博客
关于我
56平住房卖2万,新房价变白菜价?爬取全国315个城市的房价信息
阅读量:628 次
发布时间:2019-03-14

本文共 865 字,大约阅读时间需要 2 分钟。

前言

今天来使用爬虫技术,爬取全国315个城市的房价信息。

大家都知道 房价信息是非常有价值的,敏感的,对于一些人来说是投资赚钱的一种重要渠道。能够及时的获取房价涨跌信息,甚至用大数据分析市场行情,这对于投资是非常有利的

PS:如有需要Python学习资料的小伙伴可以加下方的群去找免费管理员领取

 

可以免费领取源码项目实战视频PDF文件

 

所以,这种信息爬取的难度也是较大的。

我一开始使用requests库,发现反爬机制比较厉害,而且网页的数据结构容易变化。然后我用selenium 爬取,配置好参数,使用本地浏览器,依次爬取32页数据,共630条房价信息。

我贴出部分代码供参考:

def parse():    global start,end    try:        for i in range(start,end):            name = driver.find_element_by_xpath('//*[@id="px"]/tbody/tr[%s]/th[2]/a'%(i)).text            price = driver.find_element_by_xpath('//*[@id="px"]/tbody/tr[%s]/th[3]'%(i)).text            row = [name,price]            print(row)            sheet.append(row)    except:        print("到底了!")

最后的结果通过代码自动发送到QQ邮箱,效果如下:

 

共315个城市,想要获取数据的朋友可以联系我,提供实时的房价信息。

得到表格,进行数据分析,用excel,进行数据的处理,绘制成统计图:

 

我们可以看到,全国房价的前三名分别是:

深圳:北京,上海。

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:弄堂里的一只汪

转载地址:http://vjioz.baihongyu.com/

你可能感兴趣的文章
Neo4j(2):环境搭建
查看>>
Neo4j(4):Neo4j - CQL使用
查看>>
NEO改进协议提案1(NEP-1)
查看>>
Neo私链
查看>>
NervanaGPU 项目使用教程
查看>>
Nerves 项目教程
查看>>
nessus快速安装使用指南(非常详细)零基础入门到精通,收藏这一篇就够了
查看>>
Nessus漏洞扫描教程之配置Nessus
查看>>
Nest.js 6.0.0 正式版发布,基于 TypeScript 的 Node.js 框架
查看>>
nested exception is org.apache.ibatis.builder.BuilderException: Error parsing Mapper XML.
查看>>
nestesd exception is java .lang.NoSuchMethodError:com.goolge.common.collect
查看>>
nestJS学习
查看>>
net core 环境部署的坑
查看>>
NET Framework安装失败的麻烦
查看>>
Net 应用程序如何在32位操作系统下申请超过2G的内存
查看>>
Net.Framework概述
查看>>
NET3.0+中使软件发出声音[整理篇]<转>
查看>>
net::err_aborted 错误码 404
查看>>
NetApp凭借领先的混合云数据与服务把握数字化转型机遇
查看>>
NetAssist网络调试工具使用指南 (附NetAssist工具包)
查看>>