【帆软杯】武汉市二手房数据可视化

楼主
石头
12

房地产一直是十分受人关注的行业,房价也是关系全国人民生计的要素之一。习总书记说“房子是用来住的”,这句话改变了房地产行业的市场状况,各种政策不断出台实施,调节着房地产市场格局。2019年疫情以来,人民的生活发生了很大的改变,买房、卖房的情况也有所不同,房地产行业再次受到冲击,房价不断动荡变化。因此,我们希望通过对武汉市二手房市场行业的数据进行分析,并可视化呈现,探寻武汉市二手房市场的变化与规律,为买房人与卖房人提供一定的参考。

 

 

本作品爬取链家网2021315日之前的数据,从房价、热门社区、成交周期、房屋面积、房屋热度等方面进行数据可视化呈现,并通过这些数据呈现的规律对还在售的二手房成交价格、成交周期进行预测。

链家网作为全国二手房市场的领头羊,拥有全国最大的真实房源数据库,有较高的参考价值,因此本作品将链家网作为数据来源。

爬虫基于scrapy框架,首先爬取到链家网上每套成交二手房对应的URL,将所有URL存入文件中,然后获取到每个URL对应的HTML,解析页面,使用正则匹配获取想要的字符串数据,得到每套成交二手房的基本数据并存入csv文件中,同理可以获得在售二手房的数据。最后将数据集存入orcale数据库中。用sql进行建表和数据处理。

数据可视化采用finereport,首先连接Oracle数据库,然后用sql语句建立数据集,再在各个板块中将这些数据集可视化,到这一步本作品就制作完成。

编辑于 2021-11-24 20:01

分享扩散:

沙发
发表于 2021-11-29 15:44:06
12
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表