Python数据分析及可视化实例之期中考试源码(06)

Python数据分析及可视化实例之期中考试源码(06)

系列文章总目录:Python数据分析及可视化实例目录


1.背景介绍

前面已经讲了爬虫和MongoDB,

理论上数据采集和存储已经拿下,

本节原计划上一个复杂点的源码,

算了,做个期中考试吧,顺便,

测试下多少人跟着本主专栏学习。


考试通不过,不影响后续章节学习,

会给兄弟们提供数据源的,好歹给个赞!

不需要加群、加公众号,没有任何推送!


2.考试内容

采集58同城某一区域的二手房基本信息:

红框内的即为需要采集的格式化数据。


step1.采集基本数据

除了距地铁距离,

其他都可以按Html标签名提取命名。

step2.获取小区经纬度

根据小区名获取地理坐标(经纬度)

step3.存储数据

可以选择存储为CSV或MongoDB,

采用其他数据库的小伙伴可以自便。

step4.发送邮件

将某区域或小区的增量房产信息发送邮件提醒自己。


3.分析目的

  • 二手房相对真实市场价格
  • 二手房价格趋势及预测(曲线)
  • 某区域或小区二手房增量
  • 不去讨论房价的猪多因素,
  • 能买起就买,炮哥如是说!
  • 猪多因素都没有毛线关系,
  • 数据是用来扯淡和学习滴!




胶水语言博大精深,

本主只得一二为新人带路,

老鸟可去另一专栏:Python中文社区


新手可查阅历史目录:

Python数据分析及可视化实例目录



最后,别只收藏不关注哈

编辑于 2017-10-13

文章被以下专栏收录