Python数据分析及可视化实例之期中考试源码(06)
系列文章总目录:Python数据分析及可视化实例目录
1.背景介绍
前面已经讲了爬虫和MongoDB,
理论上数据采集和存储已经拿下,
本节原计划上一个复杂点的源码,
算了,做个期中考试吧,顺便,
测试下多少人跟着本主专栏学习。
考试通不过,不影响后续章节学习,
会给兄弟们提供数据源的,好歹给个赞!
不需要加群、加公众号,没有任何推送!
2.考试内容
采集58同城某一区域的二手房基本信息:
红框内的即为需要采集的格式化数据。
step1.采集基本数据
除了距地铁距离,
其他都可以按Html标签名提取命名。
step2.获取小区经纬度
根据小区名获取地理坐标(经纬度)
step3.存储数据
可以选择存储为CSV或MongoDB,
采用其他数据库的小伙伴可以自便。
step4.发送邮件
将某区域或小区的增量房产信息发送邮件提醒自己。
3.分析目的
- 二手房相对真实市场价格
- 二手房价格趋势及预测(曲线)
- 某区域或小区二手房增量
- 不去讨论房价的猪多因素,
- 能买起就买,炮哥如是说!
- 猪多因素都没有毛线关系,
- 数据是用来扯淡和学习滴!
胶水语言博大精深,
本主只得一二为新人带路,
新手可查阅历史目录:
最后,别只收藏不关注哈
编辑于 2020-12-30 10:32