零基础学习Python数据分析

零基础学习Python数据分析

使用Python进行数据挖掘是最近几年才开始火起来的,之前网上很多的资料都是关于Python网页开发等。但使用Python进行数据挖掘的侧重点已经完成不一样了。本人就是浪费了很多时间来筛选这些博客、书籍。所以就有了本文,希望能帮大家少走一点弯路。


----------我是分割线--------

本文章主要从数据挖掘的角度出发, 讲讲如何零基础学习Python语法、数据清洗、以及数据建模。本文不能保证你能成为大神,但是如果能踏踏实实地学习完,找一份年薪15w+的工作还是不太难的。本人也是非计算机专业,所以希望给非计算机的人一点参考,大神请绕道。

熟练掌握任何一门语言,几乎都需要经过以下过程:

  1. 良师--学习Python课程+入门书籍+浏览技术博客
  2. 社区帮助--善于使用搜索引擎、Mail List
  3. 益友 -- 寻找学习伙伴
  4. Learn by Code --项目实践

一、Python学习课程推荐

这两个学习课程从最基础的Python语法开始,介绍了Python数据分析、统计模型以及机器学习的各个方面,内容十分充足。之所以建议使用老外的课程是因为,老外上课假定你什么都不会,讲解深入浅出,尤其是对于华盛顿大学的机器学习课程,把复杂的概念讲解得十分简单。

1. 密歇根大学的《学习使用Python编程并分析数据》主要包括以下课程(讲解十分详细,深入浅出,非常适合入门学习,视频都是有字幕的):

2. 华盛顿大学的《机器学习》专项课程

在专项课程页面无法选择旁听,必须点击进入单独课程页面才可,这个课程专题旁听是有限制的,无法提交作业;如有需求,可以申请奖学金,回答三个问题即可,系统自动通过申请。


  • 《机器学习基础:案例研究》:你是否好奇数据可以告诉你什么?你是否想在关于机器学习促进商业的核心方式上有深层次的理解?你是否想能同专家们讨论关于回归,分类,深度学习以及推荐系统的一切?在这门课上,你将会通过一系列实际案例学习来获取实践经历。
  • 《机器学习:回归》
  • 《机器学习:分类》
  • 《机器学习:聚类和检索》
  • 《机器学习:推荐系统和降维》
  • 《机器学习:应用深度学习创建智能运用》


二、网上打码教程

Learn by doing!!! 学习编程最有效的方式就是敲代码!

  1. Codecademy 围绕Python 的基础语法,内容非常丰富。
  2. Datacamp Python基本语法(他家的R语言课程十分不错!)

三、Python技术博客

简单介绍一些非常棒的Python技术学习的博客

1. 廖雪峰Python教程 简单易上手的Python基础语法教程,值得学习, Python 2和Python 3版本都有。

2. 非常棒的pandas练习Github Repo

3. 很详细的Python 爬虫教程

4. 国外Data Science博客大全

四、Python入门书籍推荐

常用书籍下载网址,几乎囊括了网上能找得到的所有Python相关的书籍(PDF、Epub和mo bi格式),且提供云盘下载链接。你值得拥有!

python | 搜索结果

1. 掌握Python语法的基础上学习《Python for data analysis》是比较不错的选择,涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用。

2.《Python数据分析与挖掘实战》介绍了使用Python进行数据挖掘的详细案例,数据和代码都可以下载,作为机器学习的进阶学习是不错的选择(这本书也用对应的R语言和Matlab 版本)。

3. 《Python Cookbook》很厚的一本书,可以作为Python语法查询手册。

再添加几个外文书籍下载网址:

1. All IT eBooks 全,可能需要使用翻*墙下载,翻*墙方法见文末


2. Library Genesis 各种书籍,不局限于编程书籍

3. Fox eBook - eBooks Free Download Site

4. Development / Programming / AvaxHome

五、推荐订阅博客(更细频率较高)

iPhone上可以使用Reeder阅读器,Instapaper用来保存后稍后阅读,因为信息量比较大。


  1. No free Hunch Kaggle竞赛平台的官方博客,包括一些优秀的代码解读以及高分选手的采访,十分有用的经验(来自不同背景,不同年龄层次,不同职业的选手)
  2. Flowing Data 十分有用的数据分析的案例
  3. Python日报 内容十分精彩的集锦(中文)

六、FAQ (待续)

  1. Python 2.x还是Python 3.x?
  2. 如何安装Python包? 强烈推荐Anaconda包,你值得拥有!尤其是Windows系统。
  3. 网络速度慢,请翻*墙,安利一款免费好用Google开发的防屏蔽的梯子Lantern,速度不错。
  4. 是否需要很强的统计和数学背景? 有良好的数学和统计背景固然很好,但是现在很多岗位对数学和统计背景要求并不很多,都是简单的算法,Python编程已经能够很方便地实现,更多的是对业务的深入理解。如有需要建议,边学习Python边学习数学统计。

七、实践项目

  1. Kaggle竞赛项目,里面不仅仅有很多竞赛项目,而且有很多可供学习的代码博客以及论坛,都是实战项目,有很强的实践价值。

----------------------

中文的Python数据分析的教程较少,而且质量良莠不齐,所以推荐多为英文资料。而且随着学习的深入,有时候只有英文资料可以借鉴。学习数据分析和机器学习,英文再好也不为过。并不是说中国没有优秀的人才,而是为了便于国际交流学习,中国人也多用英语。


P.S.: 衷心感谢大家的赞赏,这是对我最大的肯定(网费有着落了)。

文章被以下专栏收录

    未来数据会成为核心资源,各个企业都在积累数据,挖掘数据价值,所以数据挖掘工程师的缺口特别大。