首发于DT新纪元

数据科学入门篇3:数据处理利器Pandas使用手册

工欲善其事必先利其器,在使用Python做数据挖掘和数据分析时,一大必不可少的利器就是Pandas库了。pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的,其纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。

下面就从创建数据、查看数据、筛选数据、统计数据、缺失值处理、数据可视化等14个方面介绍Pandas数据处理的基本操作,希望对广大数据爱好者有所帮助。

1、创建数据

2、查看数据

3、选择数据

4、读取和保存

5、筛选数据

6、增加和删除数据

7、计数统计

8、数据分组

9、缺失值处理

10、排序和合并

11、可视化

12、字符串操作

13、广播

14、数据库操作

说明一下,本人现在也还只是一个学生,目前算数据菜鸟一枚,因为自己即将参加17年的校招,需要梳理所学知识,就顺便将将其进行一下分享,如果对您有所帮助,那甚好;如果没有,还请大神们自动屏蔽掉。


另外,更多据挖掘和机器学习方面的学习资源,欢迎关注我的微信公众号“DT新纪元”,期待与您一起成长。

注:以上内容虽不完全自己原创,但也是自己辛苦学习和整理所得,知识可以分享,但请不要恶意抄袭,转载前请先征求我的同意,希望大家多多理解,在此谢过!

编辑于 2017-02-11

文章被以下专栏收录

    本专栏面向所有数据科学爱好者;发起本专栏的主要目的是为了更好的跟大家进行分享和交流。 自学数据科学,一路磕磕碰碰,深知其中的艰辛与不易;所以笔者来到这里,希望用我曾经踩过的坑和绕过的弯,慰藉现在迷茫的你! 笔者深信,每一位现在的“大神”都是曾经的“小白”,同样,每一位现在的“小白”都可能是以后的“大神”! 欢迎更多的人加入我们。我们的愿景是:未来,一起,用数据拓展世界!