数据科学 | 从小白走向算法工程师

数据科学 | 从小白走向算法工程师

编者按

听说有个专科生转行了?毕竟他转行的沉没成本低啊,我不一样。听说有个博士转行了?毕竟人家是博士,水平在那,我怎么能跟人家比。种一棵树,最好的时间是十年前,其次就是现在。这篇文章告诉你,每个人的转行路其实都充满了艰辛。

文章作者:书生
责任编辑:书生
文章发表于微信公众号【运筹OR帷幄】:数据科学|从小白走向算法工程师
欢迎原链接转发,转载请私信@运筹OR帷幄获取信息,盗版必究。
敬请关注和扩散本专栏及同名公众号,会邀请全球知名学者发布运筹学、人工智能中优化理论等相关干货、知乎Live及行业动态:『运筹OR帷幄』大数据人工智能时代的运筹学

欲解锁文中超链接,欢迎访问原文:书生:从小白走向算法工程师

文章来源:知乎专栏-数据路漫漫

本文首发于数据科学版块新晋副主编知乎专栏:

书生:从小白走向算法工程师


我为什么转行了

最开始决定转行应该是2017年的4月。

书读到了这个阶段,换到另一个领域,心中难免踟蹰。

一方面,相对在高校搞些落地难的项目或者国企划水,对实现价值还有些“妄念”;另一方面,惊讶于我转换数据分析的硕士好友竟是我所知同学收入中最高的。

很长一段时间,我们一直在讨论转行的可能性,同时刷知乎了解这个行业所需的能力和发展前景。


01数据分析师


刚开始只定了一个小目标:和同学一样做个数据分析师就好。

起初看了秦大的文章,并确定了数据分析师的基本技能。

如何快速成为数据分析师?

  • 硬技能方面主要要求:
  • 掌握excel常用函数;
  • 熟悉ppt,BI等展示工具;
  • 掌握SQL数据库,查改增删等操作;
  • 会使用一门编程语言,如python;
  • 了解统计学知识,并能深入理解业务。

Excel比较日常,碎片化的时间加深巩固下就好。

当时关注了一个公众号:Excel之家(iexcelhome)。早晨班车上看一个函数推文,上班拉一下数据操作就好。

PPT及其他BI类的工具,主要用于效果展示。当时尝试一周做4-5页ppt。BI方面,如想深挖建议使用Tableau,短期使用可以考虑在线网站,我当时用的BDP,功能基本具备。

SQL学习,时间允许情况下看视频是最快的学习方式。另外《SQL必知必会》作为一本工具书,后面优化SQL查询语句时也会经常拿出来看看。

6月份,python语言过了一遍。当时一直在出差中,晚上对着网易云上的视频手敲代码。这里推荐小甲鱼python视频,对初学者非常友好,配合课后题使用更佳。

期间一直和好友沟通,了解一些业务知识的同时,也不断地审视下当前的水平。

大概7月初,我觉得初步掌握了分析师的技能,可以胜任相关的工作了。

然鹅,这时我发现了一个问题:我对数据分析这个方向并没有足够的热情。


02爬虫工程师

随后,大概迷茫了1个多月,不知道到底要用Python做什么。爬虫,网页,还是开发?

没有计划的时候,学习进展就非常缓慢。胡乱加了很多群,听了很多讲座。

后来和某老师交流过后,他说考虑到数据分析硬性技能的门槛太低,建议我考虑做数据挖掘方向。

可能是那段时间看了太多花式爬取数据并进行多维度分析的爽文,一时间我居然忘记了先去看看招聘JD(这里墙裂建议转行的同学一定要按照相应的JD来升级自己的技能树,少走弯路)。

这样子我又走进了一个定式思维的误区:认为数据挖掘就是python爬取数据!!!

初期,在知乎看了路人甲的文章和静觅的博客。

无意间看到某大神总结的进阶指南(侵删):

根据当时爬虫中的问题,总结并绘制了一张脑图,计划针对每个技能点进行各个击破。(后面的多进程和软件抓包一直没有实现过)

18年3月,入手了《python3网络爬虫开发实战》,意外发现作者静觅是北航尚未毕业的研究生,百感交集。不过这本书内容确实比较详实,对小白友好,通过此书让我对之前零散的爬虫知识进行系统化重构。

这样子走走停停,大概8个月左右的时间。搭建scrapy框架爬知乎用户信息,爬图片,爬网易云音乐,爬阿里招聘信息,还注册了github管理代码。

github.com/kunkun1230/P

期间走马观花的看了一遍西瓜书,总觉得很多算法似曾相识,不过时间关系没有细思如何利用并整合到自己的技能树上。

一晃到了18年4月,这时候公司的项目到了一个节点,考虑到后期在职会长期驻外,外加一些个人事务,我裸辞了。

之后很长一段时间,一直忙于个人事务,没有进行数据方面的学习。

关于是否应该裸辞,之前看过很多知乎的回答,这点我和很多人见解不太一样,我认为 一定情况下裸辞是ok的,但是要把握好节奏,坚持学习坚持锻炼,不要懈怠。(我是不会告诉你,我利用裸辞这段时间减了16斤脂肪,解锁了倒立人旗的)


03算法工程师

18年6月份,在知乎接触了猴子的课程比较浅显,只是在每个阶段点了一下,不过却帮我把整个流程梳理的清清楚楚。加上有前面的积累,我终于把整个大数据方向的发展框架理清楚了(足见我悟性之低)。这时,我的目标已经从最开始的数据分析师,跳过了爬虫工程师,最终定位在机器学习(或者说算法)工程师。

开始,做了Kaggle上的Titanic和Sharebike项目。感觉机器学习的知识还欠缺很多。重新“咀嚼”了一遍西瓜书,将书中的框架整理成了脑图。

西瓜书总结

同时,总结了常用的特征处理方式。

对于做数据挖掘的同学来说,抽时间手打一遍《python数据分析》,上传github自然是极好的。


投简历

10月份忙完自己的事情,入手了李航的《统计学习方法》,对照书拿着草稿纸推导了一遍常用的算法并开始投递简历。

值得一说的是简历中的项目经历,这应该是所有转行小白最头疼的事情了。

看到太多人不假思索的放上泰坦尼克,共享单车这些分析项目,我坚定的确认了这是个简历上的“送命项”。

思索过后,我以我的工作领域关键词 + 数据分析的关键词进行检索(记得一定是英语,一定是Google)。

例如:

Clean Energy(Sloar/Geothermal/Wind Power)+ Python(ML/Analysis)。这样子,我看到了很多相关的论文,还有别人在这个领域都做过什么样的项目。基于别人的项目和代码,那么你就可以有针对性的“嘿嘿嘿”了(此处省略1万字)。为了准备转行我还有针对的做了几个项目并上传github

求职初始,我的定位是结合新能源背景做一些算法和数据挖掘的工作。然鹅,仅有的几家能源公司风评不太好,投递简历便像微尘入海,连个涟漪都没泛起来。令我意外的是,后面在某聘上公开简历后,很多互金领域的公司发出了面试邀约。

11-12月初,参加了很多次面试,在面试中不断迭代技能,查缺补漏。

12月中旬,对比手中几个offer,选择了其中一个薪水显著提升且相对稳定的公司。

19年3月份,顺利转正。

至此,我的转行和裸辞生涯结束(●'◡'●)ノ。


总结

博士毕业又工作了近2年,突发转行的想法,已是近30岁的光景。

只是20-30岁没有做的事情,30-40岁如果再没做,他日到50的时候,必然更加后悔。所以,10年前没种的树,就只有种在当下。

学历对于转行似有帮助,因为不少公司看到博士生总愿给个机会了解一下。但很多时候也要承受高学历下,实不载名的压力,毕竟水平可能不及本专业的研究生甚至本科生。

所以,转行结束而新行业的工作才刚开始,未来还有漫长的数据路要走。

编辑于 2019-05-18

文章被以下专栏收录