1400位同学的数据分析入坑问答:全搁这儿了

1400位同学的数据分析入坑问答:全搁这儿了

导读

  • 本篇主题: 微信咨询数据分析问题的整理
  • 阅读对象: 想入坑数分的小白
  • 文章字数: 3k+
  • 阅读时长: 三站地铁

为什么要写本篇文章,因为加微信的接近1.4k,而我还是我,一个人,但大家的问题很多是重复的,我选了常见问题,整理到这篇文章。

数据分析FAQ

知易行难,建议还是了解下,实际厂里是怎么数据赋能业务的。扔一个数分训练营,了解数据分析如何赋能业务,高手绕行,小白查收~

1.毕业想应聘数分岗如何准备?

来咨询的同学,专业各异:应用数学,计算机,会计,经济学,信息管理,日语,英语,汽车,自动化等。

学校的优势是,时间充沛,但是往往大家是在马上毕业或者面临秋招的时候,才意识到自己想从事数分岗位,这不是为难自己么。

我这里分两类同学来回答,从打算入坑数分到毕业秋招时长分类。

  • 第一类同学,离毕业秋招还有3月+

恭喜你,至少你比其他同学提早一步明确未来1-3年的方向,在时间维度上你已经占优势。

  1. 学习数分基础,到北上广深,找相关实习,互联网企业,18线小厂也没关系,关键要有份实习经历。好处多多,想不通来问我!
  2. 不方便实习,在学校踏踏实实夯实基础,网上教程丰富,多练习,最好沉淀出一些小项目或参加一些小比赛,并能把项目真正理解讲清楚。
  • 第二类同学,离毕业秋招小于3个月

大部分同学都是临近找工作才明确未来入坑的方向,毕竟大学玩的太high了。怎么办? 一般公司对实习时间有要求,最少3个月,现在找实习,有点来不及,除非找能留下来转正的实习。这时候,周围同学都在奔波于各大公司校园招聘宣讲会,这时候直接应聘数分,估计简历都很难过,供需决定,容易理解。

如果,以后还是希望入数分,建议:

  1. 互联网企业其他业务相关岗位: 运营,产品,新媒体
  2. 大公司如果真的没机会,小公司也不要太排斥,有个平台很重要
  3. 周末,n小时充电时间,养成习惯,n>=2
  4. 到一二线城市去,就那10个左右城市,你猜猜是哪些?

参考文章:

2.裸辞转行学习数分有建议麽?

首先,真的不建议裸辞。尤其是作为小白+转行业裸辞,成本很大。

但是,每个人都有每个人不同的苦水,民工深表理解。咨询的同学里,真的不少是已经裸辞的,那肯定是已经到达自己忍耐的上限。这些同学,很焦虑,我想帮助,但也只能从方向上或学习资源给点小支持。

  1. 调整好心态,降低焦虑感,因为焦虑造成更低效
  2. 明确方向,制定可实现的学习目标,严格执行
  3. 做好跨城市找工作的准备,当然看个人
  4. 做好曲线就业的准备,可以从其他相关岗位切入
  5. 做好降低薪资水平的准备
  6. 做好未来1年,新公司采坑的准备
  7. 做好长期没有工作的准备,比如6月+
  8. 做好回传统行业准备,互联网也并没有那么美丽,传统行业也不一定没有机会,尤其对于有家庭或即将有家庭的同学

3.那种行业合适数分小白入行?

  • 公司类型

如果能选,一定要选互联网公司,这里不是对传统企业的互联网业务有偏见。而是大部分情况下,企业文化和基因,影响是从上到下的,直接决定到做的事,决定你的时间投资回报率。

  • 业务类型

不同公司,业务差别极大,对数据依赖程度不同。

第一,公司主要产品或服务是什么?会生产哪些数据?数据量和维度?

第二,公司收入主要来源是什么?数据策略会直接影响收入吗?

优先选择To C的业务:

类型推荐指数原因电商5星不解释短视频5星推荐策略,功能改善社交4-5星功能,用户行为工具类3-4星功能改善在线教育3-4星依赖课程,题库,老师游戏3星更偏重设计,创意金融(非大平台)3星线下依赖度高,数据量较小

以上不考虑公司规模,仅从业务上考虑。

4.数据分析师常用那些工具?


5.网上学习资料很多,应该怎么选择?

21世纪,信息检索能力,太重要了,重要到会影响你收入,你相信麽?

短时间获取高质量学习资料:

  • 知乎,搜索关键词,看精华部分。
  • GitHub,搜索关键词,看给星的数量。
  • 能用google搜索,一定不要某度,相信我。
  • 微信搜索,微信对内容质量的把控严,看阅读量和在看量
  • 天池或kaggle论坛,会有很多同学分享数据项目

参考文章:

6.sql学到什么程度就可以了?

注意,对于数据分析师,95%以上只学会Select语句即可。对于insert,alter等,用到时现查询即可。

  • 熟练基本语法
  • 常用聚合函数
  • join操作熟练,并了解笛卡尔积
  • 清楚SQL执行顺序
  • 熟练嵌套查询

达到上面要求,可以理解get到了50%,能干活了,但SQL要精通,还是需要再工作和数据处理场景中提升,相信我。

如何检验SQL能力达到50%?

参考文章: 数据民工来取经儿:数据小白竟然用牛客网刷SQL题?

最高效的学习,一定是先站在别人的经验上快速了解,扔一个初级入门数分训练营,1分钱,节省踩坑大量的时间,快速了解数据分析如何赋能业务,高手绕行,小白查收~

经哥自己写教程,最大的特点就是实用,够用就行,不多浪费大家学习那些无用的长尾功能。

所以,针对不同知识背景的同学,输入不同的学习目标。

我根据大家对数据相关工具的掌握程度,将学SQL的同学划分为三类。

其中,数据相关工具包括: Excel、SQL、Shell、Python等

第一类群体: 数据小白

我定义的数据小白,是这样的:

  • Excel: 基本功能会用,对数据有点概念, 比如:
  • 能对某列进行排序、筛选
  • 能对某列求和、求平均值
  • 知道透视表,但不熟,比如:
  • 会选中表格内容生成透视表
  • 不懂行、列、值如何拖拽满足统计要求
  • SQL\Shell\Python: 完全没接触过
  • 学习目标: 能看的懂SQL,并能简单使用SQL统计数据

我希望小白同学,学习课程的下面模块:

  • 第一部分: SQL的应用场景
  • 考核目标一: 什么是SQL?
  • 考核目标二: SQL能干哪些事儿?
  • 考核目标三: 互联网最常用数据库,说两种。
  • 第二部分: SQL的基础语法
  • 考核目标一: 用SQL来实现Excel的基础功能: 排序、筛选、去重
  • 考核目标二: 用SQL来实现Excel的汇聚功能: 求和、求平均、求最大/最小值
  • 考核目标三: 给出一个复杂SQL脚本模板,并能简单修改完成统计

第二类群体: 表哥表姐

我定义的表哥表姐:

  • 每天用Excel完成各种统计分析,对Excel下面数据功能极精通
  • 基础功能: 列排序、筛选、去重、求和、求平均
  • 高级功能: 透视表行列值汇总、占比汇总、过滤、排序
  • 常用函数:
  • 数值函数: SUM\AVG\MAX\MIN\FLOOR\COUNT
  • 逻辑函数: IF\IFERROR
  • 字符函数: LEFT\RIGHT\MID\CONCATENATE\VALUE
  • 时间函数: YEAR\MONTH\DAY\DATE
  • 高级函数: VLOOKUP
  • SQL: 了解过,知道是干啥用的,甚至搜过相关文章,因为没数据库环境,一直没动手练过
  • Shell\Python: 完全没接触过,以后也不准备投入时间学习
  • 学习SQL目的: 以Excel+业务为主,SQL作为辅助工具,希望能从数据库提取和统计数据,然后导入Excel继续做表格

我希望表哥表姐,重点学习下面模块, 考核深度增加:

  • 第二部分: SQL的基础语法(新增考核点已标黄)
  • 考核目标一: 用SQL来实现Excel的基础功能: 排序、筛选、去重
  • 考核目标二: 用SQL来实现Excel的汇聚功能: 求和、求平均、求最大/最小值
  • 考核目标三: 给出一个复杂SQL脚本模板,并能简单修改完成统计
  • 考核目标四: 举例常见错误写法,可根据运行错误提示,能找到原因并修改
  • 第三部分: SQL的多表关联
  • 考核目标一: 理解表关联的背景知识点,笛卡尔积,并举例说明
  • 考核目标二: 理解left join/right join/full区别
  • 考核目标三: 独自完成两表关联查询的测试题

第三类群体: 准数据民工

我定义的准数据民工:

  • 希望做数据工作,还没有实战经历,正在摸索搭建数据环境,学习数据的工具和语言。
  • SQL已完成一定基础语法学习
  • SQL/Shell/Python都刚刚开始接触学习
  • Excel用的不太多,不太熟悉
  • 只会基础排序、筛选的使用,透视和高级函数很少
  • 缺少业务场景的数据需求,不知道工具怎么服务于业务分析
  • 学习目标: 了解SQL高级且常用的场景,学会拆解业务需求为SQL脚本

我希望准数据民工,重点学习下面模块:

  • 第二部分: SQL的基础语法
  • 跳转到第二部分测试题目部分,如果能轻松作答,则可以跳过基础语法阶段
  • 第三部分: SQL的多表关联(加深考核点已标黄)
  • 考核目标一: 理解表关联的背景知识点,笛卡尔积,并举例说明
  • 考核目标二: 理解left join/right join/full区别
  • 考核目标三: 能独立完成三张甚至更多表的关联查询
  • 第四部分: 高级函数用法
  • 考核目标一: 日期转换、加减测试题
  • 考核目标二: hive sql分组排序函数row_number
  • 考核目标三: hive sql字符串聚合函数concat_ws\group_concat
  • 考核目标四: hive sql的json格式解析
  • 第五部分: 如何将业务需求拆解为SQL脚本
  • 考核目标一: 需求沟通,明确数据需求是否合理,是否能做
  • 考核目标二: 将需求拆解到业务表中,并列出待统计的数据指标

7.应该学习R还是Python?

都可以,但是Python生态更强大,第三方包极丰富,可做的事情不仅仅局限于数据分析和挖掘。

R语言主要应用于数据统计领域,统计学同学会比较熟悉,我知道人大统计学院R语言牛人很多,每年都会举行一次R语言会议。

对了,我自己不懂R。

8.转行小白是否建议参加培训?

分情况。

case 
when u in ('自学能力强','自制力强') then '自学'
when u in ('基础差','解决能力弱','自我驱动弱') then '培训' 
end

注意,培训可能只是解决了你一部分需求,比如,资料你不用搜集了,数据和练习环境别人提供了,遇到问题你有人问了。但,不是培训完就一定能找到满意工作,最终还是要看自己,即使再好的培训课程,还是需要最后能落到自己脑子里才行。

9.数据分析行业有考证有用么?

99%公司招聘数据分析师岗位,不要求提供什么xx证书,剩下的1%,我不知道,如果你知道,请一定告诉我。

10.取经儿是否有培训课程?

没有,只是写点文章

我不想挣钱吗?这问题简直是在侮辱我不给孩子买奶粉。

我没有课程,只有一个原因,懒。

等着被拍醒。

11.数据分析对年龄有要求吗?

年龄只是一个数字,但本质上,是竞争力的问题,年龄是影响人竞争力的一个重要参数。

我们粗略认为,人的市场竞争力 = 能力 * 精力 = 能力 * function(年龄)

随着人年龄增长,人对薪水需求也在增长,但当竞争力低于自己的薪水增长时,那就会match不到岗位。

12.自学或培训完,简历石沉大海,焦虑

客观上: 今年大环境不好,就业行情一般,坑少人多,竞争激烈

主观上:简历竞争力 = 技术能力 + 实习经历 + 项目经验 + 简历表达力 + 城市选择 + 公司岗位竞争度

自己match下原因,该充电的充电,该争取的争取,该舍弃的舍弃。

13.辛苦提数,变成产品邀功的半页PPT?

互联网各个岗位职责不太一样。 业务是公司最重要的,业务好,用户留存高,之后才有其他。 所有岗位都围绕业务展开,都有自己的价值。

其实,每个岗位都有类似的疑问。

  • 研发: 我非半天劲实现的接口,PM提都没提?
  • PM: 为了研发哥哥上线一个功能,我都跪下了...
  • 测试: 每天这么多重复操作,这么多bug,我要疯了
  • 运营: 我想出来的活动方案,要求很多同学才能完成,研发,PM,测试,数据..
  • 运维: 我更苦逼,线上这些服务,我们轮班要盯着,有问题随时上报。对了,我还负责给大家开权限,收权限,无聊哦

对于数据分析师,提数支持业务,是常有的事情,业务需要在数据上验证效果。我们也在服务产品运营过程中,对业务也更加了解,如果没有业务的需求,数据分析缺乏真正了解业务的入口。

一直提数,没有其他,就该想想是不公司或自己有哪里不对了。

所以,提数的工作量最好控制在一定比例。分出部分精力做深度业务分析,尝试价值挖掘。

数据分析师只有跟产品和运营搭配起来,才能真正落地。 另外,多跟产品和运营聊天和沟通,不同同学思维和考虑方式很不一样。

最后,业务了解的基础上,可以从数据上挖掘更多有用且业务也觉得好落地执行的优化或改善,这就是价值。

感慨

之前做过一个MBTI职业测试,我最match的职业竟然是,人力资源和事业发展顾问,实际上我是常住回龙观的数据搬运工。


关于经哥

帝都北五环外,码农集聚村,回龙观的一位数据老民工,欢迎加v唠嗑、吐槽

强大自我,拒绝躺平,持续学习,长期主义。

职业咨询

只回复付费咨询的同学,相信经哥,这是最高效的沟通方式,欢迎有付费认知的同学来撩。

可以选择知乎付费咨询,也可以加我微信私聊。

建议后者,原因是可以围观老民工朋友圈,日常所思所想。

经哥数据课程

如果你想节省学习成本,对数据分析感兴趣,下面则需而取:

人走赞留,江湖再见,蟹蟹!

热门文章推荐

入门篇

快速入坑数据分析师? | 超级菜鸟学习数据分析?

数据分析师干啥活儿 | 数据分析师极简入门书籍

经哥自建SQL练习网站 | sql学到什么程度?

技能篇

数据处理技巧 | 设计和评估 ABTest

数据分析师的类型 | 公司从0搭建BI系统

SQL刷题, 完爆牛客网 | SQL提数: 数据分析第一步

shell命令篇:文件查看 | 数据统计 | awk:数据统计

Python绘图篇: Matplotlib | Pandas | Seaborn

案例篇

短视频留存分析 | 社区内容生态建设分析 | 付费自习室的收入预估 | 相亲问题的数据量化

优惠券发放背后的逻辑 | 因果分析: 双重差分模型

网站日志数据分析实战 | 网站被攻击的数据分析!| 大白话Kaggle入门 : Titanic篇

思维篇

数据波动的异常分析 | 订单下降该如何排查 | 场景思维,咱要有这个习惯 | 数据需求处理场景

求职篇

写简历,看这篇就够 | 数据面试,这样准备就可

互联网10大岗位 | 互联网就业大盘 | 没数据经验别慌

数据分析师岗位分类 | 数据分析岗的迷茫?

1400位同学的数据分析入坑问答 | 求职咨询的数据小白 | 前端工程师转行数据分析的咨询 | 关于数据分析找工作咨询回复

资料篇

最全数据分析学习资料 | 行业报告数据源大全

编辑于 2023-02-01 19:07・IP 属地北京