1400位同学的数据分析入坑问答:全搁这儿了
导读
- 本篇主题: 微信咨询数据分析问题的整理
- 阅读对象: 想入坑数分的小白
- 文章字数: 3k+
- 阅读时长: 三站地铁
为什么要写本篇文章,因为加微信的接近1.4k,而我还是我,一个人,但大家的问题很多是重复的,我选了常见问题,整理到这篇文章。
数据分析FAQ
知易行难,建议还是了解下,实际厂里是怎么数据赋能业务的。扔一个数分训练营,了解数据分析如何赋能业务,高手绕行,小白查收~
1.毕业想应聘数分岗如何准备?
来咨询的同学,专业各异:应用数学,计算机,会计,经济学,信息管理,日语,英语,汽车,自动化等。
学校的优势是,时间充沛,但是往往大家是在马上毕业或者面临秋招的时候,才意识到自己想从事数分岗位,这不是为难自己么。
我这里分两类同学来回答,从打算入坑数分到毕业秋招时长分类。
- 第一类同学,离毕业秋招还有3月+
恭喜你,至少你比其他同学提早一步明确未来1-3年的方向,在时间维度上你已经占优势。
- 学习数分基础,到北上广深,找相关实习,互联网企业,18线小厂也没关系,关键要有份实习经历。好处多多,想不通来问我!
- 不方便实习,在学校踏踏实实夯实基础,网上教程丰富,多练习,最好沉淀出一些小项目或参加一些小比赛,并能把项目真正理解讲清楚。
- 第二类同学,离毕业秋招小于3个月
大部分同学都是临近找工作才明确未来入坑的方向,毕竟大学玩的太high了。怎么办? 一般公司对实习时间有要求,最少3个月,现在找实习,有点来不及,除非找能留下来转正的实习。这时候,周围同学都在奔波于各大公司校园招聘宣讲会,这时候直接应聘数分,估计简历都很难过,供需决定,容易理解。
如果,以后还是希望入数分,建议:
- 互联网企业其他业务相关岗位: 运营,产品,新媒体
- 大公司如果真的没机会,小公司也不要太排斥,有个平台很重要
- 周末,n小时充电时间,养成习惯,n>=2
- 到一二线城市去,就那10个左右城市,你猜猜是哪些?
参考文章:
2.裸辞转行学习数分有建议麽?
首先,真的不建议裸辞。尤其是作为小白+转行业裸辞,成本很大。
但是,每个人都有每个人不同的苦水,民工深表理解。咨询的同学里,真的不少是已经裸辞的,那肯定是已经到达自己忍耐的上限。这些同学,很焦虑,我想帮助,但也只能从方向上或学习资源给点小支持。
- 调整好心态,降低焦虑感,因为焦虑造成更低效
- 明确方向,制定可实现的学习目标,严格执行
- 做好跨城市找工作的准备,当然看个人
- 做好曲线就业的准备,可以从其他相关岗位切入
- 做好降低薪资水平的准备
- 做好未来1年,新公司采坑的准备
- 做好长期没有工作的准备,比如6月+
- 做好回传统行业准备,互联网也并没有那么美丽,传统行业也不一定没有机会,尤其对于有家庭或即将有家庭的同学
3.那种行业合适数分小白入行?
- 公司类型
如果能选,一定要选互联网公司,这里不是对传统企业的互联网业务有偏见。而是大部分情况下,企业文化和基因,影响是从上到下的,直接决定到做的事,决定你的时间投资回报率。
- 业务类型
不同公司,业务差别极大,对数据依赖程度不同。
第一,公司主要产品或服务是什么?会生产哪些数据?数据量和维度?
第二,公司收入主要来源是什么?数据策略会直接影响收入吗?
优先选择To C的业务:
类型推荐指数原因电商5星不解释短视频5星推荐策略,功能改善社交4-5星功能,用户行为工具类3-4星功能改善在线教育3-4星依赖课程,题库,老师游戏3星更偏重设计,创意金融(非大平台)3星线下依赖度高,数据量较小
以上不考虑公司规模,仅从业务上考虑。
4.数据分析师常用那些工具?
5.网上学习资料很多,应该怎么选择?
21世纪,信息检索能力,太重要了,重要到会影响你收入,你相信麽?
短时间获取高质量学习资料:
- 知乎,搜索关键词,看精华部分。
- GitHub,搜索关键词,看给星的数量。
- 能用google搜索,一定不要某度,相信我。
- 微信搜索,微信对内容质量的把控严,看阅读量和在看量
- 天池或kaggle论坛,会有很多同学分享数据项目
参考文章:
6.sql学到什么程度就可以了?
注意,对于数据分析师,95%以上只学会Select语句即可。对于insert,alter等,用到时现查询即可。
- 熟练基本语法
- 常用聚合函数
- join操作熟练,并了解笛卡尔积
- 清楚SQL执行顺序
- 熟练嵌套查询
达到上面要求,可以理解get到了50%,能干活了,但SQL要精通,还是需要再工作和数据处理场景中提升,相信我。
如何检验SQL能力达到50%?
参考文章: 数据民工来取经儿:数据小白竟然用牛客网刷SQL题?
最高效的学习,一定是先站在别人的经验上快速了解,扔一个初级入门数分训练营,1分钱,节省踩坑大量的时间,快速了解数据分析如何赋能业务,高手绕行,小白查收~
经哥自己写教程,最大的特点就是实用,够用就行,不多浪费大家学习那些无用的长尾功能。
所以,针对不同知识背景的同学,输入不同的学习目标。
我根据大家对数据相关工具的掌握程度,将学SQL的同学划分为三类。
其中,数据相关工具包括: Excel、SQL、Shell、Python等
第一类群体: 数据小白
我定义的数据小白,是这样的:
- Excel: 基本功能会用,对数据有点概念, 比如:
- 能对某列进行排序、筛选
- 能对某列求和、求平均值
- 知道透视表,但不熟,比如:
- 会选中表格内容生成透视表
- 不懂行、列、值如何拖拽满足统计要求
- SQL\Shell\Python: 完全没接触过
- 学习目标: 能看的懂SQL,并能简单使用SQL统计数据
我希望小白同学,学习课程的下面模块:
- 第一部分: SQL的应用场景
- 考核目标一: 什么是SQL?
- 考核目标二: SQL能干哪些事儿?
- 考核目标三: 互联网最常用数据库,说两种。
- 第二部分: SQL的基础语法
- 考核目标一: 用SQL来实现Excel的基础功能: 排序、筛选、去重
- 考核目标二: 用SQL来实现Excel的汇聚功能: 求和、求平均、求最大/最小值
- 考核目标三: 给出一个复杂SQL脚本模板,并能简单修改完成统计
第二类群体: 表哥表姐
我定义的表哥表姐:
- 每天用Excel完成各种统计分析,对Excel下面数据功能极精通
- 基础功能: 列排序、筛选、去重、求和、求平均
- 高级功能: 透视表行列值汇总、占比汇总、过滤、排序
- 常用函数:
- 数值函数: SUM\AVG\MAX\MIN\FLOOR\COUNT
- 逻辑函数: IF\IFERROR
- 字符函数: LEFT\RIGHT\MID\CONCATENATE\VALUE
- 时间函数: YEAR\MONTH\DAY\DATE
- 高级函数: VLOOKUP
- SQL: 了解过,知道是干啥用的,甚至搜过相关文章,因为没数据库环境,一直没动手练过
- Shell\Python: 完全没接触过,以后也不准备投入时间学习
- 学习SQL目的: 以Excel+业务为主,SQL作为辅助工具,希望能从数据库提取和统计数据,然后导入Excel继续做表格
我希望表哥表姐,重点学习下面模块, 考核深度增加:
- 第二部分: SQL的基础语法(新增考核点已标黄)
- 考核目标一: 用SQL来实现Excel的基础功能: 排序、筛选、去重
- 考核目标二: 用SQL来实现Excel的汇聚功能: 求和、求平均、求最大/最小值
- 考核目标三: 给出一个复杂SQL脚本模板,并能简单修改完成统计
- 考核目标四: 举例常见错误写法,可根据运行错误提示,能找到原因并修改
- 第三部分: SQL的多表关联
- 考核目标一: 理解表关联的背景知识点,笛卡尔积,并举例说明
- 考核目标二: 理解left join/right join/full区别
- 考核目标三: 独自完成两表关联查询的测试题
第三类群体: 准数据民工
我定义的准数据民工:
- 希望做数据工作,还没有实战经历,正在摸索搭建数据环境,学习数据的工具和语言。
- SQL已完成一定基础语法学习
- SQL/Shell/Python都刚刚开始接触学习
- Excel用的不太多,不太熟悉
- 只会基础排序、筛选的使用,透视和高级函数很少
- 缺少业务场景的数据需求,不知道工具怎么服务于业务分析
- 学习目标: 了解SQL高级且常用的场景,学会拆解业务需求为SQL脚本
我希望准数据民工,重点学习下面模块:
- 第二部分: SQL的基础语法
- 跳转到第二部分测试题目部分,如果能轻松作答,则可以跳过基础语法阶段
- 第三部分: SQL的多表关联(加深考核点已标黄)
- 考核目标一: 理解表关联的背景知识点,笛卡尔积,并举例说明
- 考核目标二: 理解left join/right join/full区别
- 考核目标三: 能独立完成三张甚至更多表的关联查询
- 第四部分: 高级函数用法
- 考核目标一: 日期转换、加减测试题
- 考核目标二: hive sql分组排序函数row_number
- 考核目标三: hive sql字符串聚合函数concat_ws\group_concat
- 考核目标四: hive sql的json格式解析
- 第五部分: 如何将业务需求拆解为SQL脚本
- 考核目标一: 需求沟通,明确数据需求是否合理,是否能做
- 考核目标二: 将需求拆解到业务表中,并列出待统计的数据指标
7.应该学习R还是Python?
都可以,但是Python生态更强大,第三方包极丰富,可做的事情不仅仅局限于数据分析和挖掘。
R语言主要应用于数据统计领域,统计学同学会比较熟悉,我知道人大统计学院R语言牛人很多,每年都会举行一次R语言会议。
对了,我自己不懂R。
8.转行小白是否建议参加培训?
分情况。
case
when u in ('自学能力强','自制力强') then '自学'
when u in ('基础差','解决能力弱','自我驱动弱') then '培训'
end
注意,培训可能只是解决了你一部分需求,比如,资料你不用搜集了,数据和练习环境别人提供了,遇到问题你有人问了。但,不是培训完就一定能找到满意工作,最终还是要看自己,即使再好的培训课程,还是需要最后能落到自己脑子里才行。
9.数据分析行业有考证有用么?
99%公司招聘数据分析师岗位,不要求提供什么xx证书,剩下的1%,我不知道,如果你知道,请一定告诉我。
10.取经儿是否有培训课程?
没有,只是写点文章
我不想挣钱吗?这问题简直是在侮辱我不给孩子买奶粉。
我没有课程,只有一个原因,懒。
等着被拍醒。
11.数据分析对年龄有要求吗?
年龄只是一个数字,但本质上,是竞争力的问题,年龄是影响人竞争力的一个重要参数。
我们粗略认为,人的市场竞争力 = 能力 * 精力 = 能力 * function(年龄)
随着人年龄增长,人对薪水需求也在增长,但当竞争力低于自己的薪水增长时,那就会match不到岗位。
12.自学或培训完,简历石沉大海,焦虑
客观上: 今年大环境不好,就业行情一般,坑少人多,竞争激烈
主观上:简历竞争力 = 技术能力 + 实习经历 + 项目经验 + 简历表达力 + 城市选择 + 公司岗位竞争度
自己match下原因,该充电的充电,该争取的争取,该舍弃的舍弃。
13.辛苦提数,变成产品邀功的半页PPT?
互联网各个岗位职责不太一样。 业务是公司最重要的,业务好,用户留存高,之后才有其他。 所有岗位都围绕业务展开,都有自己的价值。
其实,每个岗位都有类似的疑问。
- 研发: 我非半天劲实现的接口,PM提都没提?
- PM: 为了研发哥哥上线一个功能,我都跪下了...
- 测试: 每天这么多重复操作,这么多bug,我要疯了
- 运营: 我想出来的活动方案,要求很多同学才能完成,研发,PM,测试,数据..
- 运维: 我更苦逼,线上这些服务,我们轮班要盯着,有问题随时上报。对了,我还负责给大家开权限,收权限,无聊哦
对于数据分析师,提数支持业务,是常有的事情,业务需要在数据上验证效果。我们也在服务产品运营过程中,对业务也更加了解,如果没有业务的需求,数据分析缺乏真正了解业务的入口。
一直提数,没有其他,就该想想是不公司或自己有哪里不对了。
所以,提数的工作量最好控制在一定比例。分出部分精力做深度业务分析,尝试价值挖掘。
数据分析师只有跟产品和运营搭配起来,才能真正落地。 另外,多跟产品和运营聊天和沟通,不同同学思维和考虑方式很不一样。
最后,业务了解的基础上,可以从数据上挖掘更多有用且业务也觉得好落地执行的优化或改善,这就是价值。
感慨
之前做过一个MBTI职业测试,我最match的职业竟然是,人力资源和事业发展顾问,实际上我是常住回龙观的数据搬运工。
关于经哥
帝都北五环外,码农集聚村,回龙观的一位数据老民工,欢迎加v唠嗑、吐槽
强大自我,拒绝躺平,持续学习,长期主义。
职业咨询
只回复付费咨询的同学,相信经哥,这是最高效的沟通方式,欢迎有付费认知的同学来撩。
可以选择知乎付费咨询,也可以加我微信私聊。
建议后者,原因是可以围观老民工朋友圈,日常所思所想。
经哥数据课程
如果你想节省学习成本,对数据分析感兴趣,下面则需而取:
人走赞留,江湖再见,蟹蟹!
热门文章推荐
入门篇
技能篇
shell命令篇:文件查看 | 数据统计 | awk:数据统计
Python绘图篇: Matplotlib | Pandas | Seaborn
案例篇
短视频留存分析 | 社区内容生态建设分析 | 付费自习室的收入预估 | 相亲问题的数据量化
网站日志数据分析实战 | 网站被攻击的数据分析!| 大白话Kaggle入门 : Titanic篇
思维篇
数据波动的异常分析 | 订单下降该如何排查 | 场景思维,咱要有这个习惯 | 数据需求处理场景
求职篇
1400位同学的数据分析入坑问答 | 求职咨询的数据小白 | 前端工程师转行数据分析的咨询 | 关于数据分析找工作咨询回复
资料篇