[python,pandas]数据分析求职指南——猎聘网数据分析职位解析

[python,pandas]数据分析求职指南——猎聘网数据分析职位解析

王瑞王瑞

本文是猎聘网数据分析系列文章的第三篇,前两篇分别为猎聘网爬虫编写使用MySQL进行数据清

数据来自猎聘网,使用爬虫进行爬取,源数据及整个分析项目链接如下。

源数据:职位数据

爬虫及数据分析项目源代码:Ruiww/LiePinAnalysis

猎聘网职位爬取及分析系列文章已全部完成

系列文章一:[requests,pyquery]爬取猎聘网职位信息

系列文章二:[MySQL]猎聘网数据分析职位数据清洗


数据分析是数学与计算机科学相结合的产物,指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。越来越多的企业将选择拥有项目数据分析经验的专业人士为他们的项目做出科学、合理的分析,以便正确决策项目。

通过偶然的机会,我接触到数据分析的相关理念,并对此产生了兴趣,希望从事相关工作。然而在求职过程中,招聘网站的信息多而纷杂,难以了解数据分析相关职位整体的情况。

通过对猎聘网数据分析职位网页的爬取与分析,形成这份数据分析求职指南,从地域、行业、公司薪酬等方面为数据分析的求职提供参考,并从需求技能层面进行分析,为想要从事数据分析的学习者提供方向。


分析思路

招聘需求分布

职位集中于计算机、金融领域,互联网·电商行业职位数占比达1/3,保险、银行行业每家公司平均的职位需求最多

数据分析的行业分布图显示,职位需求TOP10中除服装服饰行业外,均为计算机、金融、咨询等日常工作中会产生以及需要处理大量数据的领域,与通常的印象相符。

图中折线各点数值为相应行业职位数量/公司数量,衡量各行业平均每家公司对数据分析职位的需求程度。该指标与各行业需求职位数量的总数并不成正比,保险、银行大于2,明显高于平均水平,而服装服饰、通信工程和网络游戏行业需求程度较低。


TOP10中服装服饰行业需求超过专业咨询排到第7位令人意外,具体研究该行业的职位,发现岗位职责基本是对货品、销售数据进行整理分析,一个典型的服装服饰行业数据分析职位的职责如下所示。

凡人优品 - 数据分析主管
1、依据公司年度目标和年度计划,协助上级制定、规划、实施运营分析部的年度工作目标和年度工作计划,规划全年商品数据销售统筹及分解实施,制定新品上市计划;
2、协助上级完成每季产品发展策略、产品结构需求、品类计划、产品销售预测、销售周期及降价期,与商品前期企划工作紧密对接,建立并完善商品流通管理流程及管理体系,确保大商品链的正常运作;
3、直营店的具体销售数据(产销率、库存率和库存款式、终端断款率和断款款式、爆款率和爆款款式畅销款式等)及实际情况,结合产品生命周期,负责各类数据的统计和分析,并分析各店铺历史销售数据,有针对性制定各店铺的上货计划;
4、负责各类销售数据的统计与分析,每月、每周提交销售数据分析报告及解决方案(促销、清货、调配、换货);
5、商品报表分析(消化率、周转率、折扣率、毛利率分析报表)。


行业-职位数占比表明,职位的行业集中度高(互联网·电商一个行业占据了32.22%,TOP5占比62.87%,TOP10占比74.21%),求职时应重点考虑占比排名靠前的行业。

各行业需求最多的前三个公司分别为:

职位集中于一线城市,北京、上海占据总量的近60%

北上深广四个1线城市占据前四位,而北京、上海分别以818个职位,34.03%的占比和559个职位、23.25%的占比遥遥领先。

职位需求大的城市平均每家公司的需求量也较高,但天津市奇高。对天津市各公司的职位需求数量进行分组统计,发现捷信中国与捷信消费金融目前对数据分析职位有大量的需求,而天津有数据分析需求的公司数量较小,因此明显拉高了其职位/公司比。

需求聚集在京津冀、长三角、珠三角与川渝四个地区,与当前互联网行业的分布基本一致

从地区层面来说,职位主要分布在京津冀、长三角、珠三角与川渝四个地区,这样的分布特征也与当前互联网行业的分布呈现明显相关性,与职位的行业分布情况吻合。

主要城市职位需求的TOP 3公司为,Baidu(15)与阿里巴巴(18)不出所料在自己的大本营拔得头筹,然而腾讯却不在榜中,各城市中腾讯的职位需求总和为5。


中等规模公司需求量最大,1-49人初创公司的平均招聘需求最旺盛

100-400人中等规模的公司的需求数量最大。

1-49人规模的小公司平均职位需求最旺盛,具体观察发现,这一规模的公司主要以天使轮与A轮融资的初创公司组成,人员流动性大,导致招聘需求旺盛。相应的,10000人以上的公司已发展到稳定期,因此员工流动性较小,职位数/公司数的值较低。


未细化的数据分析职位占2/3,其后依次为大数据、数据挖掘与数据运营

大多数数据分析职位未进行细分,占比66.53%。

需求量较大的行业中,IT服务与计算机软件两行业大数据类型的职位占比较高,主要由许多toB的软件与服务提供商组成。

薪酬与福利

数据分析薪酬在前四年稳步增长,4-6年出现瓶颈期,此后出现较大分化

企业职位中8年以上的职位数据较少,因此仅对前8年的薪酬进行分析,发现较为明显的分为三个阶段:

  • 1-4年:薪酬30%-50%的速度增长
  • 4-6年:薪酬出现瓶颈,大部分处于20-35万之间
  • 6年后:较第6年上升一个台阶,但此阶段分化程度很大,第7年Q3/Q1 = 2.22 , Q3-Q1 = 33.75

福利水平较高,社保、假期与发展空间相关词出现最频繁

对职位标签进行分词统计,获得词云图,并对TOP 10标签进行了统计:

五险一金,带薪年假,发展空间大,绩效奖金,岗位晋升,定期体检,领导好,节日礼物,午餐补助,技能培训


技能需求

对四类职位(数据分析、数据运营、数据挖掘、大数据)的岗位描述进行聚合并分词,获得词云。

由词云可以看出,职位的技能需求从数据分析和运营偏重业务与技术结合的层面,到数据挖掘的编程、机器学习,再到大数据的各类构架这一较倚重技术的方向。在求职准备时,可以根据自身情况,选择职业类型,并根据所需技能进行重点的准备。

数据分析:SQL、EXCEL、统计学

数据运营:EXCEL、分析报告、SQL

数据挖掘:PYTHON、统计学、R

大数据:HADOOP、SPARK、JAVA

「真诚赞赏,手留余香」
1 人赞赏
李明仆
文章被以下专栏收录
1 条评论
推荐阅读