数据分析招聘岗位信息挖掘

数据分析招聘岗位信息挖掘

思维导图

项目背景与说明

数据,已经渗透到当今每一个行业和业务的职能领域,成为重要的生产因素。人们对于海量数据的挖掘和应用,也预示着新一波生产力增长的到来。在这一浪潮的推动下,数据分析师应运而生,且在商业迅速发展的今天,这一岗位的人才需求也越来越大。本项目通过某招聘网站数据分析师岗位的招聘信息,探索一下当前这一热门岗位的现状,对于想从事这一行业的人提供一点参考。

项目理解

  1. 数据分析岗位目前的薪资水平如何,不同城市、不同行业之间是否存在差异
  2. 数据分析岗位对于学历和资历的要求如何
  3. 目前数据分析岗位主要集中在哪些行业,发展前景如何
  4. 不同规模的公司对于数据分析人员的需求是否有差异

目标设定

  1. 数据清洗,去除重复值、缺失值、异常值
  2. 数据整合,根据相应的分析指标提取相应的数据
  3. 结合对此项目的理解搭建分析指标
  4. 对分析结果进行可视化,以BI形式展现出来
  5. 项目总结,提出合理化建议

此次项目用到的工具主要有Excel 2016和Power BI,其中Excel用于数据清洗、数据筛选和数据可视化,Power BI用于报表制作。

项目内容

1.数据清洗

此次项目的数据源是通过网络爬虫获取到的某招聘网站数据分析师岗位的招聘信息,有岗位名称、公司名称、工作城市、薪资、公司类别、公司规模、行业、岗位职责、发布信息共9个字段71034条记录,存在大量的重复值、异常值与缺失值,通过Excel对数据源进行初步清洗。

数据源信息

对于岗位名称和公司名称都相同的认为是重复值,在Excel中通过删除重复列(对于岗位名称和公司名称两列内容都相同的记录删除),可以看到删除重复列后保留了49171条记录。

薪资、公司规模两列存在缺失值,此处使用筛选功能直接将缺失值删除,去除缺失值后数据变为45317条记录。

2.数据拆分

使用Excel对工作城市、薪资、公司类别、公司规模、行业、发布信息等字段的数据进一步清洗,得到便于分析的形式。

工作城市一列中的数据有的只有城市名,有的在城市名后还包含地区名,使用数据分列功能只保留城市。

清洗前
清洗后

薪资字段有的是以年薪表示,有的以月薪表示,且薪资的单位既有万也有千,此处运用分列和函数将薪资标准化为以“千”为单位的月薪表示。

薪资数据格式不一致

拆分思路:

a.首先使用数据分列功能,以“-”分为两列,后一列再以“/”分为两列,这样分列之后第一列可以用最低薪资表示,第二列用最高薪资表示,第三列表示月薪或年薪。

b.使用函数将薪资最大值分列,将数值部分与单位部分分开

首先用left函数“=LEFT(E2,LEN(E2)-1)”提取E列数据中薪资的数字部分,然后用right函数

“=RIGHT(E2,1)”提取薪资中的单位部分

c.使用if函数嵌套

=IF((F2="万")*(G2="月"),D2*10,IF((F2="千")*(G2="年"),D2/12,IF((F2="万")*(G2="年"),D2*10/12,D2)))

=IF((F2="万")*(G2="月"),E2*10,IF((F2="千")*(G2="年"),E2/12,IF((F2="万")*(G2="年"),E2*10/12,E2)))

分别将薪资的最大最小值标准化为单位为“千”的月薪表示,并求出二者的均值作为该岗位的平均薪资

这三个字段分别使用替换功能去除脏数据即可,注意的是行业这一列,此处只保留第一个行业类型,因此在替换后需要再以“/”分列取第一个元素。

清洗前
清洗后

发布信息这列中包含工作地点、学历要求、资历要求、招聘人数、发布时间、无效数据等信息,此处只提取学历要求和资历要求数据信息。

拆分思路:

a.首先使用替换去除其中的脏数据。

b.清洗数据后发现每行数据包含多个字符,字符之间用逗号分隔,并且每个单元格内字符的数量是不固定的,而需要的学历和资历信息在每个单元格中的位置也不固定。

c.使用函数“=LEN(F2)-LEN(SUBSTITUTE(F2,",",""))+1”计算单元格内以逗号分隔的字符个数,计算后发现每种字符个数的数量及其所占总数据的比例为

字符个数数量占比
327886%
4438610%
53044467%
6579313%
719054%

可见大部分数据的字符个数都集中在4、5、6,回到数据按字符个数筛选,字符个数为4时:其中大部分都缺失资历这一信息;字符个数为5时:包含要提取的信息,且资历位于第二个,学历位于第三个;字符个数为6时:同样包含要提取的信息,且资历位于第二个,学历位于第三个

字符个数为4时
字符个数为5时
字符个数为6时

因此,综上,为了降低提取数据的难度,只提取发布信息一列中字符个数为5和6的单元格中的资历和学历信息

3.结合实际业务进行数据分析

使用Excel的数据透视表功能,按城市汇总薪资的平均值,并筛选出岗位数量的TOP 15,可以看到数据分析师岗位的平均薪资大致在8-10k,其中北上深等超一线城市薪资在10k以上。

按行业汇总薪资的平均值,并筛选出岗位数量的TOP 15,不难看出数据分析师在各行各业中的平均薪资也是在8-10k,其中计算机、互联网、金融行业更是超过了11k,也从侧面反映出这几个行业近几年的热门程度。

小结:从以上两点可以看出,要想从事数据分析师这一岗位,且追求高薪资的话,最好还是去北上深等超一线城市的计算机、互联网、金融等行业。

使用数据透视表筛选学历和资历两个字段并计数,可以看出学历要求主要集中在本科和大专,而资历要求集中在1-4年和应届生。

不同学历、不同资历人才需求对比

将数据透视表的值字段显示方式更改为显示列汇总的百分比,可以发现一个规律:对于本科和大专,工作经验越长,本科的需求逐渐大于大专。

本科与大专在资历上的差异对比

小结:从学历方面而言,数据分析师岗位的要求不是很高,门槛相对较低;从资历方面来说,1-4年工作经验和应届生比较集中,对于想转行的人而言有一定难度。

汇总行业字段并计数,绘制各行业所占数量百分比的饼图

其中互联网和计算机行业两大巨头占比超过了三分之一,反映出这两个行业近年来的火热程度,而随着越来越多的行业开始重视数据,因此数据分析也逐渐渗透到各行各业中,但整体差距不大。未来数据分析还是主要集中在互联网、计算机行业,其他行业虽然也会有这一岗位,但需求量有限。

筛选字段公司规模,汇总数量及其占比,绘制条形折线图

不同规模的公司对于数据分析人才需求是存在差异的,规模越大的公司需求量越少,规模较小的公司需求量反而越大。这可能是因为大公司制度成熟,员工体系、组织架构相对比较完善,因此对于这一岗位的需求不是很大;而小公司可能处于创业初期或发展中期,内部体系相对不完善,人才稀缺,又或者处于转型期,因此需求量较大。

4.报表制作

使用Power BI制作报表,从多维度展示不同城市数据分析师岗位的情况

由于原数据中城市数量太多且部分城市岗位数量太少,从普遍性角度考虑,筛选岗位数量前20的城市进行报表制作。直接在Excel中对原始数据进行筛选,之后导入Power BI。

用到的可视化工具主要有:

①切片器:用来选择不同城市,从而对比不同城市各指标的差异

②卡片图:用于展示平均薪资、岗位数量等指标的数值

③仪表盘:用于展示一个城市中数据分析岗位薪资的平均值与薪资的最大、最小值对比

④饼图:用于展示学历、资历占比情况

⑤条形图:展示不同规模公司岗位需求数量差异对比

⑥百分比堆积条形图:不同类别公司对于学历需求占比差异对比

⑦树状图:不同行业岗位数量对比

在切片器中选择不同城市即可呈现出该城市数据分析师岗位的平均薪资、岗位数量、学历占比、资历占比、公司规模数量、行业岗位数量等信息,各图表之间实现了动态联动,实时地展示出各项指标信息。

5.总结与建议

综上,从薪资水平、城市差异、学历、资历、公司规模、公司类型等维度对数据分析师这一岗位进行分析,主要有以下结论:

针对以上结论,对想要从事数据分析师这一工作的人提几点建议,仅供参考:

哆哆女性网营销推广工具有哪些制作斗图网站哈尔滨seo服务现代军旅电视剧大全最新电视剧火锅鸡起名按诗词给宝宝起名观看防火知识观后感深蓝传说地下铁电影免费观看上海周易研究会柘城高中seo优化搜索引擎水浒传孙二娘爱丽丝梦游奇境读后感广州做网站建设哪家公司好seo优化北京酒店起名大全酒店取名商丘的皮肤医院八月播种什么蔬菜壹心理解梦蛋鸡养殖场起名长篇情感故事邯郸网站建设响应式女孩缺水起名字网站首页优化过度起名吗讲究吗深圳flash网站设计个体加油站起名大全网络营销是什么推广成都制作网站哪个好淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化