
四、人力资源大数据及其典型应用
“信息社会”的确立标志着大数据时代的到来,也标志着一场生活、工作与思维的大变革。大数据的本质不是它含有多少信息,而是它可以对信息数据进行专业的处理和整合,大数据时代的到来为企业人力资源管理带来一场新的变革。正如维克托·迈尔·舍恩伯格在《大数据时代》书中所写,“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……”汹涌来袭的大数据浪潮,也是加速企业创新和变革的重要利器。
对处于战略转型中的人力资源管理,大数据的思想如何体现?如何运用大数据提升HR价值,进而提升组织效能?
1.什么是人力资源大数据
大数据近几年发展很快,图1-18展示了每分钟互联网能产生哪些数据,这些数据还在不断地上升。数据的大小通常按照如下进阶,后者是前者的1024倍。
KB→MB→GB→TB→PB→EB→ZB→YB→NB→DB
根据业界的共识,达到PB这个级别基本上是大数据的临界点,也就是说数据量积累到PB水平以后,才能开始去谈大数据。

图1-18 2016年年底互联网一分钟产生的数据量(数据来源于网络)
那么人力资源的数据是否属于大数据?对于人力资源来讲,大部分企业人力资源领域产生的数据基本上还是在GB这个级别,可能有几十个到几百GB,BAT等一些大企业平时也比较重视数据,也有技术手段收集与积累数据,存量相对高一些,可能达到几十到几百个TB。所以仅仅从数据量上还远远没达到大数据的量级。那是不是说我们人力资源就不能谈大数据了?我们可以利用大数据的思维方法以及技术,去研究与探索人力资源管理,在人员规划、人才画像、离职预测、高潜识别、组织效能、文化活力、舆情分析等方面进行深度洞察,从而为企业人才方面的决策提供高含金量的辅助依据与建议。
2.人力资源大数据的特点
(1)相关性
人力资源大数据特点之一是相关性,其主要体现在三个层面:
①人力资源内部业务数据:基于员工在“工作、生活、学习、发展”的四个圈产生的各种各样的信息(包括结构化数据、非结构化数据,下文有示例),彼此关联又互相影响。
②人力资源外部数据:一是基准数据,比如各地五险一金政府规定,这些基数的调整,就会影响到公司的人工成本;不同城市对社保缴纳年限对于买车买房的限制,积分落户,租房补贴,可能影响人才的流动等。二是行业对标数据,比如薪酬调研报告、劳动力市场趋势报告等。三是竞品公司各方面的对标数据。
③企业经营数据也会影响到人力资源的数据分析,当公司效益好时,人力资源方向的投入也会增加,比如增加人才招聘力度与培训费用、提高员工薪酬福利待遇等。当效益不好时,可能采取关停并转、减员增效等措施。
(2)流转性
大部分人力数据贯穿在“入离升降调、选用育留管”的各个流程中,前后端到端流通并交互,确保业务正常运转。流转确保了数据的连续性与一致性,并且流程中产生的数据都有记录,累积下来可用于未来的进一步大数据分析。人力资源数据提供接口到下游系统,以便支撑其他业务系统需要;同时其他业务系统的一些数据与人力资源数据可以有交互。
(3)分散性
①人力资源本身的数据分散在不同系统里,这可能是由于系统规划建设的局限性,有些系统不是互联互通的,比如招聘数据、培训数据、测评数据、评估数据等。
②人力资源之外的数据,比如经营数据,涉及财务、销售、业务等部门,掌握在各个部门自己手里,由于利益交错盘结,数据尚未共享。
③外部行业对标数据。这些数据大多分散在不同的地方,需要花费不少人力物力去收集、整理、汇总;即使收集齐了,由于维度的不同,综合分析也不容易。
从实践角度来说,目前人力资源数据存在一定问题,一是数据量不够多,目前很多企业信息化系统建设也不够完善,数据收集与积累有限,绝大多数企业还处于传统意义的分析。即使信息化比较完善的企业,由于缺少数据挖掘方面的专业人才,数据的积累仍停留在起始阶段。二是技术限制不易分析,绝大多数人力资源从业者不懂大数据技术,而大数据专家也不懂人力资源管理。新时期需要培养跨界复合型人才,才能将人力资源管理推到新高度,助力业务发展与管理决策。
3.人力资源大数据的价值
人力资源大数据的价值主要体现在有效运用大数据思维与技术,可以在人力资源规划、招聘、员工学习与发展、绩效管理、薪酬与激励体系、员工福利与服务等方面展开探索与实践,通过数据挖掘与建模分析,预测未来趋势,为人力资源决策提供辅助支持,从而体现大数据的价值。
首先,大数据时代思维方式发生了根本性变化。过去我们做数据都是采样,而大数据实际上不是采样,而是选用全量数据。另外,我们过去采样的时候要求个体数据要很精确,但是大数据可以允许不精确,它可以接受混杂性,它要求的是有效性。还有一个特点,过去做数据分析是事先提出一个因果假设,然后收集数据,通过分析来验证假设,这是因果关系;但大数据讲究的是从大量数据中找出相关关系。
其次,大数据时代思维模式的转变。大数据的处理和技术发展到今天,仍处于“盲人摸象”的阶段(图1-19)。你可能摸到的是“腿”,他可能描述的是“鼻子”,虽然正确但都是局部,不是全貌。随着大数据技术的不断进步和越来越多的活而全的数据源,探索到的东西也将无限逼近事实与真相,也越能获得更深邃的智慧与洞察,也就体现了大数据真正的价值。

图1-19 大数据的“盲人摸象”阶段
4.人力资源大数据典型应用
任何一个组织,要抓住大数据的机遇,就必须做好几方面的工作。从技术角度看,首先,要收集并且开发特定的工具,来管理大规模并行服务器产生的结构化和非结构化数据,这些数据,可能是自己专有的,也可能来源于“云”。其次,每一个组织都需要选定分析软件,用它来挖掘数据的意义。但可能最重要的是,任何组织都需要人才来管理和分析大数据。这些人被称为“数据科学家”,他们集黑客和定量分析员的优势和特长于一身,非常短缺。聪明的领导人,将想方设法留下这类人才。
不少的公司都意识到这难得的机遇,而且已经采取了行动。比如,通用电气将投资15亿美元在旧金山湾区建立一个全球软件和分析中心,作为全球研发机构的一部分。中心拟雇佣至少400名数据科学家,现在已经有180位到位。通用电气在全球拥有超过1万名工程师从事软件开发和数据分析工作。通过共同的分析平台、训练、领导力培训以及创新,他们的努力得以协调配合。通用电气对于大数据的研究活动,相当一部分集中在工业产品上。
(1)百度人力资源大数据共享信息平台
百度的人力资源大数据共享平台已经迭代到3.0版本,从人才管理、运营管理、组织效能、文化活力、舆情分析等,做了相应的指标体系建设和相应的建模,在这之上完成了很多应用,比如BIEE、个人全景、用户画像等,为管理层的人才决策提供参考与建议(详见第五章)。
(2)人才雷达把数据挖掘用到招聘服务
《大数据时代》译者、电子科技大学互联网科学中心主任周涛创立了成都数之联科技有限公司,并把数据挖掘用到了招聘服务领域。
人才雷达系统的成功关键就在于,受邀用户可以选择绑定自己的LinkedIn、微博、人人等社交网络账号,让人才雷达搜索引擎自动匹配和推荐用户社交网络中更加匹配所招岗位技能要求的人才,并依照契合度来进行推荐排序,每一位被系统列出的推荐者头像旁都会展现一个9维的人才雷达图,以方便招聘官挑选,这正是“人才雷达”名称的由来。
其核心技术是人才搜寻模型和匹配算法,通过对被推荐者邮箱、网络ID、Cookie地址等多维度身份标识的匹配,从9个维度来判别被推荐人的适合程度:职业背景、专业影响力、好友匹配、性格匹配、职业倾向、工作地点、求职意愿、信任关系、行为模式。
(3)e成科技的大数据招聘服务SaaS平台
e成科技(上海逸橙信息科技有限公司)组建于2013年6月,是全国领先的一站式大数据招聘服务平台提供商,利用机器学习算法、数据挖掘和NLP(自然语言处理)等技术提升简历与岗位的匹配效率,激活企业及猎头等招聘机构的闲置简历资源,提高存量简历利用率,形成协同共享效应,打造基于算法的招聘服务SaaS平台。
目前,由e成科技提供的大数据招聘服务包括简历搜索、基于企业职位的个性化推荐、人脉内推、人才库、约Ta,以及包括职位BI分析、企业大数据画像、人才地图在内的多项数据BI服务,帮助企业有效提高招聘资源利用率,并为企业人力资源决策提供关键性参考。
(4)上海联通推出人力资源“管理仪表盘”
上海联通面向公司管理层推出人力资源“管理仪表盘”,采用定量分析、定期推送、用数字说话的方式,建立可视化报告中心,提高数据的直观性及易读性。管理仪表盘现有10个维度、30多个专题,以“图形—数据—解读”的形式,为管理层直观呈现人力资源管理分析报告。
以效率改善为前提、以质量管控为目标、以流程重构为核心、以信息系统为载体,面向员工入职、调动、换岗、退出等基础业务探索人力资源数字化运营管理转型(表1-6)。
表1-6 人力资源基础业务流程数字化运营功能

(5)京东的离职预测模型
离职预测——业务建模。通过2015年研发员工在离职数据,预测2016年在职员工的离职倾向;根据业务场景,选择三个机器学习模型。为规避过度拟合的问题,基于业务、模型提炼出适合京东的离职预测模型(图1-20)。

图1-20 京东员工离职预测模型
离职预测——落地实践。数据结论与实践业务结合,持续优化JD(图1-21)。

图1-21 数据预警指导实践
(6)大数据预测员工心理状态趋势
计算机自主学习的强大,在于无止境地自我完善,具有无与伦比的适应性和自生长性。事实上,在分类或趋势预测的背后,是庞大的数据演算,建模和预测的过程包含了繁复的统计过程,包括描述统计与推断统计。人工智能看似神秘,其实充斥着大量的数学计算的研究过程。在人才发展方面,人工智能可以帮助我们预测员工的心理状态趋势,从而激发员工的热情。
柯塞(BESTER)中国合伙人胡闻斌提道,柯塞曾启动了管理环境对人类心理的影响研究,旨在寻找那些激发员工工作热情的最佳管理环境方面的实践。目前已积累了3414个管理环境样本,并针对每个样本持续采集了约5年的员工心理及行为数据,调研不同企业所采取的管理战略以及具体的执行方案。通过运用人工智能,进行了大量的建模和验证工作,发现不同的管理方式下的员工心理状态变化趋势,尤其是工作动机,在一定程度上都是可预测的。