3.2.2 数据质量控制
大数据分析通常会有很大一部分时间用在数据的清理上,在公司日常流程中产生的数据质量也是分析是否准确的关键因素。再好的算法没有数据质量作为保障也是无价值的。
故不积跬步,无以至千里,我们在日常工作中需要控制好数据产出的质量。建立好数据核查的机制,通过持续改进来确保数据质量的不断提升也是管理者须及时开展的事情。
对于人力资源管理中常用的与人有关的信息,按照种类区分列举如下(见表3-2):
表3-2 人力资源管理常用信息项
这些看上去很简单的数据,在公司中也会不同程度地存在各种错误的情况,以下简单列举一些在不同公司中看到的错误案例及影响:
• 姓名错误:中国文化博大精深,有些相似汉字容易发生混淆出错的情况,比如已、己、巳。姓名出错会导致公司在为个人进行个税申报时发生错误。
• 银行信息错误:账号出现差错等情况,会导致公司每月发工资时,汇款被银行退回,影响员工及时收到工资。
• 工资错误:显而易见这是影响度很大的错误,不仅会有少发工资的情况,有些企业还有发生过发双份工资的情况。
• 离职信息错误:员工离开公司但是信息没有被及时更新,对公司和员工个人都有一定影响。
• 性别错误:有女同事由于在公司系统里的性别为男,导致其无法在休假功能中请产假的情况。
• 父母子女的年龄错误:员工自行在系统中错误输入了父母子女的生日年份,导致在系统中产生18岁以下的父母和70岁以上的子女,影响企业为员工家属购买保险的操作。
纵观各种错误,我们可以依据错误数据产生的时间点,将问题划分为数据输入问题和数据更新问题。
• 数据输入问题
公司的数据基本是由人借助于系统媒介来相互传递最后进入系统的。例如,员工填写纸质表格给HR,HR填写电子表格给服务中心数据录入员,由数据录入员最终录入系统。人脑不是电脑,只要是人就会有出错的可能性,每增加一次人工的操作,就会增加一次输入错误的机会。
• 数据更新问题
数据是流动的,比如员工搬家、换电话、银行卡变更、获得了新的资格认证等。如何确保这些信息能够及时反映到最新的系统中呢?这又是一个棘手的问题。
对于数据质量,我们可以通过系统控制、人工控制、流程控制来防范数据错误:
• 系统控制
为什么把系统控制放在第一条呢?因为在数字化时代,能让机器做的事情就尽量不要让人去做。以下几项数据错误防范工作是可以利用系统功能和科技来解决的。
1. 系统规则:最简单的是把一些规则,例如身份证信息和生日、性别的比较,家属关系和年龄之间的对比,级别和工资之间的比较,利用系统的自动检查机制在输入的时候就进行校验,发现问题并及时处理。
2. 自动采集:利用技术让机器自动采集相关的数据来取代人工录入,比如是否有可能通过指纹门禁,人脸识别、手机定位等来自动为员工进行无感打卡?这样就能尽量减少人为操作产生错误的可能性。
3. 自动核查与提醒:由于数据来源广泛,有的数据来源并不是公司的系统,而是通过其他的途径传递过来的。这时就会有不是因为数据错误而是因为根本没有数据输入的情况存在。这时候我们就可以利用机器人流程自动化的技术来对数据进行自动核查并反馈给相应的数据负责人。例如,当我们发现员工没有主动维护自己的银行账号时可以自动发出提醒邮件给员工。
• 人工控制
虽然在数据质量控制这方面我们希望尽量减少人工控制,但是在技术和流程不完美的前提下减少人为出错还是必需的。可以通过如下几种方式来进行:
1. 自查:提供核查表给所有涉及数据录入的人员,提醒对方按照核查表进行自查。
2. 互查:每个人都有盲点,因此可以让另一个人来进行检查,更容易发现盲点错误。
3. 统一数据核查及修正:人工进行数据报表的核查或者差异比较(例如,本月工资和上月工资的比对,以此发现异常情况)。
• 流程控制
1. 流程设计、减少浪费:我们要从流程设计上考虑是否有可能简化,减少数据不必要的传递步骤,从而减少出错的可能性。例如,可以让员工自行在系统中输入,由HR依据员工提交的身份证明来审核的方式控制数据质量。这样在减少了数据传递环节的同时,又有核查步骤来进一步确保质量。
2. 闭环设计、提升动力:如果维护数据这项工作对员工来说不会有直接的影响,自然员工就不会有特别高的优先度来及时维护和更新数据。HR需要考虑设计在什么场景中员工会实际用到此数据。例如,假设某些福利是定期快递到员工家里并发送手机信息提醒,员工在换电话号码及家庭住址时就会主动记得去系统中更新信息。
3. 错误分析、持续改进:通过系统的数据核查,我们可以进一步分析发现是在流程中的哪些步骤产生的问题,并进行相应的持续改进。
4. 流程审查、确保执行:有时问题的产生是因为流程没有被严格执行而导致的。因此,HR要定期审查流程设计及执行情况。例如,通过核查数据检查及修正的历史结果来确保流程是被正常执行的。
5. 容错管理、降低风险:由于数据不可能百分之百准确,所以企业在后续的流程中要考虑实际可能发生的错误并有相应的容错机制来应对错误数据。