主数据管理:企业数据化建设基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.4 主数据的属性

当主数据的定义和编码规范确定后,就需要确定主数据的属性内容了。属性代表使用者对业务实体关注的特性要素。

对于一个人来讲,他的身份证上所写的信息一定是从社会角度来看人们所关心的核心信息:姓名、公民身份号码和住址,我们还可以从公民身份号码中看出这个人的出生年月和性别。如果这个人去看病,那么医生关心的就是身高、体重、血型、过往病史等信息;而当这个人在企业工作时,企业就会关注他的入职时间、岗位、学历等信息。另外,笔者曾经接触过一个监狱管理系统,囚犯属性中还有一个叫作“绰号”的字段,可见属性范围内并没有限定的内容,但应遵守一些业务规则和标准。

主数据的属性信息从何而来?主数据的属性信息应当首先基于业务运转过程中的积累,同时也可以借鉴国家标准、行业标准、行业内头部客户的标准。

那么我们可以通过以下途径进行主数据属性信息的收集。

1.现有信息系统

当前的企业大多数只能使用软件厂商提供的现有数据模型。我们可以利用现有信息系统对基础数据的描述获取大量的主数据属性信息。

2.业务资料、业务单据

企业在业务开展过程中,必定会对关键信息进行记录,大量的业务过程和业务单据记录的基础信息内容,都可以成为主数据属性选取的素材。

3.对业务骨干的调研与访谈

对于成熟度较低、数据模型并不完全清晰的主数据,我们在进行主数据属性项调研时需要再次与业务骨干进行深入沟通,业务骨干对基础数据的描述也具有较大的参考价值。

通过以上工作的开展,我们可以获取一份主数据属性的基础资料库。我们可以将这些属性做初次整理,同时制定属性选择的策略,最终由项目组给出一份主数据属性确认表,既作为建模阶段的成果,也作为后续工作开展的依据。

主数据属性的选取往往涉及数据属性多少的问题,在这里我们只讨论主数据的普通属性,先不涉及其分类属性和编码。

主数据的属性获取通常有两种途径:一种是在所有与之对应的基础数据上,将获取数据属性的总和作为属性选取的来源;另一种就是根据数据模型设计的理念来进行数据属性设计。但无论是哪种设计模型,我们都要面临将多少种属性放入主数据中的问题。

首先我们先把主数据的属性进行大致归类。

1.基本属性

基本属性是对主数据本质的描述。从需求的角度讲,基本属性在各个系统都需要使用,是企业十分关心的一些属性。比如,在人员主数据中,人的性别、年龄、手机号码、邮箱、所属部门、所属单位、职级、职务等信息都是基本属性。

2.业务性属性

业务性属性是在比较专业的系统中的特定信息,如人员主数据中的入职时间、是否为专业军人、是否为党员等信息。这些属性是某个部门或业务人员出于自己的管理目的而对主数据属性做出的要求。

3.统计属性

统计属性并不取决于主数据本身,而是由于业务的发生而产生的统计分析性属性。比如,产品主数据中的本月销售数量、是否为畅销品等信息都是统计属性。

首先,我们认为主数据的属性项中不应当包含统计属性信息,如在一个信息系统的数据库表结构中,一个基础数据的表中一般不会包含统计属性信息,因为这样的统计属性信息的维度有很多(多变且不确定)。其次,统计属性信息是附加在这个事物之外的信息,数值受业务影响而并不由其本身决定。虽然这个属性的数值也需要在各个系统间共享,但是这样的属性以数据服务的方式通过统计系统发布会相对比较合理。

归类完成之后,就应选择可以进入主数据范围的属性了。主数据属性的选择有两种方式。一种方式是只选择该主数据最基础、最核心的基础属性,这些数据反映的是主数据最基础和客观的信息,也是各个系统都需要的信息。另一种方式是将我们发现的尽可能多的属性信息放入其中,以求在主数据管理系统中能够看到更多、更全面的信息。具体的选择策略如下。

1.选择基础属性策略

主数据只选取最基本的属性,后续工作则专注于系统间的编码名称一致和系统间的数据共享工作。主数据管理项目的管理难度高,选取基础数据即可实现主数据管理90%以上的价值,所以我们优先推荐此种策略。

2.选择大而全的集合策略

业务属性共享度低,可能仅在本系统中使用或仅由少数系统共用。如果将业务性属性纳入主数据模型,则主数据模型的变动会较为频繁。

在以往的主数据定义中,凡是需要共享的内容都希望进入主数据范畴,但我们建议这样的问题通过服务来解决。比如,在服务列表中增加获取人员“是否为专业军人”的服务,以及人员“是否为党员”的服务。这样既可以保证主数据模型的稳定,又满足了系统间数据共享的需求。主数据管理则应更加专注其本职的工作。

主数据属性的定义并没有严格的对错之分,即使将所有的属性都归入主数据中也可以,甚至可以说我们将越多的属性归入其中,主数据管理所能发挥的价值就越大,但这也恰恰是众多项目失败的地方。

设计其实是一个取舍的过程,我们的策略永远都是二八原则,即优先获取八成的价值。如果一定要追求剩余的两成价值,那么投入产出比就会变得不合理。所以我们建议在相对复杂的主数据管理体系构建过程中能够关注重点,优先解决核心问题。