大数据财务分析(第2版·微课版)
上QQ阅读APP看书,第一时间看更新

二、数据类型

企业面对的传统数据主要是交易数据,而互联网和物联网的发展,带来了诸如社交网站、传感器等多种来源的数据。数据来源于不同的应用系统和设备,因此数据类型多种多样。通常,我们把数据类型分为三类:结构化数据、半结构化数据和非结构化数据。

1. 结构化数据

结构化数据是按照特定的结构存储的,通常以表格的形式呈现,每个数据项都有明确的定义和数据类型,数据间的因果关系较强。财务系统、信息管理系统、医疗系统等关系型数据库产生的数据和Excel表格等都属于结构化数据。

2. 半结构化数据

半结构化数据的数据结构并不完全固定,但是每个数据项仍然有明确的标识,数据间的因果关系较弱。XML文档、JSON文档、邮件、网页等属于半结构化数据。

3. 非结构化数据

非结构化数据的数据结构没有明确的定义,数据项之间的关系也不明确,数据间没有因果关系。文本、图片、音频、视频等属于非结构化数据。当前,非结构化数据越来越成为数据的主要部分。知名研究机构IDC的调查报告显示:企业中80%的数据都是非结构化数据。