可视化分析与SAS实现
上QQ阅读APP看书,第一时间看更新

1.2 数据可视化分析兴起的背景

上面的例子简单介绍了可视化分析如何帮助更好地理解和分析数据。但是,很显然,仅凭上面提到的技术性优势是不可能让这一领域成为数据分析行业的一个热点的。那么数据可视化分析为什么会变得如此重要?究其主要原因,还是由于数据分析日趋重要而引起的对数据分析需求的不断增长和对高素质数据分析人员的巨大需求。

数据已经成为各个组织机构的宝贵资产,如何有效地利用数据了解过去、管理现在、预测并且优化未来成为它们发展的重要问题,数据分析已经成为提升企业竞争力的关键环节。越来越多的组织机构依靠正确可靠的信息来进行决策并取得成功,而其中绝大部分正确可靠的信息出自数据分析,所以在这些组织机构中,逐渐出现了数据科学家的角色,并且这个角色显得日益重要。

各机构对于数据科学家的期望是能够对海量的数据进行处理,并采用适当的算法从海量数据当中获取有价值的信息。具体来说,数据科学家的职责体现在数据价值链的四个阶段:数据产生、数据获取、数据存储和管理、数据分析。如果把数据当作是原始资料,前两个阶段是资料采集阶段,而数据存储和管理与数据分析则是对这些原始资料进行深加工产生巨大价值的阶段。由于这四个阶段所需要的技能各不相同,所以一名出色的数据科学家也需要掌握应对各个不同阶段工作的技能。具体来说,数据科学家需要有一定的数学知识,尤其是统计学和矩阵运算的相关知识;另外,数据科学家应该有较强的程序开发能力,能够对算法和处理数据的逻辑通过开发代码实现;其次,数据科学家需要具备快速理解业务背景和问题的能力,在现实中不难发现,很多数据科学家也是某个领域(例如金融或供应链等领域)的业务专家;当然数据科学家还应当善于沟通,善于将分析的过程和分析的结果和别人分享。

对数据科学家的这些要求和他们所需要承担的责任,使得寻找合适的数据科学家并非易事。事实上具有丰富的数学知识,高超的编程经验,并且具有相当的行业领域知识的人才是非常稀缺的。而对于数据科学家的需求则是不断增加的。由此就带来两个问题,第一,如何降低数据分析的工作强度以使数据科学家能够承担更多的工作?第二,如何采用有效的技术与工具,使得更多的人可以分担数据科学家的工作?数据可视化分析技术就是在这样的背景出现并飞速发展的。好的数据可视化分析工具为具备一定业务知识以及数学知识,但对于计算机程序开发了解较少的人才提供了对大量数据进行快速有效分析的利器。可视化分析技术提供的自助式的数据准备、数据转换,交互式的数据探索以及容易上手的高级分析技术,可以让更多的人员经过短期的培训就能够处理和分析大量的数据。