大数据可视分析方法与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.1 网络数据简介

网络数据是一种普遍存在的数据结构,在现实应用场景中,许多数据都可以抽象成网络结构。例如,在金融交易中,如果将每一笔交易的交易双方抽象成两个实体,那么这笔交易就可以被抽象为两个实体间的边,这样,金融交易数据就可以被抽象成一个金融交易网络。根据原始数据来源的不同,通过抽象得到的网络结构、属性、特征各有不同,因此网络数据也有各种不同的分类。根据网络是否随时间演变,可以将网络数据分为静态网络数据和动态网络数据两个大类。

静态网络数据普遍存在于金融、社交、学术等应用场景中。一般地,通过对实体和实体间关系进行抽象,可以从许多数据中提取出静态网络数据,例如,学术合作网络就可以通过将论文作者抽象为节点,将论文合作抽象为节点间的边得到。静态网络主要包括网络拓扑结构、节点属性以及边属性三个方面的数据。对于静态网络数据的可视化,主要关注对网络拓扑结构以及节点、边属性的展示。网络布局,即研究如何将网络数据中的节点和边按照一定的规则排布在二维平面上,使得用户能够直接观察和分析网络数据。

动态网络数据是指网络的拓扑结构、节点属性、边属性和其他相关数据属性随时间变化的网络数据。在现实场景中,大部分对于动态网络数据的研究更加偏重于数据的动态变化,包括网络拓扑结构的变化、节点属性变化、边属性变化等。

下面主要介绍常用的网络可视化方法,根据前面的分类,主要包括静态网络中网络拓扑结构的常用可视化方法和动态网络中动态变化的常用可视化方法。