犯罪制图与警务优化
上QQ阅读APP看书,第一时间看更新

第二节 GIS地理数据分析方法

GIS地理数据分析是指利用地图分析及空间统计方法,对符合GIS格式的可视化数据、空间对象、属性数据、空间过程等地理数据加以估算、测量与分析,以探索隐藏在地理(空间)现象之后的原因、规律和原理。相对于普通数据,地理数据在数据特征、数据间相互关系、处理技术等方面均具有一定的特殊性,且通常无法满足传统统计方法的基本假设传统统计学方法大多建立在样本独立与大样本的基本假设上,然而空间上对象与事件的相互依赖性普遍存在,致使大部分空间数据样本之间并不独立;另外,有些空间数据采样十分困难,如某些气象台站稀疏地分布在山区,导致样本点太少而不能满足抽样方法的两大基本假设,因而不适用于传统的社会科学统计分析方法。,故传统社会科学或犯罪学量化研究中,典型的采样与运算模型并不适用于地理数据分析,而需使用专门的空间分析方法与模型才能对相关数据进行科学性分析并得出正确的结论。

一般而言,地理数据分析种类包括图形分析、空间数据分析和空间模型建构等;而地理数据分析技术或方法则以格局分析、密度分析、距离分析、空间相关分析、空间数据探测、空间统计、空间插值、空间回归分析等技术为主(Cressie, 1991; O'Sullivan & Unwin,2002)。在犯罪地理数据分析方法部分,学者张平吾将其归纳为空间句法分析(Space Syntax)、点分布模式分析(Point Pattern Analysis)、最近邻距离分析(Nearest-neighbor Distance)、空间自相关分析(Spatial Autocorrelation)、空间关联局部指标(Local Indicators of Spatial Association)、探索性空间数据分析(Exploratory Spatial Data Analysis)、社会经济环境分析等(黄富源等,2006:222-230)。

自20世纪60年代末以来,相关领域学者对地理信息分析理论、方法和技术进行了专门的研究,试图将社会经济时空格局与过程加以数学化。总体来说,地理数据分析方法、技术内涵大致包括以下六个主要方面与内容(王劲峰等,2005)。

一、空间数据采集与处理

空间数据主要利用抽样、插值、缺值等方法获取并加以完备。空间抽样是指针对需要研究的空间信息,首先对其所属的地理学对象以抽样、空间关联性及精度衡量等方式获取符合空间统计假设的样本,其次依据原始假设与方法对所选取数据进行插值(加强某些空间特征)或缺值(去除某些空间特征)的预处理,从而取得符合分析条件的空间数据。

二、属性数据空间化和空间尺度转换

自然科学与社会科学数据通常具有不同形状、尺度的地理空间单元,需要建立属性数据空间化及空间尺度转换技术,或称可变面单元问题(Modifiable Areal Unit Problem, MAUP)。在地理数据分析领域中,通过包括GIS方法、尺度转化理论及方法、小区域统计学理论及方法等转换技术,并通过相关软件包设计后,可归结、转化属性数据与空间数据,进而实现属性数据空间化,并对地理数据分析结果的精确性和不确定性进行定量分析和解释。

三、空间信息探索分析

探索性空间数据分析(Exploratory Spatial Data Analysis, ESDA)是指针对具有空间位置信息、模型的属性数据进行分析或阐述、评价的空间模型。在地理数据分析领域中,多以表(Table)、地图(Map)与图形(Figure)链接,或对空间单元大小进行调整,或通过模型计算的区划(Regionalization)等方式,针对“某些事件在地图上的什么位置”“这部分地图的属性值在概括统计中处于什么位置”“地图的哪些区域满足特定的属性要求”等问题进行解释。

四、地理统计

直接获取的点状空间数据,或由点状空间数据,通过空间插值或趋势面分析趋势面分析法是针对大量离散点信息从整体插值角度出发进行趋势渐变特征分析的最简单的方法。而获取的空间连续分布数据,是空间数据的主要存在形式(例如气象台站、地质物探、生态环境等数据)。在地理数据结合各领域的研究中,往往需通过变异函数(Variogram)Variogram是空间分析方法之一,可求出变异量随距离变化的关系。根据变异函数所得的图形可分析区域化变量的空间自相关(Spatial Autocorrelation)结构,即分析样本的变异性以及空间结构,假设空间分布的随机变异平均值不随空间位置而改变,即假设其在空间上具有定常性(Stationary)。、克里格方法(Kriging)Kriging统计法主要根据区域化变量理论来探讨自然资源在空间上分布的相关性。就统计意义而言,它是一种从变量相关性和变异性出发,在有限区域内对区域化变量的取值进行无偏、最优估计的一种方法。克里格法的适用条件是区域化变量存在空间相关性,并能够发展出不同点或区块的推估系统方程式。、模拟方法(Simulation)Simulation是当今地理统计领域中最活跃的一种方法,多运用于空间极端值方面的统计分析,如在水污染研究中,需要通过污染金属所表现的极值来发现污染源。此外,Simulation通过多种实现(Realization)系统的表现,具有良好的统计效用。等地理统计方法,对相关空间数据进行科学化的探讨与解释。

五、空间模型构建

空间模型构建是地理数据分析的深化和升华,利用空间信息与专业属性信息,通过客观的数学法则与计算机运算,对社会现象进行检验、评估、模拟和预测,建立具有空间分布意义的模型。空间模型中的空间对象包括点、线、面和体等具有地理空间位置的数据;属性数据包括名目、顺序、等距和等比等可协助描述所观察的空间物体的数据;空间过程被分为区域过程(例如区域少年犯罪发展过程)、地理统计过程(如各种区位事实)、点过程(如犯罪人口分布)、斑块过程(如犯罪热点)和线过程(如犯罪转移)等。目前社会科学结合地理数据的模型构建,多通过空间回归模型搜寻研究对象在空间布局上的联系、差异以及空间多元解释变量,并以区域统计模型对研究区域内对距某一目标单元一定距离的空间范围内所有点的值进行分析,计算指定距离内的空间关联度,从而搜寻、监测空间内的热点(Hot Spots),应用于疾病、犯罪等空间格局的热点诊断和预测。

六、综合信息的预测

环境、地理、社会、经济、交通、疾病、犯罪等时空分布模式大多源自复杂因素综合作用的结果,目前一般数学统计运算方法大多只能进行单一成因要素的提取或简单过程预测功能。欲实现基于时空信息复合过程的科学预测,不仅需要进行多源复杂因素分解,更需要将多种分解模式重新组构融合形成一个新的整体模式。

根据已知点的地理信息数值来推断未知点的值或更进一步推断整个区域状况,也是目前地理学研究的重要内容。当前地理数据的分析趋向于整合前人先验信息与更加复杂的空间统计方法,从本质上提高空间估计的精确度,并最终建立起有效的空间扩展模型。