1.1.2 地理空间数据组成特征
1.基础性与共享性
人口过剩、环境污染、森林破坏、自然灾害、流行疾病、寻找最合适某种作物生长的土壤、查找最佳行车路线等,都与地理因素有关。据悉,80%的信息都与空间位置相关。地理空间数据是数据库的基础,是其他数据库的一个重要组成部分,也就是说,在进行军事数据库、政务数据库、财经数据库、资源数据库、人口数据库等的建设时,往往离不开地理空间数据。
所有空间信息使用同一种规范或标准进行表达,这使得与空间信息打交道的人员可以使用同一种语言进行交流。在整个互联网环境内搭建一个畅通无阻的流通平台,使信息的交流与共享变得更加便捷,较好地解决了海量地理信息存储的不便,大大扩展了空间信息的共享范围。借助空间数据库系统,空间信息的应用范围更加广泛,实效性更能得到保障,准确性得以提高,信息的共享程度能得到加强。
2.随机性与模糊性
空间数据复杂性的一个特征就是不确定性,即模糊性。模糊性主要指介于有序和无序之间或无序与有序并存的现象,以及介于清楚和模糊之间或清楚和模糊并存的现象。表明事物性态或类属上的亦此亦彼性、中介过渡性,亦即对于事物是否具有某种性态,是否属于某个类别的问题,不能做出非此即彼的明确结论。模糊性几乎存在于各种类型的空间信息中,如空间位置的模糊性、空间相关性的模糊性以及模糊的属性值等。随机性描述事件发生的不确定性(某事件或者将发生或者不发生),数据不确定性是数据“真实值”不能被肯定的程度。传统的不确定性方法存在不足。概率统计通过概率考察随机事件发生的随机可能性,模糊集采用隶属度描述元素对概念的隶属模糊性,粗集是以自己的上近似集和下近似集为基础,把包括二者在内的所有不确定位置之边界集笼统考虑。在空间数据挖掘和知识发现中,是像传统的经典数学一样同时抛弃随机性和模糊性?是像概率统计一样仅仅考虑随机性而不考虑模糊性?还是像模糊集仅仅考虑模糊性而不考虑随机性?或者像粗集一样把随机性和模糊性笼统考虑,而留下一个难以解决的边界集问题呢?因此,需要引入新的理论与有效的方法去研究空间数据所具有的不确定性。同时,数据的属性空间分布、属性不确定性描述指标的建立以及定性数据与定量数据的转换等问题都有待深入探讨。
3.复杂性与多样性
空间数据源数据量大,时空类型不一致,数据噪声大。它既有空间特征(地学过程或现象的位置与相互关系),又有属性特征(地学过程或现象的特征)。空间数据不仅数据源丰富多样(如航天航空遥感、基础与专业地图和各种经济社会统计数据),而且结构复杂,且空间分辨率不断提高。这些数据源中的数据可能具有不同的数据格式和意义,为有效地传输和处理这些数据,需要对结构化或非结构化数据的集成进行深入的研究。随着对地观测计划的不断发展,每天可以获得上万亿兆字节的关于地球资源、环境特征的数据,使得对海量空间数据组织、处理和分析成为目前GIS亟待解决的问题之一。地理信息系统要处理比文字、数字等更复杂的地理空间数据。
4.区域性与多层性
地理信息系统一般都针对特定的地理区域,或者说与特定的地理区域相联系,以地理空间数据和信息为处理对象;而地理空间数据和信息又通常以区域为单位来组织。因此,区域性是地理空间数据的天然特征,特别是进行区域研究的GIS,如“陕西省生态环境数据库系统”、“塔里木河水资源管理信息系统”、“西安市房地产管理信息系统”等,系统名称前往往都冠以区域名称,即指明了系统的区域性。区域沿地球表面展开;地球表面如此广阔,人们通常将地球表面分成很多的图幅来制图,以致区域的分布及特点常需要若干幅水平相接的地图来表达。这一特点导致地理信息系统的数据处理必须具备图幅接边和读图剪切等功能,数据组织管理中需要有图幅管理或图库管理的功能。
地理空间数据还具有鲜明的层次性,而且其层次性包含两种含义。其一,不同比例尺的区域层次。地球上的区域层次是很多的,例如,从我国的小村庄,到乡镇、县(市)、地区、省、大区、国家,直到七大洲。不同的区域层次的地图必须采用不同的比例尺。其二,描述不同地理要素的专题层次或图层。专题图层相当于地图学中的专题地图,同一区域或同一图幅可以有多种专题图,如杭州市范围的交通旅游图、环境保护图、土地利用图、城市规划图等。在地理信息系统中,不同要素的地理空间数据也常常分别加以组织,形成同一区域的多重图层或专题数据层次,或用以加强显示的功能和灵活性,或基于它们进行多因子叠合分析。