热门搜索 :
考研考公
您的当前位置:首页正文

GIS中的数据分析

来源:伴沃教育
二、GIS中的数据分析

第1节 空间数据分析

地理信息系统(GIS)与—般的计算机辅助制图(CAM/CAD)系统的主要区别在于GIS具有空间数据的分析、变换能力。除一些基本的变换功能如数据更新、比例尺变换,投影变换外.主要的空间分析和变换功能为地理数据的拓扑和空间状况运算,属性综合运算,几何要素与属性的联合运算等。为了完成这些运算,GIS一般都以用户和系统交互的形式提供以上分析处理能力。应指出,栅格数据结构与矢量数据结构的空间分析方法有所不同。一般来说,栅格结构组织数据的空间分析方法要简单一些。

下图以分级结构形式概括的各种空间分析类型和方法:

图 : GIS空间分析方法

一、综合属性数据分析

GIS中属性数据一般采用关系型数据库管理,因此,关系数据库中各种分析功能都可以对属性性数据进行分析。

(一)数学计算

属性数据中的数字型数据可以进行“加”、“减”、“乘”、“除”、“乘方”等数学运算,以产生新的属性值,如人口数/图斑面积(km)=人口密度。

(二)逻辑运算

逻辑运算的基本原理是布尔代数,这种逻辑分析几乎可以在所有

的空间分析中得到应用。它按属性数据的组合条件来检索其他属性项目或图形数据,以及进行空间聚类.

(三)单变量分级分析

属性的单变量分级分析是把单个属性作为变量,依据布尔逻辑方法分成若干个类别。这种分析方法,可进行属性数据的合并式转换,把复杂的属性类别合并成简单的类别,以实现空间聚合

(四)多变量统计分析

多变量统计分析主要用于数据分类。在GIS中存储的数据具有原始的性质,以便用户可以根据不同的使用目的,进行任意提取和分析,特别是对于观测和取样数据.随着采用的分类和内插方法的不同,得到的结果有很大的差异, 因此,在大多数情况下, 首先是将大量未经分类的属性数据输入信息系统的数据库,然后要求用户建立具体的分类算法,以获得所需要的信息。

1.变量筛选分析

随着现代数据收集系统的不断改进,在一个取样点上常可以收集到几十种原始变量。在这些变量中有许多是相互关联的,可以通过寻找一组相互独立的变量,使多变量数据得到简化,这就是变量筛选分析。常用的变量筛选方法有主成分分析法、主因子分析法和关键变量分析法等。

主成分分析是以取样点作为坐标轴,以属性变量作为矢量矩阵,研究属性变量之间的亲疏关系。

主因子分析是以属性变量作为坐标轴,以取样点作为矢量矩阵,

通过以相似系数建立相关矩阵来研究取样点之间的亲疏关系。

关键变量分析则是利用同性变量之间的相关矩阵,通过由用户确定的阀值,从数据库变量全集合中选择一定数量的关键独立变量,以消除其它冗余的变量。

2. 变量聚类分析

所谓变量聚类分析就是一系列数据观测点的属性交量,按其性质上的亲疏远近程度进行分类。

二、缓冲区分析

缓冲区(BUFFER)分析即根据数据库中的点、线、面实体,在其周围建立一定宽度范围的缓冲区多边形(如下图)。这是GIS空间分析的基本功能之一。例如,断层影响带.

特征要求缓冲区宽度不同时的处理: 在进行缓冲区分析时,经常发生不同级别的同一类要素具有不同的缓冲区大小。例如,在城市土地地价评估时,沿主要街道两侧的通达度、繁华度的辐射范围大.而小街道则较小.这与要素的类型和特点有关。在建立这种缓冲区时,首先应建立要素属性表,根据不同属性确定不同的缓冲区宽度,然后再产生缓冲区.

三、空间合成叠置分析

空间信息(多边形网络叠置层)的合成叠置,就是把同一地区、同一比例尺的两幅或两幅以上的图层重叠在一起,产生新的空间图形或空间位置上新的属性(加、减、判别等)。叠置后产生的新的图形属性就是原叠置相应位置处的图形对应属性的函数,可用下述关系式表达:

U=f (A、B、C… )

式中A、B、C…表示原叠置层的图形的属性.f函数取决于各层上的属性与用户需要之间的关系。

(一)

包含分析

包含分析主要用于确定点、线、面之间的相互联系,如确定某区域内矿井的个数,这是点与面之间的包含分析。

(二)多边形叠置

参加叠置分析的两个图层应都是矢量多边形结构。若需进行多层叠置,也是两两叠置后再与第三层叠置,依次类推。其中被叠置的多边形为本底多边形,用来叠置的多边形为上覆多边形,叠置后产生具有多重属性的新多边形

(右图)

多边形叠置的目的是通过区域多重属性的模拟,寻找和确定同时具有几种地理属性的分布区域;或是按照确定的地理指标,对叠置后产生的具有不同属性级的多边形进行重新分类或分级。

(三)栅格数据的叠置分析

栅格数据的叠置,有三种主要变换类型的函数关系,即点变换、区域变换和邻域变换。

四、网络分析

网络是一系列相互联结的弧段.形成物质、信息流通的通道。例如;水从水库流向各种水渠;从发电厂经电网向用户供电;城市的道路网均构成网络.

网络分析的主要用途是:选择最佳路径;选择最佳布局中心的位置。所谓最佳路径是指从始点到终点的最短距离或花费最少的路线;最佳布局中心位置是指各中心所覆盖范围内任一点到中心的距离最近或花费最小;网流量是指网络上从起点到终点的某个函数,如运输价格,运输时间等。网络上任意点都可以是起点或终点。

第2节 数字地面模型(DTM)与地形分析 一、DTM的概念与作用

数字地面模型是描述地面诸特性空间分布的有序数值阵列.

二、DTM的表示方法 1.数学分块曲面表示法

这种方法把地面分成若干个块,每块用一种数学函数,如博立叶级数多次多项式、随机布朗运动函数等,以连续的三维函数高平滑度地表示复杂曲面,并使函数曲面通过离散采样点。

2.规则格网表示法

规则格网表示方法是把DTM表示成高程矩阵,它来源于直接规则矩形格网采样点或由规则或不规则离散数据点内插产生。由于计算机对矩阵的处理比较方便.特别是以栅格为基础的GIS系统中高程矩阵已成为DTM最通用的形式。

3.不规则三角网(TIN)表示法

不规则三角网(TIN)是专为产生DTM数据而设计的一种采样表示系统。它克服了高程矩阵中冗余数据的问题,而且能更加有效地用于各类以DTM为基础的计算。因为了DTM可根据地形的复杂程度来确定采样点的密度和位置,能充分表示地形特征点和线,从而减少了地形较平坦地区的数据冗余。TIN表示法利用所有采样点取得的离散数据,按照优化组合的原则,把这些离散点(各三角形的顶点)连接成相互连续的三角面(在连接时,尽可能地确保每个三角形都是锐角三角形或是三边的长度近似相等),如下图。

三、DTM的空间内插方法

DTM空间内插的概念十分简单,即在一个由x、y坐标平面构成的二维空间中,由已知若干离散点的高程,估算待内插点的高程值。由于DTM采样的数据点呈离散分布形式,或是数据点虽按格网排列,但格网的密度不能满足使用的要求,这就需要以数据点为基础进行插值运算。

DTM内插按插点分布范围,可分为分块内插、剖分内插和单点移面内插三类,见下图。

常用的内插方法有:

1. 2. 3. 4.

二元多项式拟合内插(趋势面拟合) 二元样条函数内插 距离加权平均内插 KRIGGING算法

四、DTM地形分析

尽管DTM的应用十分广泛,但地形分析是其基本应用,其它应用都可由此推演、扩展。

地形分析的内容有地形因子提取、地表类型分类以及剖面团的绘制等。

(一)地形因子的自动提取

1.

坡度和坡向分析:坡度定义为水平面和地形表面之间夹角

的正切值;坡向为坡面法线在水平面上的投影与正北方向的夹角。 坡度和坡向的计算通常在3×3个DTM格网窗口中进行。 2.

地表粗糙度计算:地表粗糙度是反映地表的起伏变化和侵

蚀程度的指标,一般定义为地表单元的曲面面积与其在水平面上的投影面积之比。但根据这种定义,对光滑而倾角不同的斜面所求出的粗糙度,显然不妥当。实际应用中,以格网顶点空间对角线L1和L2的中点距离来表示地表粗糙度,值愈大,说明4个顶点的起伏变化也愈大。 3.

高程变异分析:高程变异是反映地表单元格网各顶点高程

变化的指标,它以格网单元顶点的标准差与平均高程的比值来

表示。 4.

谷脊特征分析: 谷和脊是地表形态结构中的重要部分。谷

是地势相对最低点的集合,脊是地势相对最高点的集合。 (二)地形剖面图的绘制

DTM表示了—个区域地形的整体状况。在应用中经常需要了解从地面上一点至另一点沿途的地形变化情况,如通视性、地貌轮廓形状、斜坡特征、地表切割强度等,这就需要绘制地形剖面图。 (三)真实感地形表示

把地形表面以真实感强的三维图形表示出来。若把地形表示成色调连续变化的三维图像,则在土地景观设计、森林覆益模拟等应用中更适用、美观和形象。

其处理过程是:透视变换;色调计算,隐藏面消除;图形输出等。 (四)泰森多边形分析

第三节 数据输出与自动制图(略)

因篇幅问题不能全部显示,请点此查看更多更全内容

Top