文档介绍:空间统计分析实习报告
Spatial statistics tools
分析模式工具集中的工具采用推论式统计,以零假设为起点,假设要素与要素相关的值均表现随机分布。然后计算P值说明,这种分布属于随机分布的概率。在应用中,返回Z得分和P值判断是否可以接受或拒绝零假设,同时在不同的工具中,还表示分布是聚集,或分散
是标准差的倍数,-P的概率下接受随机分布的接受域
Average Nearest Neighbor 最邻近分析
根据每个要素预期最近要素的平均距离来计算最邻近指数,当指数大于1,要素有聚集分布的趋势,对于趋势如何,还要依据 z—value和P—value 来判断,小于1时,趋向分散分布
最近邻指数的表示方法为:平均观测距离与预期平均距离的比率,预期平均距离是假设随机分布中领域间的平均距离
这种方法对面积指值非常敏感(期望平均距离计算中需要面积参与运算),如果未指定
面积参数,则使用输入要素周围最小外接矩形的面积(不一定合坐标轴垂直)
Spatial Autocorrelation (Morans I) 空间自相关分析
更具要素位置的属性使用Global Moran’s I 统计量量测空间自相关性
Moran’s I是计算所评估属性的均值和方差,然后将每个要素减去均值,得到与均值的偏差,将所有相邻要素的偏差相称,得到叉积。统计量的分子便是这些叉积之和。
如果相邻要素的值均大于均值,这叉积为正,如果以要素小于均值而一要素大于均值,则为负
如果数据集中的值倾向于在空间上集聚(高值聚集在高值附近,低值聚集在低值附近)
则指数为正,如果高值排斥高值,倾向于低值,则指数为负
之后,将计算期望指数值,将之与其比较,在给定的数据集中的要素个数和全部熟知的方差下,将计算Z得分和P值,用来指示次差异是否具有统计学上的显著性
Multi-Distance Spatial Cluster Analysis K函数分析
确定要素(后与之有关连的值)是否显示某一距离范围内统计意义显著的聚类或离散
基于 Ripley's K 函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可汇总一定距离范围内的空间相关性(要素聚类或要素扩散)
Ripley's K 函数可表明要素质心的空间聚类或空间扩散在邻域大小发生变化时是如何变化的。
如果特定距离的k观测值大于k预期值,则与该距离下的随机分布相比,该分布的聚集程度更高,反之亦可。如果,k观测值大于HIConfEnv,则该距离的空间聚类具有统计学上的显著性,如果k观测值小于LwConFEnv,则该距离的空间离散具有统计学上的显著性
对于置信区间,点的每个随机分布称为“排列”将一组点随机分布多次,将对每个距离选择相对预期k值向下和向上最大的k值,作为置信区间
Anselin Local Moran’s I局部Moran’s I 分析
给定一组加权要素,使用局部Moran’s I统计量来识别具有统计显著性的热点,冷点和空间异常值。
Z得分和 p值是统计显著性的指标,用于逐个要素判断是否拒绝零假设。他们可指示表面相似性和向异性
如果要素 Z值是一个较高的正数,则表示周围的要素拥有相似值,输出要素Cotype字段会将具有统计显著性的高值聚类表示为 HH,低值聚类表示为LL
• 如果要素的 z 得分是一个较低的负值,则表示有一个具有统计显著性的空间异常值。输出要素类中的
COType 字段将指明要素是否是高值要素而四周围绕的是低值要素(HL),或者要素是否是低值要素而四周围绕的是高值要素(LH)。
Getis-Ord General G 高低聚类分析
使用 Getis-Ord General G统计可度量高值或低值的聚类程度
Z得分越高或越低,聚类程度就越高,如果 z得分接近零,则表示不存在明显的聚类,为正表示高值的聚类。为负表示低值的聚类
Hot spot Analysis(Getis-Ord Gi*) 热点分析
如果给定一组加权要素,使用 Getis-Ord Gi* 统计识别具有统计显著性的热点和冷点
• 如果要素的 z 得分高且 p 值小,则表示有一个高值的空间聚类。如果 z 得分低并为负数且 p 值小,则表示有一个低值的空间聚类。z 得分越高(或越低),聚类程度就越大。如果 z 得分接近于零,则表示不存在明显的空间聚类。
Adabg00 模式分析
Average Nearest Neighbor 最邻近分析
最邻近指数小于1。聚集分布。
Z得分为-,对应的P
,即这种分布是随机的情