1 / 101
文档名称:

基于空间自相关的空间数据挖掘若干关键技术研究.pdf

格式:pdf   页数:101页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于空间自相关的空间数据挖掘若干关键技术研究.pdf

上传人:kh6797 2016/7/2 文件大小:0 KB

下载得到文件列表

基于空间自相关的空间数据挖掘若干关键技术研究.pdf

相关文档

文档介绍

文档介绍:南京航空航天大学博士学位论文 I 摘要由于计算机技术、网络技术、空间数据采集技术以及空间数据库技术等的迅速发展, 使得复杂多变的空间数据日益膨胀,远远超出了人的解译能力。因此对从空间数据库发现空间知识的需求日益增长,于是出现了用于从空间数据库中进行知识发现的崭新研究领域——空间数据挖掘。空间数据挖掘指的是从空间数据库中抽取隐含的知识、空间关系或非显式地存储在空间数据库中的其它模式等。它是多学科和多种技术交叉综合的新领域,汇集了来自数据挖掘、机器学****模式识别、空间数据库、统计学、人工智能、地理信息系统、遥感以及决策支持系统等各学科的成果。 本文系统的介绍了空间数据挖掘的基本理论,比较传统数据挖掘与空间数据挖掘的不同之处。由于空间数据的特殊性, 传统的数据挖掘技术已经不再适用于从空间数据库中有效地发现知识,只有研究新的理论、技术和方法,才能从空间数据库中挖掘出新颖有效的、能被人们理解的空间知识。针对空间数据的自相关性,本文重点对空间聚类、空间同位规则以及空间分类和预测进行了研究。 本文的主要创新成果包括以下四个方面: (1)研究了如何进行高效空间聚类的问题。对 DBSCAN 算法进行改进,提出了一种改进的基于密度的抽样聚类算法(IDBSCAS), 它不仅能够有效地处理大规模空间数据库,而且在聚类时既考虑了空间属性又考虑了非空间属性。该算法采用了一种新的抽样技术,不需要再对纯核心对象邻域中的每个对象都执行区域查询,从而节省了许多聚类时间;另外,通过引入匹配邻域的概念,使得该算法在聚类时,不仅考虑了空间属性也考虑了非空间属性,提高了聚类质量。2 维空间数据测试结果表明IDBSCAS 算法在聚类效果和执行时间上都比DBSCAN 算法好。 (2)研究了有效地挖掘正负空间同位规则的问题。尽管人们对挖掘空间同位规则做了一些研究,但大多数研究者仅仅对正空间同位规则进行研究,没有考虑负空间同位规则。提出了一种新的正负空间同位规则挖掘算法(PNSCLRMA),它不仅能挖掘正空间同位规则也能挖掘负空间同位规则。在该算法中采取了两项优化技术,第一,为了减少大量的连接操作,定义了星形邻域的概念;第二,采用了剪枝技术,只保留感兴趣的空间同位模式。实验表明该算法能有效地提取正负空间同位规则。 (3)研究有效的空间数据预测模型。提出了在多元线性回归模型的基础上用基于空间自相关的空间数据挖掘若干关键技术的研究 II 于空间数据预测的模型(MLR *)。该模型在多元线性回归模型的基础上,首先通过在输入变量中加入空间信息,然后把新的输入变量输入多元线性回归模型来估计模型参数,最后再进行空间预测。实验结果表明,该方法能取得与空间自相关模型几乎相同的预测效果而且它的计算代价较小。 (4)研究了基于模糊c-means 算法的空间分类和预测。通过引入空间对象对模糊聚类的模糊隶属度的概念,提出了基于模糊 c-means 算法的空间数据分类和预测的方法(SFCM)。该方法首先用模糊 c-means 方法对数据集论域空间进行聚类,但由于空间数据具有空间自相关的特性,在用模糊 c-means 算法进行空间聚类时加入了空间信息。然后计算每个空间对象对所有聚类的模糊隶属度并从中找出模糊隶属度最大的聚类。最后用该聚类中心对象的因变量的值作为该空间对象的因变量的估计值。理论分析和实验结果表明,本文方法比空间自相关模型具有较好的分类和预测能力,而且本文方法具有更高的求解效率;另外,本文方法与 CPFCM 方法相比,其分类准确率比CPFCM 方法的分类准确率明显要高,这也就说明在进行空间分类和预测时,必须加入空间信息。 关键词:空间数据挖掘;空间自相关;空间聚类;空间同位规则;空间分类和预测南京航空航天大学博士学位论文 III Abstract T he qu ick development of computer technologies, network technologies , spatial data collection technologies and spatial database s technologies make spatial data more complex, more changeable and bigger, which has been beyond the human ability to analyze, so the d emand of discovering knowledge from spatial database s is strengthen ed increasingly and a new research field in order to discover knowledge from spatial