1 / 76
文档名称:

多维信息挖掘系统的实现及其应用(可复制论文).pdf

格式:pdf   页数:76
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

多维信息挖掘系统的实现及其应用(可复制论文).pdf

上传人:mkt365 2013/11/12 文件大小:0 KB

下载得到文件列表

多维信息挖掘系统的实现及其应用(可复制论文).pdf

文档介绍

文档介绍:摘要7⒘松⒌惚冉贤挤治龉δ埽芙ɑ嘏惺萦胝媸凳葜涞牟钜旄数据挖掘在测井信息处理过程中起着很关键的作用,但目前尚有的典型数据挖掘系统或多或少存在交互性弱、挖掘过程可控性低、数据可视化程度差等缺点。本文依据测井信息处理的实际需要,根据数据挖掘的科学流程,结合神经网络、遗传算法、缂癟聚类算法等数据挖掘算法理论,利用计算机模拟墒踊喑坦ぞ遶、数据库管理及数据可视化等技术研究开发了一套多维信息挖掘系统。本文还重点提出了利用该系统建立精度好、效率高的分类、回归及聚类模型关键流程及方法。取得的主要成果有以下几点:7⒘硕懒⒂诖笮褪萃诰蛳低持獾摹⒄攵缘匮ёㄒ档目7攀蕉辔息挖掘系统,建立了测井、网格等地学数据的输入接口,简便了对测井、网格等地学数据进行数据挖掘时的数据输入过程,同时也建立了文本数据及的输入接口,也为其他信息的数据挖掘提供了可能。7⒘嘶谑菘墒踊际醯纳⒌阃挤治龉δ埽舛杂谑萏迨粜约涞相关性分析带来很大的便利;还开发了属性聚合、属性转换、奇点标注及抽样等数据预处理功能,属性聚合及属性转换使得数据体的各属性能更好地适应各种不同的数据挖掘算法,奇点标注及抽样则能加强数据挖掘模型的准确性及适应性。7⒘私换バ越锨俊⑼诰蚬炭煽匦越狭榛睢⒃诵行式细摺⒎治鼋峁较精确的神经网络分析功能、遗传神经网络分析功能、绶治龉δ芗劾喾治龉δ埽橇耸萃诰蛄笕挝裰械娜分类、回归及聚类分析这对于测井信息处理中的岩性识别、孔隙类型识别、物性参数计算及含油气性识别等过程起着关键性的作用。还首次将遗传神经网络分析及劾喾治鲆胧据挖掘系统。好地呈现出来,更好地表现模型的性能。还首次开发了其他数据挖掘系统少有的分类模型应用、回归模型应用及聚类规则应用等知识应用功能。关键词:数据挖掘:神经网络;遗传神经网络;纾籘聚类
知识水坝***@pologoogle为您整理
,曲瓵瞖,.—竚,,’瑃,遡.,&.瑚【】甌琯甀Ⅱ甀痵Ⅱ.痵’协、,.—.
知识水坝***@pologoogle为您整理
籊籼印瞔旭;甌..,.廿’甀..:;
,信息化浪潮迅速席卷全球,与此同时,各个领域产生了大量的数据,如银行、电信及其他商务行业每天的巨额交易数据;人类进行太空探索、天文观察、生物试验、高能物理试验、地质勘探时也会产生大量的数据;甚至互联网也产生了文本、图像及其他多媒体格式的海量数据。如何采用有效的方法,把海量数据所隐藏的有用信息挖掘出来,己成为各行各业共同关注的热点。数据挖掘,际醣阍兰甏υ硕数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它通过自动或半自动的方法对海量数据进行探索和分析,以达到发现有用模型的目的。针对传统技术不适合分析海量数据、高维数据、分布式数据的特点,数据挖掘融合了机器学习、人工智能、模式识别、统计学和数据库系统等学科的各自优点,为这些问题提供了良好的解决方案。数据挖掘的任务概括起来分为预测型方法和描述型方法“两种,其中预测性方法细分为分类、回归、异常检测三种,描述性方法细分为聚类分析、关联规则发现、序列模式发现三种。数据挖掘的流程大致分为数据准备、数据探索、数据预处理、数据挖掘、结果分析和知识应用,其中数据探索及数据预处理的流程不容忽视,它是数据挖掘的根基,直接影响挖掘结果的有效性和可靠性。数据挖掘中常用的方法有传统统计方法、可视化技术、神经网络方法、遗传算法、决策树方法及关联规则挖掘算法,其他的方法还有粗集方法、模糊集合方法、模糊稻劾唷⒆⒄瓜肿当前,世界上比较有影响的典型数据挖掘系统有甇、
一些特殊领域基本上没有专门的数据挖掘系统,这就给相关专业领域的用户带来地学中测井等数据的挖掘过程还不是很方便,方法也不是很完善,缺乏应用于地油气资源是国家经济发展的支柱,是国家经济建设和人民生活的物质基础。取虽然它们在某种程度上对很多领域的海量数据起到了决策支持作用,但它们或多或少存在交互性弱、挖掘过程可控性低、数据可视化程度差等缺点。针对地学等极大的不便。最近几年或几十年学术界出现了许多新方法、新理论,诸如神经网络、遗传学、模糊数学等等,很多数据挖掘系统由于种种原因很少或根本没有涉及这些方法。具体体现在以下几点:没有提供测井数据、网格数据等地学数据的输入接口,这使得测井数据、网格数据等地学数据的输入过程变得繁琐,降低了数据挖掘的效率。没有开发遗传神经网络分析、劾喾治龅裙δ埽低辰惺萃诰蚴钡精确性及效率就降低了。没有开发分类模型应用、回归模型应用、聚类规则应用等知识应用功能,这对于实际问题的模拟、预测或决策带来了不便。由此可见,现有的数据挖掘系统