文档介绍:兰州理工大学
硕士学位论文
在数据挖掘中概念格的理论研究
姓名:黄文涛
申请学位级别:硕士
专业:计算机软件与理论
指导教师:李明
20070526
摘要知识是人类认识客观世界的结果,同时也是指导人们行为的准则,在知识经济的时代里知识是社会发展的重要动力,是决定生产力发展的主要因素,特别是随着时代的发展,环境的变化,认识的深入,人们必须不断的获取与发现新的知识,人们有各种获得知识与发展知识的手段,而其中最重要的一种手段是从数据库中进行数据挖掘。随着技术的日益普及,“丰富的数据与贫乏的知识”问题变得日渐突出,而数据挖掘如何从大量的数据中智能地、自动地抽取出有价值的知识和信息,因而成为当前人工智能中非常活跃的研究领域。概念格是近年来获得飞速发展的数据分析的有力工具,用来发现数据中隐藏的知识模式。因此,研究概念格的基本理论以及将其应用于知识发现有着非常重要的意义。本文主要研究概念格的基本理论和基于概念格的知识发现。在概念格与粗糙集的关系方面,由于概念格与粗糙集在数据分析方面有相似之处,并且粗糙集的一些概念包括等价类,上、下近似等都可以通过概念格来表示。本文论述了概念格与粗糙集之间的联系,建立了它们之间的的关系。在概念格的代数性质方面,本文给出了形式背景下概念集合上的元素之间的二元运算,使通常意义下的概念格成为带有算子的概念格,证明了概念格为代数意义下的格,并研究了其代数性质,为概念格的进一步研究提供了理论基础和新的研究方法。在基于概念格的规则提取方面,数据挖掘尤其是规则挖掘可以看作是一个形成概念的过程和发现概念之间关系的过程。概念格反映了对象与属性之间的精确关系,而模糊概念格反映了概念与属性之间的不确定联系,在现实生活中,人类认识的大量概念都是模糊的,因此研究模糊概念格对于实际决策有着重要的意义。对概念格本身及其应用进行了一些研究,但是,知识发现正处于发展阶段,概念格理论在知识发现中的应用还有许多问题值得研究。本文的研究工作是一个尝试,相关工作还有待进一步深入。关键词:数据挖掘;概念格;粗糙集;代数系统硕士学位论文
甒在数据挖掘中概念格的理论研究,“県.,瓹..瑄甀畉瑃..琤甇琣:,琑珹
插图索引图表的形式背景对应的概念格的肌图形式背景所建的概念格⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
ⅰ年控礏⒈C芸冢凇!D杲饷芎笫视帽臼谌ㄊ椤学位论文原创性声明学位论文版权使用授权书兰州理工大学导师签名:芦年寥日月日多—/~本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于⒉槐C芏凇朐谝陨舷嘤Ψ娇蚰诖颉啊獭一
第滦髀数据挖掘技术概述随着数据库技术和数据库管理系统的广泛应用,全球范围内数据库中的数据量急剧增大,电子化数据越来越多,信息高速公路的发展和广泛应用使得整个社会变成了信息化的网络世界,数据量的增长更为迅猛。有些公司经过多年积聚下来的商业数据目前己经超过数百万乃至数亿条记录:有些面向科学研究数据库的数据量也非常惊人,比如,记录天体信息的数据库容量达到数个字节。全球商业、企业、科研机构和政府部门在过去若干年的时问里积累了海量的、以不同人们眼花缭乱,这些数据中蕴含着大量的知识,人们正面临“数据丰富而知识贫数据中得到那些知识呢淙皇菘庀低程峁┝硕允莸墓芾砗图虻サ拇砉能,人们可以在这些数据之上进行商业分析和科学研究,但数据资料如此庞大而自一十分繁杂,因此要从中发现有价值的信息或知识,达到为决策服务的目的,对人工处理来说是非常困难的。人们需要能够对数据进行较高层次处理的技术,从中找出规律和模式,,具有较为广泛的应用前景【¨.专家预测数据挖掘在未来十年内会有革命性进展,是个性化个人偏好分析,实时识别和分析用户信息的关键技术。数据挖掘的目的是从数据中找出有意义的模式。模式可以是一组规则,聚类,决策树,依赖网络或其他方式表示的知识。一般来