文档介绍:黑龙江大学
硕士学位论文
基于数据仓库的知识发现策略研究
姓名:许海涛
申请学位级别:硕士
专业:情报学
指导教师:吴大刚
20080510
中文摘要随着用户对知识需求层次的提高,越来越多的人早已不满足于以往所得到的知识,为了应对这一趋势,本文研究的主要问题集中在提高知识发现的效率,尤其是随着数据库技术的飞速发展,各种存储着复杂数据类型的数据仓库给数据库知识发现提出更加严峻的考验。本文主要提出了基于数据仓库的数据库知识发现策略问题,即算法可伸缩策略和过程驱动策略两大策略,并提出了基于这二种策本文的主要难点在于本文着重解决一般数据挖掘过程在数据仓库的环境下进行知识发现的策略优化问题,提高数据挖掘效率,使数据、信息能迅速转化为可为用户利用和决策支持的知识;以及对不同数据选择不同数据挖掘算法策略的提出。使这种选择策略能成为连接基于数据仓库的知识发现与挖掘算法之间的有效桥梁,不论是对专家还是初学者都能有效地驾驭数据挖掘算法进行数据仓库的知识发现。在本文的研究过程中,作者通过大量的阅读和学习与数据仓库知识发现相关的书籍、文献资料和相关理论,使论文研究的理论基础比较厚重,并通过对现有有关数据库知识发现和数据仓库知识发现的研究成果的学习和研究,归纳和总结了一些数据挖掘策略的优缺点,从而分析了本文所提出的策略的可行性。力争为基于数据仓库的知识发现理论的研究提供若干参考,同时不论对企业还是个人用户的实际操作都能有一定的指导意义。关键词:数据仓库;数据挖掘;知识发现:发现策略略的一种新知识发现模型。
,瑃‘,,,‘瑃,Ⅱ甌,甈·.
籇;籇:‘.
新躲和趴学位论文作者签名碑炀亏论文作者签名:印丕疗签字日期:阥月名日签字日期:留年隆荨签字日期:汐阣稳独创性声明学位论文版权使用授权书人已经发表或撰写过的研究成果,也不包含为获得墨蕉江太堂或其他教育机构的本学位论文作者完全了解墨垄堑太堂有关保留、使用学位论文的规定,有权本人授权墨垄堑太堂可以将学位论文的全部或部分内容编入有关数据库进行检本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他学位或证书而使用过的材料。保留并向国家有关部门或机构交送论文的复印件和磁盘,允许论文被查阅和借阅。索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。学位论文作者毕业后去向:工作单位:电话:黑龙江大学硕士学位论文通讯地址:邮编:
第一章绪论为决策支持领域的技术⋯一基于数据仓库的知识发现。早期关于数据库知识发现第一节基于数据仓库的知识发现策略研究的背景与现实意义伴随信息社会的到来,信息技术的高速发展,数据库应用的规模和范围不断扩大、数据及信息数量的飞速增长,经常会把人们淹没在信息的海洋中,特别是近年来,商业条码的推广、企业和政府事务的管理以及数据采集工具的发展,都提供了大规模的数据,在商业管理、政府部门、科学和工业数据处理等领域都应用了数以百万计的数据库。从而把人们大多数的精力消耗在寻找有价值的知识上。这种信息的变革,不仅影响着社会生产方式和人类的生活,也使人们对科学研究,从对现象的描述转入对规律的思考。对于基于数据仓库的知识发现也正是在这种背景下产生的。人们对数据的需求早已经不是停留在表面层次,而是需要更深层次的内在的,更易于理解和接受的知识。同时,许多企业的经营管理人员为了应对日益激烈的市场竞争和决策支持的需要,越来越重视将从纯粹的理论研究转化的研究面对如今超大规模的数据存储来说已稍显窘迫,使得人们集中精力于数据仓库环境下的知识发现研究全方位的优化,以达到对隐藏在数据中潜在有用信息和模式关系最大限度的发现和挖掘。本章着重介绍基于数据仓库的知识发现策略应用研究的背景与现实意义及国内外研究现状。世纪人类早已进入信息爆炸时代,伴随着计算机和数据库技术的迅猛发展,在人类的社会生产活动中积累了大量的数据。一方面,各种类型的数据库系统的数据存储量剧增,在这些隐藏着许多重要信息和知识的海量数据中,只提供着对历史数据信息的查询;另一方面,随着社会的发展和进步,人类需要更多的有用的可理解的信息和知识来为人们的决策服务。这样一来“数据丰富、知识贫乏’’的窘况进一步加剧。虽然目前在数据库的知识发现发面的研究已经取得了一定的
一、本文研究的理论意义成果,但是随着大型数据库的发展,又对知识发现提出了新的挑战,使人们如何从数据库中存储的海量信息中迅速获取知识成了数据仓库知识发现领域研究的热点问题。本文对提高基于数据仓库技术的知识发现的效率有一定的指导作用。许多企业或组织机构在管理运作中,已经积累了大量的数据,包括业务运作、客户、产品和人员等。但是这些数据却被埋藏在计算机系统中未加以或难以