1 / 67
文档名称:

关联规则挖掘算法研究.pdf

格式:pdf   页数:67页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则挖掘算法研究.pdf

上传人:779277932 2011/7/22 文件大小:0 KB

下载得到文件列表

关联规则挖掘算法研究.pdf

文档介绍

文档介绍:青岛大学
硕士学位论文
关联规则挖掘算法研究
姓名:曲建华
申请学位级别:硕士
专业:计算机软件与理论
指导教师:李咏梅

!摘要年【壳跸忍峁送诰蚬隋菇灰资菽χ谢羌倬补亓9骀瞻晏猓月粗疃囿系避数獬库的关联规刚挖掘系统的设计构思,根据关联飙则挖搠系统结构框架,数据携獭楚近年采邋速发袋静穰悫楚疆技零。数据挖掇褪鞘蟠量的、不完套的、肖噪声的、模糊的、噫桃的数据中,提取隐含在其中鲍、人们攀先不知道的、但又怒潜在有用的信息和知识的过程。挖掘关联规刘蹙数攒挖掘中一个重要组成部分。关联规则蹙单向的,它是指菜类顼莛或姆薤与另一类项瑟或姆筵露掰存在豹攀淘影璃关系。扔研究人员对关联规则豹挖掘问题避行了大量的研究,包括对原有的算法进行优化,如引入隧机采样、势撂黔思想镶,以挺舞舞法挖撼攥则弱效率;对关联援剃本论文蘩一部分对数据拣掘技术进行了总体介绥,说明了綦本概念、功能和系统总体框强瑷及发震中的赡点和研究方面;第二鬻对关联规煲基本概念的进行了介绍,提如了关联攫则黪努类方法;第三掌探讨了挖援各秘关联骥爨鐾懿算法,从挖掘单维单层布尔关规则的经典的呤迹治隽送诰虼莆⒍嗖愎亓=赠瓣筹法,多维关毅撬粼静冀法妥多维多僮藩往关联规燹的算法。文中掇豳算法优化方法,势对其性能遴好了实验测试;第题端分、第五部分谨缨分绍了旗于美静关联黼弼擦籀系统,箕于采用了一个颛型酌萋于关系数据摩的关联规则挖搋簿法,提离了挖掘效搴,并详缨分提了程廖设计戆各个功能模块,最后就设计中遗留的问蹶进行了进一步的分析。关键测:关联溉戴獗繁硬集挖瓣算法关系整数据库的应用进行推广。实糕了旗予
,,.,,,—甎゛。...,,:,:—,琾篢:,篴琣
绪论第一章数据挖掘际醺攀对象模型、对象一关系模型和演绎模型,包括空间的、时间的、多媒体的、,数据库和信息技术已经系统地从原始的文件处理演化到复杂的、功能强大的数据库系统。自年代以来,数据库系统的研究和开发已经从层次和网状数据库系统发展到开发关系数据库系统、数据建模工具、索引和数可以方便、灵活地访问数据。联机事务处理”对于关系技术的发展作出了重要贡献。自年代中期以来,数据库技术的特点是广泛接受关系技术,研究和开发和科学的数据库、知识库、办公信息在内的面向应用的数据库系统百花齐放,涉及分布性、多样性和数据共享问题被广泛研究。异种数据库和基于的全球信息系统,如惨殉鱿郑⒊晌P畔⒉档纳计算机硬件稳定的、令人吃惊的进步导致了功能强大的计算机、数据收集设备现在数据可以存放在不同类型的数据库中。数据仓库就是一种多个异种数据源在单个站点以统一的模式组织的存储,以支持管理决策。数据仓库的定义是耙皇橹惺紫雀龅模菏莶挚馐面向主题的、整合的、稳定的,并且时变的收集数据以支持管理决策的一种数据决魈馐鞘莨槔嗟谋曜迹恳桓鲋魈饣径杂σ桓龊旯鄣姆治隽煊颉萁胧莶挚庵埃匦刖庸び爰桑圆煌氖蚶丛唇型一数据结构和编码,将原始数据由面向应用转向面向主题。莶挚獾氖菔毕拊一年,数据的编码包含时间项,因此仓库要时变际跏切畔⒓际踝匀唤慕峁据组织技术。此外,用户通过查询语言、用户界面、优化的查询处理和事务管理,新的、功能强大的数据库系统。这些使用了先进的数据模型:扩充关系模型、面向和存储介质的大量供应。这些技术大大推动了数据库和信息产业的发展,使得大量数据库和信息存储用于事务管理、信息检索和数据分析。甃甀在“策形式。数据仓库具有如下特征:莶挚庵写娲⒋罅康睦肥荩菥山胧莶挚夂笫羌倩蚋地收集数据。数据挖掘本不更新的。
摅,决策分辑纛数稽擦援绘蠹羧据食霹中数攒瓣多缀逻辑橇豳,镪含交互式焱邋鞯氖巢挚馐犰辔狪海牡庇枰话闶扪鱅沟叮询翻对数据翡分耩,提供分耩懿建模臻麓,生成橇话数瓣、聚集、鼹次,支持瑰辘模型进行预测、趋势分析、统计分析操作。数擐瘁技零鲍演化溺:莶执嶂С諳琲⒕霾叻治黾笆萃葵一辈辩论
数据挖掘模式的类型的数据变成了“数据坟墓”——难得再访问的数据档案。这样,重要的决定常常不⑾止亓9嬖颍庑┕嬖蛘故臼粜砸恢数据的丰富带来了对强有力的数据分析工具的需求,大量的数据被描述为“数据丰富,但信息贫乏”。快速增长的海量数据收集、存放在大型和大量数据库中,没有强有力的工具,理解它们已经远远超出了人的能力,结果收集在大型数据库中是基于数据库中信息丰富的数据,而是基于决策者的直觉,因为决策者缺乏从海量数据中提取有价值知识的工具。此外,当前的专家系统技术依赖用户或领域专家人工地将知识输入知识库,这一过程常常有偏差和错误,并且耗时、费用高。数据挖掘工具进行数据分折,可以发现重要的数据模式,支持决策。数据和信息之间的鸿沟要求系统地开发数据挖掘工具,将数据坟墓转换成知识“金块”。数据挖掘是从大量数据中提取或“挖掘”知识。数据挖掘功能用于指定数据挖