文档介绍:要摘关键词:关联规则,惴ǎ現瓽惴ǎ攘糠椒ǎ巳ざ规则是数据挖掘重要技术之一,本文对关联规则进行分析研究,主要包括以下内容:最后给出了关联规则一个应用实例,将算法引入到银行客户信息系统中,实验结果数据挖掘是知识发现讨械暮诵牟糠郑萃诰蚴谴哟罅渴葜蟹⑾钟趣模式,即从数据库海量的数据中找出隐含的、未知的、但却是非常有用的信息。关联訟算法进行深入研究。分析算法思想,针对算法缺陷,本文分别给出改进算法。实例证明,改进后的算法能有效减少候选项集个数,提高执行效率;有效减少扫描数据库次数,减小负担。钊胙芯縁瓽惴ㄋ枷牒虵甌娲⒔峁埂Mü,建树的过程中确保压缩效果最好,从而减小疧负担,提高算法效率。结合实例,比较了惴ê虵瓽惴ㄐ阅堋怨亓9嬖蚨攘糠椒ń辛松钊胙芯俊1疚姆直鸫邮Ш凸嬖蚨攘苛礁龇矫妫重点分析了兴趣度度量存在的问题。针对现有度量标准存在的不足,结合规则有效性原则,提出一种度量改进方法。分析结果表明,该改进方法可有效屏蔽掉无效规则。表明,改进后的度量可以有效约束规则,改进效果较好。硕士论文关联规则算法及度量方法研究
知识水坝为您整理
,—瓵,;瑀—瓸—,:珹硕士论文琩,.,,.··——,疧,簍Ⅱ
知识水坝为您整理
研究生签名:乒崎游拢昙据抛孑年学位论文使用授权声明声明尸本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文中作了明确的说明。南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对于保密论文,按保密的有关规定和程序处理。研究生签名:日
髀数据挖掘概述擞学公式。实际上,所有的发现都是相对的,是有特定前提和约束条件的,面向特定领数据挖掘【氖怯τ靡幌盗屑际酰哟笮褪菘饣蚴莶挚庵校崛∪嗣歉行巳さ馐停航馐头⑾值哪J剑サ舳嘤嗟摹⒉磺刑庖獾哪J剑;晃D掣鲇杏媚信息和知识,这些知识或信息是隐含的、事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。这表明,数据挖掘是一类深层次的数据分析。它的目标是将大量数据转化为有用的知识和信息。数据挖掘起源于世纪年代初,机器学习和数据分析的理论及实践是数据挖掘研究的基础,极大的商业应用前景是数据挖掘研究工作的巨大推动力。传统的数据库查询和统计,只能提供用户想要的信息,而数据挖掘技术则可以发现用户没有意识到的潜在信息。数据挖掘一个正式的称呼是数据库中的知识发现【,实际上,数据挖掘只是械囊桓龉丶街琛4庸阋迳侠斫猓荨⑿畔⒁彩侵J兜谋硐中问剑侨嗣更把概念、规则、模式、规律和约束等看作知识。发现知识的方法可以是数学的,也可以是非数学的;可以是归纳的,也可以是演绎的。发现的知识可以被用于信息管理、查询优化、决策支持和过程控制等,也可以是用于数据本身的维护。知识发现并不要求发现放之四海而皆准的真理,也不是要去发现崭新的科学定律或域,同时还要易于被用户理解,最好能用自然语言表达挖掘出来的结果。一般的,知识发现是指从数据中发现有用知识的过程,是由多个步骤相互连接、反复进行人机交互的过程,具体包括【浚杂τ昧煊虻牧私猓喊ㄓτ弥械脑は戎J逗湍勘辍⒛勘晔菁焊菸侍獾哪勘旰托枰Q≡窈鲜实氖菁菰ご恚喝コ肷臀薰厥荩コ瞻资萦颍悸鞘奔渌承蚝褪变化等。葑;唬赫业绞莸奶卣鞅硎荆梦浠换蜃;环椒ḿ跎儆行П淞康氖浚得到适合数据挖掘的形式。《ㄊ萃诰蛩惴ǎ焊萃诰虻哪康模≡袷萃诰蛩惴ǎ糜谒阉魇葜的模式。萃诰颍翰捎醚《ǖ耐诰蛩惴ㄔ谘∪〉氖葜兴阉鳎圆囟ǖ母行巳的模式和知识。式,便于用户理解和应用。硕士论文关联规则算法及度量方法研究。,~一.
国内外研究现状为了研究,更主要的目的是为商业决策提供真正有价值的信息,进而获得更大的商业利趋势。它是人们长期对信息技术,尤其是数据库技术研究和开发的自然演化结果。通过尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成许多新的技术热点。国内南京大学的徐洁磐、陈栋等人开发了一个原型系统:馐且桓鐾ㄓτ茫喊颜庑┲J督岷系接τ孟低持校⒒诱庑┲J兜淖饔谩S迷は取⒖尚的知识检查和解决知识中可能存在的问题和矛盾。大致可将这个过程分为数据准备、数据挖掘、结果表达和解释这几个阶段。由此可见,数据挖掘是泻诵牟糠郑萃诰虻暮没抵苯佑跋熘J斗⑾值慕峁J萃诰的产生和发展,很大程度上是受商业应用需要而推动的。分析这些数据,不再是单纯的润。目前,数据挖掘技术已经在许多行业得到应用【,并取得了~定实效