文档介绍:多维关联规则算法设计摘要关键字:有襬算法的基础上,自主设计了一种计数器算法,通过对目标数据库对象的自主计数器算法除了打破了原有襬算法不适用于寻找多维关联规则的缺陷之外,数据挖掘,也称为数据库中的知识发现是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程,而关联规则是其帜J街械囊恢帧4庸何锢悍治龅降缧拧⒁幸档群A渴莸姆治龃恚联规则已经在商业领域得到了广泛的实际应用,其中,寻找挖掘海量客户数据中的多维关联规则更是潜力无穷。传统的惴ㄊ腔诘ノ菘猓罢也级亓9嬖虻某<惴ǎ湫较低,使用范围有限的缺点同样明显,同时对于寻找多维关联规则并不适用。本文在原计数,有效地找到了一条寻找多维关联规则的方法,为多维数据库的关联规则挖掘提供了更多的技术支持。最大的优势在于在寻找多维关联规则的全过程中,只需要扫描一次目标数据库,这大大节省了对系统的负担,尤其是在对海量数据或远程数据库进行关联规则挖掘的时候,提高了整个算法的运行效率。文章还通过自主编译的计算机程序,利用真实的电信企业用户数据,成功地寻找并输出了多维关联规则,实现了计数器算法的实际应用。数据挖掘关联规则惴多维关联规则计数器算法,,北京邮电大学硕士毕业论文
鷈癿鷒舶鷐撕仉琲鷜撕印賜盟鷗删,衖向琻,鏻瓼,陊,餰閏印,叩北京邮电大学硕士毕业论文多维关联规则算法设计,琲,Ⅱ,.,,,産瑃,,琲穞,,’
“/嫡韔:北京邮电大学硕士毕业论文多维关联规则算法设计.
第一章绪论数据挖掘的历史背景会上首次出现貲这个术语。随后在年、年和年都举行貲数据挖掘是貲最核心的部分,是采用机器学习、统计等方法进行知识学计算机技术的另一领域——人工智能自年诞生之后取得了重大进展。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。经历了博弈时期、自然语言理解、知识工程等阶段,目前的研究热点是机器学习。机器学习是用计算机模拟人类学习的一门科学,比较成熟的算法有神经网络、遗传算法等。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现:的产生。实际上,数据库中的知识发现是一门交叉性学科,涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等多个领域。从数据库中发现出来的知识可以用在信息管理、过程控制、科学研究、决策支持等许多方面。年略诿拦滋芈烧倏5牡旃嗜斯ぶ悄芰:匣嵋榈淖ㄌ馓致专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。随着参与人员的不断增多,驶嵋榉⒄钩晌D昊帷暝诿拦υ季傩械牡谒慕熘J斗⑾钟胧挖掘国际学术会议不仅进行了学术讨论,并且有多家软件公司展示了他们的数据挖掘软件产品,不少软件已在北美、欧洲等国得到应用。北京邮电大学硕士毕业论文多维关联规则算法设计第骋还
的知识发现,把两者混淆使用。一般在科研领域中称为貲,而在工程领域则数据挖掘在商业中的应用猤⑵壅┓⑾.萃诰蛟谑谐∮O挠τ习的阶段。数据挖掘算法的好坏将直接影响到所发现知识的好坏。目前大多数的研究都集中在数据挖掘算法和应用上。人们往往不严格区分数据挖掘和数据库中称为数据挖掘。数据挖掘技术从一开始就是面向应用的。它可以应用在各个不同的领域,电讯公司和信用卡公司是用数据挖掘检验具有欺诈行为的先行者,保险公司和证券公司也开始采用数据挖掘技术来减少欺诈,医疗部门则是另一个前景广阔的产业:数据挖掘可以用来预测外科手术,医疗试验和药物治疗效果,零售商更多的使用数据挖掘来决定每种商品在不同地点的库存,通过数据挖掘使用促销和优惠卷手段,制药公司通过挖掘巨大的化学物质和基因对疾病的影响,通过数据库来判断哪些物质可能对治疗某种疾病产生效果。可以说,在很多领域中,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售绯妒谐等商业领域。数据挖掘所能解决的典型商业问题包括:数据库营销、客户群体划分&、背景分析⒔徊嫦畇仁谐》治鲂形#约翱突Я魇苑治⒖突庞等等。数据挖掘技术在企业市场营销中得到了比较普遍的应用,他是以市场营销学的市场微分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”。通过收集、加工和处理设计消费者消费行为的大量信息,确定特定消费群体或个体的消费兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以次为基础,对所识别出