1 / 47
文档名称:

关联规则并行算法在医药销售系统中的应用.pdf

格式:pdf   页数:47
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则并行算法在医药销售系统中的应用.pdf

上传人:779277932 2011/7/22 文件大小:0 KB

下载得到文件列表

关联规则并行算法在医药销售系统中的应用.pdf

文档介绍

文档介绍:重庆大学
硕士学位论文
关联规则并行算法在医药销售系统中的应用
姓名:刘颖
申请学位级别:硕士
专业:计算机系统结构
指导教师:熊忠阳
20040508
要摘技术成了商业智能的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注,如何提高数据挖掘的效率成为学术界热门的研究课题。本文主要针对关联规则发现,在商业销售行为领域方面的应用研究。等。作者对现有的关联规则算法进行了分析,在经典的惴ɑ∩希岢了并行—惴ǎ霉淌褂靡恢痔厥獾氖萁峁梗杂诿扛鱿罴锹包含项集中项的事务的疍,使得找出所有频繁罴恍枇酱问菘馍琛J笛证明这种新的并行算法能大大提高收敛速度,得到优于一般并行算法的加速比。此并行算法实现简单有效,能更好地应用于现实问题。的模型上选用了/P汀K惴ú⑿谢绞讲捎昧私盗肥萜骄峙涞并且详细的讨论了不同结点机数时,挖掘结果的纵向对比,验证了算法的正确性关键词;关联规则,算法,萃诰颍⑿兴惴数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘先验的惴ㄊ且恢肿钣杏跋斓耐诰虿级亓9嬖蚱捣毕罴乃惴ǎ但是惴ㄒ灿衅涿飨缘娜毕荩葱枰6啻沃馗瓷杞灰资菘狻⑿什桓本文选用通过商用网络连接起来的机,以及并行虚拟机蚖操作系统,共同构成了一个机群系统作为并行计算平台。在并行程序各节点机的数据并行方式。最后,本文从实用性的角度介绍了关联规则挖掘在商业分析领域方面的应用。和准确性等。最后对挖掘结果的关联规则进行了商业分析,取得了令人满意的效果。证明了此算法在该医药公司销售数据集中具有局部实用性。重庆大学硕士学位论文中文摘要
,,./..瓾瑂琹—.甌甌瓵.:珺狝,
绪论论文选题及研究意义技术——数据挖掘府和科学等领域的数据库内积累了大量历史数据,激增的数据背后隐藏着许多重要的信息,然而过去由于缺乏挖掘数据背后隐藏知识的手段,导致了“数据丰富,能够对数据进行更高层次的分析,以便更好地理解和利用这些数据背后所包含的,阌υ硕耍饫锼傅摹爸J丁本褪数据挖掘技术是面向数据库系统建立的对大型数据库进行更为抽象的、深层次的、二次开发的一项实用性很强的技术,同时数据挖掘也是一门很广义的交叉学可视化等学科领域汲取营养。简单地说,数据挖掘就是从大量的数据中提取或“挖掘”出知识口】。一种比较公认的技术定义是,数据挖掘量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的研究已经和数据仓库蚴菁结合起来,数据仓库蚴菁的出现为数据挖掘技术提供了新的应用领域,也对数据挖掘技术提供了有利的支撑。数据仓库蚴菁把传统数据库中大量的历史数据重新提取,生成一个集数据集市瓿闪耸莸氖占⒓伞⒋娲ⅰ⒐芾淼裙ぷ鳎J萃诰蚬烫峁了规范的、海量的数据,使得数据挖掘能够能专注于知识的发现。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,所发现的知识最常见的有以下五类:广义知识、关联知识⒎掷嘀其中,数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。它反映一个事件和其他事件之间依赖或关联的规律,如果两项或多项属性之间存在关联,那么其中~项的属性值就可以依据其他属性值进行预测。关联可分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。本文主要针随着数据库技术的成熟和数据库管理系统的广泛应用,人们已经在商业、政但信息贫乏”的现象川,即所谓“数据爆炸”。面对浩淼无际的数据海洋,人们希望信息,从数据库中发现知识数据中隐含的信息。科,我们必须从人工智能、统计学、机器学习、知识库系统、高性能计算和数据就是从大的、人们事先不知道的、但又是潜在有用的信息和知识的过程D壳笆萃诰中的、面向主题组织的、随时间变化的、内容相对稳定的数据集合。数据仓库识⒃げ庑椭J推ú钚椭J。,及其核心重庆大学硕士学位论文髀
国内外研究现状综述对关联规则作为数据挖掘的研究对象,在商业行为趋势预测方面的实用性应用研最为著名的关联规则发现方法是瓵提出的惴ā】。根据其思想,关联规则的发现可分为两步:第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;第二步是从频繁项目集中构造可信算法的核心,也是计算量最大的部分。由于常用的关联规则挖掘串行算法,如猤榷即嬖谝桓龉同的局限性:当挖掘数据量很大的时候,算法的可用性和效率大大降低。因此过大的距离。这一方面是因为实验数据脱离了数据库或数据仓库的环境,因此它是为串行算法在面对海量数据集时效率非常降下,而现实数据都有非常庞大的历史本论文是在最经典的关联规则挖掘算法:惴ǖ幕∩隙云浣胁⑿化,提出了数据划分并行援索策略,给出了并行算法。此策略使用一种特

最近更新

2026年元宵节祝福语最新200句 24页

2023年四川幼儿师范高等专科学校单招职业技能.. 41页

2023年四平职业大学单招职业倾向性测试题库最.. 41页

2023年大理农林职业技术学院单招职业技能测试.. 40页

2023年天津国土资源和房屋职业学院单招职业倾.. 41页

2026年元宵习俗作文400字 9页

2026年儿童诗关于童年的唯美诗篇 5页

2023年娄底幼儿师范高等专科学校单招职业技能.. 40页

2023年宁夏石嘴山市单招职业适应性测试题库附.. 41页

2023年宁波城市职业技术学院单招职业技能测试.. 40页

2023年安庆师范大学单招职业适应性考试模拟测.. 40页

2023年安徽医学高等专科学校单招职业倾向性考.. 39页

2026年傅雷家书大学生读后感1000字 10页

2023年安徽邮电职业技术学院单招职业倾向性考.. 41页

2023年宣化科技职业学院单招职业技能测试模拟.. 40页

2023年山东信息职业技术学院单招职业倾向性考.. 39页

2023年山东城市建设职业学院单招职业适应性测.. 41页

2023年山东省德州市单招职业适应性测试题库最.. 39页

2023年广西农业职业技术大学单招职业技能考试.. 40页

2023年武汉铁路桥梁职业学院单招职业技能考试.. 41页

2026年信念简单作文 11页

2023年浙江省嘉兴市单招职业适应性考试题库最.. 40页

2023年福建省三明市单招职业倾向性考试题库新.. 41页

耐蚀钢新工艺 33页

2023年辽宁省沈阳市单招职业倾向性考试题库必.. 38页

2023年重庆商务职业学院单招职业技能考试题库.. 39页

2023年长江师范学院单招职业技能考试题库完美.. 41页

2026年保护地球保护环境的作文三百字 6页

2025年国家开放大学《建筑力学》章节测试参考.. 13页

【人教版英语字帖】七年级下册单词表衡水体字.. 42页