文档介绍:摘要挖掘领域内最为常见的技术之一,是个非常重要的研究课题。尽管有多种不同的聚类算法,但这些算法还存在一些问题:如算法的效率、初值的选择、最优解的问题等等。因此对聚类算法还需要作进一步的优化、改进研究,以更好的适用于解决工程实际问题。这样不仅有助于算法理论的完善,更有助于算法的推广和应用。本文重点对聚类算法特别是猰进行了改进,提出了三种重要的改进方法。本文的主要工作有:【拷樯芰耸萃诰虻亩ㄒ濉⒒咎卣鳌⒅饕5氖萃诰蚣际酢⒕劾嗉际醯基本概念以及主要的聚类分析算法:对经典劾嗨惴ń辛私衔O晗傅慕绍,分析其主要优缺点,提出了要改进和努力的方向。褂酶春闲畏ǘ訩—惴ń杏呕8春闲畏ㄊ腔谧罨档憬械代的一种有效的随机搜索寻优方法,有着效率高,程序简单,结果稳定的特点。利用甇中的数据作为仿真试验数据,结果表明,改进后的算法提高了计算效率和鲁棒性,基本满足工程需要。【扛莞春闲尉植克阉髂芰η慷糯惴ㄈň炙阉髂芰η康奶氐悖ǜ春形与遗传算法相结合构成复合形一遗传算法,其中把复合形法作为一个算子嵌套到遗传算法中,来提高遗传算法的局部搜索能力。利用一组的数据进行聚类,结果表明,狦媒峁牡问钚∧勘旰【拷糯惴ㄓ敫春闲畏ü钩勺楹嫌呕椒ǎ糜贙优化聚类。首先使用遗传算法进行大范围搜索,在取得较优结果时加入记忆体,用来存储最优解群体,然后利用局部搜索能力较强的复合形算法、以最优解群体作为初始顶点作进一步优化,从而达到最优解或者接近最优解。结果表明该方法的迭代次数及【拷陨系难芯砍晒糜谀吵蠧系统设计,包括数据表的设计、数据数三个属性,分别采用改进后的聚类算法和基本猰聚类算法对客户类型进行进后的聚类算法对客户的聚类更加合理,能够较好阿反映客观现实,有着重要的关键词:数据挖掘,聚类分析,劾嗨惴ǎ春闲危糯惴ǎ突Ч叵数据挖掘是随着信息技术不断发展而兴起的一门新学科。聚类分析作为数据及平均目标函数值都较为理想。总体所耗时间都大大降低,在提高效率的同时也改善了解的质量。转换以及数据仓库的建立等功能模块的设计。选取顾客年龄,购买总额,购买次聚类,采用图像处理工具将聚类结果进行处理。由结果可以看出,改参考和实用价值,具有较强的理论和实践意义。管理西北工业大学硕士学位论文:数据挖掘技术及其在超市械挠τ
知识水坝为您整理
畁甌晰,:数据挖掘技术及其在超市械挠τ瓵瑃,.,.瑃琱猻瑃甋,..¨
知识水坝为您整理
.曲;.痶’.;猰籆;:
⋯燧名:剁拗辏辉抡既年日年;∥日西北工业大学学位论文知识产权声明书学位论文原创性声明本人完全了解学校有关保护知识产权的规定,即:?梢越ū狙宦畚牡娜ú炕虿糠帜谌荼入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律注明作者单位为两北工业人学。保密论文待解密后适用本声明。学位论文作者签名秉承学校严谨的学风和优良的科学道德,本人郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容和致谢的地方外,本论文不包含任何其他个人或集体已经公开发表或撰写过的研究成果,不包含本人或其他己申请学位或其他用途使用过的成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式表明。本人学位论文与资料若有不实,愿意承担一切相关的法律责任。
第滦髀研究背景与意义随着计算机应用和网络技术的飞速发展,人类已经进入了信息革命和信息爆炸的时代,尤其近年来,随着数据库技术和信息技术的飞速发展,成千上万的数据库被用于商业管理、政府办公、科学研究、教育以及工程开发等领域,人们利用信息技术产生和搜集数据的能力也得到了大大的提高,尽管这些大量的数据背后可能隐藏着重要的信息,然而却不能为企业的决策和发展提供有效的服务,没有真正的成为一个企业的资源,大量的数据以至于有可能成为企业的包袱甚至垃圾,而使人们陷入了“被数据淹没,却饥渴于知识”的尴尬境地,因此,人们结合统计学、数据库、机器学习等技术,用数据库管理系统来存储数据,用机器学习的方法来分析数据,从而挖掘出海量数据背后的重要信息,数据挖掘和知识发现技术应运而生并得到了迅猛的发展。基于数据仓库、和数据挖掘技术为基础开发出的数以百计的软件产品已经走向市场,进入实际应用之中。对商业智能,庖恍滦肆煊蚱鸬搅酥С抛饔谩T诼槭±砉ぱг旱摹犊技评论》杂志提出未来杲ǘ匀死嗖卮笥跋斓笮滦思际踔校笆萃诰颉位居第三。在皇橹卸允萃诰的定义为:所谓数据挖掘,简单地说,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据