1 / 55
文档名称:

面向关联规则挖掘的隐私保护算法研究.pdf

格式:pdf   页数:55
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向关联规则挖掘的隐私保护算法研究.pdf

上传人:durian 2014/1/16 文件大小:0 KB

下载得到文件列表

面向关联规则挖掘的隐私保护算法研究.pdf

文档介绍

文档介绍:面向关联规则挖掘的隐私保护算法研究重庆大学硕士学位论文重庆大学计算机学院业:计算机应用技术学科门类:工学跹学生姓名:张鲲鹏指导教师:王茜教授专二欢晁脑
④.篊’,—
摘要关键词:数据挖掘,关联规则,隐私保护,时间效率由于现代计算机硬件技术、互联网技术以及多媒体信息技术的高速发展,人们所拥有的数据量已经达到了前所未有的规模,而数掘挖掘技术的出现使得对大量的库存数据进行有针对性地处理和分析以得到隐藏在其中的知识成为可能。然而在随着数据挖掘技术不断的发展和延伸,数据挖掘应用可能带来的隐私信息泄露的风险与同俱增,因此基于隐私保护条件下的数据挖掘己成为研究的热点领域。本文首先对基于隐私保护的数据挖掘技术的基本概念、国内外研究现状以及相关的算法进行了综述,而后选择基于关联规则挖掘的隐私保护数据挖掘算法作为研究的重点。在关联规则挖掘算法中主要研究了基于随机扰动的算法,此算法在兼顾隐私保持度和挖掘结果精确度上有着良好的性能,但其执行时间效率低下的问题限制了实际应用的范围。惴ㄕ攵訫惴ㄔ谥毓瓜罴媸抵С侄时在概率矩阵求逆过程中的指数级复杂度,提出了一种利用临阶概率矩阵问所存在的递推关系来简化运算过程,有效地提升了算法的运行效率。本文在惴ǜ慕幕∩希谒惴ㄔ诙耘で菁髯楹系募剖中利用关联规则挖掘中布尔数据集的特性,通过已知项求解未知项的方法消减项集计数过程所产生的系统丌销,以达到对算法时间性能的进一步优化。改进算法在挖掘过程中对取值全为真的项集计数保存在一个动态的哈希链表中,在对幌集的真实支持度进行重构时,只对取值全为真的项集在扭曲数据集中进行扫描计数,而其他组合的计数则利用哈希链表中存储的中⒆訨结果计算获得,从而减少了对扭曲数据集的访问次数,提高了算法运行的时间效率。理论分析说明在增加一定空间开销的条件下,改进算法的执行时间效率优于原算法,而在挖掘规模较大的数据库时体现的更为明显。实验结果也表明改进算法相比于原算法以及惴ㄓ凶鸥己玫氖奔湫阅堋重庆人学硕Ш温畚中文摘要
甌重庆人学硕士学何论文英文摘要、.,瑃..琤.,.瑃甌‘疭琣猻琽’’,甌
重庆大学硕士学位论文英文摘要,:,,
目录中文摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.萃诰蚝鸵奖;ぜ际醺攀觥奖;な萃诰蛩惴ǖ淖凼觥英文摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.髀邸诠亓9嬖虻耐诰蛩惴∕母慕基于关联规则的隐私保护数据挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.重庆人学硕士学位论文选题背景以及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究目标及内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本文内容的组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.数据挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..奖;⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.隐私保护数据挖掘算法的分类⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.基于分类的隐私保护数据挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..谄舴⑹⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.其他隐私保护数据挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.算法的评估标准⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.关联规则概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.■Ⅲ卫撕矗也勉拐玛巧他体
芙岷驼雇致谢⋯⋯参考文献⋯⋯附录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯总结⋯⋯⋯展望⋯⋯⋯髡咴诠ザ了妒垦黄诩浞⒈淼穆畚目
论选题背景以及意义的新的数据分析技术。年举行的第十一届国际联合人工智能学术会议上第一次被提出。年,第掘的发展还应该在保持个人私密信息不被泄露的前提下进行。由于计算机硬件的介意提供真实信息。此结果说明数据挖掘只要在其过程中采取可靠的技术手段保也说明隐私保护技术的有效性会影响用户提供真实信息的可能性。不知情的情况下,利用浏览器中存在的技术漏洞来跟踪用户的浏览记录;由于计算机硬件,数据库技术和互联网的发展,人们接受的信息量急剧增大。急速增长的数据背后隐藏很多信息,人们希望在大量的数据中能进行更高层次的分析,找到内部隐藏的关系和规则。数据挖掘技术就是在这样的需求背景下出现数据挖掘是以新的角度将数据库技术、统计学、机器