1 / 46
文档名称:

基于关联规则的隐私保护算法研究.pdf

格式:pdf   页数:46
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于关联规则的隐私保护算法研究.pdf

上传人:化工机械 2012/8/31 文件大小:0 KB

下载得到文件列表

基于关联规则的隐私保护算法研究.pdf

文档介绍

文档介绍:兰州理工大学
硕士学位论文
基于关联规则的隐私保护算法研究
姓名:仲波
申请学位级别:硕士
专业:计算机应用
指导教师:张远平
20070601
摘要系式准确率能达到应用的要求,表明该挖掘算法能适用于实际问题的需布式关联规则挖掘也逐步得到研究。现有的分布式关联规则挖掘需要有一个算法执行中心来收集所有的原始数据,然后执行相应的挖掘算法。影响了产生规则的有效性。因此,进行数据挖掘同时保护用户的隐私信本文在综述了国内外关联规则挖掘研究成果的基础上,讨论了基于与复杂度,并通过实验表明,该算法在伪装后的数据集上挖掘出来的规数据挖掘是从大量数据中提取或“挖掘”知识。大多数传统的关联规则挖掘是由一个用户在本地的一个单一的数据库上进行操作。随着计算机网络的不断发展,产生规则的数据往往来自于网络中不同的用户,分有时候用户关心隐私,不愿意提供相应数据或者只提供虚假数据,从而息不被泄露逐步成为数据挖掘实际应用的发展方向之一。关联规则的隐私保护典型算法;并主要关注随机响应技术与关联规则的结合,给出随机响应技术中影响隐藏性的变换概率口与挖掘算法准确性之间的关系式:计算表明,从鲆陨鲜挛竦氖菁校∪⊙镜数据量超过数据集%产生的关系式,其相对误差,即用该关系式算出变换概率一代入基于随机响应技术的挖掘算法产生的误差与希望达到的误差相比,不超过ィ徊⒂么罅考扑阊橹ぴ谑菁婺2煌那榭鱿拢要。本文还提出了将随机响应技术应用于保护隐私的多维关联规则挖掘中,设计了在伪装的数据集上进行挖掘的算法,分析了算法的安全性则与原规则相比,相对误差不超过ァ关键词:关联规则,隐私保护,数据挖掘,变换概率,随机响应硕士学位论文
基于关联规则的隐私保护算法研究甒‘‘’’,.琺琣ィ畉ィ甌畉,,..瑆瓺..。,甧.,.,.篴,Ⅱ
插图索引图利用树存储候选项集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图交易事项检索引擎的工作原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图相对误差率与参数口,∥,,的关系废罴⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图相对误差率与参数口,∥,,的关系一项集硕士学位论文图隐私保护模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
日期:僻布立禾日期:堋年⒈C芸冢凇!D杲饷芎笫视帽臼谌ㄊ椤钴波种密日期:∧月昱日学位论文原创性声明学位论文版权使用授权书兰州理工大学‘月晷石月本人郑重声明:所星交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。朐谝陨舷嘤Ψ娇蚰诖颉啊獭导师签名:本学位论文属于⒉槐C芸凇日‘
第一章绪论甀关联规则概述保护隐私挖掘算法的提出与现状度增长时,人们感到面对信息海洋像大海捞针一样束手无策,因此,需联规则问题院笾疃嗟难芯咳嗽倍怨亓9嬖虻耐诰蛭侍饨辛舜罅的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并由于计算机处理能力、存储技术以及互联网络的快速发展,人类拥有的信息呈爆炸式增长,从而激发了人们寻找“知识宝藏”的欲望,进扰着人们,并且随着计算机处理能力、存储技术以及互联网络的快速发传统数据仓库方法要求将分布各处的数据集中于某中心点,虽然这性原因,不愿共享他们自己的数据,1;ひ降氖萃诰随着信息时代的来临,人们要面对越来越庞大的数据,当数据量极要一种从大量数据中去粗取精,去伪存真的技术,数据挖掘技术就是人们长期对数据库技术进行研究和开发的结果,是信息技术自然演化的结果。它从大量的数据中,抽取出潜在的、有价值的知识、模型或规则的过程,经过十几年的研究和发展,数据挖掘技术进入一个更高级的阶段,数据挖掘算法也已基本成熟、,在今后还会掀起更大的波澜,这门新兴的学科会有更加广阔的前景。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。它在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品之间的联系,找出顾客购买行为模式,、货存安捧以及根据购买模式对用户进行分类。扔晔紫忍岢隽送诰蚬丝徒灰资菘庵邢罴涞墓行的思想等,以提高算法挖掘规则的效率;对关联规