1 / 42
文档名称:

保护隐私决策树算法的研究.pdf

格式:pdf   页数:42页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

保护隐私决策树算法的研究.pdf

上传人:tggwft 2016/7/17 文件大小:0 KB

下载得到文件列表

保护隐私决策树算法的研究.pdf

相关文档

文档介绍

文档介绍:硕士学位论文摘要近些年,数据挖掘技术已经被广泛使用到包括金融、医学等的各个领域。虽然利用数据挖掘技术得到的规律和模式对我们后来的工作起到了有效的指导作用,但是,也给我们的生活带来了其他的问题,这当中被人们广泛关注的就是隐私的泄露。就数据挖掘技术而言,隐私包括两个方面的内容,一个是挖掘技术作用的原始数据;另一个则是从原始数据中挖掘出来的有价值的规律。目前,保护隐私的数据挖掘主要从两个方向进行研究,数据变换和密码学方法。第一种是改变原始数据,通过添加噪音或者随机改变数据来隐藏原始数据,该方法主要用于集中分布的数据;第二种是对原始数据及中间计算结果进行加密,主要用于分布式数据挖掘。本文提出了一种决策树改进算法,该算法利用原始数据构造属性间单步转移概率矩阵,并且在单步转移概率矩阵的基础上,根据构造决策树过程中需要的属性自行计算属性间联合概率,使得决策树构造算法在计算信息熵的时候不用从原始数据中统计获得概率。并且该算法改进了决策树创建叶节点的条件,从而决策树不会用尽所有的候选属性才停止构造,这就消除了没有原始数据造成的影响。由于属性问联合概率矩阵是通过单步转移概率矩阵计算得到的,因此其结果会与从原始数据中得到的结果有差异,而且终止条件的改进也会影响决策树的准确性,但是实验证明,由此差异造成的最终决策树同样会有较高的分类精度,能够达到应用的要求。这样既可以有效的保护原始数据,又没有降低决策树的分类精度。关键词:数据挖掘;隐私保护;决策树;单步转移概率矩阵;属性问联合概率保护隐私的决策树算法的研究 Abstract R-ecenny years,t11e data miIling tec:hIliques arc be锄llscd tlle area ofFm锄ce, Medicine and inS仃uCts llsiIl ours work witllme mode aIldmlesbyusing thedata minin&at nlesam占妇e itbrings us some problems in our daily mosts嘶ous probleIll is thep晰acy me datamimn&埘Vacy isincluding aspects·one is meori酉nal datauSing tomine;another istheValuable mles mined台om theori西nal4ata. Now,the pdvacy-protected data miIliIlg isresearched五的m“ are Randomization andEncryl)tion methods.’rhe firstmemod is tochange meori舀nal used inthecentral stored second method is toencrypt ttleori酉nal dataand the is uSed inthedistributing datamimng. Tllisarticlepresellts animprovedalg耐tl蚰of deCision ‰uses嘶舀nal data toconstmct the“ transitionprobability ma砸x on attributes”.And atthebase of ‘‘ probability matrix on attributes”,according tome attributes inme process ofconstmCting the decision tree,the probability be锕een me attributese觚be calculated mal(es theaJgorimm ofbllilding me decision treedoes not have theprobability矗om o啦如al datawhen calculating the铋舡| mealgoritllm improves me e11ding condition ofbuildiIlg decision treewhich don’tstopconstnlcting f如m using allof ithas no influence onori