1 / 6
文档名称:

基于聚类的匿名化隐私保护技术研究.pdf

格式:pdf   页数:6
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于聚类的匿名化隐私保护技术研究.pdf

上传人:799474576 2013/8/7 文件大小:0 KB

下载得到文件列表

基于聚类的匿名化隐私保护技术研究.pdf

文档介绍

文档介绍:《现代图书情报技术》版权所有,欢迎下载引用!
请注明引用地址:基于聚类的匿名化隐私保护技术研究[J],现代图书情报技术,2010(11):53-58.
总第 199期 2010年第 11期
基于聚类的匿名化隐私保护技术研究
王平水
(安徽财经大学管理科学与工程学院蚌埠 233030)
【摘要】目前多数匿名化隐私保护技术由于其严重依赖于预先定义的泛化层或属性域上的全序关系,导致匿名结
果产生很高的信息损失,数据的可用性降低。通过定义距离和代价度量函数,提出基于聚类算法构造 l-多样性
匿名隐私保护模型。实验结果表明,该方法可减少信息损失,提高发布数据的可用性。
【关键词】数据发布隐私保护 k-匿名 l-多样性聚类
【分类号】TP311
ResearchonAnonymousPrivacy-PreservingTechniquesBasedonClustering
WangPingshui
(CollegeofManagementScienceandEngineering,AnhuiUniversityofFinance&Economics,Bengbu233030,China)
【Abstract】Atpresent,mostanonymousprivacy-preservingtechniquessufferfromhighinformationlossandlowusability
thatismainlyduetorelianceonpre-definedgeneralizationhierarchiesortotalorderimposedoneachattributedomain.
Throughdefiningdistanceandcostfunction,thepaperprovidesakindofl-diverseanonymousprivacy-preservingmod

whilereducingtheinformationloss.
【Keywords】Datarelease Privacy-preserving k-Anonymity l-Diversity Clustering
1 引言
随着技术、大容量存储技术和数据处理技术的迅猛发展以及数据共享范围的逐步扩大,数据的自动
收集和发布越来越方便。然而,在数据发布过程中隐私泄露问题也日益突出,因此实施隐私保护就显得尤为重
要。数据发布中隐私保护对象主要是用户敏感数据与个体身份之间的对应关系。通常使用删除标识符的方式发
布数据无法真正阻止隐私泄露,攻击者可以通过链接攻击获取个体的隐私数据。匿名化是解决链接攻击所带来
的隐私泄露问题的主要技术之一。自从 Samarati等[1-3]首次提出 k-匿名模型以来,由于 k-匿名技术能够简单
有效地对发布的数据进行隐私保护,近年来国内外研究人员对匿名化技术开展了广泛而深入的研究工作,以寻求
更为有效的保护隐私的方法。研究表明,