文档介绍:第卷第期计算机科学
39 12
年月
2012 puter Science Dec 2012
模型下数据隐私保护机制研究
MapReduce
杨绍禹王世卿
郑州大学信息工程学院郑州
( 450052)
摘要在对海量数据进行分析和处理的过程中敏感信息的隐私保护显得尤为重要针对统计类型数据分析服务
, 。
的效率和安全问题在计算模型的基础上引入差别隐私保护机制在该模型上提出一种带有隐私保护
, Map-Reduce 。
的决策树生成算法并证明其满足差别隐私实验表明该算法具有良好的分类精度和满意的计算效率
, ε- 。, 。
关键词差别隐私统计数据并行计算决策树生成算法
Map-Reduce, , , ,
中图法分类号文献标识码
A
Research of Data Privacy & Security in Map-Reduce Model
YANG Shao-yu WANG Shi-qing
(College of Information Engineering,Zhengzhou University,Zhengzhou 450052,China)
Abstract In analyzing and processing of the large-scale database,it is crucial for protecting the privacy of sensitive da-
order to analyze the service efficient and security for the mass data with statistical character,the mechanism with
differential privacy was implemented in the Map-putation decision tree’s generation algorism was
proposed at putation model,and proved to satisfy theε-differential experiment indicates that the
algorism has well classification accuracy putation efficiency.
Keywords Map-Reduce,Differential privacy,Statistical data,puting,Decision tree generation algorism
差异
引言。
1
2 数据隐私与问题描述
随着网格计算和云计算等高性能计算模型的发展,针对
海量统计类型数据的分析和处理效率得到很大程度的提高。数据隐私问题的研究有着很长的历史,其中包括加密技
相比传统的相对闭合的数据处理环境,新的计算模型大多建术、匿名化技术、去可识别性技术等很多研究方法。根据统计
立在开放的系统环境下。这样的数据处理环境为分布式数据数据库的特点,关于数据隐私性的