1 / 4
文档名称:

基于隐私保护的经济统计信息发布.docx

格式:docx   大小:16KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于隐私保护的经济统计信息发布.docx

上传人:glfsnxh 2017/12/28 文件大小:16 KB

下载得到文件列表

基于隐私保护的经济统计信息发布.docx

文档介绍

文档介绍:关于CPI持续上涨的成因分析及预测
摘要:居民消费价格指数是技术的进步和互联网的广泛应用,信息共享已薮成为人们日常工作、生活和学****中的普遍婀行为。政府部门、社会团体和个人的统计写信息大量涌现,信息数据收集的种类和数筘量呈指数级增长。与此同时,国家和有关部门制定了有关信息安全的法规及相关制度,舆论媒体对统计数据的关注度和要求酴也越来越高,但有关国民经济的各种统计鳊数据因存在虚假和泄露隐私受到质疑的情胫况却时有发生。大量的隐私数据发布和共剑享已经对隐私和信息安全构成威胁,隐私槁数据的泄露已成为急待解决的问题[1]桨。如何保证隐私数据在发布或使用时不被觉对应到特定人和特定部门已成为一个研究泷热点。
统计信息通过分析统计数据得到圪,统计数据按属性可分为4类:①能直接缥识别个体身份信息的显式标志符,如身份证号、姓名、社会保险代码等;②有助识香别个体信息身份的准标志符,如一些组合腐属性;③敏感属性,即隐私信息;④非敏感属性,即非上述3类的其他属性。本文所述的本隐私保护主要是指对统计数据中袍个人敏感信息的安全保护,是防止不法分陇子对个人敏感信息非法窃取的私有信息保护[2]。隐私攻击者除了能访问发布的池统计数据表外,还可能通过文献资料、技动术文档等获得发布的统计数据表中所采用
宅的隐私模型和实现算法等。我们假定攻击者可能获得的数据信息统称为背景知识。通常攻击者都是从背景知识中获得目标对象的QID属性。
用户对经济统计数据韪的第一要求是查询结果必须准确。从这个闸前提出发,本文提出一种基于交互的序列宓表发布模型,它能保证敏感信息不泄露,壕同时又能最大程度地减少统计数据的信息┅损失,提高统计数据的效用。实验结果表侪明,该模型对于大数据集的隐私能很好地⑻进行保护,而且丢失的重要信息少,能够邵满足统计数据发布的需要。
2隐私保护模型
为了解决隐私保护问题,国内外研眨究者提出了很多方法,这些方法主要有:甯①匿名保护。为了保护个人信息,在数据椭发布时,对能够直接标识个人身份的标识俏符进行删除或加密。②扰乱、随机化数据技术。通过对数据的随机化处理,增加数据“噪声”,使得数据不再反映真实的世界,从而无法被滥用而侵犯个人隐私。当厦然,关键的技术是要从处理后的数据中获烦得有效的分析结果。③分布式的隐私保护墼技术。双方或多方进行数据分析挖掘时,由于某种原因,参与者不愿将数据与他人腴共享而只愿共享数据分析挖掘结果。这需是要运用密码学技术来解决实际的隐私问题ょ。如安全两方或多方计算问题等。④k-措匿名技术。它要求在公布后的数据中保留
蕊一定数量的个体特征,从而防止匿名处理珈后的数据被链接攻击,造成个人隐私泄露蕈。
研究者们根据隐私保护方法建立了很裂多隐私信息保护发布模型,如k-匿名模憔型[3]、L-多样性模型[4]、t-磴closness框架[5]和个性化匿一名模型[6]等。这些隐私保护模型都是震针对可能存在隐私泄露建立的。
3基于欹统计应用的交互序列发布模型及算法
序谷列发布模型
隐私保护模型实际是利用好翡的数据发布方法来保护隐私,使用最多的脏算法是泛化或有损连接[7]。在一些统饭计分析中,需要进行联合查询,用户对统B计数据进行查询最重要的要求是查询结果耘准确,这样发