文档介绍:ELECTRONICS WORLD・探索与观察
基于线段树的中英文同义多关键词
加密数据搜索方案
南京信息工程大学应用技术学院 方忠进
南京信息工程大学滨江学院 张 豫
大数据时代的到来已经毋庸置疑。在这种情况下,数 效率。
据成为一种无形的资源。然而存储和维护如此庞大的数据
所消耗的成本,对普通企业和个体来说是难以承受的。云 1 相关知识
计算和云存储的出现给极大的减少该成本,个人和团体只 线段树
需要租赁相应的资源,就可享受到高质量的存储和数据处 线段树是一种二叉搜索树,与区间树相似,它将一个
理服务。但是将数据直接存储到云端中往往会面临泄露 区间划分成一些单元区间。对于线段树中的每一个非叶子
的风险。因此为了提高数据的安全性,就需要对数据进行 节点[a,b],它的左儿子表示的区间为[a,(a+b)/2],右儿子
加密。 表示的区间为[(a+b)/2+1,b]。使用线段树可以快速的查找
用户在搜索过程中,可能会使用关键词的同义词进行 结点所在区间,时间复杂度为O(logN)。
检索,生成的陷门就与原关键词所生成的不同,从而无法 图1为区间[1,12]所创立的线段树。对于每一个子节点
检索到用户需要的密文。这给基于关键词的加密数据搜索 而言,都表示整个序列中的一段子区间;对于每个叶子节
的准确率带来了巨大挑战。 点而言,都表示序列中的单个元素信息;每个结点可额外
本文根据同义关键词在同一种语言下的表达方式会有 存储相关的信息。
差别,但被翻译成另外一种语言时,