1 / 4
文档名称:

基于语义划分的P2P 搜索技术研究.pdf

格式:pdf   页数:4
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于语义划分的P2P 搜索技术研究.pdf

上传人:799474576 2013/8/7 文件大小:0 KB

下载得到文件列表

基于语义划分的P2P 搜索技术研究.pdf

文档介绍

文档介绍:第期计算机技术与发展. .
年月; .
基于语义划分的搜索技术研究
孙名松,刘杰,李胜利
哈尔滨理工大学网络信息中心,黑龙江哈尔滨
摘要:由于目前大多数结构化都采用技术,而算法只能进行精确查找且命中率较低。为了提高查全率,
文中提出一种基于语义划分的搜索方法,通过空间向量模型利用资源文档的多个关键字建立文档的语义相似角,在
环的基础上增加一个基于语义相似角排列的语义环,首先利用进行精确查找,当精确查找失败时转人语义环
进行模糊匹配,从而通过精确查找和语义模糊匹配的融合实现智能搜索,提高查全率。仿真实验表明:本算法实现
了高查全率;在小规模稳定网络中能实现效率搜索。
关键词:;语义:相似角;分布式哈希表
中图分类号: 文献标识码: 文章编号:———

,,
,,,
:
. 。,
,
;,, —
, .
.——
.
:;; ;
前言的巨大挑战。
随着的快速发展,由于具备可扩展文中采用基于语义划分的双环分布式散列表
性、健壮性、对等的结构等优点,被越来越多地应—,在环的基础上增加一
用到互联网资源共享中,网络经过近十年的发展, 个基于语义相似角排列的语义环,首先通过
已经从第一代的中心索引拓扑和第二代的无结构式拓算法进行精确查找,当精确查找无法命中时将查询转
扑结构发展到了现今广泛采用的结构化如入语义环通过语义相似角进行模糊匹配并返回语义相
引】等,这些都是基似角最接近的/个结果,其中为设定的阈值。从而
、、、
于【技术,其优点是可以保实现精确查找和模糊匹配的融合,提高查全率。
证在一定的跳跃次数内查找到网络中存在的数
据对象,但只能根据资源的键值关键字进行精确匹算法介绍
配的查询,从目前的应用上来看,网络优势主要体美国麻省理工学院在年提出一种基于
现在大范围的共享、搜索上。如何在用户广泛分布、数的协议。它利用相容哈希函数为每个节点和关
量巨大、节点行为不可控、计算能力和网络连接不均匀键字分配位的标识符,此标识符可以用一等
的复杂环境下实现高效的搜索服务是应用面临哈希函数产生,然后按照顺时针方向将每个节点标示
符从小到大排列成一个一维的环,节点的标识符
收稿日期:——;修回日期:一—可以通过哈希节点的地址产生,而关键字的标识符
作者简介:孙名松一,男,教授,研究方向为网络应用、网络安可以通过直接哈希此关键字产生,用,
全。唯一标识一个节点的关键字和节点标识,其中标识符
· · 计算机技术与发展第卷
长度为/,且必须足够长,这样才能保证两个节点. 具体实现
或者关键字哈希到同一个标识符上的概率小到可以忽建立节点资源的语义相似角。
略不计。将节点标识,对存储在节点等于首先利用向量空间模型建立节点资源文档,再通
值的节点上,若不存在节点等于值的节点, 过技术计算出节点资源文档相应的文档向
则存储在节点值大于值且最接近值的节点量,最终计算出语义相似角。向量空间模型、
上,每个节点仅维护一张记录其后节点标示的, 是一个对信息进行过滤、提取、索引和比较相关性的代
的指针表,一般每个指针表中含有节点长度数模型,通过对文件的关键字用相应的向量表示来建
大小个表项,表项的第一个,对为其后继节