文档介绍:维普资讯
卷第期哈尔滨商业大学学报自然科学版..
年月·
树和单字倒排相结合的汉英词典查找机制
朱文强,刘秉权,葛冬梅,王喻红
.哈尔滨工业大学计算机科学与技术学院,哈尔滨;
.黑龙江工程学院计算机科学与技术系,哈尔滨
摘要:在对词典的查找算法作了回顾基础上,根据跨语言信息检索系统的要求,提出了一种词典查找
的新机制,
方法。既实现了查找的高效率又实现了模糊查找的算法,实验证明这种方法能够满足实际系统的需要.
关键词:跨语言信息检索;词典查找;树;倒排索引
中图分类号: 文献标识码: 文章编号:——
—
—
....., —
.,,,;
.。,,
:
—.
,.——
.
.
:—;;—;
跨语言信息检索—找算法,在翻译词典中快速有效地找到相应的翻译
,简称是使用一种语言的查询项检索项,因此词典的查找效率和准确性对整个系统的性
其他一种或者多种语言的文档信息的方法¨.在能来说是非常重要的.
跨语言信息检索中,最为流行的技术就是基于查询国内外信息检索的很多学者已经就词典查找
翻译的方法,将用户输入的源查算法提出了很多高效的算法,有很多不同的词典机
询串翻译成目标语言的查询串,,整词二分法,基
检索系统检索出用户所需文档. 于树的方法,逐字二分法,还有双数组
基于双语词典的查询翻译⋯,在汉英跨语言信息树方法,虽然这种方法的构建过程比较麻烦,
检索系统中采用汉英双语词典,用户输入汉语查询但查询效率非常高,只需要简单的几个运算就可
串,通过双语词典获得相应的英语翻译,然后再到以,
,即只有词典中存在的
系统中,比较基础的部分就是翻译词典的查词才能够检索到,虽然树的方法可以实现相
收稿日期:——.
基金项目:国家自然科学基金,黑龙江省自然科学基金
作者简介:朱文强一,男,硕士,研究方向:人工智能、信息检索、移动平台计算
维普资讯
第期朱文强,等:树和单字倒排相结合的汉英词典查找机制
同前缀的匹配,
词典的跨语言信息检索中,实现一种支持模糊查找有关,最快是,最坏的情况就是树的深度,
的算法可以在程度上提高系统的召回率. 即,:用户查找
传统的基于字符串匹配的模糊查找算法对于这个单词,首先从根节点出发,找到节点,从节
双语词典的查找来说实现起来比较麻烦,需要非常点找到节点,然后是节点,最后到达节点,判
多的附加信息,,则结束查找,查找次数仅为次.
广泛和高效的模糊匹配查找算法,我们根据信息检
索中倒排文档的技术结合比较高效的树词典
机制提出来了一种新的词典查找机制,就是混合
树和单字倒排的方法—
,以下简称方法.
数据结构设计
树本身作为一种搜索树在信息检索领