1 / 5
文档名称:

基于NLP 技术和相似度计算的智能搜索引擎研究.doc

格式:doc   页数:5
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于NLP 技术和相似度计算的智能搜索引擎研究.doc

上传人:799474576 2013/9/28 文件大小:0 KB

下载得到文件列表

基于NLP 技术和相似度计算的智能搜索引擎研究.doc

文档介绍

文档介绍:第 35卷第 4期
昆明理工大学学报(理工版)

http: / /www. kustjourna. /

V 35 N o 4
2010年 8月
Journal ofK unm ingU n iversity of Science and Technology ( Science and Technology)
Aug. 2010
do:i 10. 3969 / .j issn. 1007- 855x. 2010. 04. 016
基于 NLP技术和相似度计算的智能搜索引擎研究
1 1 1 2

3



4, 5
( 1. 桂林理工大学信息科学与工程学院, 广西桂林 541004; 2. 太原科技大学机械电子工程学院, 山西太原 030024;
3. 莫纳什大学管理学院, 澳大利亚维多利亚州墨尔本 3800; 4. 利物浦大学计算机科学系, 英国利物浦 L 69 7ZF;
5. 西交利物浦大学计算机科学与软件工程系, 江苏苏州 215123)
摘要: 针对传统的搜索引擎对于自然语言理解方面存在的问题, 文章研究了一种新的基于自然
语言处理技术和相似度计算的智能搜索引擎的模型. 其核心技术是基于自然语言处理的中文分
词技术、语义相似度和对立度等理论, 将这些概念理论结合起来, 从用户习惯的思考角度, 结合
Do tLucene开源全文搜索引擎建立一个智能的搜索引擎. 研究表明, 该模型在对已经收录的文档
有着 86. 1% 的查准率. 该智能搜索引擎较好的对查询语句的实现了理解, 能够对用户的提问做
出正确的回答.
关键词: 自然语言处理; 中文分词; 相似度; DotLucene; 智能搜索引擎
中图分类号: TP39
文献标识码: A
文章编号: 1007- 855X( 2010) 04- 0076- 04
Research on Intelligent Search Engine Based on NLP
T echnology and Sim ilarity Calculation
1 1 1
2 3 4 5
( 1. Schoo l of Inform a tion Sc ience and Eng inee ring, G u ilin U n iversity o f T echno logy, G u ilin, G uangx i 541004, China;
2. M echan ica l and E lec tron ic Eng ineering Co llege, T a iyuan U niversity of Sc ience and T echno logy, T a iyuan 030024, China;
3. D epartment o fM anagem en t, M onash U niversity, M e lbourne 3800, A ustra lia;
4. D epartm ent puter Science, U n iversity o f L iverpoo,l L iverpoo,l L69 7ZF, UK;
5. Departm ent puter Science and