文档介绍:——奎堕墨三奎兰堡主堑窒生兰垡笙奎鷈曲錿鷆匆餴,畁矗,,.琸薳.Ⅲ琣痓痠,。簁Ⅵ,、.....琣..痑琣痵
问题,包括中文的分词、特征提取、特征匹配及权值计算等的综合应用技术。论文最后对所做的工作进行了总结,指出了这一系统对特定领域用户从匣袢∮杏眯畔⒌挠τ们熬昂拖质档囊庖澹并提出厂进一步的研究方向。关键词:特定领域,搜索引擎,谋拘畔ⅲ禲文分词技术,分类系统太原理工大学硕士研究生学位论文
瓾,餴炳縧產印狟,.,.,
隿,畂癿皿珻曲甒皁琭簊,“琺,如太原理工大学硕士研究生学位论文£黙厅.,,,甌—琣畂,,
第一章绪论引言络用户可以借助信息服务工具一搜索引擎在全球范围方便地发布和检索随着信息技术的不断发展和痺应用的日益广泛,广大的网信息,然而当人们在尽情享受这种科技的进步所带来便利的同时,也不得不面对互联网上一些别有用心的人利用捶⒉家恍┎唤】档纳踔是反动的言论。不仅对人们的思想健康造成了不利的影响,而且也给我们社会的安定和经济的馕陶溶牵嘏ㄓ潮魄雷试蕹岸镢糾瞒群博幅葡哥幅。唏骊雀德潍傅嘲璋际蔫”受。前浠;罐潦瓣滢亭潼嘱德国瞒蕊艄藓潜嘲嚷;滩渫停黑潆际嚷∞潆陲滔;瀑潆一鬲;陪深浔怒潮灌漠г龀叭芄囗婷炀赣新魉骘印簕。嗣臻;博孺懈,萌浠∞;窄嘲、管理松散的谌荩患焖鞯挠没б灿原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。传统的信息搜索工具,如;、、龋捎谄渌捎玫乃索方法大多是基于关键词匹配进行检索,忽略了信息服务与知识传递的深度与质量,使得人们在检索结果中感到很难找到自己真正需要的内容,往往存在查不全、查不准、检索质量不高的现象;那些门户网站或者专业网站鏨太原理工大学硕士研究生学位论文、、、
页增加到现在多亿网页;雅虎搜索引擎拥兀淮浴辍辍斐觯豪淼螿:£也号课隧的研究背景与意义球最大的搜索引擎逝;饔ご裕篻§:£从年的亿网一种新型的面向知识内容的解决方案——设计一种按照知识概念体系组日俱增的“信息爆炸”所带来的冲击,既是摆在相关研究人员面前的一项中心凇暗谑宕沃泄チM绶⒄棺纯鐾臣票ǜ婢伞保刂万台。网络国际出口带宽增长飞速,总数达到。下注册的域名称收录了亿个网页;国内的中文搜索引擎百度惚ǎ慌γ怂埽篵堑埂闝丑网页数估计已达到嘁冢銮颐磕昊乖诳焖僭龀ぁ。人们在工作、学进行了分类,但需要用户懂得分类的标准,然后逐层点击相应的分类链接,才能获得所需的信息,给用户带来了极大的不便。为此人们期待着能够有织的,以精确、专业、个性化和以用户为中心的智能信息服务工具,能为用户提供面向实际需要的、有针对性和时效性的信息资源的系统。适应网络化、智能化以及个性化的需要是二十一世纪信息检索技术发展的新趋势。如何针对特定领域的用户,充分利用网络技术、数据挖掘技术、文本处理技术、自然语言理解技术及人工智能等技术,提出一套从畔⒆试粗锌焖佟⒆既返卣业剿枭畈愦涡畔⒌氖迪只疲杂Χ杂重要研究课题,也是提升领域行业组织和管理莸囊恢钟辛κ侄巍随着的飞速发展,网上数据不断激增,据中国互联网络信息到年眨夜贤没ё苁颍贤扑慊锏数、┦荼砻鳎夜チM乱荡年轮锌圃和状斡隝网互联到现在经过十年的发展取得了丰硕的成果,中国互联网已经形成规模,其应用已走向多元化。作为为全的中文页面从两年前的七千万页增加到了现在的两亿多。而整个互联网的太原理工大学硕士研究生学位论文
嗡淼难芯勘尘坝胍庖一种新型的面向知识内容的解决方案——设计一种按照知识概念体系组日俱增的“信息爆炸”所带来的冲击,既是摆在相关研究人员面前的一项万台。网络国际出口带宽增长飞速,总数达到。下注册的域名球最大的搜索引擎簂..从年的亿网页增加到现在多亿网页;雅虎搜索引擎海痵畒./埠网页数估计已达到嘁冢銮颐磕昊乖诳焖僭龀ぁ。人们在工作、学进行了分类,但需要用户懂得分类的标准,然后逐层点击相应的分类链接,才能获得所需的信息,给用户带来了极大的不便。为此人们期待着能够有织的,以精确、专业、个性化和以用户为中心的智能信息服务工具,能为用户提供面向实际需要的、有针对性和时效性的信息资源的系统。适应网络化、智能化以及个性化的需要是二十一世纪信息检索技术发展的新趋势。如何针对特定领域的用户,充分利用网络技术、数据挖掘技术、文本处理技术、自然语言理解技术及人工智能等技术,提出一套从畔⒆试粗锌焖佟⒆既返卣业剿枭畈愦涡畔⒌氖迪只疲杂Χ杂重要研究课题,也是提升领域行业组织和管理莸囊恢钟辛κ侄巍随着姆伤俜⒄梗鲜莶欢霞ぴ觯葜泄チM缧畔中心凇暗谑宕沃泄チM绶⒄棺纯鐾臣票ǜ婵保刂到年眨夜贤没ё苁颍贤扑慊锏数、┦荼砻鳎夜チM乱荡年轮锌圃和状斡隝网互联到现在经过十年的发展取得了丰硕的成果,中国互联