文档介绍:文本中知识的获取摘要人类通过文字来描述世界、表达思想,文本是人类智慧传承的重要媒介。随着知识系统面临着几个重要问题:如何识别文档主题,如何识别文档中心词;如何对用户所关和信息抽取技术是文本处理中的重要技术,可以在一定程度上解决上述问题。本文对基的任何词语卑谥J犊饽进行实时消歧处理,不需要语料库,无须训练。提出了基于语义网络与惴ǖ牡ノ谋竟丶食槿∷惴āT诖室逑绲基础上,文本中的所有词语都具有确定的词义,对语义网络进行剪裁,去掉词语的其他义项,此时语义网络中的节点即为该词在文本中的义项,然后使用在对中英文科技论文的手工标注数据集上,与巧方法进行比较,结果表明了算法的启发式的汉语信息抽取规则生成算法——,文档知识管理在学术界和企业界引起了广泛关注。但是文档知识管理心的内容进行个性化的关键性提示;如何精确返回用户希望得到信息。关键词获取技术于语义词典的单文本关键词获取技术,信息抽取技术中的规则生成机制进行了研究,主要的研究工作和研究成果包括:基于语义网络与惴ǖ拇室逑提出了基于语义网络和岷系闹J洞室逑缢惴ǎ芄欢晕牡抵谐鱿针对中文文本,以为语义知识库,以义原为节点,义原问的相关性为边的权重构造无向赋权网络,表达文本内容。使用惴ㄆ兰垡逶娜ㄖ兀而计算义项的权重;对每一个词语来说,权重最高的义项即为其含义。分别采用全文标注试验与评测集对算法进行了评价。针对英文文本,以S镆逯J犊猓許=诘悖琒实南喙匦晕边的权重构造无向赋权网络,表达文本内容;使用惴ㄆ兰跾娜重;根据的权重并结合共指词义现象、词义常用性等因素进行词义消歧。在数据集对算法进行了评测。基于语义网络与惴ǖ墓丶食槿挖掘出重要的词义,其对应的词语即为文本关键词。有效性。
知识水坝***@pologoogle为您整理
关键词:关键词获取信息抽取词义消歧2捎糜屑喽降淖缘紫蛏瞎嬖蜓习过程,能够根据中文的特点进行启发式的逐步泛化,同时采用阕幼魑F扩展进一步提高规则的覆盖效果。在自主开发的财经新闻信息抽取系统上,对瓹则。此外,将信息抽取技术应用于本体的实例获取,在北京旅游信息查询系统价生成规则的效果。阕幽芄缓芎玫钠揭指哺锹视胱既仿实拿埽徊捎糜镆算法性能进行评测,生成规则的准确率为倩芈饰.,性能优于手工编制的规琓牧煊虮咎骞菇ü讨衅鹆酥匾5淖饔谩
知识水坝***@pologoogle为您整理
.,...,.甌,,
甒痜甌“眘.,,甧..琽.::瑆甊—瓵,,·锰
王盔笙。谚翌金:唬汗纭暌灰关于论文使用授权的说明申请学位论文与资料若有不实之处,本人承担一切相关责任。校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保密论文注释:本学位论文属于保密在—年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人签名:日期:学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑导师签名:■童.,.
;还媛自我表述。本体论信息是事物本身所表现的信息,是事实上的存在。它与是否有主体的智能是在一定的环境下针对特定的问题和目的而有效地获得信息、处理信息形成知识和策略、利用策略来解决问题,从而成功达到目的的能力。认识世界和改造呕世界的能力是人类的基本能力,也是人类区别于其它生物物种的特殊能力。人类的智能也正是在不断地认识世界和改造世界的过程中体现出来的。回顾人类文明进化过程,我们发现社会发展遵循这样的循环过程:当人类面对具体的生存环境时,就会发现问题,并设定解决问题的具体目标;为此,就要获取关于问题、环境和目标的相关信息;把这些信息提炼成为相应得知识;进而在目标的导引下利用这些知识生成解决问题的智能策略;并把策略转化成为智能行为,解决问题,达到目标。在此基础上,人类又会面对新的环境设定新的目标和提出新的问题,开始新一轮更高水平上的,不断展开螺旋式的演进,不断解决新问题。这一过程贯穿了人类的历史,体现在社会发展、科学技术发展的方方面面。信息科学是信息时代的表征性技术,存在这样一个规律:智体从环境中获取信息,通过认知与决策得到策略,实施策略改造环境:这一规