文档介绍:兰州理工大学
硕士学位论文
基于本体的语义标注研究
姓名:王亚斌
申请学位级别:硕士
专业:计算机应用技术
指导教师:李明
20100420
摘要语义标注是语义⒄姑媪俚闹匾L粽街唬饕Q芯咳绾胃咎宕解的语义,从而实现计算机与计算机之间,计算机与人之间的智能交互。目前,语义标注依然存在以下一些问题:标注系统往往是针对特定的应用,不能根据不同数据的特点采用不同的标注方法;已有的标注方法还不能解决所有标注问题。数据之间的相互依赖关系进行标注。一阶线性条件随机场的非线性依赖关系,例如:层次依赖关系,邻接依赖关系,一阶线性条件随机场模型一树状条件随机场模型保证模型训练问兰不是很困难的情况下,可以有效提高标注的准确率和,的标注方法,该方法在关键词:语义槐咎澹挥镆灞曜ⅲ惶跫婊的符号赋予带有具体含义的语义信息,为互联网上的信息提供具有计算机可以理基于规则学习和基于分类模型的标注方法只能标注相互独立的数据信息,不能对,芄槐曜⑹菪畔⒅涞南咝砸览倒叵怠5牵杂谖牡抵写嬖模型不能标注。本文的研究内容包括以下两个方面:攵砸唤紫咝訡荒鼙曜⒉愦我览倒叵档奈侍猓岢隽艘恢指慕,,在召回率。髯刺跫婊∧P在标注具有层次依赖关系的文档时能够显著提高标注的准确率和召回率。但是,对于更复杂的邻接关系、长距离依赖关系标注问题,树状条件随机场模型不能有效标注。为此,提出了链式条件随机场模型的基础上加入了对跳边的支持,可以有效标注信息之间的各种复杂的长距离依赖关系。硕士学位论文
..琤籓籗甌,;痶,,;瑃瓵,!.;琭—瓸珻.:.,,’,甌—;’
插图索引图基于树状条件随机场的句上法依存树⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图语义痛砏的关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图桓黾虻サ谋咎濉图本体建模生命周期⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图一阶线性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图基于一阶线性的句法结构树⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图链式条件随机场模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图基于链式条件随机场的句法依存树⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯P陀胂咝訡P偷氖笛榻峁冉稀图诠俜接锪系姆窍咝粤碈镆褰巧ū曜⑵啦饨峁图语义逑到峁埂图硕士学何论文
附表索引表与谓词有关的特征及其说明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表语义痛砏的对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表基于本体的语义标注工具的基本特性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表与关系结点有关的特征及其说明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表识别目标和识别效果的交叉表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯硕士学位论文
剔谧轹夕%作者签名:≥渺诫作者签名:喜面空式日期:劢年多月』兰州理工大学学位论文原创性声明和使用授权说明日期:刃肜年;月原创性声明学位论文版权使用授权书日期:刀肜年易月已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。/一。。
第滦髀课题研究背景及意义万维网化程度低等。网页包含了大量的文本、图像、甚至声音,但是这些信息对计算机毫无意义,这是因为大部分系哪谌菔巧杓聘嗽亩恋模皇侨眉扑慊哪里有与其它页面的链接。但是,它甚至分辨不出个人主页和天气预报的区别,在倡议琄】。语义氖菔墙峁够模镆迕魅返模梢栽诨骱突髦洌饔肴酥间进行知识共享和交互。语义拍畹奶岢觯S行Ы饩瞿壳耙蛱赝纤嬖诘娜毕萏峁┝诵碌募术思路。语义校髦肿试幢蝗宋5馗秤枇烁髦置魅返挠镆逍畔ⅲ扑慊以分辨和识别这些语义信息,并对其自动进行解释、交换和处理。但是,语义内容管理、多语言的语义信息交互、语义信息可视化以及语义枋鲇镅缘慕一步标准化。在这些挑战中,语义内容生成是指利用本体对文档进行描述,生成带本体标记的语义内容,它是语义⒄沟谋匾G疤幔怯镆錡应用的基础。语义内容生成主要包括语义标注和语义集成。其中,语义标注【扛荼咎宥晕档ǜ髦掷嘈停纾篧页面、癙文档等杏镆迕枋觥S镆标注的目的,就是用本体对萁斜暌訵智能的实现起着至关重要的作用。因此,语义标注可以为因特网上的信息提供具有计算机可以理解的语义,从而满足智能主体詗上异