文档介绍:四川大学
硕士学位论文
数据库汉语自然语言查询接口设计与实现
姓名:胡明耀
申请学位级别:硕士
专业:计算机应用
指导教师:唐常杰
20060420
提出了一种新的基于语义的汉语知识分词方法一正则分词法。引入了词数据库汉语自然语言查询接口的设计与实现摘要数据库中文自然语言查询接口是数据库研究的藿要分支,一直是岛研究界关注的热点,已经取得了丰硕的成果,但在处理自然语占的方式方法上还没有大的突破。针对这一现状,本文提出了一些新方法和新思路,主要成果设计和实现了汉语数据库自然语言查询接口系统,系统包括正则分词子系统和对象语义解析子系统;基于实现了鍪笛樾韵低常鞘刑炱畔⒉檠脱】涡畔⒉基于,构建了一个应用于手机短信信息查询的实用性系统,列车时刻信息查询系统,查询正确率在.%。利用此系统,对的市场应用进行了一定的探索和研究。关键词自然语言处理,自然语言查询接口,数据库中文自然语言查询,正则计算机应用号业研究生胡明耀指导老师唐常杰教授如下:汇正则分词规则。提出了一种新的语句语义解析方法,对象语义解析法。引入了对象语义规则表达式和对象语义解析树的概念,前者为查询语句的语义归结规则,后者为语义规则归结过程中构造的语义树:询,查询正确率分别在.%和.%;结果表明,系统具有很好的实用性和扩展能力;表达式
甌.%...%,...%....甌·,,
菘庾匀挥镅越涌谘芯肯肿矗基本概念工智能、自然语占处理、数据库系统、人机接口等方面的研究【俊K孀判畔式信息终端只琍等拇罅坑肯趾褪褂茫没枰R恢旨虮愕淖匀语言查询技术,因此数掘库自然语言查询接口作为人机接口的重要研究领域广义上,数据库自然语占接口包括数据库设计、数据库定义、数据操纵檠⒉迦搿⒏隆⑸境等方面【俊T谑菘庾匀挥镅越涌谥惺菘獾自然语言查询最为藿要,与数据库用户最为紧密相连。数据库自然语言查询方便用户:用户使用简单的自然语言进行与数据库进行查询交互,无需记忆任何的指令性的代码或者标识,无需专业的培训,即可方便的使用数据逻辑独立性和物理独立性:与数据库系统提供形式化查询语占鏢相比,自然语言的查询是以数掘库中数据所属领域的逻辑概念来访问数据的,屏蔽了数据库的逻辑和存储结构,它足架构在形式化查询语言上的更高一层数据库查询技术;说明式语言:非过程性的查询使得用户可以简单明了地提出查询请求,无需进行形式化的查询逻辑组织。应用广泛:尤其适合作为搜索引擎的查询接口谥J读煊虻谋镜厮阉查询尤佳蛘哂胗镆羰侗鸺际跸嘟岷辖ǜ油昝烙胧涤谩数据库自然语言查询接口易学、易用、应用前景好。但自然语言的复杂数据库自然语言接口是人工智能与数据库技术相结合的产物,涉及到人技术的发展和普及绕渥阃缡菟阉骷际醯难芯亢头⒄,各种智能便携得到重视。接口的目的是:用户查询数据库信息时,使用同常通用自然语占与数据库进行交互,简单快捷地获取数据库中的数据信息。数据库自然语言查询接口有下列优点;库;性阻碍了接口的研发。概念层次网络理论窜普呋圃粝壬岢龊河锟谟镉形迕鼓:四川大学颂卜学位论文第●’
缺模糊,汉语书面语只有后三重模糊【俊T谑菘夂河镒匀挥镅圆檠涌谥校数据库汉语自然语言查询接口查询的数据库对象基于特定知识领域,因此涉型相关于数据库数据内容,受限语言查询可以去掉自然语言中的歧义和模糊自然语言的子集,基于领域的受限的自然语言的理解和处理,特别是在应用在特定具体的数据库接口上,则是完全可行的。数掘库中的内容一定足明确的、有限的,而用户的提问又总是围绕着数据词蚩捎伤嵌ㄒ宓拇省L嵛手械亩室话阄J菘獠僮髅畲省⒒蛴由于是向数据库提问,不可能出现带有感情色彩的词汇,也杜绝了成语俚句型有所限制,句法有所简化,例如只剩下了祈使句、疑问句及相应的省询语占,所以它并不要求完全彻底地去理解语言的深层含义。只要我们从发音模糊、音训转换模糊、词的多义模糊、语义块构成的分合模糊、指代冗因为没有复杂的语义块的问题,因此只会遇到词的多义模糊,指代冗缺模糊。及到的查询自然语言足受限的自然语占,对于词的多义模糊,指代冗缺模糊是在受限的自然语占的有限集下,这可以方便地对此进行消除。数据库自然语言查询是一种受限语占查询,具体表现在:词汇受限、句型受限、语义受限和语用受限【俊J菘庾匀挥镎疾檠校褂玫拇驶愫途性,回避自然语言理解的在理论和实现上的困难。众所周知,目粄『理论和技术还难于实现彻底的自然语言理解,但是作为对于上述的可行性,吕光楣,陈清波等人给出了总结【浚库进行的。因此提问中的名词必为数据库概念模式中定义的词或其同义数据库关系名属性名有关的领域性动词。语的出现。略句。歧义性和上下文相关现象大量减少,且有一定的规则可循。更垂要的一点是,由于接口的最终目的是把自然语言转换成数据库内部查语言的功能结构和语义的某些特征上去分析处理它,达到转换的目的就行了。阴川大学硕卜学位论吏第