文档介绍:南京邮电大学
硕士学位论文
基于受限自然语言的房产信息查询设计与实现
姓名:赵希成
申请学位级别:硕士
专业:计算机软件与理论
指导教师:郑彦
20090401
岢鲆恢指慕姆执仕惴ㄒ籛惴ǎ摘要岢龇虾河镉锓ú⒛苈惚鞠低巢檠氖芟尬姆ü嬖颍向数据库系统发问并获得所需的信息,从而大大改善了人机交互的容易程度。近年来,设本论文主要的研究目标是结合房产信息查询特定的应用需求,研究与实现一个基于受限的汉语自然语言查询系统。它允许用户在界面层输入受限汉语查询语句,然后通过一定本论文首先阐述本课题的研究背景和现状,在对已有技术总结基础上,提出汉语语法并能满足查询要求的受限文法规则。研究设计了适合房产信息系统的系统词典:通用词典、专用词典和关联词典。提出一种改进的分词算法—盟惴ú握蘸偷ゴ氏喙氐南低炒实渲懈龅氖菘庥镆澹τ梅坎畔⒌牧域知识,采用词典中长词优先的原则,以从左向右的顺序滑动与被切分的查询语句相匹配,实现了分词。在分词基础上,设计实现了面向房产信息查询的受限自然语言理解与数据库查询子模块,该模块实现了受限自然语言理解和类枋觥=岷瞎亓4实洌捎檬屎媳系统的“关联路径处理椒ǎ钪帐迪至死郤语句至锞涞淖;弧本文的创新点主要体现在:芯亢蜕杓屏耸屎戏坎畔⒉檠南低炒实洌杓剖迪至嗣嫦蚍坎畔⒉檠氖芟拮匀挥镅岳斫庥胧菘獠檠幽?椤本文研究实现的是一个面向房产信息查询原型系统,仅对规则自然语言进行进行查询处理,还有许多改进之处,比如:受限汉语规则扩充,对不同应用数据库移植等,以便使系统更完善,实用性更强。关键词:受限自然语言数据库查询系统词典算法中文自然语言查询系统是数据库查询系统研究的重要分支,它是自然语言理解、数据库技术、人工智能、人机界面相结合的产物。它使用户可以直接以汉语自然语言的方式,计数据库自然查询接口,已成为自然语言研究中最具有广泛应用前景之一。的算法把用户的输入转换成标准的锞洌⒃诜坎畔⑹菘庵型瓿伤G蟮牟檠输出查询结果。南京邮电人学坝研究生学位论文
.甌琓琫.,瑄珹篻,甌猰,瑃南京邮电人学硕上研究生学位论义,瑃..,猰琓
甌,,瑃,甿唬瓺瑂::.
图表清单表非标准词与标准词词典⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表建筑时间表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图句子数组、句型字符串生成界面⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯锞湎允鞠⒋翱凇图系统运行主要界面⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图系统架构模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表通用词典⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表关系词典结构⋯⋯⋯⋯⋯.’⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表关联词典⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表拘畔⒈怼图直接关联模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图算法测试⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图ㄓ么实涔芾怼南京邮电人学颐研究生学位论文
缩略词至宿略词英文全称中文译文中文自然语言查询系统基于系统词典分词狾识别查询条件和目标字段查询条件字段生成查询目标字段生成南京邮电大学硕研究生学位论文
研究生签名:疼犁导师签研究生签名:素兰社日期:砭翌里业南京邮电大学学位论文原创性声明南京邮电大学学位论文使用授权声明送交学位论文的复印件和电子文档,可以采用影印、缩印或其它复制手段保本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他入已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所存论文。本文电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ论文的全部或部分内容。论文的公布ǹ授权南京邮电大学研究生部办理。
第一章绪论论文背景及意义随着现代科学技术的发展,人类从工业化社会步入了信息时代,计算机已经成为这个时代标志性的产物,人类对信息的处理也提出了更高的要求。各生产和管理部门对计算机应用和数据库应用的需要普遍加强,而广大的非专业数据库用户普遍缺乏计算机专业知识和数据库概念,要让他们对英语的数据库用户界面如国际标准的数据库查询语言的正确使用是一件非常困难的事情。因此,为中国用户提供易于理解、便于使用的数据库汉语查询系统是十分重要的。随着自然语言理解研究的深入,中文数据库自然语言界面显然最符合这类用户的要求,它能接受用户以自然汉语的形式提出查询语句,自动进行分析,生成标准的锞洌杂τ檬