文档介绍:基于统计与规则相结合的口语语言理解研究摘要实现“人机口语对话系统”是多年来人们一直渴望实现的梦想,也是人工智能领域研究人员孜孜不倦追求的目标。口语对话系统的目的是在用户和计算机之间提供一种交互界面,帮助用户以一种更为自然的方式利用计算机完成任务。正如“口语对话”本身所表明那样,该系统的主要特点是以语音作为输入输出,要求系统能够理解用户输入的语音。口语语言理解是对话系统中最核心的组成部分,其性能的好坏对口语对话系统有关键性的影响。它的任务是从口语句子中提取出语义表示。口语的特点决定了口语理解的困难,口语理解一般需要解决三种噪声形式:用户的自发性引起的“随意噪声”,不合乎语法的句子引起的“语法错误噪声”和语音识别错误引起的“语音错误噪声”。本文则主要研究这三种噪声形式的处理,主要的研究工作和研究成果包括:攵钥谟锒曰跋低车挠镅岳斫馕S镆謇斫獾奶氐悖捎昧擞镆蹇蚣的表示方法。为了处理具有“随意噪声”和“语法错误噪声”的口语句子,我们提出了基于统计与规则相结合的口语理解方法。该方法首先利用统计分类器确定口语句子的任务主题,然后根据这个任务主题动态寻找相应的语义语法,利用基于文法的分析技术得到句子的语义概念。在对实际用户的语料测试中,该方法取得了ト挝袷侗鸫砦舐屎.%语义单元理解错误率。镆羰侗鹱魑6曰跋低车氖淙攵耍湫阅艿暮没抵苯佑跋熳哦曰叭务是否能顺利进行A舜怼坝镆舸砦笤肷保竦酶诺挠镆羰侗鹦阅埽自然语言理解模块和语音识别模块的有效融合是一个研究趋势。为此,我们提出了基于全信息的卅语音识别结果重排算法机制。该算法需要考虑如下因素:首先语音序列要与应用领域的语法保持一致,应能被语法解释,这属于语法信息;其次,由语法解释的分析结果在语义上应真实,这属于语义信息;再次,语义分析结果应与当前的对话上下文相关,这属于语用信息:最后得到语音序列的全信息值,获得全信息值最高的语音假设即为最优。
知识水坝***@pologoogle为您整理
能信息服务,既包括面向公众用户的多语言智能信息广播和讲解,也包括杓撇⑹迪至嗣嫦虬略说亩嘤镅灾悄苄畔⒎裣低持械娜嘶换模块。该模块支持多种语言查询⒂铩⒑河铩⑷沼锏,在体育领域内,提供应用场景为赛事信息查询的多语言智能信息服务;在城市公共领域内,提供应用场景为天气预报、公交信息查询、旅游锓饮信息查询的多语言智面向奥运参与者个人的个性化多语言智能信息咨询。关键词:口语对话系统口语语言理解全信息语音假设
知识水坝***@pologoogle为您整理
鸻,—猰,、.瑃,、,:瞨妙:’產‘‘ⅱ鬶,觚..,’痵..’
筸,舢畂瓼,,琓詓珽甀砗隺裲噔:,甧.,,瞨伍瑆甌琲甌,.—甿,痵
‘私舻日期:————日期:地:五挫塾建纽站盘关于论文使用授权的说明我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经日期::本学位论文属于保密在一年解密后适用本授权书。非保密论文注释:本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑本学位论文不属于保密范围,适用本授权书。导师签名:
第一章绪论最初的人机交互是人们通过按键、控制鼠标等输入设各控制计算机,同时通过显示设备希望能够采用更加自然的方式进行信息获取、信息显示和信息交流,使设备具有更加人得这个梦想的实现不再遥远,并随之产生了一批研究或实际系统。这种对话式的人机交影院的效率。砀裉钚础H粘I畛3;峒礁髦指餮谋砀瘢渲型臣票砀裾己大比重,比如人口普查表、市场调查表、政策调查表等,这些表格的完成需要花费大量成这些表格,这将大大缩短统计的周期,节省开销。邢薹段У挠镆糇远搿特定任务的语音界面,比如电子邮件语音管理助手、计算机语音桌面等。人机口语对话生,另一方面也将使用户摆脱近台操作的约束,用户可以不必盯着屏幕通过操作键盘和现代社会,人们每天都同各种各样的计算设备进行信息的沟通和交流,即人机交互。获得信息,但是这种交互方式并不是最优的,。随着信息时代的来临,人们越来越性化的界面。一种有效