1 / 119
文档名称:

基于统计模式识别发音错误自动检测的研究(可复制论文).pdf

格式:pdf   页数:119
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于统计模式识别发音错误自动检测的研究(可复制论文).pdf

上传人:mkt365 2013/11/11 文件大小:0 KB

下载得到文件列表

基于统计模式识别发音错误自动检测的研究(可复制论文).pdf

文档介绍

文档介绍:摘要发音错误自动检测是计算机辅助语言学习系统的关键技术,在很大程度上决定了计算机辅助语言学习系统的性能。可靠的自动发音错误检测技术有助于计算机辅助语言学,分析出学习者的发音缺陷,针对性的给出改进意见,并给出对应的学。本文针对主流的基于统计模式识别的发音错误自动检测技术进行了深入的分析,在声学模型和后端处理方面都进行了有针对性地研究,建立了性能稳定的发音检错系统。本论文的具体工作和研究成果概述如下。首先,本文调研了发音错误自动检测技术,通过对该研究背景和现状的分析,选择了基于统计语音识别的策略作为发音错误检测的基本方法。在对基本的发音检错的系统进行介绍时,本文重点说明了系统中的错误检测度量得分算法。针对原有的错误检测度量得分算法在实际使用中的缺陷,本文提出了算法,其检错性能要明显好于原有算法。在对本文的实验数据库进行介绍时,分析了数据库上几个专家检错结果的一致性问题,了解了人工发音检错的性能,说明了发音检错自动任务的挑战性。其次,在声学模型的改进方面,本文提出了引入统计语音识别中的自适应技术,将该技术用于测试数据,减少测试数据与训练数据的不匹配,同时也应用于训练数据,以有效的估计出话者无关的规范模型。在对测试数据采用自适应技术时,本文引入了语音识别中成熟的算法。由于语音检错与语音识别的目标不一致,算法不一定能提高发音检错系统的性能。为此,本文针对发音检错的目标,提出了已的自适应技术;在对训练数据采用自适应技术时,本文引入了语音识别中的惴ǎ陨晒娣兜纳P停岣呒齑硇阅堋由于规范模型会导致其与测试数据更加不一致,因此需要把际鹾蚐技术结合使用,以有效的提高发音检错系统的性能。再次,在声学建模的改进方面,本文还提出了采用语音识别中的区分性训练的思想,针对性的设置与发音检错目标相一致的声学建模目标函数。通过回顾语音识别中的各种区分性训练的方法,本文说明了这些区分性训练的方法如何与语音识别的提高识别率的这个目标函数相一致。然后针对发音检错的任务,本文分析了该任务的目标函数以及与之对应的区分性训练的策略,提出了发音检错的区分性训练的方法要与错误检测度量得分算法相一致,并且提出在进行区分性训练时,训练数据库中除了正确发音的样本外,还需要错误发音的样本,否则区分性训练可能作用不明显。
知识水坝***@pologoogle为您整理
此外,除了声学建模的改进以外,本文还从发音检错的后端处理方面,提出了三维后端归一化的处理策略和基于机器学习的后端处理策略。首先,通过对专家打分和实验数据的分析,提出了要在说话人层次上引入说话人整体发音水平的特征:其次,通过对文本相关的后验概率的分析,提出了要在说话内容层次上引入音素类别的特征;再次,通过对系统使用中的干扰问题的分析,提出了要在说话时间层次引入前后文得分的特征。最后,通过引入这三个层次的特征,提出了三维后端归一化的处理策略,大幅度提高了系统性能。三维后端归一化的处理策略也有一些问题,比如多维特征的处理。为了解决这些问题,我们提出了更加可靠的基于机器学习的后端处理策略,通过创矶辔卣鞯挠呕最后,通过以上的研究工作,可以实现一个性能比较稳定的发音检错系统,在此基础上,本文提出了发音检错的声学模型自动更新策略,该策略能通过对未标注的原始数据的获得,针对错误发音样本进行处理,不断的提高发音检错系统的性能。首先,本文分析了错误检测度量生成算法,说明了对错误发音进行建模的必要性;接着通过对错误发音的特点和非监督的参数估计的分析,提出了几种错误发音建模的策略,其中错误发音半监督聚类建模的算法效果最好。进一步,通过已建立的性能比较可靠的检错系统以及错误发音建模算法,本文提出了发音检错的声学模型自动更新策略,能够处理未标注的原始数据,改进声学模型的建模空间,提高发音检错系统的性能。关键词:发音错误检测,统计语音识别,比例化对数后验概率,选择性最大似然线性回归,区分性训练,后端处理,机器学习,半监督聚类摘要
知识水坝***@pologoogle为您整理
鷒咖甒:,印,甧甌·.’.【,,.,.琲,
皁玡觚瓼筼,甒锄猺.,鷗籗,“也瓼也瑃膇瑃阛,畂王琹...甦’.猟.,;靍甧:.瓼,.,—.,.’,.:琒疕
常用英文缩写对照表啪篋锄磇,动态时间对齐矶品蚰P血,线性判别分析,支持向量机咚够旌夏P啵壤允笱楦怕,最大似然线性回归,自适应训练,区分性训练甈畲蠛笱楦怕,最小音素错误,支持向量机,计算机辅助语言学习篐:,矢量量化篠篏胀ɑ八讲馐篗,最大似然估计荚:印篠“,选择性最大似然线性回归篗钚》掷啻砦血【钚∶枋龀ざ茸荚:范德实蛊紫凳,最大似然估计:,最大互信息量估计钚⊙橹ご砦笞荚.,最小词错误篠篖狿篜:
功础傅铅绣蛤五辍辉耲日中国科学技术大学学位论文原创