文档介绍:摘要的各个行业、各个方面。对于应用十分广泛的孤立词语音识别系统,怎样更通对非特定人情况,识别性能急剧下降。丰要问题是由于非特定人之间的差异造种人的语音。这就说明人的大脑可以进行一些归一化过程,去除语音个性化的的处理,实验证明这种方法能有效地提高孤立词识别系统的识别率。唇兴祷叭斯橐换蔽A四芄欢圆煌祷叭私懈既犯焖随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。语音识别技术开发的产品,应用领域非常广泛,几乎深入到了社会用,快速地适应各类人群的语音识别系统成为语音识别的研究关键。九十年代以来,大规模词汇的特定人的连续语音识别取得了很大进展,但成的。说话人语音的差异,主要来源于说话人的发音生理结构的差异。但是尽管说话人的差异很大,人却可以很轻松的理解不同口音和性别的各特征。说话人归一化技术的思想就是源于人的识别过程,说话人归一化目的是建立一个归一化的说话人空间,使得任何人的语音可以映射其中。在语音识别系统中,大多前期处理提取的都是声道参数,因此对说话人的归一化丰要集中于归一化说话人声道长度的差异。一般而言,精确的归一化函数是保证归一化效果的前提,但过于复杂的方法,计算量就大,对实际应用场合是不适用的。因此为了简化处理,常采用统一的归一化函数来进行处理,但这种方法与实际语音统计结果并不相符。因此本文提出用说话人转换中的动态频率规整的方法实现说话人语音的归一化,这种方法避免了单一的归一化函数另一方面,以往的说话人归一化技术关注于对声道响应的差异的归一化,但近期的研究证明,声门共鸣也同样影响着说话人的频谱特性。因此本文进一步提取鲁棒性能和抗噪性能优于参数的感知最小方差无失真参数地感知折叠变换,本文提出采用基于下声门/声道非线性耦合作用的第二声门共鸣频率来估算感知折叠因子,与采用第三共振峰的估算方法比较,它能滤除语义信息的影响,更好地体现说话人的个性特征。具体应用时,本文首先提取语音的频谱包络求出第二声门共鸣频率,并由此估算感知折叠因子,然后4笱渡涎宦畚孤立训识别乃祷叭斯橐换际
知识水坝***@pologoogle为您整理
关键词:孤立词识别,声道长度归一化,动态频率规整,声门共鸣,感知最小方差无失真参数利用所得到的折叠因子对感知最小方差无失真参数进行归一化,最后将归一化的参数用来进行语音模型训练与识别。实验证明,这种方法能够有效地提高非特定人的语音识别系统的识别率。最后,本文通过具体的实验对影响系统识别性能的因素进行深入的分析,并加以总结和归纳,并指出今后努力的方向。上海大学硕十学位论文孤寺词识别乃祷叭斯化技术
知识水坝***@pologoogle为您整理
,.琣瑃琒瑃,瓽,甀4笱:学位论文孤立词识别叶乃祷叭斯橐灰换际琧..,;琲猠琤甋痶
.,:;瓵琍上海大学硕十学位论文孤立词识别中的说话人归‘—甌琕,
签名:埤日期:率腿日期:驾:浩原创性声明本论文使用授权说明C艿穆畚脑诮饷芎笥ψ袷卮斯娑本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容。
第一章绪论课题来源课题研究的背景与意义从统计的角度来看,非特定人对语音识别系统的影响可以体现在两个方面【浚⒁粝肮卟钜煊胄睦碜刺钜欤好扛鋈硕加凶约旱姆⒁粝肮撸祷翱炻埠本课题来源于教委项目,基于词分割的语种辨识系统钅勘嗪牛语音是最为方便、快捷、自然的人际交流方式,采用语音作为人与计算机交互的手段,使计算机能像人一样,具有听、说和理解的能力,是计算机得以真正普及的基础,在其中所需的各种技术中,以语音识别技术最具挑战性。近年来,孤立词语音识别技术的研究取得了很大的进展,在某些领域中已经有了这种智能化的人机交互系统。然而在实际应用中,实验室“成功”的语音识别系统,在灵活性和自适应方面上还远远不能满足实际的需求,这一点在非特定人系统中体现得尤为突出。首先,由于说话人差异的存在,导致非特定人胨祷叭宋薰兀琒卣骺占涞姆植祭肷⒍群筒煌V涞幕斓却笥谔囟ㄈ讼低与说话人相关,琒特征空间;其次,说话人之间的差异会导致训练集和测试集出现严重的模型不匹配。说话人语音之间的差异包括以下几点【浚镆粞系牟钜欤河捎诜窖缘拇嬖冢煌祷叭硕杂谕痪浠暗姆⒁艨赡苡很大差别。汉语是一种多方言语种,所以方言口音对汉语语音识别系统造成严重的影响;砩系牟钜欤杭词谷嗣遣捎帽曜嫉钠胀ɑ埃煌祷叭说纳佬巫矗特征等存在差别,都会造成语音频谱特性的不同;不一样,说话时的心情也不一样,这些习惯和心理状态都会造成当时说