文档介绍:摘要随着语音处理技术和网络技术的飞速发展,基于球网络的说话人识别技术已成为将语音与口网络融合的一种重要应用。该技术可靠性高,操作简便,易被用户接受,在网络认证等方面有着相当广泛的应用前景。基于绲乃祷叭耸侗鹣低车恼肥侗鹇驶崾艿铰家艋肪场⒈尘霸肷传输信道及说话人说话方式等因素的影响。提高系统的鲁棒性,是本文的主要目标。本文对如何提高系统客户端、传输过程中及服务器端鲁棒性做了如下工作:分析了蛊赘鹘紫凳目乖胄阅埽玫礁呓紫凳乖胄越喜疃徒紫凳噪性较好的结论以便于对它们进行合理编码来突出抗噪性强的系数对识别系统的贡献;采取一种对蛊滋崛〉姆燃尤ㄋ惴ǎ沟孟低车男阅茉赟较低时得到较大的改善;提出只取每字前后〗惺侗鸬募瓤商岣呗嘲粜杂帜节省计算量的方法;估测带噪语音的≡馭大于某个门限值的语音段来提取参数,不仅可以提高系统性能还减少了流经网络的数据量;针对口网络中数据丢失这一现象,采用交织及丢失数据替代技术对丢失的语音数据进行补偿以提高系统的鲁棒性;研究了干净和带噪语音测试时间长短对系统识别率的影响,得到系统识别率基本随测试时间增加而上升但在测试时间大于秒时,带噪语音的识别率几乎不再随测试时间变化的结论:采用将注册用户分为男女两类,在识别时先判断测试音所属的类别再在该类中最终判断的基于说话人分类的识别方法,并用实验验证该方法确实改善了系统的性能。关键词高斯混合模型特征提取蛊分组丢失说话人识别说话人分类南京邮电学院硕士学位论文
知识水坝***@pologoogle为您整理
甌,,,甊甀,畐,,,,琣,..瑃
知识水坝***@pologoogle为您整理
第一章绪论帚一早三:⒄每个人在讲话时使用的发音器官——舌、牙齿、喉头、肺、鼻腔在尺寸和形态方近年来,随着缂际醯姆伤俜⒄梗嗣嵌酝绲睦貌辉倬窒抻谠缙的电子邮件、电子布告、全球浏览和文件传输等业务,多媒体通信与口网络的融合成为当前绲姆⒄骨魇浦弧@泌鐾缋创渖⑽摹⑼嫉榷嗝教信息是基于绲亩嗝教逋ㄐ乓滴竦暮诵摹甏笃冢贗缟戏⒄各种语音业务开始成为绶⒄沟囊桓鲅芯咳鹊恪S镆羰侨说囊恢稚硖卣鳎它不仅包含了说话人的语义信息,也包含了说话人的个性特征。利用携带有生理信息的说话人语音特征来对Ⅲ网络的用户进行身份认证,是将语音与缃合的一种重要应用。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,面差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音【俊S捎谟镆羯硖卣鞑幌罂诹罨蛘呙苈肽敲慈菀妆磺匀。祷叭耸别技术应用于网络也比较方便,基于Ⅲ网络的说话人识别技术作为一种理想的网络安全认证方式,有着相当广泛的应用前景;说话人识别又称声纹识别,这项技术的研究开始于世纪年代。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。实验室的渴南京邮电学院硕士学位论文
.祷叭耸侗鸬南肿观察语谱图进行识别,提出了“声纹”的概念。之后,电子技术和计算机技术的发展,使通过机器自动识别人的声音成为可能。实验室的岢隽嘶谀J狡ヅ浜透怕释臣品讲罘治龅纳剖侗鸱椒ǎ鹦藕处理领域许多学者的注意,形成了声纹识别研究的一个高潮,其间的工作主要集中在各种识别参数的提取、选择和实验上,并将倒谱和线性预测分析等方法应用于声纹识别。年代末至今,声纹识别的研究重点转向对各种声学参数的线性或非线性处理以及新的模式匹配方法上,如动态时间规整⒅鞣至糠治⒁矶煞蚰P虷和人工神经网络取H缃瘢剖侗鸺际跻逐渐走入实际应用,应用声纹识别技术研制出的智慧卡延用于自动提款机。欧洲电信联盟在电信与金融结合领域应用声纹识别技术,于年完成了计划,并于同年又启动了计划,在电信网上完成了声纹识别。同时,和等公司成立了联盟,希望实现电子交易的自助化,通过声音确定人的身份是此项目的重要组成部分。其他的一些商用系统还包括:Ⅱ镜腟镜腣、镜腟等。国内开展声纹识别研究比较早的机构有北京大学、中科院声学所、中科院自动化所、清华大学等,并先后得到了国家自然科学基金重大和重点项目、攀登计划等基金的支持,取得了丰硕的研究成果【俊在国际声学、语音和信号处理会议琁畚募校磕甓加泄赜谒祷叭耸侗鸬专题。目前这项技术的研究主要集中于如下几个方面:谟镆粼銮康乃祷叭耸侗鹣低车目乖胄匝芯俊D康氖翘岣呤侗鹣低城端预处理的抗噪声能力,提高输入信号的信噪比。常用的方法有减谱法、滤波法以及自相关处理抗噪法、利用复数帧段主分量特征的降噪方法等【。盗酚胧侗鹛跫黄ヅ涫比如不同的麦克风。