文档介绍:话人识别鲁棒性增强研究摘要说话人识别又称声纹识别,是语音信号处理中的重要组成部分,是当前的研究热点之一。说话人识别技术即是一种基于说话人的声音鉴权说话人身份的技术。本文介绍了说话人识别系统的基本原理和研究现状,着重就如何提高与文本无关的说话人识别系统的鲁棒性展开深入研究。本课题对目前主流的高斯混合模型和支撑向量机两大系统进行了详细的讨论,并从特征域、模型域、得分域等不同角度对说话人识别鲁棒性增强技术进行了系统的探讨,并在此基础上提出了基于高斯混合模型超矢量的支撑向量机系统及其测试得分归一化,提出了基于交叉相似度测量的说话人自适应的得分归一化和对称得分技术。本课题在剑桥开发的开源的镆羰侗鸸ぞ呋∩瞎菇ㄋ祷叭耸别确认系统,系统最终采用高斯混合模型超矢量的基于广义线性内核的支撑向量机系统,选用感知线性预测静态及动态参数、瞬ā⑻征补偿及变换、自适应模型、得分归一化、噪声因子消除等技术。通过多种说话人识别鲁棒性增强技术结合运用,课题整体系统取得了良好的识别性能,已达到美前列。本课题研究主要针对电话信道和麦克风信道下的说话人识别确认系统,但本课题所涉及的许多技术及思想对于其他条件下的说话人确认系统、说话人辨认系统、乃至语音识别系统都有参考、借鉴及应用价值。关键词:说话人识别文本无关高斯混合模型超矢量支撑向量机交叉相似度测量鲁棒性增强
知识水坝***@pologoogle为您整理
.,琣..,—琭,,,.瑃猳
知识水坝***@pologoogle为您整理
簊,—珿琧...畇
日期:鱼盗盈堕旦醐:母相瑚蹲本人签名:查型日期:四筮鱼坚旦/生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国保密论文注释:本学位论文属于保密在—年解密后适用本授权书。非保密论文注或创新性本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究膊话;竦帽本┯实绱笱Щ蚱渌逃沟难或证书而使用过的材料。与我。⒐ぷ鞯耐径员狙芯克龅娜魏喂毕拙言诼畚闹作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑释:本学位论文不属于保密范围,适用本授权书。本人签名:导师签名:、
第一章绪论研究背景倒谱和线性预测分析等方法应用于说话人识别。年代末至今,说话人识别的研究随着科学技术的迅猛发展,信息化的不断深入,计算机、网络已渐渐改变了世界、国家、个人的生存和生活方式。与此同时,对于计算机、网络日益增加的、极其紧密的依赖唤起了对于安全性的呼声一浪高过一浪。随着科学技术的发展,越来越多的生物特征信号以其唯一性、永久性、理论上极高的防伪能力被应用于各种生物识别系统中。在这些生物特征中,目前应用最广的有指纹、声音、虹膜和人脸等。此外,可用的生物特征还有视网膜、气味、血管纹路、⑶┟⒉教⒍蔚鹊取I糇为一种引人注目的生物特征,有以下两个优势:首先,声音是一种人们自然发出的信号,其采集不会对人体带来任何伤害,消除了人们的顾虑;有些应用缁诘缁暗引用校镆羰侵饕5耐ㄐ琶街剩蚨没Р换岣械教峁┯镆羰菔且桓隼圩傅墓程。其次,语音的采集非常方便,对于基于电话的应用,公用电话系统提供了几乎到处存在的电话网络采集并传送语音信号,不需要专门的采集设备和传送语音的网络;即便不是基于电话的应用,也只需要声卡和麦克风即可,代价低廉。基于声音的生物特征识别称为说话人识别,也叫声纹识别,是基于说话人的声音鉴权说话人身份的技术。说话人识别按识别任务可以分为两类:说话人辩认退祷叭巳啡G罢哂以判断某段语音是若干人中的哪一个人所说的,是“多选一侍猓欢笳哂靡匀范某段语音是否是声言的某个说话人所说的,是“一对一’’的判别问题。对说话人识别的研究始于世纪年代。早期工作主要集中在人耳听辨和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。实验室的瓽渴庸鄄煊锲淄冀惺侗穑岢觥吧母拍睢V螅缱蛹际鹾图扑慊际醯姆⒄梗雇ü髯远别人的声音成为可能。实验室的甈提出了基于模式匹配和概率统计方差分析的说话入识别方法,引起信号处理领域许多学者的注意,形成了说话人识别研究的高潮,其间的工作主要集中在各种识别参数的提取、选择和实验上,并将重点转向对各种声学参数的线性或非线性处理以及新的模式匹配方法上,如动态时间北京邮电大学硕士研究生学位论文
可行性分析口,