文档介绍:摘要说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人关注。本文的工作是围绕基于高斯混合模型的说话人识别系统展开研究,在完成多项基本性能的测试和比较的基础上,对特征提取、分类算法、识别统计中的某些环节进行一定的改进,以便获得较高的识别率。本文的工作主要有以下几个方面:低彻菇ǎ涸诟鲇镆舴侄魏褪侗鹇始扑阍虻幕∩希紫妊芯苛瞬煌试语音单位长度对识别率的影响情况,证明了这些原则的正确性和系统的可靠性;针对预处理过程中的预加重系数和加窗分帧帧长的选择进行实验,取得了预加重系数的最优值,以及在不同高斯混合模型阶数条件下的最佳帧长。阅苎芯浚涸谙嗤牟馐蕴跫拢芯苛薒、、这些主流基本特征的优劣,证明了这种充分模仿人耳听觉特性的特征对提高识别率的作用;在相同的测试条件下,研究了高斯混合模型的阶数对系统识别率的影响,分析了阶数过大或过小对系统的负面影响,并结合实际情况进行了选择;提出在算法的迭代过程中设置协方差阈值,并对不周阂值条件下的识别率进行实验对比,证明了将协方差阈值设置为钠帐市院涂尚行浴低掣慕憾越衔?煽康幕咎卣鱉懈慕氩罘值蛊赘拍畈⒍改进前后的特征进行实验,证明了这种综合考虑前后帧影响的差分特征的有效性;考虑到传统最大期望算法存在着会出现奇异阵的缺陷,引入参数口来控制修正比例对迭代结果进行修正,验证了改进算法在参数估计上的有效性;针对系统判别准则中常用的传统概率打分法,采用归一化投票和设置比例阈值的方法改进,验证了归一化改进的局限性和比例阈值改进的有效性。最后对本文工作进行了总结,同时对未来的研究工作进行了展望。关键词:说话人识别;高斯混合模型;特征提取;分类模型大连理工大学硕士学位论文
知识水坝***@pologoogle为您整理
.触..,閏口基于高斯混合模型的说话人识别系统的研究痵:..,.琇.,.
知识水坝***@pologoogle为您整理
篠,籊;大连理工大学硕士学位论文也甌琣——
髀研究的背景及意义别可能是最自然和最经济的方法之一——声音输入设备造价低廉,甚至无费用缁,随着生物学和信息学高度发展的世纪的来临,生物认证技术作为一种更加便捷、先进的信息安全技术开始在全球电子商务时代崭露头角。这是一种根据人体自身的生理特征纾褐肝啤⑹中巍⒘巢俊⒑缒ぁ⑹油ぁ⑵兜和行为特征纾荷簟⑶┟击键方式等词侗鹕矸莸募际酰羌庋А⒋ǜ屑际酢⒑焱馍韬图扑慊际跤谝身的第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求薄I锶现ぜ际醯尼绕鸬靡嬗谛藕偶觳庥氪怼⒛J绞侗稹⑷斯ぶ悄堋⒒学习等理论与技术的发展,由于它为身份识别提供了一个可靠的解决方案,其应用前景必定广阔,并能为构筑世纪基于自主研究开发的国家信息安全体系提供强有力的技近年来,在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术【俊S胗镆羰侗鸩煌氖牵祷叭耸侗利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,说话人识别除具有不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性闭:没接受程度高,由于不涉及隐私问题,用户无任何心理障碍;糜镆艚猩矸菔丽其他生物识别技术的输入设备往往造价昂贵;诨诘缧磐绲纳矸菔侗鹩τ中,如电话银行、电话炒股、电子购物等,与其他生物识别技术相比,说话人识别更为擅长和得天独厚。由于与其他生物识别技术相比,说话入识别具有更为简便、准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、控制等各方面,特别是基于电信网络的身份识别【。比尔·盖茨认为:“以人类生物特征肝啤⒂镆簟⒘诚竦进行身份验证的生物识别技术,在今后数年内将成为产业最为重要的技术革命。”.芯康南质狄庖术支持。大连理工大学硕士学位论文
早在年,英国国王查尔斯一世之死的侦破过程中,就利用了声音作为找出犯人的线索。年美国法院就第一次采用此方法进行取证。随着时代的进步,在世界范围内说话人识别技术正广泛应用于诸多领域。截止到去年初。∩惺羝舳锥危浞⒄箍间更为广阔,在金融、证券、社保、公安、军队及其他民用安全认证等行业和部门有者广泛的需求【俊D壳埃祷叭耸侗鹬饕Sτ迷谝韵录父龇矫妫裼昧煊目前,民用业务对用户所做的身份认证只