文档介绍:沈阳理工大学
硕士学位论文
基于LabVIEW的文本无关说话人识别系统的设计与实现
姓名:杨洁
申请学位级别:硕士
专业:检测技术与自动化装置
指导教师:华宇宁
20070101
摘要对信号分析处理的基础上,利用虚拟仪器的软件平台——蚆嘟说话人识别是指通过说话人语音中携带的特征信息,对说话人身份进行自动识别的过程,它在许多领域内都有良好的应用前景。说话人识别可分为说话人辨认和说话人确认两类,本文主要是关于文本无关说话人辨认系统的研究与实现。本文详细阐述了文本无关说话人识别系统的基本原理,研究了识别过程中的特征提取、模型选择和判决规则等关键技术。同时,在“硬件的软件化”思想和合,开发设计了基于虚拟仪器技术的文本无关的说话人识别系统。本文从语音信号的实时采集开始,对语音信号进行滤波、预加重、端点检测等预处理,滤除了语音信号中的无声段,为语音特征参数的提取提供了有效的语音段,采用线性预测倒谱及其差分和美尔倒谱及其差分相结合的参数特征提取方法,实现了通过改进的矢量量化一隐马尔可夫算法来识别的说话人辨认系统。通过实验分析及其运行结果表明,本文实现的系统具有较高的识别率。同时由于本系统采用了虚拟仪器技术,系统的拓展性和可维护性较强,因此具有深远的研究价值和实际意义。关键词:说话人识别;虚拟仪器技术;线性预测倒谱及其差分;美尔倒谱及其差分;矢量量化一隐马尔可夫算法沈阳理工大学硕士学位论文
.;;;..’:.,痵沈阳理工大学硕士学位论文瓵—,,:.瑃甀.·,,“,瑄
售者∥;鞠■阳指导教师签名:佯半字期:,印学位论文作者签名:彳匆期:.:娜⒀硕士学位论文原创性声明沈阳理工大学学位论文版权使用授权书本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。加日何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要日期本学位论文作者完全了解沈阳理工大学有关保留、使用学位论文的规定,即:沈阳理工大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论文被查阅和借阅。本人授权沈阳理工大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ日
、快捷的手段。在高度发达的信息社会中,用数字化的方法进行语音的传送、储存、识别、合成、增强等是整个数字化通信网中最重要、最基本的组成部分之一S镆舸淼囊幌盗屑际跫捌溆τ已成为信息社会不可或缺的重要组成部分,如语音压缩编码、语音合成、语音识别等。语音压缩编码是压缩语音信号便于传输通信和保密,其目的是用尽可能低的比特率来获得尽可能高的合成语音质量。一方面压缩编码后可以在有限带宽的信道上传输多路语音提高信道的利用率,另一方面可以在窄带的模拟信道上传输数字语音。语音合成是模仿和代替人口的发音功能,也就是人们通常所说的让计算机说话,它实现了文字到语音的转换过程。当用各种方式输入文字信息时,计算机能将文字内容按照语言规则,转换成由基本音元组成的序列,按说话时音元连接的规则控制音元的序列,输出连续自然的声音。语音识别是语音合成的逆过程,通过模仿人耳的听觉功能将语音转化成等价的书面信息,也就是让计算机听懂人说话。可以分为特定说话人语音识别、多说话人语音识别和非特定说话人语音识别等,其应用很广。说话人识别是语音识别的一种,和语音识别一样,是通过对采集到的语音信号进行处理,然后据此做出判断。两者的不同之处在于说话人识别希望从语音中提取不同说话人的特征,并加以利用;而语音识别则力图减少不同说话人对于同一语音的差别。说话人识别是通过对说话人语音信号的分析和特征提取,确定说话人身份。说话人识别可以用于说话人身份未知、而说话人的身份问题又很重要的场合。主要的应用有:◆说话人核对:在电子商务和电话预约服务中,以用户的声音实现汇款、转账、
余额通知等;用特定人的声音实现机密场所的出入人员检查;用工厂职工的口令◆司法取证:判断犯罪时所记录的声音究竟是多个嫌疑犯中的那个的声音,有时可能嫌疑犯中不包括真正的罪犯,这时需要说话人辨别和说话人确认的有机结◆医学应用:使说话人识别系统只响应患者的命令,从而实现对患者假肢的控制等。◆声控电子密码锁:实时执行军事指挥官和飞机驾驶员的口述命令、只有有经验的操作人员才能进行的高精度控制等。说话人识别从具体应用的角度,可以分为两部分:说话人辨认祷叭巳啡9嗣家澹罢呤歉菀欢斡镆从说话人集合中找出最有可能的说话人,这