文档介绍:南京理工大学
硕士学位论文
基于文本无关的说话人识别技术研究
姓名:蒋晔
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:唐振民
20080601
摘要关键词:说话人识别,矢量量化,高斯混合模型,特征提取本文的工作是围绕构建一个文本无关的说话人识别系统展开的。主要研究语音的预处理、特征提取、说话人模型建立以及判决策略。并实现了基于矢量量化珿乃祷叭耸侗鹣低场本文的工作主要有以下几方面:在语音信号预处理方面,对语音信号进行的采样,炕缓蠼性ぜ在特征提取方面,本文提取了语音信号的线性预测系数⑾咝栽げ獾蛊紫凳和德实蛊紫凳⒃贕系统下比较它们的优劣,实验结果表明:最优,次之,畈睢在识别模型方面,本文主要介绍模型、隐马尔可夫模型和P汀2⒍訴虶进行了测试,分别进行了说话人辨认和说话人确认实验。实验结果表明:无论是说话人辨认还是说话人确认,P偷氖侗鹦阅要优于。针对P徒凶胖匮芯浚芯苛烁咚够旌夏P偷慕资韵低呈侗鹇实挠跋欤分析了阶数过大或过小对系统的负面影响,并结合实际情况进行了选择;提出在算法的迭代过程中设置协方差阈值,并对不同阈值条件下的识别率进行实验对比,证明了将协方差阈值设置为的普遍性和可行性;针对一般初始化参数方法提出了分裂法和稻劾嘞嘟岷系姆椒ǎ笛橹っ鞲慕蟮姆椒苡行岣呤侗鹇省最后对本文工作进行了总结,同时对未来的研究工作进行了展望。,透咚够旌夏P重、分帧处理、加汉明窗。硕士论文基于文本无关的说话人识别技术研究
,疭,璐.、、簅,瑃甋瑃,,甌,;,籔硕士论文瑃琣琕.Ⅱ
研究生龆诿酶声学位论文使用授权声明明本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献蠖南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅于保密论文,按保密的有关规定和程序处理。本学位论文是我在导师的指导下取得的研究成果,尽我所知,在表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学已在论文中作了明确的说明。研究生签名:年月或上网公布本学位论文的全部或部分内容,可以向有关部门或机构趋交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。灵年月日日
髀背景及意义信息产业中极为重要的前沿技术。生物识别技术具有丕置要记忆、不会遗忘、使用方便语音是人类的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这使得通过分析语音信号来识别说话人成为可能。最初人们是通过人耳来辨别语音的说话人身份,即“闻声识人”。随着计算机的出现和电子信息技术的发展,出现了用计算机自动识别语音的话者身份的技术,即说话人识别技术。也称为声纹识别或话者识别。它属于生物特征识别技术的一种。说话人识别技术与语音识别技术有许多相似之处,都是在提取原始信号中某些特征参数的基础上,建立相应的参考模板或模型,然后按照一定的判决规则进行识别。但由于它们的识别目的不同,在处理策略上存在着实质性差异。语音识别主要提取语音信号中包含的语义信息,应尽可能的将不同人说话人的差异归一化;而说话人识别技术力求挖掘出包含在语音信号中的说话人的个性因素,强调不同人之间的特征差异。本章的内容安排如下:首先对说话人识别技术的背景和意义做简要介绍,并且重点介绍说话人识别技术的主要应用领域,然后综述了说话人识别在国内外的发展和研究现状。最后探讨一下说话人识别技术的研究重点及难点。以人类生物特征肝啤⑸啤⑷肆车进行身份验证的生物识别技术,正逐渐成为等优点。其中,说话人识别还具有以下特性:没Ы邮艹潭雀撸捎诓簧婕耙轿侍猓没奕魏涡睦碚习糜镆艚猩矸菔侗鹂赡苁亲钭匀缓妥罹玫姆椒ㄖ唬羰淙肷璞冈旒低廉,而其他生物识别技术的输入设备往往造价昂贵。屎显冻躺矸萑啡稀T诮性冻躺矸萑啡鲜蔽薹ɑ袢∑渌锾卣魇保恍要一个麦克风或电话、手机就可以通过网络进行基于说话人语音的身份认证。祷叭耸侗鹂梢栽谟没Р恢2痪醯那榭鱿峦瓿缮矸菔侗穑哂幸涡匀现さ奶祷叭耸侗鹂梢晕匏辉冢奘辈豢伞4蟠筇岣呤侗鸬目刹僮餍浴正因为说话人识别具备简单、方便、准确、经济及可扩展性良好等诸多优势,具有广阔的应用前景,几乎遍及人们日常生活的各个角落。包括:民用的个性化服务、银行和证券、公安和司法、军队和国防、保安和证件防伪等各个方面。研究高性能的说话入性。基于文本无关的说话人识别技术研究硕士论文
应用领域说话人识别技术的发展与现状识别系统,有重要的实际意义。说话人识别的主要应用领域,包括:糜谝小⒅と低随着电话银行、远程炒股等业务的不断增加,这些业务对用户所做的身份论证只是采用密码方式,其安全性令人担忧。如果采用说话人确认技术并结合原来的密码,可安全有效地实现用户身份的确认,大大提高了操作的安全性。现在人们越来越多地依赖于口令和密码,随着不