文档介绍:摘要说话人识别最常采用的是固定帧长、帧移的声学参数,这种算法中清音和浊够取得与对数似然度算法相近的识别率,而且可以与对数似然度算法的得分融面改进支持向量机说话人识别系统。提出了将优化后的木怠⑷ㄖ囟信道一直是影响说话人识别的最大因素,由于通信线路的复杂性以及话筒的多样性,会对原始的语音产生偏移,因此会导致识别性能的急剧下降。针对信道采用特征映射的方法将前端特征参数的信道信息去除,将因子分析仅仅限制在前关键词:说话人识别,混合高斯模型,超矢量,因子分析,扰动属性投影本论文研究的是复杂信道情况下的与文本无关的说话人识别问题。本论文的目标是在保证实时实现的基础上尽量提高识别率,在这篇论文中,从前端特征抽取,P拖碌牟馐缘梅郑С窒蛄炕低诚碌奶卣鞑问⒄貉选取,信道空『白兰频雀鞲龇矫嬲关⒘搜芯浚岢隽艘幌盗行滤惴ǎ⑶一竦昧实验的证明,主要集中在以下几个方面:音是同等对待的。由于清音是一种类白噪声的信号,而浊音是一种准周期的信号,反应的是说话人声道变化的情况,浊音包含有更多的说话人信息。因此,在本文中求取特征参数时不固定帧长,对浊音进行适当的加权处理。通过动念的参数处理,相对于固定帧长的参数等错误率有%左右的下降。说话人识别的主流算法是混合高斯模型,在测试的时候,采用的是求对数似然度的方法,本文另外提出一种采用模型距离头角的判决算法,这种算法不仅能合,将说话人识别的等错误率降低%%。最近几年,支持向量机在说话人识别中取得了突破性的进展。本文中从三方作为区分性模型的特征矢量,优于传统的只将均值作为特征矢量的系统,相对于基线系统性能有%以上的提升。将模型距离和央角作为支持向量机的输入参数并将其与参数结合。针对『貉镜钠胶馕侍庖蔡岢龌谀P途嗬牒采用支持向量机去挑选合适的负例,采用切分的方法增加正例。的影响,本文提出三种方法在均值超矢量空间估计信道空『白翰捎肊惴ā⒅成分分析的算法和与岷系腜分析的算法,在估计出信道空间之后再通过特征映射的方法去除信道的影响,去除信道信息的系统相对于基线系统在等错误率上最多有%以上的下降。因子分析是解决目前信道问题的最有效算法之一,本文将相关系数的与因子分析相结合,从而将因子分析的复杂度大大降低。在估计出信道空『日螅端处理参数,保留了耐暾蚣埽蟠蠼档土思扑懔浚却砦舐可以降低将近%。另一方面。将因子分析与支持向量机相结合。可以取得比购玫男Ч中田科学技术人学博学位论义摘爱
知识水坝***@pologoogle为您整理
.畉;甌瓼,甀;畁%%.%琣中国科学技术人学博学位论义—,:,,,’.摘舞¨
知识水坝***@pologoogle为您整理
甌..:篍琍%瑃猆%..甋甇,珿瑂,摘要
洳中国科学技术大学学位论文原创性和授权使用声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。本人授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密的学位论文在解密后也遵守此规定。作者签名:
第一章绪论说话人识别的应用趣的信息,语音识别分为若干研究方向,主要有语义识别、语种识别以及说话人是从输入的语音信号中寻找说话人表达的语义内容信息;语种识别则专注于在不语音信号中的语义内容,而是希望从语音信号中提取出代表个人身份的特征,识唯有自动说话人识别、语种识别的性能在某些条件下可以与人类的能力相当,甚说话人识别的应用有一些缺点,比如同一个人的声音具有易变性,易受身体比如环境噪音对识别有干扰;又比如混合说话人的情形下人的声纹特征不易提成,因此使用者的接受程度也高:袢∮镆舻氖侗鸪杀镜土褂眉虻ィ认,只需要一个麦克风或电话、手机就可以通过网路ㄑ锻缁蚧チM实现远程登录;祷叭吮嫒虾腿啡系乃惴ǜ丛佣鹊停弦恍┢渌胧缤ü政府匾>卵芯炕梗禄氐耐ㄑ督凶远镆艏嗫兀道,、、鹊取S镆迨侗鹁褪且话憬驳挠镆羰侗穑簿同人说的不同语义的语音信号中挖掘出隐含的语种信息:而说话人识别并不注重别出说话入的身份。在图像、语音识别等模仿人类机能的模式识别领域中【至超过人类【】。状况、年龄、情绪等的影响;比如不同的麦克风和通信信道对识别性能有影响;取:⋯⋯等等。尽管如此,与其他生物特征相比,说话人识别的应用有一些特殊的优势:毯铺卣鞯挠镆艋窆⒎奖恪⒆匀唬铺崛】稍诓恢2痪踔型个麦克风即可,在使用通