文档介绍:北京工商大学
硕士学位论文
基于核主成分分析与神经网络的文本无关说话人识别研究
姓名:周长锋
申请学位级别:硕士
专业:控制理论与控制工程
指导教师:韩力群
20070501
摘要关键词:说话人识别;核主成分分析;概率神经网络;模糊稻劾说话人识别是根据人特有的语音信号识别说话人身份的一种生物认证技术。说话人识别的关键技术包括两个方面:一是如何从数据量相当大的原始语音信号中提取出反映说话人声音特色的特征参数;二是如何设计识别能力强的分类器。本文对说话人识别系统的研究分别从特征提取与分类器设计两方面进行。对于特征参数的提取,在对目前存在的单一主流特征进行研究的基础上,对基于声道的线性预测倒谱系数和基于人耳听觉特性的德实蛊紫凳岸叩牟罘窒数进行了一系列特征组合研究,将研究结果应用于文本无关说话人识别,并对各种多参数组合特征进行了评价,通过计算机仿真实验,表明所采用的多参数组合特征有利于改善识别效果。为了降低组合特征的维数、缩短训练和识别时间,提高系统识别效率,研究了主成分分析和核主成分分析的最优降维性质在文本无关说话人识别中的应用。核主成分分析方法采用非线性方法提取主成分,是主成分分析的改进算法。本文提出了利用核主成分分析选择合适的核函数在高维空间提取组合特征主成分的方法,各组合特征经过核主成分分析降维,损失的特征信息最少,在保证识别性能的同时,后续阶段的计算开销将会大大减少。实验结果表明,核主成分分析不仅实现了合理降维,而且能取得比传统主成分分析更好的识别性能。对于分类器的设计,主要应用人工神经网络技术,设计了基于概率神经网络的说话人识别系统。针对概率神经网络训练样本的数目比较大时,存在的内存需求巨大和运算时间较长的问题,将模糊稻劾嗨惴ㄒ敫怕噬窬绶掷嗥鳌H诤狭秸的优点,提出了基于模糊稻劾嗟母怕噬窬缢祷叭耸侗鹣低场J笛榻峁示该系统具有较好的识别性能。北京荷檀笱妒垦宦畚
.:;籪..,.琣琤瓵甌
学位论文作者张监雌魄砷年易月导师签名:象查蔓至日期:≯舻日集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,北京工商大学学位论文原创性声明本人郑重声明:所呈交的学位论文是本人在导师指导下进行的研究工作所取得的研究成果。除了文中已经注明引用的内容外,论文中不包含其他个人或均已在文中以明确方式标明。本声明的法律后果完全由本人承担。北京工商大学学位论文授权使用声明本人完全了解北京工商大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京工商大学。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑学位论文电子版同意提交后,可于口当年口一年口二年后在学校图书馆网站上发布,供校内师生浏览。学位论文作者签名:
竞椭鞒煞址治觥第滦髀研究背景与现状在生物学和信息科学高度发展的今天,生物认证技术作为一种便捷、先进的信息安全技术开始在全球电子商务时代崭露头角。这是一种根据人体自身的生理特征纹、手形、脸部、虹膜、视网膜、气味等托形L卣声音、签名、击键方式等词别身份的技术。它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。在信号检测与处理、模式识别、人工智能、机器学习等理论与技术迅速发展的推动下,不久的将来,生物认证技术必将进入一个光辉的时代。语音,作为信息交流的最自然、最有效、最方便的途径,近年来,在生物认证技术领域中越来越受到研究者的关注【”,而说话人识别则被认为是最自然的利用语音特征进行身份鉴别的方式。说话人识别【康难芯渴加兰甏T缙诘墓ぷ髦饕<性谌硕媸笛和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。年,实验室的甂通过目视观察语谱图行说话人识别,提出了“声纹”的概念,意指与指纹嗬唷V螅一些学者对基于声纹的说话人识别进行的深入研究却得到了不同的结果,说明声纹技术并不可靠,主要原因在于语谱图易受语音环境和说话人状态的影响。这段时间的研究主要集中在寻找人通过语音来识别说话人的感知机理,以利于机器仿真。随着计算机及电子技术的发展,说话人识别的研究重点转向对各种声学参数的线性或非线性处理以及新的模式匹配方法上。年代后,动态时间规划褪噶苛炕,际醣挥τ玫剿祷叭耸读韑:来,使说话人识别的性能得到了大幅度的提高。年代以来,隐马尔可夫模型多特征组合等技术,在语音识别领域中得到了成功和广泛的应用,并且成为说话人识别的核心技术。进入年代后,特别是年愿咚够旌夏P