文档介绍:独创性(或创新性)声明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的
研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文
中不包含其他人已经发表或撰写过的研究成果;也不包含为获得桂林电子工业学
院或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究
所做的任何贡献均已在论文中做了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。
本人签名: 日期:
关于论文使用授权的说明
本人完全了解桂林电子工业学院有关保留和使用学位论文的规定,即:
研究生在校攻读学位期间论文工作的知识产权单位属桂林电子工业学院。本人保
证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为桂林电子工业学
院。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文
的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密
的论文在解密后遵守此规定)
本学位论文属于保密在年解密后适用本授权书。
本人签名: 日期:
导师签名: 日期:
万方数据
摘要
摘要
人的语音虽然具有独立性,但也是可以被模仿。模仿者蓄意模仿说话人的声音,
当相似度较高或几乎相同时,当前的身份确认系统有可能会被模仿者欺骗。语音模仿
技术的出现就给当前的信息安全带来威胁,这就使得有必要加强当前说话人识别系统
的安全性,开展反模仿技术的研究。本文详细介绍了基于动态阈值的说话人反模仿系
统。
文中首先介绍了常用语音特征参数,并使用了一种新的方法来实时提取语音特
征;接着介绍了说话人识别方面的基本概念、原理以及当前的研究现状,并简单介绍
了当前流行的说话人识别方法。
要实现反蓄意模仿,理想状态就是要让说话人确认系统的错误接受率为零。而本
文所进行的基于矢量量化以及高斯混合模型的说话人识别的实验都证明:当说话人确
认系统的错误接受率为零时,其错误拒绝率极高使得系统几乎不可用。传统的确认方
法受到阈值的影响不能满足反模仿的要求。而基于动态阈值的说话人确认方法利用当
前说话人辨认的性能已经非常好的特点,将说话人辨认的策略融入到说话人确认当中
来,无需设置阈值,具有较强的判断冒名顶替者的能力,同时系统的错误拒绝率依然
保持在可用的水平。该方法通过建立一个综合了多个说话人语音特性的非特定说话人
模型,使其能够对于不同的待确认语音给出不同的判决阈值,从而解决了说话人确认
在判决阈值设置上存在的困难,提高了系统的自适应性。为了使新的判别策略适用于
实际开放的应用环境,在现有的 N 个说话人模型之外附加一个全局说话人模型,这
个模型训练所使用的数据是所有参考说话人的训练数据。于是,在改进的判别策略中
一共有 N+1 个说话人模型,其中全局说话人模型代表了多个说话人的共同特征。
为了验证系统,特意创建了模仿者的语音库,并以此进行训练、测试。实验结果
证明了本文所提出方法的有效性以及实用性,很好的克服了传统方法的局限性。
本文最后给出了研究结论,并指出了不足之处,给出了未来的研究方向。
关键词:语音模仿;反模仿;说话人识别;说话人确认;矢量量化;高斯混合模型
I
万方数据
Abstract
Abstract
Although the speech of humans is unique, it’s also could be the
mockers imitate some speaker intentionally and similarly, current speaker recognition
system may be deceived to accept them falsely. The appearance of speech-imtating gives
the current information security to bring the it is necessary to strengthen the
current speaker recognition system, and develop the counter-imitation technology research.
This article first introduces monly used speech parameters and creats one n