文档介绍:中国科学技术大学
硕士学位论文
基于分类特征映射和SVM的说话人确认方法研究
姓名:贺庆玮
申请学位级别:硕士
专业:电路与系统
指导教师:李辉
20090501
摘要随着通信与计算机技术的发展,使用电话、手机等工具进行交流的用户不断增多,电话语音也在人们的生活中占有越来越重要的地位。使用电话语音来进行而,将目前常用的短时倒谱参数用于文本无关的说话人确认需要较多的语音数据,将魑K祷叭四P褪苯ɑ嵊龅酱笱盗费尽⒘嚼嗍莼斓现本文主要针对糜谖谋疚薰厮祷叭巳啡现写嬖诘奈侍猓允褂锰卣骺间分类和兴祷叭颂卣饔成涞姆椒ń辛搜芯浚⑶叶許的建模方法进行了探讨。主要研究内容如下:针对采用⑺,并提取代表说话人个性信息的特征能够更加精细地描述说话人参数统计特性。本文针对基于的特征空不同旌隙鹊那榭鱿陆辛朔治觥J笛楸砻鳎和ü掷嗵卣饔成关键词:说话人确认特征映射说话人身份鉴别具有方便快捷等诸多优点,其技术在金融、商贸、公安、军事等领域具有广阔的应用前景。其中,文本无关的说话人确认不需要说话人的语义配合,其应用范围更加广阔,实用性更强。近年来,支持向量机捎谄渚哂星壳帜芰Γ绕涫屎辖饩隼嗨于说话人确认这样的二元分类问题,因而成为模式识别领域的一个研究热点。然等问题,使慕C媪僮叛盗沸实拖隆矢量。,提升了掷嘟缑娴那中阅堋M保掷嘧涌占渲械腉间划分方法和基于基因周期的特征空间划分方法,在不同子空间个数、和子系统评分融合,.甋系统相对于甎系统,档土%;.,
甌.,琤琾,甒,瑆琣猆..,.,.瑃,琧’..,—,.’甀.
簊—.猻,%.琭瑂珿,
签字日期:三堑皿凇岔彩中国科学技术大学学位论文原创性声明中国科学技术大学学位论文授权使用声明口保密!D本人声明所呈交的学位论文,足本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:签宁日期:作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复偷缱影妫市砺畚谋徊樵暮徒柙模梢越宦畚谋嗳胗泄厥库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。导师签名:签字日期:口公开
第一章绪论说话人识别概述实现人和智能设备之间进行畅通的语音交流,是近几十年来人们不断追求的一个目标,自动语音识别是实现这一目标的关键性技术。自动语音识别是从语音用前景,世界上很多国家和地区的大学、研究机构以及一些著名的大公司长期以来都投入了巨大的人力和财力来进行语音识别领域的各项研究。自动说话人识别技术是语音识别技术的一个重要分支,它是高效的人机交互、身份认证以及信息检索手段,对终端设备要求简单恍枰P阅芰己玫穆罂入控制、电话语音交易的身份认证、公安司法、军事上的电话语音监听、网络资源准入、金融证券安全,以及一些个人设施如手机、母鲂曰柚玫鹊取泛地应用于“数字化图书馆”中的语音检索以及信息获取目前这方面的研究正在深入地进行。自动说话人识别技术的研究始于年代。近多年来,在这一领域的研究取得了重大进展,商用系统已经在若干领域得到了一定应用。年,实提出了使用语图仪娉龅挠锲淄兴祷叭耸侗鸬姆椒╗俊S锲淄贾惫勖髁耍╢练的人可以直接看出不同话者之间语谱图的差别,但是,语谱图难以量化描述,计算机而不是非要专业训练的人才能进行这项工作。年技术用于说话人的识别,得到了较好的结果【俊甏珺和热颂岢鼋咝栽げ獗嗦考察了线性预测倒谱系数信号中提取我们所感兴趣的各种信息或者语音的性质,如语义内容、传输通道特征、语言种类以及说话人身份等等的一种技术。自动语音识别开始于世纪年代【浚两褚丫嗄甑睦罚谕ㄐ拧⒐赖戎疃嗔煊蛴凶殴憷ǖ挠风即可工作侗鹇史浅8撸谕枷瘛⒂镆羰侗鸬饶7氯死嗷苤校ㄓ凶远说话人识别的性能在某些情况下与人类的能力相当,甚至于超过人类】】。因此,自动说话人识别可以应用于计算机和计算机网络的使用、一些关键部门的出随着互联网的蓬勃发展以及网络资源的“爆炸式”增长,自动说话人识别也可以广验室的瓽无法直接使用语谱图进行说话人识别。十九世纪六十年代,数字信号处理技术开始用于语音识别领域,其意义在于可以直接用计算机进行语义和说话人的识别,首先将