1 / 54
文档名称:

稳健语音特征和音频场景识别方法的研究(可复制论文).pdf

格式:pdf   页数:54
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

稳健语音特征和音频场景识别方法的研究(可复制论文).pdf

上传人:mkt365 2013/11/5 文件大小:0 KB

下载得到文件列表

稳健语音特征和音频场景识别方法的研究(可复制论文).pdf

文档介绍

文档介绍:征子集。采用删分类器对选取的特征子集进行评估,对比不同Ⅳ值对应的系统识别率,摘要音频信号含有丰富的信息,并具有非接触性、自然性和采集设备成本低的优势,使得音频信号识别技术在实现人机交互和各种电子产品智能方面具有很好的应用前景。实际应用中,说话人语音不可避免地会受到开放环境的影响,从而降低说话人识别的准确率。稳健语音特征提取算法能有效降低噪声对说话人语音特性的影响,提高说话人系统的分类性能,因而受到广泛关注。作为音频信号识别技术的另一个分支一音频场景识别技术,可以使各类设备根据音频信息自动地感知环境特征,具有听觉智能性。当前,音频场景识别的问题已成为一个研究热点。在前人研究工作的基础上,本文对说话人识别中的稳健语音特征提取方法、音频场景识别中的特征选择方法和模型优化方法进行了研究,具体包括:芯苛艘恢只谧钚》讲钗奘д嫦煊透兄L匦缘牡蛊滋卣魈崛》椒āW魑梅尔频率倒谱系数的一种改进算法,该方法能有效解决梅尔频率倒谱参数在混有背景噪声的语音条件下系统分类性能下降的问题,从而提高了识别系统的稳健性。鲆恢只诰植颗斜鸹奶卣餮≡穹椒ā8梅椒ú捎昧礁雠斜鹱荚蚨蕴卣向量在类间的区分能力进行评估,按判别值大小进行排序,选取前Ⅳ鎏卣飨蛄孔槌商把最高识别率对应的Ⅳ值作为最佳经验值。在模型训练和识别过程中,能够在线选取音频样本的特征子集。本文把基于局部判别基的特征选择算法应用于音频场景识别系统,通过对比实验表明,该方法能有效地提高系统的分类性能。芯苛艘恢只谥С窒蛄炕囊矶煞蚰P陀呕椒āU攵砸矶煞蚰型在训练类的参数时不具有判别力的问题,进行了改进。在改进方法中,首先训练连续隐马尔可夫模型参数,使用支持向量机对参数进行判别性训练,然后用训练得到的支持向量对原始模型参数重新估值,得到新的模型参数。通过改进方法与隐马尔可夫模型的对比实验,表明改进方法在~定程度上提高了音频场景识别系统的分类性能,实现了对隐马尔可夫模型的优化。关键词:稳健语音特征;特征选择;局部判别基;隐马尔可夫模型;支持向量机大连理工大学硕士学位论文
知识水坝***@pologoogle为您整理
刎哪踖膔咖甄嘶,觚恤韈阻皿猙羣朗砷Ⅱ.瓻大连理工大学硕士学位论文,,.瞖仃也瞐也゛猚一,..,:甤一
知识水坝***@pologoogle为您整理
篟甿:.::篠——
大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:作者签名:
学位论姗:一竺塑丝兰坐鲨兰璺导师签名:鲨墨盟垄坠垒日期:二滥辍弧圃铝日年—兰月大连理工大学学位论文版权使用授权书本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、日期:型本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将缩印、或扫描等复制手段保存和汇编本学位论文。作者签名:大连理工大学硕士学位论文
算法有短时平均能量或振幅【⒐,,⒐舱穹濉髀基因周则,⑾咝栽げ庀凳稳健语音特征发展概况程。随着第一台计算机某鱿郑约叭斯ぶ悄堋⒛J绞侗稹⒂镆粜藕糯砑际醯兴起与发展,计算机对音频信号的识别能力成为实现计算机智能化的核心问题之一,并成为广泛关注的研究热点。目前,基于纯净语音的说话人识别研究已经发展到相当成熟的阶段,但在开放式环境中,识别率却大幅度下降。提取具有稳健性和较强区分能力的特征向量是解决这一问音频包含与场景相关的丰富信息,使基于音频的场景识别成为可能【ΑR羝党【笆别是一种通过提取场景音频信号的特征自动确定设备周围场景的过程,可以使各种便携式设备更加智能。例如,手机可以根据周围不同的场景而自动的调节各种情景模式【:便携式数字设备可以为使用者提供位置等信息桓髦种璞缚梢晕L跽习巳核周围场景的变化自动地调节各种设置【俊8菹衷诘男藕糯砑际酰罢夷芄唤虾帽碚各个音频场景的特征比较困难。因此,利用现有的各种音频特征寻找最优特征子集,提一个完整的音频识别系统主要包含三个部分:特征提取、特征选择和模型匹配。要达到好的分类效果,必须对这三个部分进行改进。因此,除了致力于对稳健语音特征、特征选择方法的研究外,优化模型也开始受到人们的广泛关注。要的意义。目前,对音频特征的研究可分为时域和频域两种。比较常用的时域特征提取閏,【、短时自相关函数【】。频域特征主要有傅立叶频谱、倒谱【俊⒚