1 / 70
文档名称:

基于SVM的汉语语音情感识别的研究(可复制论文).pdf

格式:pdf   页数:70
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于SVM的汉语语音情感识别的研究(可复制论文).pdf

上传人:mkt365 2013/11/12 文件大小:0 KB

下载得到文件列表

基于SVM的汉语语音情感识别的研究(可复制论文).pdf

文档介绍

文档介绍:摘要随着信息技术的发展,对人机交互能力的要求不断提高,语音信号中的情感信息近年来正越来越受到人们的重视,特别是在语音合成和语音识别领域。从信号处理的观点来看,语音信号不仅包括了文字信息,还包括了说话人的语调和情感信息。情感可被分为两类:主要情感和次要缮情感。主要情感包括害怕、愤怒、高兴、悲伤和厌恶,是所有社会化的哺乳动物共有的,有其特殊的表现形式。次要情感包括自豪、感激、悲痛、亲切和惊奇,是主要情感的变化或组合形式,其中一些是人类特有语音信号的情感识别也可以看成一个模式识别问题。本文介绍了基于暮河镉镆羟楦惺侗稹Mü怨谕庀喙匮芯康牧私獠⒔岷献约旱氖验,将情感类型划分为高兴、愤怒、惊奇和悲伤四类,并遵循相应的原则,采用剪辑法和录音法分别建立了蚐两个小规模的汉语语音情感数据库;然后从语音信号中提取了能量、基频和语速等相关的特征参数。并且,在此数据库的基础上对这些情感声学特征参数作了统计分析,分别从基频、能量和语速特性描述了人类四大主要情感之间的不同特点。对于包含四种情感的语音情感的确认任务来说,一共需要训练龆元分类器,分别对应四种情感咝恕⒎吲⒕F妗⒈的支持向量,训练集中的每类情感数据对应的支持向量经训练后被确定为相应的情感类,其它非本类的情感则被标上否定标志,分别识别了河镉镆羟楦惺菘猓隽耸侗鸾峁褪笛榉治觥W后讨论了该领域存在的一些问题和今后需要进一步研究的课题。关键词人机交互;语音信号;情感识别;支持向量机;模式识别的。
知识水坝***@pologoogle为您整理
.地,甌瑂:..,,琣瑃....痶,畉.Ⅱ
知识水坝***@pologoogle为您整理
;Ⅲ
箩着作者签名:芦涛导师签名:垒日期:砷年挛倘燕山大学硕士学位论文原创性声明燕山大学硕士学位论文使用授权书日期:沙吵年乒月才日日期:甓试络迦本人郑重声明:此处所提交的硕士学位论文《基于暮河镉镆羟感识别的研究》,是本人在导师指导下,在燕山大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文的研究工作做出重要贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承作者签字《基于暮河镉镆羟楦惺侗鸬难芯俊废当救嗽谘嗌酱笱Чザ了士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归燕山大学所有,本人如需发表将署名燕山大学为第一完成单位及相关人员。本人完全了解燕山大学关于保存、使用学位论文的规定,同意学校保留并向有关部门送交论文的复印件和电子版本,允许论文被查阅和借阅。本人授权燕山大学,可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。保密口,在年解密后适用本授权书。本学位论文属于不保密团。朐谝陨舷嘤Ψ娇蚰诖颉啊獭担。
第滦髀研究背景计算机科学技术的迅猛发展对人类社会产生了巨大影响,一场信息革命正在酝酿。在众多领域,计算机正逐渐代替人类完成一些极具挑战性的任务,为了使人类与计算机间能够更加智能更加自然的交互,新型的人机交互技术正逐渐成为研究热点。人类自然形成的认知习惯和形式必定是人机交互的发展方向:一方面要求计算机能看、能说、能听、能感觉,即能够智能地感知使用者的意图;另一方面,使用者可以不必坐在计算机前通过鼠标和键盘操作计算机,而是可以在三维空间中以更加自然和人性化的方式同计算机交流。总之,新型的人机交互环境具有自然化、智能化、人性化等特点。实时多媒体信息在新型人机交互环境中扮演着举足轻重的角色,计算机通过采集图像信息和语音信息,形成计算机视觉和听觉,然后处理采集到的多媒体信息进行识别,从而感知使用者的意图,完成人机自然交互。如何实现计算机的拟人化,使其能感知周围环境和气氛以及对象的态度、情感等内容,自适应地为对话对象提供最舒适的对话环境,尽量消除使用者和机器之间的障碍,己经成为下一代计算机发展的重要目标。研究表明,在人机交互中需要解决的重要问题与人和人交流中的重要因素一致,关键都是“情感智能”的能力。计算机要能够更加主动适应操作者的需要,首先必须能够识别操作者的情感,而后再根据情感的判断来调整交互对话的方式。对于情感信息的处理技术的研究包括多个方面,主要有情感特征分析、情感识别缰迩楦惺侗稹⒚娌壳楦惺侗鸷陀镆羟楦惺侗鸬、情感模拟缜楦杏镆舻暮铣傻。目前,关于情感信息处理的研究正处在不断深入之中【浚渲杏镆粜藕胖械那楦行畔⒋淼难芯恳苍嚼丛绞艿饺们的重视。语音信号中的情感信息是重要的信息资源,它是人们感知事物必不可
研究现状及价值少的部分。例如同样一句话,由于说话人的表现的情感不同,在听者的感知上就会有较大的差别,所谓“听话听音”就是这个道理。然而,传统的语音信号处理技术把这部分信息作为模式的变动和差异噪声通过规则化处理给去掉了。