文档介绍:摘要关键词:语音处理情感特征提取语音情感识别随着人机交互系统的快速发展,语音情感识别近年来越来越受到人们的重视。包含在语音信号中的情感情息是一种很重要的信息资源,它是人们感知事物的必不可少的部分信息。例如同样的一句话,由于说话人表现的情感不同,在听者的感知上就可能会有较大的差别。所谓“听话听音”就是这个道理。本文首先介绍了语音情感识别的发展历程、研究背景、研究领域及其主要应用,接下来介绍了目前语音情感识别主要研究方法及本文在语音情感识别中所用的情感的分类及其韵律特征。重点分析了各种特征参数的提取方法唤霭ㄔ下商卣鞑问褂蟹窃下商征参数如共振峰F渲谢艏觳馑惴ú捎靡恢肿远髡翱诔ざ鹊乃惴ǎ芄根据不同的人、不同的发音的差异来调节窗的长度,提高基频提取的准确性。本论文应用隐马尔可夫模型慕杏镆羟楦惺侗穑云浞治龉毯设计思想进行了深入详细地探讨。本文使用的汉语语音库包含了高兴、愤怒、悲伤、惊讶、恐惧和平静语音,提取了语音库中情感语句的短时能量及其一阶、二阶差分,基频及其一阶、二阶差分,第一共振峰和共八维情感特征参数。使用从左向右的连续隐马尔可夫模型进行情感语音识别,每个模型用六个状态,每个状态用四个混合高斯概率密度函数来估计输出概率密度函数,,我们用“分段邓惴ā毓繦模型的观察值概率距阵。最后应用惴ǘ愿糜镆艨馇楦杏锞浣惺侗穑笛榻峁表明,六种情感的总体识别效果较为理想,其中悲伤和愤怒的识别率更好一些。最后讨论了该领域存在的一些问题和今后需要进一步研究的课题。隐马尔可夫模型分段均值算法
知识水坝***@pologoogle为您整理
,,,瑃琤..瓸猈..’..畐,,.,:..,琲
知识水坝***@pologoogle为您整理
篠,琒瑆琒琀
导师签名:/祁砌学位论文作者签名:彦鑫嫱学位论文作者签名:鹰龛嚏独创性声明学位论文版权使用授权书签字同期:冲晔卵柚年彳月肜日发表或撰写过的研究成果,也不包含为获得苤盗盘堂或其他教育机构的学本学位论文作者完全了解鑫鲞盘堂有关保留、使用学位论文的规定。特授权丕盗盘堂可以将学位论文的全部或部分内容编入有关数据库进行签字日期:坩,月本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签字同期:刀检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得
,人机的交互能力越来越受到研究者的重视。如何实现计算机的拟人化,使其能感知周围的环境和气氛以及对象的态度、情感等内容,自适应地为对话对象提供最舒适的对话环境,尽量消除操作者和机器之间的障碍,已经成为下一代计算机发展的目标。斯坦福大学的蚇难芯勘砻鳎谌嘶换ブ行枰=饩龅奈侍馐导上与人和人交流中的重要因素是一致的,最关键的都是“情感智能”的能力。因此计算机要能够更加生动地适应操作者的需要,首先必须能够识别操作者的情感,而后再根据情感的判断来调整交互对话的方式。对于情感信息处理技术的研究包括多个方面,主要有情感特征分析、情感识别缰迩楦惺侗稹⒚娌壳楦惺别和语音情感识别等⑶楦心D例如情感语音合成等D壳埃赜谇楦行畔⒋理的研究正处在不断的深入之中,而其中语音信号中的情感信息处理的研究正越来越受到人们的重视。通过语音相互传递信息是人类最基本的功能之一,语言是人类特有的功能,是人类相互传递信息的最重要的手段【俊K淙蝗死嗫梢酝ü嘀质侄位竦猛饨缧息,但是最重要的信息源只有语音、图像和文字三种。与用声音传递信息相比较,显然用视觉和文字相互传递信息其效果要差得多,这是因为语音中除包含实际发音内容外,还包含发音者是谁及喜怒哀乐等各种信息。所以语言是人类最重要、最有效、最常用和最方便的交换信息的形式。另一方面,语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。包含在语音信号中的情感信息是~种很重要的信息资源,它是人们感知事物的必不可少的部分信息。例如同样的一句话,由于说话人表现的情感不同,在听者的感知上就可能会有较大的差别。所谓“听话听音”就是这个道理。然而传统的语音信号处理技术把这部分信息作为模式的变动和差异噪声通过规则化处理给去掉了。实际上,语音信号不仅包含了文字信息,还包含了语调及情感信息。人们同时接受各种形式的信息,怎样有效地利用各种形式的信息以达到最佳的信息
来识别人的各种情感,并让机器对这些情感做出适当的响耐。.婕