1 / 2
文档名称:

利用深度学习进行可变长度语音片段的情感识别.pdf

格式:pdf   大小:2,036KB   页数:2页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

利用深度学习进行可变长度语音片段的情感识别.pdf

上传人:学习的一点 2021/12/3 文件大小:1.99 MB

下载得到文件列表

利用深度学习进行可变长度语音片段的情感识别.pdf

相关文档

文档介绍

文档介绍:◆教育理论◆ SANWENBAIJIA
利用深度学****进行可变长度语音片段的情感识别
魏金太 王 振
河南林业职业学院
摘  要:通过将深度神经网络应用于频谱图,提出一种用于可变长度语音段的情感识别方法。从频谱图中提取这些信息,
并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传统的将句子分割成更小的固定长
度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题。
关键词:变长语音片段;深度学****频谱图;神经网络;情感识别
情感识别在许多应用中起着重要的作用,特别是在当 Bhargava 和 Rose 使用叠加的瓶颈深度神经网络(DNNs)对
今日益普遍的人机交互系统中。作为人类之间的主要传播媒 窗口化语音波形进行训练,并且在相同体系结构上获得的结
体之一,语音已经引起了研究者的广泛关注。言语包含丰富 果只比相应的 MFCC 略差。直接使用梅尔谱声谱图进行说话
的情绪信息,如何从语音信号中提取这些信息对于自动语音 人识别也被证明是成功的。此外,基于线性间隔频谱图描述
情感识别具有重要意义。作为语音情感识别的重要组成部 了最近公布的现有技术的鲁棒语音识别系统。
分,提取最相关的声学特征引起了很多研究兴趣。这些研究 在语音情感识别领域,已经进行了一些使用深度神经
大部分都致力于设计一些手势特征,这些特征对于情感识别 网络进行特征学****的研究。最近,乔治等人提出了一个卷积
来说是最有特色的。 循环神经网络,对原始信号进行操作,从语音数据中执行端
最近,机器学****社区的一个趋势是直接从原始未处理 到端的自发情绪预测任务。Satt 等人还将 CNN 和 LSTM 相结
数据中推导出输入信号的表示。这个想法背后的原因是网络 合,对线性间隔频谱图中的情绪进行分类,超过了通用基准
可以自动学****原始输入信号的中间表示,它更适合手头的任 数据集