1 / 59
文档名称:

rbf神经网络和hmm用于音乐识别算法研究.pdf

格式:pdf   页数:59页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

rbf神经网络和hmm用于音乐识别算法研究.pdf

上传人:2890135236 2015/8/19 文件大小:0 KB

下载得到文件列表

rbf神经网络和hmm用于音乐识别算法研究.pdf

相关文档

文档介绍

文档介绍:RBF 神经网络和 HMM 用于音乐识别的算法研究
摘要
音乐信号处理是信号处理领域中的重要组成部分。为了能让计算机
与人类能够用音乐自由的沟通,有关计算机音乐处理的研究,意义日益
凸显。音乐的计算机自动识别是新兴的交叉学科,其研究涉及物理学、
信号处理、人机交互、音乐理论等诸多学科知识。本文研究的音乐识别
正是将计算机多媒体技术、信号处理与模式识别的相关知识和技术同音
乐理论相结合,用计算机模拟人对音乐认知和分析的过程。
论文首先介绍了计算机音乐的发展,并对基本乐理及音乐信号的特
性进行了简单的描述。围绕音乐相关理论,论文对比了音乐信号与语音
信号的特性,选取(Mel-Frequency Cepstral Coefficients)作为单音
信号的特征,并对特征矢量维数的选择进行了讨论,利用 RBF 神经网络
对钢琴 88 个单音进行识别,实验取得了 100%的识别结果。实验结果表
明所选特征对识别钢琴单音信号是有效的。
其次论文研究了在西方音乐和弦识别中使用频率较高的音级轮廓
(Pitch Class Profile 简称 PCP)特征及其计算方法,给出了具体的计算公
式。论文基于 HMM 构建了音乐和弦识别系统,定义了 36 个状态,每个
状态代表一类和弦;通过一个 12 维的多元高斯函数拟合观察向量的概率
分布, 该模型分别由高斯函数的均值向量和和协方差向量来定义。论文
II
借助 Chris Harte 制作的标签文件训练得到有监督的 HMM。识别过程通
过 Viterbi 算法,对输入信号依照极大似然法来寻找最佳路径,即最佳的
和弦序列。为了克服系统处理快节奏音乐时出现的如下问题:识别空和
弦时系统常发生混淆,论文采用了得到很多学者认可的节拍同步分析算
法。实验以帧为单位对三首不同音乐的和弦进行了识别,平均识别率达
到 %。最后论文对实验过程及结果进行了细致的分析和讨论。
关键词:音乐识别, 钢琴单音识别, 和弦识别, RBF 神经网络, 隐马尔
可夫模型
III
STUDY OF MUSIC RECOGNITION
ALGORITHM BASED ON RBF
WORK AND HMM
ABSTRACT
Music signal processing is an important part of signal processing. In
order municate puter freely, the research puter music
signals processing has been taking a more and more important role. Music
recognition is a rising interdisciplinary researeh field, which involves
physics, signal processing, puter interaction, music theory and
music psychics. To describe music characters puter, this dissertation
combines the technique of multimedia, signal proeessing and pattern
reeognition with music theory to make puter to imitate the course of
music cognitive and analysis of human.
First of all,the paper describe about the development puter
music,then describe briefly about the basic music theory and characteristic of
music signal. Based on music theory, the features between music and the
speech signal pared. We select mel frequency cepstrum coefficient as
the characteristic of monophonic music also discussed the selection
of dimensions of feature vector. We recognize the eighty