文档介绍:西安建筑科技大学硕士学位论文
基于哼唱的 MIDI 音乐检索系统的研究
专业:信号与信息处理
硕士生:孙洁
指导教师:王民副教授
摘要
在科技及网络的不断发展,多媒体技术及设备数量飞速增长的环境下,音频
数据作为多媒体数据的重要组成部分,其信息量也在不断的增长。在海量音乐数
据库,传统的音频检索方式给用户的使用带来种种的限制,用户已经不满足于这
种基于文本的音频检索,这对音乐检索提出了更新、更高的要求。自然、方便、
有效的哼唱音乐检索是一种基于内容的音乐检索方式,有着广泛的应用前景和重
要的研究价值。该方式允许用户以哼唱的形式来检索所需的歌曲,用户无需记住
歌曲的名字、演唱者或者歌词,只要哼出歌曲的旋律就能找到想要的歌曲。
本文对 MIDI 音乐数据库的哼唱音乐检索系统的关键技术进行了研究,主要
有三个方面:MIDI 音乐数据库的旋律特征提取、哼唱特征提取和音乐旋律匹配
算法。针对这三方面,本文做了以下工作:
MIDI 格式作为音乐文件格式,分析了解 MIDI 文件的结构,实现从
MIDI 音乐库中提取音乐的旋律信息。
2. 详细分析几种基音提取算法。为了保证系统的时间复杂度较低和算法精度
较高,本文对哼唱语音信号用两层 BP 神经网络进行切分音符及清浊音区分,阐
述平均幅度差函数法和自相关函数法的优缺点并进一步改进,得到更精确的基音
周期,从而提取音高和音长,生成哼唱的旋律特征,为后续的匹配算法做好准备
工作。
。结合本系统对准确度及速度的要
求,本文建立基于音高差隐马尔科夫模型加权音长比来匹配,最终得到最佳匹配
音乐。
最后本文针对基于哼唱的 MIDI 音乐检索系统进行实验验证,对其进行抗噪
性分析并与其他论文进行对比,结果表明该系统的检索具有较高的准确性和实用
性。
西安建筑科技大学硕士学位论文
关键字:哼唱音乐检索;BP 神经网络;自相关函数;平均幅度差函数;隐马尔
科夫模型
论文类型:应用研究
西安建筑科技大学硕士学位论文
Based on the humming MIDI music retrieval system
research
Specialty: Signal and Information Processing
Name: Sun Jie
Instructor: Prof. Wang Min
ABSTRACT
In the continuous development of the technology and work environment of
rapid growth in a number of multimedia technology and equipment, the audio data, as
an important part of the multimedia data, the amount of information is constantly
growing. In the massive music database, the traditional audio retrieval methods bring
all sorts of restrictions to the use of the users, and users have not been satisfied with the
text-based audio retrieval, which proposed newer and higher requirements for music
retrieval. Natural, convenient and effective humming music retrieval is a content-based
music retrieval methods, which has a broad application prospects and important
research value. This mode allows the users to retrieve the desired songs by humming
form. The user does not need to remember the name of the song, artist or lyrics, and he
just hum the melody of the song to find his desired song.
This p