1 / 57
文档名称:

海量音频指纹数据的存储检索应用研究.pdf

格式:pdf   页数:57页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

海量音频指纹数据的存储检索应用研究.pdf

上传人:tswng35 2016/3/16 文件大小:0 KB

下载得到文件列表

海量音频指纹数据的存储检索应用研究.pdf

相关文档

文档介绍

文档介绍:海量音频指纹数据的存储与检索研究 Research on Storage and Search for Massive Data of Audio Fingerprinting 学科专业: 计算机科学与技术研究生: 王润涛指导教师: 孙济洲教授天津大学计算机科学与技术学院二零壹叁年拾壹月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名: 签字日期: 年月日学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 导师签名: 签字日期: 年月日签字日期: 年月日摘要随着大数据时代的到来, 尤其是包括图像、音频、视频在内的海量多媒体数据,这些数据亟需被有效地管理起来,并为广大用户提供方便、快捷的检索方式。随着模式识别、机器学习、云计算技术的发展, 基于内容的多媒体检索技术应运而生,这种技术的出现使得信息检索不再依赖于数据的标签和关键字,而且搜索结果更为准确,搜索方式更为便捷。音频数据作为多媒体中重要组成部分,其数据规模也在迅速膨胀,人们面临的问题不再是缺少多媒体信息,而是如何在海量的数据中找到自己所需要的信息。如何快速有效的检索海量音频成为当前学术界和工业界信息检索研究领域的一个重要课题。音频指纹检索技术是基于音频内容的信息检索方式,通过对未知音频片段提取名为音频指纹的数字特征,然后在事先准备的海量音频指纹数据库中进行音频指纹的搜索与相似度计算, 获得音频详细信息的方法。这种方法解决了传统基于文本关键字的搜索音频存在的文本标注不全、错误等问题,同时解决了用户不知道关键词时无从下手搜索的困难。音频指纹提取与匹配算法已经在实验室中取得了丰硕的成果,并在部分产品中得到了应用,但所处理的数据集规模相对较小。在应用到大规模数据集时会遇到性能瓶颈,以及并发性、扩展性等问题。本文在对音频指纹提取与匹配算法的深入研究基础上,对海量音频指纹数据的存储与检索进行了设计、实现及优化。首先提出了基于哈希结构的音频指纹存储结构,然后进一步提出了两种分布式哈希解决方案,并通过实验证明了所设计的方法的有效性。在此基础上,本文又提出了一种海量音频指纹数据的序列化分布式存储方案,并再一次通过实验证明了其有效性。本文所设计的存储结构和分布式存储检索方案具有多级并发、高性能、可容错、易扩展等特点,对于构建海量音频指纹检索系统具有实际价值,对于推进音频指纹检索技术在社会中的应用具有重要意义。关键词: 音频指纹海量数据存储与检索分布式存储 ABSTRACT With ing age of big data, t he world is producing data at an exponentially increasing speed , especially multimedia data such as images, audios and videos. How to effectively manage and make use of these data to providing more convenient is one of the fundamental problems people need to solve in the information age . As the development of techn ique s in pattern recognition , machine learning and cloud computing, content -based multimedia search comes in. Compared with traditional keyword -based search, content -based search is independent of ta gs and keywords, and with more accurate search results and more convenient search methods. As the ponent of mu