1 / 111
文档名称:

互联网视频内容检索的关键技术研究.pdf

格式:pdf   大小:3,496KB   页数:111页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

互联网视频内容检索的关键技术研究.pdf

上传人:kh6797 2016/10/6 文件大小:3.41 MB

下载得到文件列表

互联网视频内容检索的关键技术研究.pdf

相关文档

文档介绍

文档介绍:中国科学技术大学博士学位论文互联网视频内容检索的关键技术研究姓名:刘守群申请学位级别:博士专业:网络传播系统与控制指导教师:朱明20100501摘要I 摘要随着计算机网络和数字多媒体技术的发展,互联网视频应用日益普及,网络视频的数量急剧膨胀,如何有效的发现、检索和处理庞大的互联网视频数据已成为研究领域和工业界中亟待研究和解决的问题。目前互联网视频检索主要依赖于网络视频的标题、描述文本等信息,存在着视频信息的索引不完全、文本描述信息不准确的问题,从而影响检索的结果。检索过程中没有充分分析和利用视频的视觉信息,使得检索结果存在视觉内容上的重复,与人们的预期存在偏差。本文主要针对互联网视频的繁杂冗余的特征,研究互联网视频内容的检索方法中的几个关键问题,包括信息的抽取、视频相关性的挖掘和海量视频信息的处理等,期望通过本文的研究工作促进基于内容的视频检索的发展和实用化进程。本论文的主要研究工作如下:1. 提出了基于语义结构描述的视频网页识别和信息抽取方法。针对基于文本的视频检索,着重研究互联网视频页面的识别方法以及视频网页文本的抽取算法。首先,提出了基于语义区域表示的视频网页描述方法,以语义区域描述视频网页的结构,进一步提出面向语义结构的网页匹配算法,并将算法应用于视频页面的识别和视频描述文本的抽取,有效的提高了视频网页内容识别和抽取的准确性。2. 提出了结合SIFT特征匹配及时序特征的视频相似度度量方法。首先归纳了视频相似度度量的方法,在传统方法的基础上提出了基于SIFT特征的视频帧匹配算法,并通过LSH哈希优化了匹配的效率,提高了匹配的准确率。同时采用RANSAC算法对匹配帧序列进行处理,剔除离群的噪声信息,充分挖掘了视频帧之间的相关性,有效地结合了视频帧序列的时序信息,提高了视频相似度度量的准确率,并有效的完成视频片段的消重。3. 提出了基于仿射传播聚类算法的视频检索结果优化方法。视频的检索结果中通常存在大量的相同或者相似的结果,从而影响检索结果的质量和用户的检索体验。针对这一问题,本文提出了基于仿射传播(Affinity Propagation)聚类的视频检索结果优化方法。首先依据视频的相似度模型,计算检索结果中的视频之间的相似度,构造相似度的矩阵;然后通过仿射传播聚类算法,依据视频之间的相似度矩阵对视频内容进行聚类,将在内容上相似或者相同的视频进行归类,有效地改善了视频检索结果的质量,完成检索结果的优化。摘要II 4. 提出了基于Map/Reduce的分布式海量视频片段相似度计算方法。视频数据的特征复杂使得视频相似度度量算法在处理大规模视频数据时存在性能瓶颈,针对这一问题,本文首先提出了一种面向海量视频相似度计算的视频特征表示方法,该方法借鉴了信息论的模型以及文本数据相似度的计算方法,在特征描述的基础上,提出了基于Map/Reduce架构的视频相似度计算方法,将视频相似度计算的任务进行分解,并通过分布式的框架进行处理,有效地提高了视频相似度的计算效率,并且具有较高的可扩展性。关键词:互联网视频检索,视频文本索引,视频信息检索,聚类,信息抽取,视频消重,视频数据处理,海量视频数据处理Abstract III ABSTRACT With the fast development works and digital multimedia technology, video application es popular, the amount of video clips over the is very huge, and how to effectively discover video contents, retrieval video clips and processing video data es a challenging task in both research and industry. State-of-art video retrieval systems are based text such as the title and surronding description text of video. Although it is fast, there are many problems in it, such as the pletion of indexing, the incorrect of description text, which leed to the poor result int the retrieval result. These systems also ignore the content of videos, which leed to many duplicat