文档介绍：II
摘要

随着计算机、电子及信息技术的飞速发展,人们之间的信息交流变得越来越方便。
海量的多媒体信息通过移动终端自由的传输和存储,由此带来的视觉信息爆炸问题日
益严重。海量、非结构化的数字化视觉信息数据的管理、存储以及传输的难度越来越
大,已成为目前人们检索和浏览信息的主要障碍。使用在文本中广泛应用的基于关键
词的内容检索方法来对视觉信息进行处理,不但效率低,而且也不能很好的利用视觉
信息中所包含的丰富知识。为此,相关专家和学者提出了基于内容的视频检索技术,
其中,视频镜头边界检测和关键帧技术的提取是近几年来的研究热点。镜头边界检测
是检索技术中要解决的首要基础技术问题,关键帧的提取是其中的核心技术之一。本
文针对视频镜头边界检测和关键帧的提取方法进行研究和探讨,以期能找到一种能提
高视频检索效率的方法。
镜头边界检测技术是基于内容的视频检索的基础,只有有效的获得分割的视频镜
头,才能提取到能够充分代表镜头内容的关键帧。繁多的视频信息、复杂的视频种类
以及视频编辑的手段增加了对视频镜头边界检测难度。本文将针对当前现有的一些镜
头边界检测技术只能单一的针对某一特定领域的视频进行分割,扩展性能差的不足,
提出改进算法。
视频关键帧提取技术是视频数据处理研究领域的热点研究问题。关键帧提取技术
是基于内容的视频检索的核心技术之一,对于场景繁多、内容复杂、镜头变化较多的
视频类型,现有的关键帧提取方法效果不是很好,直接影响视频检索的速度和准确性。
基于以上问题,本文主要做了以下几个方面的研究:
(1)在关键帧提取之前要进行镜头边界检测。本文针对现有的镜头检测技术大多
只能在某一特定领域内的视频中应用的不足,提出一种基于小波边缘检测算子的自适
应分块视频镜头边界检测算法。结合小波边缘检测和视频帧的自适应分块方法,检测
视频镜头变化,得到分割的镜头。
(2)对视频帧提取图像颜色特征、形状特征和纹理特征,通过归一化处理,得到
融合颜色、形状、纹理多种特征的相似性度量值,作为衡量视频帧特征的标准。
(3)由于基因表达式编程有很强的全局搜索能力,在解决聚类问题时具有明显的
优势。能够在完全不需要对数据集有任何先验知识的情况下对簇进行聚类分析,从而
解决基于划分的聚类算法中需要预设簇个数的缺陷。本章利用基因表达式编程的自动
聚类功能对视频帧进行聚类,改进并提出了基于 GEP 自动聚类的视频关键帧提取算
法(Key Frame Clustering Algorithm based on Gene Expression Programming,
KFC-GEP)。
(4)通过实验验证了的有效性,实验结果表明该方法能有效提高各种类型视频关
I
键帧的提取精度。

关键词:镜头边界检测;小波边缘检测;多特征融合;视频关键帧;KFC-GEP
II
ABSTRACT
With the rapid development puter, electronics and information technology,
munication among people is ing more and more convenient. Huge
amounts of multimedia information is freely transmitted and stored through mobile
terminal, and the visual information explosion problem is increasingly serious. Huge
amounts of unstructured digital visual information data management, the storage and
transmission of it is more and more difficult, which has e a main obstacle
people search and browse information. Using the method of content retrieval based
on keywords to processing visual information, which is widely used in text retrieval, is
consuming and also can't very good use of visual information contained in the
knowledge. Therefore, ex