文档介绍：中国科学技术大学
硕士学位论文
面向三维视频应用的多视角视频编码压缩算法研究
姓名:朱玲
申请学位级别:硕士
专业:信号与信息处理
指导教师:李厚强
20100501
摘要
摘要
随着数字多媒体技术的快速发展和用户需求的不断提高,三维视频应用逐
渐成为一个消费领域的潮流,获得越来越多的关注。三维视频,相比较与传统
的二维视频,增加了真实场景的深度信息,能提供用户更加立体的视觉感受。
三维视频通常由多视角的纹理信息及其相应的深度信息组成,数据量巨大,对
存储和传输都带来了挑战,必须对其进行有效的压缩,尤其是信息量占绝对比
重的多视角纹理视频信息部分。如何对多视角视频进行有效的压缩编码传输是
推动三维视频应用的关键。因此,研究面向三维视频应用的多视角视频编码压
缩算法具有广泛的应用价值以及理论意义。
本文基于面向三维视频应用这一前提,研究多视角视频编码的一些关键技
术,主要工作和创新之处在于:

实现视角切换的解决方案。
在一个典型的任意视角视频流系统中,用户的需求是多样的,如果不分差
异的将所有多个视角视频信息全部传输到不同的用户端,显然是低效的,这里
一般采用视角切换技术。本文提出了利用视角间预测模式编码的冗余帧来实现
视角切换的解决方案。即对位于潜在切换点的原始帧,根据其所在视角的特性,
编码若干种冗余帧,当切换发生时,根据具体的切换场景选择最佳的冗余帧代
替原始帧进行传输以实现有效的视角切换。实验结果表明本文提出的解决方案
与传统的利用关键帧技术实现视角切换方法相比,不仅可以提升编码压缩性能,
而且可以有效节约传输带宽。

的影响。
三维视频应用中,无论是立体视频显示,或自由视角浏览,解码端都需要
深度信息。深度信息旨在合成虚拟视角而不直接用于显示。如何结合这一特性
在编码端利用它来提高多视角的纹理视频压缩效率,进而提高整体的三维视频
编码压缩水平是非常有意义的。本文通过大量实验分析了采用视角合成预测模
式对多视角视频编码性能的影响,结果表明这种预测模式提高了编码性能,同
时表明虚拟视角能够提供比现实存在的参考视角更准确的预测信息。大量的实
验数据对从事三维视频编码研究的专家学者而言具有参考指导意义。
关键词:三维视频多视角视频编码视角切换视角合成预测
I
Abstract
ABSTRACT
With the rapid development of multimedia technologies and higher user
demands, three dimensional (3D) video es a trend in the consumption area,
attracting a great attention.
3D video, compared to traditional two dimensional (2D) video, can provide
more realistic stereoscopic experience. monly consists of multiview texture
video sequences and corresponding depth information. The amount of the data is
large, which is a challenge to storage and transmission especially under limited
bandwidth. Thus it is necessary to press and transmit the 3D video
data, particularly the multiview texture information which constitutes the largest
portion. And the key to promote the use of 3D video lies in the efficient coding and
transmission of multiview video. In conclusion, it is of great theoretical and practical
significance to do research on pression of multiview video.
This thesis