文档介绍:浙社大学硕士学位论文
摘要
随着信息技术的发展和性能的提高,以视频压缩为核心的监控系统得
到了长足的进步,并广泛应用于安保、生产等领域。编解码系统作为视频监控的
关键技术,其编码标准也由和发展到和
针对网络视频录像机的市场需求,基于编码标准,研制了一套以
芯片为核心的视频编解码系统,本文就所承担的软件部分实现
进行了研究。
通过模块代码运行效率测试,发现运动估计占整个压缩处理时间的一半以
上。在对原有的方法进行分析的基础上,提出了一种改进的六边形搜索算法,在
经过数据结构优化和部分代码汇编改写之后,将代码映射到硬件平台。更
进一步从地址映射、数据访问等方面对编码方案进行优化。经过实验数据测试,
视频压缩率满足指标要求,实时处理能力达到帧秒。
关键词视频编码,标准,运动估计,代码优化,
浙江大学硕士学位论文
斤
浙江大学硕士学位论文
第一章绪论
引言
随着上世纪七十年代后大规模和超大规模集成电路技术、数字信号处理技
术、计算机技术、通信技术的跨越式飞速发展,人类对信息的处理也迅速从模拟
领域进入数字领域,从本地的单机处理进入网络交互式处理,从简单的文本信息
处理进入多媒体信息处理。因此世纪被形象的称为信息时代、数字时代、多
媒体时代。
多媒体信息主要包括文字、声音、图像、图形和视频等内容。其中视频又是
多媒体信息中最重要的组成部分。这是因为首先视频信息极易被人类接受。据
统计人类接受的信息大约来自视觉其次视频信息具有直观、形象、准确、
高效和应用广泛等特点第三视频信息容量大。与音频、数据相比,视频具有无
与伦比的信息容量。但与文本、数据和语音相比,视频海量的数据量使得未经压
缩的数字视频几乎没有任何实用价值。例如对于格式的视频材料,
当帧率为印,采样深度为比特,色差格式为时,每秒数据量为
。如果直接在容量为的格式光盘中保存,则只能保存不
到分钟的内容。对于高清晰度数字电视每秒数据量更高达
,而地面广播系统的传输带宽仅有到。因此无论是存储还是
传输,数字视频都必须经过压缩才能具有实际意义,这就使得视频压缩技术成为
多媒体技术的关键所在。
视频编码原理
视频编码的目的是实现对视频的压缩,其核心思想是去相关。即通过减少视
频序列间的相关性,用较少的比特数来表示视频内容,降低视频内容中的冗余,
从而实现对视频的压缩。视频序列中的冗余主要有以下几个方面
空间冗余
浙江大学硕士学位论文
空间冗余是指在同一帧画面中,相邻的像素间存在的相关性,特别是当这些
相邻像素位于同一个视频对象中时,相关性极强。例如在图像的背景区域。
时间冗余
通常对视频序列而言,除非发生场景切换,否则相继帧在时间上都是连续的。
在前后两帧中往往包含与当前帧相同的背景和对象。只是由于镜头的转动或对象
的移动使得空间位置发生变化。运动越缓慢,位置的变换越小。因此视频序列在
时域存在极强的相关性。
编码冗余
对于编码符号,其平均码长高于所表示信息的信息嫡,这个偏差就形成了编
码冗余。编码冗余、空间冗余和时间冗余都依赖于图像数据的统计特性,可以统
称为统计冗余。
人眼视觉冗余
由于人眼视觉的非均匀性,使得人眼视觉对某些空间频率感觉迟钝。因此视
频中不同频率成分的内容对于人眼系统而言其重要性是不同的。也就是说存在频
域兀余。例如人眼视觉系统对亮度信号变化的敏感性高于色度信号变化。因此可
以对色度分量进行降采样,同时保持主观视觉质量不变。色差格式就
是对色度分量在水平和竖直两个方向进行的降采样。另一方面对信号频域的
各个分量可以采取不同的量化步距,将人眼视觉不敏感的分量去处,而不会引起
土观质量的下降。
结构冗余和知识冗余
图像的某些区域存在非常强的纹理结构,图像像素值有明显的分布模式,形
成结构冗余。或者图像中包含的信息与某些先验知识有关,例如人的五官位置对
于人脸而言就是一种先验知识,这种冗余构成知识冗余。
信源编码的方法按照压缩数据能否被准确恢复分为两大类无损编码和有损
编码。虽然无损编码可以无失真的恢复原始数据,但其压缩效率十分有限。因此
在视频压缩中都是将无损编码和有损编码结合使用。
视频编码中主要压缩技术有以下几种。
预测编码
预测编码不是对一个像素直接编码,而是用同一帧帧内预测编码或相邻
浙江大学硕士学位论文
帧帧间预测编码中的像素值来进行预测,然后对预测残差进行量化和编码。
显然预测编码实际是利用了图像数据中的空间和时间冗余。线形预测编码又称为
差分脉冲编