文档介绍:华中科技大学硕士学位论文
摘要
是一种先进的、近年来流行的国际视频编码标准。国内外很多公司以及
研究机构都在研究 编码算法在数字信号处理器(DSP,Digital Signal Processor)
平台上的实时解决方案。由于 编码算法的复杂度高以及 DSP 的资源有限,至
今没有较好的解决方案。
在分析 标准特性和 Blackfin561 系统结构的基础上,对存储资源分配进
行了一些优化。根据 中用到的数据结构的大小,被操作的频度,确定数据在
内存上的分块布局,减小了内存访问冲突。设计了视频采集缓冲区的双核同步策略,
并且将缓冲区布局在不同的片外内存子块上,试验表明能减少视频采集中等待的时
间。定量分析高速缓存(Cache)容量大小对 Cache 失效率和平均访存时间的影响,
确定 Cache 的最佳容量,在内存代价和 Cache 效率之间取得平衡。针对 Cache 的两
种回写机制的特点,对不同数据块按页采用不同的回写机制。通过计算额外开销,
分析出合适的 DMA 一次调度数据块的数目,分析出 DMA 传输方向控制器的不同
切换周期对系统性能的影响,找到切换周期的最佳值。分支指令和循环指令对存储
性能影响较大,通过预测分支跳转和构建硬件循环来提高它们的效率。
测试结果表明,优化后的视频采集占用的系统资源减少。对于低复杂度的场景,
有较快的实时编码速度,编码帧率达到 22 帧。对标准序列测试的结果也表明,经
过存储资源分配优化后的系统性能得到提升。
关键词: 视频编码,数字信号处理,直接内存访问,高速缓存,子块并行读写
I
华中科技大学硕士学位论文
Abstract
is an advanced and popular pression standard. panies
and research institutions try their best to explore the real-time solution of Encoder
in DSP (Digital Signal Processor) platform. However, as the plexity and the
resources limitation of DSP, there was no good solution up to now.
The optimization of storage resource assignment based on the analysis of
Blackfin561 architecture and encoding algorithm characteristics. The conflict of
accessing memory is reduced by Abstracting data structures of algorithm,
analyzing data size and operation frequency, and distributing corresponding memory
level for the data. A dual-core synchronization method is designed for video capture, and
buffers are distributed to different sub-banks, so the time of waiting video data is reduced.
By calculating cache miss rate and average time of accessing memory, optimal Cache
capacity is allocated, and appropriate write-back strategy is chosen for different part of
data structures. By calculating additional spending of DMA transfer, fix up appropriate
number of blocks transferred by one DMA transfer, and what is the optimal register value
of DMA traffic. Branch and circle also have a great impac