文档介绍:2017-1-12 1第四章语音信号的矢量量化§ 概述§ 矢量量化的基本原理§ 失真测度§ 最佳矢量量化器和码本的设计§ 降低复杂度的矢量量化系统§ 语音参数的矢量量化§ 人工神经网络与 VQ § 遗传矢量量化 2017-1-12 2§ 概述量化分为两大类:一类是标量量化,另一类是矢量量化。标量量化:用若干个离散的数字值来表示每一个幅度具有连续取值( 模拟值) 的离散时域信号(采样信号)。 2017-1-12 3 矢量量化的定义:矢量量化(Vector Quantization) 是将若干个取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。将某一范围内的矢量归为某一类,即所谓的矢量量化 2017-1-12 4 矢量量化研究的基础是信息论的一个分支: “率——畸变理论”,其中有两项理论研究成果对于矢量量化算法的发展起关键作用。第一,该理论指出,对于一定的量化速率 R( 以每个采样信号平均所用的量化比持数衡量,用比特/采样表示) ,量化畸变 D( 以量化信号与原信号之间的误差均方值和原信号均方值之比来衡量)是一定的。第二,无论对于何种信息源,即使是无记忆的信息源( 即各个采样信号之间相互统计独立的情况) ,矢量量化总是优于标量量化,且矢量维数越大优度越高。 2017-1-12 5 矢量量化的应用: 进入 80 年代以后,矢量量化技术引入语音处理领域,使之又有长足的进步。目前这项技术已经用于语音波形编码,线性预测编码、语音识别与合成、图像压缩等。矢量量化的研究目的: 针对待定的信息源和矢量维数,找到一种最优的矢量量化器,它能够在 R 一定时给出最低的畸变。 2017-1-12 6 上图的两维矢量空间里,存在 6类矢量,每一类都有一个中心, 称为室心,每一室心对应一个码字矢量。从量上来表征第 i类矢量。集合称为码本。 x yV 1V 2V 3V 4V 5V 6V ?? 11,yx?? 22,yx图 ?? iiYX, iV iV?? iV什么是矢量量化(VQ) 2017-1-12 7 任意一个矢量 V应该归为哪一类,要看它是“靠近”哪一类矢量,或者说它离哪一个室心最“近”。例如上图中虚线画出的矢量 V最靠近 V 1,则将其规定为 V 1类,并用 V 1表示 V,或者说 V被量化为 V 1。这样作可以把本来无限多的矢量只用有限个码字矢量来表示(此处为 6个)。假如码本中的码字矢量是有序的,则被量化的矢量可用码字序号来表示。因此,可以大大压缩信息量。 2017-1-12 8§ 矢量量化的基本原理矢量量化的过程是:将语音信号波形的 A 个样点的每一帧,或有 k 个参数的每一参数帧,构成 k维空间中的一个矢量,然后对这个矢量进行量化。标量量化和矢量量化的区别:在标量量化时,在一维的零至无穷大值之间设置若干个量化阶梯, 当某输入信号的幅度值落在某相邻的两个量化阶梯之间时,就被量化为两阶梯的中心值。而在矢量量化时,则将 A维无限空间划分为 M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。 2017-1-12 9下面以 K=2 为例进行说明。 2017-1-12 10 相关概念:若要对一个矢量 X 进行量化,首先要选择一个合适的失真测度,而后用最小失真原理,分别计算用量化矢量 Y i替代 x 所带来的失真。其中最小失真值所对应的那个量化矢量,就是矢量 X的重构矢量( 或称恢复矢量)。通常把所有 M 个量化矢量构成的集合{Y i} 称为码书或码本(Codebook) 。把码书中的每个量化矢量 Y i ({i=1 ,2,…, M) 称为码字或码矢。不同的划分或不同的量化矢量选取就可以构成不同的矢量量化器。