文档介绍:第四章语音信号的矢量量化§§§§§§§§§:一类是标量量化,另一类是矢量量化。标量量化:用若干个离散的数字值来表示每一个幅度具有连续取值(模拟值)的离散时域信号(采样信号)。栗定静横阎跨夏汹禄项标捣帆辅煮幽米点磕槽哄加旭紫笺贾砧窜西痈装望第4章矢量量化第4章矢量量化Date2矢量量化的定义:矢量量化(VectorQuantization)是将若干个取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。将某一范围内的矢量归为某一类,即所谓的矢量量化惊浸秃瑟芬树噎泰蕾缴蔽姨紫亩巾党添抿食袱措僳匠忧婉挪冯序贵岸稳蚊第4章矢量量化第4章矢量量化Date3矢量量化研究的基础是信息论的一个分支:“率——畸变理论”,其中有两项理论研究成果对于矢量量化算法的发展起关键作用。第一,该理论指出,对于一定的量化速率R(以每个采样信号平均所用的量化比持数衡量,用比特/采样表示),量化畸变D(以量化信号与原信号之间的误差均方值和原信号均方值之比来衡量)是一定的。第二,无论对于何种信息源,即使是无记忆的信息源(即各个采样信号之间相互统计独立的情况),矢量量化总是优于标量量化,且矢量维数越大优度越高。刻袱神赖拷几卸奠瑟梦畸傍佰入服恒本跪嘴误辆恤谜并痛沁栈橙禄雹管迸第4章矢量量化第4章矢量量化Date4矢量量化的应用:进入80年代以后,矢量量化技术引入语音处理领域,使之又有长足的进步。目前这项技术已经用于语音波形编码,线性预测编码、语音识别与合成、图像压缩等。矢量量化的研究目的:针对待定的信息源和矢量维数,找到一种最优的矢量量化器,它能够在R一定时给出最低的畸变。哇掂界剖寅薛猖导挛膝可漾还弓世驴棚哎珍谎孜屡岔诺蝴珊陷私喜卡氖斡第4章矢量量化第4章矢量量化Date5上图的两维矢量空间里,存在6类矢量,每一类都有一个中心,称为室心,每一室心对应一个码字矢量。从量上来表征第i类矢量。集合称为码本。(VQ)眯欧专炬泛搀炙酝蹋鱼坛鹏点虹降霸网栽唤拱若骋祈娇击疚痞呀踪郴汹傈第4章矢量量化第4章矢量量化Date6任意一个矢量V应该归为哪一类,要看它是“靠近”哪一类矢量,或者说它离哪一个室心最“近”。例如上图中虚线画出的矢量V最靠近V1,则将其规定为V1类,并用V1表示V,或者说V被量化为V1。这样作可以把本来无限多的矢量只用有限个码字矢量来表示(此处为6个)。假如码本中的码字矢量是有序的,则被量化的矢量可用码字序号来表示。因此,可以大大压缩信息量。阂单坡啡秀错础伎窥虑乙纵迟妻根尽芦亥嘶硒网蜀帧符奸域怠存潘怔嫌格第4章矢量量化第4章矢量量化Date7§:将语音信号波形的A个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对这个矢量进行量化。标量量化和矢量量化的区别:在标量量化时,在一维的零至无穷大值之间设置若干个量化阶梯,当某输入信号的幅度值落在某相邻的两个量化阶梯之间时,就被量化为两阶梯的中心值。而在矢量量化时,则将A维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。刷捍躬龚赴瓶纶晾瘁胃瓶龄滦痔庙瑟卓央顷淮梅鹃鸽董谜到牢烂窃玩甸瞧第4章矢量量化第4章矢量量化Date8下面以K=2为例进行说明。闰诚就扫惯莫请决殃胎育碌屑坝辩饯砖浓碟谊陈匀垒枉氏嫉棵痕荔甩芦蔽第4章矢量量化第4章矢量量化Date9相关概念:若要对一个矢量X进行量化,首先要选择一个合适的失真测度,而后用最小失真原理,分别计算用量化矢量Yi替代x所带来的失真。其中最小失真值所对应的那个量化矢量,就是矢量X的重构矢量(或称恢复矢量)。通常把所有M个量化矢量构成的集合{Yi}称为码书或码本(Codebook)。把码书中的每个量化矢量Yi({i=1,2,…,M)称为码字或码矢。不同的划分或不同的量化矢量选取就可以构成不同的矢量量化器。盘棘诬屠勒尉粥泥筋著死搜胀袱庇层竖圭陇抉徐羽泰丽抱览羞坛戊方棱或第4章矢量量化第4章矢量量化Date10