1 / 29
文档名称:

多媒体技术音频编码基础和标准.ppt

格式:ppt   大小:464KB   页数:29页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多媒体技术音频编码基础和标准.ppt

上传人:相惜 2022/9/4 文件大小:464 KB

下载得到文件列表

多媒体技术音频编码基础和标准.ppt

相关文档

文档介绍

文档介绍:


1
编辑ppt

一、压缩编码的必要性
二、音频编码基础
三、音频编码的分类
2
编辑ppt
压缩编码的必要性



1
编辑ppt

一、压缩编码的必要性
二、音频编码基础
三、音频编码的分类
2
编辑ppt
压缩编码的必要性
多媒体音频数据的存储和传输中,必须压缩数据。利用音频编码压缩数据。
高质量音频
采样数据率(每秒比特数):
信号类型
频率范围
(
H
Z
)
采样率
(
KH
Z
)
量化精度
(位)
数据率
(位
/
秒)
电话话音
200
~
3400
8
8
64k
高质量音频
20
~
20K

16

压缩编码数据率:
信号类型
数据率
(位
/
秒)
压缩编码
标准
数据率
(

/

)
数据率
(
字节
/
分钟
)
IP
电话话音
64k


40
K


128k
960k
3
编辑ppt
压缩编码的必要性
数据压缩造成音频质量的下降、计算量的增加。人们在实施数据压缩时,要在音频质量、数据量、计算复杂度三方面进行综合考虑。
各领域的专家致力于算法的研究,众多的企业致力于芯片和产品的研制,国际标准化组织也先后推出一系列建议。
高质量高效率的音频压缩技术广泛地用于多媒体应用、音像制品、数字广播、数字电视等领域。
4
编辑ppt
音频编码基础
从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。
1、时域信息的冗余度
2、频域信息的冗余度
3、人的听觉感知机理
5
编辑ppt
1、时域信息的冗余度
幅度的非均匀分布 一般语音中小幅度样本比大幅度样本出现的概率要高,并且通话中必然会有间隙,更会出现大量低电平样本。,可以采用非均匀量化对其编码。
样本间的相关 对语音波形的分析表明,取样数据的最大相关性存在于邻近样本之间,并且取样速率越高,样本间相关性越强。根据相关性,可利用N阶差分编码技术,进行有效的数据压缩。
6
编辑ppt
1、时域信息的冗余度(续)
周期之间的相关 虽然语音信号需要一个电话通路提供整个200~3400HZ的带宽,但在特定的瞬间,某声音只有少数频率成分在作用,它们在周期域周期间,存在着一定的相关性。
基音之间的相关 人说话声音分为浊音和清音,浊音不仅有周期间的冗余度,还对应于音调间隔的长期重复波形。
7
编辑ppt
1、时域信息的冗余度(续)
静音系数 两人间打电话,平均每人的讲话时间为通话总时间的一半,另一半时间听对方讲。听的时候—般不讲活,而即使是在讲话的时候,也会出现停顿。声音间隔本身就是一种冗余,若能正确检测出该静比段,便可“插空”传输更多的信息。
长时自相关函数 上述周期间等相关性,都是在20ms间隔内进行统计的所谓短时自相关。如果在较长的时问间隔(如几十秒)进行统计,便得到长时自相关函数。
8
编辑ppt
2、频域信息的冗余度
非均匀的长时功率谱密度 在相当长的时间间隔内进行统计平均,。从统计的观点看,这意味着没有充分利用结定的频段,有固有的冗余度
语音特有的短时功率谱密度 语音信号的短时功率谱,在某些频率上出现峰值,这些峰值频率不只一个,但最主要的是第一和第二个,由它们决定不同的语音特征。
9
编辑ppt
3、人的听觉感知机理
人的听觉具有掩蔽效应 当两个响度不同的声音作用于人耳时,响度较高的频率成分会影响对响度较低频率成分的感受。
人耳对不同频段的声音敏感度不同 低频成分容易掩蔽高频成分。即使是对同样声压级的声音,人耳的实际感觉到的音量也是随频率而变化。
人耳对语音信号的相位变化不敏感 入耳听不到或感知极不灵敏的声音分量都不妨视为冗余的。
10
编辑ppt
音频编码的分类
音频编码分位三类:
基于音频数据的统计特性进行编码,其典型技术是波形编码。其目标是使重建语音波形保持原波形的形状;
基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频的特性;
基于人的听觉特性,进行感知编码。
11