文档介绍:音频技术概述|第1
Inter音频产业
随着Inter的普及,Inter也迅速成为一个音乐发行渠道。消费者可以从Inter上把他们最喜欢的歌曲或新近发行的歌曲下载到便携式播放器中。固态音频压缩技术不断推进的里程和具有庞大容量的各种便携式存储媒体的出现,使Inter音频产业呈现欣欣向荣的景象。
一些音像公司,500)(this)">如BMG、EMI和华纳,均向Inter内容提供商提供音乐,而Inter内容提供商则将音乐内容提供给消费者下载。这便产生了一个重要的问题,即如何保护Inter发行渠道中的版权。于是,一些在Inter上提供数字权利管理(DRM)的软件公司,如Liquid Audio、Intertrust、Microsoft和Verence便跻身进入这一领域。这种业务的成功在很大程度上取决于SDMI(安全数字音乐倡议组织),该机构联手录音公司、消费电子公司、器件(半导体芯片)供应商及DRM公司,建立安全方针,确保Inter音乐发行得到保护并具有合法性。以上是这一快速发展领域的总体状况。
MPEG 音频
MPEG是高保真音频压缩的一个国际标准(采用于1992年)。这个标准分为3个层面:II层、III层和I层。流行的MP3是MPEG-1的III层。AAC(高级音频编码)是MPEG的第二阶段(MPEG-2),MPEG-2是MPEG-1的改进。这个新标准采用于1997年。在同样的压缩比率下,AAC比MP3提供更佳的音频质量。MPEG-2和MPEG- 或48kHz,比特率在32kbps至128kbps之间。这些音频压缩标准全都利用了人类听觉系统的直觉特征心理声学。
心理声学
通过将心理声学模型应用到音频比特流中,可以消除大量无关的音频数据。这一模型使用了频域和时域中强信号的屏蔽效果。
频率域屏蔽
当一个强信号(屏蔽信号)出现时,500)(this)">与它同时产生的一个较弱信号(被屏蔽信号)就可能被我们的听觉系统所忽略,前提是在频率域中的被屏蔽信号与屏蔽信号十分相近。这称为频率屏蔽效果(如图1所示)。480Hz将被较强的500Hz信号所屏蔽。通过采集这些频率域在屏蔽效果下的有声和无声的音频水平,可以获得屏蔽阈值。任何振幅比阈值低的信号人耳都听不见,因此可以去除。这将大幅度减少用于对音频信号进行编码的数据量。
当这个屏蔽信号变弱时,阈值曲线也随着降低,直到一个水平,到了这个水平后,无论屏蔽信号是否继续减弱,阈值曲线都将保持不变。只要信号大于3 dB,人耳就能听到音频内容。
时间域屏蔽(当时屏蔽)
这种屏蔽效果不仅在频域发生,而且也在时域发生。当出现一个强信号,并在极短的间隔内跟随一个弱信号时,这个弱信号就几乎被人耳忽略了。这是人类听觉反应系统的感知效果。
这种信号屏蔽能力取决于其频率位置和响度。音频编码器将使用这一信息(信号屏蔽比率SMR),利用允许的编码比特数对输入声频信号进行编码。
算法
基于以上的屏蔽技术,典型的音频编码过程如下所示:
,大约有32个关键(critical)子带-->子带滤波。
。