文档介绍:第二章媒体信息处理技术
音频处理技术
音频数字化处理
MIDI音乐合成
多媒体声音卡
音频文件格式
音频处理技术
基本内容:音频数字化处理,MIDI音乐合成,
多媒体声音卡,音频文件格式
音频数字化处理
①波形声音:基于振动波(信号化)描述的声音;
可形成数字波形文件
②语音:人的声道发出的声音—语义化描述的语言形式
③音乐:通过乐谱规范表达的乐曲—符号化描述的声音;
可形成数字音乐文件
(1)声音的模拟信号表示方法
Sound = Bline + A×f(t)
①基线Bline:提供一个测量模拟信号的基准点
②周期T:两个相邻信号的波峰(或波谷)之间的时间间隔,
用于表示信号的快慢即声音发生的频率f;f = 1/T(Hz)
③振幅A:波形峰点(或谷点)与基线之间的距离
用于表示信号的强弱即声音的响度
(2)声音的质量特性
SQuality = (Tone, Volume, TQuality)
①音调(Tone):声音频度与音域宽窄程度,与频率f有关.
音调可按频率分为:
· 次声(f <20Hz)
· 可听声(20Hz≦f≦20KHz)
· 超声(f>20KHz)
②音量(Volume):声音响度亦或音强,与振幅A成正比.
③音质(Tone Quality):声音在听觉上的优美程度,
亦称音色;
是振幅与频率的优化组合(基音+ 谐音)
声音的质量通常以音频信号的带宽来衡量
音频(Audio):声音的同义词
频率范围为:20Hz~20KHz
人的声带一般为:50~500 Hz
常见的音频带宽:
①电话音频: 200Hz~
②无线电广播调幅(AM)声:50Hz~7KHz
③无线电广播调频(FM)声:20Hz~15KHz
④高保真(HiFi)立体声: 20Hz~20KHz
①放大:使信号幅度达到可采集与变换要求;
并滤除高频干扰和噪声
②采样:模拟信号离散化
以固定的采样周期T对波形Xa(t)的幅值进行抽样,
得到一个离散的序列X(n).采样值:
X(n)= Xa(nT);
N = 1,2,3,……(离散点的个数),
T = 1/f,f为采样频率
③量化:离散信号数字化
把每个采样值(模拟量)转换成数字量,
并用n个二进制数表示;n越大,量化精度越高
量化值:
量化误差:
注意点:a. 实现量化的过程称A/D变换
b. 均匀量化后的信号称脉冲编码调制(PCM)信号
c. A/D变换一般是均匀量化;因而称PCM量化
④编码:数字信号格式化
把每个量化值表示成二进制存储位形式的字长
8位字长≡ 8bit (1个Byte)
若要进行数据压缩编码时,需采用相关算法及数据格式表示
(1)采样频率fc:单位时间间隔(采样周期)内所采集的样本数
fc越高,数字化后的信号质量就越高;但存储量也越大
(2)量化字长:用采样周期分割样本波形的振幅空间的等分数,
表示为采样值的二进制位数;因而称采样精度或样本字长.
量化字长(位数):
4bit16级(n=16),8bit256级,16bit65536级.
(3)声道数:一次采样所记录的声音波形个数
单声道—产生一个声音波形;
双声道—产生两个声音波形(立体声)
声道数增加,:
存储量=(采样频率×量化字长×声道数)/8 (Byte/s)
采样定理:若fc≧2fsmax (fsmax为最大信号频率),
则可保证量化后的信号具有还原为模拟信号的能力.
例:人耳听觉的上限频率为20KHz;则fc≧40KHz
MIDI音乐合成
音乐设备数字接口MIDI的作用:
定义电子音乐设备连入计算机的电缆和端口标准;
定义计算机与MIDI设备之间进行信息交换的一整套规则,
包括电子乐器之间传送数据的通信协议
1988年,MIDI正式成为数字式音乐的一个国际标准
1. 数字音乐的生成方法
· 波形声音数字化方法生成数字波形文件
· MIDI方法(电子音乐合成方法) 生成数字音乐文件
( 乐谱的数字式描述— MIDI消息)