1 / 34
文档名称:

语音处理与语音识别简介).ppt

格式:ppt   大小:2,078KB   页数:34页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音处理与语音识别简介).ppt

上传人:q1188830 2019/7/26 文件大小:2.03 MB

下载得到文件列表

语音处理与语音识别简介).ppt

相关文档

文档介绍

文档介绍:*语音处理与语音识别简介2014年9月*主要内容数字音频基础知识音频处理基础知识语音识别技术简介*●是指自然声●是机械振动在弹性介质中传播的机械波●是随时间连续变化的物理量●声音概念●振幅—波的高低幅度,表示声音的强弱●周期—两个相邻波之间的时间长度●频率—每秒钟波振动的次数,单位是Hz●声音特性*声音的强度(响度或音量),与声波振幅成正比;唱盘、CD盘等声音载体中的音强不变,通过播放设备的音量控制可改变聆听时强度;音频处理软件可提高声源音强声音的特色,主要影响因素是复音;复音指具有不同频率和不同振幅的混合声音,其中最低频率是“基音”,是声音的基调,其他频率的声音为“谐音(泛音)”代表声音的高低,与频率有关;使用音频处理软件对声音的频率进行调整时,其音调也会随之发生变化●声音的三要素●音调——(高低)●音强——(强弱)●音色——(特质)*●声音的频率范围*数字音频声音是振动的机械波,话筒把机械振动转换成电信号,用随时间连续变化的物理量表示,称之为模拟音频。在计算机内部,所有的信息均以数字表示,代表声音信号的物理量也用一系列数字表示,称之为数字音频。模拟音频在时间上是连续的,而数字音频则是一个数据序列,在时间上不具备连续性,因此只能是断续的。当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个电压幅度值,称之为采样。采样得到的表示声音强弱的模拟电压幅值是连续的,把无穷多个电压幅值用有限个数字表示,称之为量化。*●采样采样过程按固定间隔采样声音波形采样声音波形之后的结果声波是连续信号,或称连续时间函数x(t)。用计算机处理这些信号时应先离散化,即按一定的时间间隔(T)取值,得到x(nT)(n为整数),T称采样周期,1/T称采样频率(每秒钟采样次数),x(nT)称采样值(或离散信号)采样概念*设连续信号x(t)的频谱为x(f),以采样间隔T采样得到离散信号x(nT)如果满足:当|f|≥fc(fc是信号高端截止频率)时,有T≤1/(2fc)或fc≤1/(2T)则可由x(nT)完全确定x(t)。当fN=1/(2T)时,称fN为奈奎斯特频率采样定理奈奎斯特(Nyqust)采样定理:只要采样频率大于或者等于信号中所包含的最高频率的两倍;即当信号是最高频率时,每个周期至少采样两个点,则理论上就可以完全恢复原来的信号。●采样采样方法语音信号频谱在高频处迅速下降,但非限带。应用时只对一定频率范围内的信号感兴趣,就可以对经滤波限带的音频信号采样。这样,在采样前,用一个锐截止模拟低通滤波器对音频信号进行滤波。*●量化通过采样得到的表示声音强弱的函数x(nT)是连续的,为把x(nT)存入计算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合x(nT)量化概念量化原理先将整个幅度划分成为有限个小幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。如果量化值是均匀分布的,称为均匀量化。设为量化阶距,量化器最大范围是Xmax,则:=2Xmax/2B量化电压幅值之后的结果