1 / 67
文档名称:

语音信号处理课件 第02章基础知识.ppt

格式:ppt   大小:2,421KB   页数:67页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音信号处理课件 第02章基础知识.ppt

上传人:分享精品 2017/11/22 文件大小:2.36 MB

下载得到文件列表

语音信号处理课件 第02章基础知识.ppt

文档介绍

文档介绍:第2章语音信号基础知识
人类的语言器官
语音产生过程
语音信号产生的数字模型
语音信号的特性
人类的听觉功能
1
1. 人类的语言器官
人类能以语言沟通,进而累积知识,形成文化,其中一个主要的原因,就是人类具有较其它生物优越的发音器官。
人类的发音器官能够产生多样性的声音,构成丰富的词汇,无疑是最关键的因素。
声音是一种波,能被人耳听到,它的振动频率在20~20 000 Hz之间。
1、人类的语言器官
2
1. 人类的语言器官
人体发音器官—肺、气管、喉(包括声带)和声道,肺是语音产生的能源所在;声带为产生语音提供主要的激励源;声道是指声门至嘴唇的所有器官:咽、鼻腔、口腔等,它们具有非均匀截面,且随时间变化,起共鸣器(或谐振器)的作用。
1、人类的语言器官
3
1. 人类的语言器官
图2-1 人类的发音器官
注:喉部以上的部分统称为声道;气管和肺在声门以下
1、人类的语言器官
4
1. 人类的语言器官
图2-2 最重要的发音器官之一:声带
(a)闭合状态(b)张开状态
甲状软骨杓状软骨环状软骨声门声带
1、人类的语言器官
5
人的说话过程分为五个阶段
(1)想说阶段:人
的说话首先是客
观现实在大脑中
的反映,经大脑
的决策产生了说
话的动机;接着
讲话神经中枢选
择恰当的单词、
短语以及按语法
规则的组合,以
表达他想说的内
容和情感。这个
阶段与大脑中枢
的活动有关。
(2)说出阶段:由
上阶段中枢的决
策,以脉冲形式
向发音器官发出
指令,使它们各
自相关的肌肉协
调地动作发出声
音来。另外还开
动另一个“反馈系
统”即讲话者的听
觉系统,来帮助
修正语音。
(3)传送阶段:说出
来的话语是一连串
的声波,凭借空气
为媒介传到听话者
耳中。
(4)接收阶段:听话
者从外耳收集到的
声波信息,经过中
耳的放大作用,到
达内耳,经内耳基
底内膜振动转化为
耳蜗内的毛细胞的
电位变化,由听觉
神经传给大脑。
(5)理解阶段:讲话
者大脑听觉神经中
枢收到脉冲信息
后,辨认出说话的
人及其所说的信
息,从而听懂讲话
者的话。
2、语音产生的过程
6


声带
声道
直流气流
声音
嘴唇
声压波
速度波
能源
激励源
谐振源
辐射源
交流气流
2、语音信号产生过程
7
发声机理
2、语音信号产生过程
8

语音的形成过程—空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,形成语音。
浊音(Voiced sounds) :声带绷紧,气流通过时会使得开口变成一开一闭的周期性动作,这时候就造成周期性的激发气流,如a,o;
清音(Unvoiced or Fricative sounds) :声带完全舒展,声道某部位收缩形成一个狭窄的通道,产生空气湍流,如t,d;
爆破音:声带完全舒展,声道的某部位完全闭合,一旦闭合点突然开启,空气压力快速释放,如b,p。
能被人耳听到,它的振动频率在20~20 000 Hz之间
2、语音信号产生过程
9
2. 语音产生过程
语音的两个重要声学特性:
浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在80~500 Hz左右。
共振峰(Fn , n=1,2,...):声道是一个谐振腔,它放大声音气流的某些频率分量而衰减其他频率分量,被放大的频率我们称之为共振峰或共振峰频率。
声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要,越多越精确。
2、语音信号产生过程
10