1 / 103
文档名称:

语音信号处理第六章语音识别.ppt

格式:ppt   大小:760KB   页数:103页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音信号处理第六章语音识别.ppt

上传人:阿哈哈哈吧哈哈哈 2022/3/17 文件大小:760 KB

下载得到文件列表

语音信号处理第六章语音识别.ppt

文档介绍

文档介绍:第六章 语音识别(speech recognition)
§ 语音识别技术的一般概念
§ 语音识别的原理和识别系统的组成
§ 动态时间规整DTW
§ 基于统计模型框架的识别法(HMM)
§ 说话人识上反映了人脑功能的若干基本特性,是一种更接近人的认知过程的计算模型。
构***工神经网络的三个基本要素是:
1神经元
2 网络拓扑
3 网络的训练算法
。首先必须将连续的
讲话分解为词、音素等单位,其次要建立一个
理解语义的规则。
。语音模式不仅对不同的说话人
不同,对同一说话人也是不同的,例如,一个
说话人在随意说话和认真说话时的语音信息是
不同的。一个人的说话方式随着时间变化。
五、语音识别的主要问题
。说话者在讲话时,不同的词可能
听起来是相似的。这在英语和汉语中常见。
、字的语音特性受上下文的影响,
以致改变了重音、音调、音量和发音速度等。
,致使识
别率低。
§ 语音识别原理和识别系统的组成
一、语音识别的步骤和框图 二、预处理
三、语音特征参数的提取
四、模式匹配
语音识别原理
模式匹配原理: 未知语音模式与已知语音模式逐一比较,最佳匹配的参考模式作为识别结果。
识别步骤:
学****训练 分析语音特征参数,建立模板库;
识别测试 按照一定的测度和准则与系统模型进行比较,通过判决得出结果;
语音识别本质就是模式识别
语音识别层次模型

方法,采用语音分析技术预先分析出这种方法所
要求的语音特征参数,这些语音参数作为标准模
式由计算机存储起来,形成标准模式库,称为模
板。这个过程称为“学****和“训练”。在某些识别
系统中,还备有专家知识库,其中存放由语言学
家总结的各种知识,如同音字判决规则、语法规
则、语义规则等。
一、语音识别的步骤
2. 识别:将输入语音进行处理,提取特征参数,
和模式库中的模板进行比较匹配,作出判决。
预处理
语音特征
参数分析
失真测度
计算
识别决策
标准
模板
专家
知识
模式匹配
语音识别的框图
语音信号的放大、防混叠滤波、自动增益控制、模数转换、消除噪声、端点检测。
二、预处理
端点检测:从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能使处理的时间减到最小,而且能排除无声段的噪声干扰。端点检测的正确与否影响到识别率的高低。
语音端点检测的方法:短时能量和短时过零率。
基于幅度谱高阶统计量的鲁棒语音端点检测算法
基于倒谱特征的带噪语音端点检测
基于子带能量特征的语音端点检测
特征参数和识别方法有关系,是语音识别的关键之处,选择的好坏直接影响语音识别的精度。
语音特征参数包括:短时平均能量、短时过零率、频谱、三个共振峰频率(F1、F2、F3的频率值、带宽、幅值)、线性预测系数、LPC倒谱和Mel倒谱等。
三、语音特征参数的提取
X = fft(x,2^nextpow2(2*size(x,1)-1));
%
S= abs(X).^2; %短时功率谱
R = ifft(S); %
R = R./m; % 有偏自相关估计
[a,e] = levinson(R,N);

%利用Levinson-Durbin算法 求出预测系数a,和预测误差e
Lpc系数
Lpc系数
- -
- -
- -
求lpcc系数
tmp=x(i,:) .* hamming(FrameLen)';
tmp=lpc(tmp,FrameLen-1);
tmp=rceps(tmp);
tmp=tmp(2:n_lpcc+1) .* CepWe