文档介绍：第六章语音识别（speech recognition）
§ 语音识别技术的一般概念
§ 语音识别的原理和识别系统的组成
§ 动态时间规整DTW
§ 基于统计模型框架的识别法(HMM)
§ 说话人识上反映了人脑功能的若干基本特性，是一种更接近人的认知过程的计算模型。
构***工神经网络的三个基本要素是：
1神经元
2 网络拓扑
3 网络的训练算法
。首先必须将连续的
讲话分解为词、音素等单位，其次要建立一个
理解语义的规则。
。语音模式不仅对不同的说话人
不同，对同一说话人也是不同的，例如，一个
说话人在随意说话和认真说话时的语音信息是
不同的。一个人的说话方式随着时间变化。
五、语音识别的主要问题
。说话者在讲话时，不同的词可能
听起来是相似的。这在英语和汉语中常见。
、字的语音特性受上下文的影响，
以致改变了重音、音调、音量和发音速度等。
，致使识
别率低。
§ 语音识别原理和识别系统的组成
一、语音识别的步骤和框图二、预处理
三、语音特征参数的提取
四、模式匹配
语音识别原理
模式匹配原理：未知语音模式与已知语音模式逐一比较，最佳匹配的参考模式作为识别结果。
识别步骤：
学****训练分析语音特征参数，建立模板库；
识别测试按照一定的测度和准则与系统模型进行比较，通过判决得出结果；
语音识别本质就是模式识别
语音识别层次模型

方法，采用语音分析技术预先分析出这种方法所
要求的语音特征参数，这些语音参数作为标准模
式由计算机存储起来，形成标准模式库，称为模
板。这个过程称为“学****和“训练”。在某些识别
系统中，还备有专家知识库，其中存放由语言学
家总结的各种知识，如同音字判决规则、语法规
则、语义规则等。
一、语音识别的步骤
2. 识别：将输入语音进行处理，提取特征参数，
和模式库中的模板进行比较匹配，作出判决。
预处理
语音特征
参数分析
失真测度
计算
识别决策
标准
模板
专家
知识
模式匹配
语音识别的框图
语音信号的放大、防混叠滤波、自动增益控制、模数转换、消除噪声、端点检测。
二、预处理
端点检测：从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能使处理的时间减到最小，而且能排除无声段的噪声干扰。端点检测的正确与否影响到识别率的高低。
语音端点检测的方法：短时能量和短时过零率。
基于幅度谱高阶统计量的鲁棒语音端点检测算法
基于倒谱特征的带噪语音端点检测
基于子带能量特征的语音端点检测
特征参数和识别方法有关系，是语音识别的关键之处，选择的好坏直接影响语音识别的精度。
语音特征参数包括：短时平均能量、短时过零率、频谱、三个共振峰频率（F1、F2、F3的频率值、带宽、幅值）、线性预测系数、LPC倒谱和Mel倒谱等。
三、语音特征参数的提取
X = fft(x,2^nextpow2(2*size(x,1)-1));
%
S= abs(X).^2; %短时功率谱
R = ifft(S); %
R = R./m; % 有偏自相关估计
[a,e] = levinson(R,N);

%利用Levinson-Durbin算法求出预测系数a,和预测误差e
Lpc系数
Lpc系数
- -
- -
- -
求lpcc系数
tmp=x(i,:) .* hamming(FrameLen)';
tmp=lpc(tmp,FrameLen-1);
tmp=rceps(tmp);
tmp=tmp(2:n_lpcc+1) .* CepWe