1 / 11
文档名称:

基于fisher比的梅尔倒谱系数混合特征提取方法.doc

格式:doc   大小:93KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于fisher比的梅尔倒谱系数混合特征提取方法.doc

上传人:小雄 2021/6/27 文件大小:93 KB

下载得到文件列表

基于fisher比的梅尔倒谱系数混合特征提取方法.doc

文档介绍

文档介绍:基于Fisher比的梅尔倒谱系数混合特征提取方法
摘要:
针对语音识别中梅尔倒谱系数(MFCC)对中高频信号的识别精度不高, 并且没有考虑各维特征参数对识别结果影响的问题,提出基于MFCC、逆梅 尔倒谱系数(IMFCC)和中频梅尔倒谱系数(MidMFCC),并结合Fisher准 则的特征提取方法。首先对语音信号提取MFCC、IMFCC和MidMFCC三种特 征参数,分别计算三种特征参数中各维分量的Fisher比,通过Fisher比 对三种特征参数进行选择,组成一种混合特征参数,提高语音中高频信息 的识别精度。实验结果表明,在相同环境下,新的特征与MFCC参数相比, 识别率有一定程度的提高。
关键词:识别精度;梅尔倒谱系数;逆梅尔倒谱系数;中频梅尔倒谱 系数;Fisher准则
中图分类号:TP391
文献标志码:A
Parameter extraction method for Mel frequency cepstral coefficients based on Fisher criterion
Abstract:
Concerning the low identification precision of Mel Frequency Cepstral Coefficients (MFCC) parameters in high frequency signals and the problem that the influence of each dimension feature parameters has not been considered to identify, the method of extracting features based on MFCC, IMFCC (Inverted MFCC) and MidMFCC (Mid-frequency MFCC) combined with Fisher criterion was adopted. Extracting MFCC, IMFCC and MidMFCC parameters from speech signals and calculating the Fisher ratio of components of three parameters, useful parameters were chosen by using Fisher standard and a mixture feature was constructed to improve mid-frequency and high frequency recognition accuracy. The experimental results show that the new feature has better recognition results compared with MFCC in the same environment.
Key words:
recognition accuracy ; Mel Frequency Cepstral Coefficient (MFCC); Inverted MFCC (IMFCC); Mid-frequency MFCC (MidMFCC); Fisher criterion
0引言
在语音识别中,最终的训练和识别环节是针对语音的特征参数进行 的,因此特征提取在识别过程中作用非常关键[1]。
目前,常用的特征参数主要有线性预测系数(Linear Prediction Cepstral Coefficent, LPCC )、感性预测系数(Perceptual Linear Predictive , PLP ) 及梅尔倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC),其中LPCC与PLP对环境的依赖性较高,抗噪能力
差[2],所以目前应用较多的是MFCCo MFCC系数描述的是语音在频率上的 能量分布,使用一串在低频区域交叉重叠排列的三角滤波器组,获得语音 的频谱信息,但是由于低频区域使用的滤波器数量较多,分布密集,同时 中高频区域使用的滤波器数量较少,分布稀疏,造成MFCC随着频率的提 高,计算精度下降,对最终的识别结果会造成影响,特别是当识别基元选 择为音节或词组时,在两个读音相近的音节或词之间误识率较高。目前对 于语音的特征参数的提取,提出了许多改进的算法,如针对短时傅里叶变
换无法兼顾时间和频率分辨率,采用分数阶傅里叶变换或小波变换等调频 信号的处理方法代替短时傅里叶变换对语音信号进行处理[3],或者针对 MFCC参数对于语音信号描述的