1 / 34
文档名称:

特征提取.ppt

格式:ppt   大小:8,706KB   页数:34页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

特征提取.ppt

上传人:cjc201601 2020/1/13 文件大小:8.50 MB

下载得到文件列表

特征提取.ppt

相关文档

文档介绍

文档介绍:特征提取报告人:汤旭国学号:1130349093*语音识别应用预处理模块:对输入的原始语音信号进行处理滤除掉不重要的信息及背景噪声语音分帧(近似认为语音信号在10-30ms内是短时平稳的)预加重(提升高频部分)等处理特征提取:去除语音信号中对于语音识别无用的冗余信息保留反映语音本质特征的信息即提取出反映语音信号特征的关键特征参数形成特征矢量序列,以便用于后续处理声学模型训练:根据训练语音库的特征参数训练出声学模型参数在识别时可以将待识别的语音的特征参数同声学模型进行匹配,得到识别结果。语言模型训练:语言模型是用来计算一个句子出现概率的概率模型。它主要用于决定哪个词序列的可能性更大,或者在出现了几个词的情况下预测下一个即将出现的词语的内容。语音解码和搜索算法:针对输入的语音信号,根据己经训练好的HMM声学模型、语言模型及字典建立一个识别网络根据搜索算法在该网络中寻找最佳的一条路径,这个路径就是能够以最大概率输出该语音信号的词串语音是怎么产生人通过改变声道的shape发出的不同声音。声道的shape包括舌头,牙齿等。 s(MelFrequencyCepstralCoefficents)是一种能准确描述这个包络的特征,在语音识别人工特征方面,可谓是一枝独秀主要的几个概念声谱图(Spectrogram)倒谱分析(CepstrumAnalysis)Mel频率分析(Mel-FrequencyAnalysis)梅尔倒频谱系数(Mel-FrequencyCepstralCoefficients)一、声谱图(Spectrogram)FFTFFTFFT