文档名称：

连接数字串语音识别.pdf

格式：pdf 大小：913KB 页数：4页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

连接数字串语音识别.pdf

上传人:1017848967 2017/8/18 文件大小：913 KB

下载得到文件列表

连接数字串语音识别.pdf

相关文档

文档介绍

文档介绍：Ξ
云南大学学报( 自然科学版) , 2002 , 24 ( 4) : 262~ 53 - 1045/ N ISSN 0258 - 7971
Journal of Yunnan University
连接数字串语音识别
尉洪, 杨鉴
(云南大学信息与电子科学系,云南昆明 650091)
摘要:介绍了语音识别的一般方法,基于隐马尔可夫( HMM) 统计模型和 HTK 工具包,声学层选用单音子
和二音子识别单元,给出了一个简单的,母语为非汉语的非特定人连接数字串识别实验.
关键词:数字串识别;隐马尔可夫模型;二音子;非母语语音识别
Ξ中图分类号: TP 391. 42 文献标识码:A 文章编号:0258 - 7971 (2002) 04 - 0262 - 04
语音识别是语音信号处理的一个重要研究方数或基于 Mel Scale 的系数(Mel 频率刻度倒
向,是模式识别的一分支. 连接数字串识别是连谱系数) ,然后辅之以帧能量等其它特征参数.
续语音识别的一个特例,一方面与孤立字词识别相下面的特征参数是比较具有代表性的: ①基
类似,它属于小词汇量的语音识别,另一方面它又因周期; ②过零率; ③临界带特征矢量; ④L PC 预
具有一些连续语音识别的特点,比如,必须建立相测系数特征矢量; ⑤L PC 倒谱特征矢量; ⑥Mel 倒
应的声学层识别模型,而相应的统计语言模型则不谱特征矢量; ⑦L SP 特征矢量; ⑧前 3 个共振峰
必建立,数字之间没有明显的停顿,数字串的长度频率 F1 ,F2 ,F3 ; ⑨语音帧能量.
不固定,识别过程中必须考虑音素之间的协同发音
现象等.
在研究语音识别的方法上,相对成熟的主要方
法有:模板匹配,矢量量化,隐马尔可夫统计模型,
神经网络等. 这些方法各有优缺点,针对数字串的
语音识别,我们采用隐马尔可夫统计模型的方法.
1 语音识别的一般过程
语音识别系统与传统的模式识别系统类似,具图 1 语音识别的一般过程
有特征参数的提取(语音分析) 和识别算法(或模型) Fig. 1 Basic process of speech recognition
的选取 2 个关键步骤,具体实现过程分 2 个阶段进
行,即①样本模式的训练, ②未知模式的识别[1 ] (如 1. 2 识别模型的选取目前常采用的识别模型主
图 1) . 要有 3 类,它们分别是 HMM 模型,人工神经网络
1. 1 特征参数的提取特征参数的提取与选择是模型,矢量量化模型.
语音识别中的一个非常重要的环节特征参数有时
, 2 HMM 模型
域参数和变换域参数两类. 好的特征参数,既可以具
有很高的模式区分能力,又可以节省大量的存储空 HMM 模型是一个具有马尔可夫性的随机模
间,起到很好的数据压缩作用. 目前在语音识别中主型,它具有很强的时间处理能力. 我们一般研究的
要采用基于线性预测分析(LPC) 技术得到的倒谱系是一阶的 HMM 模型,其隐含的意义有 2 层:一是
收稿日期:2001 - 12 - 03
基金项目:云南省自然科学基金赞助(云南民族汉话语音数据库与语音识别研究,99F0016M) .
作者简介:尉洪(1973 - ) ,男,云南人,硕