文档介绍:湖南大学
硕士学位论文
基于DSP的非特定人孤立词语音识别系统的研究和设计
姓名:杨熙
申请学位级别:硕士
专业:电路与系统
指导教师:苏娟
20070410
基于 DSP 的非特定人孤立词语音识别的研究和设计
摘要
语音是人类进行交流的手段,因此,使用语音作为人机交互的途径对于使用
者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。近
年来,语音识别技术被广泛应用于工业控制、消费类产品及移动通信中,是高科
技应用领域的研究热点。本文就是在这种情况下对非特定人孤立词语音识别系统
做了一些探讨。
论文中首先介绍了孤立词语音识别系统的基本理论,分析了孤立词语音识别
的基本工作过程。接着介绍了两种常用的孤立词语音识别算法:DTW 和 HMM,对两
种算法进行了比较,根据比较结果并考虑本系统的特点,采用现在的主流算法
HMM,以提高识别率。提出了基于动态噪声的五状态端点检测算法,给出了详细的
算法流程图以及具体参数的设置,用 仿真了在有噪声和无噪声的情况
下,利用此算法对孤立词的端点检测效果,实验结果表明,此算法具有抗噪能力。
硬件设计方面,在介绍 TI 公司的 TMS320VC5409 DSP 芯片的基础上,阐述了
以 TMS320VC5409 DSP 为处理中心的孤立词语音识别系统的构成,给出了各部分的
具体硬件设计;软件设计方面,针对孤立词识别的特点,论述了系统软件的设计
过程。给出了语音识别各部分的流程图,并对各部分用 进行了仿真,
给出了仿真结果;建立了基于六个常用命令词的非特定人孤立词语音识别系统的
训练系统和仿真系统,并实现了对输入命令词的识别;论述了外挂 FLASH 的
TMS320VC5409 引导装载程序的设计过程。
关键词:语音识别;孤立词;非特定人;隐马尔可夫模型;DSP
II
硕士学位论文
Abstract
Speech is the means that human being carries munication. Therefore,
using speech as a puter interaction approach is the most natural way for
the user. At the same time, equipment miniaturization also demands omitting the
keyboard to economize volume. In recent years, the speech recognition technology
has been widely applied to industrial control, consuming product and mobile
communication. It is a hot research spot in high technology application field. This
thesis makes some discussions on speaker-independent isolated word speech
recognition system in this case.
The thesis first introduces the elementary theory of isolated word speech
recognition system and analyses the basic work process of isolated word speech
recognition. Then it introduces two kinds of isolated word speech recognition
algorithms mon use, Dynamic Time Warping (DTW) and Hidden Markov Mode
(HMM), carrying on parison to the both. According to parison results
and considering this system’s characteristic, it adopts mainstream algorithm HMM at
present to improve recognition rate. In this paper, it proposes a five-state endpoint