文档介绍：语音识别简介

索引
1. 语音识别的发展简史 .................................音识别的几个重要的思想。但是，伴随着这个年代的开始却是几个日本的实
验室进入语音识别领域，并构建一些专用的硬件用于语音识别系统。东京 Radio Research Lab 首先构建了一个
用硬件实现的元音识别器。语音信号经过精心制作的带通滤波器进行谱分析和通道输出谱加权处理后，用多数
逻辑决策电路选择输入语音中元音的识别结果。1962 年，东京大学进行了另一个音素识别器的硬件实现的尝试。
它使用过零率方法分离语音信号的不同部分，并进行识别。 1963 年，日本 NEC Lab 对数字进行语音识别的尝
试可以算得上最值得注意的工作，因为它不仅是 NEC 研究语音识别的开端，还导致一个长期的和卓有成效的研
究计划。
在 60 年代中，三个研究项目的开展对其后 20 多年的语音识别研究和开发产生了重大影响。第一个研究项
目在 RCA Lab 开始于 60 年代后期，目的是研究语音事件在时间刻度上不均匀性的现实解决办法。在能够可靠
检测出语音事件的始末点的基础上，发展了一套时间归正的基本方法，显著降低了识别匹配评分的变化程度。
几乎与此同时，前苏维埃的研究人员 Vintsyuk 提出使用动态规划来对齐两个不同长度的语音音段。尽管动态时
间弯折(DTW)概念的实质和用于连接词识别的算法雏形已经包含在 Vintsyuk 的工作中，但直到 80 年代才在西
方广为人知，并发扬光大。
60 年代的最后一项成就是研究人员 Reddy 用动态跟踪音素的方法进行连续语音识别的开创性工作。Reddy
的这项工作最终在 CMU（他在 60 年后期加入 CMU）培育出长期进行的并获极大成功的语音识别研究计划，在
连续语音识别系统的研究方面至今仍然保持世界领先的水平。
70 年代，语音识别研究取得了一系列具有里程碑意义的成就。首先，在模式识别思想、动态规划方法、线性预测思想等基础研究的成功应用的支撑下，孤立词发音和孤立语句发音的识别成为了可行的有用技术。70 年
代的另一个里程碑是在 IBM 开始了一个长期持续的、卓有成效的大词汇量连续语音识别研究的集体努力。他们
在 20 多年中研究了三项不同的工作，其中之一就是简单备忘录的听写系统 Tangorn。在这期间，AT&T Bell Lab
开展了一系列目的在于建立真正的非特定人语音识别系统的实验。研究提出了范围广泛的一类复杂的聚类算法，
用于确定能够表示大