1 / 15
文档名称:

语音识别技术人工智能.doc

格式:doc   大小:30KB   页数:15
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音识别技术人工智能.doc

上传人:916581885 2022/5/21 文件大小:30 KB

下载得到文件列表

语音识别技术人工智能.doc

文档介绍

文档介绍:一:前沿
语音识别技术是2000年至2022年间信息技术领域十大重要的科技开展技术之一。它是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。语音识别 技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经,前三选识别率达99.96%;并且可以识别普通话与四川话两 种语言,到达实用要求。2000年7月在北京自然博物馆新开设的动物展馆中展出的具有语音识别口语对话功能
“熊猫〞,采用了我们研发非特定人连续语音识别系统,在展览馆 这样高噪声的环境下,该识别系统的识别率也超过了98%,到达实用要求。通过该系统观众与“熊猫〞自然对话可以了解熊猫的生活习惯、生理结构等信息,其形 式生动、活泼,吸引了大量的学生与参观者。
五、语音识别的几种根本方法
一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。
(1)基于语音学和声学的方法
  该方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有到达实用的阶段。   通常认为常用语言中有有限个不同的语音基元,而且可以通过其语音信号的频域或时域特性来区分。这样该方法分为两步实现:   第一步,分段和标号   把语音信号按时间分成离散的段,每段对应一个或几个语音基元的声学特性。然后根据相应声学特性对每个分段给出相近的语音标号   第二步,得到词序列   根据第一步所得语音标号序列得到一个语音基元网格,从词典得到有效的词序列,也可结合句子的文法和语义同时进行。
(2)模板匹配的方法
  模板匹配的方法开展比较成熟,目前已到达了实用阶段。在模板匹配方法中,要经过四个步骤:特征提取、模板训练、模板分类、判决。常用的技术有三种:动态时间规整(DTW)、隐马尔可夫〔HMM〕理论、矢量量化〔VQ〕技术。   
1、动态时间规整(DTW)   语音信号的端点检测是进行语音识别中的一个根本步骤,它是特征训练和识别的根底。所谓端点检测就是在语音信号中的各种段落(如音素、音节、词素)的始点和终点的位置,从语音信号中排除无声段。在早期,进行端点检测的主要依据是能量、振幅和过零率。但效果往往不明显。60年代日本学者Itakura提出了动态时间规整算法(DTW:DynamicTimeWarping)。算法的思想就是把未知量均匀的升长或缩短,直到与参考模式的长度一致。在这一过程中,未知单词的时间轴要不均匀地扭曲或弯折,以使其特征与模型特征对正。  
 2、隐马尔可夫法(HMM)   隐马尔可夫法(HMM)是70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破。HMM方法现已成为语音识别的主流技术,目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。可见HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型。   3、矢量量化(VQ)   矢量量化(VectorQuantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是:将语音信号波形的k个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对矢量进行量化。量化时,将k维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离〞最小的区域边界的中心矢量值。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最正确的矢量量化系统,用最少的搜索和计算失真的运算量,实现最大可能的平均信噪比。   核心思想可以这样理解:如果一个码书是为某一特定的信源而优化设计的,那么由这一信息源产生的信号与该码书的平均量化失真就应小于其他信息的信号与该码书的平均量化失真,也就是说编码器本身存在区分能力。   在实际的应用过程中,人们还研究了多种降低复杂度的方法,这些方法大致可以分为两类:无记忆的矢量量化和有记忆的矢量量化。无记忆的矢量量化包括树形搜索的矢量量化和多级矢量量化。
〔3〕神经网络的方法
  利用人工神经网络的方法是80年代末期提出的一种新的语音识别方法。人工神经网络(ANN)

最近更新

2026年党规知识竞赛试题及一套参考答案 17页

2026年刑法培训考试题及答案(必刷) 15页

2026年初级经济师之初级经济师基础知识考试题.. 105页

2026年注册建筑师考试题库200道及答案【最新】.. 84页

2026年注册造价工程师考试题库200道及答案【名.. 86页

2026年反恐防暴考试题库附参考答案(能力提升.. 12页

2026年疾病控制题库附完整答案【名师系列】 41页

2026年税务廉政知识测试题(完整版) 14页

2026年自考专业(会计)考试题库200道附答案【轻.. 84页

2026年安全员考试题库300道附答案【预热题】 85页

2026年安徽卫生健康职业学院单招职业倾向性考.. 43页

2026年宗教审核员考试题库(典优) 40页

2026年高级社会工作师考试200道【培优】 87页

2026青海油田招聘参考题库附答案 46页

c语言考期末试题(word) 13页

2026年暗镜心理测试题库附答案 40页

数组c语言考试题库(a卷) 13页

2026年民族宗教执法考试题库(历年真题) 40页

新安全生产法知识竞赛试题库及完整答案(必刷.. 43页

2026年江苏省泰州市单招职业倾向性测试题库附.. 43页

2026年江阴保安考试题及答案1套 15页

项目英文策划建议书 7页

项目流程编制步骤建议书 5页

项目实施监控批准建议书 5页

2026年注册会计师(CPA)考试题库200道及参考.. 100页

青龙文化发展建议书 6页

青年人生指南建议书 6页

需求自主实施项目建议书 5页

集团学校发展建议书 5页

2025交通运输部所属事业单位第七批统一招聘10.. 18页