1 / 6
文档名称:

语音识别.doc

格式:doc   大小:22KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音识别.doc

上传人:wxc6688 2019/12/31 文件大小:22 KB

下载得到文件列表

语音识别.doc

相关文档

文档介绍

文档介绍:语音识别系统概述    1 语音识别系统在移动设备上的应用苹果公司收购的siri,是一种语音识别系统,其首次在iphone4s上的应用,获得了巨大的成功,这也是语音识别系统第一次真正意义上在手机上的应用,可以见的前景广阔。微软公司开发的人工智能助理Cortana,在微软收购诺基亚后将这款语音识别系统应用于诺基亚lumia上面,也受到了众多诺基亚粉丝的追捧。针对计算机语音输入的软件是由IBM公司开发的ViaVoice,这款软件能够通过语音对计算机进行简单的控制,甚至还支持一些方言的输入如:四川话,东北话等。我觉得语音识别可以和人工智能结合起来,一则可以开发出通过语音控制的机器人如果机器人够智能人们还可以和它对话甚至帮人们出主意解决生活中的一些问题;二则可以开发出类似个人秘书的软件,当然siri也算个人秘书不过siri还不够智能,很多语音识别不了或者识别不准确。电影《云端情人》里面的语音识别软件功能就非常强大,可以自我学****甚至还可以达到和人谈恋爱的地步这就非常高端了;另外语音识别功能还可以用于一些特殊场合来控制某些关键部件,在手动控制失灵的情况下,紧急情况下可以用语音来作为后备控制。2 语音识别的难点发音差距大,每个人的发音****惯有很大的差距,就连英文的发音方式都分为英式发音和美式发音,无论中文还是英文都有大量词汇,不少人有对一些单词或者是汉字的长期发音错误这些都应该要纳入考虑。环境噪音影响识别能力,环境的噪音也会成为一种电信号进入语音识别系统中从而干扰其识别能力。提取人语音中的情绪信息,现代的语音识别系统很难能从人的语音中提取情绪信息。3 完备的语音识别系统应具有的能力能识别我们所表达的内容,这是最基本的功能。语言的种类,siri需要人工设置语音的种类才能识别,这就导致了语言不能混合使用,并且也很麻烦。能鉴别说话人的身份,每个人的音调音色都不相同,鉴别说话人的身份,这是可以实现的并不像电视电影里面通过录音来破解这个系统,可以采用随机词语,限定时间,和多词语来确保这个系统的安全。能识别我们表达时的情绪,这个就现在的技术来说就比较难实现了,因为通过人的语气来定义当时的情绪很难,这个工作让人来做都有难度。4 语音识别的方法一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。基于声道模型和语音知识的方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有达到实用的阶段。利用人工神经网络的方法是80年代末期提出的一种新的语音识别方法。人工神经网络(ANN)本质上是一个自适应非线性动力学系统,模拟了人类神经活动的原理,具有自适应性、并行性、容错性和学****特性,在结构和算法上都显示出实力。但由于存在训练识别时间太长的缺点,目前仍处于实验探索阶段。模板匹配的方法发展比较成熟,目前已达到了实用阶段。在模板匹配方法中,要经过四个步骤:特征提取、模板训练、模板分类、判决。4 模板匹配法采用的技术隐马尔可夫法(HMM)模仿大脑根据语法知识和言语需要发出的音素的参数流。模拟出语言信号的整体非平稳性和局部平稳性。通过已捕捉到的信息来猜测未输入的信息给出概率最大的猜测信息。矢量量化(VQ)矢量量化主要用于小词汇量,孤立词的语音识别中。主要是从大量信号样本中训练出好的码书。从实际效果出发寻找