1 / 25
文档名称:

语音识别设计.doc

格式:doc   页数:25页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音识别设计.doc

上传人:xxj16588 2016/7/13 文件大小:0 KB

下载得到文件列表

语音识别设计.doc

相关文档

文档介绍

文档介绍:语音识别设计特定人语音识别设计的研究…………………………………………… 1 摘要……………………………………………………………………… 2 Abstract …………………………………………………………………...3 目录……………………………………………………………………...4 第一章绪论……………………………………………………………..5 语音识别技术的历史……………………………………… 6 语音识别技术的现状……………………………………...7 语音识别技术的发展趋向………………………………… 8 第二章特定语音识别芯片介绍……………………………..9 凌阳 SPCE061A 芯片…………………………………… 10 RSC 系列芯片…………….. ……………………………..11 芯片 WS — 100 系列……………………………………… 12 第三章特定人语音识别产品开发…………………………………… 13 特定人语音识别技术的开发流程………………………..14 特定人语音识别技术中的难点…………………………..15 第四章结论及展望…………………………………………………… 16 参考文献………………………………………………………………..17 致谢…………………………………………………………………….18 摘要摘要: 回顾语音识别技术的发展历史, 调查数家语音识别芯片的产品, 了解语音识别的开发流程, 并对语音识别技术面临的问题和发展前景进行了讨论。关键词: 语音识别;语音芯片;开发流程;技术难点; Abstract Abstract: Review the history ofvoice recognition technology, the investigation ofseveral speech recognition chip products, to understand the development process for speech recognition, and voice recognition technology problems and development prospects were discussed. Key words: speech recognition; voice chip; development process; technical difficulties 第一章绪论 语音识别技术的历史(1) 国内研究历史我国语音识别研究工作起步于五十年代, 但近年来发展很快。研究水平也从实验室逐步走向实用。从 1987 年开始执行国家 863 计划后, 国家 863 智能计算机专家组为语音识别技术研究专门立项, 每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步, 在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究, 其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度, 达到 9 % ( 不定长数字串)和 % ( 定长数字串)。在有 5% 的拒识率情况下,系统识别率可以达到 % (不定长数字串) 和 % ( 定长数字串), 这是目前国际最好的识别结果之一, 其性能已经接近实用水平。研发的 5000 词邮包校核非特定人连续语音识别系统的识别率达到 % ,前三选识别率达 9 % ; 并且可以识别普通话与四川话两种语言, 达到实用要求。中科院自动化所及其所属模式科技(Pattek) 公司 200 2 年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品—— PattekASR ,结束了中文语音识别产品自 1998 年以来一直由国外公司垄断的历史。(1) 国外研究历史语音识别的研究工作可以追溯到20世纪50年代 AT& T 贝尔实验室的 Audry 系统, 它是第一个可以识别十个英文数字的语音识别系统。但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在 60 年代末 70 年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能, 更重要的是语音信号线性预测编码( LPC ) 技术和动态时间规整( DTW ) 技术的提出, 有效的解决了语音信号的特征提取和不等长匹配问题。这一时期的语音识别主要基于模板匹配原