1 / 29
文档名称:

语音芯片.doc

格式:doc   大小:1,236KB   页数:29页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音芯片.doc

上传人:zbfc1172 2019/8/15 文件大小:1.21 MB

下载得到文件列表

语音芯片.doc

文档介绍

文档介绍:语音芯片又称:语音IC,又被叫做声音芯片。(一)、语音基础知识 1、什么是语音芯片? 语音芯片集中在广东省范围生产及研发较多。例如:广州唯创电子语音芯片定义:将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。普通语音芯片放音功能实质上是一个DAC过程,而ADC过程资料是由电脑完成,其中包括对语音信号的采样、压缩、EQ等处理。录音芯片包括ADC和DAC两个过程,都是由芯片本身完成的,包括语音数据的采集、分析、压缩、存储、播放等步骤。 ADC=AnalogDigitalChange模数转换 DAC=DigitalAnalogChange数模转换音质的优劣取决于ADC和DAC位数的多少。例如:广州唯创电子语音芯片的WTV010-WTV340系列芯片,最低从10秒到340秒,根据控制方式取决段落多少。 2、语音信号的量化表述:(分类:语音芯片和音乐芯片) (a)“语音芯片”介绍: (1)语音信号的量化采样率(f)、位数(n)、波特率(T) 采样:将语音模拟信号转化成数字信号。采样率:每秒采样的个数(byte)。波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps:bitpersecond 采样位数指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。(2)采样率奈奎斯特抽样定理(NyquistLaw):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。嗓音的频带宽度为20~20KHZ左右,普通的声音大概在3KHZ以下。所以,,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。在应用单片机的过程中,采样越高,定时器中断速度越快,会影响到其他信号的监控和检测,所以要综合考虑。(3)语音压缩技术。由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式: 语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。语音采样:一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。数学压缩:主要是针对采样位数进行压缩,这种方式也是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。通常,以上几种压缩方式都是综合起来使用的。(4)常用语音格式 PCM格式:PulseCodeModulation脉冲编码调制,它将声音模拟信号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。 WAV格式:WaveAudioFiles是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。 ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90%以上,已广泛地应用于电话通信领域。 MP3格式:MovingPictureExpertsGroupAudioLayerIII,简称为MP3。它是利用MPEGAudioLayer3的技术,采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(VariantBitrate可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小。 mp3压缩率10倍甚至12倍。是最初出现

最近更新

部编版语文二年级下册 期中测试卷 (含答案 ) 9页

瓶装气体运输方案 3页

部编版四年级语文下册第八单元测试题(含答案).. 11页

高考物理专题复习:摩擦力 17页

部编版一年级语文下册第四课《四个太阳》看拼.. 2页

部编版一年级下册语文专项练习--第一单元写话.. 1页

高考数学(理科)一轮总复习:4-3平面向量的数量.. 37页

部编人教版三年级道德与法治(下册)期末试卷(附.. 5页

进口贸易合同模板7篇 18页

辽宁省鞍山市普通高中2024-2023学年高二下学期.. 16页

高等数学同济大学课件上第45积分表(2) 6页

高等数学课件D1232函数展开成幂级数 23页

传统文化作文300字三年级6篇 5页

初中毕业作文5篇 8页

露天矿山现场管理制度 3页

程序员个人年终工作报告集合3篇 8页

高速流水线技术在5G信号处理中的研究 22页

西安市雁塔区北师大版五年级上册期末测试数学.. 15页

莆田第九中学2024届九年级上学期返校考试数学.. 23页

综合素质评定学生自我陈述报告(真题5篇) 8页

产品需求文档(PRD)模板下载(附完整案例) 2页

考研学习计划表格(精选19篇) 40页

新生班主任选拔面试评分表 3页

广西省医院大全 18页

禾丰中心卫生院新建项目海绵城市专项设计说明.. 11页

继电保护压板退投规定 14页

小学低年级语文阅读能力评价 4页

ISO9001-2015组织环境与相关方要求控制程序 4页

铁路调度指挥与统计分析课题作业 36页

Windows历史 10页