1 / 72
文档名称:

基于信息熵和神经网络的语音端点检测算法研究(可复制论文).pdf

格式:pdf   页数:72
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于信息熵和神经网络的语音端点检测算法研究(可复制论文).pdf

上传人:mkt365 2013/11/14 文件大小:0 KB

下载得到文件列表

基于信息熵和神经网络的语音端点检测算法研究(可复制论文).pdf

文档介绍

文档介绍:基于信息熵和神经网络的语音端点检测算法研究摘要语音端点检测是语音分析、语音合成和语音识别中的一个重要环节。在实际运用中,通常要求首先对系统的输入信号进行判断,准确的找出语音信号的起始点和终止点。这样才能采集到真正的语音数据,减少数据量和运算量,并减少处理时间。因此语音端点检测算法研究意义重大。本文首先介绍了几种典型的语音端点检测算法。随后对三种语音端点检测算法进行研究。算法一:在对信息熵原理理解的基础上,分析了语音信号与背景噪声的幅度熵及谱熵的差异,并根据这些差异进行了基于幅度熵和谱熵的语音端点检测算法研究,仿真实验结果表明该方法检测准确率较高。算法二:在对信息熵语音端点检测研究的基础上,结合神经网络在模式分类方面的优越特性,提出了基于信息熵和神经网络的语音端点检测算法,该算法针对语音信号和背景噪声进行建模,把语音信号端点检测问题看作是对每帧信号进行分类,通过建立相应的模型,根据模型的匹配程度对每帧语音矢量进行划分,确定其属于语音或背景噪声。仿真实验表明,该算法在检测准确率上要优于信息熵语音端点检测算法,且避免了常规方法需要设置闽值门限这一难点。算法三:语音信号端点检测研其本质是区分语音与背景噪声。语音与背景噪声的划分不是绝对的,分界处的语音信号有可能属于语音,也有可能是背景,因此语音端点检测属于边界分类模糊问题。而模糊技术在处理边界模糊问题上具有独特的优势,通过对语音数据的模糊化,结合对神经网络语音端点检测的研究,提出了基于模糊神太原理工大学硕士研究生学位论文●
知识水坝***@pologoogle为您整理
经网络的语音端点检测算法。仿真实验表明,该算法在检测准确率上是本文研究的三种算法中最高的,但该算法的缺点是算法复杂。文章最后对本文所研究的三种算法进行了总结,提出了一些在今后工作中需要迸一步研究的问题,并对近几年来出现的一些研究掰方向作了简单的介绍和展望,指出了端点检测未来的发展前景。关键词:端点检测,幅度熵,谱熵,神经网络,模糊太原理:大学硕士研究生学位论文
知识水坝***@pologoogle为您整理
猠,瓵瑆太原理笱妒垦芯可宦畚,甀瑃.,甌,,甌篣疭.,.簅
簊琓瓵.,瓵琣琭太原理工大学硕士研究生学位论文篠,.,狽狽.,
毯整导师签名:塑盥墅三菏ネ:褐ィ豪关于学位论文使用权的说明做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的本人完全了解太原理工大学有关保管、使用学位论文的规定,其中包括:①学校有权保管、并向有关部门送交学位论文的原件与复印件;②学校可以采用影印、缩印或其它复制手段复制并保存学位论文;③学校可允许学位论文被查阅或借阅;④学校可以学术交流为目的,复制赠送和交换学位论文;⑤学校可以公布学位论文的全部或部分内签声本人郑重声明:所呈交的学位论文,是本人在指导教牙的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的科研成果。对本文的研究法律责任由本人承担。论文作者签名:日期:容C苎宦畚脑诮饷芎笞袷卮斯娑月:明
第一章绪论语音端点检测背景及意义了生活。人类语言的主要表现形式有文字和语音,语音学是研究人类不同语言中发音与语义之间的相互关系及规律的学问,而语音信号处理已经成为语音学研究的一个重要分支。当今信息化社会,以数字信号处理方法为工具进行的语音信号研究成果,已经对社会的发展和人类文明的进步做出了巨大的贡献。例如,人们很想在与机器进行交流时能用自然语言来代替传统的人机交流方式。作为语音信号处理中的重要领域,语音识别技术其最大优势在于能够使得人机用户界面更加自然和容易使用,也就是赋予机器听觉功能,在人机通信中让机器能“昕懂”人的语言,辨明话音的内容或说话人,并进一步使机器能够按照人的意志来进行某种操作,从而把人类从繁重或危险的劳动中解脱出来。作为一个完整的语音识别系统,其最终实现及使用的效果不仅仅限于识别算法的好坏,许多相关因素都直接影响着应用系统的成功与否。语音识别的对象是语音信号,语并确定语音信号的开始及结束。一般的信号流都存在一定的背景噪声,而语音识别的模型都是基于语音信号训练的,语音信号和语音模型进行模式匹配才有意义。因此从信号语言是人类文明的体现,是人类智慧的结晶,我们的生活离不开语言,语言更丰富音端点检测的目的就是在复杂的应用环境下从信号流中分辨出语音信号和非语音信号,流中检测出语音信号是语音识别的必要的预处理过程。如图卜尽详细说来,端点检测有两个过程:谟镆粜藕诺奶卣鳎媚芰俊⒐懵省㈧、音高炔问及它们的衍生参数,来判断信号流中的语音月镆粜藕拧太原理工大学硕士研究生学位论文图镆羰侗鹣低晨蛲甋
在商用语音系统中,由于信号多变的背景和自然对话模式而更容易使句中有停顿怯镆,特别是在爆发声母前总会有无声间隙。因此,这种开始/结束的判定尤为重跎