文档介绍:摘要关键词;语音增强:谱减:掩蔽效应:在语音通信中,通信双方经常受到周围环境噪声的强烈干扰。在一些特殊场合的应用中如强噪声试验场、军事演习现场及车载通信系统等等,这种情况尤为严重。当环境噪声太大时,会严重干扰通话质量,甚至使通话无法进行。因此滤除背景噪声很有必要。语音增强的目的就是改进这些通信系统的性能,去除带噪语音中的嗓声,尤其是实际环境中的背景噪声。在众多的诳啬增强算法时准醴由于其简单有效成为最流行的技术。但传统谱减法在增强后的语音中往往伴有“音乐噪声”和无法抑制的背景噪声,同时语音失真很大。针对传统谱减法的缺陷,出现了许多改进算法,这些改进方法与传统谱减法相比,在消除音乐噪声、背景噪声和减小语音失真等方面都有很大进步。当带噪语音信噪比很低时,这些算法的性能急剧下降。本文对谱减法加以改进使其能更好消除背景噪声,同时又引入了基于听觉噪声掩蔽效应的加权滤波方法,存消除噪卢的同时改善了增强后语音的听觉效果。最终布低成鲜迪质凳庇镆粼銮肯低场实验结果表明,该系统能有效消除背景噪卢,抑制“音乐噪声”,在较低信噪比下也能获得很好的增强效果,同时该系统能够实现实时语音增强。在
鷗印癶甌瑃—.甌¨.琤..;籗籇
第一章前言语音增强的课题研究背景一,语音通信是一种理想的人机通信方式。人们一直梦想有朝一日可以摆脱键盘或遥控设备的束缚,拥有更为友好、亲切的人机界面,使得计算机或家用电器可以像人一样听懂人的话语,看懂入的动作,执行人们所希望的任何任务。而语音数字信以在强背景噪声下可以正常通信。在语音编码时,特别是参数编码,由于语音生成模型是低速率参数编码的基础,当模型参数的提取受到混杂在语音中的背景噪声严重干扰时,重建语音的质量将急剧语音。然而,由于干扰往往都是随机的,从带噪语音中提取完全纯净的语音几乎不当今世界正处于信息时代。计算机、电子和信息技术的高速发展,推动着人类社会向信息社会不断进步。语音是人类相互之间进行交流最自然和最方便的形式之号处理正是其中一项至关重要的应用技术。语音数字信号处理是一门涉及面很广的交叉学科,其研究领域涉及到信号处理、人工智能、模式识别、数理统计、神经生理学和语言学等许多学科。其在数字话音通信、声控打印机、自动语音翻译和多媒体信息处理等许多方面都有常重要的应用。语音数字信号处理包含的内容十分广泛:如包括语音编码、语音识别、语音合成、说话人识别和语音增强等T谟镆羰信号处理的诸多研究领域中,语音增强是语音数字信号处理系统进入实用阶段的重要环节。人们在语音通信过程中会受到来自周围环境、传输媒介引入的、通信设备内部噪声,乃至其他讲话者的干扰。这些干扰最终将使接收者接收到的语声已非纯净的原始语音信号,而是受噪声污染的带噪语音信号。如安装在汽车、飞机或船舰上的电话,会受到发动机产生的噪声的干扰;在街道、机场或其他公共场合使用电话,经常受到很强的背景噪声的干扰,严重影响通话质量;又如,室内会议电话的回声随同语音广播到每个会议地点,影响收听效果;战场上存在着严重的噪声,使得战地电话或电台无法进行正常的语音通信,这些都需要一种语音增强系统,使人们可环境噪声污染也使许多语音处理系统的性能急剧恶化。语音增强作为预处理,可以改善这些系统的性能。例如语音识别正在步入实用阶段。但目前的识别系统大都是在安静环境中工作的,在噪声环境中尤其是强噪声环境,语音识别系统的识别率将受到严重影响,需要语音增强技术进行预处理。数字电话中需要进行语音编码,恶化,甚至变得完全不可懂。通常情况下,语音增强的主要目标是从带噪语音信号中提取尽可能纯净的原始
主要研究内容音增强的方法可以显著地降低背景噪声,改进语音质量,但并不能提高语音的可懂在实际需求推动下,早在上世纪年代语音增强就引起人们的注意,随着数字增强算法,能适用于各种噪声环境。必须针对不同噪声,采取不同的语音增强对策。的最佳感知语音增强方法尚未形成。引入听觉感知实现语音增强的原理是根据掩蔽闽值和噪声之间的相对关系对带噪语音谱分量有选择地进行处理,这样可以在对可闻噪声进行抑制的同时还可以尽量减少对原语音信号的损伤。如果噪声谱处于掩蔽阈值之下则噪声不可闻,一般不需要进行处理;如果噪声谱在掩蔽闽值之上则噪声可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳,这是一种主观度量;二是提高可懂度,这是一种客观度量。这两个目的往往不能兼得。目前,~些对低信噪比带噪语音进行语度,甚至略有下降信号处理理论的成熟,年代曾形成一个研究高潮,取得了一些基础性成果,进入年代后,超大规模集成电路技术的发展以及酒某鱿治S镆粼銮的实时实现提供了可能。语音增强不但与语音数字信号处理理论有关,还涉及到人的听觉感知和语音学。再则,噪声来源众多,随场合而异,它们的特性也不同。很难找到一种通用的