文档介绍：中国科学技术大学
硕士学位论文
卷积混合语音信号频域盲分离研究
姓名:吴奇昌(SA08006077)
申请学位级别:硕士
专业:信号与信息处理
指导教师:戴礼荣
2011-05
摘要
摘要
近年来,语音信号的盲分离成为了盲信号处理领域的一个热点问题,它在语
音识别、小型移动通信设备以及远程会议方面有着广泛的应用前景。针对语音信
号盲分离的方法主要有独立分量分析(ICA)方法和基于时频分析的时频掩蔽(TF
Masking)方法。目前,针对瞬时混合信号的盲分离已经获得了很好的效果,而对
于在实际环境中由房间的回响和各种反射造成的卷积混合语音信号,要实现分离
相当困难。目前越来越多的研究采用频域上的方法来进行卷积语音信号的盲分
离,该方法可以将时域上的卷积问题变换为频域上的乘积问题,这样就可以采用
相对成熟的解瞬时混合的 ICA 方法对混合信号进行分离。与 TF Masking 方法相
比,频域独立分量分析(FDICA)方法优点在于使分离信号的音乐噪声与谱失真较
小,但收敛速度不够理想,且存在固有的幅度和次序的不确定性问题。本文将传
统的 FDICA 方法与 TF Masking 方法相结合,提出了一种新的基于 FDICA 的卷
积语音信号盲分离方法,利用 TF Masking 的聚类结果对 FDICA 做初始化,并进
一步进行 ICA 迭代频带挑选,该方法着眼于追求良好分离性能并极大提升运算
效率,同时也解决了次序不确定性问题。在此基础上,又通过搭建的多通道数据
采集平台,进行了分块在线的盲分离尝试,并针对性的加入了对 ICA 分离的后
处理优化方法,在付出极小运算代价的情况下进一步提升了语音信号分离性能,
这也为后续的盲分离系统的研究奠定了基础。具体研究工作包括以下几个方面:
第一,为了加深对盲分离的理解与认知,第二章首先介绍了盲信号分离的信
号混合模型和麦克风阵列模型,接着采用 MLS(Maximum Length Sequence)方法
进行了房间声学脉冲响应测量。第三章对 ICA 的基本概念、数学知识和基本算
法做了较为全面的介绍,并且给出了频域卷积混合语音盲分离的概念以及基于信
息最大化的 FDICA 基本算法。
第二,在第四章中首先回顾了基于语音时频分析的盲分离算法,为了提升传
统 FDICA 收敛和分离性能,结合 TF Masking 方法,提出了一种新的基于 FDICA
的盲分离方法,加快了 ICA 的收敛速度,并在追求良好分离性能的同时极大提
升了运算效率。
第三,在第五章中首先利用 ASIO 驱动实现了多通道同步语音采集平台,该
平台将有利于进一步的盲分离研究和盲分离系统的搭建;然后对分块在线盲分离
可能存在的问题进行了分析,在第四章的算法基础上提出了针对 FDICA 的时频
掩模后处理方法,从分块在线的实验结果来看,在消耗极小运算量的情况下,后
处理方法对于语音信号的分离性能有较明显的提升;经过改进后的整套算法在分
I
摘要
离性能和运算效率方面也表现出了很好的性能。这也为后续针对实际应用的盲分
离系统的搭建奠定了坚实的基础。
关键词: 盲信号分离独立分量分析卷积语音信号时频分析频带挑选
后处理
II
Abstract
Abstract
In recent years, blind source separation (BSS) of speech signals has e a hot
topic in the field of blind signal processing, and it has widely potential application in
speech recognition, munication and remote meetings. There are two main
methods to achieve BSS: ponent analysis (ICA) and time-frequency
masking (TF Masking). BSS for instantaneously mixed signals has already achieved
good performance. But in real environment, speech signals are mixed convolutively
due to the reverberation and various reflection, which has made BSS quite difficult.
Presently, mor