文档介绍:上海交通大学工学硕士学位论文摘要
基于独立分量分析的语音信号分离算法研究
摘要
语音信号的分离近年来成为信号处理领域的一个研究热点,它在电话
会议、助听器及便携设备、机器的语音识别方面有很多的应用与影响。
而盲信号处理的方法常被用于语音分离中去,“盲”是指没有关于源信号
本身以及传输信道的知识,盲分离的理论基础是独立分量分析,其可以
广泛的被应用于通信、图像、语音、生物医学、雷达、地震、声纳等多
种类型信号的处理。本文详细研究了语音分离的基本理论,重点研究卷
积混合频域解法模型框架下的语音信号分离算法。本文的主要工作如下:
基于时域实值瞬时混合模型的盲分离算法已经研究的比较充分,但
是在语音信号在现实中往往是卷积混合,而且在频域分离方法中信号是
复值的,本文研究了利用复值信号特征的瞬时混合盲分离算法,对不同
的复数域盲分离算法进行了编程实现,研究了卷积混合模型频域盲分离
中的次序不定问题,提出了一种基于分离矩阵初始化的次序对准算法,
并通过实验进行了性能比较和分析。
卷积混合语音信号的频域盲分离算法的主要思想是利用傅立叶变换
将混合模型在时域中复杂的卷积运算转换成频域当中相对简单的乘法运
算,把时域中的卷积混合问题简化成为在频域中每一个频点上的瞬时混
合分离问题。这样就可以运用目前已经发展相对比较成熟的瞬时盲分离
算法,解出各频点的分离矩阵,再用傅立叶反变换,就可以方便地得到
时域的解卷积滤波器,从而恢复出源信号。频域盲分离算法会带来普遍
上海交通大学工学硕士学位论文摘要
难以解决并影响分离效果的幅值不确定性和次序不确定性问题。不确定
性是盲分离算法的固有问题,其对于时域信号而言并不会严重的影响到
分离结果。但对于频域信号来说,在完成每个频率点的盲分离后,直接
对各个频率点的分离矩阵进行逆傅立叶变换,不能够保证每个输出通道
对应着同一个源信号的成分,很有可能夹杂了其它信号,从而使解卷积
失败。
解决次序不确定的方法又被称为次序对准算法。传统算法如相关性
参数法和波达估计法鲁棒性较差,准确度不高,不能将分离和对准两步
联合考虑,在逐频点对准时效果会较大受到前一频点次序对准以及第一
步分离效果的影响。本文研究了相关系数法和波达估计法,并编程实现
了波达估计法的次序对准算法,对波达估计法的性能以及其对最终分离
结果的影响进行了分析;研究了上述次序对准算法存在的问题,并在此
基础上提出了一种基于分离矩阵初始化的算法,该算法同样是利用几何
信息的方法,可以在分离的过程中实现次序对准,相比传统算法鲁棒性
较好,准确度较高,而且将分离和对准两步联合作为整体考虑;从而带
来了在主客观评价指标上都较好的最终分离结果。
频域盲分离的次序不定实际上仍然是一个棘手的问题,本文还介绍
了利用信号频域相依性的新的频域盲分离模型,其理论上可以从本质上
回避次序不定问题。
关键词:语音信号分离,独立分量分析,卷积混合频域盲分离,不确定
性,次序对准
上海交通大学工学硕士学位论文摘要
Research of Speech Separation Based on ponent
Analysis
ABSTRACT
Speech separation has been a hot topic in signal processing society
recently years, which has many applications and influence in telephone
conference, hearing aid, portable devices, speech recognition. Blind signal
processing is a useful method in speech separation, in which the term “blind”
means that the source itself and the transmission channel is unknown.
ponent analysis is the theoretical basis of blind signal
separation, which can be used in various signal processing fields including
communications, image, speech, biology, radar, seismic, sonar and etc. The
thesis starts with the researc