文档介绍:学****文档 仅供参考
基于ICA的语音信号盲别离
学****文档 仅供参考
[摘 要]语音信号盲别离处理的含义是指利用BSS技术对一段语音信号进行处理。混合语输入语言的MATLBA 时域和频谱图程序分析 4
混合语音信号的MATLBA 时域和频谱图程序分析 8
3 盲信号处理 10
盲信号处理的基本概念 10
盲信号处理的方法和分类 10
盲信号处理技术的研究应用 10
独立成分分析分析 11
独立成分分析的定义 11
ICA的基本原理 12
4 FASTICA算法 14
数据的预处理 14
FastICA算法 15
ICA别离的步骤 16
混合语音信号的波形图 16
别离后的信号的波形图 17
20
5 小结体会 22
6参考文献 23
7致谢 24
8附件 25
学****文档 仅供参考
1 前 言
盲语音信号别离技术的背景及意义
近年来,混合语音信号的别离成为语音信号处理领域的一个研究热点。我们经常在信号处理中遇到这样的问题,如何将这些原始信号从一组随机信号经过一组混合系统得到的观测信号种恢复出,如果在重构过程中没有原始信号和混合系统的先验知识,就将该过程称为盲别离。其理论也不断运用到医学、图像、通讯等领域
在语音方面的应用包括有多个人说话构成的声音环境下,从多个话筒接收到的声音信号就是所谓的鸡尾酒会问题,它是指人们在嘈杂环境中或者是在许多人同时说话的情况下有辨识自己感兴趣的声音的能力引起研究者的兴趣。而我们所研究的混合语音信号别离急速虽然不能失信是电脑具有和人类一样的听觉,但 是通过该技术却能使原本相互混叠的语音信号相互剥离,来作为语音识别的预处理,从而使得噪声环境下结合多说话人情形下的语音识别的实现成为可能。
语音的特性
(1)短时平稳性
通过对语音信号的研究,语音信号是一种非平稳的、时变的随机过程,另一方面,人类声音系统的结构的变化是有一定限制的,在短时间内(10~30ms)人的声道和声带形状基本不变,而且大部分情行下,原激励参数也是如此,由此可认为在较短的时间内语音的特征是不变的,语音的这一短时性特点是对语音信号分析和处理的前提。
(2) 清音和浊音
语音可以分为清音和浊音两大类,他们从语音产生的基础上有明显的分别,前者由随机性噪声产生,后者由周期性脉冲产生,因此在特点上也有本质的区别。在时域上,浊音表现出显而易见的周期性,在频域上,浊音有共振峰构造且能量比较集中在低频段内。清音则不同,清音没有较明显特征,和白噪声差不多。
浊音在频域上有共振峰结构,能量大量集中在低频区(<1000Hz),清音则没有共振峰结构,能量大量在高频段且较小(>1000Hz)。
学****文档 仅供参考
2 语音信号特性及分析
语音的基本特征
〔1〕语音的时域特征
由于讲话人不同时间说话内容不同,且没有规律性,因此语音的信号是时变的。但是,人类发出声音器官的变化率有限,在较短时间内(5.500ms),声道在平稳状态,因此语音的信号有短时平稳性。并且这种短时平稳性,是语音处理中许多算法和理论的前提。由于人在讲话话时,不同音节、单词之间总存在着一些时间上的间隔,由此在时域上,语音信号存在着两种音段:有音段、无音段。经过有音和无音的检测,可用于去除语音中较平稳的噪声。而且,无音段越占较大比例,语音在稀疏性越好,基于这一特点,产生了很多增强语音稀疏性的算法。
〔2〕语音的频域特征
语音的主要频谱能量集中在300-3400Hz。语音由清音音和浊音构成,浊音信号含有语音信号的大量能量,其频谱集中于低频段中的基因频率及其各次谐波上,表现出周期性;清音则表现出随机性,在频谱与白噪声差不多。
〔3〕语音的统计特征
可以将语音信号看作是一个遍历性随机过程的样本函数,可用幅度的概率密度函数来描述统计特性。
通过对语音信号统计特性的研究,其幅度分布的概率密度函数可以用两种近似的表达式来较好的描述,一种是伽马(Gamma)分布
()
式中k是一个常数,与标准差,有以下关系
()
另一种是拉普拉斯分布(Laplacian)分布