文档介绍:单位代码: 10293 密级: 公开
硕士学位论文
论文题目: 基于压缩感知的语音稀疏基
和投影矩阵构造技术的研究
学号 Y001090502
姓名唐力
指导教师杨震教授
学科专业信号与信息处理
研究方向语音处理与现代语音通信
论文提交日期 2012 年 2 月 21 日
南京邮电大学学位论文原创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得
的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包
含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它
教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的
任何贡献均已在论文中作了明确的说明并表示了谢意。
本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。
研究生签名:_____________ 日期:____________
南京邮电大学学位论文使用授权声明
本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文
档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索;
可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质
论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院(筹)办理。
涉密学位论文在解密后适用本授权书。
研究生签名:____________ 导师签名:____________ 日期:_____________
南京邮电大学
硕士学位论文摘要
学科、专业:工学、信号与信息处理
研究方向:语音处理与现代语音通信
作者:唐力
指导教师:杨震教授
题目:基于压缩感知的语音稀疏基和投影矩阵构造技术的研究
英文题目:Research on Speech sparse basis and projection matrix
based pressed Sensing
主题词:压缩感知;语音信号;稀疏表示;K-SVD;K-LMS
Keywords: Compressed Sensing; speech signal; sparsity; K-SVD; K-LMS
项目资助:国家自然科学基金“基于 Lp 优化的语音压缩和编码技术的研
究”,项目编号 60971129
国家 973 计划“物联网混杂信息融合与决策研究”,项目编号
2011CB302903
南京邮电大学硕士研究生学位论文摘要
摘要
语音通信已经成为人类生活中必不可少的一部分,语音是模拟信号,需要经过数字化处
理才能在数字通信系统中进行加工处理。在信号处理中数字化的第一步便是采样,一般遵循
奈奎斯特采样定理对语音信号采样。但是奈奎斯特采样的速率较高,采集的信号中具有较多
冗余的信息。所以为了降低采集后的数据量,2004 年 Daonodo 与 Candes 等人提出了压缩感
知理论,压缩感知在对稀疏信号进行采样的同时,也对信号进行了压缩。采用压缩感知技术
对语音信号进行处理,将大大降低传输过程中所需的信息量。
压缩感知的前提是信号具有稀疏性,但是语音信号在常规变换域中的稀疏度不够理想,
所以在对语音信号进行压缩感知投影观测之前,首先需要对语音信号在稀疏变换基上的稀疏
表示进行深入研究。因此,为了实现语音信号的压缩感知采样,本文主要研究了语音信号的
近似稀疏性和稀疏表示形式,在现有传统正交基的基础上寻找稀疏字典的训练算法,从而使
得原始信号在训练过的稀疏变换基上可以更加稀疏地表示。本文的主要工作和创新有:1)在
语音信号压缩感知技术中常常对投影观测矩阵进行自适应的选取,本文将信号的投影残差加
入到自适应投影观测矩阵的选取中,改进了针对信号能量进行的自适应投影观测算法;2)将
K-SVD 训练算法和小波分解后的特性联合考虑,对小波分解后的低频系数采用 K-SVD 算法,
从而降低了稀疏字典训练算法的复杂度;3)针对 K-LMS 稀疏字典训练算法中 LMS 分解过程
采用固定的步长因子,容易带来较大的稳态误差这个问题,本文提出将前两次稀疏表示过程
中的误差引入到步长因子的计算中,对 K-LMS 训练算法进行改进,从而得到较好的重构性能。
在迭代过程的初始阶段,采用较大的步长因子,随着迭代次数的增加逐步减小步长因子的大
小,降低稀疏表示过程中的稳态误差,从而可以准确恢复出原始语音。
在文章的末尾,对全文进行了总结,并且提出了语音压缩感知有待