1 / 70
文档名称:

基于稀疏表示的语音信号的最佳投影与其重构技术的研究.pdf

格式:pdf   页数:70
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于稀疏表示的语音信号的最佳投影与其重构技术的研究.pdf

上传人:cherry 2014/6/12 文件大小:0 KB

下载得到文件列表

基于稀疏表示的语音信号的最佳投影与其重构技术的研究.pdf

文档介绍

文档介绍:单位代码: 10293 密级: 公开






硕士学位论文

论文题目: 基于稀疏表示的语音信号的
最佳投影与其重构技术的研究


学号 Y001090504
姓名徐倩
导师杨震
学科专业信号与信息处理
研究方向语音处理与现代语音通信
申请学位类别工学硕士
论文提交日期 2012 年 2 月
南京邮电大学学位论文原创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得
的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包
含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它
教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的
任何贡献均已在论文中作了明确的说明并表示了谢意。




研究生签名:_____________ 日期:____________

南京邮电大学学位论文使用授权声明
南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送
交学位论文的复印件和电子文档,可以采用影印、缩印或其它复制手段保存论
文。本文电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文
外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。
论文的公布(包括刊登)授权南京邮电大学研究生院(筹)办理。




研究生签名:____________ 导师签名:____________ 日期:_____________
南京邮电大学

硕士学位论文摘要

学科、专业:工学、信号与信息处理
研究方向:语音处理与现代语音通信


作者:徐倩
指导教师:杨震教授


题目:基于稀疏表示的语音信号的最佳投影与其重构技术的研究
英文题目:Research on the Optimized Projection and Reconstruction
Technology of Speech Signal Based on Sparse Representation


主题词:压缩感知,语音信号,基追踪,正交匹配追踪,最优观测,
自适应观测
Keywords: Compressed Sensing, Speech Signal, Basis Pursuit, Orthogonal
Matching Pursuit, Optimized Observation, Adaptive
Observation
南京邮电大学硕士研究生学位论文摘要
摘要
近年来,压缩感知理论是国内外信号处理领域学者的研究热点,它的“边采样边压缩”
使得 A/D 转换后数字序列、速率能够远低于传统的奈氏采样定理的特点,是最大的引人之处。
本文将压缩感知理论应用于语音信号领域,研究语音信号的压缩感知技术,特别是最佳压缩
投影和重构性能。本文分析了语音信号自身的特征,并以此优化观测矩阵,达到改善语音信
号的压缩感知和重构性能的目的。
本文首先提出了一种基于最优观测的语音压缩感知方法。该方法利用了语音信号在 DCT
域的近似稀疏性,结合最优观测算法找出 DCT 基对应的最优观测矩阵,然后采用求得的最优
观测矩阵对语音信号进行投影观测。实验结果表明,基于最优观测矩阵的压缩感知的重构语
音的质量较好,该方法提高了语音的压缩感知和重构性能。
依据语音信号的某一特性自适应地构造观测矩阵,即语音信号的自适应压缩感知,是本
文另一个主要研究内容。根据相邻的不同类型的语音帧有不同的帧间变化量,本文提出了一
种新的语音帧间自适应压缩感知算法。实验结果表明该帧间自适应压缩感知的重构性能比非
自适应压缩感知更好。
本文第三个研究内容是进一步研究语音的自适应压缩感知,提出了一种基于清浊音判断
的语音自适应压缩感知方法。该方法分别由帧间自适应和帧内自适应组成。帧间自适应首先
依据语音帧的短时能量和短时过零率判断语音帧属于清音帧还是浊音帧,基于浊音信号含有
的信息量比清音信号更多且对语义更重要的事实,然后由整段语音信号中清音帧的总个数和
浊音帧的总个数自适应地分配较多的观测数给浊音帧。在帧间自适应确定观测个数之后,帧
内自适应根据本帧语音的能量特性自适应地从全局观测矩阵中选取能量最大的行向量构成最
佳观测矩阵。实验结果表明,上述基于清浊音判断的语音自适应压缩感知算法大大改善了重
构语音的质量,并且帧间自适应和帧内自适应都有助于提高语音压缩感知的重构性能。



关键字:压缩感知,语音信号,基追踪,正交匹配追踪,最优观测