文档介绍:摘要计基于任意阵列的语音信号的二维角度——俯仰角和方位角,然后把基于子空间的测向算法和定位算法结合起来,提出了新的基于麦克风阵列的远场定位算法一一垂心定位法。该方法与传统的测向交叉定位法相比精度更高,抗噪性更好。麦克风阵列已广泛应用于音/视频会议、语音识别及增强等领域。声源定位技术是基于麦克风阵列的阵列信号处理的关键技术之一,是语音信号处理领域的一个新的研究热点。本论文针对基于麦克风阵列的声源定位技术展开研究,主要做了以下几方面工作:总结归纳了目前基于麦克风阵列的声源定位技术的几类基本方法的原理及优缺点,并利用声线跟踪法建立了混响环境下的房间脉冲响应模型。由于语音信号及室内声场环境的特殊性,提出了语音信号的预处理,包括预滤波、加窗分帧处理、语音端点检测等。在实际应用中,语音信号有可能位于近场,也可能位于远场,所以分别对近场、远场这两种情况下的声源定位技术进行了研究。在近场的情况下研究了近场可控波束定位算法和基于高阶统计量的近场声源定位算法两类。对于近场可控波束定位算法,在传统定点约束波束形成的基础上,推导出了近场定点波束新的表达式,把基于自校正的稳健的自适应波束形成应用于近场。对于基于高阶统计量的近场声源定位算法,把传统的近场源定位方法和瓺类算法用于研究声源定位问题,都得到了很好的定位效果。在远场的情况下研究了基于子空间的声源定位算法。基于子空间的远场声源定位分为两个步骤估计语音信号的二维角度和确定语音信号的位置。瓺惴芄痪返墓关键词:麦克风阵列,声源定位,波束形成,高阶统计量,子空间
知识水坝***@pologoogle为您整理
琲甒髓。甌..,,,琣..痸,..猘琺簃瑂甋:,
知识水坝***@pologoogle为您整理
、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特多以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。确的说明并表示谢意。圈期:年C艿难宦畚脑诮饷芎笥ψ袷卮斯娑导师签名:蜀期:
第一章引言研究背景的形式。因此,语音信号是人们构成思想沟通和感情交流的最主要的途径。并且,由于语音和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。麦克风阵列是指由一定的几何结构排列而成的若干个麦克风组成的阵列。相对于单个麦克风而言具有更多优势,它可以电子瞄准的方式从所需要的声源方向而言具有隐蔽性、不易受干扰。正是由于其独特优势,基于麦克风阵列的应用已有挑战性的研究课题。早在世纪七八十年代,就已经开始将麦克风阵列应用于语音信号处理的研究中,进入年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点【。年将麦克风阵列引入到大型会议的语音增强中,并开年在混响环境下用阵列信号处理对声音进行捕获。年语言是人类特有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息提供高质量的声音信号,同时抑制其他人的声音和环境噪声,具有很强的空间选择性,而且不需移动麦克风就可获取移动的声源信号,同时它还可以在一定的范围内实现声源的自适应检测、定位及跟踪,这使得它在诸多领域有着广泛的应用。基于麦克风阵列的声源定位是指用麦克风阵列拾取声音信号,通过对多路声音信号进行分析与处理,在空间域中定出一个或是多个声源的平面或空间坐标,即得到声源的位置,以进一步控制摄像机和麦克风阵列波束对准正在说话的人。传统定位是采用雷达技术,而基于麦克风阵列的定位系统相对于传统的雷达跟踪定位经成为一门新型的技术。同时,由于它涉及到阵列信号处理、数字信号处理、模式识别和数据融合等多方面的理论知识,因而成为语音信号处理中难度大、且具发出很多实际产品。年罂朔缯罅幸氲接镆羰侗鹣低常年又将阵列信号处理用于移动环境下的语音获取,后来将其应用于说话人识别。第一章引言
麦克风阵列声源定位技术概述基于到达时延的定位技术和开始将其应用于声源定位中,用于确定和实时跟踪说话人的位置。目前麦克风阵列系统已有许多应用