文档介绍:东北大学
硕士学位论文
双目视觉立体匹配算法研究
姓名:唐麟
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:徐心和
20060201
摘要双目视觉立体匹配算法研究双日视觉是计算机视觉领域的一个重要组成部分。双目视觉研究中的关键技术摄像机标定和立体匹配一直是研究的热点。本文由两部分组成,分别对双目视觉的算法和未标定图像的立体匹配进行了研究和算法的实现。在本文的第一部分,首先阐述了摄像机标定的基本原理,然后对双目视觉的理论进行了研究,同时介绍,一个自己实现的位于移动小车上的双目视觉系统。这个双目视觉系统利用双目视觉的原理实现对小球的实时定位。在此双目视觉系统的实现中涉及摄像机标定、视频流捕捉、图像处理和坐标系转换等方面内容。在本文的第二部分,详细介绍了一种未标定图像立体匹配的算法,编程实现了该算法并进行了试验分析。未标定图像立体匹配是进行基于图像的三维重建的关键一步。为了介绍未标定图像立体匹配的算法,在这一部分的开始,介绍了相关的理论知识,包括对极几何和立体匹配的基本理论。在这个对未标定图像进行立体匹配的算法中,首先是根据传统理论进行初始匹配,然后用匹配的点对估算基础矩阵,进而恢复对极线约束,最后,再结合对极线约束进行立体匹配。关键词:双目视觉;立体匹配;摄像机标定;基础矩阵;对极几何;视频流捕捉东北大学硕士学位论文
;����;����������东北大学硕士学位论文������琣���.������.���;�������.������,���甇����.����.���,�����.��������������琲���������,��瓸������.���.���������.������.������琺�������籉���������;������築����
第一章绪论��引言计算机视觉发展近�多年来有两大事件,一是二十世纪八十年代的��计算视人工智能等。计算机视觉要达到的最终目的是实现计算机对三维景物世界的理解,即方法,即从分析人类视觉入手,利用大自然提供给我们的最好参考系——人类视觉系计算机视觉是计算机科学与人工智能的一个重要分支,在近三十年有了突飞猛进的发展。可以预言,这种发展势头还将保持一个相当长的时期。原因很清楚,“百闻不如一见”,视觉信息在人类活动所涉及的各种信息中所占比重最大,由于它独特的空间特性和结构特性,不能为其它任何信息所代替【�。觉理论使计算机视觉成为��懒⒖蒲В欢�嵌��兰途攀�甏�岢龅纳阆窕�员甓�和分层重建思想使计算机视觉走出了低谷。计算机视觉的中心任务就是对图像进行理解,其中包括对单幅图像的理解、对多幅图像的理解和对视频图像的理解,理解的是物体的形状、位置和运动信息。从图像处理与模式识别发展起来的计算机视觉研究方向主要是如何利用二维投影图像恢复三维景物世界拉��计算机视觉使用的理论方法主要是基于几何、概率、运动学与三维重构的视觉计算理论,它的理论基础包括射影几何学、刚体运动力学、概率与随机过程、图像处理、实现人类视觉系统的某些功能。为了达到计算机视觉的目的,通常有两种技术途径可以利用【�。第一种是仿生学统,建立视觉过程的计算模型,然后利用计算机系统予以实现。第二种是工程方法,即脱离人类视觉系统框架的约束,利用一切可行的和实用的技术手段实现视觉功能。由于仿生学方法的进展缓慢,现在计算机视觉的研究大多使用工程方法。计算机视觉有几个核心问题,对于单幅图像,核心是分割问题;对于多幅图像核心是三维重构问题和运动分析。在基于图像的��亟ㄖ校�幢甓ㄍ枷竦牧⑻迤ヅ涫�关键的步骤。立体视觉是由多幅图像�话闶橇椒�获取物体三维几何信息的方法。对生物视觉系统,人们早就注意到,几乎所有具有视觉的生物都有两个眼睛。用两个眼睛同时观察物体时,会有深度或远近的感觉。盘体电影之所以有逼真的深度感,也是仿造了东北大学硕士学位论文
的计算视觉理论框架��.�泳跸低逞芯康娜�霾愦���从信息处理系统的角度出发,认为对此系统的研究应分为三个层次,即计算理第一章绪论立体视觉原理。在立体电影拍摄中,用两个摄像机同时拍摄,而在放映时,将两个摄像机拍摄的图像同时投影到屏幕上,并利用偏振光的原理,使人的双眼分别看到左右摄像机拍摄的图像,从而使人感到真实三维场景的立体感��。在计算机立体视觉系统中,也可以利用摄像机从不同角度获取同一景物的两幅图像,然后利用三维重建原理,由计算机重建景物的三维形状,恢复出物体的空间位置信息。��二十世纪八十年代初,��首次从信息处理的角度综合了图像处理、心理物理学、神经物理学及临床神经病学的研究成果,提出了第一个较为完善的视觉系统框架,这一框架虽然在细节甚至在主导思想方面尚存在大量不完备的方面,许多方面还有许多争议,但至今仍是广大计算机视觉工作者接受的基本框架。计算机