文档介绍:机械电子工程原理
第十九章
移动机器人视觉导航系统的设计
计算机视觉简介
视觉是人类观察世界、认识世界的重要功能手段,为人类提供了多达70%以上的外部信息,视觉也被认为是机器人最主要的感知能力。
视觉传感器为机器人提供了十分丰富的外界信息,并且在不需要传感器的运动及物体无任何接触的情况下,就可以达到对环境和目标的识别,这是其他传感器难以做到的,因此,机器人视觉技术是机器人智能化水平的一个重要体现。
人们研究计算机视觉旨在使计算机具有通过二维图像认知三维环境信息的能力,这就是立体视觉技术。这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态和运动等,并且能对它们进行描述、存储、识别与理解。
2
立体视觉概述
了解人类视觉的构成、信息处理过程,对计算机视觉的研究是非常具有启发性和吸引力的。人类对高级生物视觉的研究成果,给我们研究和设计计算机视觉系统提供了很好的模型或生物支持。
生物视觉系统的视觉过程由多个步骤组成,其流程图如图所示。
3
生物视觉系统
从狭义上说,视觉的最终目的是要对场景做出对观察者有意义的解释和描述;从广义上讲,还要基于这些解释和描述,并根据周围环境和观察者的意图制定出行为规划。
人类的视觉不仅要识别物体的形状和颜色,而且要随时地作用于物体。立体视觉就是指这种判断物体距离或深度的感觉。正常的双眼视觉都可以提供高度的立体感。外界目标在视网膜上的像是二维的,而且同一物体在左、右眼的视网膜上的成像有着微小的差异。这种不同为立体视觉提供了最基本的信息——视差(disparity)。人们正是利用视差原理来实现机器人视觉三维感知能力。
4
机器人立体视觉的原理
一般的摄像机的投影映射关系如图所示,通过摄像机像平面x’o’y’上对空间点(X,Y,Z)所成的像点(x,y)仅能够获得二维信息,无法获得空间点与摄像机的距离信息。
5
立体视觉中左、右摄像机最简单的放置位置如图所示。图中o-XLZL为左摄像机图像坐标,o-XRZR为右摄像机图像坐标,f为摄像机焦距,两摄像机之间的间距为2d,O-XZ为世界坐标系。在物体表面存在着空间一点P,在世界坐标系下的坐标为(Xp,Yp,Zp),该点映射到左右两个摄像机图像坐标系中的坐标分别为:(xl,yl),(xr,yr)。
通过几何关系可以得到:
机器人立体视觉的原理
6
场景中一点,分别在左右图像中产生像点,这一对像点称为共轭点。所以,只要能在左右图像中找到相应于场景中某一点的共轭点,应用上页中的公式就可以计算出该空间点的三维坐标值。
立体视觉技术一直都是视觉技术中研究的前沿与焦点问题。根据视觉传感器的个数立体视觉技术可以分为:双目立体视觉和多目立体视觉。立体视觉获取的实质是对视觉图像信息的理解,在这个过程中可以应用许多性能优良的智能算法,如模糊逻辑、人工神经网络和遗传算法等。
机器人立体视觉的原理
7
双目立体视觉导航移动式机器人
本系统设计的视觉导航移动式机器人如左图所示,采用双目立体视觉,通过在实验车前安装双摄像机,如右图所示,以模拟人类双目视觉系统,从而实现移动机器人的自主导航、避障功能。
8
摄像机标定
计算机立体视觉应能从摄像机获取的图像信息出发,计算三维环境物体的位置、形状等几何信息,并由此识别环境中的物体。图像上面的每一点在图像中的位置与空间物体表面相应点的几何位置有关。这些位置的相互关系,由摄像机成像几何模型所决定,该几何模型的参数称为摄像机参数。
内部参数描述摄像机的内部光学和几何特性,如图像中心、焦距、镜头畸变以及其它系统误差参数等;
外部参数指的是某一世界坐标系和摄像机坐标系之间的相对旋转和平移。
这些参数必须由实验与计算来确定,实验与计算的过程称为摄像机标定。摄像机参数已知是所有计算机视觉方法的前提,同时这一过程精确与否,将直接影响立体视觉系统的测量精度。
9
摄像机模型
在标定过程中,有多种模型可供选择来描述摄像机。针孔模型是其中最常见的一种,它简单实用而又不失准确性,在物距相对于摄像机焦距很大时,它能够较准确地描述摄像机的几何关系。
=
10