文档介绍:上海交通大学工学硕士学位论文 摘要
从双目立体图像中恢复三维信息的研究
――加入结构约束的半全局匹配算法的研究与实现
摘 要
三维重建是计算机视觉、计算机图形研究中倍受关注的热点。而双目
立体视图匹配是一种经典的三维重建方法,它通过比较在不同位置对同
一场景拍摄的两幅照片找出其中匹配的场景点,从而根据场景点在两幅
图像中不同的位移程度得到其相对于相机的距离(称为深度),进而从二
维图像信息中恢复三维场景的信息。双目立体视图匹配的应用十分广泛,
如虚拟现实、文物保护、工业监控、数字娱乐等,同时,相对于其他三
维重建的方法,双目立体视图匹配的设备要求、算法的时间复杂度以及
空间复杂度较低,因此具有十分重要的研究价值。
通过对双目立体视图匹配方法的分类、分析与比较,今后将出现如下
的发展趋势和热点:更多地体现全局性、算法的高速性、对噪声的鲁棒
性以及算法的通用性。因此,本文实现了几种具有发展前景的方法,并
进行比较和改进,选择并实现一个具有较高匹配精度、同时具有较高的
执行速度兼顾对噪声的鲁棒性的双目立体匹配算法,以满足实际应用的
需要。
第 I 页
上海交通大学工学硕士学位论文 摘要
近年来,双目立体视图匹配领域涌现出了许多优秀的算法。本文选择
了三种具有代表性同时效率领先的算法进行实现:基于置信传播(BP)的
对称模型,半全局立体视图匹配,以及基于 mean-shift 的图像分割的方
法。通过对这三种算法的结果精度与执行速度进行比较与评估,我们最
终选择了半全局的立体匹配方法作为本文改进和提高的基础。这是由于
该方法的精度较为理想,并具有相较于其他两种算法巨大的速度优势;
同时该算法还具有采用现代 cpu 的单指令多数据流技术大幅加速的能力,
在对噪声的鲁棒性上也存在着优势。
在研究的后半部分,本文针对半全局立体匹配存在的一些问题进行了
一系列改进,这也是本文的创新点:
1. 针对在特定情况下算法由于规划路径不完全而引起的严重的深度
赋值错误,本文提出了使用图像分割的方法获得场景的结构分割信
息,通过初步的深度估算以及最小二乘法为每一个分割区域计算平
面模型参数,以此作为场景的结构信息加入到基于点的匹配代价的
计算中去,从而为匹配过程添加一个结构性的软约束。
2. 针对原算法存在的无法为遮挡和错误匹配区域提供可靠深度估算
的缺陷,本文提出基于前面得到的场景结构信息来进行此类区域深
度估算的方法,给出了可行的解决方案。
3. 针对结构性软约束存在的区域内部的平滑问题,同时为了避免深度
边界的模糊化,本文结合前面得到的结构信息,通过对拟合过程的
第 II 页
上海交通大学工学硕士学位论文 摘要
分析改进,引入了一种带有结构信息的快速二次曲面拟合方法。
算法的结果表明,在不改变原半全局立体视图匹配算法的整体框架,
并且保留其利用 cpu 单指令多数据流能力的前提下,本文所提出的方法
成功地解决了规划路径不完全引起的深度赋值错误,为遮挡和错误匹配
区域提供了可靠估算。因此相较于改进前的原算法,改进后的算法结果
精度得到了大幅地提升,同时保留了原算法的高速性,继承了原算法对
于噪声的鲁棒性。因此,改进算法具有广泛的应用价值与前途。
关键词:双目立体视图匹配,半全局立体匹配,图像分割,结构性软约
束