第1章 绪论
全球信息化进程的加快及科技水平的日益提高,促进形成了全球自动化的格局,随之而来的是人工智能技术的蓬勃发展。计算机视觉作为人工智能的“眼睛”,是感知客观世界的核心技术,在人工智能热潮下占据着举足轻重的地位,因而得到了迅猛的发展。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息。特征匹配作为其中一个基础且关键的技术,实现不同影像上相同目标或同名特征之间对应关系的建立,是低层视觉通往高层视觉的纽带,是实现信息识别与整合[1-3],以及从二维图像中恢复三维信息[4-5]的有效途径,进而实现基于影像的三维重建。
影像匹配是基于影像获取三维信息,进而实现基于影像的三维重建的基础。从影像中提取具有物理意义的显著结构特征,包括特征点、特征线、边缘线,以及具有显著性的形态区域用于影像匹配,属于特征匹配的范畴。特征可以看作整张图像的精简表达,由于特征具有显著性特点,通过对提取的特征结构进行匹配并估算变换函数将图像上其他像素进行对齐,减少了许多不必要的计算,同时能够减少噪声、畸变及其他因素对匹配性能的影响,是目前实现影像匹配的主要形式。鉴于点特征具有简单、稳定的特性,且是其他特征匹配的基础,其他特征匹配均可以转化为基于点特征的匹配来进行,如线的端点、中点或离散化形式,以及形态区域中心等[6-9],所以基于点特征的影像匹配成为众多科研人员研究的重点,而在基于影像的三维重建中该匹配方式同样适用。但基于特征点的影像匹配,得到的同名点往往是稀疏、分布不均的。为了提高后续三维重建工作中的视觉效果,往往需要在此基础上进一步对特征点的匹配结果进行加密,该过程大多以初始匹配点为基础进行匹配增长及匹配传播,得到准稠密的匹配结果。目前,基于稠密匹配点云构建的三维模型基本上能较好地表达地物的轮廓信息,但放大后地物边缘处细节问题突出,易产生粘连、缺失、变形等问题,尤其对物方建筑物边缘而言,这种问题更突出。而人工地物都蕴含着大量的直线特征,如建筑物边缘、立面等,包含丰富的几何结构信息,能够较好地表达地物的结构特征,如果能将地物的边缘直线特征用于图像分割及约束后续准稠密匹配,就一定能起到较好的优化效果。因此,将直线特征作为匹配基元并实现其可靠匹配是基于影像精细三维建模的基础[10-14]。