立体视觉技术的基本原理
立体视觉技术依靠三角测量原理来确定场景中物体的深度。该系统使用两台或多台相距一定距离的摄像机(称为基线距离),从略微不同的角度捕捉同一场景的图像。通过分析这些图像之间的差异,系统可以计算出场景中每个点的深度。
立体视觉的主要组成部分包括
1、基线距离: 基线距离或摄像机之间的距离对深度精度起着至关重要的作用。基线距离越大,深度分辨率越高,而基线距离越小,则适合近场应用。选择最佳基线对于确保特定使用情况下的系统性能至关重要。
2、立体匹配算法: 立体匹配是将摄像头捕捉到的图像中的对应点对齐的计算过程。这种对齐是通过识别像素模式的相似性来实现的,通常使用传统的计算机视觉算法,如半全局匹配(SGM)和块匹配,或使用先进的神经网络算法。这些算法会生成差异图,然后将其转换
3、深度图或点云–场景的详细 3D 表示。
深度感知: 深度图或点云为机器提供了每个像素的距离和位置信息,使其能够感知和理解周围环境的空间布局。这些数据为障碍物检测、路径规划和环境制图奠定了基础。
支持自主系统
立体视觉技术使自主系统能够生成环境的同步和定位映射,这使其成为对精度、可靠性和适应性要求极高的应用领域不可或缺的技术。
自主驾驶
在自动驾驶汽车中,立体视觉系统通过探测和测量与行人、车辆和道路障碍物等物体的距离来增强对态势的感知。这种能力对于以下方面至关重要
避免碰撞: 深度感知使车辆能够实时检测并避免潜在的碰撞。
导航: 对道路及其周围环境进行精确的三维测绘,可支持路径规划和自适应巡航控制。
极端条件: 多光谱立体视觉集成了可见光和红外热像仪,可确保在弱光、多雾或多雨的条件下保持稳定的性能。
例如,Foresight 的 QuadSight® 技术采用多光谱立体视觉技术,即使在最具挑战性的天气和光照条件下,也能提供无与伦比的障碍物探测功能。该技术结合了可见光和热成像技术,可确保 2 级至 5 级自动驾驶汽车的安全性和可靠性。
机器人技术
在机器人技术中,立体视觉技术赋予机器类似人类的三维感知能力,使其能够在环境中进行精确操纵、导航和互动。主要应用包括
工业自动化: 配备立体视觉系统的机械臂可在动态环境中精确定位、拾取和放置物体。
仓库作业: 自主移动机器人(AMR)利用三维感知进行路径规划,在复杂的布局中避免碰撞。
工业自动化
立体视觉改变了工业自动化领域的游戏规则,因为在工业自动化领域,机器必须在多种多样且往往不可预测的条件下运行。深度知觉有助于
重型机械设备: 装有立体视觉系统的挖掘机、起重机和其他重型设备可以通过探测障碍物和保持空间感知,在危险环境中安全运行。
农业自动化: 三维感知可帮助自动拖拉机完成导航、路径规划、地形分析、作物监测、喷洒和收割等任务。
立体视觉技术的优势
立体视觉的优势不仅限于其功能。与其他三维感知技术(如激光雷达)相比,立体视觉为三维感知提供了一种具有成本效益的解决方案,可提供高密度点云而不影响精度,尤其适用于中远程应用。它的适应性允许与热成像等其他传感模式集成,从而创建能够应对各种挑战的多光谱系统。现代立体视觉系统的设计也非常坚固,具有自动校准和耐候性硬件,可确保在恶劣环境中的可靠性能。
挑战与未来方向
虽然立体视觉技术已经取得了长足的进步,但它仍面临着一些挑战,例如遮挡(场景的一部分被一个或两个摄像头遮挡),以及与立体匹配算法相关的高计算要求。不过,包括机器学习集成和硬件加速在内的不断创新正在解决这些局限性。
立体视觉的未来在于与其他传感技术(如超声波和雷达)的融合,以创建结合每种方法优势的多传感器系统。这些混合系统有望为自主系统提供更高的精度、冗余度和可靠性。
塑造自主系统的未来
由立体视觉技术驱动的三维感知技术使机器能够感知、理解周围环境并与之进行三维互动,从而彻底改变了自主系统。从自动驾驶到工业自动化和机器人技术,立体视觉正在塑造智能机器的未来,推动创新并提高各行各业的安全性。
Foresight 将继续以基于 CMOS 和红外传感器的尖端立体视觉解决方案引领潮流,以满足当今最具挑战性的应用需求。随着技术的发展,它无疑将开启新的可能性,推动下一波自动驾驶和高效率的浪潮。