自动驾驶行业的立体视觉

智能驾驶地形及障碍物识别

分享这篇文章

随着技术的快速发展,自动驾驶汽车行业的增长非常迅速,而且没有放缓的迹象。2021年,全球估计有2030万辆至少具有1级自动驾驶(驾驶员辅助)的汽车,预计这一数字将增至62.4辆左右。到2030年将达到100万。

自动驾驶技术的主要目的是提高驾驶安全性。这是通过收集有关环境的准确信息并对其进行分析来实现的,从而可以检测和避免障碍物。包括摄像头、雷达和激光雷达在内的一系列传感器协同工作,以识别并提供所需的车辆周围环境的详细和精确信息,最好是在任何天气和照明条件下都能实现。

这些传感器构成了当今市场上大多数高级驾驶员辅助系统(ADAS)的基础。我们越能从技术和实施的角度优化这些技术,自动驾驶汽车就会变得更好、更安全。

3D感知的挑战

由于其功能和经济性,摄像头是当今最常见的传感器之一,用于捕捉车辆周围物体的高分辨率数据。尽管摄像头作为ADAS和AD(自动驾驶)传感器很受欢迎,但它们的潜力还有待挖掘。目前,大多数ADAS算法都是基于单目系统,视频是从单个摄像头获得的。单目视觉无法直接准确地估计到物体的距离,而这对于环境中障碍物的有意义的3D表示至关重要。这也意味着基于单目系统的高度自动驾驶汽车并不够安全。

还有其他能够为ADAS提供3D感知的技术,其中之一就是激光雷达。无论这项技术多么有用,它也很昂贵,对汽车制造商来说需要复杂而昂贵的集成过程。这给自动驾驶汽车的量产带来了障碍。

自动驾驶汽车行业面临的两个最大挑战是找到最具性价比的方法来获得准确的3D数据,以及确保扩大这种传感器套件的有效方法。3D立体视觉在成本和性能方面都解决了这两个挑战。

3D立体视觉:担起重任?

3D立体视觉技术通过使用两个摄像头提供物体在环境中的相对深度和精确位置信息,类似于人类通过两只眼睛检测深度的方式。

在3D立体视觉中,两个摄像头安装在一个已知距离的平面上,该距离被称为基线。这两个摄像头同时拍摄图像,并且这两个图像之间的重叠区域用于创建3D感知。然后可以使用算法来匹配像素,生成并分析这些重叠图像中像素之间的差异。由于视差和深度是负相关的(即,随着与摄像头的距离增加,视差减小),这些视差点可以用于分析计算深度。然后使用外极几何将这些点映射为三维空间中的坐标。或者简单地说,一只摄像头可以给你2D的照片,两只摄像头可以给你3D的照片。

3D立体视觉的优势

3D立体视觉提供了关于目标区域中所有物体高度准确的数据,以及关于这些物体的深度和相对位置的关键信息。3D立体视觉还使得许多其他关键应用成为可能,如语义分割,即根据类别或标签对图像中的每个像素进行分类。这意味着它不仅可以判断物体在那里,还可以识别它是什么。

3D立体视觉领域在过去十年中迅速发展,因为它满足了自动驾驶汽车行业的关键需求。更好的摄像头提供更高的分辨率和更好的动态范围,从而即使在弱光照条件下也能从更远的距离检测到更小的物体。此外,还有更高的计算能力,这意味着更复杂的算法可以以更高的速率运行,性能更准确。即使使用两只摄像头也并不那么昂贵,因此该解决方案比许多其他提供相同信息的技术更简单、更便宜。更重要的是,它相对容易融入任何现有的ADAS系统。

3D立体如何与其他传感器配合使用?

任何ADAS都将利用多个传感器协同工作,以建立对车辆环境的最佳感知。3D立体视觉与这些其他技术协同工作,为ADAS数据带来深度感知和准确性。

用于深度感知的ADAS中最常用的技术之一是激光雷达,它具有与3D立体视觉类似的功能。3D立体视觉和激光雷达都能够测量距离和估计深度,并且都可以用于形成3D点云——空间中代表3D感知的一组数据点。每种技术都可以用作ADAS中唯一的传感器,或者它们可以一起用于创建冗余,在其中一个系统发生故障的情况下,另一个系统进行补偿。

真正的区别在于成本和可扩展性——这正是自动驾驶汽车行业面临的挑战。3D立体视觉是最具成本效益和易于集成的技术,可以提供高质量、准确的3D数据。它以激光雷达等其他技术的一小部分成本带来了3D成像的所有好处,因为它使用的是相对便宜且功耗最小的高分辨率摄像头。

3D立体视觉可以实现高体积可扩展性,因为很容易将该技术集成到现有系统中。凭借Foresight的Mono2Stereo等先进技术™ ScaleCam专有的基于软件的算法可以简单快速地集成到当前系统中。这使得Foresight的解决方案非常适合现有系统的大量升级。

Foresight:让3D立体视觉变得触手可及

3D立体视觉对自动驾驶汽车行业的巨大好处显而易见。凭借Foresight革命性的软件解决方案,自动驾驶汽车行业现在有了一种快速而廉价的方式,可以将这项技术添加到任何ADAS

联系方式

订阅我们的报刊