中电网移动|移动中电网
 
中电网移动|移动中电网|高清图滚动区

LiDAR是机器人的最终选择吗?机器视觉还有哪些潜力可挖掘

本文编译自ZDNet

今年,关于机器人的一大趋势就是,机器人“看”的方式正在发生根本性的变化,这将对公用事业成本和机器人的扩散产生巨大影响系统。

机器视觉融合了多种技术,并且越来越依赖机器学习和人工智能形式的软件来解释和处理来自 2D 传感器的数据,这在不久前是无法实现的。

随着对软件的日益依赖,高度专业化的传感器(如 LiDAR)发生了有趣的转变,LiDAR 长期以来一直是在半结构化和非结构化环境中运行的机器人的主要产品。将人类与人工智能软件之间的关系结合起来的机器人专家开始发现 LiDAR 实际上并不是必需的。相反,机器视觉正在以更实惠的成本提供更高质量的映射,尤其是在室内机器人和自动化方面。

为了详细了解正在进行的转型,我(GN)与 inVia Robotics 的首席技术官兼联合创始人 Rand Voorhies 就机器视觉、自动化的未来以及未来几年 LiDAR 是否仍将成为机器人的基础传感器进行了联系。

GN:机器视觉、传感器或软件方面的进步在哪里?

Rand Voorhies:虽然 2D 成像传感器确实在不断改进,但它们的分辨率/噪声/质量问题成为机器视觉广泛采用的限制因素。尽管在过去十年中出现了一些有趣的传感器改进(例如偏振传感器阵列和全光/光场相机),但没有一个真正的牵引力,因为机器视觉传感器的主要优势在于其成本和普遍性。通过深度学习的出现,最具开创性的进步确实是沿着软件方向革新。与十年前的技术相比,现代深度学习机器视觉模型似乎很神奇。任何拥有 GPU 的工程师现在都可以下载并运行对象识别库,这在十年前会让顶级研究实验室陷入困境。事实是,2D 成像传感器比典型的 LiDAR 传感器捕获的数据要多得多——你只需要知道如何使用它。

虽然尖端机器视觉一直在突飞猛进,但其他因素也有助于采用更简单的机器视觉技术。电池和电机技术的不断发展已将组件成本降低到量产程度,从而为最终用户提供非常强大的投资回报率。考虑到良好的投资回报率,客户(在我们的例子中是仓库运营商)很乐意用“基准”贴纸来注释他们的环境。这些贴纸几乎就像机器人技术的作弊码,因为非常便宜的机器视觉解决方案可以超精确地检测基准贴纸的位置和方向。通过将这些基准点贴在仓库各处,机器人可以轻松构建地图,让它们能够进行自我定位。

GN:您能否介绍一下采用激光雷达的背景?为什么它会成为自动驾驶应用中如此标准化的传感工具?开发人员使用 LiDAR 机器视觉的早期障碍是什么?

Rand Voorhies:在激光雷达出现之前,机器视觉就已经被用来引导机器人。由于 Sebastian Thrun、Daphne Koller、Michael Montemerlo、Ben Wegbreit 和其他人的一些开创性学术研究使来自这些传感器的数据处理变得可行,LiDAR 在 2000 年代初期开始受到广泛欢迎。这项研究和经验导致基于 LiDAR 的 Stanley 自动驾驶汽车在 DARPA 大挑战赛中占据主导地位(由 Thrun 领导),以及 Velodyne 的成立(由另一位大挑战赛参与者 David Hall 创立),这产生了许多现在考虑成为事实上的自动驾驶汽车传感器。挑战赛表明,LiDAR 终于成为了一种可行的技术,让快速移动的机器人能够在未知、杂乱的环境中高速导航。从那时起,学术界对改进用于处理 LiDAR 传感器数据的算法兴趣大大增加,并且已经发表了数百篇关于该主题的论文和培养了各类人才。最终,毕业生们纷纷涌入商业领域,拥有大量的 LiDAR 学术经验,准备将理论付诸实践。

在许多情况下,LiDAR 已被证明是非常适合这项工作。密集的 3D 点云一直是机器人专家的梦想,它可以让避障和寻路变得非常容易,尤其是在未知的动态环境中。然而,在某些情况下,LiDAR 根本就不适合这项工作,并且会将原本简单的解决方案变得复杂。确定 LiDAR 什么时候合适,什么时候不合适,对于构建不仅有效的机器人解决方案至关重要——它们还为客户提供了积极的投资回报率。

与此同时,机器视觉也在进步。机器视觉的早期障碍之一可以通过一个简单的问题来理解:“我是在看远处的大物体还是近距离的小物体”?使用传统的 2D 视觉,根本无法区分。甚至我们的大脑也可能被愚弄,正如在游乐园透视错觉中所看到的那样。机器视觉的现代方法使用多种方法来克服这一点,包括:

通过了解场景的更大上下文来估计物体的距离,例如,我知道我的相机离地面 2m,并且我知道汽车的轮胎在街道上是 1000 像素,所以它是 25m 远。
通过使用两个或更多重叠的相机(即立体视觉)来构建对场景的 3D 理解。
通过“感觉”相机如何移动来构建对场景的 3D 理解,例如,使用 IMU(惯性测量单元 - 有点像机器人的内耳)并将这些移动与来自相机的不断变化的图像相关联。
我们自己的大脑同时使用所有这三种技术,让我们对周围的世界有更丰富的了解,而不仅仅是构建一个 3D 模型。

GN:为什么对于许多机器人应用而言,机器视觉比 LiDAR 有更好的技术案例?

Rand Voorhies:LiDAR 非常适合在地形中有很多未知和不一致的户外应用。这就是为什么它是自动驾驶汽车的最佳技术。在室内环境中,机器视觉是更好的技术案例。由于光子在仓库内的物体上反弹,机器人很容易在激光雷达的方向上感到困惑。例如,他们很难区分一箱库存和一架子库存——两者对他们来说都只是对象。当机器人深入大型仓库的过道时,它们经常会因为无法区分它们的地标而迷路。然后必须重新映射。

通过结合使用机器视觉和基准标记,我们的 inVia Picker 机器人可以准确地知道它们在任何时间点的位置。他们可以“看到”并区分他们的地标。几乎所有基于 LiDAR 的仓库/工业机器人都需要一些基准标记才能操作。基于机器视觉的机器人则需要更多的标记。后者需要额外的时间和成本来部署长卷贴纸而不是更少的单个贴纸,但是当您考虑执行常规 LiDAR 测绘的时间和成本时,平衡会大大有利于纯视觉。归根结底,仓库环境中的 2D 机器视觉比 LiDAR 更便宜、更容易、更可靠。

如果机器人的使用不需要非常高的精度和可靠性,那么 LiDAR 可能就足够了。但是,对于无法承受任何准确性或正常运行时间损失的系统,机器视觉系统可以真正展示其优势。基于基准的机器视觉系统允许操作员将标记准确地放置在需要高精度的位置。使用 inVia 的系统从货架上拾取和放置手提箱,将这些标记放置在手提箱和货架上提供毫米级精度,以确保每个手提箱准确放置在它应该去的地方而不会失败。尝试使用纯 LiDAR 系统来实现这一目标对于商业用途来说成本和时间都太高了。

GN:有哪些更好的商业案例?

Rand Voorhies:在业务方面,情况也很简单。机器视觉可以节省金钱和时间。尽管多年来 LiDAR 技术的成本有所下降,但它仍然很昂贵。我们致力于为我们的机器人寻找最具成本效益的技术和组件,以使任何规模的企业都能使用自动化。在 inVia,我们的理念是让复杂的技术变得简单。

使用机器视觉与使用 LiDAR 完成订单所需的时间差异及其所有重新映射要求至关重要。这可能意味着按时或迟到一天向客户下订单的区别。由于激光雷达重新映射而迷路的机器人都会降低该系统的投资回报率。

使用机器视觉时,硬件本身也更便宜。相机比 LiDAR 便宜,而且大多数 LiDAR 系统无论如何都需要带有基准的相机。使用机器视觉,应用基准点需要额外的一次性人工成本。然而,一次性将基准点应用于手提袋/货架在劳动力方面非常便宜,并且会产生一个更强大的系统,停机时间和错误更少。

GN:机器视觉将如何改变物流和履行等领域机器人的格局?

Rand Voorhies:机器视觉已经通过自动化死记硬背的任务来提高劳动生产率,从而对物流和履行中心产生影响。使用机器人完成订单的仓库可以补充稀缺的劳动力,让他们的员工管理涉及决策和解决问题的高阶任务。机器视觉使移动机器人车队能够在仓库中导航,执行诸如拣货、补货、库存移动和库存管理等关键任务。他们在没有中断的情况下做到这一点,并且具有高精度。

使用由机器视觉驱动的机器人系统也因其价格合理而消除了量产障碍。过去因传统自动化而被排除在市场之外的中小型企业能够从重复性任务的自动化中获得同样的好处,从而发展他们的业务。

GN:仓库在寻求采用新系统时应该如何调查机器人技术的前景?

Rand Voorhies:现在市场上有很多机器人解决方案,每个解决方案都使用非常先进的技术来解决仓库运营商面临的特定问题。因此,最重要的一步是确定您最大的挑战并找到解决它的解决方案。

例如,在 inVia,我们创建了一个专门解决电子商务履行机器人所特有的问题的解决方案。履行电子商务订单需要随机访问大量不同的 SKU。这与零售履行非常不同,在零售履行中,您要检索大量 SKU 并将它们装在箱子和/或托盘中运送出去。这两个操作需要非常不同的存储和检索设置和计划。我们创建了专有算法,专门创建更快的路径和流程来检索随机访问的 SKU。

电子商务也更加依赖劳动力和耗时,因此成本高昂。因此,这些仓库希望采用机器人技术来帮助他们降低劳动力成本,以及将订单送到客户手中所需的时间。他们有 SLA(服务水平协议),规定何时需要挑选、包装和运送订单。他们需要询问供应商他们的技术如何帮助他们消除障碍以满足这些 SLA。

猜你喜欢
中电网移动|移动中电网|频道导航区