对于制造商来说CONTROL ENGINEERING China版权所有,机器视觉是一个日益重要的关键领域,他们将该技术应用于机器人以实现许多自动化技术。在 2D 视觉之后,3D 视觉系统增加了相机传感器的深度。现在,一家从事机器视觉领域的AI公司,宣称要为工业机器人提供一种 "4D视觉",以实现更快速、更智能和更灵活的机器人作业。
显然,这里所说的"4D"和电影院里的4D不是一个概念。根据 Apera AI 首席执行官 Armin Khatoonabadi 的说法,这个"D",不是传统意义上的时间维度。它更多地是关于扩展机器人的智能,是指当图像被捕获时出现的智能,并继续传送到机器人那里以帮助它做出更好的决定。
"4D视觉"具有更短的捕获和处理时间,这减少了机器人的整体循环时间,同时还能为机器人提供清晰的图像。"4D 视觉"背后的理念是让机器人成像比 3D 视觉更快、更熟练,因为有时候3D 视觉太慢且不那么智能。
2D 视觉与 3D 视觉
"支持AI的计算机视觉"是 Apera AI 公司的 4D 视觉解决方案的核心口号。从某些方面来说,该短语是多余的,因为所有计算机视觉技术都属于AI领域。对于计算机而言,图像只不过是与网格相对应的一系列值,无论是 2D 图像网格还是 3D 空间。
对于工程师来说,机器视觉的挑战是找到让计算机复制人类必须解释图像内容的能力的方法。机器视觉系统在工业中是必不可少的,尤其是在测量、检查、识别和引导应用中。在许多机器人集成挑战中,视觉系统是关键部分,没有它,机器人将缺乏完成任务所需的输入。
对于某些任务,例如检查水果块的颜色是否正确或检查瓶子的填充水平,2D 视觉系统就足够了。在其他情况下,例如必须使用图像数据将机器人引导到 3D 空间中的某个位置的拣选任务,可以使用 3D 成像设备。对于大多数应用,视觉系统必须在视野中定位目标对象,然后将对象与预定义的模式进行比较。
当使用 2D 视觉系统捕捉 3D 对象时,它会从一个角度收集对象的平面视图。例如,球形对象将显示为圆形。对于许多应用程序,不需要缺少的高度信息。2D视觉的常见应用包括:
· 验证特征和位置
· 尺寸检查
· 条码读取
· 字符识别
· 标签验证
· 质量检验
· 监视和对象跟踪
· 存在检测
在所有 2D 视觉应用中,准确的图像源自识别图像明暗区域之间的对比度。因此,光线不足和光线变化会降低准确性。非常暗或反光的物体也很难准确检测。最后,如果目标物体离相机更近或更远,可能会引入测量误差。没有任何 z 轴信息,相机只能看到更近或更远的物体更大或更小。
另一方面,使用 3D 视觉,系统收集的不仅仅是平面图像。收集 3D 点云,收集对象表面上大量点的 x、y 和 z 坐标。3D 视觉可以通过多种技术实现,包括激光三角测量、立体视觉、飞行时间和结构光。与 2D 相比,由于额外的 z 数据,3D 视觉可以执行更复杂的任务:
· 厚度、高度和体积测量
· 尺寸标注和空间管理
· 测量形状、孔、角度和曲线
· 检测表面或装配缺陷
· 针对 3D CAD 模型的质量控制和验证
· 机器人引导和表面跟踪(例如,用于焊接、粘合、去毛刺等)
· 用于放置、包装或组装的拣选箱
· 对象扫描和数字化
3D 视觉挑战和缺点
虽然 3D 视觉系统具有优势并且可用于特定应用,但 3D 视觉确实存在一些主要缺点。一些 3D 机器视觉挑战足以让制造商和系统集成商望而却步,其中包括:
1. 浪费:整个场景在整个成像管道中被捕获和处理,这会产生大量的数据。而其中很少是真正有用的。
2. 遗漏的表面细节:该过程中包含的二维信息非常少。
3. 不必要的费用和编程时间:如果有选择,有些制造商和系统集成商宁愿围绕 3D 视觉工作,因为它不值得花费那么多时间和费用。
4. 无法生成高质量的点云,这对于更好的对象识别至关重要:如果设置不是最佳的,3D 相机并不总是擅长这一点。
5. 速度慢:由于需要处理大量数据www.cechina.cn,机器人可能需要更长的时间才能得出正确的结果。
3D 视觉需要更强大的硬件和软件来完成任务。它更耗费时间、处理器和软件。虽然今天计算机的能力在不断提高,但 2D 成像可能总是更快一点。
此外,3D 视觉在创建场景的 3D 表示时会捕获大量数据。执行大多数任务实际上只需要很少的这些数据。3D 点云在捕获 3D 信息时可能会牺牲 2D 信息的质量。它也更昂贵且不容易设置。
4D 视觉的工作原理
在某种程度上,"4D视觉"可能是一种倒退,因为它使用 2D 相机而不是 3D。该过程的关键补充是人工智能。在一个典型的"4D视觉"应用中,2D 摄像头捕捉场景,然后 AI 提取 2D 信息,如阴影、边缘、纹理和颜色(就像人类一样),同时执行对象识别和姿势估计。然后将物体的姿势发送给机器人,以帮助它像 3D 相机一样更好地执行任务。
拣选箱是要求苛刻的机器人视觉应用的一个很好的例子。虽然从一个盒子里一堆杂乱无章的相同物体中一个一个地挑选物体对人类工作者来说是微不足道的,但多年来,这对机器人技术来说一直是一个复杂的挑战。
在机器人需要看到三维空间的情况下,需要 3D 视觉似乎很直观。但为什么?虽然人眼确实利用了立体 3D 视觉,其中每只眼睛之间视图中物体的形状和位置差异与深度相关,但人类视觉是由另一个器官辅助的:大脑。这是因为大脑能够使用情境和对象的先验知识来估计深度并提供指导。
这就是 Apera AI 公司推出VCV-Cortex 背后的想法,该系统将 2D 视觉与 AI 相结合,提供 2D 视觉的速度和简单性以及 3D 视觉的稳健性和功能。
该系统使用两个带有即插即用软件的摄像头。扫描目标对象以创建图案。接下来,AI 系统需要 24-48 小时来训练和学习对象。之后,配备该系统的机器人准备好拾取零件,并在现场计算机上运行该系统。
"我们使用更多的AI提取大量信息。不只注意边缘,也关注遮挡以及纹理、阴影等信息。" Khatoonabadi说CONTROL ENGINEERING China版权所有,"例如,一个系统接受了几何和图片形状的训练。我们对它应该做什么和应该忽略什么有很大的控制权。我们可以告诉系统忽略一块几何体www.cechina.cn,这为用户提供了很大的控制权。"
"4D视觉"提供给机器人的信息对系统的压力较小,同时仍允许机器人执行其任务。使用AI和软件的更多自由还可以让机器人以更大的灵活性工作,这对提升整个系统的效率有利。
根据 Khatoonabadi 的说法,这种 4D 视觉方法更接近于人类感知视觉的方式,而不是计算机 3D 视觉。
当人类观察物体时,不使用激光测量来确定其深度。相反,使用立体视觉。2D 图像由眼睛收集。然后大脑接管,解释一系列情境信息,包括颜色、阴影、透视、边缘等。即使闭上一只眼睛--消除立体深度感知,人类也可以快速估计距离或深度。拥有如何解释情境信息相关的智能对于整体视觉非常有价值。
虽然“4D视觉”系统与 2D 系统相比具有显著的能力提升,对于想要获得即插即用的机器视觉的工程师来说是一种可行的解决方案CONTROL ENGINEERING China版权所有,但它仍然无法像 3D 系统那样捕获数据。它只是估计它。
毫无疑问,有许多机器视觉应用需要 3D 数据。随着计算机处理速度越来越快、成本越来越低,3D 视觉的速度和数据缺陷也会变得越来越不重要。
这种“2D 相机加上更多AI 的4D 视觉”解决方案,会为你的工厂带来更多收益吗?答案只能交给时间去检验了。