瞧瞧机器人如何像你一样往钱包里塞现金
1 天前 / 阅读约5分钟
来源:CNET
Generalist AI发布Gen-1物理AI模型,使机器人能够执行多种任务,包括叠衣物、修理机器人等。Gen-1设计适用于任何机器人,能够即兴创作完成任务,提高机器人执行任务的成功率。

机器人竟然也能取钱,这着实让人有些担忧。Generalist AI/截图/CNET

2026年,机器人领域取得了突飞猛进的进步,其灵活性显著增强,这正是长期以来我们寻求真正实用家庭帮手所亟需的。如今,一款全新的人工智能模型横空出世,为机器人执行各类任务提供了强大动力,包括叠衣物、制作盒子、修理其他机器人,甚至能用薄纸币将钱包填满。

本月早些时候,位于加利福尼亚的Generalist AI公司发布了Gen-1,这是一款全新的物理AI模型,能让机器人顺利完成上述所有任务(以及更多)。Generalist AI的联合创始人兼首席执行官皮特·弗洛伦斯向我透露,这是基于现实世界智能设计的机器人迈出的一大步。

在该公司发布的大多数示例视频中,Gen-1在一对机械臂上运行,但其功能远不止于此。弗洛伦斯表示:“Gen-1旨在成为任何机器人的大脑,这意味着同一模型可以应用于人形机器人、工业机械臂或其他机器人系统。”

对于通用人形机器人而言,今年已被证明是具有突破性的一年,包括波士顿动力和Honor在内的多家公司都推出了能够做出类似人类动作的先进机器人。预计机器人市场将迎来爆发式增长,摩根士丹利的一项预测显示,到2050年,市场规模将增长至5万亿美元。预测表明,机器人将首先进入工业、零售、酒店和护理等领域,最终走进我们的家庭。要实现这一目标,我们需要在人工智能方面取得进一步突破。

训练机器人与人类和谐共处

过去几年里,我们见证了大型语言模型,如ChatGPT、Gemini和Claude等,以惊人的速度发展。然而,为机器人提供动力的物理AI模型却进展缓慢,这主要是因为缺乏训练这些模型的数据。机器人,尤其是人形机器人,必须像人类一样学会在一个为人类打造的世界中导航。

这些数据通常是从由人类远程操作的机器人执行任务时收集的,但Gen-1并非如此。相反,用于训练Generalist AI模型的数据集是由人类使用可穿戴技术完成数百万个不同任务而收集的。

弗洛伦斯说:“我们自主研发了轻量级‘数据手’,并在全球范围内推广,以了解人们如何与物体实际互动,包括所有微妙的力反馈、触觉感受、滑动、纠正和恢复等,这些构成了人类在现实世界中的灵活性。这种数据对于教授机器人物理常识至关重要,即具备直观的理解和实时适应的能力,而非执行僵硬的指令。”

Generalist AI发布了一系列视频,展示了该模型在机器人上反复执行各种不同任务的情况,其中最引人注目的或许是一个机器人从钱包中取出现金,然后再将其放回同一个口袋。这是一个让许多人都会感到棘手的繁琐任务。考虑到纸币的脆弱性和钱包的材质,这对机器人来说显然也不容易,但它还是成功完成了任务。

另一段视频显示,一个机器人按颜色分类袜子,将它们整齐地叠成一摞,并使用触摸屏计算袜子的对数。该模型还能完成其他棘手的任务,如拉开拉链、用笔装满铅笔盒、将橙子堆叠成整齐的金字塔形状以及插入网线等。

这些视频充分展示了Gen-1功能的广泛性,但更令人印象深刻的是它完成某些任务的成功率。Generalist AI将该模型的成功率与前一版本进行了对比,发现Gen-1能够在99%的情况下成功维修机器人吸尘器(Gen-0的成功率为50%),在99%的情况下折叠盒子(Gen-0的成功率为81%),在99%的情况下包装手机(Gen-0的成功率为62%)。

大多数机器人被编程为以特定和有序的方式完成任务。但是,当环境发生变化时会怎样呢?弗洛伦斯说:“环境中最微小的变化都可能导致任务失败。”

机器人需要的一项重要技能(人类天生具备)是随机应变的能力。这就是为什么Gen-1在设计时考虑了即兴创作,以便它能够想出完成任务策略的原因。弗洛伦斯给我举了一个例子,一个机器人用两只手重新定位一个汽车任务中放置不当的零件,尽管它只接受过使用一只手的训练。

他说:“直到现在,这种创造力在机器人技术中基本上还不存在。”

弗洛伦斯表示,在增强机器人的即兴创作能力方面仍需开展大量工作,但早期的进展已经显示出对可靠性和速度的积极影响。“我们开始看到真正的进展,并很高兴能够推动具身智能的边界。”

毕竟,也许有一天,你会需要一个能在家里修理你所有其他小机器人的机器人。