几十年来,机器人和人类共享同一空间的世界一直存在于大众的想象中,而人工智能的出现只会加剧人们对这一现实越来越近的期待。

作为赋予机器生命这一理念的积极倡导者之一,马克·雷伯特认为, 科技进步主要提升了机器人的认知能力。然而,在人形机器人能够与人类进行更广泛的互动之前,机械结构和安全方面仍需取得重大突破。

“指望它们在两三年内就能高度实用化未免过于乐观。但我认为,十年后将会发生一场重大变革。这些机器人将非常强大,”雷伯特在接受NeoFeed采访时说道。

“我们相信,大约 10 年后,机器人将能够观察人类完成一项工作,然后执行该工作,因为它会分解技能并理解必要的步骤,”他补充道。他当时正在巴西参加 Safra 人工智能投资日。

作为现代机器人领域的先驱,雷伯特毕生致力于研究动物的运动方式以及如何将这种运动方式转化为机器的运行规律。他拥有麻省理工学院的博士学位,曾任教于卡内基梅隆大学和麻省理工学院。1992年,他创立了波士顿动力公司,并领导该公司长达三十年。

目前,波士顿动力公司由韩国现代汽车控股,现代汽车持有该公司80%的股份, 软银持有剩余的20%。雷伯特曾担任首席执行官,直至2020年初被罗伯特·普莱特接任,但他仍以董事会主席的身份关注公司的发展。

作为首席执行官,雷伯特开发了重新定义机器人运动的机器人——从能够奔跑、跳跃和保持平衡的机器到设计用于在恶劣环境中运行的四足机器人。

这种对运动能力的执着催生了波士顿动力公司开发的“机器狗”Spot。Spot能够爬楼梯、穿越崎岖地形,并在人类不宜进入的区域执行任务。作为该公司的旗舰产品,Spot已被用于监测切尔诺贝利的辐射水平,并开始被安全部队和军队采用,用于诸如拆除地雷等任务。

尽管 Spot 能够执行一系列自适应功能,但 Raibert 承认,总体而言,机器人仍存在许多缺陷,在能够可靠地与人类互动之前,安全性还需要改进。

“要弄清楚如何做到这一点,需要非常谨慎。通常情况下,这些机器人是与人分开使用的。我认为,在相当长的一段时间内,这种情况在很大程度上还会继续下去,”他说。

研究人员表示,由于存在这种风险,像《杰森一家》动画片或反乌托邦小说《卡桑德拉》中描绘的那种家用机器人,距离成为现实还有很长一段时间。

Atlas,波士顿动力公司的人形机器人(图片:复制品)

他说:“家庭是最难安置机器人的地方,因为安全问题很复杂,而且很难找到理想的产品成本。此外,它还需要具备许多实用功能来弥补这些不足。”

Spot 是波士顿动力公司开发的一款四足机器人,售价约为 75,000 美元,通常以多台为单位出售。

Raibert 创立的公司还开发了另外两种型号:Atlas,一款专注于复杂动作研究和测试的人形机器人;以及 Stretch,专为在物流仓库中装卸箱子而设计。

Raibert 致力于机器人领域超过 50 年,他表示对该领域的未来感到兴奋,尤其是利用语言模型—— 大型语言模型(LLM)——来扩展机器的认知能力。

但他认为,新一代人工智能对解决他眼中该领域最大的瓶颈——硬件——贡献甚微。他表示,机器人的物理特性仍然是人形机器人发展面临的主要挑战之一。

“对机器人来说,做接待员非常简单。基本上,只需要说话和理解就行了。最难的是体力活,比如修理汽车、摩托车或自行车,”雷伯特说道。据他所说,这些正是机器人专家们主要从事的工作。

在这场人形机器人竞赛中,除了波士顿动力公司之外,还有许多大型企业也在争夺市场份额,例如美国的特斯拉公司,其Optimus 、Generalist和Dexterity等机器人就属于此类。但他同时也提到了中国取得的进展,中国至少有27家机器人公司正在运营。

“所有国家中最具雄心壮志的当属中国。我不会说他们已经拥有最先进的人形机器人,但如果你看看他们对机器人技术的关注程度、投资和投入,你不可能不对中国今天的发展印象深刻,”雷伯特说道。

以下是雷伯特访谈的主要摘录:

人工智能如何帮助发展机器人技术?它是否提高了人形机器人或其他类型机器人的易用性?
当前一代大型语言模型(LLM)使人机交互变得更加便捷,因为你可以说话,它会被翻译成机器人能够理解的语言。这指的是认知层面。我认为,到目前为止,LLM在机器人的物理层面上还没有起到什么作用。

人工智能训练进展如何?
目前正在进行一系列研究,这些研究旨在构建基础模型——例如视觉语言模型——通过让机器人观看各种任务的执行过程(包括远程操作和仿真)来训练它。然后,机器人会构建一个模型,使其能够协调自身的手部动作或移动方式与周围环境。我认为这些技术目前都还没有达到可以应用于工厂的性能水平,或者至少大部分还没有。但人们对它们最终能否成功抱有很大的乐观态度。

“如果你观察ChatGPT、Gemini以及其他所有机器人的认知功能,它们的表现都非常出色。但是机器人与世界的互动则是另一回事。”

目前机器人研发的瓶颈更多在于硬件而非软件吗?
我认为,如果你观察ChatGPT、Gemini以及其他所有机器人的认知功能,就会发现它们的性能非常出色。虽然它们并不完美,但我每天都在手机上使用它。所以,认知方面发展良好。但是,机器人与世界的互动,也就是物理层面,则是另一回事。目前有很多研究人员正在致力于物理人工智能的研究,并且取得了进展。RAI研究所、波士顿动力公司就是其中之一,还有像Generalist、Dexterity这样的公司,以及其他数不胜数的机构。

您认为10年后机器人的可用性会如何?
在这个领域,十年是很长一段时间。我认为你会看到很多变化。看看目前市面上的人形机器人,指望它们在两三年内就能非常实用未免过于乐观。但十年后,我认为将会出现一场重大变革。这些机器人将非常强大。硬件会不断发展,成本也会下降——这部分要归功于所有开发者的努力。而且,由于人工智能公司正在构建的基础模型,它们的能力也会不断提升。

您设想10年后人类与机器人之间会是怎样的互动方式?例如,是否有可能出现机器人接待员?
我觉得做接待员挺轻松的。基本上,你只需要会说话、能听懂就行了。最难的是体力活,比如修汽车、摩托车或自行车。举个例子,当你拆卸自行车时,你会明白每个零件的作用以及它们是如何组装在一起的。这种理解有助于指导必要的操作步骤。这些都是高难度的任务,而这正是机器人学家最感兴趣的:在现实世界中执行各种操作。

是因为手部动作的精准性吗?机器人很难做到这一点吗?
我们思考问题时会考虑一系列技能。比如,如果你在修自行车,你会先用到一项技能,比如拧螺丝。然后是一系列步骤:拧螺丝、拆变速器、拆链条。你会交替进行理解步骤顺序和执行各项技能。

“如果你去工厂,他们会通过观察其他人来教你。我们相信,大约10年后,机器人将能够观察人类完成一项工作,然后自己完成这项工作。”

这方面进展如何?
其中一个项目叫做“观察、理解、实践”。如果你进入一家工厂,他们会通过观察其他人来教你。你观察、理解,然后提出问题。如今,机器人需要编程。我们相信,大约十年后,机器人将能够观察人类完成一项工作,然后自己完成,因为它会分解技能并理解必要的步骤顺序。

法学硕士学位能在这方面发挥作用吗?
是的,这是至关重要的一部分。人工智能提供的正是这种理解。人工智能还能提供关于世界的知识。你可以拿起手机问:“如何更换自行车链条?”它会告诉你步骤——也许不会告诉你如何用手指操作,但会告诉你顺序。这已经对机器人大有帮助了。否则,程序员就必须弄清楚所有步骤并编写所有程序。

你认为哪些类型的工作更容易被机器人取代?
最大的问题是北美、亚洲和欧洲的人口都在下降。因此,我们有机会利用机器人来维持生产力。我并不是说机器人不会取代工作岗位,但它们确实有机会填补就业空缺。这就是我的想法。

人们对机器人的恐惧是否过头了?
当我们发布机器人表演的视频时,很多评论都说他们感到害怕。但点赞和踩的比例却非常高。人们喜欢看机器人的视频——然后又喜欢说他们感到害怕。我不知道这是怎么回事。这就像去看恐怖电影:你是想感受恐惧,还是真的感到害怕,觉得机器人会统治一切?我认为这两种情况都存在。

“人们喜欢看机器人的视频——然后他们又喜欢说他们害怕。我不知道这是怎么回事。”

在您的报告中,您重点提到了安全漏洞。解决这些问题并允许机器人直接与人互动需要多长时间?
要弄清楚如何实现这一点,需要非常谨慎。通常情况下,这些机器人是与人分开使用的,而且我认为这种情况还会持续相当长一段时间。因此,家庭是最难安置机器人的地方:因为安全问题很复杂,而且很难找到理想的成本。此外,它还需要具备许多实用功能来弥补这些不足。

甚至最近也有电影(如《爱丽丝卡桑德拉》)探讨了家用机器人精神错乱的风险。
是的。可惜的是,好莱坞似乎只有一种叙事模式,那就是机器人都是邪恶的。这是在美国的情况。在其他国家,比如日本,人们对机器人的态度要乐观得多。比如Astro Bot(日本Team Asobi公司开发的游戏),里面的机器人都是友善的角色。我认为这是一种更积极的态度。

你认为机器人会在战争中得到应用吗?例如,取代步兵,或者像无人机一样发挥其他作用?
波士顿动力公司不允许其任何机器人配备武器。你不能给波士顿动力公司的机器人安装武器。部分原因是他们认为这些机器人并非为此而设计的。如果你和军方人员交谈,他们也会同样担心误伤友军。

但这种军事用途已经存在了,对吧?
一些警察部队已经开始使用这些机器人。他们并非给机器人配备武器,而是让它们充当中间人,这样既能让警察和嫌疑人保持距离,又能让他们之间保持沟通。在美国和其他一些国家,大约有十几个警察部队在这种情况下使用Spot机器人,而且效果显著。

“我们研究过军队和警察训练的犬只,它们能做很多事情。Spot 做不到它们能做的绝大多数事情。”

Spot看起来像只狗,你说警方已经在使用它了。它能否取代警犬,例如用来嗅探毒品?
狗狗们在各自的领域都非常出色。我们研究过军犬和警犬,它们能做很多事情。Spot虽然做不到它们能做的很多事情,但这并不意味着它就不能做一些有用的事情。

能否利用传感器让Spot闻到气味?
我真的不知道。但他们开始使用Spot系统来拆除地雷了。荷兰军队为此购买了一些设备。

你对机器人的未来最兴奋的是什么?
对我而言,这已是我毕生的事业,我们一路走来,取得了长足的进步。现在发生了很多事情,我很兴奋地期待着我们能做出哪些新的尝试。有些公司获得的投资额令人难以置信。所以,现在从事这类工作真是令人激动。

下一步是什么?
我们有大约五个小组分别研究不同的方面:行动能力、灵巧性、感知能力,以及如何将这些能力与推理和常识结合起来。我们需要将所有这些能力整合起来。

你认为未来会是更多的人形机器人,还是像那些在仓库里工作、与人类互动隔绝的机器人?
两者兼有。人形机器人领域发展迅猛,而且这种趋势还会持续下去。很多公司都在研发这类机器人,其中一些做得非常出色。波士顿动力公司、埃隆·马斯克以及一些中国公司都做得非常棒。但我所在的公司已经在仓库里部署了机器人,我认为这种趋势将会继续蔓延。

美国是否在该技术领域处于领先地位,还是中国有机会在竞争中脱颖而出?
中国有制造能力。深圳就是深圳。我希望美国能重拾制造实体产品的能力,把这些能力带回美国。我认为美国在人工智能和计算机领域仍然领先。但目前有很多事情正在发生,也有很多雄心勃勃的公司和投资者。所以一切皆有可能。