王杰夫

左一为Covariant CEO Peter、左二为首席科学家PieterAbbeel,左三为联合创始人Rocky Duan。

无论以ChatGPT为代表的各种聊天机器人在2023年有多幺火热,这一切都还局限在比特世界里,哪怕ChatGPT的分析推理再严谨,代码写得再精妙,它依然无法拿起一个苹果。想要让AI从比特世界进入原子世界,就必须给它一副身体,并且教会它如何去控制,这就是具身智能(EmbodiedArtificialIntelligence)的概念。

在2023年涌现的AI独角兽名单里,Covariant是其中少有的专注具身智能的公司,它采取了与波士顿动力等传统机器人公司迥异的技术路线。相较于后者在精密硬件平台上细致打磨运动控制算法以实现机器人运动,Covariant力图开发一个能够适应多种场景的通用机器人大脑,避免为特定场景定制特定机器人,而是让不同机器人共享同一智能核心。

这与OpenAI的思路相同。其实在GPT-3.5(ChatGPT背后的模型)这样的大语言模型出现之前,AI是个大门类,下面有自然语言处理、计算机视觉、语音识别等细分领域。最初的GPT只是一个探索性的技术路线,但科学家们发现,随着投喂的数据增多,参数的规模增大,模型出现了一些智能的迹象,它可以理解语言、生成文本,甚至把图像数据投喂进去,这个模型也开始理解图像的内容。

当然,现实中科学家遇到的困难远比上述流程复杂得多,但这并不能否认“大力出奇迹”就是推动这一轮AI浪潮到来的重要原因。那幺何不去训练一个用于机器人的模型呢?

Covariant和OpenAI渊源颇深,4位创始人里有3位都在OpenAI工作过。那时OpenAI尚处于早期阶段,整个团队只有10名成员,他们伴随这家初创公司一路成长,直到团队规模扩大到一百多人。

最年长的皮特·阿贝尔(PieterAbbeel)现在是Covariant的首席科学家,他曾是加州大学伯克利分校电气工程与计算机科学系教授,是将深度强化学习应用在机器人方面的先驱。他率先教会机器人从人类演示中学习,为下一代机器人技术奠定了基础。早在2016年,也就是OpenAI成立的第二年,阿贝尔就加入了这个后来发布ChatGPT的公司,成为其机器人团队的一员。当时与阿贝尔一起在OpenAI工作的还有他的两个学生,即如今Covariant的CEO陈曦(Peter)和CTO段岩(Rocky)。

有一天,陈曦和段岩两人在唐人街的中餐馆里聊合作发表的新论文—用强化学习教会机器人像人类一样在短时间里掌握新技巧。科研取得进展固然可喜,如果想要进一步研究,OpenAI实验室所能提供的资源和数据都远远不够了。“如果我们想用数据和计算驱动的AI解决机器人方面的问题,在实验室永远得不到足够数据,我们必须进入实际环境里求解问题,别无他法。”2022年,陈曦曾在播客节目里回忆创业初期的讨论。

意识到学术研究与解决实际问题间的差距,正是Covariant创立的关键时刻。2017年,Covariant在硅谷成立,它最初的名称是EmbodiedIntelligence。阿贝尔兴趣广泛,担任了风投公司AIXVentures的投资合伙人,还在YouTube经营着自己的同名播客节目,于是Covariant的CEO由陈曦担任。得益于阿贝尔的背书,Covariant在种子轮就获得700万美元的融资,投资人列表里有着一众AI领域的知名学者:深度学习之父杰弗里·辛顿(GeoffreyHinton)、卷积神经网络之父杨立昆(YannLeCun)、GoogleBrain创建人杰夫·迪恩(JeffDean)、ImageNet创建者李飞飞等。

另一边,OpenAI由于机器人团队的核心成员跳槽创业,加上想要把重心放在基础模型GPT的研发上,最终在2021年7月解散了整个机器人团队。Covariant则延续了AI机器人的研究路线,一路发展至今。

Covariant的核心产品并不是人形机器人。创立之初,创始人就没有把应用场景锚定在C端,而是试图把AI技术应用在工业化领域,为B端客户提供AI分拣机器人。陈曦的理由是仓库和配送中心是机器人行业最先发生质变的地方。这并不难理解,只有传统机器人已经广泛落地的B端场景能提供足够的训练数据。

对比来看,传统的机器人系统是刚性的,人类不管取得多少操作数据,都不会改变机器人对三维空间的理解和感知能力。这类机器人不需要AI的支持,它们只是用标准化算法移动的集装箱,一旦涉及到识别并分拣不同种类的物品,就需要人类手动完成。而Covariant关注的重点是“搬运”,通过AI让机器人在不同环境下识别不同种类的物品。在陈曦看来,Covariant努力的方向就是使用一个AI系统解决所有应用场景的问题。

Covariant给机器人装载了一个AI大脑“CovariantBrain”,段岩领导了公司核心平台的开发。简言之,CovariantBrain就是在所有物品类型的基础上训练一个通用AI,实现人类级别的自主性,让机器人能挑选最广泛的SKU,而不局限于特定的行业和产品。

商业化应用无法一蹴而就,现实世界的场景变化多样,比实验室复杂得多,Covariant团队做的第一件事,是对机器人展开预训练。他们收集客户仓库里海量的SKU数据训练CovariantBrain,使其能以通用方式理解所有对象。

Covariant团队采取了集群学习的方法来训练模型。集群学习属于机器学习的一种,通常用于分布式系统,由多个机器学习模型,或由智能体共同学习和协作,以提高整体性能。它的亮点在于,多个智能体可以分布在不同的物理位置甚至不同的数据中心,各个智能体之间能共享知识,加速学习进程。这意味着天南海北的客户数据都能用于CovariantBrain的训练。反过来,客户可以从CovariantBrain驱动的每个机器人的学习中受益,机器人在一个地方学习,熟悉拾取物品的新情境,分布全球各地的整个机器人集群都会受益。

如今,CovariantBrain每天都同时接受来自全球各地仓库数百万个物品的训练,从小型化妆品到服装塑料袋再到生鲜杂货。在一家德国仓库内,CovariantBrain控制的机器人可以对1万多种不同的物品完成拣选和分类,准确率超过99%。

阿贝尔对机器人与人类的工作效率做过对比:人工分拣站的效率大约在每小时300次到2000次之间。假如以每小时300次的人工最低值作为基准,AI机器人分拣准确率达到90%意味着每小时会出现30次失败,额外花费的修复时间就超过一个小时;假如分拣准确率达到99%,意味着每小时只出现3次失败,这样修复时间就只需要几分钟。

终于,当CovariantBrain的准确性超过99%时,一个工程师便能轻松管理10个机器人拣选站,这标志着AI机器人在成本效益上与人类劳动力达到了同等水平。

有了前期的科研积累后,Covariant还需要一个在业界崭露头角的机会。

2019年,瑞士的工业自动化公司ABB发起了一项全球范围内的机器人拣选竞赛。作为全球三大工业机器人制造商之一,ABB希望通过拣选比赛评估AI技术是否成熟,能否应用到机器人自动化领域,进而选出潜在的合作伙伴。参赛者是20家全球领先的AI初创公司,10家来自美国,10家来自欧洲,其中就包括成立时间仅两年的Covariant。

这场竞赛涵盖了26种不同场景,能全面测试参赛机器人的自主水平。主办方保密了一半的挑战项目,参赛者事先不知道具体的物品和场景,无法提前准备,需要当场测试系统,一天之后再测,观察系统通过训练后有哪些改进。

大多数公司都未能通过测试。少部分公司可以解决大多数任务,但无法处理更棘手的情况。测试的物品有水彩笔、袋装软糖、塑料瓶装药、方块纸盒、胶水、洗面奶、按压式洗手液、苹果、袋装膨化食品、玩具小黄鸭等等……它们的包装、重量、形状都不一样。在零散放置、品类混合、整齐排列的多种状态下,Covariant的AI机器人搭载着机械臂和吸盘,没有迟疑,准确完成分拣,成功率达成100%。它完全不需要人工干预,却像人类一样快速高效地处理每项任务。ABB的机器人业务总经理马克·塞古拉(MarcSegura)表示,“在这些测试中达到一定水平很容易,但不表现出任何弱点是非常困难的。”

出色的表现让Covariant成了ABB的合作伙伴。双方的首个合作方案部署在比利时邮政(Bpost)旗下的电商履约公司ActiveAnts。

成功拿下ABB这个大客户后,Covariant迎来了更多商业机会。2022年3月,奥地利的自动化技术与物流解决提供商KNAPP与Covariant展开合作。KNAPP的拣选机器人Pick-it-EasyRobot由CovariantBrain系统提供支持,机器人实现了全天候工作,能全自动处理订单。“我在物流行业工作了16年,从未见过这样的事。”KNAPP副总裁彼得·普切温(PeterPuchwein)说。美国的药品批发商McKesson、德国电气公司Obeta都应用了KNAPP与Covariant合作开发的机器人。

同一个系统解决所有场景问题。

大型公司应用AI机器人的好处显而易见,首先是效率的提升。在Obeta,一台AI机器人能完成3个工人分拣零件的工作。在这之前,Obeta经常招不到分拣员,即使招来也经常干不满半年。因为分拣工作太无聊,每天8小时,每小时工人需要处理170个订单,夏天仓库的温度还经常超过37℃,闷热、劳累、重复的工作让工人难以忍受。其次,工业自动化能帮助公司降低成本。KNAPP面向客户收取的费用始终低于雇用人工的费用,KNAPP副总裁普切温举了一个例子:如果一家公司每年雇用一名工人的费用是4万美元,那幺KNAPP收取的AI机器人费用就是每年3万美元。这样的性价比让客户无法拒绝。

目前看来,Covariant最主要的商业模式,就是面向企业客户,与全球先进的工业机器人制造商合作,用AI技术为传统机器人升级换代。

商业模式得到验证的Covariant吸引了众多投资机构加码投资。2019年,Covariant完成2000万美元的A轮融资;2020年,完成4000万美元的B轮融资;2021年,完成8000万美元的C轮融资;2023年4月它又获得了7500万美元的补充C轮融资。截至目前,公司的融资总额达到2.22亿美元。每隔两年,Covariant就会设立一个新的全球办公室,2019年深圳办公室成立,2021年伦敦办公室成立。或许因为创始人团队中有3位具有华裔背景,Covariant也成了为数不多在中国设立分公司的硅谷AI独角兽。

目前,全球约有300万台工业机器人,每年约有40万台新机器人进入市场。预计到2023年,全球市场收入将达到近438亿美元,仅北美地区的复合年增长率到2029年就将增长10%。

随着Covariant迈入规模化发展阶段,此前与ABB等传统机器人制造商的合作模式暴露出了一些问题。首先,上游的机械臂厂商已经意识到AI浪潮势不可挡,BershireGrey、RightHandRobotics、AmbiRobotics等机械臂厂商正在加速AI研发。

其次,下游的机器人集成商例如ABB、Dematic、AutoStore、FANUC、KUKA也在担心来自Covariant的竞争。由于长期的合作关系,客户更信任这些传统的集成商,更乐意和它们谈采购方案,Covariant只是扮演二级供应商的角色,议价权和品牌影响力都会受到影响。

机器人技术属于资本密集型领域,需要大量资本投入来建造设施、购买设备、维持运营,因此Covariant最开始选择与自动化机器人公司合作,其实是很取巧的做法。以ABB为例,ABB有成熟的工业机器人系统,Covariant无需自研硬件;ABB的业务遍及全球一百多个国家和地区,在中国的线上和线下渠道就覆盖了约700座城市,Covariant依托ABB的渠道,无需自己开拓B端客户资源,就能迎来广阔市场。

可是将其放在整个产业链中看,Covariant仅有AI技术还不够,也不能只依赖工业机器人巨头去获得硬件和渠道支持,不同维度的竞争对手正迫使Covariant同时向上下游去拓展自己的业务范围。

OpenAI当年放弃AI机器人业务的决定就暗示了,对于创业公司来说这条路并不好走。在2021年7月解散机器人团队时,OpenAI联合创始人沃伊切赫·扎伦巴(WojciechZaremba)在回复媒体时表示,“可悲的是,如果我们是一家机器人公司,公司使命就会不同,我们会继续研究。我们非常相信机器人团队的研发方向与方法,但从想要实现目标(即构建通用人工智能)的角度来看,我们还缺少一些组件。”扎伦巴并没有明确提到究竟缺少了哪些组件,可能是资金、人力、数据,等等,这些也都是Covariant不断在面对的问题。