今年,我和机器人一起逛展。
今年国内最受关注的产业展会,除了七月初的 WAIC(世界人工智能大会),就属八月下旬的世界机器人大会。
马斯克带起的人形机器人风口,加上大模型爆火后推动的具身智能热潮,让机器人赛道再次成为创业、投资的热门领域。有数据统计,2023年至今国内仅人形机器人融资就达到 80 亿元,再加上四足、工业用、医药、商用等机器人细分领域,机器人赛道的热闹程度相比 AI 也毫不逊色。
不过热闹归热闹,机器人初创团队,尤其是背景还不错的,拿到初始的第一第二笔钱并不困难。但要成长到更大规模,仅有技术概念或者产品原型远远不够,要有自己更突出的优势特点,以及把这些特点运用到现实场景,有能创造出更大商用价值的能力和潜力。
那么,在行业埋头狂奔了一年后,国内人形机器人和具身智能今天走到了哪一步?逛完今年的世界机器人大会,我们看到了这个问题的一部分答案。
参展人形机器人翻倍,机器人和真人一起逛展
人形机器人的爆火,首先体现在参展的机器人数量上。
2023年极客公园参加世界机器人大会的时候,曾对现场展示的人形机器人做出盘点,当时现场展出了约十几款人形机器人。
而今年,世界机器人大会现场展出的人形机器人的数量直接翻倍,达到接近三十款。
不止是数量,机器人的能力,也明显比去年有提升。
在去年的机器人大会中,虽然不少家机器人厂商,已经宣布了机器人具有双足运动的能力,但在嘈杂的现场环境中,只有一两家机器人企业现场实机展示双足运动。
而快进到今年,行走展示则成为了一个标配。
背后悬挂一根绳在固定展台上的行走展示是最基础的。
几家机器人公司,如去年就进行过行走展示的星动纪元,已经开始了绕场行走的测试。在其他展会中,你可能会看到机器狗和小车在人旁边并肩而行,而只有在世界机器人大会上,才能看到双足机器人和人并肩而行的魔幻场景。
再进一步,加速进化公司的小型人形机器人,已经开始让小朋友操作,进行踢足球的比赛了。
一向以运动能力著称的宇树的人形机器人,已经可以跳舞了。
而人形机器人运动能力的另一端,则是上肢运动能力。
简单的抓取箱子放置,已经显得不再稀奇。人形机器人公司,仍然可以在三点上进一步“卷”起来。
其一,是与AI大语言模型的结合。机器人可以识别人类的语义,更“聪明”地抓取物品。不过,限于场景的嘈杂,此次大会中展出的不多。
主要的人形机器人厂商本身,也并不自己训练AI语言大模型,而是选择和其他公司合作接入大模型。例如,科大讯飞在世界机器人大会上,就展出了其多模态AI套件。套件利用对于人嘴部的视觉识别和声音的拾取,可以更准确地在展会的嘈杂声音中,更精准地收音,已经与智元机器人达成了合作。
其二,就是动作的流畅性。此次,星尘智能的展示就令人惊喜。
星尘智能的机器人Astribot S1,此次在现场展出了写毛笔字、敲扬琴、打咏春拳等展示。不少观众用“丝滑”来形容星尘智能的机器人的动作。
星尘智能联合创始人来杰表示,这主要在于星尘智能的机器人,采集和训练的数据本身,多一重“力”的维度。
传统对机器人的训练,通常机器人分解任务后,会设计出一条行动轨迹,然后机器人以相对均匀的力度按照轨迹操作,因此动作显得相对僵硬。而星尘智能则在采集训练数据时,就创新性地增加了力的维度,让机器人的动作能更“有张有驰”。
而配合触觉传感器,在手部动作的精细性上,也会有所提升。“比如运用轨迹控制,切胡萝卜和切黄瓜,需要计算不同的轨迹。而人其实更多时候是用力反馈来判断操作,伸出手去,碰到黄瓜后开始用力。”来杰表示。
其三,则是抓取的成功率。
虽然在公众眼中,此次大会的不少机器人,看起来都能抓取物品,但在抓取任务,实际上存在不同的难度。在2024年进行了多轮融资的银河通用,就在展会上重点展示了其抓取能力——尤其是抓取拥有透明材料的水瓶的能力。
银河通用公司表示,银河通用在抓取的成功率上十分领先,原因之一是源自对于合成数据的训练。
在人形机器人的动作精细度上,最后呈现的成果,许多时候仍然要落在训练数据上。这点是与其他AI领域不完全相同的地方——机器人想要拥有具身智能,仍然需要大量数据进行训练,而这样的数据本身,还是很稀缺,也很贵。
最早能在年末看到人形机器人进入生活
与去年参加世界机器人大会,主要参展的人形机器人都是才做出来不久的产品不同,今年,头部的机器人厂商,对于产品的口径,已经统一地变成了接近量产。
量产是不是就意味着我们快要在生活中见到人形机器人了呢?
不尽然。
根据极客公园的观察,普通公众或将在生活中见到人形机器人,但这些机器人可能更多地仍然是展示功能居多,而非真正大规模地替代人类工作。
备受关注的稚晖君创立的智元机器人,在世界机器人大会期间,就宣布 2024 年,智元机器人预计发货量达到 300 台左右,其中双足人形机器人预计 10月起量产,年内发货 200 台。
智元机器人代表了一类人形机器人的产品思路。主攻工业场景,这些先进的人形机器人,将首先被应用在试点工厂中,与具体的工业场景进行磨合。
智元机器人已经是该类场景中的头部企业,不过量产,仍然大概只意味着百台量级的机器人在工厂里分散试点。
在智元机器人的发布会上,智元机器人还展示了另一个场景,是机器人替代人类,进行汽车销售——搭载了大模型的机器人,终于有了一点智慧的感觉。在智元的展示中,可以主动介绍汽车的功能,甚至在对话后发现客户口渴还可以主动倒水。
这算是人形机器人公司找到的一类场景:放置在公共场景,在特定场合进行展示、介绍、答疑。
虽然目前来看,技术和场景还有很多提升和挖掘的空间,包括在直播中,一部分观众的直观感受是会“有点尴尬”。但这一场景,倒是更有可能更快地出现在我们身边。
在智元的生态合作伙伴展台上,极客公园与智元的生态链企业数字华夏进行了交流,了解到在与智元合作的基础上,数字华夏公司已经拿到了不少订单,专门生产这种与人轻交互的人形机器人。
另一个在落地场景上,表现较为突出的,是银河通用公司。
由于抓取等能力上的突出应用能力,银河通用预计将在第四季度,与美团公司进行合作,开启智慧药店和智能零售的机器人店试点。用户可以直接通过与轮式行动的机器人对话,依靠机器人抓取,购买货架上的物品。
2024年上半年,亚马逊关闭了不少依靠视觉识别的无人零售店,被爆料其中一个原因就是因为视觉识别在很多场景下,仍然无法做到完全的智能,需要背后进行人工干预。
而依靠机器人的无人零售,或许将意味着一个新的无人零售的商业模式的开启。机器人直接从货架上抓取货物递给用户,能够避免店铺里出现复杂的状态,而将难度转换成机器人的抓取问题。
而除此之外,机器人本身的通用性,意味着相比于只是结账的无人化之外,机器人未来可能实现直接上货、摆货架、打扫卫生等多项操作,产生真正的无人零售。
对于更多的人形机器人公司,尤其是双足机器人公司而言,目前最重要的客户,仍然是科研客户。
逐际动力和加速进化,都是此次世界机器人大会中,展出的双足能力较为优秀的公司。在交流中,它们都提到,科研用户仍然是目前双足的人形机器人重要的客户。
“科研的需求还是比较大的。传统的运动控制、CV的科研人员都在转型AI,就需要新的构型去承载。比如原本做四足运动控制的科研人员,现在经常也在转过来做双足的运动控制,他们就需要一个好的本体来承载这些算法需求。包括感知、人机交互等等,都需要一个机器人来承载研究。”现场工作人员介绍道。
而家居场景,则是一个许多公司都会提到的未来愿景。
人形机器人最终的星辰大海,在于进入家庭,帮助做家务、照顾孩子、养老。
相对进展较快的UniX AI表示,其轮式双臂人形机器人Wanda将在9月进入小规模量产,年内预计将生产100台左右。初期的Wanda可以完成洗衣服、做汉堡、叠衣服、餐后清洁碗盘等任务。
笔者逛展时,发现一个很有趣的现象:在今天的机器人大会上,几乎每一个在展的机器人面前,都一定有一个工作人员,工作中的最重要的内容,就是防止好奇的人群,靠近机器人——即使是在机器人没有动起来的时候。
人形机器人想要落地,安全性是一个必须解决的问题——机器人尚不能做到全身遍布触觉传感器,在做动作的时候触碰到人类就有可能发生危险;反之对于精密的人形机器人来说,不是按程序设定行动的人类,一样是一种危险。
机器人会长一张人脸吗?
对于机器人专业的人而言,机器人像人,反而常常是不重要的。
机器人的原型机,常常连头都没有。目前各家人形机器人厂商的成型产品,最多也就是为机器人赋予一张简陋的emoji,来简单体现一下机器人的状态。
不过,此次在机器人大会上,极客公园还是发现了几家公司,在专门做机器人的脸部动作。
其中,除了每次参展都能引起不少人围观的Ex Robots的外观惟妙惟肖的机器人“苏轼”,此次机器人大会上,还有更专注于面部本身的Noetix公司参展。
Neotix公司的人脸,本身有29个自由度,脸部不止眼睛和嘴巴能够运动,还能做出更精细的表情,比如皱眉。不过,为了容纳足够多的电机在脑部,Neotix的机器人略显头大。
对于普通参展观众而言,机器人的人脸,显然具有天然的重要性。
主攻轻交互的数字华夏,为机器人装上了人脸,而它的人形机器人展示前,互动的人数显然更多。人们不厌其烦地测试机器人会不会被吓到眨眼,能不能盯着一个人看,也总有人想趁着无人看管摸摸机器人的脸。
Neotix公司的创始人表示,参展后,也发现了许许多多不同的长尾需求——很多商家很愿意展示一个有趣的人脸在自己的展台来吸引客户。
今天人形机器人产业还在从0到1做出一个有效产品的阶段,人脸显然不会是机器人公司优先级最高的任务,但如果未来几年,人形进入商用,甚至走入家用,不论是前面提到的机器人导购,还是天天和老人小孩面对面的陪伴机器人,脸部可能是手、足之后,机器人厂商需要攻克的下一个课题。
结语
在一年人形机器人/具身智能的投资狂飙过后,在今年的世界机器人大会上,人形机器人在机器人大会上的展出翻倍,而人形机器人的能力,也明显较去年普遍有了提升。
而在展台前积极交流的专业人士们,关注的重点,也已经机器人中用哪一款电机这样的具体问题,逐渐向人形机器人到底能够应用在哪些场景里,何时能够进行商业化了。
看起来,最早在今年年末,一批公司就将开启这样的场景落地的探索了。
而人形机器人真正进入普通人的生活,或者大规模在工厂内应用,行业里普遍认为,仍需最短三到五年,甚至十年。
不过,每年在机器人大会的现场,笔者都能看到一场新的人机关系的探索正在发生。
小朋友围着机器狗,像摸真的狗狗一样,试图和它们交流。
再专业的机器人领域从业者,有的时候路过一张逼真的机器人脸,也时常忍不住想伸手摸摸触感如何。
笔者在序厅路过一个围得水泄不通的拍照区,挤进去一看,原来是有人在模仿进行机器人表演。而周围的人,似乎无法分辨,互相询问,是真的吗?
人形机器人距离真正进入我们生活,仍然有一些距离。
但在世界机器人大会上,我们已经可以看到未来的一瞥:机器人变得越来越像人类,而人类也在被机器不断赋能。人机融合的时代,可能并不遥远了。