【来源:虎嗅网】

本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:陈月芹

中国人形机器人的产业发展史可能会有几个绕不过去的时刻。比如2025年蛇年春晚通过一场表演让大众对人形机器人建立了感知。

又比如4月19日的北京亦庄马拉松,一群铁疙瘩歪歪扭扭地冲向终点,它们没有“意念”,主要靠电机驱动和工程师遥操,有的因电量耗尽步伐拖沓,有的刚登场就退赛,有的半路“掉”头⋯⋯20支队伍里最终有6支顺利完赛。

当人形机器人走出PPT和Demo(演示)视频,普通人看的是热闹,产业链企业关心技术和商机,而嗅觉敏锐的资本则在揣摩着风向......种种期待和现实落差,令人不禁疑惑:先进到可以玩杂技和跑步都跑不利索,哪个才是中国人形机器人的真实现状。

为了深入了解这一新兴产业的发展动态,4月中旬,经济观察报走访了机器人重镇深圳具有代表性的9家具身智能头部企业,它们分别是作为深圳机器人“八大金刚”的帕西尼、普渡科技、数字华夏、智平方、跨维智能、逐际动力,以及越疆科技、大象机器人、云鲸智能。

我们发现,除了对人形机器人行业的前程远大颇具信心外,目前各家企业在技术路线、应用场景等方面押注不同的逻辑,甚至可以说没什么共识——这本质上是人形机器人从实验室走向产业化的必经阶段。

以下是我们根据实地调研梳理出的人形机器人行业的9大分岔口:

1.人形机器人需要两条腿吗?

2.人形机器人要不要脸?

3.人形机器人如何感知外界?

4.“大脑”“小脑”和“本体”,哪个更重要?

5.怎么训练人形机器人?

6.人形机器人有什么用?

7.人形机器人卖给谁?

8.何时进入量产阶段?

9.亦庄马拉松应该被群嘲还是鼓掌?

人形机器人需要两条腿吗?

把机器人做成双足、四足还是轮式,是人型机器人赛道上的第一个分叉口。

在我们调研的9家企业中,数字华夏、越疆科技是“双足派”,帕西尼、智平方、跨维智能、大象机器人是“轮式派”,普渡科技两种形态产品都有。

当下机器人企业的人才、资金等资源有限,只能集中精力做好其中一种形态,这就导致做轮式机器人的企业更多强调精准抓取、泛化能力等,而做双足机器人的企业则侧重于精密机械关节的协同,走得更快更稳、能跳能翻,还抗击打。

从目前头部企业发布的产品案例看:轮式机器人的常见展示场景是参与工厂作业,而人形机器人似乎更擅长跳舞、爬山、翻跟头等技巧动作。

帕西尼的人形机器人采用轮式底盘的逻辑,代表很多同类企业的考量:一方面,目前双足技术还没有完全成熟。做双足比较好的企业,无论是宇树科技还是波士顿动力,即使设计再精细,偶尔还是会“扑街”;另一方面,轮式底盘的机器人产品计划优先在工厂、家庭等平整地面场景应用,而非野外等复杂地形。因此,帕西尼更注重锻炼机器人上半身的能力,特别是手部的功能设计和落地应用。

相比之下,双足机器人的技术实现难度更大。机器人主要靠关节、电机驱动,而要实现双足行走需要模拟人类28个以上关节的协同运动,背后涉及动态平衡控制、重心转移、地面反作用力计算等。在人类看来很容易实现的很多任务,对机器人来说却很难,例如稳定地走路、上下楼梯、不同角度被推倒后起身站立等。

从能耗的角度,轮式机器人续航普遍在5小时以上,双足机器人一般在2小时左右。目前,双足机器人的大部分能量用于维持平衡,而轮式机器人的底盘通过物理结构就能实现静态稳定,控制复杂度低,且能放置更大容量的电机。

因此在大多数工业化场景中,轮式机器人有更稳定、成本更低、效率更优的特点,例如搬抬运送货物、上下料等,考验的是机器人上肢的灵巧程度。

不过,双足也有不可替代性。一家做双足机器人的企业认为,双足人形机器人可以侧身穿过更狭窄的空间。在需要上下台阶或穿越障碍物较多、非平面地形时,轮式机器人会受限制。此外,轮式机器人只能在单个平整车间工作,而理论上双足可以像人一样在工厂里自由移动。

数字华夏一位人士称,坚持做双足的原因是机器人被做成轮式后,很大程度上会失去深度交流的功能,只是为了干活,但眼下干活还不是机器人的长项。

他认为,机器人摔倒不是硬件问题,而是算法出现了故障。就像早期的新能源汽车,等到出货量足够大,足够多的问题被发现、被解决,才能更成熟和智能。

为什么选择做人形机器人?5月10日,宇树科技创始人王兴兴在一次公开演讲中表示,人类更喜欢长得像人的机器人,更能够提供情绪价值。此外,人形结构最简单,适配人类通用数据,还可以处理需要人做的不少事,“一旦人形机器人技术成熟,甚至可以用几个关键零部件拼在一起,下载一个程序就可以让人形机器人干活了”。

人形机器人到底要不要脸?

这是一个与“要不要腿”类似的问题。目前市面上绝大多数人形机器人产品是“无脸派”。

宇树科技头部采用中空或黑色玻璃面罩,避免使用复杂表情模块,而波士顿动力Atlas和特斯拉OptimusGen2都采用黑色面罩+LED灯效来显示机器人的状态。“无脸派”的逻辑是降低额外成本,侧重工业场景下机器人的协作能力,同时规避伦理争议,如身份伪装风险和恐怖谷效应。

而数字华夏把具有仿生人脸、能提供交互需求作为机器人的主要特色。它想做有温度的机器人,未来在机器人融入人类社会时,让人感觉更舒适。

数字华夏研发的有脸人形机器人“夏澜”(陈月芹/摄)

该公司旗下的机器人“夏澜”长着一张“人脸”。得益于仿生硅胶皮肤和表情驱动系统的精密配合,“夏澜”能根据人的说话指令,识别语义并匹配22种表情,例如听到“地震了”会皱眉惊恐、听到“今天天气很好”会微笑。

数字华夏公关总监吴为介绍,这张“脸”皮成本约3万元,如果产量能上千,单张脸皮的成本可以降到200元左右。

人形机器人如何感知外界?

机器人如何自主感知外界环境,是行业一大难题。

有的企业以单目、红外感应、激光雷达作为环境建模的核心。不过,在这种技术路线下,机器人一旦遇到强光等复杂环境,或摄像头被遮挡,感知精度会下降。

跨维智能的双目视觉技术,通过两个摄像头同步采集图像,模拟人眼视差原理,生成三维空间信息,让机器人摄像头被部分遮挡时不至于陷入盲区。

视觉感知更适用物流等非精细操作的工业场景,不过,一旦要求机器人感知微小接触力的变化,例如检测压力、温度和纹理,或让机械臂根据力的反馈调整抓取力度,视觉感知远远不够。这也是帕西尼想解决的难题,其核心产品是基于霍尔原理和力控算法设计的传感器和灵巧手,这一优势也使得帕西尼做整机人形机器人时更关注上半身、手和手臂的协同能力。在同类企业大多只能做到三维力感知时,帕西尼的传感器能感知六维力,获取接近15种不同触觉维度信息。

带多维触觉传感器的机械手(陈月芹/摄)

机器人是否需要触觉?有人认为,视觉与语言已经能覆盖多数交互场景,如自动驾驶。但触觉感知的支持者强调触觉是物理交互的必需,医疗手术、精密装配都需要机器人更“敏感”。

是否需要触觉,取决于不同厂商机器人的落地消费场景。非触觉机器人仅需800万像素相机即可完成毫米级追踪,硬件成本较触觉路线机器人低6成以上。帕西尼的一对具备六维感知力的机械手售价则在20万元左右,物流、大部分制造业、家庭服务等场景还无法为此买单,目前主流客户来自下游机器人厂商等。

“大脑”“小脑”和“本体”,哪个更重要?

在商业化和规模化前夕,产业链各环节的代表企业都希望掌控生态话语权,而不是甘于做二级供应商。多数投资人也希望自己买的是未来产业链链主的号码牌,培养出掌握减速器、伺服系统、传感器等关键技术的企业,或挖掘出具备“核心零部件→整机制造→场景落地”垂直整合能力的“下一个特斯拉”。

我们在调研中发现,所有人形机器人企业都必须回答一个问题:人形机器人的“大脑”“小脑”和“本体”,哪个更重要?这里的“大脑”指人形机器人负责感知和决策的智能中枢,“小脑”负责运动控制,“本体”则是硬件结构。

与不少科研机构和头部公司扎堆研发“大脑”不同,一家专注于运动控制的深圳初创企业选择做连接“大脑”和“本体”的桥。他们的逻辑是,“大脑”算法能力的投入巨大,中小型企业很难与大型企业比拼,而等到“大脑”开发得越来越成熟,大模型的想法怎么传输给机器人、机器人怎么应对物理环境的变化,这些都是纯大模型公司没法做的。

在“本体”通用性不足的情况下,机器人没法“交付即使用”,这家公司要把大脑和本体的底层运动控制“解耦”的接口或工具链做好,做一个适合更多客户的机器人本体。

智平方向客户交付的产品形态是机器人,但其中值钱的是“大脑”,严格来说是软硬一体的解决方案。现在的机器人切换硬件形态或换个关节,对大脑的适配性改动非常大,“大脑”很难独立于硬件存在。

亦庄马拉松期间,宇树科技专门发声明称公司没有直接参赛,而是客户使用其机器人G1本体参赛,试图廓清“机器人上场即摔倒”的责任。这反映出具身智能行业的现状:硬件供应商只卖本体,客户负责算法优化,机器人的性能高度依赖算法调优能力,再强的“大脑”、再硬核的本体,技术链条间仍存在断层。

怎么训练人形机器人?

2025年,机器人行业新的争夺战悄然打响,各大厂商绞尽脑汁,夺取最有价值的AI“燃料”——数据。

聪明的机器人是一条条数据“喂”出来的,仅一个倒水的动作,大模型就需要“吃”下上万条数据才能学会。根据来源划分,这些数据可能来自于真实数据、仿真数据和互联网数据。

真实数据训练即通过实体机器人手把手采集物理交互数据,更真实,采集慢,成本也高;仿真数据是利用英伟达等工具生成虚拟环境数据,成本次之;而互联网数据则是整合互联网开放资源,成本最低。

为了投喂真实数据,数字华夏在南京设有数据采集中心,做各类模拟的真实场景,如银行、线下门店等导购场景,几十台甚至上百台机器在人的遥操下一遍遍地练习,记录标注数据集,再把数据输入模型进行训练,回传给机器人。

数字华夏方面认为,机器人终有一天会走稳,具身智能的能力一定会出现,届时企业比拼的是覆盖客户的多少,有多少有效数据——有多少数据意味着机器人有多少能力、能进入多少场景。

以银河通用、宇树科技为代表的仿真数据优先派,主张自己学得更快、成本更低,甚至能在零真实数据情况下启动。遇到较难模拟的极端场景,如火灾救援,仿真系统也可以批量生成。不过,仿真数据还须解决模拟器效果不够理想、数据实用性不高的难题,Sim2Real(模拟到现实)之间的差距是核心挑战。

跨维智能开发了一款Sim2Real引擎,在虚拟世界中训练、获取数据,再把训练好的能力复制到物理世界的机器人本体上。

智平方是三类数据融合派,创始人郭彦东称智平方所用的训练数据量和很多搜索引擎相近,庞大的数据量在整个机器人赛道里位列第一梯队。

数据和强化学习算法是机器人区别于大型遥控玩具的核心。“吃”够数据后,机器人还需要泛化学习能力,把已有的经验迁移到未知场景中,机器人才能算得上“聪明”“有用”,能举一反三处理复杂、动态的人类世界出现的任务。

为了解决数据和泛化能力不足的问题,帕西尼在筹建数据采集中心,搭建多个核心场景样本间,例如打扫卫生、餐厅场景里的切菜等,将任务拆细后反复训练,以达到最终的理想状态:机器人在开放场景下,“看到什么就知道怎么操作”。

人形机器人到底可以干什么?

每家机器人厂商的展示PPT里,一定有几页关于机器人应用场景的内容,主流方向包含工业、物流、零售商业、按摩服务、家庭、农业、科研等,然而没有人会明确告诉你这些愿景哪天能实现。这也就不难理解,投资人朱啸虎为什么泼冷水:机器人没什么用处、没有人愿意花十几万买机器人去干活。

机器人怎么应用?当前行业主流思路是按照工业→商业服务→家庭的路径逐步渗透,优先级由场景标准化程度和任务复杂度决定。

其中,环境更标准化、任务单一的工业制造场景最为拥挤,尤其是新能源汽车制造、3C电子装配、仓储物流,是特斯拉、优必选等机器人厂商都想攻克的高地。

越疆科技也选择让人形机器人走协作机器人走过的路,先在特定工厂车间反复训练,再在实地工厂运行。其协作机械臂掌握的力控技术可以做曲面打磨、涂胶等精细的工作,应用在汽车、3C等行业。

数字华夏做过评估:工业生产对准确度、精度的要求太高,如果打10个螺丝错1个就没人愿意用;家庭养老难度最大,空间小、环境复杂,内部判断2028年以前,机器人很难走进家庭。因此他们认为机器人短期的用处是通过“流量效应”吸引顾客,给消费者带来更好的购物体验。

还有一批机器人厂商把科研教育作为突破口,比如优必选、逐际动力、大象机器人,不仅卖本体,还搭建开放式开发平台,支持二次开发。高校、科研机构是目前业内愿意为机器人买单的主流客户,一方面高校有教育系统专项资金支持,另一方面,相较于工业场景对精度、稳定性(千小时无故障运行),以及家庭场景交互安全性的要求,科研教育场景的容错性更高。

帕西尼的机器人手上装有众多传感器,能填补人形机器人触觉模态缺失的空白,这一差异化使得帕西尼侧重进入对手部精细动作要求更高的场景,如照顾老人、手术或危险作业等。近期正和帕西尼洽谈合作意向的是一家大型垃圾分拣厂,想让机器人代替人类在恶劣条件下长时间作业,还能让触觉技术发挥作用,区分不同材料的垃圾。

人形机器人卖给谁?

朱啸虎认为,人形机器人企业至今仍没有找到较清晰的商业化路径。即便是火出圈、不愁订单的宇树科技,在他眼里仍“没有为客户创造持续的价值”。

一个濒临倒闭的难关改变了大象机器人的商业路线:2019年以前,大象机器人的主营业务是研发工业机器人,到了2020年,疫情导致很多合作工厂不开工、不付尾款,大象机器人一度裁员到只剩20人。管理层决心从市场需求和应用层面出发,做“个人可以拥有的机器人”,随后推出了第一款轻量级协作臂myCobot,收获了扭亏为盈的第一桶金。从那之后,大象机器人确定了做小型化、高性价比机器人的路线,其主打产品轻量型双臂机器人能连续工作3万小时、售价约8万元/台,目标是做轻工业柔性产线的人工替代。

一台机器人8万元,与一个人工的全年成本(工资、社保、食宿等)相比仍有优势。这也是大象机器人帮客户算的账。

机器人跳舞火了之后,越疆科技今年来自商业领域的订单增长最快,例如艾灸、按摩等场景。一家大型连锁按摩品牌苦于人员流失、用工成本高,主动找到越疆科技,希望用按摩机器人替代技师。

机器人产品的迅速落地,也许不是投资人喜欢的,但确实让一些机器人公司拿到订单、活下来了。而大多数愿景广阔、高谈技术理想的机器人公司至今仍然靠投资人烧钱。

何时进入量产阶段?

在机器人走进工厂和千家万户前,需要先过量产关。除了大宗订单来源不稳定,机器人量产的产品性能也参差不齐。少数购买人形机器人的客户常遇到买家秀和卖家秀不符的问题,到手的机器永远没有像展示样机那样动作“丝滑”,沦为人工“智障”。而厂商手上摔得坑坑洼洼的样机,性能才是最好的。

据了解,目前国内还没有真正实现量产的人形机器人公司,量产的难度在于解决软硬件一致性。例如,工程师在仿真平台上做强化学习,再把算法灌给两台装配零部件一模一样的机器人,依然可能存在一台走得很稳、而另一台摔倒的情况。

据了解,这种差异主要在于硬件没有达到车规级的精密标准,和算法软件的匹配也不够好,很多样机的机器人都是花了长时间调试出来的,导致机器人难以量产、良品率低。

“现在90%的人形机器人公司交不出批量的货。”数字华夏的吴为解释,因为每台机器都要调试数月,每台样机的出炉都要算上硬件、调试时间和人员成本。数字华夏判断,一个机器人公司进入量产的标志是一年至少产出1000台。

亦庄马拉松应该被群嘲还是鼓掌?

朱啸虎断言人形机器人行业没有未来。此后在亦庄马拉松,机器人出了不少洋相,又强化了人形机器人科技泡沫化的形象。

应该肯定的是,部分参赛机器人如天工Ultra在2小时40分内完成21公里路跑,并且在碎石路、斜坡等复杂地形中保持稳定,已经说明人形机器人的长足进步。

事实上,这场赛事的价值,不在于瞬间的掌声或嘘声,而在于为机器人产业的“马拉松”提供了真实的起跑线。

不得不警惕的是,早先舆论渲染机器人“未来已来”致使公众的期待过高,而忽视了人形机器人目前相当于“博士生的大脑、三岁小孩的身体”的现实。因此,当这个“小孩”还没有站稳,就开始翻跟头炫技,要求他去干重活,无疑是揠苗助长。而现在,因为机器人在一场马拉松上摔倒,就否定整个行业的前景,则有些因噎废食了。

值得注意的是,在这次调研中,多数企业人士对朱啸虎提出的“机器人应实用”“花拳绣腿没有用”等观点表示认同。他们都提到,行业应该警惕过度泡沫,但也希望大家对人形机器人的不完美多一点包容。