谁在为人型机器人的出货量买单?具身智能的“数据”游戏
2026-05-31 18:32:21
  • 0
  • 0
  • 0

具身智能无疑是当前最火热的赛道之一,大量的热钱疯狂涌入。具身智能的蓬勃发展,连带着数据采集和标注——这门生意,也变得炙手可热。

隐晦的默契

具身智能不同于大语言模型,它的训练数据主要依赖于物理世界的真实数据,如抓杯子、叠衣服、打螺丝等等。而这些数据必须通过采集获得。目前主流的数据采集方式是遥采操作:操作员佩戴VR设备和动捕手套,通过头显和手柄实时控制机器人的每一个关节和手指,进行叠衣物、抓杯子、插拔接口等精细动作。机器人在此过程中产生的“运动数据”被记录下来,经过清洗标注,最终用于机器人的模型训练。

行业内有观点认为:想让机器人具备商业化落地的能力,至少需要数千万小时的有效实操数据。而现在据测算,高质量的真实场景数据只有几十万小时。差了上百倍。

巨大的缺口,为数据采集和标注提供了广阔的市场空间。

2026年具身数据公司迎来了规模化发展的新阶段。在强有力的融资浪潮下,一批公司开始密集浮出水面。

光轮智能,刚刚完成10亿元级别融资;聚焦具身数据业务的上海新智完成亿元融资;曼孚科技完成数亿元Pre-C轮融资;更早一些,初创企业智域基石也拿到了数千万元的天使轮投资。就连互联网大厂京东也参与进来,在今年5月组建了自称的“全国首个具身智能数据采集社区”。

传统的数据服务巨头同样没有缺席。海天瑞声、数据堂等老牌标注公司,正纷纷调转船头,加码布局具身智能。一场围绕“如何喂饱机器人”的数据竞赛,已然开跑。

具身数据业务可以说风头正劲。从产业的发展规律来看,数据采集公司和具身智能公司合作,本是技术进化、产业分工的必然之选。

但世间的事,有时就是这样,走着走着就走样了,而且越是热钱多的领域越容易这样。

走样的合作

让我们把目光移回到具身智能企业身上。

当下这些具身智能企业最大的焦虑是什么?是技术问题吗,是资金问题吗?都不是,是出货量的问题。出货量是衡量商业化落地最显而易见、最无法粉饰的指标,也是支撑估值和后续融资的核心支柱。

过去两三年,具身智能产业的发展尚处于襁褓期,资本的重心在技术研发和产品创新上面。现如今,技术已经进入成熟期。各家机器人产品一个接一个的发布,春晚的机器人节目一届比一届精彩,机器人马拉松比赛一次比一次热闹。

但喧嚣之下,资本的焦虑却与日俱增。因为,资本关注的重心发生了偏移。既然产品已经成型,那么人形机器人到底有没有商业价值?有多大的市场需求?这些实际问题不得不摆上台面接受检验。

可现实是,真正能在工厂里打螺丝、在生产线上干活的机器人,还寥寥无几。这与各类酷炫的机器人视频,形成了刺眼的反差。

在需求还没有释放的局面下,如何向资本市场“提供情绪价值”,成为了具身智能企业最迫切的课题。

于是,一个精妙的闭环设计应运而生。

闭环是如何转起来的

这个闭环暂时按下不表,先来说一个大的政策背景。

为了抢占人工智能高地,这几年国家正在大力推动数据要素市场建设。去年12月,根据国家数据局发布的《关于加强数据科技创新的实施意见》,更是明确提出要“加快攻关具身智能等技术创新发展的高质量数据集构建”,并“谋划布局一批数据领域部级重点实验室”。

多地地方国资和公共机构响应号召,纷纷出资牵头兴建“数据训练基地”或“数采中心”。

截止2026年4月底,数据库显示,中国已经有至少90个人形机器人数据采集和训练中心(以下简称“数采中心”)处于使用或规划建设中,其中,至少有64个数采中心已投入使用,包含了28个在2026年正式投入运营的数采中心。

这些带有地方国资或数据集团背景的主体,手握预算,成为了最积极的机器人采购方。在已经投入使用的64个数采中心中,至少有13个数采中心部署了100台或以上机器人。

从公开的资料来看,这些人形机器人来自全国至少30家机器人制造商。几乎囊括了主流的具身智能企业,如智元机器人、乐聚智能、宇树科技、优必选、像银河通用、睿尔曼、星海图、傅利叶等。他们的机器人产品成为多个数采中心的具身智能数据采集终端。

具身智能把机器人卖到这些数据采集中心,数据采集中心用这些机器人训练,采集和标注数据,然后机器人公司(或旗下的数据子公司,或关联的数据服务商)再花一笔钱定向买回这些数据。

资金、产品、数据,完成了一个漂亮的循环。

下面来看一个具体的案例。

根据财报显示,2025年Q4,优必选在短短三个月内签下至少6笔来自数据采集中心的大单,总计约8.29亿元。根据公开资料显示,这些合作主体有“自贡数投人形机器人数据采集中心项目设备采购”,中标产品为具备自主换电功能的具身智能人形机器人Walker S2,采购金额高达1.59亿元;惠州市惠阳区人形机器人大湾区数据采集中心项目,金额达5962.015万元。广西防城港市人形机器人数据采集与测试中心和人工智能科创教育示范项目,中标金额2.64亿元。

这些买家正好印证了我们此前的判断,几乎都是带有地方性质的数采中心。2025年全年,优必选全年签约额近14亿元,单单是这些数采项目的合作就占了59%。换句话说,超过一半的机器人出货,是卖给了各地政府建的数据采集中心,而不是真正的工业级客户。

这个闭环,伴随着资金、数据和机器的流转起来。对优必选而言,账面上实现了机器人的大规模出货,计入营收;对采集中心而言,机器人公司回购数据,达成了“数据交易额”;对地方而言,展示了数字化建设的成果。一举三得。

从账面上看,机器人卖出去了,数据交易完成了。从更高的视角看,这个看似合理的商业循环,从本质来说还是在投资,并没有工业产出。好比汽车公司造了一半的汽车,全部用于碰撞试验以获取数据,而不是卖给了老司机。

这套模式,几乎是美国AI巨头、算力中心和GPU公司之间“左手倒右手”游戏的微缩版本——只不过资金量和企业规模不在一个量级上。美国AI巨头们之间是这么操作的:云厂商大量采购GPU建算力中心,算力中心再将算力以优惠价“返租”给GPU公司或其生态企业,各方账面上的资本开支和营收数据都得以美化。

除了地方数采中心之外,这样的合作模式也出现在数据标注公司身上。数据猿近期走访了多家数据标注公司,几乎都看到了类似的合作模式:数据标注公司购买特定公司的机器人产品,建立具身数据的遥采产线,然后机器人厂商回购这些采集和标注好的数据。

需要强调的是,之所以拿优必选作为剖析样本,并非指向某一家企业。只是因为它是一家上市公司,财务数据公开可查,便于论证。这是行业内普遍存在的现象。这个现象,有三个侧面值得人们注意:

第一个:非生产性需求占据主导

IDC的数据显示,2025年人形机器人出货中,商演、科研和数采场景占了78.4%。这说明什么?说明整个行业的大头,都不是真正的“商用落地”,而是各种“非生产性需求”。数采中心就是这78.4%里的重要组成部分。

第二个:数采需求占比仍在攀升

券商研报预测,2026年数采需求的占比还会大幅提升。为什么?因为各地政府的数据中心还在建,采购需求还在释放。

第三个:机器人产能正在爆发

今年,不管是不是机器人商业化落地的元年,但肯定是爆产能的元年。宇树科技创始人王兴兴表示,2026年公司目标出货量为1万至2万台。智元机器人宣布首万台通用机器人下线,乐聚也建成了万台年产能产线。但问题是,产线建好了,如果真实工业需求跟不上,这些产能最终要流向哪里?数采中心能吃得下这么多产能吗?如果哪天各地政府不建数采中心了,或者政策标准变了,这个循环还能不能维持?

探讨这个问题,并不是急于对这种模式投以苛责,更不是要对具身智能这个赛道,冠一个“产业泡沫”“虚假繁荣”的帽子。从产业发展的客观规律看,任何一项颠覆性技术在商业化混沌期,都离不开基础设施的“虚掷”与“试错”。带有公共机构色彩的数采中心建设,本质上是一种战略性投入,它扮演了“产业孵化器”与“风险缓冲带”的角色,为尚在襁褓中的具身智能托底。没有这些订单,许多初创企业甚至撑不到技术成熟的那一天。

与此同时,我们也看到了智元、优必选、宇树等企业也在制造业产线、商业服务等领域进行着商业化的真实探索。比如,优必选的机器人产品在汽车制造、3C电子等领域进行搬运、质检等工作。行业的努力不应被一笔抹杀。

然而,具身智能的从业者也必须清醒地认识到:这种托底早晚有结束的一天,没有真实的产业需求,换不来真金白银的订单;左手倒右手可以暂时撑起估值,却撑不起一个健康的产业生态。

只有我们的机器人,真正大规模走向工厂、仓库、家庭,创造不可替代的劳动价值。到那时,我们才能说,这场关于“左手倒右手”的游戏,终于玩出了一些真正有意义的东西。

 
最新文章
相关阅读