国内具身智能赛道再次迎来重要时刻。
据可靠消息,具身智能头部企业自变量在两个月内连续完成四轮重磅融资,已确定完成全部交割。目前,自变量投后估值突破 200 亿元大关,成为了大湾区首个、也是唯一一个估值超过 200 亿元的具身智能企业。
更为难得的是,这些投资全部已完成交割、融资款全部到账。
其汇集了互联网巨头、国家队、产业资本与顶级 VC 的豪华投资阵容,在业内实属罕见。
在如今已经足够火热的具身智能领域,自变量此次公布的消息依然引发了行业的关注。
继今年 4 月下旬宣布完成小米战投领投的 B 轮融资后,自变量在短短两个多月的时间内连续完成了 B+、B++ 和 C 轮融资。自变量机器人是国内具身企业中唯一一家获得四大互联网厂商分别领投,并多次加注的企业。其中美团(A 轮)、阿里(A + 轮)、字节跳动(A++ 轮)、小米(B 轮)各自领投一轮,并多次加注。
更关键的是,这四轮融资已经 100% 完成全部交割。在当前的资本市场环境下,这种资金迅速落袋的确定性,充分证明了资本对底层技术和商业前景的渴望与信任。
伴随融资的顺利交割,自变量的投后估值正式超过 200 亿元,确立了绝对的头部地位。
最新一轮融资曝光的投资方阵容堪称豪华。已确定的投资方包括中国移动、中保投资、红杉中国、IDG 资本、源码资本、达晨财智、中金资本等 30 多家顶级机构、互联网巨头资本、产业资本、国家和地方基金,小米战投连续参与了三轮融资。
自变量几乎集齐了当前创投市场上所有最具实力的顶尖机构,形成了业内罕见的「全领域巨头集体重注」现象。
高估值的背后,是自变量在具身大模型上构建的技术护城河。
自变量是国内最早采用完全端到端路径、实现通用具身智能大模型的企业。其今年 4 月发布的全球首个基于「世界统一模型(WUM)」架构的具身大模型 WALL-B,将视觉、语言、动作、物理预测等能力置于同一网络联合训练,彻底消除了模块间的边界损耗。

WALL-B 从训练初始阶段就对视觉、听觉、语言、触觉、动作等多模态数据进行同步标注与联合训练,实现了真正的 「多模态进、多模态出」。它不需要在不同功能模块间转译信息,感知与动作决策同步生成。
在此基础上,WALL-B 模型具备了行业首创的原生本体感:无需持续观察自身全身、也不依赖大量外部传感器校准,就能内生地感知自身的空间尺寸(高度、宽度、手臂伸展范围、关节极限等),自主判断能否通过狭窄空间、能否触及目标物体,类似人类天生的身体空间认知能力。
更进一步,该模型拥有原生的物理「世界观」,具备极强的零样本泛化能力,并具备了交互闭环自进化能力。目前,搭载 WALL-B 的机器人已经开始常驻用户家庭,接受泛化能力的最高检验。

不仅如此,在过去的三个月中,自变量通过密集的技术开源与发布,向外界展现了其在技术上的统治力。
其中,开源模型 WALL-OSS-0.5 仅通过预训练便具备了极强的任务完成能力。在 17 个真机任务中,无需后训练即有 4 个任务自主完成率超 80%,在操作与推理任务上领跑主流开源模型。它也是行业内首个验证了 「预训练状态即可直接部署真机、性能比肩微调后模型」 的开源方案。
WALL-WM 世界模型则成为了全球首个具备事件级预测能力的世界模型。它摒弃了传统的均匀时间采样,通过事件对齐多模态数据,使模型能真正理解物理世界的演化规律。
自变量目前已形成 「闭源旗舰 + 开源底座 + 开源世界模型」 的完整技术矩阵。
在通用具身智能的道路上,自变量坚持第一性原理,在数据和本体方面自行构建。近期该公司在数据基础设施与机器人本体落地上均有实质性推进。数据端完成了全链路无本体数采方案的开源与规模化验证,本体端实现了家用服务机器人的量产入户与商业化跑通,形成了「数据 - 模型 - 硬件 - 场景」的闭环飞轮。
在数据体系上,自变量 6 月正式开源了 XRZero-G0,是国内首个跑通 「全身无本体采集→自动质检→混合训练→真机评测」 闭环的软硬一体方案,核心解决具身数据 「采集贵、可用率低、难跨本体迁移」 的行业痛点。团队通过实验验证了最优混合训练配比,将有效训练数据的获取成本下降 95%,仅为传统真机采集方案的 1/20。

在本体硬件方面,搭载 WALL-B 具身大模型的新一代轮式双臂家用机器人于 5 月 25 日正式入驻了首批真实家庭,其针对家居场景完成了硬件适配升级,可执行物体收纳、基础清洁、物品递送等日常家务任务。据介绍,自变量提供的硬件端配套端侧实时视觉脱敏能力,原始图像不会离开设备,配合主动授权机制,能够适配家庭隐私场景需求。
与此同时,自变量与 58 同城合作推出了人机协同家政服务,在深圳、北京等地上线。其中机器人负责客厅区域收纳与基础清洁,人工承担沟通协调、深度清洁等复杂环节,服务定价与同档位纯人工保洁持平,既验证了商用价值,也为模型持续提供真实家庭场景的交互数据。
自变量提供的方案也在汽车零部件产线等工业场景实现了落地验证。
当然,当前通用具身智能仍处于规模化入户的早期阶段,首批家庭的长周期使用反馈、商业化复制效率、开源生态的活跃度,都将成为这套技术飞轮能否持续加速的考验。从实验室 demo 走向日常家用,从单点任务执行走向通用家务能力,行业仍有成本、可靠性、用户体验等多重关卡需要跨越。
可以确定的是,随着资本、技术与场景的合力持续释放,国内具身智能产业已经正式跨过 「从 0 到 1」 的萌芽期,进入 「从 1 到 N」 的落地竞速阶段。自变量跑出的这条全栈路径,也将为整个行业提供一份可供参照的商业化落地样本。
文章来自于"机器之心",作者 "泽南"。
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner