疯狂擦边,互联网大厂对具身智能的小心思
16 小时前 / 阅读约10分钟
来源:36kr
互联网大厂在具身智能领域多采取“擦边式入局”,专注软件与平台,避免硬件投入。大厂“擦边”选择虽符合自身利益,但与具身智能发展逻辑相悖,软硬一体或更具商业价值。

今天的大厂其实站在了一个分岔口:继续做更聪明的软件,还是开始学会与材料、机械、供应链、工厂打交道;继续作为生态赋能者,还是成为真正意义上的产业塑造者。前者合理,后者困难,但后者或许才拥有重塑未来十年的想象力。

互联网巨头的商业理性挤占了具身赛道应有的性感。

无论是元宇宙还是大模型,抑或是短期火过一阵的教育硬件、VR,过往几年科技火热赛道中,就没有看不到互联网大厂身影的时候。持有现金流巨盘的大厂们在面对新可能时,一直保持闻风而动、全军出击的进攻姿态。

不过,在面对“前无古人般”火热的具身智能赛道时,反而却上演了意外的戏码。互联网大厂以一种异常微妙的身位出现,它们既没有缺席,也没有某种意义上的亲自下场。

换句话说,他们始终没有“狠下心来”,跨过那条“全栈押注”的分水岭。

这是一种非常典型的“擦边式入局”。做大模型、做平台、做风险投资,但鲜少有人愿意扎进工厂,搓起人形机器人的硬件。这种“偏软”的倾向,是大厂的互联网禀赋与基因,同时也能够看出其理性的商业逻辑。在自身基本盘相对稳定的情况下,投入各种资源进入陌生且规模有限,还一眼望不到头的硬件领域,纯属没必要,也没兴趣。

诚然,于大厂而言,打外围战是试错成本最低的方式,能用最小投入杠杆撬动较大收益。

但具身智能是一个“软硬强耦合”的技术领域,具身大模型的应用离不开硬件适配与随之而来的数据飞轮的转动,这不是做个大模型塞进去,做个平台牵线搭桥就能跑通的商业故事。在这个最需要燃烧想象力与激情的地方,互联网大厂还是保守了。

不过是保守,还是观望伺机而动,目前依旧不能下定论。但我还是更喜欢他们桀骜不驯,大开大合的样子。

大厂的能力边界与利益权衡

互联网大厂的入局始终带着一种“距离感”,他们布局具身智能的策略呈现出明显共性:专注于软件与平台,避免重度投入硬件(毕竟有过不少失败案例)。

腾讯推出具身智能开放平台Tairos,强调“希望成为所有机器人厂商的合作伙伴,而不是取而代之做硬件”;阿里在具身智能领域的投资布局也主要聚焦于机器人仿真训练、多模态感知和通用机器人大脑等软件层面;京东虽然投资多家机器人公司,但其自身推出的却是附身智能品牌JoyInside,专注于为机器人提供交互解决方案;字节跳动研发出GR系列机器人大模型却依赖投资补足硬件能力。(不过蚂蚁确实在做硬件)

图片来源:腾讯

互联网大厂的谨慎姿态,本质是技术禀赋与商业理性共同作用的结果。

一方面是互联网大厂的基因决定了它们更擅长“软件侧”。它们的核心能力集中在算法、分布式系统、模型训练框架和数据运营体系上,这些能力在大模型时代极具价值,使它们天然适合扮演“赋能者”而非“制造者”的角色。

以字节跳动为例,去年,字节跳动正式对外发布了第二代机器人大模型GR-2,今年字节跳动旗下云与人工智能平台Volcano Engine正加码“具身智能”及人形机器人研发。现低调发布年薪百万的岗位,招聘人形机器人资深专家,月薪高达12万元,该岗位需要主导研发人形具身机器人的操作算法,包括算法架构设计、抓取算法、VLA模型研发等。

目前,字节跳动在具身智能方向已经积累了一些成绩:今年7月推出通用机器人模型GR-3能处理长程任务并完成灵巧操作;9月发布的“机器人大脑”Robix整合了推理、任务规划与人机交互能力;ByteDexter灵巧手实现遥控操作的20个自由度的精细动作。

另一方面的理性,来源于硬件投入的巨大成本与不确定性。机器人本体制造涉及机械结构设计、电机、传感器、整机开发测试和供应链整合,需要大量资本投入和长期技术积累。互联网大厂在硬件领域缺乏经验,面临较高的试错成本。这条逻辑在互联网大厂造车中也有所体现,京东和华为浑身沾满“车味”,但依旧没有选择开个车间。

而与之形成鲜明对比的是车企与硬件厂商的“躬身入局”。小米的CyberOne早早立项,广汽集团明确2027年启动具身智能机器人大规模量产,小鹏汽车近日更是凭借所谓“最拟人”的人形机器人IRON引爆讨论。就拿IRON紧致的身材来说,这里便有着反复的工程设计打磨与关节电机技术的创新,使得其构造如此紧凑。这背后的制造业基因,正是大厂匮乏的。

互联网大厂二十多年积累的“软件能力”,既构成了入局具身智能的优势,也形成了短期难以突破的路径依赖。但更进一步的来说,硬件领域的“知识盲区”并不是阻碍进入的全部因素,互联网大厂其实已经算了一个“明白账”。

具身智能当前的行业阶段,决定了大厂的“擦边”是理性的利益选择。

以人形机器人为例,从市场规模来看,有研究报告显示,2024年中国人形机器人产业总体规模约27.6亿元,而根据毕马威日前发布的报告称,2024年全球人形机器人市场规模也仅20.3亿美元。虽然它也进一步预计到2029年将达到132.5亿美元,年均复合增长率约45.5%。但与之反差的是,互联网大厂早已实现千亿级营收。换句话说,具身智能尚未成为能影响大厂营收结构的“新增长曲线”。

更重要的是,大厂现有核心业务的“基本盘”仍足够稳固:阿里的电商、云计算,腾讯的社交、游戏,字节的短视频、直播,仍能提供稳定的现金流与利润。在这种情况下,重仓具身智能硬件的ROI极低。因为他们不仅需要承担研发失败的风险,还可能面临“投入大、回报慢”,陷入“食之无味,弃之可惜”的困境。

正如头部电池厂商不愿专门为机器人研发专用电池一样。现有动力电池市场已足够支撑业绩,短时间亦看不到机器人专用电池为之所带来的新的增长。所以,互联网大厂也秉持“技术不落后即可”,时刻关注行业动态,确保不出现代差,未来市场成熟时随时能通过投资、合作加码。

理性选择背后还可以更性感

大厂的“擦边”选择虽符合自身利益,但却显得保守,甚至你会发现现阶段打法与具身智能的发展底层逻辑有相悖之处。

最明显的尬点在于,数据飞轮断裂。这里包含两个层面,一是硬件部署的数据飞轮尚未转起来;二是互联网大厂沉淀的数据未能充分利用。

具身智能的核心增长动力是“数据飞轮”。机器人通过真机部署与物理世界交互,产生“感知-决策-执行”的闭环数据,这些数据反哺模型迭代,让智能水平持续提升。然而,大厂不做硬件本体,就无法控制部署规模、任务类型和环境多样性,导致数据采集链路断裂,飞轮难以加速旋转。

同样遗憾的是,大厂沉淀的海量互联网数据也未能充分释放价值。阿里、字节、腾讯拥有海量人机交互数据、AI应用数据、物流数据、商家数据等等。这些数据完全可以在具身智能的落地链路中发力,包括完善产品的交互能力,推动产品精准营销等。

图片说明:京东具身服务体系

不过令人眼前一亮的是,目前已有大厂认识到这些数据的潜能。京东的具身布局(尤其是JoyInside)是一个典型例子:它利用电商供应链、物流系统、用户交互数据、场景数据,为具身智能企业的应用落地提供多方位赋能。随之而来,京东也赢得了“买机器人上京东”的生态位。

还有一个尬点是比较内隐的,涉及对软硬市场认识的误区。

大厂扎堆只做模型、方案,本质是陷入了“软件才是高精尖、硬件只是低端制造”的认知误区,死守“软件做核心、硬件做配套”的传统产业分工逻辑。这种思路看似稳妥,却可能把行业推向极端内卷的竞争形态。

目前互联网大厂普遍做的是具身智能软件方案,提供通用模型能力。但这种路径有一个严重的问题:软件方案市场天然是“赢者通吃”的。参考智驾行业的“地大华魔”,最终市场只会留下少有的几家方案商。

目前,大厂的模型能力呈现同质化竞争趋势。它们的核心功能都是“自然语言交互+任务规划”,差异仅在于接口数量与适配硬件类型。这种竞争态势,既看不到“一家独大”的可能性,也看不到技术发散的魅力。

所以,这就进入到更深层的问题。如果大厂只是闭门造模型,就会使得模型成为脱离硬件的“无的之矢”。具身智能的本质是“硬件载体+智能模型”的共生体,没有适配的硬件,再先进的模型也无法发挥价值。由于缺乏自研机器人本体,平台只能对接外部硬件厂商,模型的算法优势无法与硬件的机械性能深度适配。

所以,一个真正意义上的软硬两手抓的企业,或许反倒更具商业价值。

特斯拉的成功恰恰证明了“软硬一体”的优越性。特斯拉左手Model系列车型杀遍新能源汽车销量榜,右手FSD方案形成所谓的“断代领先”。而这样的案例还在它身上继续发生,即Optimus的硬件工程持续优化,软件能力同频进化。也正是因为这软硬一体的巨大商业价值,方才推动马斯克“万亿美元薪酬方案”的通过。

结语

从商业逻辑来看,大厂的“擦边打法”固然无可指摘:ROI更高、风险更低、路径更熟、组织更稳。它避免了硬件深水区的漫长试错,也守住了互联网时代积累的优势。但如果我们把目光放得更长远、更宏观,会发现科技行业正在进入一个新的拐点——这是第一次,智能不再只存在于屏幕、数据中心和云端,而是开始以“物理形态”步入现实世界。

当智能走向物理,意味着产业价值链将发生重新分配:软件不再是全部。真正的竞争力,来自软硬的同步迭代、来自数据飞轮的持续加速、来自工程与算法共同雕刻出来的“真实世界执行力”。这与互联网的范式截然不同,它需要另一种勇气、另一种耐心、另一种更具“制造业基底”的世界观。

所以,今天的大厂其实站在了一个分岔口:继续做更聪明的软件,还是开始学会与材料、机械、供应链、工厂打交道;继续作为生态赋能者,还是成为真正意义上的产业塑造者。前者合理,后者困难,但后者或许才拥有重塑未来十年的想象力。

产业的每一次周期跃迁,都会奖励那些敢于在“合理路径之外”迈出一步的人。对于布局具身智能的大厂,这句话或许尤为贴切。

*独立作者赵佳茹对本文亦有贡献