机器人产业的下一程竞争,不在硬件的姿态控制,而在芯片之上的那一层工程化能力。
2026年的具身智能赛道的一个共性问题在于,当所有人都在训练VLA模型,所有人都能跑通π0、千寻、Qwen-VL,所有人都能去刷榜,胜负手究竟落在哪里?
地瓜机器人软件平台副总裁秦玉森在2026张江EAI演讲中给出的答案,来到了这场赛跑最隐秘的那一层——基础设施。
在他看来,谁能把芯片、工具链、数据流、仿真验证、端侧部署、运行时迭代这六件事打成一条标准化流水线,本质上谁才拿到了具身智能规模化的入场券。
这是一场关于开发者体验的战争。它的胜负,决定了五到八个人的小团队,未来能不能跑赢过去需要二三十人才能搭起来的研发体系,能不能真正走向未来。
01.
一颗芯片背后的两条路线图
具身智能要什么?秦玉森给出了一个并不浪漫的路线图:和人类奥林匹克精神一样,更高、更快、更强。
这句话翻译成工程语言意味着非常多东西,意味着端侧算力要在功耗、成本、实时性之间反复折返跑。
消费类机器人追求的是低功耗下的可用算力,具身智能追求的是模型能在几瓦的功耗预算下,跑出足够的决策频率。这两条路径在技术指标上是冲突的。
地瓜的应对是把芯片路线拆成两条,一条路上,旭日X系列服务扫地机、智能音箱一类的消费场景,把功耗压到极致,把单位成本压到极致;另一条路上,旭日S系列则承接具身智能这条更陡峭的需求曲线。
S100是过渡形态,把低功耗和多样化算力组合进同一颗SoC,能跑通约7B参数的模型,完成每秒140帧左右的视觉感知任务。这一代产品已经在上海具身企业里大规模出货。
真正承载行业期待的是S600。基于地平线BPU自研IP架构,多核CPU、GPU齐备,Qwen3-VL 8B可以跑到约35 TPS,Qwen3 8B语言模型可以跑到约31 TPS。落到具体的VLA模型上,π0能跑约10帧,π0.5约6.5帧,千寻约6.7帧,地瓜自研的运控模型能跑到约40帧。
这组数字不是秀肌肉。它试图回答的是产业里一个最焦虑的问题,那就是8B级别的视觉语言模型,能不能在机器人端侧真正跑得动?答案是可以,但前提是芯片架构要从一开始就为Transformer和混合精度计算做过定制。
芯片从来不是孤立的产品。它是地瓜整套战略的物理底座。
02.
从熟练工的脚手架到创新者的瑞士军刀
秦玉森用了一个颇有意思的说法:以前工程师需要多年经验、试错和踩坑,才能搭起一套可用的开发工具链。这套工具链是熟练工的“脚手架”,离开它,工程师寸步难行。
今天,AI把这件事彻底改写了。
工具链不应该再是脚手架,而应该是一把瑞士军刀,更小、更快、更易上手,让开发者把精力从工程化本身,挪到真正的产品创新上。
这是AI native时代的开发范式革命。
开发者不再需要读两三千页文档,不再需要两到三年的算法工程化经验,才能跑通一个完整的训练—部署闭环。
因此,今天地瓜的目标是让这一切通过单一窗口完成:从设备连接,到开发,到落地,到使用,全部一体化。
这更类似一种生态重建的范式迁移。它的影响,或许比芯片本身更深远。
地瓜云边端协同的战略架构由此浮出水面。
云端依托百度智能云等头部云厂商的算力,地瓜搭建了一站式开发环境,开箱即用,不再需要和IT经理讨论服务器选型;边缘侧把触手可得的电脑作为入口;端侧则是地瓜的芯片,作为整体解决方案中不可或缺的一环。
这也使得这套架构输出的,已经不再是单单的应用解决方案,更多是开发解决方案。这也使得机器人时代的开发中枢,正在重新定义。
03.
研发速度决定企业生死
在产业爆发的当下,秦玉森抛出了一个反直觉的判断:今天的企业应该更重视研发,而非交付。
他解释,这是因为,更快的研发意味着更快的落地,更快的落地意味着更好的现金流,更好的现金流意味着更好的竞争力。
传统软件平台的形象,是Word、WPS这样的垂类工具,或者是某一类专业领域的专用工具。但今天的机器人软件平台,必须是通用的、横跨数据采集、解析标注、模型训练、仿真平台、推理部署全链条的工具集合体。
地瓜的软件平台因此围绕六个能力矩阵展开,分别对应开发环境、数据生成处理、标注、训练中心与算法参考范例、仿真验证、端侧部署。每个环节都被拆解成可拼接的积木式工具,开发者可以像拼乐高一样,按需搭建自己的工作流。
这套体系的产业意义,是把一个二三十人的团队才能运转的研发体系,压缩到五到八人。
秦玉森在演讲中披露了几个真实的服务案例,例如一家具身智能公司从0到1开发VLA模型,接触地瓜之前跑了三个月,对接地瓜一站式平台后,一周内就跑通了完整流程;S2挑战赛期间,40多支参赛团队没有一个需要购买实体机器人,全部通过网页仿真完成3V3足球赛项目,高校师生终于可以从运维机器人的苦役中抽身,把精力放回策略、博弈和强化学习算法本身。
更简单、更易于开发,这是人才稀缺时代的杠杆解。
04.
数据闭环:仿真驱动的新流水线
数据是具身智能最大的瓶颈,这一点已是行业共识。
地瓜给出的解法,是用仿真环境和自然语言驱动,把数据生产流水线化。
具体路径是先在仿真平台里搭建物理场景,导入模型参数,通过Agent驱动数据生成、清洗、验证、评测。
整个流程由自然语言指令触发。比如一句左手拿起肥皂,就能在仿真环境里生成一个机械臂完成该动作的视频片段,全程无需人工干预。
这是仿真生成式数据的工业化雏形。当数据生产从稀缺的手工劳动,转变为可泛用、可复用的流水线,具身智能的扩展速度才真正有解。
同时,地瓜也在视觉感知管线领域为工业机器人厂商提供完整方案,从物体检测到定位抓取,覆盖最常见的工业AI视觉场景。这是一条相对成熟但市场刚需的赛道,地瓜以芯片能力为支点切入,恰到好处。
05.
产业权力的重新分配
地瓜在演讲中披露,其目前还正在携手产业链上下游伙伴,包括硬件厂商、软件平台解决方案商、运控厂商、云厂商,构建一个开放的协作网络。
这种姿态背后的产业逻辑或许是地瓜机器人意识到,具身智能的终局不会是一家通吃。芯片、模型、运控、数据、云,每一个环节都需要专业玩家。而地瓜选择的角色,恰恰是基础设施提供者和生态连接者,而非垂直整合者。
这种生态位选择,决定了地瓜的对手不是宇树、智元这些本体厂商,而是英伟达、英特尔、高通这些传统的算力霸主。
竞争维度被拉到了开发体验、工具链完整度、生态连接深度这些更上游的位置。
所有头部机器人企业的量产选择,这是地瓜在演讲中给出的定位。这句话翻译过来是,在算力底层,地瓜已经成为中国具身智能产业的默认选项之一。
秦玉森在演讲结尾给出的愿景简洁而克制:加速智能生长,让开发更简单,让机器更智能。
这背后,是中国具身智能产业最朴素也最迫切的渴望。
当芯片、工具链、数据流、运行时迭代被打包成一套开箱即用的基础设施,开发者的注意力才能真正回到产品本身,回到那个让机器人学会理解世界、与世界交互的核心命题。
这是地瓜押注的下一程。也是整个产业必须走过的下一程。