投注“端到端”:AI驶向物理世界阿里云加速“闭环”

  公司新闻     |      2025-09-28 12:23

  人工智能浪潮下,具身智能、智能辅助驾驶正载着AI开启一场从数字世界穿梭到物理世界,Agentic AI 时代正在到来,一场新的竞赛也正在开启。

  “过去这一年,AI的兴起让我们看到一个比较大的赛道涌现,就是自动驾驶与具身智能。”2025云栖大会上,阿里云大数据AI平台负责人汪军华告诉记者,阿里云对这两个行业非常关注,这不仅体现在资本层面的投入,更重要的是进行了高强度的基础设施技术栈投入。

  智能辅助驾驶技术架构正在从“多模块多阶段串联”走向“端到端一体化”变革,底层的大数据 AI 工程架构也面临不断升级的需求,产业界看得到“端到端”范式革命拐点的到来,也在走向新的技术难关。在机器人研发落地的场景中,云厂商也发现了相似的趋势与需求。

  如何帮助智驾和机器人实现“越用越聪明”?诸多云厂商正看好并投入这个产业难关的攻克抢占未来市场。实现大数据 AI 闭环被视作关键破局点之一。一场在两个AI落地前沿行业中的“卡位”战正悄然兴起。

  “自动驾驶从2003年左右开始发展,近二十年是没有太大进步的状态,直到‘端到端’出现了。” 卓驭AI首席技术官陈晓智对记者表示。

  卓驭主打低成本、高性价比的智能辅助驾驶解决方案。陈晓智介绍,从前自动驾驶的方案是模块化的技术机构,长期受制于 “感知 - 决策 - 规控” 分阶段架构的瓶颈,依赖人工定义规则,且面对复杂路况要通过 “case by case” 的方式不断修补漏洞。而具备某种scaling law性质的端到端架构则带来了范式革命,走向视觉、语言和行动能力深度融合的VLA架构模型,厂商只要关注数据、场景,不断训练模型就能实现复杂场景的自主应对,带来能力的快速迭代。基于此,整个自动驾驶行业都在向这个方向探索中。

  但通往“端到端”革命的路上有着严峻挑战,这意味着对数据量与算力需求的指数级增长。

  阿里云大数据AI平台解决方案负责人魏博文观察到,传统自动驾驶基本只要TP到几个PB的数据就能支撑模型训练,而当前主流智驾企业单次kaiyun体育全站 Kaiyun登录网页模型训练的数据量要达 10P-30P,数据已限制当前车企模型的快速迭代,需要整体大数据并发能力的提升。

  具身智能面临的问题还要更复杂。自变量机器人创始人兼CEO王潜表示,具身智能的核心是让机器具备理解物理世界、执行复杂动作的能力,它不仅需要视觉、语言能力,还需掌握摩擦、形变等物理规律,复杂性远超其他领域。

  当前,具身智能正从实验室走向产业,机器人、工业自动化、服务领域成为首批落地场景,但数据分散、算力需求特殊、通信要求苛刻等问题,让许多企业陷入研发困境,从算力到数据的处理,再到平台工具的支撑都可能成为阻碍。

  “我们需要算力、大数据、人工智能平台三位一体的、适用于具身智能的云上 AI 基础设施架构。”王潜表示。

  这也在成为云厂商发力的方向。汪军华告诉记者,随着“端到端”变革,阿里云的几个客户都处于万卡规模以上的需求,这是过去一年所涌现出来的,他们对算力的需求、对模型规模的变革、数据尤其是多模态数据的处理、高效使用、数据合规等要求都在变高。阿里云大数据 AI 平台建立了围绕模型、AI基础设施、数据基础设施、端到端搭建工具四大要素的全面有力的技术支撑,正投入Agentic AI 落地的基础设施搭建。

  刚刚过去的云栖大会上,阿里云便宣布了智能辅助驾驶解决方案的全面升级,具体来看,这套方案通过底层统一的元数据管理(DLF)实现对百 PB 级数据的高效管控,显著降低因数据备份、流动和处理带来的成本;全新支持Lance file 非结构化数据的读写、Lance 格式的训练加速,以及极致的压缩能力大幅减少存储空间的同时加速模型训练过程中数据加载部分的时间;还通过架构升级加速了千万级Clip数据生产、千亿级训练数据高性能检索等,加速智驾模型训练性能,提升整体训练效率。

投注“端到端”:AI驶向物理世界阿里云加速“闭环”(图1)

  据了解某车企端到端产线使用阿里云升级架构后的产品解决方案后,实现百万级任务管理及开发调度,现阶段支持上万任务并发运行,产能可达到 30w clips/天,持续突破调度瓶颈,较升级前效率提升2-3倍。

  通过阿里云大数据 AI 平台,王潜表示,机器人数据预处理、分布式部署、分布式训练、数据大规模远程回传等各方面的需求被完美满足,极大提升了研发及模型迭代效率。

  大数据AI一体化基础设施的建设成为智能辅助驾驶、具身智能创新与产业应用的加速器。记者了解到,目前,80% 以上中国车企、多家头部机器人企业的数据处理与模型训推链路跑在阿里云大数据AI平台上。

  阿里云正在实现AGI乃至ASI的路上加速狂奔,体现到“大数据 AI 闭环”的构建上,除了技术竞赛,云厂商们还在展开一场从产业需求出发,整合数据、算力、模型、场景的全链路能力比拼。

  一个备受关注的消息是,云栖大会上,阿里云已与英伟达在 Physical AI 领域的软件工具栈合作,阿里云人工智能平台 PAI 将集成 NVIDIA Isaac Sim、Isaac Lab、Cosmos、Physical AI 数据集等,形成覆盖数据预处理、仿真数据生成、模型训练评估、机器人强化学习、仿真测试在内的全链路平台支撑。

  这意味着,阿里云将引入英伟达在世界模型、physical AI方面的更多经验和解决方案,这可以在软件层面加速具身智能行业应用的开发,全面加速 Physical AI 创新落地。

  吸引80% 以上中国车企、众多头部机器人企业跑在阿里云大数据AI平台上的背后,是阿里云Data+AI在全模态兼容、弹性可扩展、安全合规、可靠性等方面走在市场前列,某种程度上,阿里云正超越 “技术供应商”,成为产业变革的引领者。

  以具身智能为例,王潜提到,事实上具身智能对云计算有着高可用性和对通信更加“极端”的需求。他们面临的问题是,具身智能实验中,启动新任务频率高于语言模型、自动驾驶模型训练,一旦可用性有问题,企业受到的损失不像以往的工程实践有相对成熟的解决方案,需要高可用性的保障。另一方面,由于机器人分布更加分散,对通信的要求更高,传统意义上对云的所谓存算一体实际无法满足,提出的是“网存算一体” 的新要求,才能在机器人全生命周期顺畅地开展模型部署、场景数据回收、再训练、升级部署等。

  云厂商正在显现出加速推动人工智能驶向物理世界的战略决心。伴随着在具身智能、智能辅助驾驶领域的前沿探索,值得关注的是,云栖大会上,阿里巴巴CEO吴泳铭对人类会实现AGI的确信,以及人工智能最终会实现ASI,发展出能自我迭代、全面超越人类的超级人工智能的论断。阿里云正在加速AI基础设施和云计算网络建设,是少数能做到软硬件垂直整合的超级AI云计算平台之一。

  “未来,每个家庭、工厂、公司,都会有众多的Agent和机器人24小时为我们服务。也许,未来每个人都需要使用100张GPU芯片为我们工作。”吴泳铭表示,新的计算范式需要超大规模的基础设施和全栈基础积kaiyun体育全站 Kaiyun登录网页累才能承载,未来,全世界也许只会有5到6个超级云计算平台,阿里云将以饱和式的投入推进AI基础设施建设。