Scaling up Autonomous Driving via Large Foundation Models

Published on Jun 17, 2025 Updated on Jan 15, 2026 One minute

Contents

Xpeng 今年 4 月发布 720 亿参数的“世界基座模型”以来 “扩展法则”（Scaling Law）在自动驾驶领域的系统性验证，结合“云端基座模型 + 强化学习”的方法论，还公开了已被 DeepSeek 验证的“知识蒸馏”路径，将 VLA（Visual-Language-Action）模型高效部署在自研芯片上的最新实践。

软件1.0: rule-based
软件2.0: 模型即软件
软件3.0: 模型生产模型
- 云端大模型(72B, 行业主流VLA 模型的35倍以上) -> 蒸馏到车端小模型
- 算力: 10 EFLOPS, 1w+ GPUs
- 数据传输架构，训练速度提升5倍
- 数据飞轮
- 5000万 clips (30s), 共计40w hours+，平均每天上传数据600TB，超100种触发机制驱动
- 基座模型是动态的，持续学习，循环进化。
  - 内循环: 预训练、后训练(包含监督精调 SFT, 强化学习 RL) 和蒸馏部署
  - 外循环: 量产数据飞轮
- Scaling Law:

自研芯片的摊销门槛至少是100万片起步；图灵芯片不光会用在车上，也会用在小鹏的飞行汽车以及机器人上。对于大模型的研发来说，其投入规模也是巨大的，预计今年底/明年头部厂商为辅助驾驶大模型的云端算力投入可能就是以1亿美金作为门槛。

VLA本身最早就是由DeepMind提出来，用于机器人的模型范式。语言模型加入之后对推理能力的增加，能极大地帮助机器系统建立对世界的认知，从而形成更加通用化的能力。

小鹏 G7全球首秀: L3级别算力图灵芯片 x3, 2200TOPS+, 216GB内存容量图灵 AI 芯片 + 高通8295P 智能座舱芯片近20000张卡本地部署 VLA+VLM 图灵AI芯片

40核心最高可运行大模型参数: 30B 2xNPU DSA

VLA-OL模型

路面塌陷避让
救护车识别让行
拥堵道路合理变道加塞
积水路面，主动减速
遮挡推理
识别交警手势上车节奏： VLA 软件 OTA，思考推理可视化展示-09 VLM 硬件免费升级-11 主动推荐，语音控车，记录学习个性驾驶习惯-12

全本地端运行

VLM 整车 AI 大脑

本地聊天
本地控车
主动服务
变身家人
多语言对话

芯片研发：100w 片是门槛 AI 算力：将2w 张卡 72B 基座模型

online reinforcement learning:

Vision-Language-Action - Online Reinforcement Learning (VLA-OL) TURING x2 高帧率低时延长时序

人机共驾+强化学习

VLM TURING x1 + 高通8295P

References

https://cvpr2025.wad.vision/
https://weibo.com/ttarticle/x/m/show/id/2309405178106696040457?_wb_client_=1
https://mp.weixin.qq.com/s/u_vREBzJ7Qeckn4OEWtoMQ
https://mp.weixin.qq.com/s/od2qG1Q8REGMwg6C5QW-Fg
https://user.guancha.cn/main/content?id=1464995
【跨时代小鹏G7上市发布会】https://www.bilibili.com/video/BV1Jg37zfE3t?p=2&vd_source=e05fafaa995c59e16affc059ba418214
【AI科技 AI家庭小鹏G7 全球首秀】https://www.bilibili.com/video/BV1ArTozTExV?vd_source=e05fafaa995c59e16affc059ba418214