作者 |Bruce
编辑 |德新
如何角逐自动驾驶3.0时代
(资料图)
数据是人工智能算法迭代的基石。
自动驾驶作为人工智能技术应用的典型场景,核心竞争将比拼自动驾驶的数据规模和质量。
“毫末经过接近三年的发展,目前已经是中国量产自动驾驶公司的第一名,数据规模正在快速增加。” 2022年9月13日,毫末智行CEO顾维灏在第六届毫末AI Day上宣布。
这天是毫末智行成立的第1020天。
顾维灏认为,参照谷歌发布的AI自然语言处理模型PaLM所处理的数据规模,自动驾驶领域如果要更广泛地应用 Attention大模型,所需的数据规模需要自动驾驶里程至少达到 1 亿公里。
顾维灏将近十年的技术发展分成了三个阶段:
自动驾驶 1.0 时代,最早的采用硬件驱动方式。特点包括自动驾驶运行里程100万公里,感知主要依靠激光雷达,认知基于人工规则;
自动驾驶 2.0 时代,最近几年出现的采用软件驱动方式。特点有自动驾驶运行里程100万-1亿公里,感知依靠传感器单独输出的结果,认知基于人工规则,开始出现基于小模型、小数据的技术模式;
自动驾驶 3.0 时代,即将发生并将持续发展的采用数据驱动方式。特点是,自动驾驶运行里程在1亿公里以上,感知依靠多模态传感器联合输出的结果,认知基于离线强化学习抽取驾驶常识,技术模式基于大模型、大数据。
对于毫末来说,将自动驾驶里程提升到1亿公里,建立基于Attention大模型的AI自动驾驶处理模型,是进入自动驾驶3.0时代的重心。
背靠长城汽车,要迅速突破1亿公里并非难事。
我们更看重的,是毫末在进入3.0时代后如何利用大模型、大数据加速迭代自动驾驶功能。
如果可以利用好大模型,毫末在智驾维度上超越蔚小理的胜负手很快就会出现。
过去1000天,毫末做了什么?
自动驾驶分为渐进式和跨越式,毫末走的是渐进式路线,并很早确定了“毫末模式”:
(领先的数据智能 * 稳定的量产能力 * 安全) ^ 生态
这一模式下,毫末取得了一系列战绩。
乘用车方面:
2021年,毫末辅助驾驶系统HPilot 1.0版搭载五款车,数万台规模。今年4月,搭载了第六款车型坦克500。
目前,搭载毫末辅助驾驶系统的车涉及魏牌、坦克、哈弗、欧拉多个长城子品牌,今年底将落地30款车型。
毫末辅助驾驶用户行驶里程,截至今年9月达到1700万公里;
毫末预计,2024年底,上车总量达到百万量级。这意味着,届时长城旗下的车基本上都会搭载毫末辅助驾驶系统,这对于辅助驾驶用户行驶里程也会是一个重大提升。
商用车方面:
产品层面,毫末推出了末端物流自动配送车线控底盘小魔盘、配送车小魔驼、小蛮驴、魔袋20等产品;
合作层面,与美团、阿里、物美多点建立合作关系;
订单层面,截至今年9月,小魔驼订单量突破9万单;
毫末还拿下了多个第一,比如:
发布了中国首个自动驾驶数据智能体系 MANA;
中国第一个大规模量产、重感知的城市NOH辅助驾驶系统;
中国第一个十万元级末端物流自动配送车小魔驼 2.0。
毫末智行董事长张凯表示,MANA已经基本完成数据闭环,城市 NOH 辅助驾驶系统即“毫末 HPilot3.0” 9 月量产,今年可落地区域预计将会覆盖10座城市,2023年我们的计划是 HPilot3.0落地城市超过100个。
此外,经过两代小魔驼的持续迭代,目前小魔驼2.0已经兼具自动驾驶与平行驾驶的能力, 为全程无人接管提供了完备的方案。
一句话,毫末拿下了中国自动驾驶量产第一。
那么,取得这些成绩背后的核心原因是什么?
在国内车企中,毫末很早就看清了自动驾驶进入数据驱动的终局,并且基于终局视角,一开始就搭建数据智能体系,也就是MANA。
毫末智行CEO顾维灏说,自动驾驶竞争进入了以数据驱动为主的3.0时代。
数据的重要性凸显,尤其在城市高阶智能驾驶竞争中,涉及复杂场景比如城市道路养护、变道空间狭窄等多种场景得到充分体现,此外数据还涉及多重感知融合、规控策略提升等。
毫末很清楚自己的优劣势,劣势是起步晚,优势是后面有长城的百万辆汽车做量产搭载后盾。在这种情况下,建立数据智能体系就成了重中之重。
据XEV研究所了解,搭建数据智能体系已经成为自动驾驶头部玩家的共识。
搭建数据智能体系,就近可以优化规控策略,提升用户使用辅助技术功能的体感。朝远了说,是积累数据用来反哺优化感知算法,洞察用户需求用来更好定义功能开发的关键。
对于数据的收集和处理的能力,是毫末在自动驾驶领域持续前进的核心。
毫末的核心,在自动驾驶领域应用大模型
解决了大部分高速场景后,自动驾驶的重心开始转向城市场景。
顾维灏透露,城市场景的复杂性远超毫末最早的预期,比如,城市道路经常不定时的养护;有的路段大型车辆密集,遮挡和截断严重;周围车辆的行为导致自车变道空间狭窄,变道困难;还经常遇到打开的车门等等。
解决城市场景问题,本质上即是解决更大规模的数据处理问题。
一方面,需要有效地将数据规模转化为模型效果。
业界常用的方式是监督学习,在遇到更大规模的数据时,样本标注的时间成本和费用成本会变得很高。
毫末的方式是将所有感知任务backbone进行统一,然后利用无标注数据对统一backbone进行预训练,模型剩余的部分再用标注样本进行训练。
顾维灏说,做Backbone的预训练这种方式比只用标注样本做训练,效率可以提升3倍以上,同时精度也有显著的提升。
另一方面,在数据规模增加后,需要继续保持巨量数据规模下对自然界数据分布遵循长尾分布形态。
简单来说,就是在处理好头部场景数据的基础上,兼顾腰尾部场景数据。
由于深度学习的训练过程是拟合数据分布的过程,更擅长处理头部场景,对腰尾部场景的处理效果并不好。所以,业界常用的方式是用全量数据再次精细的训练模型,但是这种做法的成本高而且效率低。
毫末的做法是,构造一个增量式的学习训练平台。训练过程中不再无差别地去优化所有参数,而是选择“有偏见”的参数进行定点优化,并动态观察模型的拟合能力,适时地扩充模型的参数规模。
顾维灏说,相比常规做法,这一方式达到同样的精度可以节省80% 以上的算力,收敛时间也可以提升 6 倍以上。
与常见的由摄像头、激光雷达、高精地图组成的自动驾驶方案不同,毫末采用了重感知轻地图的技术路线。
“城市场景里的道路环境发生变化的频率远远高于高速场景,如果把地图看作一个传感器的话,那么这个传感器的置信度是有些问题的。”顾维灏说。
毫末的解决方案是,使用 Transformer 建立强感知的时空理解能力,用时序的transformer 模型在 BEV 空间上进行虚拟实时建图,通过这种方式让感知车道线的输出更加准确和稳定,在这个时空下对障碍物的判断也会变得更加准确。
目前,在实时感知能力下,毫末已经可以不需要地图辅助就能解决过去比较麻烦的模糊复杂路口、环岛等问题。
毫末还在通过升级车上的感知系统,以使自动驾驶系统识别城市环境下的交互接口。此外,毫末还在与阿里巴巴、德清政府合作,借助路端设备提升对于城市路口的仿真场景构建效果。
自动驾驶最终目的是让车的运行更像人类驾驶。
过去业界常用的分场景、微模型方法,会存在由于太机械导致的舒适感不足问题。毫末正在借鉴多模态大模型的方法来解决认知问题,让系统的动作更加拟人。
大致做法是,对覆盖全国的海量人驾数据进行深度理解,构建毫末自动驾驶场景库,并基于典型场景挖掘海量司机的实际驾驶行为,构建 taskpromt,训练一个基于时空 Attention 的驾驶决策预训练大模型,使得自动驾驶决策更像人类实际驾驶行为。
在训练大模型时,为了提高训练效率并降低训练成本,毫末的超算中心开始登场。
这一类似特斯拉Dojo的超算中心,目标是满足千亿参数大模型,同时数据规模100万clips,整体训练成本可以降低 200 倍。
总的来说,智能驾驶这条赛道,是1和0的比拼。1指的是智驾功能,0指的是可以量产搭载的车型。
毫末智行负责1,长城汽车背后的百万销量负责0。
MANA实现数据闭环,以及高速、城市NOH功能的开发完成,和末端无人配送产品的出现,意味着毫末智行基本上完成了1。
接下来就是功能系统的大规模上车。
自动驾驶数据,毫末超越蔚小理的胜负手
追击1000天后,毫末的智能驾驶水平终于来到蔚小理的同一档。
一个标志是,搭载毫末辅助驾驶系统的摩卡激光雷达版,和小鹏P5激光雷达版,可以在首个量产城市领航辅助的称号争夺上掰手腕。
实际上,毫末智行和蔚小理的智能驾驶打法是略有不同的。
蔚小理的优势是全栈自研起步早,劣势是量产规模处于起步期。毫末智行的劣势是起步晚,优势是后面有长城的百万辆汽车做量产搭载后盾。
为了弥补这种劣势,毫末智行追击了1000天,弥补了时间差导致的功能差距。
在具体技术方案上,基于对数据智能体系的重视,毫末智行与蔚小理的注重感知、高精地图、激光雷达方案不同,采用了“重感知、轻地图”的技术路线。这是大胆、甚至可以说是冒险的技术路线。
秉承传统车企基因,毫末还具备了技术工程化能力。
毫末在两年多时间里实现10余款不同平台车辆量产落地。背后的原因是,毫末形成了一套高效的智能驾驶产品开发流程,可以30个项目异步开发。
功能产品研发完成后,大量长城旗下品牌车型等着被搭载,这将进一步推动毫末辅助驾驶系统的迭代演进。
总结来看,方向选对并且推进迅速,让毫末和蔚小理的智能驾驶功能落地节点上保持了一致,接下来,比拼的就是功能上车的规模量。
当自动驾驶进入数据驱动的3.0竞争时代,谁的数据积累速度更快,谁就能拔得头筹。
毫末和蔚小理谁的数据量积累更快?
蔚来官方数据显示,截至今年5月21日,蔚来中国用户累计使用NIO Pilot行驶超过4.18亿公里,使用领航辅助(NOP)累计行驶1.57亿公里。
何小鹏在今年3月透露,小鹏智能驾驶累计行驶里程达到1.4亿公里。
理想官方公布数据显示,截至今年6月底,理想高速NOA累计行驶里程超过2462万公里,辅助驾驶里程超过2.9亿公里。
相比之下,毫末当前的辅助驾驶行驶里程最少。但接下来,随着毫末辅助驾驶系统在长城品牌车型上的迅速搭载,毫末的辅助驾驶行驶里程规模倍增将是必然。
目前,长城汽车年销量处于100万台的水平,根据长城汽车规划,将在2025年实现全球年销量400万台车的目标。
对于蔚小理来说,当下年销量大概在9万台的水平。到2025年,要达到长城的同等销量规模,难度并不小。
销量直接决定了辅助驾驶系统的搭载规模,这一次,蔚小理全栈自研早起步的优势,开始被毫末背靠的长城汽车规模优势替代。
这也是为什么说智驾维度上毫末智行迎来了超越蔚小理的拐点。
毫末的胜负手,也就是自动驾驶数据的多样性、规模量,在1亿公里之后就会到来,相信那一天并不会太远。
谁在掌管吉利智能化转型?
亲历者说:中国第一张商业化的高精地图是怎么诞生的?
打灯变道,难倒一大批车企
关键词: 毫末追击智能驾驶1000天 对战蔚小理将现胜负手 自动驾驶