撰文| 张瑞辰
编辑| 潘 谈
4月11日一场沙尘,不光吹迷了眼,还吹得毫末智行跳了票。
看得出毫末对这场发布对相当重视且做足了准备工作,又是毫末的管理层们介绍高阶智能驾驶的成果与进展,又是邀请各种大学教授发表对自动驾驶的看法,不知道有多少小伙伴是从始至终看完整场发布会的,至少我觉得太过于冗长了。
毫末智行是致力于打造AI自动驾驶行业潮头、由长城汽车孵化而出的自动驾驶的人工智能技术公司。
从自动驾驶数据智能体系到智算中心,从五大模型到重感知轻地图的路线,毫末带来了此次主题为“ HAOMO SPEED,AI SPEED ”的AI DAY。介绍了前不久2月中旬发布的全球首个自动驾驶生成式大模型DriveGPT,中文名为“雪湖·海若”的成果与更新进展。
那我们一起来看看此次HAOMO AI DAY上的重点内容吧。
毫末智行交出了怎样的成绩单?
发布会上,毫末智行董事长张凯表示:“2023年是自动驾驶冲刺之年,大考之年。”2022年中国乘用车市场高级别辅助驾驶的前装搭载率已经跃升至29.4%了,也就是说全年交付的585.99万辆L2级以上的乘用车中有超过172万辆车是搭载高级别辅助驾驶的,但据悉其实搭载毫末智行的只有不到10%。
而毫末对行业的判断为到2025年实现70%以上的搭载率。
毫末智行的智驾产品迎来了全线的爆发,包括城市导航辅助驾驶大规模上车、行泊一体前装市场迎来量产高峰、末端物流自动配送商业化形成闭环等。在大模型成果落地车端方面,里程渗透率指数级提升、大模型驱动数据闭环以及智算中心成“自动驾驶新基建”。
具体表现为:
从3月28日开始,毫末智行的末端物流自动配送车小魔驼2.0就可以在北京亦庄经济开发区公开道路行驶测试,这就证明小魔驼2.0已经可以在北京市经开区进行常态化测试和运营了。目前小魔驼已可以实现九大场景开始运营,场景覆盖多元化。
除了末端物流自动配送车小魔驼以外,毫末智行一直坚持6P开放合作原则,所以高阶智能驾驶能力还体现在目前已经获得三家主机厂的定点合作上,相关项目已在交付中。
毫末智行高阶智能驾驶能力的进展
毫末智行CEO顾维灏表示,传统的视觉自监督模型智能学到图片纹理、传统的占用网络只学到了空间结构,如何让大模型同时学到三维空间结构和普遍纹理是感知的核心问题。
MANA视觉感知能力上首先加强了同时识别纹理和结构的能力;其次提升了鱼眼相机纯视觉测距的技术升级,逐渐代替超声波雷达;然后单趟纯视觉NeRF三维重建支持完成自动标注;最后加强了MANA支持障碍物编辑可以生成全新场景的能力。
毫末智行自动驾驶生成式大模型DriveGPT相关的更新进展:
DriveGPT是采用了和ChatGPT一样的Transformer模型与RLHF人类反馈学习能力,通过引入真实驾驶场景和人驾接管数据,可对自动驾驶认知决策模型进行持续优化。
进展方面,DriveGPT可以同时生成多个“平行宇宙”,提前做好再一次遇到类似情况可能发生的各种驾驶情况,还在预测自车未来轨迹能力上得到了提升,第三点在行驶过程中发生要决策的时候输出决策推理链Chain of Thought。
基于重感知轻地图的技术路线,DriveGPT还可以进一步使用重感知的技术,降低了对高精度地图的依赖,并且目前完成模型搭建且通过第一阶段数据跑通的DriveGPT,已经实现了超过4000万公里的量产车驾驶数据训练,参数规模达到了1200亿。
有意思的是展示智驾大数据用户使用总里程的时候,毫末PPT上用了一个动图来强行强调正在进行时,不到四十秒的时间总里程又多了30.6km,未免太过于刻意了。
算力方面,毫末智行的智算中心MANA OASIS拥有高达67亿亿次每秒的浮点高性能运算、2T每秒的存储带宽以及800G每秒的通信带宽,从而实现DriveGPT的训练稳定性优化。
在我看来,的确GPT的模式可以应用到高阶智能驾驶领域上,但会上所展示的功能或许还只是大模型的冰山一角,即便不用GPT也能实现快速标记车辆、行人、信号灯等物体,大家对DriveGPT的期待还是更高层面的功能,通过这次发布会的了解,目前能力表现还很局限,期待后续的技术升级。
顾维灏表示未来DriveGPT也将对行业开放包括机器人行业、自动驾驶行业、汽车主机厂、芯片厂商以及科研机构,还是先把第一款本月即将上市率先接入DriveGPT,搭载毫末HPilot3.0的魏牌新摩卡做好再考虑别的行业吧,这一点倒是可以学学前两天联手领克打造车机的魅族。