编者按:本文来自微信公众号 远川汽车评论(ID:yuanchuanqiche),编辑:罗松松,创业邦经授权转载。
在比亚迪宣布开启全民智驾之后,吉利、奇瑞等车企都纷纷跟进,就连最接地气的五菱最近也发布了灵犀智驾。比亚迪创始人王传福在今年的“百人会”活动上表示:“一旦用了智驾车,就很难回去”。
过去两年,随着智驾的覆盖范围和能力上限不断取得突破,加上硬件成本逐年走低,智驾正在从过去锦上添花的卖点成为实打实的产品力,而且正在快速下沉,售价不到10万的车也能实现高速领航。
与之呼应的是,车企们在智驾赛道的比拼已经不满足单点功能如何如何,智驾能不能覆盖全场景,底层架构有没有延展性,如何平衡“安全、舒适与效率”,成了新的竞争点,也是智能电动车决胜下半场的关键。
消费者对智驾的需求正倒逼行业重构技术底座。如何突破传统架构的局限成为了关键。
传统智驾算法先天不足
智驾,是从简单的泊车功能慢慢发展起来的。
车速低不易发生事故、停车场景数量有限容易写规控算法、封闭环境对感知硬件要求不高,泊车功能的这些特征,影响了智驾算法框架的建立,最终形成“感知→规划→控制”的基本框架。
感知模块负责收集和处理摄像头和雷达等传感器数据,然后将其传给决策模块,决策模块根据信息输入规划路径或动作,再传给规控模块执行。
就像在饭店后厨里,洗切、调味、掌勺、装盘、上桌,每个环节都有专人负责,大家配合协作,用流水线操作的模式,共同完成任务。
随后,这一套“先感知,后决策,再控制”的逻辑被应用到了高快速路上。虽然相较于泊车,高快速路场景的车速提高了,场景数量变多了,规控逻辑复杂了,但相应地,智驾的感知精度、算力大小、算法成熟度和代码数量也都提升了不止一个等级。从实际效果来看,智驾在高快速路上的表现,还算是游刃有余的。
但随着智驾应用场景的进一步开放,由感知、决策、控制三大独立模块共同托举起来的智驾功能,在复杂多变的城市道路面前,开始显得捉襟见肘了。
首当其冲的是长尾场景难以覆盖。
异形交通灯、临时交通管制、施工围挡、被涂抹又重新画上的道路线、公交车道通行时间、以及动向不可捉摸的行人、非机动车,甚至是流浪动物和逆顺光线的变化……成千上万种元素排列组合,构成成千上万种交通路况。
这对从算法规则库来说,简直就是灾难——路况无法穷举,意味着规则算法永远无法完整,意味着,一旦出现以前没见过的长尾场景,智驾就处于“无例可循”的宕机状态,应用范围受限事小,瞎规划乱行动事大。
其二,存在时效低,数据信号损耗的问题。
三大模块之间的数据传输接口由人定义,有固定数据传递格式和内容。一些可能对决策有帮助的细节,会因为不在规范定义范围内而被过滤掉,也就是俗称的“数据损耗”。
比如雷达和摄像头探测到的信息经过人工算法的简化处理后,只向规控模块提供了前方动态障碍物的速度和车道线边界,但丢失了道路表面材质信息之类(结冰路面)的细微差异,这就会影响车辆紧急制动的规控策略,容易造成刹车不及的追尾事故。
路面结冰
或者是数据在人为定义范围内,但模块之间的信号传递需要时间,等规控接收到感知模块给的信息,已经来不及通知控制模块采取行动了。行车噩梦“鬼探头”就是典型例子。
就像功能手机无法运行智能应用,以规则穷举为底层逻辑的算法规则库无法覆盖所有可能出现的道路情况,模块拼接的架构也无法解决数据损耗和实时性的瓶颈难题。
先天不足的传统智驾架构,已经无法满足如今全民智驾、智驾平权的切实需求了。
智驾的“奇异博士”:端到端架构
明确问题本质,是解决问题的前提,车企深谙这个道理。
根据《端到端智驾行业研究报告》显示,已经有87%的车企启动端到端研发,试图一次扫清传统智驾算法的短板和缺陷。
相比传统智驾算法,只能照本宣科地按照预设菜谱(规则算法库)做菜,超出菜谱范围就只能歇菜,端到端大模型架构,更像是个全能型厨师,一个人负责所有步骤一个人就是一个团队,没有固定菜谱(人工规则代码),靠观摩各种做菜视频,慢慢学习模仿,自学成才。
端到端大模型的颠覆性在于其构建的“数据即算法”闭环——传感器获取的感知数据直接输入端到端大模型。没有损耗丢失,也不存在人为过滤,避免了重要信息丢失影响决策的可能性。
感知、决策和控制模块“三合一”,没了桥接的数据链路,就不存在系统延时,整体响应更加迅速。饱和式投入海量训练集,最大限度地覆盖长尾场景,彻底解决传统智驾算法的核心痛点。
同样是处理“车辆右拐遭遇行人横穿马路”的场景,传统智驾的规则算法的处理方式是僵硬地遵循“先查看环境识别到行人→再思考自车行动是刹车还是行车→最后再调用方向盘和油门刹车”的分布操作。
如果行人有走动或其他行为,传统的规则算法要么是重复上述步骤,驾乘人员会在刹停、启动,再刹停、再启动之间摇摇晃晃,毫无体感舒适度;要么就是受规则限制,索性停车等候,直接影响道路通行效率。
端到端大模型的处理方式就非常拟人,属于“边看路边思考边动方向盘”的下意识反应,持续观察行人位置,预判行人动态,在接近行人时提前减速,在和行人保持安全距离后,又及时加速驶离,整个过程丝滑流畅,不存在卡顿或急刹急停的情况。
智驾技术底层逻辑的变化,催生了对数据和算力的全新需求。数据处理,模型训练,算力支撑,决定了端到端大模型对对复杂场景的理解能力和决策能力的优劣,也决定了智驾水平和用户体验的下限和上限。
华为云八爪鱼智驾云服务所提供的全链路解决方案,正在成为其中重要的赋能者。
智驾的“古一法师”:数据
华为云八爪鱼智驾云服务具备多重核心能力:即能为车企提供智驾“超级工具箱”,又是高质量数据的“黄金矿工”,还能兼做智驾的虚拟驾校训练师,全流程全方位地为车企的智驾研发保驾护航。
智驾的“超级工具箱”,指的是华为云可以提供一套从数据到模型的完整开发工具。工具箱包里自带了参考算法和数据集,车企可以直接上手,像“搭积木”一样方便快捷地训练自家的智驾系统,无需再投入额外的人力物力,做到“开箱即用,万物通用”。
智驾的“黄金矿工”,指的是华为云又快又准的搜索能力。搜索引擎可以从数百亿条数据里迅速找到正确且有用的内容,投喂给大模型进行训练。类似制作“专属错题集”,针对薄弱环节进行专项训练和复习,直至答出正确答案。
智驾的“虚拟驾校”,指的是华为云通过生成式AI创造出一个和现实相同的道路环境,再为不同车企的不同智驾系统量身定做海量的“地狱级难度”考题,对智驾系统的极限能力进行不断试炼。
在这种虚拟驾校模式下,智驾系统的测试效率比传统方法快5倍,相当于一天测完过去五天的量。也只有从这全程模拟测试的“修罗场”里闯出来的智驾系统,才能够算得上“千锤百炼”。
端到端大模型通过汲取海量数据信息自学成才,靠模仿做到分毫不差,固然是重点,知其然又知其所以然,也同样重要。
尤其在面对比如仅小车通行标识、公交车道限时使用标识等复杂交通标识时,单纯模仿历史数据的端到端模型,是无法理解这些标识的含义的,也就更谈不上按标识提示规划行车路径。
VLM/VLA融合多模态解决方案的出现,很好地给端到端模型打上了补丁。
作为独立系统,VLM(Visual-Language Model视觉语言模型)提前对潮汐车道、公交车道之类的道路标志和通用交通规则等进行预训练。结合当下时间点,判断是否可以驶入公交车道,继而向端到端模型发出“向左变道避让”或“直行进入公交车道”的指令,再由其生成具体行动轨迹。
VLA(Visual-Language-Action Model视觉 - 语言 - 动作模型)则更进一步,直接融合“看、想、做”三个动作。
华为云的AI训练标注功能对原始数据(如图像、文本、音频、视频等)添加注释或标签,明确指出输入数据的含义,相当于“老师在考前给学生划知识重点”,让车能360度无死角“看”清自车周围的道路环境。
大语言模型提前对抽象的交通标志进行理解,预测道路参与者的下一步行动意图,整个过程完全“类人”,帮助端到端大模型从单纯地“依葫芦画瓢”直接进化成“有思想有逻辑有判断有预测”的硅基工具。
在研发前期,为车企提供趁手的开发工具;在研发过程中,为智驾提供海量的有效训练数据;在检验验收阶段,为车企提供全流程仿真测试,持续拔高智驾模型的上限。华为云八爪鱼智驾云服务在智驾数据方面的能力,可以为车企的智驾研发带来持续加成。
智驾的“法器”:算力
如果说数据是智驾的核心燃料,那么算力就是动力引擎。
端到端模型的参数量巨大,计算密集。单次训练就需要数千张GPU并行计算。训练一个城市NOA模型,就可能需要数PB数据和数周算力资源。换句话说,算力大小,决定了模型的规模和复杂度。
华为昇腾AI云服务拥有目前国内最全的云服务“组合拳”,三大万卡智驾集群+昇腾算子+全场景AI框架+工具链+大规模集群训推平台。
95%的故障,可在几分钟内完成监测和故障诊断;故障快速恢复架构,能够在30分钟内完成自我修复,成功率高达95%;大模型长稳训练能实现40天不中断,相比业内千亿参数模型训练平均2.8天无中断的数据,稳定性翻了14倍。
澎湃算力和超强稳定性,是昇腾AI云服务向车企用户做出的承诺。
在不改变用户使用习惯的前提下,全流程的昇腾迁移工具链,能够支持主流场景算法快速迁移,可提供专业服务,从环境准备、模型开发迁移、到精度对齐、模型调优等环节上,帮助车企将算法从英伟达“无感迁移”到昇腾上。
同时,华为云还设有业界首个汽车数据安全合规的汽车专区,可以支持国内多个资质图商协同服务。严格遵循“物理隔离、公网隔离、数据不出云”的管控要求,符合测绘级合规要求,能为车企彻底解除数据隐私和合规性方面的后顾之忧。
尾声
技术革新,往往带来腥风血雨的产业权力更替,但智能驾驶领域,开放融合、协作发展才是主旋律。
华为云始终以开放姿态携手各方生态伙伴,围绕国产工具链自主可控和大模型应用进行联合创新。生态伙伴间的每一次协作,都是对端到端智驾模型技术闭环的补全,更是对国产智驾生态筋骨的打磨。
在工具链层面,华为云将昇腾AI云服务、全场景AI框架、迁移工具链等核心能力与伙伴共享,助力车企构建自主可控的研发体系;
在大模型应用领域,和图商(四维图新),智驾方案商(禾多科技)等伙伴一起,依托华为云的算力和云计算能力,让地图数据标注、仿真场景搭建、算法训练纠错等环节的效率大幅提升。
华为云和生态伙伴携手并进,组成了智能驾驶领域的“超级赋能团”,让端到端大模型从“能用”变得“好用”,推动车企完成从“造车”到“造智能”的跨越,打造了一个全新的,共赢的智驾生态圈。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。