说人话讲清自动驾驶,端到端到底是个啥?(1)

本期视频专业性有点高,适合对智能汽车尤其是自动驾驶感兴趣的朋友们。

如果你看过华为或者车企的新车发布会,在讲到自动驾驶能力时,他们一定会提到“端到端”、“神经网络算法”、“大语言模型”等专业名词,这些词究竟是什么意思?自动驾驶现在到底发展到什么阶段了?哪家实力更强?

这些年我跟不少专家、工程师探讨过,也翻看了大量券商研报,接下来我就尝试用人话给你讲清自动驾驶那些事。因为内容有点多,我们分几期跟大家唠唠。

https://chejiahao.m.autohome.com.cn/info/15720547?v=1719991943033#pvareaid=6834132

首先,需要介绍一下自动驾驶整体上的工作原理,以及这些年技术发展的脉络,这样有助于大家理解各个专业名词。

自动驾驶功能的实现需要硬件和软件共同支持,硬件大家看得见摸得着,包括激光雷达、毫米波雷达、摄像头、高算力芯片等,无论是厂家还是4S店的销售,都愿意大力介绍这些硬件,因为它们能让你错觉这辆车很牛,然后心甘情愿地掏更多钱买单。

但其实,堆硬件说明不了问题,反而很可能是“差生文具多”,自动驾驶能力的高下,更多取决于软件,也就是算法。打个比方,小孩儿虽然视力、记忆力、反应速度都比大人好,但处事能力却差很多,原因就是心智不够成熟,自动驾驶的软件算法正是这个心智。

所以接下来我们着重说说软件算法。通常情况下,自动驾驶算法分为感知、预测、规划控制几个部分,几年前大家采取的是模块化+流水线式的工作模式,雷达和摄像头相当于从外面拍了很多视频回来,交给感知模块识别,认出这是一辆车,那是一个行人,它们的速度位置都是什么,感知模块完成这道工序后,继续交给预测模块去分析;预测模块要搞清这辆车和这个行人接下来要往哪里去,会和我的车发生什么关系,分析好之后再交给规划控制模块去处理;规划控制模块的任务,则是做出驾驶决策,指挥车辆接下来是该调整方向,还是加大油门,还是刹车制动。

简单概括,在传统模块化算法架构下,外部信息输入进来到最终输出成可执行的驾驶指令,需要经过一连串的模块,模块和模块之间泾渭分明,就像流水线上的一个个车间。而上一个车间如何与下一个车间交接工作,必须由人为规定好。

了解了模块化算法的工作模式,就很容易理解它的弊端:第一就是非常依赖规则,条条框框都要写清楚,像做题一样把各种数据套入公式,得出明确的解之后,才能交付给下一个模块进一步处理。这就导致程序员要写海量的代码,同时高精地图也是不可或缺的。

但即便花费了巨大的人力物力成本,也不可能把所有路况都提前标注清楚,一旦出现规则以外的特殊情况,车辆还是不知道该怎么办。

此外,用抽象死板的规则去界定复杂的外部世界,本身就会带来误差,而这些误差又会在模块与模块间的信息传递中,被进一步放大,最终在下游累积,如果你玩过传话的游戏,应该能想象这种差之毫厘谬以千里的结果。同时,模块之间的数据传输和计算都需要花费时间,导致整体算法延时较高,处理紧急场景能力较弱。

上述这些问题对于自动驾驶来说都是非常致命的问题,稍有差池就是车毁人亡,所以必须要对软件算法进行迭代升级,也就有了端到端算法架构的诞生。那下一期视频,我们就来具体说说,什么是“端到端”、“神经网络算法”和“大语言模型”。


继续阅读

相关推荐

评论(0)

还没有评论哦,快来抢沙发
最新评论
    查看全部0条评论
    加载中