2024一整年,从市场角度看,汽车的智驾属性完成了某种蜕变,即从重要产品力(如果不是核心的话),变成普及产品力。最晚到2026年,如果10万元以上的新车,没有任何智驾能力,将变得比较奇怪。
考虑到2024年平均车价已经到16.8万元,智驾从少数品牌之间博弈的“高端俱乐部”,正在变成多数产品搭载,只花了一年的时间,可谓神速。这一年,到底发生了什么。
简单说,高阶智驾的路径已经收敛到同一条路径上来,百花齐放变成一枝独秀。供应链随之打通,中阶、基础智驾有关的BOM成本、算法开发成本已经降到足够低,具备了某种程度的普及条件。
这里面其实包含了两条进化路径,但两者到底有没有因果关系,很难讲。我们只能描述一下现实,剩下的要交给读者判断。
智驾商业化,分为三条路线
什么叫高阶、中阶、基础智驾,其实也没有严格的界限。基础智驾,姑且认为就是L2辅助驾驶,对算力的要求很小(3~4Tops)。能够实现十几种特定场景下的单一功能(比如车道保持、变道辅助、碰撞预警之类)。有人提出的传感器简单(比如4环视摄像头+1前向摄像头+1毫米波雷达组合)并不是区分标准,原因稍后会提到。
中阶智驾,则要在封闭的结构化道路上实现L2+辅助驾驶。这个“+”号意味着智驾域控支持,功能不再是孤立的,而是能够实现跨场景独立行驶,当然,所有的L2都需要驾驶员随时介入,不管带几个加号。这就对传感器和算力提出更高的要求,比如多个朝向的摄像头+多个毫米波雷达+超声波雷达组合,对算力的要求提升到几十Tops。
而高阶智驾则明确要求适应复杂城市道路上有监督独立驾驶,就是常说的“城区领航”,接管次数没有明确要求,但肯定是越少越好。这种情况下,对外界感知要求进一步提升,十几个摄像头+3、5个毫米波雷达+激光雷达,成为标配。要求跨域智控,算力需求增加到100Tops以上,越高越好。
“端到端”一统高阶智驾技术路线
从2023年,由特斯拉带动,对高阶智驾的路线形成共识,即“端到端”。端到端也没有准确定义。大体上,以往的感知、规划、决策、执行等功能模块,合成一体,由感知直接“生成”决策和执行,就是端到端。这些流程形成统一大模型,本质上追求信息传递过程低损耗。无须程序员对所有场景提前编好应对方案,而指望系统基于经验库找到最优答案。因为以前的经典规控方式,很容易发现长尾场景层出不穷,代码根本写不完。
因为这类系统思考方式,不可观也不可控,因此有企业不放心,将其分为两块,即将感知和规控拆成两个模块,中间嵌入人工接口。前者就叫“一段式”端到端,后者称为“两段式”端到端。
“两段式”的好处,避免了感知模块输出的“不可观”。代价是感知白盒过滤输出,损失了信息。实际操作中,不管两段还是一段,车企都不放心,无一例外都设计了兜底规则,比如不能闯红灯之类。
这样,高阶智驾,就从规则和预案部署,变成了从模型中生成决策。这就很像人类学习驾驶的过程。
虽然端到端体量也就是中模型,在一枚Orin-X上就能跑起来,但是训练必须要用大模型和大量有效数据。训练样本的数量和质量,决定了决策优劣,也决定了系统迭代速度。
追求“一段式”的比如特斯拉、理想、小米、元戎启行、商汤等。而“两段式”的有小鹏、极氪、鸿蒙智行等。还有些企业没宣布到底是哪种,但总体印象是“两段式”多于“一段式”。
有必要说明的是,激光雷达和高精图的运用,与是否为端到端没关系。但是,有一些企业,尝试去掉这两样,实现轻图城市NOA。实际操作不存在彻底的“无图”,因为多少都会有人工标记和校正。降低软硬件成本的目的,就是让智驾延伸到十几万元的产品中去。
采取低成本硬件但属于高阶智驾的产品,都运用了端到端+某种VLM(视觉语言模型)。VLM其实也是个大模型。它的作用是从图景(交通场景)和文本(交通标识)中生成文本。即图文到文本。生成的文本,能帮助端到端模型理解场景意义。
打个比方,VLM相当于端到端的副驾教练。当端到端决策有问题的时候,VLM可以提供建议。很大程度上,VLM是基于交通规则的逻辑来思考的。双系统有矛盾的时候听谁的,可能不是像航空那样的表决系统,多数时候端到端为主,参考VLM建议;有些时候,VLM的建议具有决定性(比如约束违背交通语义规则的行为)。这依赖于更复杂的博弈机制。
简版城区智驾普及,大厂不能忍
这一年来的高端智驾的竞争态势,让消费者开始认同,中高端产品如果不能搭载高阶智驾,产品力评价要降低一大截,可能影响消费决策。
与此同时,有些品牌开始尝试推纯视觉+轻图城市NOA,并将摄像头组合也减少到比较简单的程度。降低硬件成本目的,是为了在十几万元产品上部署城市NOA。虽然这样在某些场景内(比如雨雪天气、光线不佳的时段),可能相比配备激光雷达和复杂摄像头组合的传感器,端到端决策的表现,可能要稍差一点。但也能保证城区智驾基本体验(可能在接管次数和运用场景上受到限制)。这也是刚才提到的,为什么传感器复杂度不能界定智驾等级的原因。
目前搭载简化版城区NOA的十几万元产品卖的还不错,很多传统大厂因此坐不住了。他们可能认为,还不急于参与高阶智驾方案的争夺,因为端到端迭代到现在仍不够成熟,不足以在高端消费决策中起到一锤定音的效果。
但城区NOA部署到十几万元车上是另一回事。现在技术已经走通了,市场也接受了。这些产品与只具基础智驾或者完全没有智驾的产品,形成了代际差异。智驾在十几万元产品消费决策权重,远高于30、40万元产品的决策权重,严重动摇了最大细分市场的产品力标准。
比亚迪、奇瑞都在2024年晚些时候提出了2025年“智驾平权”。这两个2024年国内乘用车销量排在前二的品牌,无法接受在这一细分市场丧失产品力定义权。
比亚迪和奇瑞貌似采取了相似的路线,即自研和与华为合作并行的方式。其实长安、长城、吉利都有类似的并行策略,但上升到“平权”高度的,目前就是这两个企业。
比亚迪和奇瑞都列出时间表,主张将“轻量级”端到端部署到十几万元的市场。鉴于这两位在业内的影响力,高速NOA将在一年多一点的时间内实现在A级产品上的普及。城区NOA将在两年内实现在A级产品上普及。
华为是权变因子
不同的地方在于,奇瑞还拿出一块试验田来和华为共同做(智界),而比亚迪则将华为按到供应商的位置上(方程豹)。
即便大家都声称有全栈自研这条线,但是,也不可能脱离供应商提供的技术方案。供应商又不会跳出来纠正甲方。在真实的供应链中,尤其是技术含量高的,供应商的技术并非即插即用,装备后自动生效。
即便供应商的方案已经比较成熟,也需要甲乙双方各自拿出团队对接、联合办公,甚至联合二次开发。所谓自研和采购,其实界限有点模糊。说是谁的技术,可能根据谁投入资源更多,或者谁更需要“开发方”这顶帽子。
这个时候,大厂更喜欢只干活不抢镜的供应商,比如Momenta、地平线、元戎启行、商汤科技等。都是典型的ToB思维,对ToC宣传不感兴趣。但是华为不一样,主机厂需要以很大的胸怀来容忍华为到处指手画脚,将自己的企业文化凌驾于合作方之上。
上汽、广汽都在2021年左右拒绝了华为。不止因为报价和主导权的问题,而是敏感到,华为作为供应商“不安分”。当然,他们都误判了华为在智驾这条线发展高度。
华为从来不是单纯的智驾方案供应商,而是有能力提供建立在芯片、算力、云、ICT网络基础上的全能技术栈。大模型训练需要的三块资源:算力、数据、算法,华为曾经三据其二(缺数据),现在全都有了。
过去几年,有95%的Top30车企选择租用华为云。华为云声称服务了300多个汽车行业用户。这就暗示着,如果基于大模型训练这条路的竞争一直走下去,而英伟达的算力卡、微软的云服务、OpenAI的大模型供应始终存在障碍,华为的优势位置只会强化,不会削弱。
鉴于地缘政治的当前局面在未来几年没有破局的可能,从市场角度,智驾就将演变成两大势力的竞合局面:一方是华为牵头的几家主机厂(以引望为平台合作机制),另一方是主机厂+供应商(算法、芯片、工具链、智驾方案、传感器)。
显然,有些企业,比如刚才提到的奇瑞、比亚迪,也包括吃回头草的上汽广汽,在两边同时下注,这就让智驾商业竞争局面变得更复杂。与智驾技术竞争局面的逐渐清朗,形成鲜明对比。
评论(0)