今年的上海车展据说有148场发布会,数量相当恐怖。但要我说,最让我感到惊喜的,还属地平线的发布会。
在这场发布会上,重磅信息接连而出,包括但不限于:
• 发布了新一代BPU架构——纳什;
• 官宣了与比亚迪、采埃孚等头部企业的合作。
更让我意外的是这组数据:2022年,中国乘用车市场中标配L2+NOA功能市场里,地平线征程芯片份额达到了49.05%!
这是什么概念?
2022年每卖出两辆具备NOA功能的新车,其中就有一辆搭载了地平线的芯片!
从伯努利、贝叶斯、到如今的纳什,地平线正在用一片片搭载BPU的智驾芯片“征服”市场,并在事实上建立汽车智驾计算的新格局。
地平线是如何做到的?BPU为何能够获得车企们的一致认可?
要解答这个问题,还要从需求端说起。
在智能驾驶方面,中国是事实上的“主战场”:自主车企、海外车企、集成商、软件商,各路英雄豪杰齐聚于此,L2/L2+NOA辅助驾驶、L3/L4自动驾驶、甚至Robotaxi无人驾驶等等,各种智驾路线在这片大地上争相竞逐。
但如果从消费者角度来看,他们最真实的需求是什么?他们最需要的智驾系统又是什么?
是L3/L4自动驾驶甚至无人驾驶的Robotaxi吗?我相信未来一定是,但目前,甚至说近10年内,可能都不会是。
这取决于多方面因素,包括技术、法规、伦理、公众接受度等等。
因此,无论是地平线的CEO余凯、还是比亚迪的董事长王传福,都表达了类似的观点:“无人驾驶离我们还很遥远,辅助驾驶将在很长时间内存在并保持主流地位。”
这里所说的辅助驾驶,不只是说LKA车道居中辅助,只有这种L2基础功能并不能完全满足消费者们的日常需求,它并称不上“够用”。
在我的理解中,真正“好用”的,应该是一套包括LKA、高速NOA、城市NOA、泊车等在内的全场景的高阶辅助驾驶。一定要足够稳定、高效、省心,而且具备合理的成本,具备普适性,让更多的消费者对智驾的能力产生足够的信心,并让更高阶的智驾技术在这一过程中获得长久的验证,从而在未来的某一天,让智驾走向真正的自动化。
这可能会是一个相当漫长的过程。因此,如何在合理的成本下,为消费者提供足够好用且稳定的辅助驾驶体验,将成为绝大多数车企未来几年内的研发主进程。
而这,恰好是地平线BPU的强项。
BPU全称“Brain Processing Unit”,是地平线自研的智能驾驶专用处理器架构。因为是专用架构,BPU在智驾系统的运行效率上有相当大的优势。
例如,微软有一个名为“COCO”的数据集,其中包含了超过30万张图片,常被用来训练模型或者验证不同系统的图片处理能力。
基于贝叶斯架构的征程5芯片,在这个数据集的目标检测测试中,在128TOPS算力的前提下,可以实现1718帧每秒的图像处理速度,在目前已量产的自动驾驶芯片中处于头部水平。与之相比,成本高出数倍、目前端侧理论算力最强的量产GPU在运行同样的测试时,图像处理速度仅为每秒千帧出头。
可以说,正是由于这种高能效、高真实性能的特性,让基于贝叶斯BPU架构的征程5成为了许多车企首发搭载NOA功能的首选。
而在车展上,地平线推出的新一代BPU架构“纳什”,又在效能上再次迎来了跃升。
目前,基于Transformer网络的大模型正成为业界主流研发方向,很多厂商都在尝试把Transformer引入到视觉任务中来,其中ViT,SwinTransformer等都是视觉Transformer的典型代表。但这种模型参数量很大,即便是推理模型,所调取的数据量也非常大,这就对处理器的带宽提出了更高的要求。
因此,在纳什架构中首次采用了三级片上缓存设计,分为L0近存、L1高性能缓存以及L2大容量缓存,不仅大幅提高了片上带宽,优化了高参数量下的性能表现,同时三级缓存与大并发的数据桥相互配合,还可以实现片上不同计算核之间的灵活多向的数据流动,提高了计算效率。
同时,在纳什架构中,还引入了多脉动立方加速引擎和数据排布变换引擎,前者可以使得引擎间数据流动更高能效、低带宽占用;后者则可以更好地应对以Transformer为代表的这种新形态算法对于数据的data layout进行更灵活的更高效的转换需求。
要知道,目前大火的算法无论是BEV还是Occupancy占用网络,均是以Transformer为核心。纳什架构这种针对性的设计,无疑将大大提高智驾模型的性能表现。
但这并非全部。目前,高阶辅助驾驶能力已开始成为部分车企打造壁垒的一种方式,因此“自研”很重要。
但对于很多车企来说,现在开始自研,困难重重。大量的资金投入是肯定的,同时还不可避免地将面临“踩坑”和“重复造轮子”等情况。
基于这种现状,地平线作为“最懂算法的计算提供商”,选择通过多种开放灵活的模式帮助客户更快开发。
首先,在本次发布会上地平线推出了专门服务于智能驾驶专业开发者,面向量产、生态协同共建的嵌入式应用开发套件——踏歌(TogetheROS™·Auto),通过多模块协同开发,解决行业多供应商协同开发的困难,可将开发、集成、验证效率提升200%,让合作伙伴更高效地利用地平线开发的算法,基础设施和算力。
同时,地平线还推出了天工开物算法工具链、包含训练、测试、管理一条龙在内的艾迪开发平台等开发工具,可以帮助客户实现快速开发和部署。
在避免“重复造轮子”方面,地平线则是直接提供了“参考算法开发加速包”,其中不乏主干网络Swin-Transformer、BEV时序多任务感知算法Bev_mt_ipm_temporal等SOTA算法,大幅降低了算法开发门槛,加速产品原型的开发与迭代。
更关键的一点是,得益于越来愈多的车企选择地平线,有越来越多来自不同厂商的智驾方案运行在相同的征程芯片上。地平线作为上游,可以根据不同算法在征程芯片上的运行表现,并针对行业的显著趋势进行优化。
例如前面提到的MScoco数据集测试成绩,目前征程5已达到1718帧每秒,而在前不久,这一数字还是1531帧每秒。
短短几个月的时间,在芯片本身没有变化的前提下,实现了如此大的性能提升,正是因为地平线针对场景和需求,将一些算子进行整合或者独立封装,优化了编译器,让编译器在部署过程中获得最佳性能。
高效能、高性价比、高开发效率,无疑可以大大提高智能驾驶的量产和普及速度,帮助车企更快抢占市场。这也是为什么,地平线征程5能够获得理想、比亚迪、广汽埃安、上汽集团、一汽红旗等众多车企量产定点的原因。
在会后的专访环节上,地平线联合创始人、CTO黄畅博士向电动知士介绍到,基于纳什架构的BPU芯片,算力相比征程5可提升数倍。同时,该架构具备“可伸缩”的能力,也就是可以根据需求,调整芯片的规模,把算力控制在几十TOPS,从而控制成本。
他还表示,基于纳什架构,在征程5芯片相当的晶体管规模下,可以进一步提升性能同时降低成本。
这又带给了我无限的遐想!
人们常说,IT行业是每年“发布一代、研发一代、预研一代”,芯片行业也是如此,但研发周期又要长得多。
例如贝叶斯架构IP核概念设计于2019年,在2020年完成了设计,并在2021年实现了一次性流片成功。这次发布的纳什架构则是早在2021年就开始了规划,并且经过两年的时间才完成了IP核的设计。
可见,芯片的研发要在项目初期就对行业的需求和技术发展有足够的判断,否则就会与市场需求脱节。
显然,此次发布的“纳什”架构就是地平线对行业发展的一次精准判断,目前的主流技术和研发方向统统命中。
更高效的BPU架构加上“可伸缩”的能力,意味着地平线将来极有可能基于纳什架构推出不止一款新品,其中既可以有算力增长数倍的“豪宅”,面向更高阶的智能驾驶;还可以有算力为100~200TOPS的“经济适用房”,以更低的成本面向主流乘用车市场。
符合当下需求,满足未来趋势,这就是地平线BPU的最大优势!
正如前文所述,中国NOA车型中,征程芯片的市占率已经达到了惊人的数字,而这次发布会上,地平线又官宣了与比亚迪和采埃孚的深度合作,都基于征程5。
前者是全球领先的新能源汽车品牌,后者则是全球领先的Tier1之一,毫无疑问,地平线征程系列芯片的出货量又将迎来一次“跃升”,将重构智驾芯片市场格局。从CPU到GPU,从PC到智能手机到云计算,正如黄畅博士所言,一个时代有一个时代的计算架构,面向全新智驾机器人时代,地平线BPU凭借对场景的洞察和针对性设计,正加速成为智能驾驶时代计算终局之选。