一位年仅31岁的公司创始人,在驾驶蔚来汽车时候,因车祸死亡。车主的亲属在讣告中提及,在启用自动驾驶功能(NOP领航状态)后,车辆在沈海高速涵江段发生交通事故。这则讣告引发了轩然大波,尽管并不清楚蔚来的NOP是否存在失灵等状况,进而影响了行驶安全,但是针对于蔚来自动驾驶的挞伐已经纷至沓来。除了批评一些新兴造车企业过分夸大现阶段智能驾驶的功能,将辅助智能驾驶在宣传中宣传为“自动驾驶”,这使得消费者产生不恰当的信赖。
目前,可量产的智能驾驶最高等级为L3级别,这是一个专业的划分方式——从阶段划分来看还属于辅助驾驶阶段。小鹏汽车汽车副总裁、互联网中心负责人纪宇在今年的一次讲话中指出,在小鹏看来,目前量产车中,还没有一家企业做到真正的L3。但横向来看,一些车企,通过设置定语研发车了L2.5级自动驾驶,限定场景下的L4自动驾驶等,都使智能驾驶的分级变得更加模糊,消费者对此产生了不恰当的理解。
比如,一位理想汽车的车主直接在车内躺平,而车还在高速路上行驶中。为了欺瞒车辆,其还在方向盘上使用压力钳——按照目前的法律,双手是不能脱离方向,因而车辆也设置了报警系统。这使得理想赶紧在官微中发布声明,称理想ONE所提供的是辅助驾驶功能而不是自动驾驶,请车主们正确使用,安全驾驶,珍爱生命。
而另一方面,由此引发了对自动驾驶深层次的讨论。这包括自动驾驶的技术路线,智能驾驶的事故责任划分。这也引发了新兴造车企业大佬纷纷表态,威马汽车创始人沈晖针对责任主体的表态是:1. L2级别辅助驾驶功能,驾驶员是功能操作主体,也是责任主体。2. L4以上级别自动驾驶功能,车内无人状态下,操作主体是车辆本身,责任主体当归属主机厂。3. 威马L4级别无人驾驶功能,当时经过了N轮内部决策会议,最终选择了高频停车场景的原因,就在于相对封闭的环境、相对低速的状态,安全性更高。
而理想汽车创始人李想则呼吁媒体和行业机构统一自动驾驶的中文名称的标准,比如L2和L3什么的用户听不懂,都是专业话术。建议采用统一名称,比如L2=辅助驾驶,L3=自动辅助驾驶,L4=自动驾驶,L5=无人驾驶。一个多余的中文字也不要有,避免夸张的宣传造成用户使用的误解。在推广上克制,在技术上投入,对用户、行业、企业都长期有利。蔚来尽管在产品介绍中,强调了辅助驾驶的界定,但这并没有为消费者重视。
李想的表态正是本文题目的意思,尽管用杀人来形容被夸大的智能驾驶有些过——上一次说自动驾驶杀人的是华为的苏箐(华为自动驾驶一把手,后文会写到)已经被调离岗位,华为对其言论表达了不认可的态度。但实际上,不成熟的技术确实变相造成了人员伤害。此外,同时还有一个老话题:自动驾驶的最高级别——无人驾驶(L5)是否真的实现?
对此,持悲观态度大有人在,有人甚至指出,“不要用自己的生命来为自动驾驶续写代码。”这并不是无知者的无知见解,实际上,一些业内的专家对此已经持续的发表过看法。
01
领军企业放弃背后:知难而退?
从行业来看,智能驾驶行业的工程师经常谈论L5级的自动驾驶。在这一级别下,民众可以在任何天气下进入一辆车,告知自己的目的地,智能驾驶汽车将把他们送到指定地点。但在2018年,谷歌旗下的著名无人驾驶公司Waymo首席执行官克拉克公开对外表示:“L5其实是不合理的期望,它其实上没有必要,因为我们很少从旧金山开车到智利的圣地亚哥,我们不会做这样的事情。”
全球最大的汽车集团大众汽车自动驾驶部门首席执行官亚历克斯·希辛格(Alex Hitzinger)在2020年的也针对于此发表了几乎一样的表态,他认为“L5级全自动驾驶也许永远都不会实现。”但是他对大众制造L4级自动驾驶汽车的能力很有信心,他说即将到来的IDBuzz电动货车将是第一辆应用这项技术的大众汽车。今年7月,作为中国自动驾驶代表性公司华为的华为智能驾驶产品线总裁、首席架构师苏箐在一次论坛上也同样判断“L5级别自动驾驶永远不可能达到。”
而一位AI从业者对明镜pro表示,智能驾驶最多只能做到辅助人驾驶,因为安全性的问题永远解决不了。这是因为,L5级别自动驾驶的定义是在任何时间、任何地点、全天候覆盖应对所有场景——一些从业人员认为,在这个要求下没有一位人类司机都做到,机器更无法做到。同样是在2020年,沃尔沃表示,该公司也正放弃追求汽车实现完全自动驾驶的激进目标,重新定位对自动驾驶技术发展的看法。
L5无法实现的判断是基于使用场景的无穷性和计算的有限性之间无法调和的矛盾。
“目前自动驾驶的难点主要在于感知和决策规划,纯视觉的路线基本上game over了,虽然以后,算力会越来越大,越来越便宜可以实时跑更复杂的神经网络模型,但是,这些模型,或者视觉这种手段本身就很有局限性,并且,训练成本也高,受环境影响大,造成基本不可能达到商用级别的鲁棒性;而现实道路的复杂性,和真实世界近乎无穷无尽的变化,是很难利用有限的数学模型(神经网络模型)完全拟合出来的。”一位分析人士指出。
几乎可以这么说,除了特斯拉之外,没有任何一家汽车厂商采用纯图像识别的方案,采用的方案都大同小异,就是大家看到的车顶上顶了个雷达的方案。
当然可以通过一些技术手段,来解决视觉问题,比如锁定搜索区域,借助V2X 5g车联网等帮助,但是这已经不是一个纯视觉的问题了。更难的是决策规划,这属于自动驾驶的深水区,已知的可能只有google开始触及这个深度。决策规划简单来说就是人在驾车的时候,会实时的做出很多决策和预测,很多经验判断,做一些潜意识逻辑思考,目前深度学习也好,传统的方案也好,都没办法做到人类思考,推理,类比,联想的思考能力。
“你的决策规划模块很难为每一种特殊场景都去写一个if - else判断,这样的情况在现实中几乎无穷无尽;此外还有,看到路边的小动物是否减速,听到警车或者救护车的警笛是否停车避让,跟渣土车保持距离,甚至车上的乘客有异样,是自动驾驶到最近的医院还是派出所等等,难道全部写成if-else判断么?”上述分析人士指出。
举例来说,路上一个风吹上去的塑料袋,或者一大堆飘落的树叶,雷达,或者视觉看来就是一个障碍物,可能要停车或者做紧急避让,但是,人就会认识这个东西,直接开过去,或者,目前经常会遇到的,一个小水洼,或者阴影,视觉可能错误认为是障碍物,当然,这个时候可能雷达告诉你这里能通行,这个时候,你的环境融合建模逻辑怎么写呢?是更相信雷达,还是视觉?是走是停?
事实上,这次蔚来汽车事故的出现,可能也是与车辆无法判断静止物体而引发的灾难性结果。有媒体援引事故驾驶员的朋友透露,当时林文钦驾驶蔚来ES8在沈海高速福建莆田界涵江段上行驶,并开启蔚来自动辅助驾驶系统NOP,可能因为该系统无法识别前面正在低速行驶的路政车辆,导致蔚来ES8追尾前车。根据网友拍到的现场照片来看,ES8的右前方严重受损,右前翼子板直接撞进驾驶舱,车辆发动机盖大面积被掀起。已经看不出车辆A柱,顶棚也陷入车内,驾驶员位车门变形严重,两前轮受损。
02
现阶段不适合工程化和商业化
“实际上这并不是图像识别的模型不行,而是模型没有办法覆盖到所有的情况,实际上工程师也不可能预料到公路上可能出现的所有情况,既然如此我们就不能保证系统一定一定是安全的。”工程师指出。
而上面提到的这些问题目前几乎看不到存在能够良好的,彻底的解决的工程化方法。可能的方法是依赖大数据,收集非常非常多的驾驶经验数据,通过云端大数据来进行判断,这相当于我们拥有一个全世界优秀司机的经验池,自动驾驶汽车完全不必理解这些行为的原因,只需根据场景进行最合理的引用。这实际上也就是车路协同,纯车端智能遇到的各种瓶颈,靠智慧的道路去突破,车端智能的局限靠智慧的城市智慧的道路去弥补。
比如,目前到处存在的监控摄像头,以及可以畅享的未来可能出现的更加多种多样的布设在道路,城市的传感器,可以帮车辆提前并且更大范围,更加准确的感知周围的环境,通过更加实时的网络将信息发送到车端;路上车辆相互之间可以自组网,互相告知大家自己位置和行驶状态,相互协同,前车为后车分享经验,比如前面可能出现的拥堵,或者避开维修的路段等;数据中心将协调车流,这样像目前过十字路口,环岛等难题也会变得非常简单;
当然这是一个非常美好的憧憬;那么你可能也意识到了,要做到这个程度可能比目前最乐观的自动驾驶落地时间还要久远的多,所需要的投入也是天量的。这意味着,我们几乎要翻新整个城市交通的基础设施,变更整个城市的设计建造思路;中间可能还会遇到目前难以想像的技术和工程难题,全都需要时间和巨大的投入去解决。
还有一种思路是让车躲避一切可能的碰撞。目前依靠多种雷达的组合,利用目前已知的技术手段,基本上是可以做到检测出车辆周围几乎所有可能构成危险的障碍物的,一些企业采用了最简单的逻辑判断,不管是树叶,还是行人,车辆全都躲开,利用算力强大的计算机,做到天下武功为快不破。事实上这种设计应该是已经存在了,用来躲避潜在的外来撞击,以及不去主动撞击别人。
但是无人驾驶上路终究还是需要与其他车辆存在一定的互动,并且这种互动必须是遵循交通规则,而具体到规则实现,规则遵守运用,就又回到上面的提出的行为决策的问题了。一些公司的无人驾驶基本没有听说有撞车发生的,但会表现的很傻,尤其是通过路口的时候,过于谨慎;(特斯拉的设计非常激进,不用激光雷达,只有一个毫米波和一些摄像头,并且看上去决策规划模块的驾驶策略设计也比较激进,所以总是撞)。
“我们在享受自动或者是辅助驾驶的便利时也需要时刻保持安全警惕,技术的迭代和升级是需要代价的,一个产品从实验室里诞生之初一定不可能覆盖到所有的case,谁也不能保证你不会遇到系统意料之外的突发情况,所以一定要小心,享受科技,但也别过度相信科技。”有行业从业人员着重指出。
所以,总结下来就是感知能力有限,不具有真正意义上的思考和判断能力;其实这也是目前所有人工智能的局限所在。真正能大规模应用的,能让人完全放开手脚的无人驾驶在目前这个阶段很可能并不是一个很好的商业尝试。或者说通用无人驾驶技术(注意是排除了限定场景的通用无人驾驶)现阶段不适合工程化和商业化。
03
5-10年内泡沫破灭
根据以往的经验,能够大规模铺开,大规模商用的东西,必然能够较为容易的利用现有的技术和工业基础,首先进行工程化,然后,通过大规模的工业化生产压低成本,进而广泛应用,并且创造利润。而能够工业化生产的前提是,技术本身已经完整的走完了三个准备阶段:
1. 理论突破,就是一件事情,科学家很早的就从理论上预见,并且证明了其可行性。
2. 技术突破,这一阶段基本上是在研究机构以非常精英化专业化的团队突破了技术实现上的壁垒,做出达到或者接近理论预期的Demo样品;
3. 工程化,主要解决产品设计,方案优化,功能完备,性能提升,良品率,鲁棒性,可用性提升,大规模复制的技术准备,成本降低等工程问题。
比如手机,无线通信相关的理论和尝试大概100年前就开始了,然后,三元电池大概80年代做出目前的原型,低功耗芯片也基本在90年代就出现了,其他的射频,组网之类理论和技术储备也都有好几十年的历史。从理论到概念设想到成品经历了相当漫长的时间。事实上,目前能看到的工业化,工程化的高科技产品,大规模集成电路,OLED,量子点,其对应的理论和技术储备从实验室走向实用通常都会经历20年甚至更长的时间。
“在任何其他领域的工程师熟练的运用着成熟的方法进行着产品开发的时候,只有无人驾驶工程师们成天紧紧盯着行业顶级会议,知名期刊上发表的所谓最新进展在干活,我甚至看到某大厂招聘无人驾驶相关工程师明确要求要熟知各种state of the art的研究最好发过顶刊,投过顶会,简直有点可笑。”有人士指出。
正常来说,工程领域更倾向于成熟稳健经过实践,经过产品检验的方案,而这些在无人驾驶恰恰是不存在的。最关键的,人家的理论从最开始就能清楚的证明,这些产品要达到一个什么样的性能,在技术上是一定可以实现的;而通用无人驾驶,实际上,在第一,第二阶段都还没有完全走完的情况下,就在资本的驱动下直接进入了第三阶段;
目前没有理论证明,前面提到的问题是能够完备的解决的,这涉及回答目前的人工智能,机器学习技术(包括但不限于深度神经网络)所能达到的能力极限。或者更明确的,能够证明通用无人驾驶所需要的智能程度是在目前已知技术的能力边界内的。通用无人驾驶所需要的在各种真实世界复杂场景下,全面超过人类的驾驶能力和行为能力。不过,在低速跑个园区,跑个仓库这种限定场景目前很多方案都是可以的。
通用无人驾驶最好还是老老实实待在大学或者研究机构里面,进行基础性工作的探索,当基本理论,技术,能力积累到一定程度的时候,工程化,商业化落地就是自然而然的事情了。而投资无人驾驶的人,目前其实都是在赌博,都在赌目前欠缺的这一点理论,技术的突破在近期就能突然冒出来,当然存在这种可能性,但是,这种突破也可能姗姗来迟到几十年之后,这都是未知的。
未来,甚至都用不了10年,最多5年之内,如果还是突破不了目前的瓶颈,投资就会大规模撤出这一个领域,也就是无人驾驶凉凉的那一天。但是这并不意味着无人驾驶技术研究的终结这条道路还会持续前进,只是会作为基础性工作而探索,直到能够通用化的一天。想起一句话,无人驾驶的难度比登上火星还难。这大概说明了这场商业竞争面临着什么。
参考资料:
1、自动驾驶技术-环境感知篇:V2X技术的介绍
2、自动驾驶网络系列四:我们谈自动驾驶网络到底在谈什么?
3、为什么不能完全相信自动驾驶?
4、自动驾驶什么时候才会凉凉,估计还要多久?