在汽车圈,关于智能驾驶的未来,到底是纯视觉方案还是融合感知方案的讨论,一直没有终止过。目前行业内智能驾驶解决方案主要分为两种:

一种是激光雷达为基础的多传感器融合感知方案,这是目前包括蔚小理在内的大多数汽车品牌所采用的策略。
另外一种就是特斯拉坚持的纯视觉方案,目前小鹏汽车也在往纯视觉方案的方向走。

目前似乎有越来越多的人认为,视觉方案符合第一性原理,才是智能驾驶的未来,因为人类开车,也是靠着眼镜获取信息,然后经过大脑处理,按照这个思路,智能驾驶也是只需要摄像头捕捉信息然后处理就行了,但是对此,自动驾驶技术公司 Waymo 前 CEO 约翰 · 克拉夫奇克(John Krafcik)却并不认同,并认为特斯拉坚守的纯视觉方案完全不可靠,就跟重度近视眼一样。

在 CES 2026 期间,克拉夫奇克毫不客气地指出了特斯拉纯视觉方案的局限:
人眼的视觉能力远远强于一辆只配备 7 个 500 万像素摄像头的汽车,而且这些相机只有一个是标准焦距,其余全是广角镜头。如此一来,这 500 万像素就被分散使用了,等效视觉清晰度只有 20/60 或 20/70。这种配置下,车上的其他摄像头甚至无法通过车管所(DMV)的视力测试。
他认为,特斯拉多年前移除雷达、超声波传感器并拒绝使用激光雷达的做法,等同于“给自己的 AI 戴上镣铐”,系统只能在更嘈杂、可靠性更低的数据源中提取重点,而 Waymo、Zoox 却用了更丰富、更稳定的传感器融合数据。

克拉夫奇克补充道:“激光雷达可提供完全不同的主动感知方式,用来弥补摄像头这种被动感知,这才是真正的‘超人级’能力。相比之下,一辆重度近视、该戴眼镜却不戴且只能在有限数据中运行的车,能力自然十分受限”。

克拉夫奇克的观点,其实主要就是驳斥,将视觉方案的摄像头,比喻成人类驾驶者眼睛的说法,他认为,7个500万像素的摄像头,无论是清晰度,还是焦距范围都无法和眼睛相提并论,人的眼睛是一台像素高达5.76亿的超级相机,虽然人眼有视觉盲点(,但大脑会自动 “脑补” 填补;同时通过眼球快速转动(扫视),把中央凹对准不同区域,再由大脑合成完整的 “高清全景”,这是相机无法比拟的动态优势。而特斯拉的7个摄像头,6个都是广角摄像头,这也意味着,他们在看远处的物体时,清晰度会打折扣,就像人的近视眼一样。

虽然克拉夫奇克这么说,但是看一个人的言论,得看他的立场,他所在的Waymo公司,采用的方案就是融合方案,结合激光雷达、摄像头和毫米波雷达,所以他这么说,肯定是很正常的。
虽然也有有着融合方案和视觉方案的争论,但是个人认为,视觉方案和融合方案,不是非黑即白的,不是非得二选一的,为什么不可以在常规情况下,采用视觉方案,而在天气恶劣的情况下,多使用激光雷达呢?

奔驰也提出了新的方案,那就是不要激光雷达,采用高清摄像头和先进的4D毫米波雷达相结合的方案,大幅降低整体硬件成本的同时,实现接近激光雷达的性能水平。总之,智能驾驶技术还在发展之中,视觉方案和融合方案之争,还没有到盖棺定论的时候,真正的“最优解”,也许不是谁干掉谁,而是谁能率先把优势拧成一股绳。
老司机侃侃车
评论(0)