12月25日-27日,理想汽车连续三天推出“2024理想 AI Talk”,分享了对人工智能的最新思考,以及包含智能驾驶和理想同学在内的人工智能技术的最新进展,并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机,App已于12月27日全量上线。此外,理想汽车宣布OTA 7.0版本车机系统将于12月底全量推送AD Max用户,新增AI推理可视化、高速端到端等功能,并实现Mind GPT-3o、Mind Diffusion V2.0的能力升级。
理想汽车董事长兼CEO李想表示:“我们在做的理想同学和自动驾驶,通常被视作独立的领域。理想汽车的愿景已升级为“连接物理世界和数字世界,成为全球领先的人工智能企业”,汽车是连接这两个世界的最佳桥梁。
理想同学App是一款人工智能应用,目前具备两大功能:“知识问答”提供多领域的问答能力,包括汽车、出行、财经、科技等领域,并能处理多种文本任务,如撰写文章、翻译和创作文案等;“看世界”依靠视觉感知能力,帮助用户识别菜单、画作、动植物、汽车等上千种通用物品。
从车机进入手机,理想同学从智舱智能助理转变为通用智能助手。从用户需求的角度出发,这是一件顺理成章的事情。很多理想汽车用户的孩子首次接触的人工智能产品就是理想同学,它通过对话帮助孩子们解决各种问题。理想汽车希望让100多万的车主及其家庭成员,不仅在汽车,还可以在手机、电脑,甚至眼镜等穿戴设备上,体验到一致的人工智能产品。其次,从长远角度来看,理想汽车认为,在掌握基座模型的前提下,真正的大模型产品会覆盖所有的设备,能让用户自主使用所有的服务。
理想汽车计划于2025年推出的L3为有监督智能驾驶,不是L2辅助驾驶的延续,而是L4高度自动驾驶的先导程序。辅助驾驶只实现了特定功能,自动驾驶则关乎整体能力。传统的L2辅助驾驶依赖上一代自动驾驶方案,通过预设条件来执行不同场景下的智驾功能,无法穷尽所有的corner case(极端情况)。理想汽车借鉴人类驾驶技能提升的过程,用人工智能的方式做自动驾驶,推出了端到端+VLM的双系统解决方案,利用Scaling Law(规模效应)不断迭代和提升自驾能力,以适应所有可能的驾驶环境。
今年7月底推出端到端智能驾驶的内测版以来,理想汽车以每周更新两个模型版本的频率,致力于在今年将综合MPI(城市+高速平均接管里程)提升至100公里。展望未来两年,还将逐步提升MPI至500公里甚至1000公里以上。为了达到MPI 500公里的目标,预估需要2000万Clips(视频片段),意味着积累50亿公里甚至超百亿公里的数据量。随着端到端+VLM双系统的不断迭代,理想汽车希望在2025年实现L3有监督智能驾驶,并为用户提供一个全场景、一体化端到端的产品。
理想汽车在国内率先取消了角毫米波雷达,转而采用以纯视觉为主的技术路线,但仍然保留了激光雷达,并将其视作“安全带”,与视觉技术配合,以期达到消除所有重大伤亡事故的目标。通过持续的OTA升级,理想汽车为用户提供了行业领先的安全能力,包括全自动紧急转向AES(自动紧急转向)、全速域无上限激活AEB(自动紧急制动)、及城市路口多方向人车混行场景AEB等。
目前,理想汽车超100亿的年研发投入已有接近一半聚焦于人工智能,并建立了四支AI团队,分别解决不同问题。在智能驾驶领域,凭借充足的训练里程和先进的训练算法,加之利用世界模型创建的模拟环境,理想汽车推出了行业首创的端到端+VLM双系统方案。该方案自7月底启动早鸟计划以来,以每周两次的频率迭代更新,在10月底正式全量推送,11月底新增“车位到车位”功能,并将在12月底推出“高速端到端”功能。
在理想同学方面,其搭载了自研的行业首个车载认知大模型Mind GPT。截至目前,该模型已积累10万亿Token的预训练数据,覆盖自动驾驶、对话等场景中特有的多模态数据。在智能商业方面,理想汽车通过大模型技术与商业领域数据和知识的深度结合,构建了一批具备零售、营销、客服、金融、财经分析等能力的AI助手。在智能工业方面,理想汽车通过全栈自研的智能制造系统、视觉算法、设备、质量预测模型等,依托于Li-MOS生产管理系统、连山云端质量预警平台、MESS系统等自研的智能化平台构建起智能制造超级大脑,横向上实现从研发端到交付端的数据闭环,纵向实现多层供应链到整车厂的数据协同。
为了实现AGI,理想汽车发布三阶段的战略路线图。第一阶段称为“增强我的能力”。在这一阶段,理想同学能为用户提供辅助功能,自动驾驶领域实现L3有监督智能驾驶。此时,AI技术已经能显著提升人类的工作效率和便捷性,但AI还无法独立,需要人类来兜底。
第二阶段叫做“成为我的助手”。AI将推进至L4级别的自动驾驶与Agent阶段的理想同学。例如,用户可以简单地指示一辆L4级别的汽车去接孩子,无需亲自在场,车辆就能自行前往学校,通过面部识别技术让孩子安全上车。第三阶段升级为“成为我的硅基家人”,人类不再需要向AI发出任何指令,AI能够延续并运用人类的记忆,自主做出决策,并主动执行多项任务,成为家庭的重要成员。