要做一家全球人工智能企业。
这是理想汽车对人工智能的新思考和新方向,连续三天的2024理想AI Talk也向我们讲述了智能驾驶和理想同学在内的人工智能技术的最新进展。
而就在12月27日,基于自研基座大模型Mind GPT的理想同学从车机进入手机,App全量上线。
一家如日中天的造车新势力也有了自己的新起点。
首先,我们要说的就是与汽车所联系最紧密的智能驾驶。
理想同学和智能驾驶是理想汽车的两大核心AI产品。
理想汽车董事长兼CEO李想表示:“我们在做的理想同学和自动驾驶,通常被视作独立的领域。我们的大语言模型Mind GPT是认知智能,连接数字世界;而自动驾驶被称为空间智能,关乎物理世界。
我们同时在这两个领域探索,并坚信认知智能与空间智能的结合——我们称之为VLA(Vision Language Action Model,视觉语言行动模型)——是一个更值得相信和追求的机遇。”
在这里,李想认为汽车是可以作为和未来智能世界的链接而存在的,理想要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭
这从行业视角来看,汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人,将物理世界和虚拟世界相融合。
接着,就是理想同学App,在我理解和现如今一众的AI大模型APP类似。
理想同学App是一款人工智能应用,目前具备两大功能:“知识问答”提供多领域的问答能力,包括汽车、出行、财经、科技等领域,并能处理多种文本任务,如撰写文章、翻译和创作文案等;“看世界”依靠视觉感知能力,帮助用户识别菜单、画作、动植物、汽车等上千种通用物品。
我们生活中的绝大多时间并不会待在车上,但毫无例外都会与手机相伴,所以为了满足理想汽车100多万的用户,这款收到好评的智舱语音助手也就来到了手机上。
从用户需求的角度出发,这是一件顺理成章的事情。
很多理想汽车用户的孩子首次接触的人工智能产品就是理想同学,它通过对话帮助孩子们解决各种问题,比如画画或写作业等。
目前,大模型技术尚处于发展早期,很多团队仍停留在聊天机器人的初始阶段,所有参与者都有探索未知边界的机会。
L3有监督智能驾驶,不是L2辅助驾驶的延续,而是L4自动驾驶的先导。
在谈话中讲到在自动驾驶的不同阶段,L3为有监督智能驾驶,不是L2辅助驾驶的延续,而是L4高度自动驾驶的先导程序。
辅助驾驶只实现了特定功能,自动驾驶则关乎整体能力。
自7月底推出端到端智能驾驶的内测版以来,理想汽车以每周更新两个模型版本的频率,致力于在今年将综合MPI(城市+高速平均接管里程)提升至100公里。
随着端到端+VLM双系统的不断迭代,理想汽车希望在2025年实现L3有监督智能驾驶,并为用户提供一个全场景、一体化端到端的产品。
理想汽车认为,达到L3的前提是实现“车位到车位”的智能驾驶,这将自动驾驶服务从干道提前到小区车位,解决最先100米和最后100米的挑战。11月底,理想汽车已全球首家全量推送“车位到车位”功能,有效应对了小区道路、环岛、掉头和复杂施工的场景。
此外,理想汽车将在12月底通过OTA 7.0版本车机系统向所有AD Max用户全面推送“高速端到端”和行业首创的“AI推理可视化”功能。
其中,“高速端到端”将实现高速特殊场景NOA不降级、不断点、更连续,使理想汽车成为国内唯一一家、全球第二家将端到端技术应用到高速(及环路)NOA场景的车企。
得益于今年理想汽车在智驾领域的快速进步,截至12月中旬,AD Max销量占比已从2月份的约20%增长至50%以上,30万以上车型AD Max销量占比已超75%。
在技术、产品、环境政策,以及消费者对人工智能信任度到位的前提下,理想汽车有望在三年后推出首款为L4级自动驾驶定义的汽车。在此之前,企业也必须满足3个条件:
500万辆以上规模的车队、掌握VLA基础模型的能力、有足够多的钱去招募最顶级的人才以及足够的算力。
目前,理想汽车超100亿的年研发投入已有接近一半聚焦于人工智能,并建立了四支AI团队,分别解决不同问题。
在理想同学方面,其搭载了自研的行业首个车载认知大模型Mind GPT。截至目前,该模型已积累10万亿Token的预训练数据,覆盖自动驾驶、对话等场景中特有的多模态数据。
自2023年12月发布以来,Mind GPT已迭代30多次,将伴随OTA 7.0进入到第三阶段,即Mind GPT-3o,进一步发展任务助手、认知成长和情感陪伴能力。
与前两代侧重语言模型不同,Mind GPT-3o将通过构建融合感知和认知的多模态端到端大模型能力,大幅降低人机交互延迟。
最后,讲到了理想汽车AGI实现的战略地图。
为了实现AGI,理想汽车发布三阶段的战略路线图。
第一阶段称为“增强我的能力”。在这一阶段,理想同学能为用户提供辅助功能,自动驾驶领域实现L3有监督智能驾驶。
此时,AI技术已经能显著提升人类的工作效率和便捷性,但AI还无法独立,需要人类来兜底。
第二阶段叫做“成为我的助手”。AI将推进至L4级别的自动驾驶与Agent阶段的理想同学。
例如,用户可以简单地指示一辆L4级别的汽车去接孩子,无需亲自在场,车辆就能自行前往学校,通过面部识别技术让孩子安全上车。
在这个阶段,理想同学代表的认知智能,与自动驾驶代表的空间智能,将会结合成一个模型,理想汽车称之为VLA。AI会出现大规模的应用,是真正的iPhone4时刻。
第三阶段升级为“成为我的硅基家人”。人类不再需要向AI发出任何指令。AI能够延续并运用人类的记忆,自主做出决策,并主动执行多项任务,成为家庭的重要成员。硅基家人是AGI的最终产品。
从智能电动车企业升维转型为人工智能企业,未来,理想汽车将始终把用户价值放在第一位,在这一点上,理想汽车始终是将家庭放在第一位。
最后我想说的是,理想汽车这次像是把公司重心完全放在了人工智能这件事情上,AI大模型、智能驾驶、甚至是硅基家人等等。
总结起来就一句话,未来的一切都要靠AI。