李想扔掉了旧世界的地图,划出具身智能上下半场

李想——中国造车势力当中专注、聚焦、高效的代名词,要做具身智能,要做AI,要做机器人。
“能不能先做成丰田那样再说?”有人诘问。
用旧世界的地图,找不到新大陆。当汽车正在变身自动驾驶机器人,丰田大众不革自己的命,就要被别人革命。
那么,新世界该如何成为胜利者?没人知道。
前往未知地带探索的人们都知道,没有路书,自己就是路书。
李想的路书是怎样的?
“自动驾驶是具身智能的上半场,通用人形机器人是具身智能的下半场。”
5月13日,李想再度做客《罗永浩的十字路口》,提出了自己的判断。相当于也回应了行业疑问:自动驾驶汽车和通用人形机器人,不是并列关系,而是递进关系。上半场在自动驾驶领域积累的感知、决策和控制等核心技术,将直接成为下半场的技术底座。
李想也说:“理想汽车做AI,不是冒险。不做才是冒险。”
当然,为了这次冒险,李想和理想汽车,已经做了充足准备。
01
具身智能第一车:全新理想L9 Livis
5月15日,全新一代理想L9正式发布,全国统一零售价45.98万-50.98万元。50.98万元的高配版本叫Livis——如同钢铁侠的Jarvis,喻示着它拥有智能,可以主动地服务用户。

全新理想L9 Livis
也可以说,全新理想L9 Livis是“具身智能第一车”。
为什么这么说?
李想对具身智能的定义是这样的:
“物理世界里所有的机器,给了它传感器、模型和芯片,也就是眼睛、大脑和心脏,让它能够自主工作,这就是具身智能。”
按照这一定义,全新理想L9 Livis达标吗?
先说眼睛。全新理想L9 Livis的感知系统从2D ViT进化到3D ViT——不是简单地“看得更远”,而是“像人一样感知三维世界”。过去2D视觉看世界是平面的,现在3D ViT真正理解空间位置关系。这依赖理想自研的马赫M100芯片——全球首个基于数据流架构的车规级5纳米芯片,可以通过编译器灵活定义视频编码器和计算模块,而非受制于第三方芯片写死的黑盒子。
其次说大脑。全新理想L9 Livis搭载马赫VLA模型,不只执行指令,更能做主决策判断并主动服务。传统智驾模型是“模仿学习”——你教它该怎么开,它照着做;马赫VLA是“理解学习”——它真正理解你在什么场景、想要什么,主动帮你做好。
2025年8月VLA司机大模型随理想i8首次交付时,它已经能实现“驾驶意图理解及风险预判”。2026年3月发布的MindVLA-o1升级版,则会让自动驾驶“看得更远、想得更深、行得更稳、进化更快、部署更高效”。
马赫VLA模型计算量较上一代提升10倍,通过3D ViT感知模型和多模态思考模型的协同,成为24小时待命的专属司机——不只把你从A点送到B点,而是在路上就开始帮你处理事情。
再说心脏。全新理想L9 Livis搭载两颗马赫M100芯片,合计2560 TOPS有效算力,是国际顶尖芯片的3倍以上。传统芯片“算力足够但架构不匹配”的瓶颈,被理想用芯片-模型联合设计(co-design)打破了。这也意味着,全新理想L9 Livis不是一辆“诞生即巅峰”的车,而是一个会持续进化的生命体。

最后是手脚。“完全体”线控底盘和800V主动悬架,共同构成了全新理想L9 Livis的“手脚”。线控底盘包括线控转向、后轮转向和EMB线控机械制动——模型可以直接输出控制转向和制动,响应速度比人快一倍。人类从看到障碍物到踩刹车执行到位大概350-400毫秒,全新理想L9 Livis全系统从感知到执行降到200多毫秒,刹车距离能差出一个全尺寸SUV的车长。800V主动悬架取消传统机械防倾杆,四轮独立控制,毫秒级响应——遇到坑洼主动伸长,遇到凸起主动收缩,转弯时主动抵消车身侧倾。

一辆车同时具备了看得懂世界的眼睛、能思考决策的大脑、提供强大算力的心脏、反应超越人类的手脚。这就是具身智能从概念走向现实的一次完整验证。
全新理想L9 Livis,也因此成为真正意义上的“具身智能第一车”。
更为重要的是,在如今火热的具身智能大探索中,从产业规模和技术成熟度来看,汽车恰恰是具身智能当前更大、更成熟的商业化载体。
李想在和罗永浩对谈时就表示,仅仅是L2级辅助驾驶,在中国已经是几千亿的市场。
而自动驾驶市场成型之后,将在全球形成5万亿美金的市场。
02
造机器人需要分几步?
这个问题,李想已经想了很多年。
2015年创办理想汽车时,李想就问自己:汽车的终极形态是什么?答案是——机器人。过去十年,理想汽车一步步朝着这个方向推进:从让车“能听、能看、能交流”,到让车从工具变成生活场景,再到今天让车成为能够识别你、理解你、主动服务你的智能体。
这套演进逻辑,被李想定义为“上下半场”。
上半场是自动驾驶的三个阶段。
第一阶段(2018-2023年)是L2辅助驾驶,车辆在特定场景下辅助驾驶员操作。关键特征是CNN 2D视觉、规则算法、MCU控制器、算力100TOPS以内——相当于赋予AI眼睛,让它能看见世界。
第二阶段(2023-2028年)是L3自动驾驶,车辆在更多场景下接管驾驶任务。关键特征是2D ViT、预训练模型(模仿学习)、端到端控制、约2000TOPS算力。
第三阶段(2028-2033年)是L4高度自动驾驶,车辆能够在绝大多数场景下完全自主驾驶。关键特征是3D ViT、稳定的预训练模型(理解学习)、全线控系统、近10000TOPS算力。
李想认为,当前中国汽车产业正处于迈入第二阶段的关键跨越期。而L4实现那天,汽车就真正成了机器人。
下半场则是通用人形机器人的三个阶段。
李想借用人类的年龄,来比拟其能力的分野。
第一阶段(2030-2035年)具备相当于6岁儿童的泛化能力——能执行简单任务,但需要大量人工干预。
第二阶段(2035-2040年)达到12岁水平——具备更复杂的推理和操作能力。
第三阶段(2040年至AGI实现前后)具备18岁成人水平——接近通用人工智能。

李想希望理想汽车的最终产品具备司机、管家、助理那样的能力
“这是一个15到20年的过程。”李想说。通用人形机器人将于2030年前后进入市场初期,相当于2015年的电动车——一个从0到1的历史性窗口。
上下半场的连接关系非常清楚:上半场积累的感知、模型、芯片、操作系统、执行机构等核心技术,直接成为下半场的技术底座。这也是为什么机器人公司要从自动驾驶公司挖人——能力可以直接迁移。
因此,理想汽车布局了五大核心技术自研,既为上半场提供“武器弹药”,也为下半场奠定基础。
这五大技术包括——感知(眼睛):3D ViT感知模型。模型(大脑):马赫VLA模型。算力(心脏):马赫M100芯片。控制(手脚):“完全体”线控底盘+800V主动悬架。操作系统(神经系统):星环OS。
五大技术不是一蹴而就,而是逐渐补齐——2021年自研感知系统量产上车;2022年芯片、操作系统、底盘三大核心项目同时立项;2023年大模型研发启动——这些投入正在逐一结出成果。
为了匹配具身智能的产品研发,理想汽车业对研发体系做了一次迭代,从按软硬件功能划分,转变为按照“造硅基人”的方式重构。
2026年年初,理想汽车的研发划分成了四个体系——脏器系统(芯片+数据集+操作系统)、脑系统(感知+模型+infra)、软件本体(Agent+工具链)、硬件本体(机器人硬件)——各自独立但协同打通。变革成效已经显现:智驾模型训练迭代周期从两周缩短至一天。
造机器人,尤其是具备通用人工智能的机器人,究竟需要几步?只有在它被造出来之后,人们才能完美的总结其步骤。在实现之前,如同“把大象装进冰箱需要几步”的问题一样,我们无需纠结大象能不能被放进冰箱,而是朝着既定的目标,分步骤坚定前行。
03
每一步都算数
有一位访谈者曾经问李想,如果资源是无限的,会自研、自产哪些东西?
李想给出了自己的答案,但特别补充说,“要先讲一个前提:资源永远是有限的,没有人有无限资源。”
回望理想的历程,很多人觉得“变化太快”——从理想ONE专注1款车,再到L系列“套娃出击”;从单押增程到油电双能;从造车再到具身智能。

理想L9 Livis的内饰依旧追求居家般的松弛感
外界看来似乎是没有战略定力,但对于资源有限的新造车势力,从0开始,面对最终目标,必须有短期的商业成功,同时坚持研发投入,一步步打怪升级,才能挑战最终的大boss。
用任正非的话说,一边“多产粮食”,一边“增加土地肥力”。
理想ONE的商业成功,让理想汽车可以再次出牌,让L系列大卖;增程系列的商业成功,才让理想汽车撑到电池技术提升、充电网络普及和消费者接受,同时推出纯电产品;汽车业务的成功,才让理想有资源投入操作系统自研、模型自研、芯片自研这些投入巨大的研发项目。
其实,理想汽车的成功,也是中国新能源汽车产业的一个缩影,正是抢先电动化,中国车企赢得了一个超车机会,同时大胆结合智能化,融合创新。不仅在国内市场,中国品牌已经占据主流。而且在全球出口市场,中国汽车也在攻城略地。欧美日汽车大厂在震惊之余,承认并追赶中国的步伐。
但行步至此,中国汽车是学习丰田大众,将产能布局全球,以规模、品质、品牌优势,重演一遍为全球市场造车的剧本吗?
再来看理想汽车的选择。

李想做客《罗永浩的十字路口》时的发言
李想的原话是:“理想汽车做AI,不是冒险。不做才是冒险。”
他的逻辑很清晰:未来3到5年中高端汽车的竞争,就是具身智能的竞争。芯片和模型是技术制高点,就像人类的大脑和心脏——心脏提供血液和氧气供给大脑进行能量和计算,这样的联合设计至关重要。到了具身智能时代,汽车产业的竞争格局将被改写:技术制高点是芯片+模型,体验实现层是软件本体+硬件本体。
对于中国汽车行业而言,利用电动化+智能化+中国制造的优势,替代丰田大众的角色,固然有机会。但在具身智能时代,中国车企能否成为将来的保时捷、BBA呢?
因此,当李想定义“自动驾驶是具身智能的上半场,通用人形机器人是具身智能的下半场”时,他做的不仅是对理想的战略定位,对于中国汽车产业也应该有所启发。
汽车行业的固有认知是:汽车是交通工具,核心竞争力是制造、工艺、供应链。但当电动化和智能化浪潮来袭,这一认知正在被彻底改写——汽车不再是交通工具,而是拥有大脑、心脏、眼睛和手脚的“机器人”。
理想汽车率先定义了具身智能的上下半场,并用自研核心技术、高研发投入引领时代。这不是一款产品的升级,而是汽车产品定义方式的变革。
旧的地图已经失效。新的路书,正在书写。
邱, 锴俊