长城智驾“补课”,端到端大模型量产上车

钛媒体APP
13:19

魏牌蓝山智驾版

过去几年,有关“智驾”的标签更多地与新势力车企紧密捆绑,小鹏、华为、理想等很多新品牌都纷纷在智驾领域发力,目的就是想要在新能源时代率先占领用户心智。

相比之下,传统车企的声量就显得小了很多,但实际上他们完全没有在这个时代躺平,以长城为代表的车企也正暗自蓄力,试图在智驾这场角逐中扳回一城。

今年以来,长城汽车总裁魏建军分别在保定和重庆进行了关于智驾的直播测试,作为企业的一把手,不仅亲自下场,还拉上了技术部门的诸多同时来为自家最新的智驾技术代言。

客观来讲,如果把时间拉回到一年以前,长城汽车的智驾在行业内还普遍没有太多存在感,应用在量产车当中的L2+级辅助驾驶产品,也大都是来自供应商的成熟方案。

直到今年4月份,长城发布了SEE一体化智驾的技术架构,核心目标就是为了应对L2+的辅助驾驶由高速走向城市场景。在这样的架构下,它在传统分段式算法模块的基础上进行了优化,采用了一体化大模型来解决更多场景的决策问题,但同时也有人工规则在里面。

从技术路线来看,目前长城汽车的SEE模型已经不是传统的基于规则决策和规划,而是带着人工智能决策的一体化大模型,所以它对于避障能力展现了一定老司机的水平,相较于之前靠几千人的团队来针对每一个场景去打补丁的笨方式,效率实现了很大程度的提升。

那么如今经过整个集团的大力研发投入后,长城的智驾水平究竟进化到了什么水平?

以下为近日长城汽车智能化副总裁吴会肖、智能平台开发中心的高级总监姜海鹏、智能平台开发中心的专家吴国苏州等与媒体沟通的对话实录,略经钛媒体App编辑。

Q:长城目前的智驾能力跟其它品牌相比在什么水平?

姜海鹏:首先说自身的优势,从去年下半年城市NOA开始,华为也好、小鹏也好,非常感谢这两家头部企业。原来我们预判城市NOA在2025年落地,恰恰由于咱们国内头部在非常深入的推广,起初是有图的,后来逐步演化成大模型无图架构,正因为它们相对激进的推动教育了我们用户,也把城市NOA推向智驾最热门的场景。

今年我们在CES期间深度试驾了特斯拉,回国以后对所有开通智驾功能的车型都深度做了一些评测和试驾,我觉得我们目前的状态不输于任何一家,如果非要排个名的话我认为我们在前三的水准,有没有任何吹牛的成分。

Q:如何看待目前行业主流的端到端大模型技术路线?

姜海鹏:现在几乎每一个算法公司或者主机厂都在讲端到端大模型,我可以负责任的告诉大家,现在真正全球搞端到端的,已经按照端到端架构去做的不超过三家,而且即使在端到端架构之下,内部也嵌入了很多规则的安全问题。因为端到端本身不是说去年或者今年特斯拉才提出这个概念,一开始做自动驾驶的时候大家就知道一定有模型化,只不过那会能力不够,模型不够、芯片不行、数据量不够。

所以,先把感知模型化,模型进一步模型化,慢慢推到决策这一端。原来没有模型的时候我们靠规则去做,后来发现一进城,如果我们还按照规则去做的话,没有办法满足城市这种场景需求。如果无限制的往上堆代码,可能一个自动驾驶没有3000人没有5000人写不好城市规则,即使写了以后有一个变动你也很难解决。所以走到今天大家已经很清楚的知道我们必须用数据驱动跑起来,才能降低人员代码的数量,降低成本,否则是不能成立的。

Q:车企对端到端感觉比较乐观,还是有一些不确定性,长城怎么看待规避风险?

姜海鹏:端到端一定是未来,但不是终点,现在还有更超前的东西,真正智能驾驶终点一定像人一样有思考,对场景有理解,基于对场景有理解基础之上做智驾的动作。

举一个简单例子,我们在开车的时候前面有一个黑色塑料袋,如果两边有车没有办法绕它,我们人一定会压过去,因为我知道这是一个软体,我可以碾压它,第一是不会出事故,第二不会对我车辆造成伤害。现在不一样,没有办法知道前面是个软体,只知道是障碍物,要么刹车要么避让。

未来自动驾驶一定是对场景理解之下的自动驾驶,我们也在做这方面的预案和开发。现在有一些基础,首先从芯片角度,像英伟达的Thor,包括我们据了解国内一些大厂芯片公司也朝着这方面定义自己的芯片,你们要支持类似于大语言模型运行芯片。从模型角度,有我们所谓的语言模型,类似open AI,支持我们做一些理解,然后做一个感知做一个综合判断,这方面才是将来的终局。

端到端就是当前基于自动驾驶本身的一套技术逻辑,从感知这个模型化到融合模型化,最后到规模模型化是分段的。因为人越来越懒,做开发尤其做软件代码做算法,极其烧脑袋的工作,他们要想自己的工作变得更简单怎么办,搞AI的同学特别烦碰代码,因为他们觉得写代码太浪费我的时间了,所以他们极其有自驱力,我要把代码转化成模型,一旦成了模型以后云端自己适应,所以端到端我们认为就是一个技术发展阶段,但不是智能驾驶的终点。

Q:长城SEE架构2.0,为何同时保留模块化端到端和完全端到端的各自特性?

吴国苏州:这两种都是理念,真正的完全端到端不是说没有规则来兜底的,但完全端到端的好处就是你数据从头到尾人驾驶的轨迹和特性学出来,以当前的技术状态谁也没办法训练一个完全端到端的东西,所有场景都能开,还有一个模块化端到端的东西,它中间还有感知的接口。

比如有车道线有类似障碍物,模块化端到端最大的好处是模型好训练,但又没有完全端到端的优势,所以把这两块结合起来。说白了跑两个模型,两个模型是独立的,算力要求就加倍,需要设计数据共享和交换的机制,这也是模型做起来比较难的一个点,最后还会有相应的仲裁机制,来确定什么场景下我相信某一个模型出口需要的能力,这样的话无缝把这些场景结合起来。

Q:长城智驾具体的开城策略是根据什么来决定的?

姜海鹏:开城其实逻辑很简单,把我们蓝山销量TOP20的城市做了一下排序,卖得最好的是重庆、成都等,这四个城市走完以后有个优势,不同类型各占一类。重庆是山城,路况确实复杂,成都是典型的拥堵场景代表,城市车道非常窄,而且车流量巨大,每个车道都有公交车道,都有待行区。深圳是典型的高新城市代表,跟上海很类似。保定就是二三线城市的代表,所以每个城市代表一类城市,我们把几个城市泛化以后到其它城市也会事半功倍。

我们非常羡慕蔚小理推广的方式,因为它世面上已经有车通过OTA给到用户功能,不是从零开始,现在已经有0.5,再加0.5变成1。我们目前市面上没有车,只能从一开始销售的时候带这个功能,这是两种不同的方式。

Q:长城汽车的城市NOA推进过程中面临过哪些调整?

吴会肖:大规模普及在2025年,我们去年判断节点是2024年上半年。后来跟整车协同,包括在开放过程中对这个模型架构上做了一些调整,然后在落地过程中我们也发现整个行业里面都会面临和用户接受人机共驾的阶段。蓝山智驾版上市就会有这个功能,上车OTA之后交互会有一些优化和调整。

Q:长城智能驾驶研发团队目前在什么规模?

吴会肖:之前老板跟我说过,管着一千多人,有驾驶的有TST的,驾驶这边人员不是未来的正确方向,基于更大模型场景理解的开发方式,实际上以后会越来越少的依赖于工程投流和人海战术,未来一定是用更加高质量、高密度、高人才梯队,再加上我们基础设施。

Q:如何看待智能驾驶中激光雷达的作用?

姜海鹏:激光雷达解决的就是1%,车企要不要为1%花几千块钱钱,我们认为就是要花,我们公司不是说没有降成本的需求,品牌那块和老板那块一直说能不能降一些成本,我们还在坚持不能降,这1%恰恰是跟安全相关的。所以激光雷达最近一两年我们不准备干掉,还是要保证安全底线。

Q:长城汽车智能驾驶车型落地智驾的顺序?

吴会肖:目前蓝山智驾版上搭载的为Coffee Pilot Ultra,此外还有max和pro,我们也要看用户的需求,有一些用户觉得这个情况下用起来有顾虑,再去决定是整个推进高速NOA还是城市NOA。

Q:消费者什么时候能真金白银为智驾这件事买单?

吴会肖:我的观点是商业是最大的慈善,你的车一定得能正向运营才能把你的企业和产业链,维持正向持续的健康发展,不能强买强卖。第一点你先把产品做好,你做好了之后你替用户解决了很多问题,他花这个钱觉得值。我们企业内部也需要做很多工作,流程、IT系统、支付通道都要搭建好,其实行业都经历过这个过程。

无论是智驾还是座舱都得把体验做上去,基于未来商业模式健康闭环,从组织和技术链上要先把路铺好,等你真正把体验做上去了用户也愿意买单,切切实实让用户享受到技术的便利,他觉得这个钱我花得值自然而然愿意付费。

今年车企很卷,软件行业都在亏损,我觉得我们整个国家包括我个人都要学会为什么样的价值付费,我们为吃饭付钱为穿衣付钱为房子付钱,是不是愿意为音乐付费、知识产权付费,整个社会都要努力。

Q:为什么明年是智驾行业的元年?

吴国苏州:可以从四个方面来看。

第一是算法的进化,我们很多年前干智驾,就觉得智驾干好第一是要把感知干好,感知看不到的东西后面没办法触及。后来感知水平提高了说虽然有感知但没有认知,我们今天讲认知就是智能驾驶系统对场景的理解。从以前来看这是非常难的,我们也做过无数的探索,但今天的语言模型和视觉语言这些技术,让我们有了一种宏观场景进行认知方面技术的抓手。这个模型想搬上车不是说照搬直接拿来用,这是不可能的。至少从技术上看是这种手段,智能驾驶大模型可能也能解决零样本或者稀有样本的能力,这是算法方面。

第二是算力方面,今天所有干高端自动驾驶的,除了国内华为有自己的芯片,确实是遥遥领先以外,剩下的都是英伟达的芯片,实际上它的核心设计师在2019年就设计完成了,中间是跳票。所以一直在迁就四年前的英伟达芯片架构。而实际上芯片明年都会有一个很重要的迭代,无论是英伟达还是国产大算力芯片都会出来,算法把它步上车。

第三是数据方面,随着这么多年大家无论是传统主机厂还是新势力,或多或少都开始积累了一定全量的智能驾驶数据,当数据量积累到一定程度以后,反过来为训练大模型产生了量变到质变的可能性。

最后就是认知方面。以前相信自动驾驶的、不相信自动驾驶的分两派,大家都认为数据驱动是未来,那数据驱动有一个好处,现在百公里接管一次,假设每年优化10倍,大家对这件事情都有信心和认知,这个认知一是反过来推动大家对技术上的投入,其次是对法律法规和伦理道德配套软性的东西产生间接性影响,这个点快要到了。

Q:如何看待特斯拉FSD进入中国,长城等国内的智驾技术相比特斯拉有哪些优势?

吴会肖:辅助驾驶里面特斯拉一直在引领,我们也在美国看了它的表现,只能说有挑战,一来特别好短期内也很难实现。美国道路和中国道路差异挺大,美国人车混行非常少,我们在旧金山街头体验的时候,如果有人的话对驾驶员还是有比较大的干扰,一旦有了很多数据进去,基于端到端大模型开发模式肯定让它有一个比较快的提升。(本文首发于钛媒体App,作者|李玉鹏,编辑|张敏)

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法