新浪新闻客户端

踩准大模型发展节奏 自动驾驶正在迎来ChatGPT时刻

踩准大模型发展节奏 自动驾驶正在迎来ChatGPT时刻
2023年06月21日 16:25

  最近,马斯克在推特上的一番话又成了车圈的热议话题。

  据 Electrek报道,通用汽车CEO玛丽博拉在一场演讲中,对马斯克公开表达了赞扬,并且称马斯克是电动汽车领域的领军者。马斯克非常开心,转发了推特并表示:特斯拉一直致力于帮助其他车企。几年前我们开放了我们的专利,现在又开始共享超充网络。同时我们也很愿意授权Autopilot或FSD给其他车企使用,当然特斯拉的任何技术都可以。

  看起来是马斯克一时之快的豪情壮语,但倘若这是马斯克密谋已久的想法?汽车行业将发生怎样的变化?

  马斯克接受CNBC的采访时表示,ChatGPT是一个语言大模型,但是它的内核其实已经有了AGI通用人工智能的影子。目前,特斯拉FSD以及底层逻辑、感知、规控执行算法都与其Optimus人形机器人相同,其本质也是在向AGI通用人工智能进化的过程。

  所以,马斯克认为自动驾驶的ChatGPT时刻正在到来。

  大模型,正在彻底改变自动驾驶

  在自动驾驶领域,特斯拉是绝对的领军者。

  过去几年,自动驾驶一直有两大路线之争。分别是以特斯拉为首的渐进式路线,以及以Waymo为首的一步到位达成L4级自动驾驶的跨越式路线。

  然而这段时间,争议逐渐减弱。事实证明,自动驾驶是一项复杂的系统性工程,研发的前提是需要足够的、源源不断的资金支持。融资,只解近渴。去年以来,有许多中美自动驾驶出现资金告急的情况,中国的这些科技公司也是迅速抓住机会,转型做智驾解决方案供应商,力争上车机会。

  所以,时间已经证明,渐进式的自动驾驶发展才是有效可行的路线。而随着智能驾驶从低阶走向高阶,从高速走向城市,场景变得越来越复杂,传统的方案,逐个击破 Corner case 的办法无法解决所有问题,长尾场景依然存在。

  在这样的背景下,大模型开始受到行业热捧。大模型具有良好的认知和推理功能,作为人工智能最先落地的应用领域之一,自动驾驶有望得到全面助力。开源证券指出,AI大模型的加速发展将缩短自动驾驶开发进程,进一步推动产业成熟。

  而自动驾驶行业,率先拥抱大模型的公司有两家,一家是特斯拉、另一家则是中国的毫末智行。在技术路线上,毫末在2021年初就开始探索将Transformer大模型技术运用到自动驾驶产品中,也是国内首家研发落地BEV感知技术的自动驾驶公司。

  另外这两家公司还有一个共同点:重感知。

  在上个月举办的特斯拉股东大会上,马斯克公布了FSD的最近进展:在股东大会10天前,马斯克曾发布推特称特斯拉将发布FSD Beta V11.4版本,该版本将采用端到端的人工智能技术,而马斯克本人也表示V11.4版本实际上便是V12版本。

  这里面有个重点:端到端。端到端是深度学习领域的概念,指的是AI模型的端到端一体化,特斯拉FSD的端到端技术实际上就是利用了这样一个大模型来做到感知决策一体化。

  成果是什么呢?马斯克表示,在未来,特斯拉相信FSD的安全性将远远超过人类驾驶员,达到10倍的安全性水平。这是一个非常重要的里程碑。通过软件更新,数百万辆车可以从需要人工干预转向完全自动驾驶,这是车队资产的历史性增值。

  端到端,正在成为自动驾驶玩家的另一条技术路线选择!而特斯拉,正在成为落地这一技术路线的排头兵。

  实际上,端到端并不是自动驾驶领域独有的说法,其本身是深度学习的一个概念,指的是一个AI模型,与此前大火的ChatGPT类似;而特斯拉FSD的端到端技术实际上就是利用了这样一个大模型来做到感知决策一体化。

  AI,或者说大模型,能够彻底改变自动驾驶,乃至整个汽车行业的游戏规则。

  部署大模型,毫末踩准了节奏

  ChatGPT最近很火,这是大家都知道的事情。但本质上,火的仍然是背后的大模型。自谷歌2017年提出基于Attention注意力机制的全新人工智能模型框架Transformer,然后特斯拉拿去做了自动驾驶,而毫末智行从2021年6月开始跟进这条技术路线,是中国自动驾驶公司中,第一个踏上这条赛道的。

  当然提到大模型就离不开数据和算力,算力是支撑算法与数据的基础,算力能否满足人工智能的训练与推理需求,直接影响人工智能的发展进程。当前,高性能计算网络内部数据交换时间比计算时间长,计算性能受到数据交换性能的限制,其光通信设备、光模组和光器件急需升级和扩容。本质上,特斯拉能够取得领先,也与其数据驱动的核心战略有关。

  毫末从成立之初就定下了“以数据驱动自动驾驶技术升级”的公司技术战略,在今年4月的第八届毫末AI DAY 上,毫末基于GPT大模型所具有的生成式、预训练、人类反馈强化学习等技术优势,将五大模型进行统一升级,发布了行业首个自动驾驶生成式大模型DriveGPT 雪湖·海若。

  横向对比行业其他玩家会发现,头部玩家都开始在发布会上提及大模型。不仅仅是智能驾驶,许多人车企甚至会在智能座舱上部署大模型,为用户提供更智能的交互。

  对于大模型,虽然行业里还仍有零碎的质疑声音,但头部玩家已经争先研发、部署,大模型就是大势所趋。

  2017年,大神AK(Andrej Karpathy)从Open AI加入特斯拉,5年多时间里,AK曾在各种行业会议等场合,描绘出了特斯拉的智能驾驶要素:大模型、大数据、大计算中心。

  在上周末的2023北京智源大会上,毫末智行CEO顾维灏发表了一番演讲,其中有一段很有道理:自动驾驶我们做了20几年,到现在大家还没有把它商业化,很有可能是技术路线的问题。如果ChatGPT、DriveGPT的方法在自动驾驶里面是走得通的,我认为它也将重塑整个智能化的一套技术路线,能够让自动驾驶更快地到来。大模型,GPT的方法加速了汽车智能化的到来。

  另外,中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强也有类似观点:「人工智能在感知、处理数据方面已经得到很好的应用,AI大模型在处理文本、获取和加工数据、建立场景的训练和迭代方面的优势,将会对人机交互智能化和智能驾驶方面起到加速推动作用,大模型的出现会在智能驾驶领域起到非常积极的作用。」

  自动驾驶变成服务? 企业们开“卷”大模型

  过去,自动驾驶无法商业化,可能是受限于硬件、受限于算力,也有可能是方式不对。但是GPT这样的生成式大模型,能够推动智能化发展。

  回到开头谈到的问题,马斯克会将FSD作为服务,开放给其他车企吗?这个问题的答案只有马斯克知道。但是我们可以设想一下,如果FSD上马非特斯拉车辆,这就意味着特斯拉将多一个“智驾方案供应商”的title。

  如今自动驾驶技术的竞赛早已不仅局限于基础的硬件堆叠。相反,数据的积累已经成为各家最为珍贵的“秘密武器”。在当前高精地图方案难以持续推进的前提下,或许唯有通过大规模真实数据积累的方式驱动,才能对当前国内复杂的路况进行更好的应对。毫末智行DriveGPT的到来,无疑为国内自动驾驶技术的竞争开辟了一条新赛道。

  截至目前,搭载毫末智能驾驶功能车辆的真实用户行驶里程已经超过了5000万公里。随着智能驾驶走入城市,数据量越来越大,智驾供应商可以通过提供完善的工具链帮助整车厂构建自己的自动驾驶算法和数据闭环系统,同时依靠大模型的数据生成能力缩小在数据领域的差距,去帮助车企打造强大的智驾功能。这也是智驾供应商相较于自研车企的最大优势之一。

  在这个世界上,有的人因为看见而相信,有的人则因为相信而看得更远。在自动驾驶研发端,特斯拉和毫末这样的企业,总是抢先别人一步实践最前沿技术,而事后的行业发展又证明,他们的思路总是对的。

  在特斯拉和毫末相继发力大模型之后,理想汽车计划在今年底,基于和ChatGPT同源的Transformer大模型,落地不依赖高精地图的城市领航辅助驾驶(城市NOA)。

  在上周末的理想家庭科技日上,理想更是推出了Mind GPT,用大模型重新塑造理想同学。理想汽车空间算法负责人陈伟表示,早在他们成立空间算法团队之初,就搭建了一个基于大模型训练的数据平台和训练平台。该团队还考虑到了多模态数据的需求,包括语音、视觉和文本等多种形式。升级后的理想同学拥有多模态感知、多模态交互能力。

  可以说,在下个阶段,“卷”智能化,更多就是“卷” AI 能力。

  而为了提速智能化研发,号称今年三季度推出“全自动驾驶XNGP”的小鹏汽车开始和百度云推进合作,并被曝出正在申请注册“XMARTGPT”“XPGPT”“XGPT”等商标。

  如今在大模型、大算力、海量数据的催化下,自动驾驶的ChatGPT时刻正在到来,哪些企业又将在这轮“内卷”中脱颖而出,让我们拭目以待。

  (来源:看头条网)

责任编辑:孙青扬

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2023 SINA Corporation

All Rights Reserved 新浪公司 版权所有