黑天鹅与灰犀牛齐飞,新技术与新产业共生。从上世纪末第一款产品亮相至今,自动驾驶技术经历了快速而多元的发展,终于走到了今天。
算力方面,21世纪初,自动驾驶还在靠笨重的计算机提供终端算力;而今天,英伟达、Mobileye已经将终端芯片算力提升至了1000 TOPS以上。
算法方面,20世纪末,自动驾驶还在依靠简单的人工规则进行少量固定场景内的有限规控;而今天,基于深度神经网络的大算法模型,已将AI推入了自主学习的时代。
硬件方面,高昂的感知硬件成本一度让自动驾驶技术长期停滞于实验阶段;而今天,感知硬件性能的大幅提升与成本的大幅下降已让诸多自动驾驶技术实现了规模化量产。
自动驾驶技术的不断进步,在促成更多自动驾驶产品落地的同时,也带来更多有关技术发展路线的争议,这又让我们对自动驾驶的未来产生了新的疑问:
在算力、算法、硬件升级之后,自动驾驶的下一个阶段又将是什么?
“以数据驱动的自动驾驶3.0时代已经到来,只有感知、认知、模式、数据4个技术条件并行成立才能称为真正进入自动驾驶新时代。我们所做的一切,都是为了能够做出数据通道和计算中心,以便可以更高效地获取数据,并把数据转化为知识。”
以上这一段话,出自毫末智行CEO顾维灏之口。在刚刚结束的第六届HAOMO AI DAY上,顾维灏像往常一样,分享了现阶段毫末自动驾驶技术研发的新观点和新思路。
但有一点不同的是,驱动这些新观点与新技术发酵的,并非来源于毫末智行自动驾驶需求,而是来源于后者对自动驾驶技术发展的思考。
俗话说得好,不想做将军的厨子不是好士兵,而在毫末智行看来,不想做学术研究的自动驾驶企业,最终肯定也搞不好自动驾驶技术。
换句话说,想要炒好自动驾驶这盘菜,就要对材料、火候、步骤了如指掌。而当下浮躁的自动驾驶行业,又显然缺乏“静下心来好好研究”的动力。
所以在这样的背景之下,毫末智行究竟研究出了一张怎样的菜谱呢?
从第一性原理到自动驾驶3.0时代
在之前的HAOMO AI DAY中,毫末智行重点提到了一个哲学概念“第一性原理”。基于对第一性原理的思考及运用,毫末智行得以发现驱动自动驾驶迭代的关键,并最终推出了数据智能体系MANA。
作为诞生于2000多年前的哲学概念,第一性原理自然不可能直接给毫末智行打开“捷径”,但确实又给困惑中的毫末智行指明了方向。
第一性原理强调,世间万物的发展都建立在其各自的基石假设之上,这也是驱动万物发展的本质;只要找到属于自动驾驶的基石假设,就能在其基础上建立并推动自动驾驶发展。
那么自动驾驶发展至今,驱动其快速发展的究竟是什么呢?
让我们不妨先回到自动驾驶发展的最初阶段。在2004年,美国DARPA面向社会举办了第一届自动驾驶技术大赛。但在第一届比赛中,没有一家参赛车队能够完赛。
经过事后分析,行业内普遍认为,这是因为当时的自动驾驶硬件性能太低所导致的。果然在2005年第二代大赛中,得益于硬件性能的提升,很快便有车队从一众选手中脱颖而出,拿到了主办方提供的丰厚奖金。
在这一阶段,自动驾驶技术所包括的感知硬件、计算机与感知算法刚刚得到确立,但总体来看,感知硬件依旧是自动驾驶如何在复杂环境下实现视觉感知的最大短板,所以硬件性能成为了这一阶段自动驾驶技术的发展重点。
这就是顾维灏口中的自动驾驶1.0时代。
显而易见的是,对比曾经捉襟见肘的硬件性能,如今自动驾驶技术可用的感知硬件可谓五花八门,包括激光雷达、毫米波雷达、感应波雷达、摄像头等硬件设备种类多样,性能选择也高低皆有,足够满足从L2到L4各类辅助驾驶及自动驾驶的需求。
由此来看,硬件自然不是驱动自动驾驶迭代的关键。而在此之后,自动驾驶发展又迎来了顾维灏口中的自动驾驶2.0时代。
在2.0时代中,自动驾驶终于可以通过性能优良的感知硬件“看”清世界了,但在感知之后如何进行决策规控,则又带来了有关自动驾驶算法的进化。
谷歌Waymo与特斯拉是自动驾驶2.0时代中的主角,基于跨越式与渐进式路线,二者各自选择了完全不同的发展道路,但结果也显而易见:
特斯拉FSD已经实现了高速域和城市域场景的打通,车队规模很快就将达到百万级;而在无数轮融资后,谷歌Waymo依旧没能走出电子栅栏,商业化运营进程缓慢。
究其原因,马斯克搬出了他对第一性原理的理解:成本与速度是自动驾驶技术研发及迭代的关键,而核心就在于这一过程中,自动驾驶企业所获取到的数据。
谷歌Waymo与特斯拉自动驾驶算法都基于深度学习而来,而这种当下公认的自动驾驶算法的迭代核心,就是AI自己训练自己,即AI通过数据进行学习,由此实现不断进化。
在这一过程中,数据量越大越好,数据量获取与学习速度越快越好,并且获取数据的成本越低越好。
谷歌Waymo虽然在自动驾驶竞争中“起了个大早”,但由于有限的量产车队限制了数据获取量、获取速度与获取成本,终究还是“赶了个晚集”。这也得以让我们从中得到一条关键信息:
在硬件与软件达标后,数据将成为驱动自动驾驶发展的核心,而数据量越大、数据获取成本越低、数据学习速度越快,自动驾驶就能更快完成数据闭环,实现自动驾驶技术的指数级发展。
这就是顾维灏口中的自动驾驶3.0时代,而对于包括毫末智行的所有自动驾驶企业来说,这也是即将步入的一个全新时代。
为数据解绑,打通数据驱动的高速公路
对于如今的毫末智行来说,自动驾驶3.0时代似乎还为时尚早,毕竟顾维灏也表示,数据驱动的自动驾驶3.0时代需要至少1亿公里以上的数据支撑,而如今毫末智行的辅助驾驶累计行驶里程,才刚刚突破1700万公里。
不过,“未雨绸缪”本就是毫末智行的优势,除了能快速领悟出“数据驱动自动驾驶迭代”的发展核心外,强大的规模化量产实力也能帮助毫末智行在数据获取上快速达到目标。
在此之前,毫末智行已经针对城市场景,对数据智能体系MANA进行了大幅升级,具体表现在对具有Attiontion机制的Transformer大模型的运用,不仅让自动标注及训练效率大幅提升,也让融合感知的鲁棒性与泛化性有了更好的表现。
但就像一条高速公路一样,Transformer大模型赋予了海量数据多车道畅行的条件,而标注与训练也终将成为造成高速拥堵的“收费站”与“检查站”。
所以长久来看,如果想真正释放海量数据带来的迭代优势,就必须降低“收费站”与“检查站”的监督与限制,让高速公路通畅起来;而数据也不能因为“收费站”与“检查站”的放水而白白流失,AI需要学会从海量数据中直接抓取,进行训练与学习。
这便是此次HAOMO AI DAY上重点提出的其中两条技术思路,即建立无数据标注的自监督学习能力,彻底发挥海量数据的数量优势,让自动驾驶真正实现“指数级升级”;另外,为了防止有价值的新数据被存量数据稀释,毫末智行也提出建立增量式学习训练平台,保证对新数据的运用,及整体数据集的有效混合。
提升对海量数据的应用能力与效率,核心是要让自动驾驶能够认识并构建出更真实的感知世界,并在此基础上,让认知能力持续提升,尽快达到“老司机”的标准。
对此,毫末智行又提出了四条新观点,首先便是借助Transformer在时序以及Attiontion方面的优势,构建具有时序特征下、能够对诸如车道线、障碍物等物体有更准确识别与判断能力的实时虚拟场景。
在过去多模态感知融合过程中,由于算法模型本身的融合能力有限,经常会出来类似于多摄像头的某特征信息没有拼接好、视觉与雷达感知没能实现同步的情况。
经过之前的“感知智能升级”,数据智能体系MANA已经达成了对搭建更准确感知世界的优化,而这一次则是借Transformer再次优化了一次。
而继之前对红绿灯识别做出升级外,对城市场景内更多交互接口的识别也纳入了此次的升级范围里,例如车辆的刹车灯、倒车灯与转向指示灯——作为为人类设计的交互接口,自动驾驶实际并不能对其进行感知交互,但既然要取代人类驾驶,那么“融入人类”就显得格外重要。
其次则是在“认知智能升级”的基础上再升级。此前毫末智行的做法是,借助预训练大模型,对有价值的数据进行筛选、标注并训练,但训练对象却是各类以场景划分的小模型。
而这次,毫末智行则将训练对象升级为统一的大模型,即毫末智行的自动驾驶场景库,所有原本零碎场景的小决策都将基于一个统一连贯的大决策,如此既能避免机械、生硬的辅助驾驶行驶表现,让自动驾驶决策更像人的同时,也能让这一决策变得更有可解释性。
在借助海量数据提升对真实世界的感知后,还有针对仿真世界的提升,而在所有城市场景中,十字路口的变量最大、仿真难度最高。
对此,毫末智行则是选择与阿里以及德清政府合作,利用路端设备将路口每时每刻的交通流都记录下来,以此对仿真世界中的十字路口场景进行调校。由于真实场景获取的数据数量及类型非常丰富,所以这对数据智能体系MANA的认知能力也会起到很大的帮助。
最后则是海量数据对庞大算力的需求。早在去年年底,毫末智行就宣布了建立超算中心的计划,而此次HAOMO AI DAY上,毫末智行则更新了超算中心的新进度,后者不仅能满足千亿级参数,同时还能大幅降低训练成本。这不得不让人为其有朝一日的满负荷运营充满期待。
3.0时代后,才是自动驾驶正赛开始时
作为自动驾驶3.0时代的核心,数据驱动自动驾驶迭代、建立数据闭环将成为所有自动驾驶企业能否生存下来的关键,越早领悟到这一点,就越有可能从竞争中活下来,并看到3.0时代的曙光。
特斯拉是目前所有自动驾驶企业中最早步入自动驾驶3.0时代的,尽管其纯视觉+众包地图的技术路线在一众自动驾驶企业中显得颇为极端,但凭借高效的数据获取、学习及训练能力,特斯拉得以将其软、硬件实力发挥至极限,由此打通一条数据闭环,实现飞速发展。
毫末智行是第二家注意到数据重要性的自动驾驶企业,这使其能够在一开始就确立数据驱动自动驾驶迭代的发展策略,并由此少走弯路,加速进入自动驾驶3.0时代。
不过话归如此,属于自动驾驶的3.0时代依旧只是刚刚开始,除特斯拉、毫末智行外,越来越多的自动驾驶企业也将因此而开始调转船头,真正精彩卓绝的高手对决,才正式鸣锣开场。
(来源:新视线)