Robotaxi诞生记:马斯克硬要冒这个险

2024-04-14 星期日

8月8日,Robotaxi首秀。这很可能是划时代的车。按照马斯克的原话:它会让特斯拉市值冲上10万亿美元。一百年后人们都会谈论这个重要时刻。而马斯克真正想要的是,通过Robotaxi(自动驾驶出租车)颠覆交通运输的现存模式。

三体引力波依照沃尔特·艾萨克森力作《马斯克传》美版(Simon&Schuster出版),选取相关章节译成中文,为大家呈现这段不输于编剧笔法的惊人内幕。

马斯克画了五年的饼:特斯拉全自动驾驶

图片

●Robotaxi诞生记

马斯克相信,自动驾驶汽车不只是能让大家摆脱枯燥费神的驾驶,而是以后人们大部分都不需要再拥有汽车。未来将是Robotaxi 的时代:当你叫车,就会有一辆无人驾驶车拉你前往目的地,然后再去拉下位乘客。一部分Robotaxi可能是个人所有,但大部分属于出租车公司或是特斯拉所有。

2019年11月,马斯克在奥斯汀召集手下五位干将,共同思考未来,大家在马斯克的高级助理阿夫沙尔还没装修好的家里一起吃饭,阿夫沙尔特地邀请私厨为大家烹调超厚全熟肋眼牛排。参加聚会的高管包括特斯拉首席设计师弗朗茨·冯·霍兹豪森(Franz von Holzhausen)、特斯拉动力总成与能源工程高级副总裁德鲁·巴格利诺(Drew Baglino)、特斯拉车辆工程副总裁拉尔斯·莫拉维(Lars Moravy)、特斯拉首席财务官扎克利·柯克霍恩(Zachary Kirkhorn)。 他们决定,Robotaxi的规格应该比Model 3更小、更便宜、速度也不用那么快。马斯克说,「我们看中的是数量,生产再多都不会产能过剩。有朝一日,我们希望可以年产2000万辆。」

关键挑战之一是,如何生产一款没有方向盘或者脚踏板的车,既能符合政府安全标准,又能应对特殊路况。每周,马斯克都会提出各种各样的细节问题。「如果有人起身离开Robotaxi,忘了关门怎么办?」他问道,「我们必须保证Robotaxi可以自动关门。」Robotaxi要怎样进入有门禁管制的小区或者停车场呢?「或许需要设计一支机械臂,可以按按钮或是取卡。」他说。 但这听起来就是个恶梦。「或许我们应该避开这种不太容易进入的地方。」他决定。有时候,大家的对话相当严肃认真,讨论各项细节,完全忘了这个概念有多么天马行空。

到了2022年夏末,马斯克和他的团队明白,他们苦思一年的问题,必须做出最后决断。他们是该打安全牌,做出有方向盘、脚踏板、侧后视镜,以及监管机构要求标配的车呢?还是应该生产一步到位能真正自动驾驶的车呢?多数工程师偏向打安全牌。他们对开发全自动辅助驾驶需要多长时间,看法更切实际。在8月18日那次富有决定性的会议上,所有人要一起做出最后决定。「我们想让你了解所有可能的风险,」冯·霍兹豪森对马斯克说,「如果我们选择生产没有方向盘的车,但是全自动辅助驾驶系统还没有完成,产品就没办法上路。」他建议生产有方向盘和脚踏板的车,但是方向盘和脚踏板都可以轻易拆掉。「基本上,我们的提议就是现在先保留那些标配,等到未来情况允许时,再全部拆掉。」

马斯克摇头表示,如果他们不逼自己一下,自动驾驶的未来就无法尽快实现。冯·霍兹豪森说,「这只是小调整,我们可以轻易拆掉那些标配。」 「不要,不要,」马斯克说,「不要。」接着就是一阵沉默。「不要镜子、不要踏板、不要方向盘。我会为这个决策负责。」 高管们都有些迟疑。「呃,我们回去研究一下再向你报告。」其中一位高管说。 马斯克再次表现出极其冷漠的态度。「我已经说得很清楚,」他缓缓开口,「这款车必须是真正的Robotaxi。我们必须冒这个风险。如果搞砸了,都是我的错。但是,我们不能设计一辆像两栖动物式的半吊子车。我们要全力开发自动驾驶车。」

几周后,马斯克依旧对自己的决定感到兴奋。一天他送儿子格里芬去读大学,他在飞机上通过手机参加Robotaxi周例会。和以往一样,他试图制造一种急迫感。「这将是划时代的革命性产品,」他说,「它会改变一切。这款产品会让特斯拉市值冲上10万亿美元。一百年后人们都会谈论这个重要时刻。

拍板亲民款车型Robotaxi,显示出马斯克的固执。他拥有能够扭曲现实的强大意志力,能够完全无视唱反调的人。这种顽固性格,或许正是让他成功的一项超能力,但也是导致他失败的原因之一。他还有一项鲜为人知的特质:非常善变。即使是他一开始拒绝的观点,他也会听进去,然后在脑中重新计算风险。方向盘的问题就是如此。

2022年夏末,也就是在马斯克宣布全力开发没有方向盘的Robotaxi之后,冯·霍兹豪森和莫拉维还是试图说服他改变决定。他们知道如何用比较委婉的方式说服他。莫拉维说,「我们给他看最新资料,夏天时他可能没有完全消化这些信息。」他告诉马斯克,即使美国监管机构批准了自动驾驶汽车,其他国家也得逐个核准,这要等上好几年之后。所以先开始做有方向盘和踏板的车,比较合理。过去几年,他们曾讨论过下一代特斯拉的定位:一款价格实惠、面向大众的小型车,售价大约在25,000美元左右。马斯克自己在2020年就曾提出过这个可能性,但后来他又决定暂缓该计划,接下来两年,他一再否决这个想法,他说有了Robotaxi之后,就没有必要生产另一款小型车。但冯·霍兹豪森没有放弃这个计划,仍在设计工作室秘密开发。

2022年9月,马斯克飞到西岸为Optimus发布会做准备。一个周三深夜,他窝在没有窗户的弗利蒙特工厂木星会议室里。冯·霍兹豪森和莫拉维带着几位特斯拉高管进入会议室,召开秘密会议。他们摊开数据表示,如果特斯拉每年要想增长50%,就必须推出一款更亲民的小型车。全球对这种车的需求非常庞大,等到2030年估计会有7亿辆的巨大需求,大概是Model 3和Model Y的两倍。接着他们又表示,这种小车可以和Robotaxi使用相同的平台和装配线。「我们说服他,如果建造这种工厂,拥有这个平台,就可以同时生产Robotaxi和25,000美元的小车,共用相同的汽车架构。」冯·霍兹豪森说。会议结束后,只剩马斯克和作者在会议室里,他显然对于25,000美元的小车提不起兴趣。「这个产品令人兴奋不起来。」他说。 他真正想做的是通过Robotaxi颠覆交通运输的现存模式。

但接下来几个月,他越来越有了兴趣。2023年2月一天下午,他们召开设计会议,冯·霍兹豪森将Robotaxi和25,000美元的模型,并排放在设计工作室。两款车都具有Cybertruck的未来感。 马斯克非常喜欢新车的设计。他说,「当人们在路上看到这辆车,就会觉得看到了来自未来的车。」新的量产车型,包括配备方向盘的Robotaxi,后来统称为下一代特斯拉。一开始马斯克想在距奥斯汀大约640公里的墨西哥北部投建一座工厂,从头开始生产新车,新工厂将采用高度自动化的全新制造流程。

但他马上想到一个问题:他一直认为,特斯拉设计工程师的工作地点必须靠近装配线,所以不应该在某个偏远地方制造汽车。工程师只有在装配线附近工作,才能得到及时反馈,才能同时优化汽车的性能和制造。尤其是生产全新车型、建立崭新的制造流程时,更应该如此。但他也明白,想要特斯拉的高级工程师派到墨西哥新工厂会很困难。「特斯拉工程师必须待在生产线上,这样生产流程才会顺畅,但是我不可能逼迫每个人搬去墨西哥。」他对作者说。

所以2023年5月,马斯克决定将下一代特斯拉和Robotaxi的生产地点改在奥斯汀,就在他本人的工作地点,他的高级工程师会在这里的全新自动化高速生产线工作。2023年夏,他每周会花好几个小时和团队一起设计生产线的每个工作岗,想办法尽可能缩减每个步骤、缩短流程时间,哪怕只是缩短几毫秒。

图片

●向人类学习开车,像人一样思考

「它跟ChatGPT一样,只不过是给汽车使用,」自动辅助驾驶团队成员达瓦尔·什罗夫(Davar Shrove)对马斯克说。 他把自己在特斯拉的AI项目,拿来跟OpenAI新推出的人工智能聊天机器人做比较。 OpenAI是马斯克和奥特曼在2015年共同创立的实验室。马斯克花了近十年时间,投入开发各种不同形式的人工智能,包括自动驾驶系统、人形机器人Optimus、脑机接口Neuralink等。什罗夫的人工智能项目主要是开发最先进的机器学习技术,也就是能够学习人类行为的自动驾驶系统,他说:「我们处理了大量信息,都是关于真实人类如何应对复杂驾驶场景,然后训练计算机神经网络模仿人类的驾驶行为。」

什罗夫偶尔会加入三剑客詹姆斯、安德鲁、罗斯的队列,组成四剑客。马斯克要求和什罗夫见面,想说服他离开特斯拉自动辅助驾驶团队,去推特工作。但什罗夫想留在特斯拉,他希望说服马斯克,自己负责的AI项目对于特斯拉甚至整个世界来说,非常重要。他把自己提出的AI新技术,命名为「神经网络路径规划器」(neural network path planner),赋予特斯拉的自动驾驶软件向人类学习的能力。

他们两人原定在2022年12月2日周五见面,实际上马斯克当天的行程已经排满,只能硬塞。当天早上,什罗夫按照马斯克的要求抵达推特总部,马斯克刚参加完 Cybertruck 赛博皮卡发布会,从内华达赶回。他向什罗夫道歉,表示自己忘记了要飞到新奥尔良和法国总统马克龙会面,需要讨论欧洲的内容审核规则。他请什罗夫当天傍晚再来面谈。当马斯克等待与马克龙会面期间,发消息给什罗夫,再次要求推迟面谈时间。「我会迟到四个小时,你愿意等我吗?」但就在同一时间,他又突如其来地发消息给独立调查记者维斯夫妇,请他们当晚飞到旧金山与他会面,协助处理推特文件。

当天深夜,马斯克回到旧金山,终于有机会坐下来与什罗夫谈一谈。什罗夫解释了,他正在开发的神经网络路径规划器项目诸多细节。 「我认为,让我继续进行目前的工作,真的非常重要。」什罗夫说。 马斯克听了他的解释后,再次燃起对这个AI项目的热情,也认同什罗夫的说法。他知道,未来特斯拉不只是一家汽车公司,也不只是一家清洁能源公司。如果能够整合全自动驾驶、Optimus 机器人、Dojo 机器学习超级计算机,它会成为一家人工智能公司,不仅能通过聊天机器人在虚拟世界运行,还能在实体工厂与现实道路上运行。 他早已在考虑聘请一批人工智能专家,与OpenAI正面对决,特斯拉的神经网络路径规划团队正好能填补这份工作。

多年来,特斯拉的自动辅助驾驶系统一向采取基于规则的算法(rule-based approach)。系统由摄像头采集视觉数据,辨识车道标线、行人、车辆、交通信号等,以及八个摄像头拍到的视频信息。接着,软件会根据一套规则运行,例如:红灯亮时要停车,绿灯亮时要开车;保持在车道标线中间;不能跨越双黄线驶入对向车道;只在其他任何车辆的速度都不足以撞到你时,才通过路口等等。特斯拉工程师手动编写和更新几十万行 C++ 代码,把这些规则应用在各种复杂情境里。

而什罗夫正在开发的神经网络路径规划器项目,可以为软件系统增加新能力。「汽车不再只根据规则决定适合的路径,」什罗夫说,「还会依赖神经网络。神经网络是根据数百万个人类行为的真实案例计算机进行深度学习。」换个说法,神经网络会模仿人类。每当面对某个情境,神经网络会根据人类在成千上万种类似情境的行为,选择其中一条路径。就跟人类学习说话、开车、下棋、吃意面……几乎所有事情一样,我们会遵循某套既定规则,但多数时候,我们都是观察其他人怎么做逐渐学会技能。这是计算机科学之父图灵在1950年发表的《计算机与智能》论文中,设想的机器学习方法。

特斯拉拥有全球名列前茅的强大超级计算机,用来训练神经网络,采用芯片大厂英伟达(Nvidia)设计的图形处理器(GPU)。马斯克的目标是在2023年改用Dojo,也就是特斯拉从零打造的超级计算机,用视觉数据训练人工智能系统。Dojo用的芯片和基础设备,全都是特斯拉人工智能团队自主设计的,算力高达每秒约800亿亿次浮点运算,是全球性能最强大的人工智能超级计算机之一 。这台超级计算机能用来训练自动驾驶软件和Optimu人形机器人。「能够同时训练它们真的很有趣,就好像它们正在努力探索世界。」马斯克说。

2023年初,神经网络路径规划器项目已经分析了从特斯拉用户车上采集的1,000万帧视频画面。这是不是意味着系统的表现只能达到一般人类驾驶的平均水准呢?「不是,因为我们只采用了人类成功应对某个情境的数据。」什罗夫解释。人类标记员会评估所有视频画面,然后给出评分,许多标记员的工作地点在纽约水牛城。马斯克告诉他们,找出「Uber五星驾驶员所采取的操作行为」,然后利用这些视频训练计算机。

马斯克会定期巡视特斯拉位于加州帕罗奥图的办公大楼,自动辅助驾驶团队就在其中一个开放空间工作。有时他会半蹲在一旁,跟工程师即兴讨论。有一天,什罗夫向马斯克展示他们最新的开发进度。马斯克觉得很不错,但有个根本问题:真的需要采用这个新方法吗?会不会有点过了头?他有个座右铭:绝不用巡航导弹打苍蝇,用苍蝇拍就够了。采用神经网络规划路径器,只为了应对不太可能发生的极端情况,是否过度复杂而没有必要?

什罗夫向马斯克展示,在哪些情况下,神经网络算法的表现会优于规则算法。在一个模拟场景中,道路上散布着垃圾箱、掉落的交通锥,以及任意丢弃的垃圾。由神经网络路径规划器引导的汽车,必要时会打破一些规则,跨越车道线,由此避开障碍物。「当我们从规则算法转为神经网络时,就能做到这一点,」什罗夫对马斯克说,「如果使用神经网络,汽车永远不会撞到任何东西,即使是在混乱的场景里。」每次看到类似的技术大跨越,马斯克就会变得异常兴奋。「我们应该举办一场詹姆斯·邦德风格的展示会。四周炸弹全部爆炸,UFO从天而降,然后我们的自动驾驶车疾驶而过,完全没撞到任何东西。」他兴奋说到。

机器学习系统在自行训练时,通常需要有目标或指标做为引导。马斯克偏爱的管理方法,正好是直接指定哪些指标最重要。他告诉团队的指标是:使用特斯拉全自动辅助驾驶的汽车,在没有人为干预下的行驶里程。「我希望每次开会时,第一张投影能够显示最新的没有人为干预的里程数,」他下令,「当我们训练人工智能时,要优化的目标是什么?答案是提高两次人为干预之间的里程数。」他告诉开发团队, 要像电玩游戏一样,让玩家每天都可以看到分数,「看不到分数的电玩游戏很无聊。如果每天都能看到没有人为干预的里程数持续增加 ,就会让大家更有动力。」

于是团队成员在工作间安装了几台巨大的85吋显示屏,实时显示全自动辅助驾驶汽车在不受人为干预下,平均能行驶多少里程。每当他们看到某种类型的干预行为反复出现,例如驾驶员在变换车道、车道合并或转入复杂路口时把握了方向盘,他们就会同时启用规则算法和神经网络算法,试着找到最优解。他们在办公区摆了一面铜锣,每当成功解决人为干预的问题时,就敲锣庆祝。

图片

图片

▲特斯拉AI技术主管Pariljain称,全自动驾驶系统(FSD)已在美国200万辆特斯拉车上使用,辅助驾驶系统(Autopilot)正在全球600多万辆特斯拉车上运行。

●AI应变能力比真人更好

2023年4月中旬,马斯克决定亲自测试一下新的神经网络路径规划器,让测试车在帕罗奥图市区绕行。什罗夫和自动辅助驾驶团队已经装配好一辆测试版特斯拉,内置的自动驾驶软件接受过神经网络训练,有能力模仿人类驾驶行为。在这个软件里,遵循基于规则的传统代码占比非常低。马斯克坐在驾驶座,旁边坐着的是自动辅助驾驶软件总监阿肖克·埃卢斯瓦米(Ashok Elluswamy)。什罗夫与其他两位团队成员马特·鲍赫(Matt Bauch)和克里斯·佩恩(Chris Payne)坐在后座,他们三人已在特斯拉工作了八年,办公桌彼此相邻,都住在旧金山,住宅只隔几个街区。多数人的办公桌上都会摆放家人照片,他们三人的办公桌却放着同一张照片:那是三人在万圣节派对的合影。堂弟詹姆斯·马斯克曾是这个团队的第四名成员,在马斯克收购推特后被紧急征调过去。而什罗夫逃过一劫。

当测试小组离开特斯拉帕罗奥图办公园区的停车场时,马斯克在地图上选定一个行驶目的地,点击了全自动辅助驾驶模式,然后双手离开方向盘。当测试车驶入主要干道时,立即面临第一个吓人挑战:一个骑车人正朝向他们而来。「我们所有人都屏住呼吸,因为骑车人会做出什么随机反应,很难预料。」什罗夫说。但马斯克一点也没在意,也没有把手放回方向盘。结果这台车自动礼让骑车人先行。「完全是真人驾驶会采取的做法。」

什罗夫和他的两位团队成员开始详细解说,他们如何从特斯拉车载摄像头搜集的数百万条视频片段,才训练出来全自动辅助驾驶软件。相比于采用人工编写代码、设定数千条规则的传统算法,新的软件架构简单很多。什罗夫说,「它的运行速度快了10倍,我们最终还直接删除了30万行代码。」鲍赫表示,这就好比人工智能机器人在玩某种极其无聊的电玩游戏。马斯克听了,扑哧笑了出来。测试车继续在车流中自主行驶,马斯克掏出手机,开始发推文。

测试车行驶了25分钟,经过大街小巷,完成复杂的转弯,成功避开骑车人、行人、宠物。行驶过程中,马斯克完全没有碰触方向盘,只有几次踩了油门,因为他觉得这台车过分谨慎。例如,在四向停车信号前过分遵守规则。但有时候,测试车一度采取的应变行动,甚至让马斯克觉得比自己可能做出的反应还要好。他说:「哇,太棒了,即使是我的人类神经网络,都可能反应不过来,但是这台车做得太棒了。」他实在太开心了,开始吹口哨,吹着莫札特的G大调《小夜曲》。

坐拥特斯拉、推特两大数据库的马斯克,对在场的所有人说:「各位做得太棒了,真的非常了不起。」接着,所有人一起参加自动辅助驾驶团队的周例会,20名成员几乎全穿着黑色T恤,围着会议桌而坐,聆听最终评判。很多人原本不相信神经网络项目能成功。马斯克宣布,现在他相信了,他们应该投入大量资源,继续推动这个项目。

讨论过程中,马斯克抓住团队提到的一个关键点:神经网络必须接受至少100万条视频片段的训练,才能运行顺畅,如果训练超过150万条,就会表现得非常优异。这意味着相比于其他车厂和人工智能公司,特斯拉拥有极大的竞争优势。因为特斯拉每天能从全球200万台电动车上,采集到数十亿帧视频。「在这点上,我们占有独一无二的优势。」自动辅助驾驶软件总监埃卢斯瓦米在会议上说。

不论是开发哪种人工智能,从自动驾驶汽车到Optimus人形机器人,再到类似ChatGPT的聊天机器人,都必须具备搜集与分析大量即时信息的能力。现在,马斯克已拥有两个强大的即时信息库:自动驾驶车辆的海量视频,以及推特平台上每周高达数十亿条推文。会上马斯克告诉自动辅助驾驶团队,他刚完成一笔重要采购案,是为推特购买了上万块GPU芯片。他同时宣布未来将增加开会次数,讨论特斯拉正在设计的Dojo芯片,Dojo芯片有望展现更强大的能力。他还懊悔地承认,自己不该在圣诞节期间,冲动下令关闭推特位于萨克拉门托的数据中心。

在那天会议中参加旁听的,还有一位人工智能领域的超级明星工程师。那一周马斯克刚把他挖来,准备投身于即将推出的秘密项目。

原文地址:点击