汽车芯片到底多不安全?

2022-09-13 星期二

芯片打压已经不是新闻了,但这一次英伟达A100芯片被限制,还是着实在汽车产业掀起了一场风波,有人喜有人忧。

 

比如小鹏汽车创始人何小鹏就在朋友圈说,(A100被限)坏消息是会对所有自动驾驶云端训练带来挑战,好消息是刚好未来几年的需求提前买回来了,而且会明显超越友商。



隔着屏幕都能感受到喜悦之情。这自然也遭到了友商的“不满”,百度副总裁就表示,“有使命、有责任感的企业家,应该带领企业自主创新、推动行业发展进步”。一句话,格局要打开。


商场即战场,资源充沛当然是竞争优势之一,发圈明爽、内心暗爽,都是爽。更何况当英伟达表示可以提供“替代方案”时,友商应该也有暗爽的,不必太计较。


而我们更关心的是,当回溯华为手机业务因芯片被禁导致销量下滑、手机格局变化的前车之鉴,不得不多想一下,A100被禁真的会影响自动驾驶产业?芯片被限制的趋势会蔓延到汽车芯片其他领域吗?是否会影响汽车格局?又会带来怎样的机遇?


01

自动驾驶离不开云端超算


一个不太冷的冷知识,这次被限的英伟达 A100和AMD MI100都不是车端芯片,而是采用7nm制程的高端GPU芯片,主要采购对象是科研机构和互联网大厂,但许多车企会向阿里、百度等云计算大厂购买计算服务,因此也间接受伤。


何小鹏之所以会跳出来抢戏,也正是因为自动驾驶离不开顶级芯片的绝对算力。


众所周知,自动驾驶可以为三个环节:感知、规划和控制,其中,感知最关键。过去两年,随着传感器种类和数量在不断增多,一辆车所能采集到的数据也在呈几何倍数增长,一方面,这对车端算力提出了更高要求,许多公司都用上了单片算力达256TOPS的英伟达Orin,蔚来旗舰轿车ET7更是一口气用了4颗。


但与此同时,数据量的暴增也对云端计算能力提出了更高要求,为了提升自动驾驶能力,车企往往会将采集到的数据上传到云端,经过分类和标注之后,再通过AI学习来不断优化算法模型,而要减少运算时间、加速算法迭代,就必须要有更强算力支撑。



对自动驾驶行业领域来说,算力高达312TFLOPS的A100就是当下的最优选择,强如特斯拉也绕不过。


在去年放话自研AI超算Dojo前,特斯拉用了5760块A100组建了一个超算集群[2],用于训练自动驾驶算法,到今年,Dojo尚未完工,但算力需求却水涨船高,特斯拉不得不将A100的数量提至7000多张。


在中国,A100几乎成了一线车企的不二选择,包括蔚来、小鹏以及毫末智行都选择了A100,效果也立竿见影,比如小鹏和阿里云合作的中国最大的自动驾驶计算中心,号称可以把原本需要7天的数据训练压缩至1个小时。


而让A100暂时无法被取代的原因,除了算力上的代差之外,更重要的是英伟达的生态。


2007年,英伟达推出了CUDA并行计算框架。在此之前,利用GPU做并行计算必须经历痛苦的底层编程,而CUDA让门槛大大降低,英伟达由此开辟了一类新的计算芯片——GPGPU,即通用计算GPU。经过十余年经营,英伟达以CUDA定义了用GPGPU进行AI计算的游戏规则,并由此垄断了全球云计算的AI芯片市场。


在汽车行业,半路出家的英伟达比其他老牌芯片厂更全能,不仅有云端的A100和车端的Orin,而且还在不断推出自动驾驶的软件栈,其中包括但不限于感知算法、高精地图、仿真等模块,对于软件开发能力较弱的车企来说,几乎可以实现一站式采购。


对国内车企来说,英伟达软硬一体的能力以及环环相扣的生态让人欲罢不能,而A100被禁对一些准备不足的车企来说就意味着必须退而求其次,比如使用上一代的V100。



从理论上来说,堆叠更多V100可以获得和A100相同的算力,但同算力下,V100的价格约为A100的1.5倍,电耗是后者1.9倍,无形之中推高了成本。


另一方面,V100是2017年发布的老芯片,在硬件设计上不可能针对五年以后的AI算法进行优化,眼下流行的大算法模型,V100缺乏良好支持,训练效率远逊于新款芯片。


这种差距在英伟达H100今年下半年发货后会进一步拉大,这枚芯片在算力上达A100 3倍,并在硬件层面加入了对Transformer(正席卷自动驾驶行业的AI算法)的支持。根据英伟达CEO黄仁勋的说法,H100的大规模训练性能会达到A100 9倍。


这一切都意味着,如果2023年的窗口期一过,依赖英伟达生态的公司届时会在云端训练芯片上与海外存在两代代差,中国自动驾驶行业进步的经济成本和时间成本,都将被显著推高。而这还不是中国汽车业眼下最担心的。


02

车端芯片,也不安全


虽然A100被禁暂时只是皮肉伤,但也让忧虑情绪在行业中蔓延:在地缘政治摩擦不断,美国制裁不停的当下,汽车芯片真的安全吗?


要回答这个问题,首先要明白美国在半导体领域的对华策略。从落地不久的《芯片与科学方案》以及本次英伟达和AMD的高端GPU被禁售来看,美国主要针对的是先进制程、高算力芯片以及AI方向,对于其他芯片,在不妨碍所谓“国家安全”的前提下,绝大部分成熟制程的芯片依然会对中国敞开大门。


粗略计算,一辆传统燃油车上大概有900多颗芯片,而一辆智能电动车上有1400多颗,主要就是以MCU为主的功能芯片和以IGBT为代表的功率半导体,而无论是MCU还是IGBT,几乎用的都是28nm及以上的成熟制程,因此被美国制裁的概率非常低。


尽管采用的是更易突破的成熟制程,MCU与IGBT依然未能实现自主可控。


众所周知,中芯国际现在可以生产14nm制程,按理说28nm以上这样的成熟制程应该不在话下,但实际情况并非如此,相比于消费级芯片,车规芯片的使用工况更恶劣,寿命要求更长,前期开发和验证周期也更长,对生产条件要求更加苛刻。



车规级的存在成倍地放大了国内外汽车芯片的差距,导致的结果就是,中国汽车芯片的国产化率只有不到5%,尤其是传统的MCU领域,国产化率低至1%,低于IGBT和存储芯片的8%,且主要是用在中低端的车身控制上,而在跟功能安全强相关的发动机、底盘系统MCU领域,国内几乎是一片空白。


在汽车MCU制造上,台积电是当之无愧的老大,占了全球70%的市场份额,反观中国大陆,目前可用于汽车MCU制造的成熟工艺制程是110nm[9],兆易创新的第一条40nm车规MCU预计要到2023年才能投入量产。


这种被动的局面和产业链分工有直接关系,一直以来,芯片厂都是作为Tier 2给Tier 1供货,和整车厂打交道的机会非常少,也说不上什么话,而传统零部件巨头几乎都是清一色的外国公司,中国的存在感很低,留给芯片厂的机会更是少之又少。


过去两年,全球汽车行业缺芯严重,MCU是罪魁祸首,这导致的结果是,一枚几块钱的MCU芯片在黑市上可以被炒到上千元天价,但另一方面也让国内整车厂意识到海外供应链的脆弱,开始通过pin to pin的方式寻求国产替代,在铁板一块的市场格局中撕开了一道小小的口子。


和传统MCU不同,集许多功能于一身的智舱和智驾SoC芯片对制程的要求更高,比如被国内车厂疯狂追捧的高通8155和英伟达Orin都是采用7nm制程,中国目前也没有能力生产。只是短期之内,这两款芯片被美国制裁的可能性有限,因为这对高通和英伟达来说损失太大了。



以高通8155为例,国内大概有30款车搭载了这颗芯片,其中包括传统车企的走量车型,比如星越L,同时,几乎所有新势力的旗舰车型都在用它,包括蔚来NT2.0平台的所有车型、小鹏的P5和G9、理想的L9等、而这些车型一年的总销量在100万辆以上,按照每块芯片100美元计算,高通损失在1亿美元以上。


英伟达更甚,Orin早已成为车企标榜自动驾驶能力的一个符号,一块不够用两块,两块不够用四块,最高算力可以到1024TOPS,包括“蔚小理”这样的新势力以及许多做L4的无人驾驶公司都是Orin的大客户,而Orin一块芯片的价格高达400美元[9],如果全面封禁,对英伟达来说将会是一个巨大的打击。


03

国产替代,喜忧参半


这次A100被禁风波又一次将国产替代推上了风口浪尖。


9月1日,一批国产AI芯片概念股闻风飙涨,此前因商业化进展不顺股价狂泻80%的“AI芯片第一股”寒武纪,在两日内股价上涨40%。壁仞科技COO张凌岚闻讯后更放出豪言:“我们的终极目标就是替代英伟达,现在机会来了”[8]。


过去数年,在国内的GPU创业潮中,壁仞、沐曦、天数智芯、摩尔线程、登临科技等公司先后成立,其中大部分直接对标英伟达,打造GPGPU,面向AI训练芯片市场。数据处理需求暴增的自动驾驶产业是他们商业化的沃土,壁仞科技就直接成立了L4级自动驾驶公司,自己做自己的客户。


但年轻是这批公司的共同特点,它们的成立时间普遍不到五年。


后起之秀们意识到,要成为“中国英伟达”,必须在算力参数上后来居上,其中的代表是壁仞科技。今年8月,壁仞科技发布峰值算力达到1000TFLOPS的BR100 GPGPU,以就差报身份证号的方式,单方面宣布吊打英伟达A100,小胜H100。


壁仞科技发布的BR100 GPGPU


原本,这些新生公司并未进入量产阶段,下游客户尚未建立起对他们的信任,更倾向于使用英伟达的训练芯片,但英伟达的断供风险无疑将客户推向了国产GPU。


但国产平替并没有那么简单,更不可能一蹴而就。


如上文所述,在AI训练芯片成功的拼图中,软件生态与算力同样重要。而算力可以通过做大芯片堆砌,软件生态的构建却要以五年乃至十年计。在英伟达CUDA成为AI训练事实上行业标准的背景下,缺乏生态支持的国产芯片们,眼下大都选择了兼容CUDA。这方便了下游直接迁移,但可能会在日后遗留专利问题或软件层面的断供风险。


相较于低端的MCU和高端的GPU,国内用在车端的自动驾驶芯片和智能座舱芯片,已经逐渐打开市场。


一方面原因是,国产自动驾驶、智能座舱芯片企业成立更早,进步速度也比较快。


另一方面则在于,让英伟达在训练芯片一直赢的“生态统一,算力为王”逻辑,在产品分层多、生态相对碎片化的车端并不完全成立,尤其是自动驾驶芯片,下游会更综合地看待芯片的指标——成本、功耗、计算实时性、售后支持等等。


这让国内企业有了从中低端产品切入,再向高端攀登的机会。


比如地平线,2020年其J2芯片(算力4TOPS)率先被长安Uni-T搭载,转年J3芯片(算力5TOPS)登上新款理想One,再到今年算力128TOPS的J5即将登车量产,这家成立7年的公司一路完成升级打怪,在格局尚未奠定的自动驾驶芯片市场,依靠性价比与开发服务友好性,把国内半数一线车企都变成了客户。


芯驰、瑞芯微、杰发科技、芯擎等企业,也正尝试在智能座舱芯片领域复制这一道路。


但是,无论是云端还是车端的芯片,不管他们处在哪个阶段,一把达摩克里斯之剑始终高悬着——这些处于潮头的先进芯片,终究会需要高至7nm乃至5nm的先进制程带来的高性能/功耗比,普遍依赖台积电代工。一旦美国加强对中国的芯片制造打击,国内14nm的工艺难以接续。


在芯片代工的元问题没有解决前,国内的先进芯片业态,仍将同时怀着希望与不安走下去。


参考资料:
[1] 小鹏汽车与阿里云联手 “扶摇”成为中国最大自动驾驶智算中心,中国证券报
[2] 特斯拉推出搭载NVIDIA A100 GPU顶尖自动驾驶汽车训练超级计算机,英伟达中国
[3] 数据中心:短期韧性,以及中长期成长性,中信证券
[4] 数字能源目标网助力运营商加速碳中和白皮书,华为
[5] 域控制器行业深度报告:汽车电子电气架构演进下的黄金赛道,平安证券
[6]「芯智驾」独立上市,能破解Mobileye的隐忧与英特尔的困境?集微网
[7] 消息称地平线计划再融资至少1亿美元,芯片领域资本竞赛继续,界面新闻
[8] 美国再下杀手,对华断供英伟达高端GPU芯片,“算力国产化”机会来了?IT时报
[9] 智能网联汽车发展若干重大问题 车百智库

原文地址:点击