抛开马斯克的自我造神,是时候重新认识特斯拉了。
在特斯拉的官网上,它宣称自己是一家电动车、太阳能和清洁能源公司。在一些人眼中,因为备受争议但持续演进的自动驾驶技术,特斯拉是一家人工智能公司。在不久前的特斯拉举办的首次AI Day上,因为一款酷似人形的机器人Tesla Bot的问世,不少人开始认为特斯拉是一家机器人公司。而马斯克经常说的一句话是:特斯拉是一系列初创公司的集合。
然而在AI Day上特斯拉透露出的真正信号是:这是一家计算公司。
“计算公司”(Computing Company)看上去是一个大而无当的概念——尤其在这个遍地都是“算法”的互联网世界里。然而,算法更多的是一个软件概念,它是基于一定的数据结构的数据输入产生的新的输出结果。而除了数据和算法,构成“计算”的更核心部分是“算力”,也就是一部计算设备——无论是一台超级计算机、一部智能手机还是一辆智能网联汽车——的数据处理能力。它在很大程度上是硬件的能力,也就是芯片和计算模块的能力。这才是“计算”的本质。
从这个意义上说,一些充分掌握人工智能“算法”而未掌握核心“算力”的公司,并不能被称作是一家“计算公司”,比如开发了今日头条、抖音和TikTok的字节跳动,就还不能被称作是一家计算公司。在我们中国,华为是一家当之无愧的计算公司,阿里巴巴和百度也在逐渐地成为计算公司。在美国,英特尔、AMD和英伟达都是称得上是老牌的计算公司,苹果和谷歌是新晋的计算公司。抱歉,亚马逊和脸书还不是计算公司。
现在,“计算公司”的名单里多了一个特斯拉。
比起看上去神乎其神的机器人Tesla Bot,特斯拉在AI Day上发布的“D1”芯片和超级计算机平台“Dojo”才是真正的重头戏:它意味着特斯拉像苹果那样,具备了把整个生态从上游到下游,都掌控在自己手里的基础能力。
“D1”是一款AI训练芯片,当然也是一款计算芯片。它采用7纳米工艺,单片FP32达到算力22.6TOPs,BF16算力达到262TOPs。根据特斯拉的演示,单颗D1芯片的神经网络算力超过一块显卡,也就是说特斯拉D1比英伟达的GPU和谷歌的TPU性能都强。特斯拉自动驾驶硬件高级总监、Dojo项目负责人Ganesh Venkataramanan说D1“完全是由特斯拉团队自主设计的芯片,从架构到封装。该芯片就像一个GPU,但又具有CPU级别的灵活性和两倍于网络芯片级别的上传/下载带宽”。所以,D1芯片既不是一款CPU,也不是一款GPU,而被直接称作“Pure Learning Machine”(纯学习机器)。
一颗颗D1芯片的无缝连接,构成了一个25颗D1芯片组成的机器学习模块,再把多个模块集成在一起,就构成了一台特斯拉自研的超级计算机——Dojo。Dojo的日语译文是“道场”,也就是修炼的地方。“修炼”的意象正符合一台超级计算机最核心的功能:对数据模型无休无止的机器学习和神经网络训练,炼成一颗超级大脑。
Dojo有超过50万个训练节点,每个节点的算力为9千兆浮点计算(fetaflops)。基于Dojo的架构,特斯拉又发布了ExaPOD——集成了120个训练模块,包含3000颗D1芯片,超过100万个训练节点,算力超过1100千兆浮点计算。特斯拉说:这就是全球最快的AI训练计算机。作为一家非常喜欢用“概念替换”的方式无限放大自身优势的公司,特斯拉甚至想宣称:这已经是全球性能最强的超级计算机。
然而作为一款神经网络训练为主要功能的计算器,特斯拉的“千兆浮点计算”指向的其实是低精度算力,而非超级计算机性能的通常参考值双精度浮点算力。按照后者性能计算,特斯拉Dojo的排名大约在世界第七,落后于日本的富岳(Fugaku)、美国的IBM Summit、美国的Sierra、中国的神威太湖之光、美国的Selene和中国的天河2-A。特斯拉说,Dojo的性能下一代还会有10倍的提升——依据这家公司的历史,很难排除其中的“吹牛”成分,但特斯拉的一个“优势”在于,比起人工智能领域遍地存在的“吹牛不上税”的玩家,它总能把事情做得更到位。
Dojo这个号称世界上最强的神经网络训练计算机,将被专注用来做一件事——训练特斯拉完全基于纯视觉而非激光雷达的自动驾驶。鉴于特斯拉在全球有几百万辆行驶在高速公路上的轿车,这是一项有着海量数据支撑的实验。特斯拉AI技术负责人Andrej Karpathy在AI Day上解释了Dojo这台超级计算机对纯视觉自动驾驶的意义:一辆特斯拉轿车上的8个摄像头能够检测足够多的图像数据和预期目标,但背后的神经网络矢量空间不够。于是,特斯拉基于Dojo计算平台重新设计了神经网络系统,作为自动驾驶系统的决策依据。
也就是说,过去特斯拉的自动驾驶眼睛好使,但脑子还是不够用(不知道这是不是自动驾驶刹车系统经常出bug的原因)。现在,特斯拉重新给了每一辆车一个新的大脑。
这是“算力”的力量,只有一家“计算公司”才能真正地做到这一点。它让特斯拉基于纯视觉方案的、将自动驾驶系统看作一个眼睛、神经和大脑的结合体的解决方案,得以在蔚来、小鹏和理想们“摄像头+激光雷达”的包围中,孤注一掷地走下去。Dojo这台超级计算机能不能真正地修炼出一颗比激光雷达厉害的“超级大脑”,虽有待时间的检验。但其背后关于从芯片到模块再到超级计算机,从硬件到软件的一整套围绕着“计算”而投入的巨大成本,让特斯拉的本质从一家“电动车和太阳能公司”跳了出来。
一直看好并加码投资特斯拉的基金管理公司ARK,其分析师Frank Downing认为特斯拉的Dojo类似一个“复合大脑”(Synthetic Brain),它锻造的是一个被超级算力驱动的、基于海量数据的神经网络训练的超级大脑。我觉得它或许可以类比谷歌的“Google Brain”——它们的区别在于,谷歌的大脑更多地用于在内容、广告和信息上的“通用人工智能”(AGI, Artificial General Intelligence)训练,而特斯拉Dojo当然优先用于自动驾驶系统的训练。而且,从芯片到计算模块再到超级计算机的算力上,Google的TPU确实逊色很多了。
ARK的分析师Frank Downing还提出了一个有意思的观点:不要盯着特斯拉那个能说会跳、身高172公分的机器人不放,特斯拉当然有可能做机器人,但更重要的是,Dojo给特斯拉带来的计算能力和大脑,将推着特斯拉走向“通用人工智能”(AGI)的未来。
马斯克说Tesla Bot能帮助人类从事一些危险而重复的体力劳动。只不过,它长得过于像人类这一点,仍然不免让它更像是一个噱头——真正能替代人类从事危险重复体力劳动的机器人,长得不需要像人,过度的“拟人化”只会束缚而不会解放一个机器人的生产力。但是,它背后的逻辑却是清晰的:特斯拉认为自动驾驶的优势在于大部分人其实不擅长驾驶这件事,那一辆自动驾驶的电动轿车又何尝不是在替代大多数人类从事危险而重复的体力劳动呢?
“替代人类劳动”这件事,是“通用人工智能”的必要性所在,而那些真正通盘掌握了从算力到数据再到算法的“计算公司”而非简单的“人工智能公司”,无疑是更有话语权的。
也许从这个意义上,我们可以重新思考一个问题:谁是中国的特斯拉?
中国的特斯拉很可能并不是一家电动汽车公司——在发展新能源汽车的问题上,我们中国应该告别硅谷崇拜,中国的第一辆新能源汽车出自比亚迪,它并非受特斯拉的启发,而是基于中国自身国情、环境资源保护使命和发展路径的需要。“中国的特斯拉”,应该是一家计算力驱动的,通过计算能力延展出强大算法和人工智能能力的、可以驾驭操控未来的机器人、车辆、飞行器和移动设备的通用型人工智能公司,它毫无疑问也是一家计算公司。
答案已经快出来了。
精彩评论