上行期理所当然的技术决策,到了用商业结果证明合理性的时候。 文丨赵宇 编辑丨龚方毅 “超越最好的智驾芯片,数据流架构是唯一的机会” 晚点:数据流架构很早就被提出,为什么到今天才适合用在车端 AI 芯片上?数据流不是全新概念,国内基本没有其他厂商做,国外有厂商把它应用在数据中心。 谢炎:你说得很对,数据流架构是个非常古老的概念,最早在 1970 年代提出,MIT 的 Jack B. Dennis、Arvind、高光荣教授他们提的,到现在已经几十年,但工业界落地非常少,最重要的原因是计算规模不够大。在计算和数据规模较小时,数据流架构的效率优势很难发挥和体现。 冯·诺依曼架构有个很大的优势——方便人类编程。它把存储和 IO 操作都抽象成指令,加上计算指令,以一种中心化的指令序列 step by step 推动计算任务,特别适合人脑在有限的上下文长度下做思考和编排。代价是损失了一定的计算并行度,降低了效率。但这在 AI 计算之前的时代还能忍受。而且过去也发明了乱序发射、超流水线、多级缓存、分支预测等复杂的 CPU 微架构技术来缓解。 数据流架构的优劣势正好相反,它用数据依赖图映射的硬件结构,天然高并行度,但提升了人类编程的复杂度,而且调试工作和编译器的难度也大幅提升。 所以 AI 出现前,数据流架构不成立——虽然概念很好,但落地很难。但当计算规模扩大到一定程度后,冯·诺依曼架构的瓶颈已经越来越明显。再往后走,数据流架构应该是一种更好的体系架构方式。 晚点:具体讲讲,数据流架构为什么更适合 AI? 谢炎:这得从 CPU 架构说起。CPU 就像厨房,有切菜、配菜、炒菜等工种,中间有个调度员负责发指令。这种集中式管理容易 Debug 和编程,但调度员负载很重,规模扩大后容易形成瓶颈:可能有人空闲但调度员没看到,或者有人本可以更早切菜但因为指令没到而等待。CPU 中有 30%-35% 的晶