Blackwell出货延迟分析:芯片无虞,服务器技术方案或成主因

独立投资人吴强
08-02

昨天有消息称英伟达的Blackwell可能延迟 , 一下炸锅 , 对此消息 , 我觉得应该是说搭配Blackwell GPU的服务器产品可能延迟 , 而非Blackwell GPU芯片出现延迟, 这样的表述会准确一点 , 毕竟这颗芯片已经经历前期设计, 流片与无数测试 , 最终顺利在台积电Fab18A工厂生产中 , 从7月开始正式量产, 前期小规模生产 , 前段GPU生产之后再交由先进封装6厂进行CoWoS-L封装 , 在Q3正式量产前的第二季度 , 少量样卡早已经交给服务器合作伙伴测试。

也就是说芯片本身没有重大问题 , 那大家悬着的心应该能稍微放一放。

从上述一系列流程中 , 我们可以确定 , 假如真的出现出货延迟 , 大概率不会是芯片的设计缺陷问题,无数次仿真/测试都做过了,即使有缺陷,大概也是体现在供电、热效应、板卡方面,或者无故障工况的时间变短;比如去年由H100的低分数die的瑕疵产品改造的H800。Blackwell芯片本身的设计上,最大挑战就是合封了2颗die之后的热效问题,但这些问题在芯片进入量产阶段 , 也不会有太大问题 , 也就是说设计缺陷的问题 , 不会是现阶段出货延迟的原因。

排除了大家最担心的设计缺陷问题 , 再来看看制造问题 , Blackwell的GPU die采用台积电N4P制程 , 跟AMD, 高通, 苹果采用的一样 , 在台积电属于运行非常成熟的工艺 , 基本也能排除 , 而 Blackwell采用的CoWoS-L封装技术是首次大规模采用 , 良率或许不是那么好 , 但也是90%以上 , 距离大量出货的十月份还有些许时间可以去改善 , 目前的良率问题不会是NV延迟出货的主因。

零部件的采购好像也没有那个环节是极度紧张的 , HBM或者液冷快接头的短缺也不至于出货延迟半年 , 毕竟这些紧缺的零部件或芯片还是有基础的供货能力 . 更何况如HBM下半年也已经明确会加入新的大供应商三星。

目前进入生产阶段的不止芯片,相信还有板卡组件、新的交换设备、新设计的机架、新制冷方案等等,从8卡Pod扩容到72卡Pod需要考虑的问题很多,尤其是包括网络带宽的收敛、以及各种并行策略(模型数据切分、分段计算、拷贝和重组)在整个Pod中的最佳工况。

RACK也需要重新设计,毕竟tray变得更多、更高密、更紧凑,机架内的布线数量、高速交换、散热也就更复杂,相信这种RACK还没有量产。

定制机架本身没有集成问题,但供电系统和制冷子系统的挑战比较大,几乎同样高度、近似重量和空间的机架却要承担最高9倍数量芯片的散热,你想想这是很挑战的,之前TPU的16000 Pod做过,但那是私有环境,不是商品化SKU。

服务器所有子系统与集成 , 由于NVL36/72是一项全新的技术方案 , 所有子系统与最终的集成是否有完善这一点确实会有点风险 , 因为除了性能以外 , 整个系统的高成熟度与高可靠性同样是一个商业产品好坏的依据。

除了产品本身的各种问题以外 , 水冷散热的GB系列服务器,目前还有漏液的问题,即使该产品已经通过认证,漏液问题让服务器厂家挺头大。

水冷散热主要零件:水冷板、分歧管、CDU及快接头(QCD)当中,以快接头处是最容易发生漏液之处,漏夜最大的问题就是责任归属。

水冷散热服务器最重要的不是价格,而是质量,所以NV这类客户选择的条件不是会不会做,而是能不能信赖,一个AI服务器的RACK动辄数百万美元,但漏液的赔偿可能会让一家小型企业破产,如果漏液,NV自己需向客户先行赔偿 , 再向鸿海广达这类系统厂作为责任归属与索赔对象。

目前NV与系统厂进行水冷散热的合作、测试,然尚无真正大量导入,都纯粹属于沙盘推演,水冷散热的RACK价格高、配置高,系统厂趋之若鹜 , 但是导入后的责任归属,才是最大问题,不论是芯片厂、系统厂或散热厂,没有哪一家厂商愿意承担此风险 , 这需要实际导入后,有了「白老鼠」才更明朗。。

所有情况都分析一遍之后 , 个人认为假如Blackwell的出货延迟是真的 , 芯片端的部分 , 设计缺陷的问题基本可排除 , 制造问题上CoWoS-L良率或许不完美 , 但也不会造成出货延迟 . 大概率是因为全新的服务器技术方案所造成 , 各式各样采用新技术的子系统可靠度还有提升空间 , 问题基本上还是出在服务器上而非芯片。

如果出货延迟为真 , 从上述所有问题看来 , 并没有根本性的重大问题 , 真要造成延误个人认为时间不会太久 , 一个季度相对合理 , 半年的延误是无法接受的 , 这样的话对NV的影响也在可接受范围 , 更何况此时此刻正进入H系列的出货高峰 , 今年后续季度的业绩兑现毫无疑问是令人兴奋的 , 只要好业绩能出来 , 明年稍微延迟的问题或许也不是那么重要了

$英伟达(NVDA)$

英伟达股价下跌,绩前能回调到多少价位?
美股三大指数集体收跌,英伟达跌近4%,【下周英伟达发布财报,你希望绩前英伟达回调到什么价位?本次财报后英伟达能否大涨?】
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

  • 郑品生
    08-02
    郑品生
    你们觉得这个 不错不错,给力顶起~~~ 。~
  • 萁实詯噯尔
    08-02
    萁实詯噯尔
    如果没有楼主的介绍我还不知道呢
  • 木头人20
    08-02
    木头人20
    看到介绍过后,勾起了我的兴趣了啊!!~
  • 小时候的吧
    08-02
    小时候的吧
    好贴就是受关注,我也来顶顶
  • 任意随风120
    08-02
    任意随风120
    我们会永远支持 非常精彩的
  • 雕龙画凤
    08-02
    雕龙画凤
    真是力挺了
发表看法
10
4