近日,黄仁勋让海外科技圈提前享受了圣诞节的喜悦。由于硅、封装以及芯片背板的问题,英伟达的Blackwell GPU曾多次传出延迟发布的消息,但这并未阻止英伟达持续推进产品更新。在GB200和B200发布6个月后,英伟达宣布将推出全新的GPU GB300和B300。外界可能以为这是一个循序渐进的过程,但实际上,这是非常高效的迭代。
全新GPU为大模型的推理和训练性能带来了巨大的提升,对于大模型公司和存储供应商来说,无疑是一份巨大的圣诞礼物。B300是台积电4NP工艺(英伟达定制工艺,属于5nm制程节点的一部分)节点上的一个全新流片。定制化工艺做了调整设计,专用于计算芯片,使得B300浮点运算比B200高50%,热设计功耗分别达到1.4KW和1.2KW,比GB200和B200分别低0.8KW。
此外,内存从8-Hi(8层堆叠)升级到12-Hi HBM3E,每个GPU容量增加到288GB,但引脚速度保持不变,所以每个GPU内存带宽仍然是8TB/s。不过,在未来9个月内,他们都没有机会拿到GB200和GB300订单。
更值得一提的是,全新的NVL72架构使得72个GPU能够共享内存且延迟极低。这项技术在处理同一问题时,可以搜索更多样本,以提高准确性,最终提升模型性能,因此NVL72在推理中的性价比比之前提高了10倍以上。
然而,在供应链方面,有一些变化也引起了关注。在GB300平台上,不再提供整个BIanca板,而只提供“SXM Puck”模块上的B300以及Grace CPU。此外,由于VRM将由超大规模厂商或者OEM直接从VRM供应商处采购,这也对现有的供应链结构造成了一定的影响。而对于亚马逊这样的用户而言,它们不得不使用NVL36而非NVL72,因为无法部署NVL72架构,从而导致成本更高。
总之,此次更新展示了英伟达在AI领域如何通过不断创新来保持领先地位,同时,也揭示了行业中供需关系与市场策略之间复杂互动的情况。不仅如此,还透露出了不同企业对于资源配置优化所持有不同态度,为我们展现了一幅充满竞争与机遇的大数据时代画面。