当前位置：首页 > 智能输送方案 > 英伟达B300AI推理的加速器2023年最新处理器排行榜中的下马威

英伟达B300AI推理的加速器2023年最新处理器排行榜中的下马威

智能输送方案
2025-05-13 14:08
0

近日，黄仁勋让海外科技圈提前享受了圣诞节的喜悦。由于硅、封装以及芯片背板的问题，英伟达的Blackwell GPU曾多次传出延迟发布的消息，但这并未阻止英伟达持续推进产品更新。在GB200和B200发布6个月后，英伟达宣布将推出全新的GPU GB300和B300。外界可能以为这是一个循序渐进的过程，但实际上，这是非常高效的迭代。

全新GPU为大模型的推理和训练性能带来了巨大的提升，对于大模型公司和存储供应商来说，无疑是一份巨大的圣诞礼物。B300是台积电4NP工艺（英伟达定制工艺，属于5nm制程节点的一部分）节点上的一个全新流片。定制化工艺做了调整设计，专用于计算芯片，使得B300浮点运算比B200高50%，热设计功耗分别达到1.4KW和1.2KW，比GB200和B200分别低0.8KW。

此外，内存从8-Hi（8层堆叠）升级到12-Hi HBM3E，每个GPU容量增加到288GB，但引脚速度保持不变，所以每个GPU内存带宽仍然是8TB/s。不过，在未来9个月内，他们都没有机会拿到GB200和GB300订单。

更值得一提的是，全新的NVL72架构使得72个GPU能够共享内存且延迟极低。这项技术在处理同一问题时，可以搜索更多样本，以提高准确性，最终提升模型性能，因此NVL72在推理中的性价比比之前提高了10倍以上。

然而，在供应链方面，有一些变化也引起了关注。在GB300平台上，不再提供整个BIanca板，而只提供“SXM Puck”模块上的B300以及Grace CPU。此外，由于VRM将由超大规模厂商或者OEM直接从VRM供应商处采购，这也对现有的供应链结构造成了一定的影响。而对于亚马逊这样的用户而言，它们不得不使用NVL36而非NVL72，因为无法部署NVL72架构，从而导致成本更高。