英伟达Blackwell B200图形处理器全速运行功耗高达1200瓦

微信扫一扫,分享到朋友圈

英伟达Blackwell B200图形处理器全速运行功耗高达1200瓦

英伟达 Blackwell B200 GPU 采用了比 Hopper 更先进的全新架构,但功耗几乎是 Hopper 的两倍。

英伟达 Blackwell GPU 的额定功率高达 1200W,配置多样,全部采用全新架构。

英伟达首席执行官黄仁勋(Jensen Huang)在 GTC 2024 主题演讲中宣布 Blackwell 时,缺乏大量的技术和架构信息。但在接下来几天的 GTC 期间,英伟达分享了更多细节,但仍然没有过多地深入探讨我们所期待的技术问题。新细节由 Jonah Albe(英伟达高级副总裁兼 GPU 架构师)和 Ian Buck(英伟达超大规模与高性能计算副总裁)透露。

英伟达Blackwell B200图形处理器全速运行功耗高达1200瓦插图

Blackwell GPU--采用全新架构,专为人工智能时代而设计。

首先,我们都知道 Blackwell 将是对 Hopper 架构的重大升级,而 Jonah 表示 Blackwell 采用的微架构与 Hopper 完全不同,看来 Blackwell 的升级不止于此。

英伟达Blackwell B200图形处理器全速运行功耗高达1200瓦插图1

我们对 Blackwell 的了解是,它采用了第二代变形引擎技术,增加了 FP4 和 FP6 计算格式。这些格式和新的软件优化使 Blackwell 成为全球同类产品中速度最快的人工智能芯片,但这对其标准 FP64 计算能力造成了影响,与 hopper 相比,它的计算能力只提高了 32%。原因很简单,Blackwell 首先是一款人工智能芯片,这是它的主要目标市场。从人工智能的角度来看,FP64 并不那么重要,而且越低,推理和训练能力就越快。

此外,走 MCM 芯片组路线的原因恰好是需要提高整体性能,而不是提高产量。英伟达首创的 MCM 方案在实际应用中效果如何,我们拭目以待,因为我们谈论的是在同一封装上运行的两个 GPU。有人提到,CUDA 在处理两个 GPU 和不同架构方面做得相当好,不需要程序员做大的改动。

GB200 GPU 是 Blackwell 的完整规格,比 Hopper 多 500W 功率。

在发布会上,围绕所有 Blackwell GPU 和平台变体出现了特别大的混乱。Jensen 表示,Blackwell 并不是一个 GPU,它是一个完整的平台,该平台有一系列产品,但它们仍然基于 GPU。截至目前,英伟达官方已经公布了三种Blackwell GPU变体。

其中包括用于 GB200 超级芯片平台的旗舰级全规格 B200。该芯片具有最高等级的计算能力,最大 TDP 为 1200 瓦。这要比 TDP 为 700 瓦的 Hopper H100 多出 500 瓦。整个超级芯片配备了两个 B200 GPU 和一个 Grace CPU,功率高达 2700W(B200 1200W x 2 + 300W CPU/IO)。

英伟达Blackwell B200图形处理器全速运行功耗高达1200瓦插图2

接下来是用于 DGX 和 HGX 平台的 Blackwell B200,其优化功率约为 1000W,性能几乎是全配置版本的 90%。目前尚不清楚该型号是否仅降低了 TDP,还是与全配置相比降低了规格。最后是 Blackwell B100,它是经过进一步调整的变体,TDP 为 700W。该型号的功率约为 B200(1000W)的 80%,B200(1200W)的 70%。

未来有可能推出单芯片 Blackwell GPU 变体,特别是用于 PCIe 平台。Blackwell GPU 架构已被纳入消费级 RTX 和 AI 平台,如 Drive Thor 和未来的 GeForce 系列。英伟达的 Blackwell GB200 GPU 将于今年晚些时候开始向首批主要人工智能客户发货,随后将开始批量生产。

上一篇

苹果或在 iOS 18 和 iPhone 16 中集成百度生成式人工智能技术

下一篇

传三星的 3nm 良品率提高了3倍:但仍落后于台积电

你也可能喜欢

评论已经被关闭。

插入图片

排行榜

返回顶部