老黄公布 Rubin GPU，2026 年登场，2027 年推Ultra，Feynman 加入

NVIDIA 公布 Rubin GPU 规划，2026 年推出，2027 年迎来 Rubin Ultra，Feynman 架构也加入路线图

NVL144 与 NVL576 配置将陆续登场

在 GTC 2025 大会上，老黄公布了 NVIDIA 最新的 数据中心 GPU 发展路线图，正式确认 Rubin GPU 平台 将于 2026 年下半年 推出，而更强大的 Rubin Ultra 计划在 2027 年 登场。此外，Feynman 架构 也被纳入 NVIDIA 的长期规划。

Rubin GPU的性能翻倍，全面升级存储与互联架构

尽管 NVIDIA Blackwell B200 刚刚全面量产，而 Blackwell B300 预计在 2025 年下半年上市，但 NVIDIA 已经开始布局未来几年服务器级 GPU 生态的演进方向。

在介绍 Rubin 之前，老黄特意指出：“Blackwell 其实命名有误。” 他解释称，Blackwell B200 实际上是 双核心设计，这导致 NVLink 互联架构发生变化。因此，尽管 B200 被称为 NVL72，但实际上更准确的叫法应该是 NV144L，而未来的 Rubin 方案将会沿用这一命名方式。

Rubin NVL144：FP4 算力提升至 3.6 PFLOPS，FP8 训练性能大增

Rubin GPU 的首发产品 NVL144 将 完全兼容现有的 Blackwell NVL72 服务器架构，但算力表现大幅提升：FP4 精度计算性能：3.6 PFLOPS（B300 NVL72 为 1.1 PFLOPS），FP8 训练算力：1.2 ExaFLOPS（B300 NVL72 仅为 0.36 ExaFLOPS），计算性能整体提升 3.3 倍。

Rubin 还将从现有的 HBM3 / HBM3e 内存升级至 HBM4，而 Rubin Ultra 则会采用 HBM4e，进一步提高带宽。每颗 GPU 的显存仍为 288GB，但内存带宽从 8 TB/s 提升至 13 TB/s。

在互联方面，NVLink 速率翻倍，总带宽达到 260 TB/s，新一代 CX9 互联 允许机架间数据交换速率提升至 28.8 TB/s（是 B300 CX8 的两倍）

Rubin Ultra，算力飙升 4 倍，最高支持 576 颗 GPU 并行计算

2027 年 Rubin Ultra 上市后，数据中心架构将迎来又一次飞跃。尽管 Rubin Ultra 仍会搭配 Vera CPU（替代当前的 Grace CPU），但 GPU 性能将迎来质变。NVL576 架构，每个机架支持 576 颗 GPU，FP4 精度推理计算：提升至 15 ExaFLOPS（Rubin NVL144 为 3.6 ExaFLOPS），FP8 训练计算：提升至 5 ExaFLOPS。

Rubin Ultra 采用四核心 GPU 封装，大幅提高计算密度，每个机架提供 365TB 高速内存（相比 Rubin NVL144 的 75TB）。但是，Rubin Ultra 在 HBM4e 内存带宽上的数据有所疑点，整体带宽 4.6 PB/s，576 颗 GPU 平均下来仅 8 TB/s / GPU，相比 Rubin NVL144 的 13 TB/s / GPU 似乎有所下降，这可能与 四核心封装 GPU 内部的互联方式 相关，但目前 NVIDIA 尚未详细解释这一点。

在互联架构方面，NVLink7 互联速率提升 6 倍，总吞吐量 1.5 PB/s，CX9 机架间互联速率提升 4 倍，达 115.2 TB/s

Rubin 之后，Feynman 架构登场，推向“千亿瓦级 AI 数据中心”

除了 Rubin 及 Rubin Ultra，NVIDIA 还在 GTC 2025 上首次提及了 Feynman 架构。按照 NVIDIA 目前的命名习惯，未来可能会推出 Richard CPU 搭配 Feynman GPU，为超大规模 AI 计算提供更强算力支持。

从 NVIDIA 的路线图来看，未来几年，数据中心 GPU 将继续朝着 更高算力、更快互联、更大带宽 的方向发展，为 AI 训练、科学计算和企业级推理任务提供前所未有的性能支持。Rubin 只是 NVIDIA AI 计算生态的下一个阶段，而 Feynman 可能会真正推动行业迈向“千亿瓦级 AI 数据中心”时代。

更多游戏资讯请关注：电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com