RTX 5090D首发测评:帧数真翻7倍,但有条件!

之前跟大家盘完英伟达 RTX 50 系发布会后,托尼就非常好奇这回新显卡到底提升了多少,老黄讲的那几页 PPT 完全压制不住我的好奇心。

于是,我们在第一时间搞来了一张 RTX 5090D ,并且为了得出具体的性能提升数据,又搞来了一张 RTX 4090D 。

这里就不给大家卖关子了,先说结论:坏消息是,在前代 4090 牙膏挤爆之后,这代 5090 又开始一点点地往外挤牙膏。好消息是,老黄在硬件规格这块给你挤牙膏,但反手又给你掏出了软件上的 “ 王炸 ” —— DLSS 4 。

总之一句话,以后你在英伟达这里买不到纯粹的光栅化性能提升了,之前 PPT 上讲的 5090 游戏翻倍提升,其实是有条件的翻倍提升。

关于 50 系显卡的参数规格,大家可以参考外媒整理的表格,这里我就不再展开了,省流就是:全系的纸面参数看起来都有提升。

数据来自:VideoCardz▼

而从外观来看,这张七彩虹 RTX 5090D 采用了经典的 Advanced 系列设计,但是跟前代 4090D 比起来,整整大了一圈——这标准的 4 槽卡厚度,也太有视觉冲击力了吧!

让我们先来看看它的 3D Mark 跑分,在 Time Spy 测试下, 5090D 是 46597 分,比跑出了 34551 分的 4090D 强了差不多 35% 。

而在渲染压力更高的 Time Spy EXtreme 测试下, 5090D 是 25765 分,对比 4090D 提升了约 42% 。

这个提升是啥概念呢?

根据极客湾之前的测试结果, Time Spy 下, 4090 要比 3090 强了 85% ,比 3090Ti 强了 71% ;Time Spy EXtreme 下, 4090 要比 3090 提升了 92% ,比 3090Ti 提升了 74% 。

数据来源:极客湾▼

跑分就这样了,那实际的游戏表现又如何呢?

咱们先上点开胃菜,先看看 GPU 负载压力相对没那么高的电竞游戏。

APEX 在 4K 画质拉满的情况下, 5090D 平均帧可以跑到夸张的 284 帧,并且 1% Low 帧也有 193 帧。

作为对比,前代 4090D 的平均帧是 264.8 帧, 1% Low 帧则是 174.2 帧。

一顿嘎嘎算之后,你会发现 5090D 相比前代帧数只提升了 7% 。

需要说明的一点是,我们测试的时候黑猴还没有适配最新的 DLSS 4 ,所以正好测试下 5090D 针对 DLSS 3.5 环境的提升,而测出来的 4 组数据也挺让人意外的——压根没有之前 PPT 里说的翻倍提升,并且在画质拉满、开光追的情况下, 5090D 也跑不满 60 帧。

在负载相对较低的档位下( 4K 影视级画质、 DLSS 超采样清晰度 60 、帧生成开启 ),不开光追, 5090D 的平均帧是 148 帧,比 4090D ( 109 帧 )高了 36% 。开了光追后, 5090D 只有 115 的平均帧,但仍比 4090D( 82 帧 )高了 40% 。

而在负载更高的档位下( 4K 影视级画质、 DLSS 超采样清晰度 100 ,帧生成开启 ),不开光追, 5090D 的平均帧为 104 帧,比 4090D 提升了 39% 。开了光追后, 5090D 为 58 帧,比前代( 40 帧 )提升了 45% 。

不过,对于已经适配了 DLSS 4 的游戏来说, 5090D 的提升强得有点可怕。

这里我们拿《赛博朋克 2077 》来举例,在 4K 超级画质下,开启光追、关闭 DLSS , 5090D 的平均帧只有 35.45 。

而当你打开这回的 DLSS 4 多帧生成后,你就会发现老黄的魔法来了,5090D 的帧数直接暴涨到 249.82 帧,对比原来的帧数差不多是 7 倍的提升啊!

作为对比, 4090D 在开光追、关 DLSS 的设置下,就只有 22.91 帧,即便是打开了DLSS 3 单帧生成,也就只有 90.93 帧。

在 DLSS 4 多帧生成的加持下, 5090D 的帧数直接就是前代的二点多倍。

当然,这里我看网上有不少人在担心 DLSS 4 的延迟和拖影问题,关于这事儿,我们后面聊 DLSS 4 再展开。

另外,这回英伟达考虑到有些游戏还来不及适配 DLSS 4 ,所以他们直接在 NVIDIA APP 里加了一个 DLSS Override 功能——这个功能可以直接替换一部分游戏里内置的 DLSS 模块。

也就是说,即使有些游戏的开发者还没来得及更新游戏内置的 DLSS 集成,也能被这个 APP 的功能给强行替换成最新版本的 DLSS 4 ,从而达到 “ 强上 DLSS 4” 的目的。

那么效果如何呢?我也替大家伙测了一下《 漫威争锋 》这款游戏。

在同样的画质下, 5090D 开启 Override 4x 帧生成功能后,平均帧是 424 帧,要比不开这个功能的帧数( 214 帧 )高出 98% 。同时, 1% Low 帧也高出个 36%( 从 89 帧提升到 121 帧 )。

看到这,相信你们应该对 DLSS 4 的离谱程度有所了解了。那么问题来了:这玩意儿到底是怎么一回事呢?

以后大家的认知要被颠覆了,因为你们以后看到的游戏画面,可能不都是传统意义上的渲染画面,有可能大部分画面是 AI 给你生成出来的!

先说多帧生成技术,看过往期文章的小伙伴应该都知道,这回 DLSS 4 对比之前两帧之间插一帧的 DLSS 3 , DLSS 4 这回可以在两帧之间生成 3 帧。

所以前面的实测结果中才会出现, 5090D 超高帧率强吃 4K 光追游戏的情况。

但咱们调侃归调侃,老黄的这个多帧生成,还真不是友商们能随便搞出来的东西,因为这个东西涉及到两个技术难点:

一个是,帧数超级加倍,性能开销也超级加倍。另一个是,帧数翻倍,插帧延迟也会翻倍,进一步加重画面拖影和滞后等问题。

而老黄的办法就是 AI !

之前 DLSS 3 的单帧生成,需要用硬件( 光流加速器 )结合 AI 去给你算插帧,相当于出了两份力才换来了一帧的提升,性能很容易就会遇到瓶颈。

现在 DLSS 的多帧生成,直接用新的 AI 帧生成模型,把软硬件的活儿一块给干了,并且还干得更加高效,一次就能生成 3 帧。

不过,虽然多帧生成的效率提高了,但老黄这边也还要解决一个问题:开启 DLSS 4 后, GPU 需要实时快速地运行多个 AI 模型,不然画面生成速度会变慢,产生咱们前面说到的延迟和拖影等问题。

一方面,英伟达这次在 RTX 50 系上掏出来的 Blackwell 架构和第五代 Tensor Core ,硬件特性就适合用来跑 AI ,这回的 AI 理论性能最高提升 2.5 倍。

另一方面,他们这回又从降低帧延迟技术入手,去提升画面的响应速度。

之前 DLSS 3 用 Reflex 技术减少了 CPU 和 GPU 的沟通成本,让 CPU 可以及时把最新的帧数据给到 GPU 进行渲染,这样 GPU 就可以一直保持高效运转状态。

但是到了 DLSS 4 多帧生成时代,这个方法就行不太通了,因为帧数翻倍后, CPU 处理不过来画面的帧节奏。

是这样的,以往不管是你看到的游戏还是视频画面,都要 CPU 来稳定帧与帧之间的节奏,画面才连贯。但多帧生成来了之后, CPU 这边的压力更大了,要算的帧数翻倍提升,容易出现算不准帧节奏,导致画面延迟变高、变卡的情况。

既然如此,老黄这回就直接把控制帧节奏的任务,交给了显卡上一个叫 Flip Metering 的模块来跑。

总之,这代 50 系显卡,我感觉是颠覆大家认知的一代,但很有可能会是未来 NVIDIA 很长一段时间的指导路线。

无论是现在还是以后,大家买新的英伟达显卡,都不仅仅是为显卡本体的性能买单,更是为他们的 DLSS 以及 AI 等一些系列软件生态买单。

你要说这是好事还是坏事呢,我觉得很难说,毕竟老黄的这个软件开发成本也是实打实的——比如他们专门用来训练 DLSS 的大型超级计算机,每天 24 小时工作,全年无休,已经这样干了 6 年,那其他的人力成本和研发成本就更不用说了。

并且在未来,制程工艺的进步很有可能会进入瓶颈期,纯硬件升级的收益将要面临一个边际效益递减的问题,在这种情况下,英伟达搞 AI 和软件生态不失为一个可取的方案。

撰文:粿条

编辑:米罗&面线

美编:焕妍

图片、资料来源

NVIDIA、VideoCardz

极客湾:RTX4090性能分析:这显卡太强了!

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com