RTX 5090D首發測評:幀數真翻7倍,但有條件!

之前跟大家盤完英偉達 RTX 50 系發佈會後,託尼就非常好奇這回新顯卡到底提升了多少,老黃講的那幾頁 PPT 完全壓制不住我的好奇心。

於是,我們在第一時間搞來了一張 RTX 5090D ,並且爲了得出具體的性能提升數據,又搞來了一張 RTX 4090D 。

這裏就不給大家賣關子了,先說結論:壞消息是,在前代 4090 牙膏擠爆之後,這代 5090 又開始一點點地往外擠牙膏。好消息是,老黃在硬件規格這塊給你擠牙膏,但反手又給你掏出了軟件上的 “ 王炸 ” —— DLSS 4 。

總之一句話,以後你在英偉達這裏買不到純粹的光柵化性能提升了,之前 PPT 上講的 5090 遊戲翻倍提升,其實是有條件的翻倍提升。

關於 50 系顯卡的參數規格,大家可以參考外媒整理的表格,這裏我就不再展開了,省流就是:全系的紙面參數看起來都有提升。

數據來自:VideoCardz▼

而從外觀來看,這張七彩虹 RTX 5090D 採用了經典的 Advanced 系列設計,但是跟前代 4090D 比起來,整整大了一圈——這標準的 4 槽卡厚度,也太有視覺衝擊力了吧!

讓我們先來看看它的 3D Mark 跑分,在 Time Spy 測試下, 5090D 是 46597 分,比跑出了 34551 分的 4090D 強了差不多 35% 。

而在渲染壓力更高的 Time Spy EXtreme 測試下, 5090D 是 25765 分,對比 4090D 提升了約 42% 。

這個提升是啥概念呢?

根據極客灣之前的測試結果, Time Spy 下, 4090 要比 3090 強了 85% ,比 3090Ti 強了 71% ;Time Spy EXtreme 下, 4090 要比 3090 提升了 92% ,比 3090Ti 提升了 74% 。

數據來源:極客灣▼

跑分就這樣了,那實際的遊戲表現又如何呢?

咱們先上點開胃菜,先看看 GPU 負載壓力相對沒那麼高的電競遊戲。

APEX 在 4K 畫質拉滿的情況下, 5090D 平均幀可以跑到誇張的 284 幀,並且 1% Low 幀也有 193 幀。

作爲對比,前代 4090D 的平均幀是 264.8 幀, 1% Low 幀則是 174.2 幀。

一頓嘎嘎算之後,你會發現 5090D 相比前代幀數只提升了 7% 。

需要說明的一點是,我們測試的時候黑猴還沒有適配最新的 DLSS 4 ,所以正好測試下 5090D 針對 DLSS 3.5 環境的提升,而測出來的 4 組數據也挺讓人意外的——壓根沒有之前 PPT 裏說的翻倍提升,並且在畫質拉滿、開光追的情況下, 5090D 也跑不滿 60 幀。

在負載相對較低的檔位下( 4K 影視級畫質、 DLSS 超採樣清晰度 60 、幀生成開啓 ),不開光追, 5090D 的平均幀是 148 幀,比 4090D ( 109 幀 )高了 36% 。開了光追後, 5090D 只有 115 的平均幀,但仍比 4090D( 82 幀 )高了 40% 。

而在負載更高的檔位下( 4K 影視級畫質、 DLSS 超採樣清晰度 100 ,幀生成開啓 ),不開光追, 5090D 的平均幀爲 104 幀,比 4090D 提升了 39% 。開了光追後, 5090D 爲 58 幀,比前代( 40 幀 )提升了 45% 。

不過,對於已經適配了 DLSS 4 的遊戲來說, 5090D 的提升強得有點可怕。

這裏我們拿《賽博朋克 2077 》來舉例,在 4K 超級畫質下,開啓光追、關閉 DLSS , 5090D 的平均幀只有 35.45 。

而當你打開這回的 DLSS 4 多幀生成後,你就會發現老黃的魔法來了,5090D 的幀數直接暴漲到 249.82 幀,對比原來的幀數差不多是 7 倍的提升啊!

作爲對比, 4090D 在開光追、關 DLSS 的設置下,就只有 22.91 幀,即便是打開了DLSS 3 單幀生成,也就只有 90.93 幀。

在 DLSS 4 多幀生成的加持下, 5090D 的幀數直接就是前代的二點多倍。

當然,這裏我看網上有不少人在擔心 DLSS 4 的延遲和拖影問題,關於這事兒,我們後面聊 DLSS 4 再展開。

另外,這回英偉達考慮到有些遊戲還來不及適配 DLSS 4 ,所以他們直接在 NVIDIA APP 里加了一個 DLSS Override 功能——這個功能可以直接替換一部分遊戲裏內置的 DLSS 模塊。

也就是說,即使有些遊戲的開發者還沒來得及更新遊戲內置的 DLSS 集成,也能被這個 APP 的功能給強行替換成最新版本的 DLSS 4 ,從而達到 “ 強上 DLSS 4” 的目的。

那麼效果如何呢?我也替大傢伙測了一下《 漫威爭鋒 》這款遊戲。

在同樣的畫質下, 5090D 開啓 Override 4x 幀生成功能後,平均幀是 424 幀,要比不開這個功能的幀數( 214 幀 )高出 98% 。同時, 1% Low 幀也高出個 36%( 從 89 幀提升到 121 幀 )。

看到這,相信你們應該對 DLSS 4 的離譜程度有所瞭解了。那麼問題來了:這玩意兒到底是怎麼一回事呢?

以後大家的認知要被顛覆了,因爲你們以後看到的遊戲畫面,可能不都是傳統意義上的渲染畫面,有可能大部分畫面是 AI 給你生成出來的!

先說多幀生成技術,看過往期文章的小夥伴應該都知道,這回 DLSS 4 對比之前兩幀之間插一幀的 DLSS 3 , DLSS 4 這回可以在兩幀之間生成 3 幀。

所以前面的實測結果中才會出現, 5090D 超高幀率強喫 4K 光追遊戲的情況。

但咱們調侃歸調侃,老黃的這個多幀生成,還真不是友商們能隨便搞出來的東西,因爲這個東西涉及到兩個技術難點:

一個是,幀數超級加倍,性能開銷也超級加倍。另一個是,幀數翻倍,插幀延遲也會翻倍,進一步加重畫面拖影和滯後等問題。

而老黃的辦法就是 AI !

之前 DLSS 3 的單幀生成,需要用硬件( 光流加速器 )結合 AI 去給你算插幀,相當於出了兩份力才換來了一幀的提升,性能很容易就會遇到瓶頸。

現在 DLSS 的多幀生成,直接用新的 AI 幀生成模型,把軟硬件的活兒一塊給幹了,並且還幹得更加高效,一次就能生成 3 幀。

不過,雖然多幀生成的效率提高了,但老黃這邊也還要解決一個問題:開啓 DLSS 4 後, GPU 需要實時快速地運行多個 AI 模型,不然畫面生成速度會變慢,產生咱們前面說到的延遲和拖影等問題。

一方面,英偉達這次在 RTX 50 繫上掏出來的 Blackwell 架構和第五代 Tensor Core ,硬件特性就適合用來跑 AI ,這回的 AI 理論性能最高提升 2.5 倍。

另一方面,他們這回又從降低幀延遲技術入手,去提升畫面的響應速度。

之前 DLSS 3 用 Reflex 技術減少了 CPU 和 GPU 的溝通成本,讓 CPU 可以及時把最新的幀數據給到 GPU 進行渲染,這樣 GPU 就可以一直保持高效運轉狀態。

但是到了 DLSS 4 多幀生成時代,這個方法就行不太通了,因爲幀數翻倍後, CPU 處理不過來畫面的幀節奏。

是這樣的,以往不管是你看到的遊戲還是視頻畫面,都要 CPU 來穩定幀與幀之間的節奏,畫面才連貫。但多幀生成來了之後, CPU 這邊的壓力更大了,要算的幀數翻倍提升,容易出現算不準幀節奏,導致畫面延遲變高、變卡的情況。

既然如此,老黃這回就直接把控制幀節奏的任務,交給了顯卡上一個叫 Flip Metering 的模塊來跑。

總之,這代 50 系顯卡,我感覺是顛覆大家認知的一代,但很有可能會是未來 NVIDIA 很長一段時間的指導路線。

無論是現在還是以後,大家買新的英偉達顯卡,都不僅僅是爲顯卡本體的性能買單,更是爲他們的 DLSS 以及 AI 等一些系列軟件生態買單。

你要說這是好事還是壞事呢,我覺得很難說,畢竟老黃的這個軟件開發成本也是實打實的——比如他們專門用來訓練 DLSS 的大型超級計算機,每天 24 小時工作,全年無休,已經這樣幹了 6 年,那其他的人力成本和研發成本就更不用說了。

並且在未來,製程工藝的進步很有可能會進入瓶頸期,純硬件升級的收益將要面臨一個邊際效益遞減的問題,在這種情況下,英偉達搞 AI 和軟件生態不失爲一個可取的方案。

撰文:粿條

編輯:米羅&面線

美編:煥妍

圖片、資料來源

NVIDIA、VideoCardz

極客灣:RTX4090性能分析:這顯卡太強了!

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com