4K無壓力暢玩3A遊戲大作,索泰RTX4080 AMP遊戲性能深度評測

一、寫在前面

隨着NVIDIA Ada Lovelace 架構的發佈,NVIDIA GeForce RTX 40系列顯卡相繼推出,其中,4080系列和4090系列顯卡依舊是高端遊戲玩家的首選。前些天我深度測試了索泰 RTX4080 AMP EXTREME AIRO的顯卡性能以及包括《巫師3》、《賽博朋克 2077》《荒野大嫖客2》、《古墓麗影:暗影》在內的多款遊戲大作的遊戲表現,接下來和大家詳細聊一聊我的體驗結果。

二、 Ada Lovelace 架構解析

(1)GPC-TPC-SM層級架構

從完整的架構核心圖看,Ada Lovelace依然沿用了GPC-TPC-SM層級架構,最大核心的GPC規模從Ampere架構(2020年發佈的30系顯卡架構)的最大7個增加至12個,Ada Lovelace的二級緩存規模是Ampere的16倍,這些暴增的參數意味着性能的巨大提升。

Ada Lovelace架構的每組GPC包含6組TPC(每組TPC包含2組SM)、1個獨立光柵引擎(Raster Engine)、2個ROP分區(每個分區包含8個ROP單元)。這樣,Ada Lovelace架構的TPC和SM單元數量分別增長到最多72個和144個。

SM的結構也與Ampere架構一樣,有4個計算模塊,1個RT CORE光追核心(第三代)以及128KB L1緩存。

每個計算模塊包含64KB寄存器文件、零級緩存指令、16個FP32單精度浮點CUDA核心、16個FP32/INT32單精度浮點和整數混合CUDA核心、1個Warp調度器、1個分配單元、1個Tensor Core張量核心(第四代)、4個載入存儲單元以及1個特殊功能單元(SFU)用於執行圖形差值指令。

除了在架構核心方面的提升,Ada Lovelace對遊戲性能的支持主要體現在三個部分:第三代RT Core、第四代 Tensor Core、NVIDIA DLSS 3。

(2)第三代RT Core

RT Core核心在視頻、遊戲中實現實時光線追蹤,專爲處理性能需求密集的光線追蹤工作負載而設計。 全新的第三代RT Core不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峯值性能提高了一倍之多。RT Core 還配備全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。

Opacity Micro-Map引擎將光線追蹤的Alpha-Test幾何性能提升2倍;Displaced Micro-Mesh引擎可動態生成微網格產生額外的幾何圖形,從而實現幾何複雜場景的實時光線追蹤,同時所佔用的顯存只有之前的二十分之一。

例如下圖是《賽博朋克2077》遊戲中的一顆樹,通過DMM引擎可以更精準的對樹葉邊緣進行光線追蹤計算,實現真實的渲染效果,展示更多的細節。

(3)第四代 Tensor Core

Tensor Core可實現混合精度計算,動態調整算力,從而在保持準確性的同時提高吞吐量。第四代Tensor Core新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的張量處理性能,性能是上一代的5倍。

(4)DLSS 3

DLSS 3算是一系列技術結合的成果,包括全新的幀生成技術、DLSS 2超分辨率技術和NVIDIA Reflex技術,應用到遊戲中就對應了幀生成、超分辨率和NVIDIA Reflex技術,開啓這三個選項纔是完整DLSS 3。

在第四代Tensor Core的支持下,DLSS 3可以在不影響畫質和相應時間的前提下,利用AI創造更多高質量幀。

三、索泰 RTX4080 AMP EXTREME AIRO介紹

作爲一款高端顯卡,索泰 RTX4080 AMP EXTREME AIRO的設計明顯是下了一番功夫的,機身採用流線型設計,少了一些硬朗的直角,多了一些圓潤的曲線,粗狂中流露出一絲優雅,整體質感十足。

顯卡正面的幻彩裝飾條的設計靈感來源於北歐神話的彩虹橋,迎着不同角度的光線會發生不同顏色的光影效果。點亮後有炫酷的RGB燈光效果,簡直酷到沒朋友。

顯卡尺寸355mm x 166mm x 72mm,拿在手裏很厚重,個頭比索泰RTX 4070Ti大了一圈,安裝時需要佔用3.5個槽位。

索泰 RTX4080 AMP搭載ICESTORM 3.0散熱系統,有3個11cm大尺寸放生盾鱗2.0風扇,優化了扇葉的曲率和鱗狀仿生條紋,提升風量。

索泰 RTX4080 AMP內置加厚、加高的散熱鱗片模組,有9條冰脈2.0複合熱管均勻分佈,與導熱銅底和鰭片無損焊接,有利於提升散熱面積和導熱能力。

背板是高強度合金材料,一體鑄型,可以增加顯卡結構的強度,保護PCB面板,減少彎曲風險。

有3個DP 1.4接口(支持8K@60Hz視頻輸出)和1個HDMI 2.1接口(支持4K@120Hz、8K@60Hz視頻輸出)。

這麼高端的顯卡,怎麼能少了燈效。在索泰 RTX4080 AMP的頂部、正面、側面、北部共設有5個ARGB燈光區域,搭載了SPECTRA 2.0燈效系統,可以自行設定不同的顏色和效果,支持單獨設置或一鍵同步。

四、 硬件配置一覽

顯卡再高端也離不開CPU、主板、內存、硬盤等一套硬件的支持,這樣才能將性能釋放最大化。

CPU:Intel i5-13490F

英特爾i5-13490F是 一款“僅供中國大陸地區”的特定型號,10核心(6+4)16線程,最大睿頻頻率4.8GHz(性能核),基礎頻率2.5GHz(性能核),L3緩存24MB,基礎功耗65W,最大睿頻功耗148W。從規格參數看,i5-13490F算是i5-13400F的小幅增強版,前者的性能核和能效核的最大睿頻都比後者高0.2GHz,前者L3緩存24MB,後者L3緩存20MB。

Cinebench R23處理器運算能力測試中,i5-13490F多線程14765 pts,單線程1818 pts,MR Ratio 8.12x。結果比我的預期好一些,應對遊戲、文檔編輯多任務並行更能遊刃有餘。

說到這,可能會有人覺得“顯卡用RTX 4080、CPU用英特爾i5-13490F,會不會影響顯卡實力發揮呀。”這是一個典型的“高顯低U”的問題,接下來我用個一個測試告訴你答案。

判斷是不是高顯低U,可以參考遊戲中的CPU和顯卡的資源佔用率率判斷CPU是否能跑滿顯卡的性能,正常情況下,CPU佔用率在50%-75%之間,同時顯卡的佔用率在95%-99%之間,大概能說明CPU是能喫滿顯卡性能的。而如果CPU佔用率超過了80%同時顯卡佔用率低於85%,這就說明CPU跑不滿顯卡的全部性能,是典型的高顯低U。

《巫師3》遊戲中,4K分辨率時,CPU佔用率77%,顯卡佔用率98%,剛剛好喫滿顯卡,算不上高顯低U。因此,用i5-13490F+RTX 4080這套搭配去打遊戲是沒問題的。當然,如果你預算充足,建議直接上i7或者更高的i9系列,這樣基本不會存在CPU的瓶頸問題。

最後我想和大家聊一聊關於盒裝和散片CPU的個人觀點。

盒裝處理器是來自英特爾授權總代理的正版盒裝處理器。散片處理器是銷售給大批量製造商,例如宏基、華碩、戴爾、惠普或聯想的OEM版本。雖然產品規格一樣,但目前個人買到的散裝處理器大多是被挑過體質甚至裝過機的二手商品,這點你去某寶平臺看評論就明白了。並且,盒裝處理器有三年官方質保,英特爾官方不提供散裝處理器的保修服務。

所以,爲了處理器的質量和質保,強烈建議買盒裝處理器。

內存:金百達黑刃 16G*2

金百達黑刃DDR5 16G*2套條,原廠三星B-die顆粒,頻率6000MHz,時序36-36-36-80,可以滿足大型遊戲、生產力、影音娛樂等需求。這款內存條的馬甲賊帥,低調黑色馬甲,金屬拉絲工藝,質感直接拉滿。

軟件測試讀取速度86781MB/s,寫入速度83138MB/s,文件讀寫速度79859MB/s,延遲72.2ns。

SSD:金百達 KP260 2T*2

金百達KP260使用長江存儲 TLC 3D NAND顆粒,NVME PCIe 4.0 x4協議,聯芸主控,沒有物理緩存顆粒,質保寫入量1200TBW,質保3年。 這塊硬盤我用作倉庫盤,完全夠用。

實測順序讀取速度4824MB/s,順序寫入速度4457MB/s,與理論速度(5000MB/s與4500MB/s)相差無幾,4K隨機速度也很可觀。

ATTO磁盤基準測試中,金百達KP260從32KB文件開始讀寫速度穩定4GB/s左右。

路由器:華碩RT-AX86U Pro

打遊戲怎麼能沒有一個穩定、高速的網絡環境!我先是升級了千兆寬帶,然後把路由器換成了華碩RT-AX86U Pro,主要是看中了它的穩定性,畢竟AX86U的名聲在外,作爲升級款的華碩RT-AX86U Pro只能更強。

華碩RT-AX86U Pro外觀相比AX86U基本沒變化,立式設計,線條硬朗,工業氣息很足;搭載四核博通芯片,4x4 160MHz頻寬,支持AiMesh組網,不僅網絡環境穩定,如果是大戶人家,可以多買幾臺組Mesh直接WiFi全屋覆蓋。

如下圖,我監測了華碩RT-AX86U Pro的信號覆蓋情況,雖然在廚房的最北部分還是會丟失信號,但在廚房門口位置可以收到WiFi信號。對我來講這樣的表現已經滿足了,只要信號能穩定、不掉速樣就夠了。

五、性能測試

先貼上索泰 RTX4080 AMP EXTREME AIRO的紙面參數。

索泰RTX 4080 AMP採用臺積電4nm工藝的AD103核心,核心頻率爲2205/2565MHz,和公版RTX 4080的基礎核心頻率一致,Boost頻率高出了60MHz。配備16GB GDDR6X顯存,位寬256-bit,顯存頻率22.4 Gbps,功耗爲320W,推薦電源850W起步。

3DMARK Time Spy是針對2K分辨率 DirectX 12 遊戲的基準測試,測試結果22742分,顯卡得分27523分,CPU得分11462分。

▼ Time Spy測試預估幾款遊戲大作2K分辨率的幀率

Time Spy Extreme 是針對4K分辨率 DirectX 12 遊戲的性能測試,測試結果11267分,其中顯卡測試13832分,CPU測試5495分。

Port Royal顯卡光追性能測試,得分17583分。

NVIDIA DLSS功能測試,在2K分辨率下,關閉DLSS後的幀率38.17 FPS,開啓DLSS後的幀率提升到131.44 FPS,由此可見,DLSS對遊戲幀率的影響有多大。尤其開啓光線追蹤後的效果更明顯,這裏先賣個關子,後面我會結合遊戲表現爲大家更直觀的講解光線追蹤和DLSS的 作用。

六、遊戲體驗

(1)解讀光線追蹤與DLSS

關於光線追蹤與DLSS的技術理論在前面已經做了解釋,接下來看它們會給索泰RTX 4080 AMP的遊戲表現帶來哪些提升。

光線追蹤通過模擬真實世界的光纖特性渲染出更逼真的遊戲畫面,創造身臨其境般的遊戲體驗。光線追蹤是RTX系列顯卡的獨有技術,在40系顯卡提升到第3代,大幅提升了運算能力與應用性能。

以《賽博朋克 2077》爲例,通過下面兩組對比可以明顯看出光線追蹤對畫面質感、細節表現、光影效果的加成。

開啓光線追蹤後畫質和細節的表現力有非常大的提升,但也意味着更多資源的佔用,導致遊戲幀率大幅下降。這時就輪到NVDIA DLSS出場了。

前文提過,DLSS的作用是在不影響畫質和響應速度的前提下,利用AI技術創造更多高質量幀,從而提升畫面流暢度。

《賽博朋克 2077》中,4K分辨率開啓光追,DLSS打開後的幀率是關閉時約2.7倍。

關閉光追、關閉DLSS,2K分辨率幀率111 FPS,4K分辨率幀率72 FPS

開啓光追、關閉DLSS,2K分辨率幀率112 FPS,4K分辨率幀率55 FPS

開啓光追、開啓DLSS,2K分辨率幀率155 FPS,4K分辨率幀率148 FPS

那麼,CPU的性能會不會影響光追與DLSS呢?直接實測,《巫師3》4K分辨率:

關閉光追、關閉DLSS:CPU佔用率51%,功耗70.3W,顯卡佔用率76%

開啓光追、關閉DLSS:CPU佔用率57%,功耗70.9W,顯卡佔用率91%

關閉光追、開啓DLSS:CPU佔用率55%,功耗74.6W,顯卡佔用率94%

開啓光追、開啓DLSS:CPU佔用率54%,功耗72.4W,顯卡佔用率99%

在沒開啓光追和DLSS前,這顆英特爾i5-13490F處理器的佔用率在50%左右;開啓之後佔用率在55%左右。由此可見,CPU的性能並不能直接影響光線追蹤和DLSS的效果,顯卡性能的釋放纔是關鍵。不過話說回來,顯卡性能的發揮又由CPU決定,也算間接有影響吧。

(2)《巫師3》

先來對比一下光追的視覺效果。2K分辨率:

圖1關閉光追、關閉DLSS幀生成,幀率144FPS

圖2開啓光追、關閉DLSS幀生成,幀率110FPS

圖3開啓光追、開啓DLSS幀生成,幀率156FPS

從三張圖的對比中可以看出,未開啓光追時,植物看着很單薄,毫無立體感可言;開啓光追後,畫面的質感有了非常明顯改善,細節豐富度和顏色的質感都是肉眼可見的提升,前後對比好像不是同一款遊戲。

▲ 關閉光追、關閉DLSS幀生成

▲ 開啓光追、關閉DLSS幀生成

▲ 開啓光追、開啓DLSS幀生成

在4K分辨率:

圖1開啓光追、開啓DLSS幀生成,遊戲幀率175 FPS,顯卡佔用率達到98%

圖2開啓光追、關閉DLSS幀生成,遊戲幀率102 FPS,顯卡佔用率97%

圖3關閉光追、開啓DLSS幀生成,遊戲在幀率290 FPS,顯卡佔用率81%

圖4關閉光追、關閉DLSS幀生成,遊戲幀率144 FPS,顯卡佔用率56%

▲ 開啓光追、開啓DLSS幀生成

▲ 開啓光追、關閉DLSS幀生成

▲ 關閉光追、開啓DLSS幀生成

▲ 關閉光追、關閉DLSS

由此可見,光追+DLSS的確可以魚和熊掌兼得,提升畫質的同時保證遊戲的流暢度,但代價是顯卡一直處於近乎滿載的工作狀態。 還有一點,不論是2K分辨率還是4K分辨率,DLSS的功能主要提升遊戲幀率,對畫質的影響微乎其微,幾乎看不出來。

(3)《荒野大鏢客2》

2K分辨率,高畫質場景:

開啓DLSS,遊戲幀率114 FPS

關閉DLSS,遊戲幀率103 FPS

4K分辨率,高畫質場景:

開啓DLSS,遊戲幀率112 FPS

關閉DLSS,遊戲幀率87 FPS

(4)《古墓麗影:暗影》

使用遊戲自帶benchmark測試:

2K分辨率,開啓DLSS,平均幀率 204 FPS,渲染幀率31993

2K分辨率,關閉DLSS,平均幀率199 FPS,渲染幀率31165

4K分辨率,開啓DLSS,平均幀率 199 FPS,渲染幀率31325

4K分辨率,關閉DLSS,平均幀率149 FPS,渲染幀率22830

(5)《賽博朋克 2077》

在遊戲中,同時開啓光追和DLSS的幀率是最高的,畫質也是最好的,甚至2K分辨率和4K分辨率基本沒有太大變化,索泰 RTX4080 AMP的表現讓我很滿意。

七、散熱與功耗表現

這裏先聲明一點,由於風扇與散熱器的規格、頻率與功耗設置這些因素都會影響散熱結果,不同品牌型號也各有不同,所以,針對索泰 RTX4080 AMP的的測試僅供參考。

室溫26℃左右,FurMark烤機30分鐘左右,平均幀率185 FPS,顯卡核心溫度71℃左右,顯存溫度58℃,整卡功耗318W,與官方TGP基本相符。滿載風扇轉速2000 RPM,噪音控制的很不錯,基本被機箱風扇蓋住。

值得一提的是,索泰 RTX4080 AMP支持風扇智能啓動技術,通過AI管控可以在高/低溫和負載之間智能啓停,有利於減小噪音。

八、總結

得益於NVIDIA Ada Lovelace架構的更新,索泰 RTX4080 AMP EXTREME AIRO能輕鬆駕馭各種3A大作、熱門單機,不論畫質、流暢性都有非常好的表現,尤其在4K分辨率時,憑藉光線追蹤和DLSS 3的輔助,可以無壓力暢玩3A遊戲,這倒是有些出乎我的意料之外。

除此之外,英特爾i5-13490F的 表現也讓我驚喜有加,本以爲作爲13代入門級處理器喫不滿RTX 4080的性能,沒想到它竟然能帶得動,最起碼暢玩主流3A遊戲是夠用的。

總之,如果你預算充足,準備組裝一臺高配主機,索泰 RTX4080 AMP EXTREME AIRO是個不錯的選擇。至於CPU,如果沒有渲染、視頻等生產力需求,這顆i5-13490F用來玩遊戲也是夠用的。#618硬件外設#

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com