iGame GeForce RTX 4080 16GB Vulcan OC首發測評

大家好,我是黃昏百分百,很榮幸獲得了英偉達與七彩虹的聯合邀請,參與到RTX 4080顯卡的媒體首測中來,在上代安培架構的首發測評中,我分別測試了iGame GeForce RTX 3080 Advance OC 10G與iGame GeForce RTX 3080 Vulcan OC 10G兩款顯卡。爲此,本次我專門申請了全新一代的iGame GeForce RTX 4080 16GB Vulcan OC顯卡。

今天我將通過全新顯卡技術介紹與性能實測,幫助大家詳細瞭解採用Ada架構的RTX 40系顯卡到底有着多麼巨大的架構與性能進步。

好了,廢話不再多說,我們開車吧。

Ada Lovelace 架構優勢分析

說到RTX 40系顯卡,首先自然要爲大家介紹一下其在製作工藝與架構上的升級,這裏我先爲大家介紹一下全新的Ada Lovelace架構。

新架構,新制程

▲NVIDIA Ada Lovelace 架構作爲 GeForce RTX 40 系列顯卡的核心,必須要放在最前面說。Ada 架構基於定製的 TSMC 4N 工藝,晶體管數量從上一代的 280 億個激增至 760 億個,是目前世界上工藝最精湛的 GPU 架構。

▲從圖靈架構開始,英偉達開始採用 流式多處理器 (Streaming Multiprocessor,SM)架構以執行光線追蹤等運算工作,上圖左側爲全新Ada架構,右側爲30系所使用的安培架構,從圖中可以看出,SM佈局基本與上代保持一致,而最核心的變化便是其內Ada 4代 Tensor Core取代了安培架構中的3代的Tensor,用於光線追蹤的RT CORE從安培架構的第二代RT CORE升級到了第三代RT CORE。不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峯值性能提高了一倍之多。

▲而每兩個SM組成一個紋理處理集羣(Texture Processing Clusters,TPCs),再由多個TPC組成一個圖形處理集羣(Graphics Processing Clusters,GPCs)。

▲而Ada架構的GPU則是由多個GPC組成的,以一個完整的AD 102芯片爲例,其擁有12個GPC,72個TPC,144個SM,18432個 CUDA核心。

▲而RTX 4080的GPU芯片中共擁有9728個CUDA核心,並搭載了16GB 的256bit GDDR6X顯存。

▲技術方面,ADA架構的RTX顯卡還帶來了着色器執行重排序、微網格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。這幾個技術,我會在後面詳細介紹。

▲最後,在能效比方面,Ada 架構的效率也令人感到不可思議:在相同的功率下,其性能相較安培架構最高可達兩倍以上;增大功率,性能還能持續提升。

第三代光線追蹤 畫面更加真實

這裏先說一下着色器執行重排序 (SER) 技術吧。

▲高級光線追蹤技術需要計算同一場景中數百萬條光線照射在諸多不同類型材質上的效果,這就使得着色器只能低效地處理一系列截然不同的工作負載。(在渲染 3D 場景時,着色器用於計算恰當的亮度、暗度和顏色級別。每一款現代遊戲都需要使用到着色器。)

着色器執行重排序 (SER) 技術能夠動態調整這些工作負載的順序,讓原本低效的流程變得異常高效。SER 可將光線追蹤操作的着色器性能最高提升 2 倍,或將遊戲的幀率最高提升 25%。

▲通俗一點說,SER技術便是通過將排序,使顯卡由逐個運算加法改爲了運算乘法,自然效率能夠得到大幅提升,同時不會增加顯示延遲。

▲緊接着我們再說一下第三代RT CORE新搭載的兩款引擎,除了在安培架構中已經使用的Box Intersection Engine與Triangle Intersection Engine兩款引擎。Ada架構搭載的新款 RT CORE 還配備全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。

▲OMM 引擎可大幅提升對 alpha 測試紋理進行光線追蹤的速度,此類紋理通常應用於樹葉、顆粒,圍欄等。

▲以樹葉爲例,全新ADA架構RT Core搭載的OMM引擎可將樹葉分爲全透明部分,不透明部分與半透明部分,大幅減少着色器工作量,進而明顯降低光線追蹤對遊戲性能的影響。

▲左側爲未開啓OMM引擎時的着色器工作量,右側爲OMM引擎開啓後的着色器工作量,可見OMM的性能立竿見影。

▲而面對珊瑚蟹這種極不規則,超多個平面(三角形)的物體,則需要DMM引擎來提升光追性能了。

▲相較於安培架構需要將多個三角形與複雜的BVH放入RT CORE中進行處理,ADA機構可以將圖形轉化爲一個基礎的三角形,一個Displace Map與一個簡單的BVH,再放入RT CORE中進行處理。

▲因此,DMM 引擎能夠以近乎 9 倍的速度構建光線追蹤邊界體積層次結構 (BVH),而所佔用的顯存只有之前的二十分之一。從而實現幾何複雜場景的實時光線追蹤。

DLSS 3 讓幀數起飛

▲有一說一,光線追蹤還是會對遊戲幀數有一定的負面影響的,所以就需要DLSS來提升遊戲幀數了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度學習超級採樣),是一種通過基於 AI 的超高分辨率重新定義實時渲染,即渲染更少的像素,然後使用 AI 構建更清晰、更高分辨率的圖像的方法,可以有效的在不犧牲畫質的情況下通過AI算法提升遊戲的幀率表現。

▲從圖靈架構的RTX 20系顯卡開始,DLSS技術隨着顯卡架構一起進化,目前已經進化到了第三代DLSS,除了代表性的DLSS 超分辨率技術,還融合了DLSS幀生成技術與NVIDIA Reflex技術。

▲這裏重點說一下DLSS 3中的潛在幀生成技術,其可通過對前後幀的分析,在兩幀之間插入一幀,進而是遊戲幀數有着近乎翻倍的提升。肯定有朋友會問,這個插幀技術與電視常用的MEMC插幀技術相比有什麼區別。

▲這裏便要說,電視因爲其不參與畫面渲染的過程,所以只能夠通過算法與預測中間幀應該顯示的畫面,難免在陰影方面出現不準確的情況,導致插幀後畫面不自然。而英偉達顯卡的DLSS 潛在幀生成技術因爲是在渲染過程中在光流加速器中發生的,所以可以獲得準確的運動矢量(MOTION VECTORS),所以可以準確預測出中間畫面所處的狀態, 自然畫面陰影效果就十分準確了。同時,生成的幀不需要CPU提供數據,因此整體幀率可以超過CPU渲染的幀率限制,大幅降低了對CPU性能的要求。

▲同時,DLSS 3 潛在幀生成技術與超分辨率技術結合,渲染1080P分辨率的原始畫面,再超分辨率到4K畫面,同時,2個4K分辨率的幀之間再生成一幀。所以,平均兩個4K幀中,只有一張1080P的幀是CPU與顯卡實際渲染的,佔總生成畫面的八分之一,可見DLSS技術對幀數提升之大。

截至11月15日發文,已有10款DLSS 3遊戲發佈:

1.《瘟疫傳說:安魂曲》(A Plague Tale: Requiem)

2.《光明記憶:無限》(Bright Memory: Infinite)

3.《毀滅全人類2:重新探測》(Destroy All Humans! 2 - Reprobed)

4.《暗影火炬城》(F.I.S.T.: Forged in Shadow Torch)

5.F1 ® 22

6.《逆水寒》(Justice)

7.《生死輪迴》(Loopmancer)

8.《漫威蜘蛛俠:重製版》 (Marvel’s Spider-Man Remastered)

9.《微軟模擬飛行》(Microsoft Flight Simulator )

10.《超級人類》(SUPER PEOPLE)

其中,《逆水寒》、《瘟疫傳說:安魂曲》我在RTX 4090首測中有所設涉及,本次還加入了《光明記憶:無限》、《毀滅全人類2:重新探測》、《暗影火炬城》、《生死輪迴》四款正式版遊戲的實測。除了DLSS 3普及速度非常快之外,以上10款遊戲有4款爲國產遊戲,可見國產遊戲在新技術的使用上還是非常厲害的,後續文章中我會詳細與大家聊。

另外,WRC Generations, 《極品飛車:不羈》(Need for Speed Unbound)和 《戰錘40K:暗潮》(Warhammer 40,000: Darktide) 在RTX 4080推出後不久就會發布,聖誕節前玩家就可暢玩這些DLSS 3遊戲。

書歸正傳,我們來比較一下DLSS開啓後對畫面效果的影響,左側爲DLSS性能模式下的4K分辨率,右側爲原生4K畫質:

▲首先看一看《賽博朋克2077》BenchMark中的截圖,整體畫面一眼看上去基本無差異,DLSS似乎能夠無比接近原生分辨率了。

▲背景中的這個欄杆,DLSS畫面還要比原生4K畫質更加銳利清晰。

▲不過,背景的瓷磚上,開啓DLSS後還是稍微有一點糊的,不過如果不像我這樣放大多倍去找茬,是根本發現不了的。

▲在同BenchMark的酒吧場景中,DLSS開啓後,畫面效果則要明顯比未開啓DLSS時更加的透徹,頂部招牌也更加的銳利清晰,個人覺得本場景下DLSS的畫質要明顯優於原生4K分辨率。

▲同樣,在網易大作逆水寒的測試中,DLSS開啓後的地磚,相較原生4K分辨率的地磚,紋理上也更加清晰,可見在有光照充足的畫面中,開啓DLSS後的畫面甚至可能超過原生4K分辨率的畫質,且其能偶帶來大幅度的幀數上升,還是很值得開啓的。

NVIDIA REFLEX 低延遲技術

▲NVIDIA REFLEX 低延遲技術主要分爲NVIDIA REFLEX SDK與NVIDIA Reflex延遲分析器,其中NVIDIA Reflex延遲分析器涉及到了外設、顯示器等其它硬件,本文不做涉及,近介紹一下NVIDIA REFLEX SDK。

▲在傳統的圖像處理流程中,如果CPU 處理幀的速度快於 GPU 渲染幀的速度(高U低顯),則會在CPU到GPU之間有一個等待渲染幀的隊列,進而導致渲染延遲的增加。

▲而通過將NVIDIA REFLEX SDK直接集成到遊戲中,就可以使CPU的幀處理速度與GPU的渲染速度保持同步,大幅降低渲染隊列,並降低CPU背壓,進而使遊戲能夠採樣鍵鼠等外設最新的輸入。最終降低畫面與輸入延遲,提高遊戲體驗。目前,NVIDIA REFLEX技術已經被集成在了DLSS 3中。


RTX 4080 全新旗艦級遊戲顯卡

自從英偉達在安培架構中新增了RTX 3090與RTX 3090 Ti這兩款24GB顯存的顯卡,可以說將圖靈架構時代單獨命名的TITAN RTX這個生產力工具級別的顯卡正式併入了GeForce RTX系列。因此,無論是上代的RTX 3090(Ti)還是本代的RTX 4090,更多情況下還是被當作生產力工具使用,亦或者用來遊玩8K與VR遊戲,而RTX 4080這個級別的顯卡往往更被遊戲玩家所喜愛,完全可以視作全新的旗艦級遊戲顯卡,所以我們首先來測試一下iGame GeForce RTX 4080 16GB Vulcan OC 的遊戲性能。

測試平臺簡介

本次我分別測試了全新的iGame GeForce RTX 4080 16GB Vulcan OC與上一代安培架構的iGame GeForce RTX 3080 Vulcan OC 10G,兩款火神顯卡,無論是從英偉達的GPU芯片定位,還是從七彩虹 iGame的顯卡產品線定位,都完全一致,所以用於比較兩代顯卡架構與性能上的差距再好不過。

另外,因爲我還有幸參與了GeForce RTX 4090的首發測評,當時Intel 13代酷睿處理器的性能測試尚未解禁,當時用的便是12代酷睿 i9-12900K進行測試,本次爲了將RTX 4090的性能測試得分同樣放入比較,故儘可能的控制變量,依舊使用12代酷睿i9-12900K處理器進行測試,望周知。

iGame GeForce RTX 4080 16GB Vulcan OC參數對比

▲可以看到,iGame GeForce RTX 4080 16GB Vulcan OC相較於iGame GeForce RTX 3080 Vulcan OC 10G,在芯片製程、CUDA數量與核心頻率上均有提升,其中一鍵超頻核心頻率更是上升了47%,這在顯卡上來說,絕對是巨幅提升。

而在顯存方面,RTX 4080 16GB提升了頻率而降低了顯存位寬,兩者的顯存總帶寬差的並不大,個人覺得是爲了降低GDDR6X的發熱,同時大顯存也可以一定程度上放置爆顯存的發生,這點晚一點我們再來測試。

全新iGame GeForce RTX 4080 16GB Vulcan OC相較於上代火神擁有更爲凌厲的造型,獨特的錆鐵色金屬外骨骼更顯兇悍,爲其強勁的性能做出警告。作爲後賽博時代的高端硬件,系列經典的銳利三角元素也將完美傳承。漆黑的底色體現了它低調的個性,打造鋒銳冷酷的高端硬件。9翼扇葉如鐮刀般鋒利厚實,散熱性能甚至比前代13翼扇葉的風扇更加強勁,而且整體也顯得更加簡潔。

▲背板也經過了優化,部分鋁製散熱鱗片直接露出,大幅加大了與空氣的接觸面積,同時方面熱空氣向上流動,通過CPU水冷的燈牌排出機箱,避免造成悶罐。

▲而iGame 火神顯卡最具識別度的LCD顯示屏在本世代得到了巨大升級,不僅屏幕分辨率提升到了800*216px,畫面更加清晰,而且採用磁吸式分體設計,無論顯卡橫裝、豎裝,屏幕內容總在你面前。

▲磁吸式分體設計的另一個好處便是其可以配合着底座獨立顯示內容,成爲可愛的桌面擺件,也可以更好的幫助玩家實時監控遊戲幀數與電腦性能。

▲將LCD屏幕取下時,也不用擔心顯卡沒有燈效而難看,iGame專門提供了燈光配件,同樣採用磁吸設計,貼上之後,炫酷的RGB立刻就回來啦!

▲通過全新的iGame Center軟件,不僅可以調整硬件燈效,快捷的進行硬件超頻,還可以爲Vulcan系列顯卡(包括之前幾代Vulcan火神顯卡)的LCD屏定製輸出圖案,且不只是靜態圖片,gif動圖同樣可以完美顯示,之前我在RTX 3080Ti首發測評時做了動圖,本次實在是沒有時間,爭取下一次再補上。

▲接口方面,依舊是3DP1.4a+1HDMI2.1的配置,另外,一鍵超頻按鈕也從RTX 3090Ti起便進行的工藝升級,目前不僅手感更好,而且更不易損壞。

▲供電方面,英偉達在RTX 3090 Ti時便正式改爲了PCIe5.0標準的12+4 Pin接口,七彩虹iGame GeForce RTX 4080 16GB Vulcan OC自然採用的也是PCIe5.0標準的12+4 Pin接口,配合着七彩虹爲火神設計的22+4項供電,可以爲顯卡的性能釋放提供充足的保障。

最後這裏友情提示一下:iGame GeForce RTX 4080 16GB Vulcan OC的尺寸爲348.5*159.5*70.4mm(含擋片) ,購買機箱前請仔細確認尺寸,另外,別問我是怎麼知道的。

3DMark Fire Strike Ultra 測試

▲3D MARK專爲DirectX 12設計的Time Spy Extreme, Time Spy是一個DirectX 12 基準測試,支持原生新的API 功能,如異步計算,顯式多顯卡適配器技術和多線程,而其Extreme版本則是將分辨率提升至4K。

▲iGame GeForce RTX 4080 16GB Vulcan OC的3D Mark Fire Strike Ultra總得分與顯卡得分分別爲17324,17221,相較於RTX 3080 10GB的得分11261與10997分別提升了54%與57%。

3D MARK Time Spy Extreme

▲Fire Strike 是一項適用於高性能遊戲電腦和超頻系統的 DirectX 11 基準測試。即使對於最新的顯卡而言,Fire Strike 測試也非常嚴苛,而Fire Strike Ultra是其4K版本。

▲iGame GeForce RTX 4080 16GB Vulcan OC的3D Mark Time Spy Extreme總得分與顯卡得分分別爲13038,14035,相較於RTX 3080 10GB的得分8935與8895分別提升了46%與58%。

通過3D Mark的測試,我們基本得知了,在4K分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC的遊戲性能基本上可達到RTX 3080 10GB的1.5倍以上,這還是未開啓DLSS的情況下的結果,緊接着,我們就來測試一下兩款顯卡在DLSS開啓後的性能表現。

3D Mark DLSS test 遊戲性能測試

▲3D Mark DLSS test是專門測試顯卡DLSS性能的基準測試,其測試原理爲連續進行兩次的3D Mark Port Royal 光線追蹤 基準測試,第一次爲關閉DLSS功能,第二次爲開啓DLSS功能,通過遊戲幀數變化來測試DLSS功能對遊戲性能的提升,目前3D Mark DLSS test 1.3版本已經支持DLSS 3的潛在幀生成技術。

在4K 分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC在DLSS關閉時平均幀率爲39幀,開啓DLSS3後幀數暴漲爲131幀,是未開啓DLSS 3前的3.36倍。

而RTX 3080 10GB在未開啓DLSS時基本上卡成PPT了,開啓DLSS之後則可以達到平均幀率66幀。

可見,在4K分辨率下,均開啓DLSS時,iGame GeForce RTX 4080 16GB Vulcan OC的幀率是RTX 3080 10GB的2倍。

而且,在顯卡壓力異常嚴苛的3DMark測試中,iGame GeForce RTX 4080 16GB Vulcan OC依舊有着131 FPS的高幀率,在其他遊戲中跑到144 FPS並不是很難,也就意味着其可以跑滿目前高端4K電競顯示器 144Hz甚至是160Hz的刷新率,高端顯卡與高端遊戲顯示器的性能,終於達到同步了!

另外,3D Mark DLSS test可在不使用8K顯示設備的情況看下進行8K遊戲的幀數測試,所以家境貧寒如黃昏我,也可以測試顯卡的8K分辨率遊戲表現了。

在8K分辨率下,如果關閉DLSS,兩塊顯卡都卡在了1幀能玩的狀態,應該是顯存爆了,而開啓DLSS後,iGame GeForce RTX 4080 16GB Vulcan OC則能夠提供68 FPS的幀率,是RTX 3080 10GB的30 FPS的2.27倍。兩塊顯卡剛好適配8K 60Hz與8K 30Hz的顯示設備。

《F1 22》 BenchMark

▲遊戲測試中,F1Ⓡ 22爲例,它支持NVIDIA DLSS和光線追蹤不透明反射、光線追蹤透明反射、光線追蹤環境光遮蔽和光線追蹤陰影幾項技術,上次測試RTX 4090的時候,用的還是內測版本,而現在正式版也已經更新,開始支持DLSS 3並內置了Benchmark。

▲在BenchMark測試中,iGame GeForce RTX 4080 16GB Vulcan OC開啓DLSS 3時幀率爲192 FPS,1%爲167 FPS,均可以跑滿目前最高端的遊戲顯示器。

而關閉DLSS後,iGame GeForce RTX 4080 16GB Vulcan OC依舊可以提供78的平均幀率與52的1% Low 幀率,所以如果你依舊在使用4K 60Hz的顯示器,在未升級顯示器之前,你完全可以暢享原生4K分辨率的光追大作。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的246%。

同時,RTX 3080 10GB在開啓DLSS 2後的平均幀率與1% Low 幀率分別爲110 PFS與50FPS,兩者相差很大,也就是說幀率並不穩定。同時,RTX 4080 16GB的平均幀率是RTX 3080 10GB平均幀率的1.75倍。

《賽博朋克 2077》 BenchMark

▲緊接着我們測試《賽博朋克2077》,這款大作的正式版也已經支持DLSS 3了,我們一起去體驗光追效果出衆的夜之城魅力吧。

在測試的過程中,我們將使用NVIDIA最新推出的遊戲性能監測軟件FrameView來進行測試,其可以實時記錄遊戲中的幀率、1% Low幀率與延遲等參數,並彙總生成CSV數據庫,簡單來說,FrameView可以使沒有內置Benchmark的遊戲也能有擁有更客觀準確的性能測試方法。

這裏我再補充一下爲什麼1% Low幀率十分重要,試想一下:

在玩PUBG的時候,你通過十幾分鐘的搜刮,神裝全部到手,但是與人對槍的時候卡了一下,直接被爆頭成盒了,這種搜刮十分鐘,成盒一秒鐘的經歷是什麼感受。遊戲中往往最激烈對抗時的幀數,纔是決定遊戲成敗的核心要素,因此,1% Low時的幀率可能要比那99%不激烈對抗時的幀率還要重要!

▲在實際測試中,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲30 FPS,1% Low 幀率爲23 FPS,延遲爲64ms。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率暴漲到了117 FPS,1% Low 幀率爲93 FPS,延遲則降低到了43ms。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的227%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲53 FPS,且1% Low 幀率爲41 FPS,延遲爲48ms。RTX 4080 16GB在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的2.2倍,且延遲還要更低一些。

由此可見,DLSS 3技術不僅能大幅提升顯卡的遊戲幀數,還能夠降低遊戲延遲,可以非常明顯的提升遊戲體驗。

《瘟疫傳說:安魂曲》

▲《瘟疫傳說:安魂曲》也是首批支持DLSS 3的遊戲之一,其正式版已經發布,前段時間我看B站上好多UP主在直播,暫時遊戲內並無Benchmark,所以我們依舊採用場景復刻+FrameView監控來測試。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲85 FPS,1% Low 幀率爲71 FPS,延遲爲60ms。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了133 FPS,1% Low 幀率爲111 FPS,延遲則降低到了43ms。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的156%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲78 FPS,且1% Low 幀率僅爲48 FPS,延遲爲30ms。RTX 4080 16GB在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的1.7倍。

《光明記憶:無限》

▲《光明記憶:無限》是一款國內飛燕羣島工作室的作品,此工作室在英偉達新技術的應用上可以說處於世界領先水準,首代遊戲《光明記憶》便同時支持光線追蹤技術與DLSS技術,我當時還專門做過光線追蹤的效果測試,而續作《光明記憶:無限》更是直接贈送給了首代遊戲的玩家,目前其內測版本已支持DLSS 3。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲74 FPS,1% Low 幀率爲54 FPS,延遲爲61ms。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了168 FPS,1% Low 幀率爲134 FPS,延遲則降低到了30ms。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的227%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲108 FPS,且1% Low 幀率僅爲81 FPS,延遲爲21ms。RTX 4080 16GB在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的1.6倍。

這裏必須讚歎一句,飛燕羣島工作室對於光線追蹤技術與DLSS技術的掌控是真的純熟,即使遊戲中光線追蹤拉滿,RTX 3080 10GB依舊能夠跑到100 FPS以上,RTX 4080 16GB更是跑到了168 FPS,真的是畫面與流暢兼得啊,我一個系列老粉玩起來爽爆了!

《幻塔》

《幻塔》是完美世界遊戲旗下Hotta Studio研發的輕科幻開放世界遊戲,PC端測試版已經支持光線追蹤與DLSS3,而且其畫面可以說將光線追蹤拉滿也不爲過,但就畫面來說,算是非常優秀的網遊了。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲42 FPS,1% Low 幀率爲32 FPS。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了140 FPS,1% Low 幀率爲81FPS。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的333%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲81 FPS,且1% Low 幀率爲56 FPS,延遲爲21ms。iGame GeForce RTX 4080 16GB Vulcan OC在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的1.73倍。

《生死輪迴》

▲《生死輪迴》(Loopmancer)是一款國產賽博風橫板動作遊戲,目前正式版已更新,支持DLSS 3和光線追蹤反射。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲52 FPS,1% Low 幀率爲50 FPS,延遲爲83ms。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了124 FPS,1% Low 幀率爲95 FPS,延遲則降低到了驚人的20ms。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的238%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲85 FPS,且1% Low 幀率僅爲60 FPS,延遲爲24ms。RTX 4080 16GB在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的1.5倍。

這裏的延遲表現可以看到,無論是iGame GeForce RTX 4080 16GB Vulcan OC開啓DLSS 3還是RTX 3080 10GB開啓DLSS 2,其延遲都降低到了20ms-24ms,大約是未開啓DLSS時的四分之一,可見DLSS對提升競技遊戲與動作遊戲的體驗有十分重要的作用。

《暗影火炬城》

▲《暗影火炬城》是由上海鈦核網絡負責開發的柴油朋克風類惡魔城遊戲,支持光線追蹤與DLSS 3,另外,過場的3D演出有全中文配音,國味十足,各種動物都萌壞了,強烈建議大家體驗一下。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲80 FPS,1% Low 幀率爲57 FPS,延遲爲54ms。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了183 FPS,爲50 FPS,延遲則降低到了驚人的27ms。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的229%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲85 FPS,且1% Low 幀率僅爲60 FPS,延遲爲24ms。RTX 4080 16GB在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的1.5倍。

這裏的延遲表現可以看到,無論是iGame GeForce RTX 4080 16GB Vulcan OC開啓DLSS 3還是RTX 3080 10GB開啓DLSS 2,其延遲都降低到了20ms-24ms,大約是未開啓DLSS時的四分之一,可見DLSS對提升競技遊戲與動作遊戲的體驗有十分重要的作用。

《毀滅全人類 2:重新探測》

《毀滅全人類 2:重新探測》是一款講述外星人狂轟濫炸地球的邪典故事。玩慣了正派英雄爲主角的遊戲,玩玩反派主角做調劑也很不錯,最新更新後的遊戲支持DLSS 3。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲79FPS,63% Low 幀率爲57 FPS。

開啓DLSS 3後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了185 FPS,爲63 FPS。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的234%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲125 FPS,且1% Low 幀率爲45 FPS。iGame GeForce RTX 4080 16GB Vulcan OC在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的148%。


《地鐵:離去 加強版》 Benchmark

▲《地鐵:離去》是全球首款支持RTX光線追蹤的遊戲,由4A Games開發,因爲其自帶功能選項非常齊全的BenchMark,成爲了衆多裝機愛好者們必備的跑分神器。其更新後的加強版支持全新光線追蹤技術與DLSS 2.0,是一個很不錯的跑分遊戲,這裏用它便是爲了測試兩款顯卡在DLSS 2下的表現。

▲經實測,iGame GeForce RTX 4080 16GB Vulcan OC在未開啓DLSS時平均幀率爲50 FPS,1% Low 幀率爲37 FPS。

開啓DLSS 2後,iGame GeForce RTX 4080 16GB Vulcan OC的平均幀率上升到了97 FPS,爲95 FPS。

開啓DLSS 2後,RTX 4080 16GB的幀率是開啓DLSS前的194%。

RTX 3080 10GB在開啓DLSS 2時平均幀率爲57 FPS,且1% Low 幀率僅爲69 FPS。RTX 4080 16GB在開啓DLSS 3時,其平均幀率是RTX 3080 10GB平均幀率的1.7倍。

除了RTX 4080 16GB的幀率要明顯高於RTX 3080 10GB之外,還有一點值得注意,RTX 4080的幀率十分穩定,1% Low 幀率與平均幀率僅差2 FPS,可見遊戲運行十分絲滑穩定,沒有幀率的大起大落,玩遊戲時不會因爲幀率變動影響沉浸感。

《古墓麗影:暗影》BenchMark

▲感謝EPIC給我們送上了古墓麗影三部曲,暗影是其最後一部。因爲它是一個測試光線追蹤與DLSS 2性能很好的遊戲,除此之外,因爲其可以提供GPU受限數據,也是判斷CPU是否能夠帶動顯卡的重要依據。

另外,因其有3個測試場景,過場黑屏會影響FrameView的幀率統計,所以這裏改爲了使用Benchmark內置的5%Low進行比較。本次測評中,所有畫質與光追特效均爲最高配置,4K分辨率時DLSS爲性能模式,2K分辨率下DLSS爲平衡模式,1080P分辨率下DLSS爲質量模式。

▲在4K分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC平均幀率164 FPS,RTX 3080 10GB 平均幀率103 FPS,RTX 4080 16GB的表現是RTX 3080 10GB的159%。

在2K分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC平均幀率204 FPS,RTX 3080 10GB 平均幀率141 FPS,RTX 4080 16GB的表現是RTX 3080 10GB的145%。

在1080P分辨率下,iGame GeForce RTX 4080 16GB Vulcan OC平均幀率212 FPS,RTX 3080 10GB 平均幀率164 FPS,RTX 4080 16GB的表現是RTX 3080 10GB的129%。

之所以隨着分辨率的降低,RTX 4080 16GB的幀數優勢也隨之下降的原因,便是在4K與2K分辨率下,i9-12900K已經無法滿足RTX 4080 16GB的需求,其GPU受限僅爲54%與42%,簡單來說,就是RTX 4080 16GB太強了,甚至連i9-12900K在2K與1080P分辨率下都帶不動它,所以,建議入手RTX 4080 16GB的朋友直接一步到位,入手13代酷睿i9-13900K並配合超高頻內存使用。

RTX 4080 16GB可當作生產力工具使用

雖然RTX 4080 16GB並沒有像RTX 3090(Ti)或RTX 4090那樣搭載24GB的超大顯存,不過16GB的顯存也已經比較大了,爆顯存的風險相對RTX 3080 10G等顯卡在生產力方面要有着明顯的優勢,因此這裏我們再來測試一下RTX 4080與RTX 3080的在生產力軟件方面的跑分,同時依舊會附上RTX 4090的成績。

這裏要說明一點,RTX 4090在測試時,使用的驅動版本要比本次測試稍老,所以分數上可能差異比較大,故僅供參考。

V-Ray 5 Benchmark 測試

▲首先我們使用V-Ray 5 Benchmark進行測試,這款軟件內置了3個測評項目,分別爲用於測試CPU的V-Ray測試,可以同時測試CPU與GPU的V-Ray GPU CUDA,以及考驗顯卡RTX渲染功能的V-Ray GPU RTX測試。本次測試中我們只測試V-Ray GPU CUDA測試的單GPU模式與V-Ray GPU RTX測試。

▲RTX 3080 10GB的V-Ray GPU CUDA得分爲3031分,而iGame GeForce RTX 4080 16GB Vulcan OC的得分爲3031分,是RTX 3080 10GB得分的173%!

▲RTX 3080 10GB的V-Ray GPU RTX得分爲2362分,而iGame GeForce RTX 4080 16GB Vulcan OC的得分爲4061分,是RTX 3080 10GB得分的172%!

OctaneBench benchmark 測試

▲OctaneBench是目前最流行的GPU渲染基準測試之一,其內置了一系列渲染測試。

▲RTX 3080 10GB的OctaneBench得分爲553分。

▲iGame GeForce RTX 4080 16GB Vulcan OC的OctaneBench得分爲928.56分,是RTX 3080 10GB得分的168%!

▲附:iGame GeForce RTX 4090 Neptune OC的OctaneBench得分爲1259.97分。


達芬奇 DaVinci Resolve AV1編解碼測試

▲英偉達提供了4K、8K的RAW格式視頻各一個,我將通過達芬奇 DaVinci Resolve對其進行剪輯,輸出一個1分鐘的視頻,編碼格式分別爲AV1與H265,我們將比較兩款顯卡在H265輸出的效率,以及RTX 4080 16GB在AV1編碼下的效率(RTX 3080 10GB並不支持AV1編碼)。

▲兩組測試中,所有參數均一致,只有分辨率與視頻編碼不同。

▲經實測,在4K與8K H.265的輸出中,iGame GeForce RTX 4080 16GB Vulcan OC要比RTX 3080 10GB效率高129%與124%。因爲RTX 3080 10GB並不支持AV1編碼輸出,我們便改爲縱向比較,輸出AV1格式還是要比輸出H.265稍微慢一些。

▲實際播放中,同分辨率下,AV1格式的視頻要比H.265格式的視頻更清晰一些,不過圖傳上傳到網上後壓縮會比較嚴重,所以大家可能看的不是很清楚,建議大家有機會也可以自己下載一組AV1視頻與H.265進行比較。

因此,支持AV1編碼解碼,使得iGame GeForce RTX 4080 16GB Vulcan OC可以提供更好的畫質輸出,同時因爲其輸出效率要比RTX 3080 10GB高出一倍有餘,內容生產者還是很值得升級一下自己的配置,提高自己的生產力的。


總結

首先,RTX 4080 16GB是非常優秀的4K遊戲顯卡,在DLSS技術的加持下,在絕大多數遊戲中,即使畫質最高,光追全開,依舊能夠提供144 FPS甚至更高的幀率,滿足目前最高端電競顯示器的輸入需求,且在DLSS 3的加持下,8K 60 FPS的遊戲渲染能力,即使連接8K顯示器或電視,依舊可以提供畫質細膩,足夠流暢的8K遊戲體驗,可以說是目前最值得考慮的高端遊戲顯卡了。

同時,16GB大容量GDDR6X顯存,以及AV1格式的編碼、解碼能力,使其也可以在一定程度上作爲生產力工具使用,進行4K、8K視頻渲染、輸出,以及建模等工作。

關於購買建議,如果你目前已經有RTX 3080或RTX 3080 Ti,且你的顯示器爲4K 60Hz及以下的配置且不打算升級顯示器,那麼你可以再等等未來的RTX 3070,而如果你已經當了很久等等黨,或者早有升級4K 高刷新率顯示器的打算,那麼,趁着RTX 4080 16GB首發,買一款最新的,毫無礦卡風險的全新高端顯卡,還是很值得的。

本次評測所使用的七彩虹iGame GeForce RTX 4080 16GB Vulcan OC顯卡,在做工和用料上可以說是整個市面上RTX 4080顯卡的金字塔尖了。七彩虹作爲顯卡銷量第一的品牌,在性能,設計,做工上一直在精益求精,作爲從RTX 20系便入坑的七彩虹老粉,七彩虹iGame顯卡在設計與工藝上的不斷進步一直被我看在眼裏,這裏必須點一個大大的贊!

最後,11月16日晚10點,七彩虹將在京東、天貓、抖音、快手等電商平臺及線下授權零售經銷渠道正式以現貨發售或預售的形式同時上架iGame、戰斧等多個系列的GeForce RTX 4080,包含 iGame GeForce RTX 4080 16GB Vulcan OC、 iGame GeForce RTX 4080 16GB Neptune OC、 iGame GeForce RTX 4080 16GB Advanced OC、iGame GeForce RTX 4080 16GB Ultra OC及戰斧GeForce RTX 4080 16GB 豪華版,感興趣的話可以去了解一下。

以上便是本次七彩虹iGame GeForce RTX 4080 16GB Vulcan OC顯卡測評正文部分的全部內容,希望對你有所幫助,別走開,後面還有本次測評的其他硬件介紹,想要直接裝整機的朋友,不妨來抄一下我的作業。

本次測評硬件簡介

CPU intel 酷睿i9-12900K

▲12代酷睿首發時我便拿到了i9-12900K,雖然現在13代酷睿測測評已經解禁,爲了方便大家比較RTX 4080 16GB與RTX 4090的性能差異,我繼續使用12代酷睿來進行測試。

▲Intel 在12代酷睿上首次使用了大小核心設計,i9-12900K/KF共有16個核心,其中分爲8個性能核(P核)+與能效核(E核),其中性能核支持多線程技術,主要用於對核心性能要求高的遊戲與生產力需求,而能效核不支持超線程技術,用於多任務處理。因此i9-12900K爲一款16核24線程的處理器。

主板 七彩虹CVN Z790D5 Gaming FROZEN 巡洋艦

▲本次測試使用的是七彩虹CVN Z790D5 Gaming FROZEN 巡洋艦主板,CVN系列是七彩虹從航母外觀中獲得了設計靈感,以上層水準的用料與高端的散熱裝甲以主攻中高端消費級市場的次旗艦系列。本代CVN系列主板更是弄弄的硬核軍事風,還以各種軍艦作爲中文名,比如我這款便叫作巡洋艦,反正用了七彩虹CVN的主板,大家就都是船長了。

▲看一個主板的做工和用料,首先肯定是要看它的供電部分,穩定的供電是所有的硬件穩定運行的保證。在CPU的供電上,CVN Z790D5 Gaming FROZEN 巡洋艦採用的是16+1+1相F.C.C鐵素體電感供電,配備了55A大電流大的L.R.T 8腳MOS,可以在保證自身供電穩定性的同時降低電感線圈對其它元件的干擾。10K黑金固態電容提供穩定的濾波效果,又沒有爆漿危險,用料上還是可以的,700系主板出場時便支持Intel 13代酷睿處理器,晚一點我也有可能用這款CPU測試13900K與12900K的性能差異。


SSD 宏碁掠奪者 Predator GM7000 2TB

▲SSD固態硬盤採用的是宏碁掠奪者 Predator的GM7000 2TB, 此前PS5新手向科普文章中使用的就是Predator GM7000,完美支持PS5主機擴容。宏碁掠奪者GM7000官方標稱的讀寫速度分別爲7400MB/s與6700MB/s,其中7400MB/s的順序讀取速度在目前的PCIe 4.0固態硬盤中屬於絕對的第一匹隊,放在此次測試中絕對不會成爲顯卡讀取遊戲內容的瓶頸。另外,Predator GM7000採用12nm先進製程主控,PCB佈局更緊湊,能夠有效降低SSD功耗及發熱量,長時間測試下來也不會掉速。

▲經實測,宏碁掠奪者 Predator的GM7000順序讀取速度爲7477MB/s,順序寫入速度爲6661MB/s,順序讀寫速度都符合標稱速度,絕對屬於目前PCIe 4.0 SSD的第一梯隊,可以保證兩張顯卡測試的穩定運行。

▲之所以選擇使用2TB的系統盤,主要原因便是現在的遊戲實在是太大了,動輒幾十上百個GB,一部藍光原盤電影也要40、50個GB,512GB乃至1TB的硬盤很容易就裝滿變紅,影響性能表現,而2TB到4TB的則很少會遇到這種問題,當然,如果還是不能滿足你的儲存需求,那麼你需要再補充機械硬盤或者NAS了。


水冷 九州風神(DEEPCOOL)冰魔方360

▲水冷採用的是九州風神(DEEPCOOL)的冰魔方360,這款水冷最值得說的便是這款多維無限鏡的冷頭了,真的是目前最耐看的冷頭之一,必須得給設計師點個贊。

▲九州風神(DEEPCOOL)冰魔方360採用了全新的第四代水泵,噪音更低,散熱性能更強,配合着九州風神的動平衡泄壓技術,使水冷擁有5年的使用壽命,九州風神也爲其提供了5年的只換不修超長質保。

本次測試的主角是顯卡,所以並未安排CPU烤機測試,晚些我想試試拿這款水冷來呀i9-13900K與AMD R9-7950X。

#一鍵同步Steam截圖#

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com