超越天網的顯卡終於來了,七彩虹 iGame RTX 4090 Neptune OC測評

大家好,我是黃昏百分百,很榮幸獲得了英偉達與七彩虹的聯合邀請,參與到RTX 4090顯卡的媒體首測中來,我拿到的是七彩虹iGame GeForce RTX 4090 Neptune OC顯卡,也就是我們俗稱的水神顯卡。

今天便與各位實際測試一下,這款全新次代的英偉達旗艦顯卡,到底有着多麼巨大的架構與性能進步。廢話不再多說,我們開車吧。

Ada Lovelace 架構優勢分析

新架構,新制程

▲NVIDIA Ada Lovelace 架構作爲 GeForce RTX 40 系列顯卡的核心,必須要放在最前面說。Ada 架構基於定製的 TSMC 4N 工藝,晶體管數量從上一代的 280 億個激增至 760 億個,是目前世界上工藝最精湛的 GPU 架構。

▲從圖靈架構開始,英偉達開始採用 流式多處理器 (Streaming Multiprocessor,SM)架構以執行光線追蹤等運算工作,上圖左側爲全新Ada架構,右側爲30系所使用的安培架構,從圖中可以看出,SM佈局基本與上代保持一致,而最核心的變化便是其內Ada 4代 Tensor Core取代了安培架構中的3代的Tensor,用於光線追蹤的RT CORE從安培架構的第二代RT CORE升級到了第三代RT CORE。不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峯值性能提高了一倍之多。

▲而每兩個SM組成一個紋理處理集羣(Texture Processing Clusters,TPCs),再由多個TPC組成一個圖形處理集羣(Graphics Processing Clusters,GPCs)。

▲而Ada架構的GPU則是由多個GPC組成的,以一個完整的AD 102芯片爲例,其擁有12個GPC,72個TPC,144個SM,18432個 CUDA核心。

▲而目前的RTX 4090的GPU芯片中,則擁有128個SM,16384個CUDA核心。可見Ada架構的GPU未來還有進一步提升性能參數的空間。

▲得益於Ada架構的巨大進步,RTX 4090的算力相較於RTX 3090 Ti也有着翻倍的提升,由RTX 3090 Ti的 40 TFLOPS提升至83 TFLOPS,這是一個什麼概念呢?在2003年上映的電影《終結者3》中,毀滅人類的天網超級計算機算力爲60 TFLOPS,而現在大家手上的一塊顯卡的性能便超過了天網,讓人驚歎這些年來科技進步之快,當年的科學幻想一個又一個成爲現實。

▲技術方面,ADA架構的RTX顯卡還帶來了着色器執行重排序、微網格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。這幾個技術,我會在後面詳細介紹。

▲最後,在能效比方面,Ada 架構的效率也令人感到不可思議:在相同的功率下,其性能相較安培架構最高可達兩倍以上;增大功率,性能還能持續提升。

第三代光線追蹤 畫面更加真實

這裏先說一下着色器執行重排序 (SER) 技術吧。

▲高級光線追蹤技術需要計算同一場景中數百萬條光線照射在諸多不同類型材質上的效果,這就使得着色器只能低效地處理一系列截然不同的工作負載。(在渲染 3D 場景時,着色器用於計算恰當的亮度、暗度和顏色級別。每一款現代遊戲都需要使用到着色器。)

着色器執行重排序 (SER) 技術能夠動態調整這些工作負載的順序,讓原本低效的流程變得異常高效。SER 可將光線追蹤操作的着色器性能最高提升 2 倍,或將遊戲的幀率最高提升 25%。

▲通俗一點說,SER技術便是通過將排序,使顯卡由逐個運算加法改爲了運算乘法,自然效率能夠得到大幅提升,同時不會增加顯示延遲。

▲緊接着我們再說一下第三代RT CORE新搭載的兩款引擎,除了在安培架構中已經使用的Box Intersection Engine與Triangle Intersection Engine兩款引擎。Ada架構搭載的新款 RT CORE 還配備全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。

▲OMM 引擎可大幅提升對 alpha 測試紋理進行光線追蹤的速度,此類紋理通常應用於樹葉、顆粒,圍欄等。

▲以樹葉爲例,全新ADA架構RT Core搭載的OMM引擎可將樹葉分爲全透明部分,不透明部分與半透明部分,大幅減少着色器工作量,進而明顯降低光線追蹤對遊戲性能的影響。

▲左側爲未開啓OMM引擎時的着色器工作量,右側爲OMM引擎開啓後的着色器工作量,可見OMM的性能立竿見影。

▲而面對珊瑚蟹這種極不規則,超多個平面(三角形)的物體,則需要DMM引擎來提升光追性能了。

▲相較於安培架構需要將多個三角形與複雜的BVH放入RT CORE中進行處理,ADA機構可以將圖形轉化爲一個基礎的三角形,一個Displace Map與一個簡單的BVH,再放入RT CORE中進行處理。

▲因此,DMM 引擎能夠以近乎 9 倍的速度構建光線追蹤邊界體積層次結構 (BVH),而所佔用的顯存只有之前的二十分之一。從而實現幾何複雜場景的實時光線追蹤。

DLSS 3 讓幀數起飛

▲有一說一,光線追蹤還是會對遊戲幀數有一定的負面影響的,所以就需要DLSS來提升遊戲幀數了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度學習超級採樣),是一種通過基於 AI 的超高分辨率重新定義實時渲染,即渲染更少的像素,然後使用 AI 構建更清晰、更高分辨率的圖像的方法,可以有效的在不犧牲畫質的情況下通過AI算法提升遊戲的幀率表現。

▲從圖靈架構的RTX 20系顯卡開始,DLSS技術隨着顯卡架構一起進化,目前已經進化到了第三代DLSS,除了代表性的DLSS 超分辨率技術,還融合了DLSS幀生成技術與NVIDIA Reflex技術。

▲這裏重點說一下DLSS 3中的潛在幀生成技術,其可通過對前後幀的分析,在兩幀之間插入一幀,進而是遊戲幀數有着近乎翻倍的提升。肯定有朋友會問,這個插幀技術與電視常用的MEMC插幀技術相比有什麼區別。

▲這裏便要說,電視因爲其不參與畫面渲染的過程,所以只能夠通過算法與預測中間幀應該顯示的畫面,難免在陰影方面出現不準確的情況,導致插幀後畫面不自然。而英偉達顯卡的DLSS 潛在幀生成技術因爲是在渲染過程中在光流加速器中發生的,所以可以獲得準確的運動矢量(MOTION VECTORS),所以可以準確預測出中間畫面所處的狀態, 自然畫面陰影效果就十分準確了。同時,生成的幀不需要CPU提供數據,因此整體幀率可以超過CPU渲染的幀率限制,大幅降低了對CPU性能的要求。

▲同時,DLSS 3 潛在幀生成技術與超分辨率技術結合,渲染1080P分辨率的原始畫面,再超分辨率到4K畫面,同時,2個4K分辨率的幀之間再生成一幀。所以,平均兩個4K幀中,只有一張1080P的幀是CPU與顯卡實際渲染的,佔總生成畫面的八分之一,可見DLSS技術對幀數提升之大。

我們來比較一下DLSS開啓後對畫面效果的影響,左側爲DLSS性能模式下的4K分辨率,右側爲原生4K畫質:

▲首先看一看《賽博朋克2077》BenchMark中的截圖,整體畫面一眼看上去基本無差異,DLSS似乎能夠無比接近原生分辨率了。

▲背景中的這個欄杆,DLSS畫面還要比原生4K畫質更加銳利清晰。

▲不過,背景的瓷磚上,開啓DLSS後還是稍微有一點糊的,不過如果不像我這樣放大多倍去找茬,是根本發現不了的。

▲在同BenchMark的酒吧場景中,DLSS開啓後,畫面效果則要明顯比未開啓DLSS時更加的透徹,頂部招牌也更加的銳利清晰,個人覺得本場景下DLSS的畫質要明顯優於原生4K分辨率。

▲同樣,在網易大作逆水寒的測試中,DLSS開啓後的地磚,相較原生4K分辨率的地磚,紋理上也更加清晰,可見在有光照充足的畫面中,開啓DLSS後的畫面甚至可能超過原生4K分辨率的畫質,且其能偶帶來大幅度的幀數上升,還是很值得開啓的。

NVIDIA REFLEX 低延遲技術

NVIDIA REFLEX 低延遲技術主要分爲NVIDIA REFLEX SDK與NVIDIA Reflex延遲分析器,其中NVIDIA Reflex延遲分析器涉及到了外設、顯示器等其它硬件,本文不做涉及,近介紹一下NVIDIA REFLEX SDK。

▲在傳統的圖像處理流程中,如果CPU 處理幀的速度快於 GPU 渲染幀的速度(高U低顯),則會在CPU到GPU之間有一個等待渲染幀的隊列,進而導致渲染延遲的增加。

▲而通過將NVIDIA REFLEX SDK直接集成到遊戲中,就可以使CPU的幀處理速度與GPU的渲染速度保持同步,大幅降低渲染隊列,並降低CPU背壓,進而使遊戲能夠採樣鍵鼠等外設最新的輸入。最終降低畫面與輸入延遲,提高遊戲體驗。目前,NVIDIA REFLEX技術已經被集成在了DLSS 3中。

▲目前已經有超過35款遊戲與軟件支持DLSS 3,包括國產遊戲《黑神話:悟空》、《光明記憶》、《生死輪迴》、《仙劍奇俠傳 7》等。

NVIDIA RTX REMIX 讓老遊戲重獲新生

▲有非常多的經典遊戲,無論在劇情上還是遊戲性上,都堪稱經典,唯獨遊戲畫面上受開發時間限制,已經跟不上現在的潮流。因此,英偉達開發了RTX REMIX軟件,可以幫助MOD愛好者在AI的幫助下,對遊戲畫面進行光追化重構,讓遊戲重獲新生。

▲NVIDIA RTX REMIX可以將素材資源整合給多個軟件使用,進而大幅降低MOD製作難度,提高製作效

七彩虹 iGame GeForce RTX 4090 Neptune OC 外觀與細節

▲七彩虹iGame GeForce RTX 4090 Neptune OC的包裝巨大無比,中心處有着顯卡的圖片,周邊則是水流漩渦的紋路,動感十足。右下角則註明了其型號爲GeForce RTX 4090,左下角也標註了其搭載了24GB的超大GDDR6X顯存,使其即可成爲超強8K遊戲顯卡,亦可作爲生產力工具使用。

▲iGame Neptune系列顯卡從30系的黑色變爲白色,iGame Neptune的標誌性特徵由圓環形的海洋之眼進化成爲了雙波浪曲線,iGame產品設計師以水流爲靈感所特別設計,遵循着水流的運動節奏打造全新的視覺語言。全新的雙曲線爲玩家帶來從左至右貫穿的RGB視覺盛宴,光效將如水流一般靜謐流淌,潺潺流動,模擬水的流動方向將曾經輝煌的亞特蘭蒂斯文明時代還原得淋漓盡致,爲玩家獻上極具藝術氣息的光影盛宴。水冷排方面也由240mm水冷排升級爲360mm水冷排,進而提供更強的散熱性能,爲硬核的遊戲玩家及內容創作者保駕護航,及時消除高負載場景下所產生的核心熱源。

▲全新的iGame Neptune 顯卡的冷頭支持旋轉,是裝機更加便捷,顯卡的安裝位子也可以變得更加靈活。

▲接口方面,七彩虹iGame GeForce RTX 4090 Neptune OC提供的依舊是三個DP 1.4a接口與一個HDMI 2.1接口,七彩虹iGame系列一脈相承的一鍵超頻按鈕依舊得到了保留。玩家輕輕點壓即可進一步獲得更優的使用體驗。

▲顯卡金屬裝甲正面擁有一個iGame LOGO,讓正面顯得不單調,內部則藏有全覆蓋的大尺寸銅底,直觸GPU熱源,利於傳遞熱量。因爲顯卡本體與風扇分離,所以顯卡尺寸更小更薄,豎裝也非常不錯。

▲我這裏用的是追風者的白色PCIe 4.0顯卡延長線幫助顯卡豎裝,顯卡頂部擁有兩個燈,透過玻璃隱約能夠看到iGame的英文與圖形LOGO,燈光亮起來的時候會很漂亮,信仰無處不在。

▲供電方面,英偉達在RTX 3090 Ti時便正式改爲了PCIe5.0標準的12+4 Pin接口,七彩虹iGame GeForce RTX 4090 Neptune OC自然採用的也是PCIe5.0標準的12+4 Pin接口,爲顯卡的性能釋放提供了可靠的保障。

▲七彩虹iGame GeForce RTX 4090 Neptune OC的合金外甲背板更顯質感,支架爲GPU及PCB平均壓力。

▲採用360冷排的冰海散熱器擁有3個120mm靜音風扇,中間的一個印有iGame圖形LOGO,左右兩個則印有iGame英文LOGO,也是信仰滿滿。

▲冷排上擁有着風扇集線器,方便玩家自由更換風扇。

七彩虹 iGame GeForce RTX 4090 Neptune OC 參數詳解

正所謂水火無情人有情,在本次測評中,我將使用上代安培架構的巔峯顯卡七彩虹 iGame GeForce RTX 3090 Ti Vulcan OC,也就是大名鼎鼎的火神顯卡,與本代Ada架構的巔峯顯卡之一,七彩虹 iGame GeForce RTX 4090 Neptune OC,也就是與火神相對的水神顯卡進行對比測試,下面我將放上二者的參數對比。

▲可以看到,iGame GeForce RTX 4090 Neptune OC 相較於iGame GeForce RTX 3090 Ti Vulcan OC,除了芯片製程之外,最大的提升便是CUDA數量與核心頻率,其中CUDA數量由RTX 3090 Ti的10752提升到了16384,增加了5632(52.4%)。

而頻率方面的提升同樣明顯,基礎核心頻率由1560MHz提升到了2520MHz,提升了幾乎1GHz,一鍵超頻核心頻率也由1920MHz提升到了2640MHz。

因此,其性能的提升可以說是十分值得期待的。

RTX 4090 是全新旗艦級8K遊戲顯卡

3D Mark DLSS test 遊戲性能測試

▲首先我們來進行8K分辨率下的遊戲測試,因爲黃昏我家境貧寒,實在沒有物理分辨率8K的顯示設備,所以8K遊戲性能方面只能夠使用3D Mark DLSS test來進行測試,其測試原理爲連續進行兩次的3D Mark Port Royal 光線追蹤 基準測試,第一次爲關閉DLSS功能,第二次爲開啓DLSS功能,通過遊戲幀數變化來測試DLSS功能對遊戲性能的提升。

▲首先有一說一,在8K分辨率,DLSS關閉的情況下,無論是RTX 3090 Ti還是 iGame GeForce RTX 4090 Neptune OC,畫面都只能說比PPT流暢一些,分別爲8.34 FPS與13.47 FPS。

RTX 3090 Ti只支持DLSS 1與DLSS 2,在開啓DLSS 2時,幀率達到了37.36 FPS,已經算比較流暢了.

而iGame GeForce RTX 4090 Neptune OC 的幀率提升則更加明顯,開啓DLSS 2時幀率便達到了62.6 FPS,可以跑滿HDMI 2.1接口的帶寬了。而開啓DLSS 3之後,幀率更是達到了94.97 FPS,要知道,3D Mark Port Royal的光線追蹤可以說是達到了變態級別,很多遊戲開啓最高光追後,幀率依舊比3D Mark Port Royal的得分高很多,Port Royal得分94.97 FPS,實際遊戲中甚至有可能跑滿目前最頂級電視的8K 120Hz,試想下8K、光線追蹤、高幀率三者兼得,是多麼爽快的遊戲體驗啊!

▲而在4K 分辨率下,兩塊顯卡都表現的更好,DLSS關閉的情況下,RTX 3090 Ti的幀率爲31.42 FPS,而開啓DLSS 2後, RTX 3090 Ti的幀率提升到了82.28 FPS。

而iGame GeForce RTX 4090 Neptune OC在未開啓DLSS時,幀率便達到了59.72 FPS,可以跑滿常見4K顯示器的60Hz刷新率,而開啓DLSS 2與DLSS 3之後,分辨率分別提升到了142.14 FPS與176.73 FPS。

這兩個幀率意味着什麼呢?意味着其可以跑滿目前高端4K電競顯示器 144Hz的基礎頻率與160Hz的超頻後頻率,顯卡的顯示能力,終於能滿足目前最強的顯示器的需求了。

3D Mark Fire Strike Ultra 測試

8K分辨率測試比較難辦,4K分辨率就輕鬆多了,我們首先通過3D Mark進行測試。

▲Fire Strike 是一項適用於高性能遊戲電腦和超頻系統的 DirectX 11 基準測試。即使對於最新的顯卡而言,Fire Strike 測試也非常嚴苛,而Fire Strike Ultra是其4K版本。

▲iGame GeForce RTX 4090 Neptune OC的3D Mark Fire Strike Ultra總得分與顯卡得分分別爲25248,25626,相較於RTX 3090 Ti的得分14311與13966分別提升了73.4%與83.5。

3D MARK Time Spy Extreme

▲3D MARK專爲DirectX 12設計的Time Spy Extreme, Time Spy是一個DirectX 12 基準測試,支持原生新的API 功能,如異步計算,顯式多顯卡適配器技術和多線程,而其Extreme版本則是將分辨率提升至4K。

▲iGame GeForce RTX 4090 Neptune OC的3D Mark Time Spy Extreme總得分與顯卡得分分別爲17092,20017,相較於RTX 3090 Ti的得分10784與11107分別提升了58.5%與80.2%。

通過3D Mark的測試,我們基本得知了,在4K分辨率下,iGame GeForce RTX 4090 Neptune OC的遊戲性能基本上可達到RTX 3090 Ti的160%-180%,而兩者同時開啓DLSS後,iGame GeForce RTX 4090 Neptune OC的遊戲性能更是比RTX 3090 Ti高出一倍還多。

當然,只使用3D Mark進行測試,肯定還是不夠客觀的,那麼我便多使用幾塊遊戲進行測試吧。

《F1 22》 BenchMark

▲我們首先拿7月1日推出的F1Ⓡ 22爲例,它支持NVIDIA DLSS和光線追蹤不透明反射、光線追蹤透明反射、光線追蹤環境光遮蔽和光線追蹤陰影幾項技術,目前內測版本已經支持DLSS 3並內置了Benchmark, 相信不久的將來,正式版遊戲也會更新對DLSS 3的支持。

▲在測試的過程中,我們將使用NVIDIA最新推出的遊戲性能監測軟件FrameView來進行測試,其可以實時記錄遊戲中的幀率、1% Low幀率與延遲等參數,並彙總生成CSV數據庫,簡單來說,FrameView可以使沒有內置Benchmark的遊戲也能有擁有更客觀準確的性能測試方法。

這裏我再補充一下爲什麼1% Low幀率十分重要,試想一下:

在玩PUBG的時候,你通過十幾分鐘的搜刮,神裝全部到手,但是與人對槍的時候卡了一下,直接被爆頭成盒了,這種搜刮十分鐘,成盒一秒鐘的經歷是什麼感受。遊戲中往往最激烈對抗時的幀數,纔是決定遊戲成敗的核心要素,因此,1% Low時的幀率可能要比那99%不激烈對抗時的幀率還要重要!

▲當然,F1 22是擁有BenchMark的,所以我們只使用FrameView補充測量了1% Low的數據,遊戲測試畫面爲4K分辨率,光追效果全開。

在BenchMark測試中,RTX 3090 Ti在未開啓DLSS時平均幀率僅爲60 FPS,且1% Low 幀率僅爲45 FPS,說真的,這對F1賽車這種激烈競技遊戲來說還是不夠看的。

而開啓DLSS 2之後,RTX 3090 Ti的平均幀率達到了142 FPS,1% Low 幀率也達到了101 FPS,已經很流暢了。

iGame GeForce RTX 4090 Neptune OC在未開啓DLSS時,平均幀率便已經有95 FPS了,且 1% Low 幀率也有69 FPS。

僅開啓DLSS 2.0時,RTX 4090的平均幀率達到了194 FPS,且 1% Low 幀率也有123 FPS。

而當iGame GeForce RTX 4090 Neptune OC開啓DLSS 3專有的 Frame Generation 幀生成功能時,平均幀率達到了可怕的 236 FPS,且 1% Low 幀率也有183 FPS。

平均幀率236 FPS,1% Low幀率183 FPS是什麼概念呢?簡單來說,就是目前最強的4K 160Hz的電競顯示器,居然連RTX 4090的1% Low幀率都無法完全顯示出來,顯示器廠商們是時候加把勁,研發並推出4K 240Hz的高端電競顯示器了!

最後,iGame GeForce RTX 4090 Neptune OC 開啓DLSS 3時的平均幀率與1 % Low幀率,分別是RTX 3090 Ti的166%與181%!

《賽博朋克 2077》 BenchMark

▲緊接着我們測試《賽博朋克2077》,這款大作的媒體體驗版也已經支持DLSS 3了,我們一起去體驗光追效果出衆的夜之城魅力吧。

▲沒錯,又是媒體體驗版,我的Steam賬號裏可有着不少好東西呢,最下面那款《瘟疫傳說:安魂曲》(A Plague Tale: Requiem),也將於10月18日發佈,支持DLSS 3,我玩了很好玩,大家也可以期待下哦,同時大家不要急,說完賽博朋克,我就說這款遊戲。

▲在實際測試中,RTX 3090 Ti在未開啓DLSS時平均幀率僅爲44 FPS,且1% Low 幀率僅爲35 FPS,延遲爲52ms,而開啓DLSS 2之後,平均幀率達到了60,且1% Low 幀率也上升到了47 FPS,延遲也降低到了47ms。可以算是流暢運行了。

而iGame GeForce RTX 4090 Neptune OC在未開啓DLSS時,平均幀率便已經有69 FPS了,且 1% Low 幀率也有52 FPS,延遲爲33ms,算是很流暢的運行。

僅開啓DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了103 FPS,且 1% Low 幀率也有73 FPS,此時延遲最低,僅爲25ms。

而當iGame GeForce RTX 4090 Neptune OC開啓DLSS 3專有的 Frame Generation 幀生成功能時,平均幀率達到了可怕的 188 FPS,且 1% Low 幀率也有154 FPS,此時延遲爲30ms,甚至比4K原生分辨率還低一些。

可見,開啓DLSS 3時,可以大幅提升遊戲幀率(爲原生4K分辨率時幀率的272%),且並不會增加延遲。

《瘟疫傳說:安魂曲》

▲在《瘟疫傳說:安魂曲》的測試中,RTX 3090 Ti在未開啓DLSS時平均幀率爲78 FPS,1% Low 幀率爲52 FPS,延遲爲55ms,而開啓DLSS 2之後,平均幀率達到了103,且1% Low 幀率也上升到了79 FPS,延遲也降低到了44ms。都能夠比較流暢的運行遊戲。

而iGame GeForce RTX 4090 Neptune OC在未開啓DLSS時,平均幀率便已經有123 FPS了,且 1% Low 幀率也有91 FPS,延遲爲30ms,算是很流暢的運行。

僅開啓DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了146 FPS,且 1% Low 幀率也有123 FPS,此時延遲最低,僅爲21ms。

而當RiGame GeForce RTX 4090 Neptune OC開啓DLSS 3專有的 Frame Generation 幀生成功能時,平均幀率達到了可怕的 192 FPS(爲原生4K分辨率時幀率的156%),且 1% Low 幀率也有167 FPS,此時延遲爲40ms,比4K原生分辨率延遲高一些,不過換來了幀數的大幅提升,完全可以接受。

《古墓麗影:暗影》BenchMark

▲感謝EPIC給我們送上了古墓麗影三部曲,暗影是其最後一部,是一個測試光線追蹤與DLSS性能很好的遊戲,只不過目前只支持DLSS 2,所以兩塊顯卡都使用DLSS 2進行測試,且因其有3個測試場景,過場黑屏會影響FrameView的幀率統計,所以這裏改爲了使用Benchmark內置的5%Low進行比較。

▲在《古墓麗影:暗影》的Benchmark測試中,RTX 3090 Ti在未開啓DLSS時平均幀率爲70 FPS,5% Low 幀率爲58 FPS,而開啓DLSS 2之後,平均幀率達到了131,且5% Low 幀率也上升到了112 FPS,都能夠比較流暢的運行遊戲。

而iGame GeForce RTX 4090 Neptune OC在未開啓DLSS時,平均幀率便已經有122 FPS了,且 5% Low 幀率也有102 FPS,延遲爲30ms,算是很流暢的運行。

僅開啓DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了213 FPS,且 5% Low 幀率也有195FPS,已經超越了目前顯示器的極限。

《地鐵:離去 加強版》 Benchmark

▲《地鐵:離去》是全球首款支持RTX光線追蹤的遊戲,由4A Games開發,因爲其自帶功能選項非常齊全的BenchMark,成爲了衆多裝機愛好者們必備的跑分神器。其更新後的加強版支持全新光線追蹤技術與DLSS 2.0,是一個很不錯的跑分遊戲。

▲因爲其BenchMark本身統計的便是99%平均(去掉最低與最高)的幀率,所以直接用官方數據了。在其Benchmark測試中,RTX 3090 Ti在未開啓DLSS時平均幀率爲41.29 FPS,能夠體驗劇情,而開啓DLSS 2之後,平均幀率達到了79.78,算是都能夠比較流暢的運行遊戲。

而iGame GeForce RTX 4090 Neptune OC在未開啓DLSS時,平均幀率便已經有56.82 FPS了,可以跑滿4K 60Hz的顯示器。

而開啓DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了125.16 FPS,值得爲其配備4K 144Hz的顯示器了。

《逆水寒》

▲國內網遊大廠網易一直與英偉達保持着深度合作,在其遊戲開發過程中大量使用諸如RTX、DLSS等英偉達的先進畫面技術,而逆水寒新發布“拂雲庭”場景便是全程圍繞“微光渲染”設計製作,同時支持RTX與DLSS 3,我玩的是媒體測試服,正式服將於10月13日正式更新,敬請期待。

▲在實際測試中,RTX 3090 Ti開啓DLSS 2之後勉強能玩,爲20 FPS,而iGame GeForce RTX 4090 Neptune OC在不開啓DLSS時便有18 FPS,開啓DLSS 3之後更是達到了82 FPS,可以說是很流暢了。

▲這裏允許我多嘴一句,開發遊戲技術最前沿的光追遊戲,難免有網易在炫技的成分,不過能夠做到讓英偉達將這款遊戲選入官方測評指南,並將菜單翻譯成英文,讓全球媒體與玩家都能夠體驗到支持光線追蹤網遊大作,我只想說網易幹得漂亮,這樣的遊戲越多越好。

RTX 4090是強大的生產力工具

自從英偉達在安培架構中新增了RTX 3090與RTX 3090 Ti這兩款24GB顯存的顯卡,可以說將圖靈架構時代單獨命名的TITAN RTX這個生產力工具級別的顯卡正式併入了GeForce RTX系列。

這裏我們比較一下TITAN RTX、RTX 3090 Ti、RTX 4090這三張生產力顯卡的參數:

TITAN RTX便已經搭載了24GB的GDDR6顯存,RTX 3090 (Ti)更是將其升級到了帶寬更高,速度更快的GDDR6X,而在最新的RTX 4090,得益於GPU製程的提升,顯卡的核心頻率得到了極大的提升,進而,理論上,生產力軟件的運行速度也得到了巨幅的提升。

因爲黃昏我並沒有TITAN RTX,所以本次將只實測安培架構的巔峯之作RTX 3090 Ti與目前的最強顯卡,ADA架構的iGame GeForce RTX 4090 Neptune OC,讓我們看一看,全新的ADA架構顯卡,生產力性能到底有多大的進化!

V-Ray 5 Benchmark 測試

▲首先我們使用V-Ray 5 Benchmark進行測試,這款軟件內置了3個測評項目,分別爲用於測試CPU的V-Ray測試,可以同時測試CPU與GPU的V-Ray GPU CUDA,以及考驗顯卡RTX渲染功能的V-Ray GPU RTX測試。本次測試中我們只測試V-Ray GPU CUDA測試的單GPU模式與V-Ray GPU RTX測試。

▲RTX 3090 Ti的V-Ray GPU CUDA得分爲1793分,而iGame GeForce RTX 4090 Neptune OC的得分爲4133分,是RTX 3090 Ti得分的230.5%!

▲RTX 3090 Ti的V-Ray GPU RTX得分爲2337分,而iGame GeForce RTX 4090 Neptune OC的得分爲5542分,是RTX 3090 Ti得分的237.1%!

OctaneBench benchmark 測試

▲OctaneBench是目前最流行的GPU渲染基準測試之一,其內置了一系列渲染測試。

▲RTX 3090 Ti的OctaneBench得分爲528.22分。

▲iGame GeForce RTX 4090 Neptune OC的OctaneBench得分爲1259.97分,是iGame GeForce RTX 4090 Neptune OC得分的238.5%!

Blender Open Data benchmark 測試

▲Blender是一款開源 3D 創建套件。它支持3D 建模、動畫、視頻編輯等諸多功能,同時支持NVIDIA RTX 渲染OptiX AI 降噪。在RTX 3090 Ti的測試中,我便使用了junk shop進行了光追渲染測試。

而Blender Open Data Benchmark將進行monster、junkshop、classroom三個場景的渲染測試。

▲RTX 3090 Ti的測試中,monster、junkshop、classroom三個場景得分分別爲2628,1358,1105分。

▲iGame GeForce RTX 4090 Neptune OC monster、junkshop、classroom三個場景的得分分別爲6492,2736,2672分。分別是RTX 3090 Ti得分的247%、201%、242%。

從以上3個Benchmark的比較中可以得出,iGame GeForce RTX 4090 Neptune OC的渲染能力基本上是RTX 3090 Ti的240%左右,這可以說是一個質的飛躍,如果你目前正在使用RTX 3090 Ti或RTX 3090及更舊的顯卡進行大量的渲染工作,那麼我強烈建議你升級到iGame GeForce RTX 4090 Neptune OC顯卡,它能夠大幅降低你的時間成本與人力成本。

24GB 大容量GDDR6X顯存爲生產力工作保駕護航

▲在之前RTX 3090 Ti首測的時候,我便比較了七彩虹iGame GeForce RTX 3090 Ti Vulcan OC與iGame GeForce RTX 3080 OC 10G在生產力方面的性能差異。

▲在測試過程中,10GBDDR6X顯存的iGame GeForce RTX 3080 OC 10G經常會出現爆顯存的情況而導致的無法勝任渲染工作。

▲雖然有些像Octane Render這類的軟件可以借用系統RAM繼續渲染工作,但是內存的傳輸速度要明顯低於顯存的,會大幅影響渲染效率。

而在當時的測試中,RTX 3090 Ti則順利的完成了渲染工作,而iGame GeForce RTX 4090 Neptune OC同樣爲24GB顯存,且上面已經測試了其渲染能力要比RTX 3090 Ti強很多,這裏就不再進行重複測試了。

因此,條件允許的話,個人還是不建議使用RTX 3080這類10GB-12GB顯存進行生產力工作,至少要上RTX 3090及以上的顯卡才能夠保證生產效率與穩定性。

NVIDIA OMNIVERSE MACHINIMA 簡介

▲NVIDIA OMNIVERSE MACHINIMA可以從遊戲,素材庫等資源庫導入視頻素材,並通過RTX渲染器進行渲染,疊加以語音自動生成面部表情技術,物理引擎計算,AI動作採集等,將素材整合成整體的畫面。

▲不同類型的內容創作者,都可以使用NVIDIA OMNIVERSE MACHINIMA進行實時的RTX內容創作與協作。

▲藉由實時動態光線追蹤技術所渲染的圖片,已經達到了亂真的程度。

▲同時,針對人物的面部動作,還可以通過導入音頻進行面部細節動作的自動渲染,這樣,生成視頻中的人物就不會“木偶感”十足了,同時還剩下的大量的面部東西捕捉工作,讓人們能夠更加專注在內容本身的創作上。

▲動作捕捉,這點不用多解釋了吧,很多電影和遊戲,之前都是由專業人士穿着補滿傳感器的衣服執行那個動作,然後再進行建模,設備成本很高,而通過AI姿勢估計功能,則只需要一個攝像頭,成本降低明顯,且修改動作也變得更加容易了。

將以上這些功能整合起來,視頻愛好者就可以相對輕鬆的創作出屬於自己的“史詩般宏偉”的視頻作品了。而對於直播主等,NVIDIA BROADCAST則可以幫助他們更加輕鬆的進行直播。

NVIDIA BROADCAST 簡介

▲NVIDIA BROADCAST通過智能降噪,虛擬背景,攝像頭自動成像功能,將直播主的人像視頻源直接合成到主要視頻源上,達到炫酷的效果。

▲音頻採集時自動降噪,AI自動採集直播主的人像部分,完全無需綠布,就可以扣去背景,再將其無縫融入到直播的視頻中去。

嗯,簡單總結下NVIDIA BROADCAST,它可以幫助直播主開電腦就開始工作而無需綠布背景,更省時間,更省空間。

總結

RTX 4090既是生產力工具,又是最高端的遊戲顯卡。不僅能夠勝任8K RAW視頻加特效、3D渲染等工作,還能夠非常流暢的在8K分辨率下游玩光追3A大作,不愧爲NVIDIA RTX 40系列的首發護航之作了。

關於購買建議,如果你預算有限,而且只是爲了在4K或2K分辨率下玩遊戲,那麼你可以再等等未來的RTX 4080系列,而如果你打算拿顯卡在8K分辨率或4K分辨率高刷新率下玩光追大作,那麼RTX 4090還是很有必要入手的。而如果你用顯卡作爲乾飯的工具,那麼即使你有RTX 3090 (Ti)顯卡,個人都覺得值得升級。

如果你手頭已經有RTX 3090,那麼無論當作生產力工具還是玩遊戲,都可以再等等。而如果

本次評測所使用的七彩虹iGame GeForce RTX 4090 Neptune OC顯卡,在做工和用料上可以說是整個市面上RTX 4090顯卡的金字塔尖了。七彩虹作爲顯卡銷量第一的品牌,在性能,設計,做工上一直在精益求精,比如我測試的這款七彩虹iGame GeForce RTX 4090 Neptune OC顯卡相較於上代安培架構iGame Neptune顯卡有着明顯的設計與做工的提升,三風扇的白水神實在是太美了,散熱能力也大幅增強,無一不是爲了提高玩家體驗而設計,在這一點上,我十分欣賞,必須要給七彩虹點一個大大的贊。目前顯卡價格已經迴歸原價,且RTX 40系顯卡無需擔心礦卡困擾,剛需的朋友們可以入手了。

本次測試平臺

CPU intel 酷睿i9-12900K

▲12代酷睿首發時我便拿到了i9-12900K,雖然現在13代酷睿已經發布並預售,不過因爲其性能測試尚未解禁,所以我繼續使用12代酷睿來進行測試。

▲Intel 在12代酷睿上首次使用了大小核心設計,i9-12900K/KF共有16個核心,其中分爲8個性能核(P核)+與能效核(E核),其中性能核支持多線程技術,主要用於對核心性能要求高的遊戲與生產力需求,而能效核不支持超線程技術,用於多任務處理。因此i9-12900K爲一款16核24線程的處理器。

主板 七彩虹 iGame Z690D5 Ultra V20

▲iGame是七彩虹的旗艦系列產品,在主板方面iGame系列則可細分爲VULCAN(頂配)與ULTRA(次頂配),本次測評所使用的是iGame Z690D5 ULTRA V20價格不高,且支持最新的13代酷睿,是十分不錯的白色主題裝機主板。

內存 宏碁掠奪者 Vesta Ⅱ DDR5 6000MHz CL30

▲測試內存採用的是宏碁掠奪者 Vesta Ⅱ DDR5內存,其XMP頻率與時序爲6000MHz CL30,不出意外是目前市面上時序最低的DDR5內存之一。

▲其在XMP頻率與時序下的讀取速度爲94561 MB/s,寫入速度爲84182 MB/s,複製速度爲84995 MB/s,更重要的是,其延遲僅爲62.8 ns!已經遠超DDR4內存所能達到的極限了。

▲而在是ROG STRIX Z690-I 主板上,其可以超頻至6667MHz CL32或6800MHz CL40,其在6667MHz CL32時性能最強,內存的讀取速度、寫入速度、複製速度均有明顯提升,讀取速度、寫入速度與複製速度都摸到6位數了!而隨着電壓的增強,內存的延時也有小幅下降。

#一鍵同步Steam截圖#

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com