最強2K分辨率顯卡來臨 iGame GeForce RTX 4070 Ti Vulcan OC測評

大家好,我是黃昏百分百,英偉達 NVIDIA在CES 2023大會上正式發佈了基於ADA架構的RTX 4070 Ti顯卡,英偉達官方宣傳其要比RTX 3090 Ti表現更好,且起售價格僅爲799美元。

其將於2023年1月5日正式發售,我非常榮幸再次獲得英偉達與七彩虹的聯合邀請,參與到RTX 4070 Ti的首發測評中。

今天我們就一起來看一看,這款能夠在CES大會上作爲主角發佈的顯卡,性能表現到底如何。好了,廢話不再多說,我們開車吧。

Ada Lovelace 架構優勢分析

說到RTX 40系顯卡,首先自然要爲大家介紹一下其在製作工藝與架構上的升級,這裏我先爲大家介紹一下全新的Ada Lovelace架構。

新架構,新制程

▲NVIDIA Ada Lovelace 架構作爲 GeForce RTX 40 系列顯卡的核心,必須要放在最前面說。Ada 架構基於定製的 TSMC 4N 工藝,晶體管數量從上一代的 280 億個激增至 760 億個,是目前世界上工藝最精湛的 GPU 架構。

▲從圖靈架構開始,英偉達開始採用 流式多處理器 (Streaming Multiprocessor,SM)架構以執行光線追蹤等運算工作,上圖左側爲全新Ada架構,右側爲30系所使用的安培架構,從圖中可以看出,SM佈局基本與上代保持一致,而最核心的變化便是其內Ada 4代 Tensor Core取代了安培架構中的3代的Tensor,用於光線追蹤的RT CORE從安培架構的第二代RT CORE升級到了第三代RT CORE。不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峯值性能提高了一倍之多。

▲而每兩個SM組成一個紋理處理集羣(Texture Processing Clusters,TPCs),再由多個TPC組成一個圖形處理集羣(Graphics Processing Clusters,GPCs)。

▲而Ada架構的GPU則是由多個GPC組成的,RTX 4070 Ti所搭載的AD 104芯片爲例,其擁有5個GPC,30個TPC,60個SM,7680個 CUDA核心,並搭載了12GB 的192bit的GDDR6X顯存。

▲技術方面,ADA架構的RTX顯卡還帶來了着色器執行重排序、微網格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。這幾個技術,我會在後面詳細介紹。

▲最後,在能效比方面,Ada 架構的效率也令人感到不可思議:在相同的功率下,其性能相較安培架構最高可達兩倍以上;增大功率,性能還能持續提升。

第三代光線追蹤 畫面更加真實

這裏先說一下着色器執行重排序 (SER) 技術吧。

▲高級光線追蹤技術需要計算同一場景中數百萬條光線照射在諸多不同類型材質上的效果,這就使得着色器只能低效地處理一系列截然不同的工作負載。(在渲染 3D 場景時,着色器用於計算恰當的亮度、暗度和顏色級別。每一款現代遊戲都需要使用到着色器。)

着色器執行重排序 (SER) 技術能夠動態調整這些工作負載的順序,讓原本低效的流程變得異常高效。SER 可將光線追蹤操作的着色器性能最高提升 2 倍,或將遊戲的幀率最高提升 25%。

▲通俗一點說,SER技術便是通過將排序,使顯卡由逐個運算加法改爲了運算乘法,自然效率能夠得到大幅提升,同時不會增加顯示延遲。

▲緊接着我們再說一下第三代RT CORE新搭載的兩款引擎,除了在安培架構中已經使用的Box Intersection Engine與Triangle Intersection Engine兩款引擎。Ada架構搭載的新款 RT CORE 還配備全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。

▲OMM 引擎可大幅提升對 alpha 測試紋理進行光線追蹤的速度,此類紋理通常應用於樹葉、顆粒,圍欄等。

▲以樹葉爲例,全新ADA架構RT Core搭載的OMM引擎可將樹葉分爲全透明部分,不透明部分與半透明部分,大幅減少着色器工作量,進而明顯降低光線追蹤對遊戲性能的影響。

▲左側爲未開啓OMM引擎時的着色器工作量,右側爲OMM引擎開啓後的着色器工作量,可見OMM的性能立竿見影。

▲而面對珊瑚蟹這種極不規則,超多個平面(三角形)的物體,則需要DMM引擎來提升光追性能了。

▲相較於安培架構需要將多個三角形與複雜的BVH放入RT CORE中進行處理,ADA機構可以將圖形轉化爲一個基礎的三角形,一個Displace Map與一個簡單的BVH,再放入RT CORE中進行處理。

▲因此,DMM 引擎能夠以近乎 9 倍的速度構建光線追蹤邊界體積層次結構 (BVH),而所佔用的顯存只有之前的二十分之一。從而實現幾何複雜場景的實時光線追蹤。

DLSS 3 讓幀數起飛

▲有一說一,光線追蹤還是會對遊戲幀數有一定的負面影響的,所以就需要DLSS來提升遊戲幀數了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度學習超級採樣),是一種通過基於 AI 的超高分辨率重新定義實時渲染,即渲染更少的像素,然後使用 AI 構建更清晰、更高分辨率的圖像的方法,可以有效的在不犧牲畫質的情況下通過AI算法提升遊戲的幀率表現。

▲從圖靈架構的RTX 20系顯卡開始,DLSS技術隨着顯卡架構一起進化,目前已經進化到了第三代DLSS,除了代表性的DLSS 超分辨率技術,還融合了DLSS幀生成技術與NVIDIA Reflex技術。

▲這裏重點說一下DLSS 3中的潛在幀生成技術,其可通過對前後幀的分析,在兩幀之間插入一幀,進而是遊戲幀數有着近乎翻倍的提升。肯定有朋友會問,這個插幀技術與電視常用的MEMC插幀技術相比有什麼區別。

▲這裏便要說,電視因爲其不參與畫面渲染的過程,所以只能夠通過算法與預測中間幀應該顯示的畫面,難免在陰影方面出現不準確的情況,導致插幀後畫面不自然。而英偉達顯卡的DLSS 潛在幀生成技術因爲是在渲染過程中在光流加速器中發生的,所以可以獲得準確的運動矢量(MOTION VECTORS),所以可以準確預測出中間畫面所處的狀態, 自然畫面陰影效果就十分準確了。同時,生成的幀不需要CPU提供數據,因此整體幀率可以超過CPU渲染的幀率限制,大幅降低了對CPU性能的要求。

▲同時,DLSS 3 潛在幀生成技術與超分辨率技術結合,渲染1080P分辨率的原始畫面,再超分辨率到4K畫面,同時,2個4K分辨率的幀之間再生成一幀。所以,平均兩個4K幀中,只有一張1080P的幀是CPU與顯卡實際渲染的,佔總生成畫面的八分之一,可見DLSS技術對幀數提升之大。

我們來比較一下DLSS開啓後對畫面效果的影響,左側爲DLSS性能模式下的4K分辨率,右側爲原生4K畫質:

▲首先看一看《賽博朋克2077》BenchMark中的截圖,整體畫面一眼看上去基本無差異,DLSS似乎能夠無比接近原生分辨率了。

▲背景中的這個欄杆,DLSS畫面還要比原生4K畫質更加銳利清晰。

▲不過,背景的瓷磚上,開啓DLSS後還是稍微有一點糊的,不過如果不像我這樣放大多倍去找茬,是根本發現不了的。

▲在同BenchMark的酒吧場景中,DLSS開啓後,畫面效果則要明顯比未開啓DLSS時更加的透徹,頂部招牌也更加的銳利清晰,個人覺得本場景下DLSS的畫質要明顯優於原生4K分辨率。

▲同樣,在網易大作逆水寒的測試中,DLSS開啓後的地磚,相較原生4K分辨率的地磚,紋理上也更加清晰,可見在有光照充足的畫面中,開啓DLSS後的畫面甚至可能超過原生4K分辨率的畫質,且其能偶帶來大幅度的幀數上升,還是很值得開啓的。

NVIDIA REFLEX 低延遲技術

NVIDIA REFLEX 低延遲技術主要分爲NVIDIA REFLEX SDK與NVIDIA Reflex延遲分析器,其中NVIDIA Reflex延遲分析器涉及到了外設、顯示器等其它硬件,本文不做涉及,近介紹一下NVIDIA REFLEX SDK。

▲在傳統的圖像處理流程中,如果CPU 處理幀的速度快於 GPU 渲染幀的速度(高U低顯),則會在CPU到GPU之間有一個等待渲染幀的隊列,進而導致渲染延遲的增加。

▲而通過將NVIDIA REFLEX SDK直接集成到遊戲中,就可以使CPU的幀處理速度與GPU的渲染速度保持同步,大幅降低渲染隊列,並降低CPU背壓,進而使遊戲能夠採樣鍵鼠等外設最新的輸入。最終降低畫面與輸入延遲,提高遊戲體驗。目前,NVIDIA REFLEX技術已經被集成在了DLSS 3中。

▲目前已經有超過35款遊戲與軟件支持DLSS 3,包括國產遊戲《黑神話:悟空》、《光明記憶:無限》、《生死輪迴》、《仙劍奇俠傳 7》等。

NVIDIA RTX REMIX 讓老遊戲重獲新生

▲有非常多的經典遊戲,無論在劇情上還是遊戲性上,都堪稱經典,唯獨遊戲畫面上受開發時間限制,已經跟不上現在的潮流。因此,英偉達開發了RTX REMIX軟件,可以幫助MOD愛好者在AI的幫助下,對遊戲畫面進行光追化重構,讓遊戲重獲新生。

▲NVIDIA RTX REMIX可以將素材資源整合給多個軟件使用,進而大幅降低MOD製作難度,提高製作效率。

▲V社經典遊戲《傳送門》的RTX版DLC也已經上線,之前在Steam上擁有《傳送門》原作的同學可以免費獲得光追升級哦,遊戲的畫面效果可以說是立竿見影,算是老遊戲重獲新生的優秀例子了。各位MOD愛好者們也可以根據自己的喜好對舊遊戲進行畫質升級,我很好奇各位會拿NVIDIA RTX REMIX去升級哪些遊戲的畫質。

七彩虹 iGame GeForce RTX 4070 Ti Vulcan OC簡介

▲本次使用的依舊是七彩虹的旗艦顯卡iGame GeForce RTX 4070 Ti Vulcan OC, iGame是七彩虹的旗艦子品牌,而Vulcan則是iGame品牌中的扛鼎之作,可以說是旗艦中的旗艦,RTX 40系火神顯卡相較於上代火神顯卡擁有更爲凌厲的造型,獨特的錆鐵色金屬外骨骼更顯兇悍,爲其強勁的性能做出警告。作爲後賽博時代的高端硬件,系列經典的銳利三角元素也將完美傳承。漆黑的底色體現了它低調的個性,打造鋒銳冷酷的高端硬件。9翼扇葉如鐮刀般鋒利厚實,散熱性能甚至比前代13翼扇葉的風扇更加強勁,而且整體也顯得更加簡潔。

▲核心頻率方面,iGame GeForce RTX 4070 Ti Vulcan OC基礎核心頻率未2310MHz~2610MHz,而按下七彩虹iGame系列顯卡經典的一鍵超頻按鍵後,其核心頻率可以提升到2775MHz。

▲背板也經過了優化,部分鋁製散熱鱗片直接露出,大幅加大了與空氣的接觸面積,同時方面熱空氣向上流動,通過CPU水冷的燈牌排出機箱,避免造成悶罐。

▲而iGame 火神顯卡最具識別度的LCD顯示屏在本世代得到了巨大升級,不僅屏幕分辨率提升到了800*216px,畫面更加清晰,而且採用磁吸式分體設計,無論顯卡橫裝、豎裝,屏幕內容總在你面前。

▲磁吸式分體設計的另一個好處便是其可以配合着底座獨立顯示內容,成爲可愛的桌面擺件,也可以更好的幫助玩家實時監控遊戲幀數與電腦性能。

▲將LCD屏幕取下時,也不用擔心顯卡沒有燈效而難看,iGame專門提供了燈光配件,同樣採用磁吸設計,貼上之後,炫酷的RGB立刻就回來啦!

▲通過全新的iGame Center軟件,不僅可以調整硬件燈效,快捷的進行硬件超頻,還可以爲Vulcan系列顯卡(包括之前幾代Vulcan火神顯卡)的LCD屏定製輸出圖案,且不只是靜態圖片,gif動圖同樣可以完美顯示。

▲接口方面,依舊是3DP1.4a+1HDMI2.1的配置,另外,一鍵超頻按鈕也得到了工藝升級,目前不僅手感更好,而且更不易損壞。而在尺寸方面,iGame GeForce RTX 4070 Ti Vulcan OC爲348.5*159.5*60.5mm(含擋片),要比iGame GeForce RTX 4080 16GB Vulcan OC的尺寸爲348.5*159.5*70.4mm(含擋片)薄約10mm,因此更加適合相對小尺寸的機箱。

RTX 4070 Ti 是全新2K分辨率高刷遊戲顯卡

▲英偉達官方對RTX 4070 Ti的定位爲能在2K分辨率(1440P)下,提供超高幀數的遊戲顯卡,得益於帶有插幀功能的DLSS3技術,英偉達宣稱RTX 4070 Ti的遊戲性能要比上一代安培架構的卡皇RTX 3090 Ti表現還要好,因此我們今天的測評將會集中在2K分辨率。

RTX 4070 Ti 與RTX 3090 Ti 顯卡性能快速比較

因爲測評的顯卡我只有使用權,沒有所有權,RTX 3090 Ti已經還回去了,無法做詳細的性能比較,所以這裏簡單拿當時測試留下來的RTX 3090 Ti的3D Mark 分數與RTX 4070 Ti的3D Mark分數進行一下比較。

▲3D MARK專爲DirectX 12設計的Time Spy Extreme, Time Spy是一個DirectX 12 基準測試,支持原生新的API 功能,如異步計算,顯式多顯卡適配器技術和多線程,而其Extreme版本則是將分辨率提升至4K。

▲RTX 3090 Ti的Time Spy Extreme顯卡得分爲11228分。

▲RTX 4070 Ti的Time Spy Extreme顯卡得分爲11075分,基本與RTX 3090 Ti持平。

▲Fire Strike 是一項適用於高性能遊戲電腦和超頻系統的 DirectX 11 基準測試。即使對於最新的顯卡而言,Fire Strike 測試也非常嚴苛。而Fire Strike Ultra是其4K版本。

▲RTX 3090 Ti的Fire Strike Ultra顯卡得分爲13516分。

▲RTX 4070 Ti的Fire Strike Ultra顯卡得分爲13354分。

經過以上兩個測試,我們得知在不開啓光線追蹤與DLSS時,RTX 4070 Ti的性能基本上與RTX 3090 Ti持平,而因爲ADA架構的RTX 4070 Ti能夠使用支持插幀技術的DLSS 3,所以實際的遊戲性能肯定是要比RTX 3090 Ti更強的。緊接着我們進行一下RTX 4070 Ti的單品遊戲性能測試。

《3D MARK Time Spy》

▲在2K分辨率的3D Mark Time Spy中,RTX 4070 Ti的總分爲21961分,顯卡得分爲22613分。

▲其中顯卡測試1的幀率爲147.76 FPS,顯卡測試2的幀率爲129.35 FPS,均很接近主流2K電競顯示器144Hz的刷新率。

▲而在2K 分辨率,使用DX 11的3D Mark Fire Strike中,RTX 4070 Ti的總分爲25604分,顯卡得分爲26520分。

▲其中顯卡測試1的幀率爲141.73 FPS,顯卡測試2的幀率爲97.19 FPS,物理測試爲125.66 FPS,同樣很接近144Hz的主流2K電競顯示器的刷新率。

《3D Mark DLSS test》 遊戲性能測試

▲3D Mark DLSS test是專門測試顯卡DLSS性能的基準測試,其測試原理爲連續進行兩次的3D Mark Port Royal 光線追蹤 基準測試,第一次爲關閉DLSS功能,第二次爲開啓DLSS功能,通過遊戲幀數變化來測試DLSS功能對遊戲性能的提升,目前3D Mark DLSS test 1.3版本已經支持DLSS 3的潛在幀生成技術。

▲在DLSS功能關閉時,RTX 4070 Ti能夠提供64FPS左右的幀率,剛好能滿足2K 60Hz顯示器的刷新率,開啓DLSS 2質量模式時,幀數可以上升至105FPS左右。

而DLSS 3開啓後,幀數可以暴增至127.22 FPS,以滿足2K高刷顯示器的需求。

《賽博朋克 2077》 BenchMark

▲緊接着我們測試《賽博朋克2077》,這款大作的正式版也已經支持DLSS 3了,我們一起去體驗光追效果出衆的夜之城魅力吧。

▲畫質設置上依舊爲2K分辨率,預設光線追蹤超級,同時分別開啓與關閉DLSS 3質量模式。

▲在測試的過程中,我們將使用NVIDIA最新推出的遊戲性能監測軟件FrameView來進行測試,其可以實時記錄遊戲中的幀率、1% Low幀率與延遲等參數,並彙總生成CSV數據庫,簡單來說,FrameView可以使沒有內置Benchmark的遊戲也能有擁有更客觀準確的性能測試方法。

這裏我再補充一下爲什麼1% Low幀率十分重要,試想一下:

在玩PUBG的時候,你通過十幾分鐘的搜刮,神裝全部到手,但是與人對槍的時候卡了一下,直接被爆頭成盒了,這種搜刮十分鐘,成盒一秒鐘的經歷是什麼感受。遊戲中往往最激烈對抗時的幀數,纔是決定遊戲成敗的核心要素,因此,1% Low時的幀率可能要比那99%不激烈對抗時的幀率還要重要!

▲在實際測試中,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲53 FPS,1% Low 幀率爲36 FPS,延遲爲40ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率暴漲到了126 FPS,1% Low 幀率爲89 FPS,延遲則降低到了39ms。

從53FPS到126FPS,DLSS 3使顯卡的遊戲幀數提升到了未開啓時的2.37倍,也將遊戲流暢度從普通辦公用的60Hz顯示器拉昇到了電競高刷顯示器的級別。

《F1 22》 BenchMark

▲遊戲測試中,F1Ⓡ 22爲例,它支持NVIDIA DLSS和光線追蹤不透明反射、光線追蹤透明反射、光線追蹤環境光遮蔽和光線追蹤陰影幾項技術,同時支持DLSS 3並內置了Benchmark。

▲測試分辨率爲2K預設最高畫質,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲112 FPS,1% Low 幀率爲97 FPS,延遲爲44ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率暴漲到了203 FPS,1% Low 幀率爲180 FPS,延遲則降低到了36ms。

即使不開啓DLSS功能,iGame GeForce RTX 4070 Ti Vulcan OC也能輕鬆應對2K分辨率下的《F1 22》,可見其優化之好,而開啓DLSS 3之後,200+的FPS更是能讓玩家有着飛一般的感覺,駕駛感受越加真實了。

《瘟疫傳說:安魂曲》

▲《瘟疫傳說:安魂曲》也是首批支持DLSS 3的遊戲之一,其正式版已經發布,目前其已經支持DLSS3,且將很快更新對光線追蹤的支持,是很值得玩的全新3A大作。

▲經實測,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲118 FPS,1% Low 幀率爲63 FPS,延遲爲47ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率上升到了155 FPS,1% Low 幀率爲90 FPS,延遲則降低到了40ms。

目前這款遊戲還不支持光線追蹤,不過很快就要更新支持光線追蹤了,目前DLSS 3對幀數的提升主要還是在1% Low上更加明顯,而相信未來支持光線追蹤後,DLSS 3的優勢會體現的更加明顯。

《光明記憶:無限》

▲《光明記憶:無限》是一款國內飛燕羣島工作室的作品,此工作室在英偉達新技術的應用上可以說處於世界領先水準,首代遊戲《光明記憶》便同時支持光線追蹤技術與DLSS技術,我當時還專門做過光線追蹤的效果測試,而續作《光明記憶:無限》更是直接贈送給了首代遊戲的玩家,目前已支持DLSS 3。

▲經實測,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲120 FPS,1% Low 幀率爲91 FPS,延遲爲21ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率上升到了170 FPS,1% Low 幀率爲210 FPS,延遲未26ms。

簡單來說,不開啓DLSS時,剛好可以跑滿2K 120Hz-144Hz的主流2K電競顯示器的刷新率,而開啓DLSS 3之後,則進入了高端2K 電競顯示器(2K 240Hz)的行列。

這裏必須讚歎一句,飛燕羣島工作室對於光線追蹤技術與DLSS技術的掌控是真的純熟,即使遊戲中光線追蹤拉滿,關閉與開啓DLSS時分別能夠有着120FPS與210FPS的高幀率,實在是優化的太好了,國產遊戲製作者如果都能有這個水平,還愁缺少國產3A大作嗎?

《生死輪迴》

▲《生死輪迴》(Loopmancer)是一款國產賽博風橫板動作遊戲,目前正式版已更新,支持DLSS 3和光線追蹤反射。

▲經實測,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲81 FPS,1% Low 幀率爲59 FPS,延遲爲26ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率上升到了173 FPS,1% Low 幀率爲132 FPS,延遲則降低到了的26ms。

開啓DLSS 3後,RTX 4080 16GB的幀率是開啓DLSS前的238%。

簡單來說,DLSS 3讓遊戲的幀數直接翻倍了!

《暗影火炬城》

▲前幾天EPIC剛送的《暗影火炬城》,是由上海鈦核網絡負責開發的柴油朋克風類惡魔城遊戲,支持光線追蹤與DLSS 3,另外,過場的3D演出有全中文配音,國味十足,各種動物都萌壞了,強烈建議大家體驗一下。

▲經實測,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲128 FPS,1% Low 幀率爲66 FPS,延遲爲34ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率上升到了199 FPS,1% Low 幀率爲147 FPS,延遲則降低到了驚人的22ms。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的幀率提升到未開啓DLSS時的1.55倍。

《毀滅全人類 2:重新探測》

《毀滅全人類 2:重新探測》是一款講述外星人狂轟濫炸地球的邪典故事。玩慣了正派英雄爲主角的遊戲,玩玩反派主角做調劑也很不錯,最新更新後的遊戲支持DLSS 3。

▲經實測,iGame GeForce RTX 4070 Ti Vulcan OC在未開啓DLSS時平均幀率爲91FPS,1% Low 幀率爲47 FPS。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的平均幀率上升到了237 FPS,爲105 FPS。

開啓DLSS 3後,iGame GeForce RTX 4070 Ti Vulcan OC的幀率是開啓DLSS前的260%!提升幅度非常巨大。

《地鐵:離去 加強版》 Benchmark

▲《地鐵:離去》是全球首款支持RTX光線追蹤的遊戲,由4A Games開發,因爲其自帶功能選項非常齊全的BenchMark,成爲了衆多裝機愛好者們必備的跑分神器。其更新後的加強版支持全新光線追蹤技術與DLSS 2.0,是一個很不錯的跑分遊戲,這裏用它便是爲了測試RTX 4070 Ti在DLSS 2下的表現。

▲畫質爲預設最高(Extreme),在關閉DLSS功能時,99%高的平均幀率可達58.64 FPS,剛好跑滿2K 60Hz的顯示器。

▲而開啓DLSS功能後,99%高的平均幀率增至 93.42FPS,遊戲流暢度上升到了未開啓DLSS時的1.5倍,配得上2K的高刷新率顯示器了。

ADA架構顯卡優秀的每瓦功率

TGP是GPU運行時的能耗上限,在運行諸如大型遊戲等高功耗應用是,GPU功耗可能會達到TGP,而RTX 4070 Ti的TGB爲285W,在剛纔我所進行的測試中,NVIDIA遊戲性能監測軟件FrameView所記錄下的平均功耗最高爲247w,最低爲179w,可見在2K最高畫質下進行遊戲時,RTX 4070 Ti的供電與散熱仍有很大冗餘空間,足以應對更嚴苛的任務,這些都是得益於NVIDIA全新的ADA架構以及TSMC 4N所帶來的每瓦性能提升。

RTX 4070 Ti亦可當作生產力工具使用

英偉達 NVIDIA的顯卡在生產力方面一直表現極爲優秀,無論是CUDA運算還是渲染能力,都具有着十分明顯的領先地位,而RTX 4070 Ti搭載了12GB的GDDR6X顯存,只要不是處理極爲佔用顯存的大型渲染工作,還是可以很輕鬆的應付的,這裏便爲大家呈現RTX 4070 Ti的生產力測試環節。

RTX 40系顯卡支持AV1編解碼硬件加速

▲AV1是由intel、微軟、亞馬遜、網飛等公司共同推出的免版權費編碼格式,在同等體積下相較其它格式要有更優質的畫面,而在壓縮同樣碼率的視頻的時候,則可以擁有更小的體積。

▲在iGame GeForce RTX 4080 16GB Vulcan OC的測試中,我使用了達芬奇 DaVinci Resolve進行AV1編解碼硬件加速的測試,不過畢竟達芬奇是收費軟件,使用門檻還是比較高的,所以今天我們測試一下國產的免費剪輯軟件剪映專業版,同樣支持英偉達RTX 40系顯卡的AV1AV1編解碼硬件加速。

▲英偉達提供了4K、8K的RAW格式視頻各一個,之前我通過達芬奇 DaVinci Resolve均進行的編解碼測試,有興趣的大家可以去看我的iGame GeForce RTX 4080 16GB Vulcan OC測評,而剪映專業版目前最高支持4K 60Hz的視頻剪輯,所以這裏僅測試4K的素材,僅2分多鐘的視頻,居然有12.2GB的超大體積。

▲視頻導出參數爲4K 30FPS,更高碼率,分別以AV1編碼與H265編碼進行導出。

▲iGame GeForce RTX 4070 Ti Vulcan OC在開啓硬件加速時以AV1格式導出本視頻僅用時約16秒。

▲而以同樣的參數開啓硬件加速,導出 4K H265格式的視頻時,則同樣用時約26秒,比開啓硬件加速時導出AV1格式的視頻慢了62.5%,可見視頻的時長越長,通過硬件加速導出AV1格式的視頻對時間的節約也越加明顯。

▲實際播放中,同分辨率下,AV1格式的視頻要比H.265格式的視頻更清晰一些,不過圖傳上傳到網上後壓縮會比較嚴重,所以大家可能看的不是很清楚,建議大家有機會也可以自己下載一組AV1視頻與H.265進行比較。

▲這時我們再來比較體積,AV1編碼的視頻僅佔595MB,相較於782MB的H265編碼視頻,瘦身了約31.4%。

因此,開啓硬件加速後,AV1編碼格式視頻的導出速度比H265視頻導出速度更快,體積還更小,儲存、上傳更加方面,可以大幅提升內容創作者的生產速度。

V-Ray 5 Benchmark 測試

▲首先我們使用V-Ray 5 Benchmark進行測試,這款軟件內置了3個測評項目,分別爲用於測試CPU的V-Ray測試,可以同時測試CPU與GPU的V-Ray GPU CUDA,以及考驗顯卡RTX渲染功能的V-Ray GPU RTX測試。本次測試中我們只測試V-Ray GPU CUDA測試的單GPU模式與V-Ray GPU RTX測試。

▲RTX 3080 10GB的V-Ray GPU CUDA得分爲1754分,而iGame GeForce RTX 4070 Ti Vulcan OC的得分爲2313分,是RTX 3080 10GB得分的1.32倍。

▲RTX 3080 10GB的V-Ray GPU RTX得分爲2362分,而iGame GeForce RTX 4070 Ti Vulcan OC的得分爲3072分,是RTX 3080 10GB得分的1.3倍。

OctaneBench benchmark 測試

▲OctaneBench是目前最流行的GPU渲染基準測試之一,其內置了一系列渲染測試,這裏我同樣分別進行了RTX 4070 Ti與RTX 3080 10GB 的渲染性能測試。

▲RTX 4070Ti 的OctaneBench得分爲723.41分。

▲RTX 3080 10GB的OctaneBench得分爲553分。

通過OctaneBench測試,RTX 4070Ti的渲染能力大約是RTX 3080 10GB的1.3倍。

Blender Open Data benchmark 測試

▲Blender是一款開源 3D 創建套件。它支持3D 建模、動畫、視頻編輯等諸多功能,同時支持NVIDIA RTX 渲染OptiX AI 降噪。在RTX 3090 Ti的測試中,我便使用了junk shop進行了光追渲染測試。

而Blender Open Data Benchmark將進行monster、junkshop、classroom三個場景的渲染測試,本次將同樣比較RTX 4070 Ti與RTX 3080 10GB。

▲在iGame GeForce RTX 4070 Ti Vulcan OC的測試中,monster、junkshop、classroom三個場景的得分分別爲3666,1519,1613分。

▲而RTX 3080 10GB的測試中,monster、junkshop、classroom三個場景得分分別爲2477,1304,1061分。

在三組測試中,RTX 4070 Ti的得分分別是RTX 3080 10GB的1.48倍、1.17倍、1.52倍。

經過以上幾款軟件的渲染測試,可知RTX 4070 Ti的渲染能力大約是RTX 3080 10GB的1.3到1.5倍,而且顯存容量也增大了20%,對於生產力用戶還是比較值得考慮升級的。

總結

首先,RTX 4070 Ti是非常優秀的2K遊戲顯卡,有了DLSS 3的加持,在絕大多數遊戲中,即使畫質最高,光追全開,依舊能夠提供144 FPS甚至更高的幀率,滿足目前主流電競顯示器的輸入需求,

同時,12GB的GDDR6X顯存,以及AV1格式的編碼、解碼能力,使其也可以在一定程度上作爲生產力工具使用,進行4K、8K視頻渲染、輸出,以及建模等工作。

關於購買建議,個人建議使用RTX 3080及以下顯卡的朋友,如果未來仍打算使用2K分辨率的高刷顯示器進行遊戲,亦或者進行輕、中度的生產力工作或視頻內容創作工作,RTX 4070 Ti將是您不錯的選擇。

本次評測所使用的七彩虹iGame GeForce RTX 4070 Ti Vulcan OC顯卡,在做工和用料上可以說是整個市面上RTX 4080顯卡的金字塔尖了。七彩虹作爲顯卡銷量第一的品牌,在性能,設計,做工上一直在精益求精,作爲從RTX 20系便入坑的七彩虹老粉,七彩虹iGame顯卡在設計與工藝上的不斷進步一直被我看在眼裏,這裏必須點一個大大的贊!

以上便是本次七彩虹iGame GeForce RTX 4070 Ti Vulcan OC顯卡測評正文部分的全部內容,希望對你有所幫助,別走開,後面還有本次測評的其他硬件介紹,想要直接裝整機的朋友,不妨來抄一下我的作業。


更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com