iGame 4070 Ti AD首發評測:顏值爆表,能效比驚人

隨着電競顯示器價格的不斷下探,我們開始有機會以更合理的價格買到高分辨率高刷新的型號。特別是27英寸2K 100Hz左右的電競顯示器售價刷到了千元出頭,配主流新機時有充足的理由成爲首選。這時候壓力就來到了GPU這邊,能否有一款在1080p和2K分辨率下滿足最高畫質、高刷新的顯卡,眼前的iGame GeForce RTX 4070 Ti Advanced OC給出了一個不錯的答案。

作爲GeForce RTX 40系列首發陣營的第三塊GPU,GeForce RTX 4070 Ti曾被賦予GeForce RTX 4080 12GB的稱號,而在iGame Advanced全新武裝下,性能也得到進一步釋放。那麼問題來了,iGame GeForce RTX 4070 Ti Advanced OC能否幫我們解決2K分辨率最高畫質運行3A大作的需求?在性能解禁之際,讓我們奉上iGame GeForce RTX 4070 Ti Advanced OC首發評測。

AD104的首次登場

在Ada Lovelace架構GPU的命名中,NVIDIA首次在GeForce RTX 4080上使用了AD103單數的命名規則,以至於iGame RTX 4070 Ti Advanced一步到位承接了AD104的稱號,核心型號爲AD104-400-A1,同時也成爲AD104的首次登場。

重點就在一步到位。iGame RTX 4070 Ti Advanced與GeForce RTX 4080一樣,僅在不影響遊戲表現的NVENC和NVDNC編解碼器上略微縮減,其餘元素完全保留,與完整的AD104看齊。

在結構上,Ada Lovelace架構GPU中包含了若干個GPC(Graphics Processing Clusters,圖形處理集羣),GPC下包含若干個TPC(Texture Processing Clusters,紋理處理簇),再往下就是SM、CUDA、RT Core、Tensor Core等等。而完整的AD104包含5個GPC,每個GPC包含6組TPC,每組TPC包含2個流式多處理器(Streaming Multiprocessors,SM)。

流式多處理器SM中,包括了近幾年大熱的深度學習超採樣DLSS加速Tensor Core,用於實時光線追蹤特效加速的RT Core等諸多處理模塊,並延續了從Maxwell架構開始引入的處理塊(Sub-Core)理念,在每個SM下面包含了4個處理快單元。

如果再往下探究,每個處理塊包含1個64KB寄存器堆,1個L0指令緩存,1個Warp調度器,1個調度單元,4個加載/存儲單元,1個特殊功能單元(Special Function Unit,SFU)用於執行超越函數指令(比如正弦、餘弦、倒數、平方根等)和圖形差值算法指令。每個SM下的128個CUDA Core隨處理快分成4組,每組CUDA由16個專門用於FP32的CUDA Core,16個可以在FP32和INT32之間切換的CUDA Core組成。

由於iGame RTX 4070 Ti Advanced使用了近乎完整的AD104核心,即5個GPC、30個TPC、60個SM,以及6個32-bit內存控制器組成的192-bit內存接口,整個芯片包含358億個晶體管,Die Size爲295mm2。

因此iGame RTX 4070 Ti Advanced使擁有7680個CUDA Core,60個第三代RT Core,240個Tensor Core,240個紋理單元和80個ROPs。同時還包含7,680KB一級緩存,15,360KB寄存器堆,以及49,152KB二級緩存,並搭配192-bit 12GB GDDR6X。可以看到iGame RTX 4070 Ti Advanced的二級緩存是上一代對標型號GeForce RTX 3070 Ti 的12倍以上,是RTX 3080的8倍,爲後續的第三代RT Core性能發揮奠定了重要基礎。

                                                                                                                                        

全新武裝的iGame Advanced

與RTX 30系列的Advanced系列的棱角分明不同,iGame RTX 4070 Ti Advanced多了幾分金屬光澤的圓潤感,在設計風格上更爲討喜。按照iGame的說法,iGame RTX 4070 Ti Advanced用銀灰色金屬外裝甲構造出的宇宙隕鐵設計作爲基礎,並引入引力之環作爲外觀視覺停留要素,在確保散熱的同時,也暗示iGame RTX 4070 Ti Advanced的性能不俗。

引力之環在很大程度上繼承了iGame Advanced系列經典的紅圈設計,使用了一套雙RGB燈組構建力量核心寓意,同時也給iGame Center燈光調節留下了更多玩法。

值得多說一句,從GeForce RTX 40系列開始,iGame Center UI進行了全面升級,界面不僅酷炫,也更淺顯易懂。比如在硬件調控中能夠對引力之環的閃爍模式、速度、亮度、色彩進行進一步的調節,同時超頻控制也融入到了第二頁中,搭配風扇散熱、功耗、頻率進行進一步的調節。

不僅如此,iGame Center本身還提供了豐富的性能監控小窗口,可以在任意畫面下置頂性能監控,跟蹤GPU在遊戲中的實際表現。

當然也少不了iGame玩傢俱樂部的成就係統,以及用來預判遊戲在不同分辨率下能否流暢運行的遊戲領域。不過目前遊戲領域的遊戲庫數據還在更新狀態,隨着後續不斷升級iGame Center的玩法註定愈發豐富。

讓我們回到顯卡本身。與正面引力之環和宇宙隕鐵設計遙相呼應的是頗爲文藝的散熱金屬背板,在增大iGame RTX 4070 Ti Advanced散熱面積的同時,也使用了與正面相同的色調,以強調前後設計的統一性。

不僅如此,顯卡後側的鏤空設計也與正面的引力之環遙相呼應,並增加了帶着圖騰象徵的雕花紋理,配合着金屬色澤,格調一下子就上來了。

爲了加強iGame RTX 4070 Ti Advanced散熱性能,顯卡使用了一套雙環形100mm+96mm九翼扇葉,也就是左右兩側風扇直徑爲100mm,中間風扇爲96mm,每個風扇均使用了雙滾珠軸承,配合iGame RTX 4070 Ti Advanced性能閒置時智能啓停技術,能讓風扇運行壽命進一步拉長。

風扇之下則是更大面積的散熱鰭片模組,iGame RTX 4070 Ti Advanced不僅使用了更大的鰭片增加效率,還使用了6根8mm的熱管提升熱量流動效率,並以迴流焊工藝使熱管與鰭片嚴絲合縫。

與GPU接觸部分則使用了真空冰片技術,通過密閉的腔體內注入冷凝液,通過相變原理在GPU發熱之後更快的將熱量分發給熱管與鰭片,獲得更好的散熱效果,這樣的設計基本上也已經成爲iGame顯卡的標配。

同時我們也能看到iGame RTX 4070 Ti Advanced身材相比GeForce RTX 40首發的前兩位同門在身材上更緊湊了一些,會佔用主板大約2.5個槽位。爲了支撐顯卡本身龐大的散熱模組,iGame RTX 4070 Ti Advanced也爲模組本身增加了一套全鋁中框作爲固定,以增加顯卡本身的可靠性。

iGame RTX 4070 Ti Advanced輸出面板接口則與公版看齊,包括3個DisplayPort 1.4a接口和1個HDMI 2.1接口。同時在輸出接口面板上增加一個物理超頻按鈕也已經是iGame系列的標配。並且這一次超頻按鈕同樣使用了金屬設計,並在面板上增加超頻示意圖,無論是質感還是細節也更爲到位。

GeForce RTX 4070 Ti在NVIDIA設計中默認Boost頻率爲2610MHz,在一件超頻加持之後,iGame RTX 4070 Ti Advanced可以達到2760MHz。而在我們進行實際超頻測試過程中,iGame RTX 4070 Ti Advanced最高可以達到2835MHz左右。

與此同時GPU核心溫度在壓力測試下爲66℃左右,紅外線壓力測試圖表現如下。

這裏值得說明TGP功耗反應的是GPU運行功耗上限,也就是功耗牆。實際上GPU Boost表現是由功耗、散熱情況、負載等多重因素決定,即使GPU Boost到最大頻率也未必接近TGP值。事實上無論是GeForce RTX 4090還是GeForce RTX 4080運行4K分辨率畫面時能耗也低於TGP值,2K和1080P分辨率更是如此。

因此在測試過程中,我們分別對iGame RTX 4070 Ti Advanced的1080p、2K分辨率最高畫質的功耗進行比較,涉及遊戲包括主流遊戲、壓力測試DEMO。可以看到iGame RTX 4070 Ti Advanced的最高功率接近300W,符合iGame官方給出310W/330W TDP功耗建議,建議在配置新機的時候儘可能選擇850W以上的整機電源進行支撐。

iGame RTX 4070 Ti Advanced的電源接口同樣爲新版的16pin接口,隨機搭配了2個8pin轉16pin的電源轉換線,當然你也可以使用ATX 3.0電源專門爲新GPU準備的16pin電源線。

順帶一提iGame RTX 4070 Ti Advanced包裝中搭配的附件也相當豐富,包括可換刀頭的吸附式螺絲刀,質感不錯的顯卡支架,配件排開,氣勢拉滿。

實踐出真知

現在進入喜聞樂見的跑分環節。如果對RTX 40系列略有了解的同學,會發現新一代GPU性能提升除了歸功於新制程、更大的緩存設計之外,還將最重要的RT Core和Tensor Core分別升級到了第三代和第四代。

其中第三代RT Core在第二代RT Core的基礎上,再次將射線/三角形求交測試吞吐量。意味着射線/三角形求交測試模塊由原來的2個再次增加到4個,相對Turing架構的1個射線/三角形求交測試模塊翻了4倍,並額外增加了下圖左下角的透明度微圖引擎(Opacity Micro-Map,OMM)和右下角的位移式微型網面引擎(Displaced Micro-Mesh,DMM)。

同時第三代RT Core還引入了着色器執行重排序(Shader Execution Reordering,SER)技術,通過與遊戲設計團隊配合,更有效的分配次級射線的排序權重,從而獲得更高效的線程排序執行,避免光追運算陷入無意義的次級射線運算深淵。

第四代Tensor Core在效率提升的同時,更進一步與DLSS 3、光流加速器強綁定,避免了CPU性能跟不上GPU所導致幀率的損失,同時還原生支持Reflex技術避免AI生成的幀率影響系統響應速度。


在測試之前,照例先搬出我們的測試平臺,這裏使用了英特爾Core i9-13900K,七彩虹Colorful CNV DDR5-6000 16GB x2,CVN Z790D5 GAMING FROZEN V20主板,1250W電源作爲基準,確保iGame RTX 4070 Ti Advanced性能可以進一步釋放。

                                                                                                                                        

在基礎測試中,我們先引入DirectX 11和DirectX 12的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal和VRMark Blue Room進行檢測。

可以看到常規測試中GeForce RTX 4070 Ti相對GeForce RTX 3090提升有12%左右提升,相對RTX 3070 Ti提升平均提升幅度更是超過50%。

這裏我們也搬出了幾個喜聞樂見的3A遊戲進行對比,這裏主要使用4K分辨率光追最高畫質,以及《地鐵:離鄉》的1080p最高畫質作爲參考。能夠看到GeForce RTX 4070 Ti相對GeForce RTX 3090提升在10%左右,相對GeForce RTX 3070 Ti提升將近100%。

暢遊2K分辨率

事實上,iGame RTX 4070 Ti Advanced真正發力的地方在2K最高畫質的3A級遊戲中。第四代Tensor Core性能提升幅度巨大,包括的FP16、BF16、TF32、INT8、INT4性能相對前一代提升兩倍以上,並支持商業Hopper GPU架構中出現的FP8 Transformer Engine。更重要的是,iGame RTX 4070 Ti Advanced所採用的DLSS 3技術已經從DLSS 2.X獨立的技術,升級到了一套高效的遊戲運行方案。

NVIDIA在DLSS 3中找到了一套將光流加速器(Optical Flow Acceleration,OFA)與DLSS相結合的辦法,構建出了一個更爲立體的分析方式,將卷積自編碼器的輸入源擴展到幾個部分,分別是:之前幀與當下幀,由光流加速器生成的光流場、遊戲運動矢量和深度等數據。這時候DLSS 3甚至承擔起渲染過程中7/8的工作,讓CPU和GPU進完成其中1/8的渲染即可,從而節省出大量的計算資源專注到更有用的地方。

這意味着遊戲一旦支持DLSS 3,那麼效率將是成倍的提升。但也需要注意,DLSS 3運行的前提是GeForce RTX 40的第四代Tensor Core,第三代以及第三代以前Tensor Core僅能支持到DLSS 2.X,即實現DLSS 3的部分功能,幀率提升雖然也很明顯,但幅度沒有DLSS 3來得更爲誇張。

這裏我們引入3DMark DLSS 2 2K、3DMark DLSS 3 4K、3DMark DLSS 3 8K進行對比,可以看到iGame RTX 4070 Ti Advanced相對RTX 3090提升了50%到70%,特別是RTX 4070 Ti在8K分辨率觸及60FPS的水準,相對GeForce RTX 3070 Ti提升了將近600%。

最後讓我們進入2K分辨率遊戲測試環節,在iGame RTX 4070 Ti Advanced與RTX 3070 Ti的較量中,能夠看到DLSS 3一旦開啓,平均性能在50%到80%的提升,部分場景更是直接從不能玩到了流暢運行的級別,比如《傳送門》RTX版提升了200%。

                                                                                                                                        

再來對比RTX 3090,在DLSS開啓後,iGame RTX 4070 Ti Advanced相對RTX 3090平均提升也超過了30%,這同樣也意味着RTX 4070 Ti在2K遊戲中的實際表現同樣也優於RTX 4090 Ti。

完成創意閉環

解決了遊戲問題,最後輪到愈發熱門的內容創意環節。得益於NVIDIA Studio在軟硬件上的結合,對於大多數消費者、內容創作愛好者、UP主無需購買專業顯卡,僅依靠GeForce RTX就能完成所有工作內容,iGame RTX 4070 Ti Advanced的12GB GDDR6X也正好符合了NVIDIA啓用AV1雙編解碼器的策略。

AV1編碼是由英特爾、微軟、亞馬遜、谷歌、網飛等網絡巨頭組成的開放多媒體聯盟AOMedia所推出的免費編碼格式,在國內已經獲得了嗶哩嗶哩、愛奇藝支持。即在相同文件體積下擁有更高清的畫質,或者相同清晰度的畫質下擁有更小的體積,因此它現階段可以進行1080p串流視頻的帶寬,實現1440p甚至更好的畫質,比如同樣的帶寬佔用下,在嗶哩嗶哩可以輕鬆播放2K或者4K的視頻,而播放4K的帶寬也將可以用來播放更高分辨率的內容。

在好萊塢擁有統治地位的DaVinci Resolve 18是率先支持AV1編解碼專業軟件之一,因此也提供了對iGame RTX 4070 Ti Advanced的編解碼支持。基本上,我們在電影院線看到的大成本特效製作、剪輯、調色有很多都來自於DaVinci Resolve。

由於動則4K、8K視頻後期調色將會耗費大量的系統計算資源和時間,利用AV1加速編碼自然成爲必選項,這裏我們分別對一段4K ProRes和8K ProRes視頻進行編碼輸出,可以看到無論是4K ProRes到4K H.265的輸出,iGame RTX 4070 Ti Advanced相對GeForce RTX 3070 Ti提升了一倍以上。而8K ProRes到8K H.265的輸出,也節省了將近1/3的時間。

這裏我們也利用ON1 Resize AI 2022考驗GPU的AI性能,通過低分辨率圖片無損提升至高分辨率圖片進行測試,可以看到iGame RTX 4070 Ti Advanced相對GeForce RTX 4030 Ti效率提升將近40%。

                                                                                                                                        

SPECviewperf 2020則是通過建模對象或渲染體的旋轉和縮放檢視,來檢測在各種專業設計領域(包含能源勘探、醫學、建築設計、機械設計、汽車設計、飛機設計等各種領域)的圖形性能,這裏包含了我們從大學專業軟件課開始就接觸的3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流軟件。iGame RTX 4070 Ti Advanced在部分場景中與GeForce RTX 3090 Ti持平,部分場景則提升了21%的性能,相對GeForce RTX 3070 Ti更是提升40%到100%。

而在Procyon Photoshop Editing的測試中,也可以看到iGame RTX 4070 Ti Advanced比RTX 3090提升9%左右,相比RTX 3070 Ti提升13%。

如果前陣子有關注《傳送門》RTX版的同學,會了解到這款免費遊戲除了是顯卡殺手之外,還是NVIDIA團隊利用NVIDIA RTX Remix用盡可能少量的資源開發的遊戲,通過NVIDIA Studio整合AI紋理工具、光線追蹤、DLSS 3以及Omniverse平臺協作,快速繞過了遊戲反編譯、提取素材的過程,讓遊戲場景的翻新與二次開發變得更快。

iGame RTX 4070 Ti Advanced的創作、渲染性能正是內容創作的基石,因此我們也着重考察了GPU的渲染性能,專業軟件中的光追性能表現。

這裏先以Blender 3.4.0作爲測試基準,在Monster、Junkshop、Classroom三個場景中,可以看到iGame RTX 4070 Ti Advanced相對GeForce RTX 3090性能提升20%以上,僅在Junkshop場景持平。而相對RTX 3070 Ti更是提升80%到107%不等。

在V-Ray 5 Benchmark中會分別考驗CUDA和光線追蹤性能,iGame RTX 4070 Ti Advanced相對GeForce RTX 3080 Ti提升了40%左右。

Octane Render RTX則是測試GPU的光線追蹤性能表現的另一個參考,Octane Render在近些年逐漸受到內容創作者熱捧,利用GPU替代CPU加速大幅縮減了渲染過程。在四個測試場景中,主要考驗GPU每秒產生的樣本率,iGame RTX 4070 Ti Advanced相對GeForce RTX 3090提升7%,相對RTX 3070 Ti提升了60%。

寫在最後:左手顏值,右手能效比

iGame GeForce RTX 4070 Ti Advanced OC厲害的地方在於,利用Ada Lovelace高效的能耗比優勢,在僅不到300W的實際功率下實現對GeForce RTX 3090,乃至GeForce RTX 3090 Ti的超越。而iGame Advanced天生的超頻天賦、加強版散熱和直觀的iGame Center,都讓其擁有了更多可玩的空間。

而透着金屬光澤的宇宙隕鐵設計語言和引力之環外觀設計,也讓iGame GeForce RTX 4070 Ti Advanced OC也具備不少MOD空間,配合側透機箱,無論與主板平行還是垂直襬放,都看點滿滿。

左右握着顏值,右手握着能效比的iGame GeForce RTX 4070 Ti Advanced OC給出了一股全能型顯卡的氣質,比基礎款更多的可玩空間也成爲其重要的加分項。特別是在沒有FE信仰公版的情況下,如果你要在首發的一衆GeForce RTX 4070 Ti選擇一款,iGame GeForce RTX 4070 Ti Advanced OC無疑會成爲顏值、性價比、能耗都相當拿得出手的那款。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com