NVIDIA GeForce RTX 5070首發評測:讓2K高幀遊戲變成主流

當顯示器價格不斷下探,2K分辨率顯示器使用率的增長速度想到相當明顯。在Steam最近的硬件統計中,2560x1440分辨率佔比接近30%,同樣也是所有分辨率顯示中增長幅度最大的。2K顯示器開始逐漸取代1920x1080分辨率的同時,GPU算力跟進變得順理成章。而這個責任,現在落到了NVIDIA GeForce RTX 5070身上。

在CES 2025上,NVIDIA給GeForce RTX 5070疊了很多層Buff,在體驗表現上可以比肩上一代旗艦,並且官方建議零售價4599元人民幣,一副性價比爆棚的樣子。雖然部分體驗表現限定在開啓DLSS 4的遊戲場景中,但作爲未來3A級遊戲必然支持的新技術,誘惑力一下子就上來了。

這時候GeForce RTX 5070依然給我們留下了很多懸念,它的基礎光柵性能表現是否也讓人滿意,作爲主流級GPU,它可以讓我們的PC具備什麼樣的素質。隨着評測解禁,現在就讓我們奉上GeForce RTX 5070 Founders Edition首發評測。

新晉玩家:GB205

GeForce RTX 5070使用了一塊與GeForce RTX 5070 Ti不同的GPU型號,即Blackwell GB205。Blackwell針對AI超算、數據中心、服務器,以及消費端制定了多個版本,服務器和數據中心以GB100爲開頭,針對遊戲和消費端優化則是我們現在所看到的GB200系列。其中GeForce RTX 5070使用的型號是GB205-300-A1,屬於Blackwell架構,基於臺積電4N FinFET定製工藝製造,擁有310億個晶體管,芯片面積263mm²。

在設計理念上,Blackwell架構與Ampere和Ada Lovelace架構設計相似,即一個GPU中包含若干個GPC(Graphics Processing Clusters,圖形處理集羣),每個GPC下面再包含若干個TPC(Texture Processing Clusters,紋理處理集羣),每個TPC下包含2個SM(Streaming Multiprocessors,流式多處理器),同時再搭配顯存控制器等周邊電路。

SM下即爲Blackwell微架構的主要體現,包括128個CUDA Core,1個第四代RT Core,4個第五代Tensor Core,4個紋理單元(Texture Units),1個512KB寄存器文件,128KB L1共享緩存,這些緩存可以根據圖形和計算工作負載需求進行重新配置。同時,SM還包含兩個FP64,FP64 TFLOP速率是FP32 TFLOP速率的1/64,對於消費端而言使用頻率不高,但可以保證FP64代碼可以被正確的執行。對應的,Tensor Core也包含了少量的FP64 Tensor來確保程序的正確執行。

完整的GB205擁有5個GPC,25個TPC,50個SM,以及6個32-bit內存控制器,用來控制12GB GDDR7 192-bit顯存。GPU中包含了6400個CUDA Core,50個第四代RT Core,200個第五代Tensor Core,200個紋理單元,以及80個ROP(Raster Operations,光柵化處理單元)。在內存子系統上,完整的GB205擁有6.25MB L1緩存,12.8MB寄存器文件,以及48MB L2緩存。

GeForce RTX 5070沒有使用完整的GB205,代號GB205-300-A1 GPU屏蔽了1組TPC,即包括5個GPC,24個TPC,48個SM。總共6144個CUDA Core,80個ROP,192個第五代Tensor Core,48個第四代RT Core,GPU Boost頻率來到2512 MHz。6MB L1緩存,48MB L2緩存。配合12GB 192-bit GDDR7顯存,顯存頻率可以來到28Gbps,帶寬達到672GB/sec,比RTX 4070提高了33%。

在編解碼能力上,GeForce RTX 5070提供了1個第九代NVENC,1個第六代NVDEC。

這裏我們慣例列舉一些重要參數作爲比較:

宛如藝術品的Founders Edition

如果有機會,筆者建議在選購時多考慮NVIDIA公版的Founders Edition,原因是太漂亮了。GeForce RTX 5070 Founders Edition同樣如此。

GeForce RTX 5070 Founders Edition的設計也是從外包裝開始的,簡約低調,提供易開口,撕開腰封的一刻,就能看到“Inspired by Gamers. Enhanced by Al. Built by NVIDIA.”(靈感來自玩家,性能來自AI,製造來自NVIDIA)字樣,格調拉滿。

盒子內襯包含了NVIDIA Logo以及象徵着內凹散熱格柵設計的背景。

與此同時,下方型號也驗明GeForce RTX 5070 Founders Edition正身。

白色內膽盒包含了GeForce RTX 5070 Founders Edition本體。與RTX 5080設計一樣,向兩側拉開外包裝盒就可以將內膽取出。

外包裝盒還提示了內部包含顯卡本體、轉換線纜以及說明書。

轉換線纜規格爲12VHPWR 16pin(12+4)轉8pin x2電源接口,主要是應對老規範電源使用,12VHPWR本身最高可以支持到600W功耗,GeForce RTX 5070的TGP爲250W,應對供電沒有壓力。

拉開內膽上下紙質卡口,就可以輕鬆打開內膽包裝。紙質卡口使用的是複用設計,所以也能將其輕鬆復原。打開包裝後就能看到GeForce RTX 5070 Founders Edition本體了,正面上看,一個風扇都沒有,非常簡約,金屬質感的X設計配合圓潤的邊緣,讓顯卡看起來像是一個藝術品。

由於這一代Founders Edition對PCB進行了全新設計,讓其面積大幅縮減,給雙風扇都騰出了流通的空間,從而提升了空氣流通的效率,也進而將顯卡體積縮小。

這裏奉上一張RTX 5090 PCB作爲參考。

這是GeForce RTX 30系列Founders Edition採用異型PCB和單流通設計之後的全新嘗試,也是有史以來第一款全流通式冷卻架構。在實際壓力測試中,GeForce RTX 5070 Founders Edition噪音在49dBA,在機箱中的噪音幾乎可以忽略。

這時候用紅外線檢測,在室溫20℃環境中,可以看到GeForce RTX 5070 Founders Edition 最高溫度在40℃左右,電源接口34℃。此時GPU核心溫度在68℃。

由於PCB不再連接到顯卡的IO面板,設計團隊爲了保證接口UHBR20 DisplayPort 2.1b 和 HDMI 2.1b性能,專門使用了注入玻璃纖維帶狀線纜作爲保障。

因此在接口配置上,GeForce RTX 5070 Founders Edition包含了3個DisplayPort 2.1b接口和1個HDMI 2.1a接口。其中DisplayPort 2.1b支持DSC技術,最高可以實現480Hz條件下實現4K 12-bit HDR。HDMI 2.1a則同樣支持DSC技術,最高支持165Hz條件下8K 12-bit HDR。

不同於RTX 5080 FE,GeForce RTX 5070 Founders Edition接口右側面板沒有封死,而是繼續留了通氣口。

不同定位的Founders Edition在導熱材質上的選擇也有不同。比如GeForce RTX 5090 Founders Edition使用了液態金屬作爲導熱材質。GeForce RTX 5070 Founders Edition使用相對常規的相變硅脂。

GeForce RTX 5070 Founders Edition小巧的外觀與GeForce RTX 4070 FE相比,在尺寸上變化不大,細節是電源接入方式回到了45度的斜插方式,並在外觀上看起來圓潤很多,一體感也更強。

用DLSS 4戰2K

GeForce RTX 5070 Founders Edition強力表現最大的功臣自然要算DLSS 4。DLSS 4是Blackwell提升遊戲體驗的重要技術,DLSS 4可以一步到位通過人工智能提升幀率,降低延遲,改善遊戲畫質。

DLSS 4引入了全新的多幀生成技術(Multi Frame Generation,MFG),提供更快的性能和更低的內存使用,並且由CNN卷積神經網絡模型更換到了Transformer模型,這讓超分辨率(Super Resolution,SR),光線重建(Ray Reconstruction,RR),深度學習抗鋸齒(Deep Learning Anti-Aliasing,DLAA)都有了更好的表現,在圖像細節質量和穩定上都有所提升。

需要注意,DLSS 4完全體需要GeForce RTX 50系列GPU才能實現,因爲需要第五代Tensor Core與NVIDIA雲端AI共同合力的結果。

而DLSS 4帶來的效果是立竿見影的。最大的改變就是DLSS 3上的幀生成,變成了DLSS 4上的多幀生成。重點就在一個“多”上。

DLSS 3的幀生成需要依靠Ada Lovelace中的光流加速器,配合遊戲運動矢量,AI網絡,實現每個傳統渲染幀之外,單獨多生成一個幀。

而在GeForce RTX 5070 Founders Edition的Blackwell架構中,第五代Tensor Core在每個傳統渲染幀之間生成的幀數,從1個提升到了最多3個。這是Blackwell硬件和DLSS軟件共同合作的結果。

這套運算方式讓原本的硬件光流加速器也被高效的AI模型代替,使得光流場的生成速度得到提升,AI模型也顯著降低了生成額外幀的計算成本。因此新幀生成AI模型比之前幀生成方法快40%,使用的顯存減少了30%,並且每個渲染幀只需要運行一次即可生成多個幀。

按照慣例,考慮到遊戲表現和內容創作表現,我們準備了兩套測試平臺。一套是針對遊戲的AMD Ryzen 7 9800XD3搭配X870E,內容創作上則使用Intel Core i9-14900K搭配Z790作爲補充,內存爲32GB DDR5-7200,電源1250W。同時顯示器使用了ROG XG27UCG 4K與FHD雙模切換顯示器作爲體驗和遊戲畫質參考。

在DLSS 4的基礎測試中,UL 3Dmark DLSS Feature Test項目已經給DLSS 4提供了預覽版的支持,GeForce RTX 5070通過DLSS 4 4X將幀率提升6.4倍,實際表現幾乎是RTX 4070的2倍。並且對比RTX 4090 D DLSS 3表現,僅剩一步之遙了。

在實踐上,DLSS 4遊戲和應用已經開始發力,在近段時間內,就會有超過75款應用和遊戲支持DLSS 4。讓筆者體感最爲深刻的就是《漫威爭鋒》從首發宣佈支持DLSS 4,需要依靠NVIDIA APP實現2X到4X調整,現在只需要在遊戲裏就能完成無縫切換,無需重啓遊戲的功能。

在實際遊戲體驗中,GeForce RTX 5070表現可以做到RTX 4070的2.5倍。

《龍騰世紀4:影障守護者》中,GeForce RTX 5070表現可以做到RTX 4070的2.1倍。

另外《龍騰世紀4:影障守護者》獲得了NVIDIA APP的支持,即在遊戲啓動之前,找到DLSS Override選項,就可以可以直接對分辨率超採樣,幀生成進行調整。

重點是DLSS 4帶來的畫質體驗效果也非常不錯。在2K分辨率最高畫質下,GeForce RTX 5070通過DLSS 4 4X在光影上獲得了更多穩定表現,畫質在體感上有進一步提升。

事實上,由於DLSS 4上幀數增加而導致的變動明顯,從而導致整體流暢性受影響。爲了解決多幀生成帶來的不確定性,Blackwell使用了增強版的幀翻轉計量(Flip Metering)作爲解決方案,它將幀節奏邏輯轉移到顯示引擎上,讓GPU可以更精確的管理顯示時序。

因此前面檢測的1% Low FPS均使用FrameView利用MsBetweenDisplayChange來計算檢測,原因是常規的檢測方式依靠CPU將幀傳遞給GPU傳遞的時差進行判斷,由於Blackwell使用了多幀生成技術,利用Flip Metering而非CPU的幀速率作爲判斷,因此這套方式並不準確。通過GPU原生的翻轉計量,這可以更爲精確的抓到結果。

回到遊戲上。《霍格沃茨之遺》同樣加入了對DLSS 4的支持,2K分辨率最高畫質且開啓光線追蹤的前提下,GeForce RTX 5070通過DLSS 4 4X實現了將近300FPS的表現,相當於RTX 4070的2倍。

同樣在畫質上,DLSS 4 4X的畫質效果更爲銳利。

《心靈殺手2》更注重遊戲的氛圍感,在開啓DLSS 4 4X後,諸如鐵絲網的細節遠比DLSS 3穩定很多,不再出現抖動的情況,甚至表現比原畫質還要好上不少。

這裏GeForce RTX 5070通過DLSS 4 4X實現了122FPS的表現,是RTX 4070的1.5倍。

《賽博朋克2077》表現更爲突出一些,GeForce RTX 5070加持DLSS 4 4X後是RTX 4070 DLSS 3的3.5倍幀率表現。

對應的畫質也顯著提升,特別是風扇與網格之間猶豫運動產生的僞影不見了。

最後是《星球大戰:亡命之徒》,遊戲中已經內置了幀生成Frame Generation和光線重建Ray Reconstruction兩個選項,其中幀生成Frame Generation可以提供2X幀生成和3X和4X的多幀生成。

實際表現中,GeForce RTX 5070搭配DLSS 4 4X可以做到189FPS平均值,是RTX 4070 DLSS 3的2倍。

然後是基礎光柵性能測試。慣例選用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal作爲參考。

GeForce RTX 5070的表現略遜於RTX 4070 Ti SUPER,但相對RTX 4070,提升幅度可以達到30%到40%。

因此在2K遊戲的實戰環節。DLSS 3遊戲中,GeForce RTX 5070表現與RTX 4070 Ti SUPER是持平的,部分場景相對RTX 4070 Ti SUPER略好一些,但在同一個水平。而如果相對RTX 4070,提升幅度還是非常明顯的,可以做到30%到40%左右的提升。

在DLSS 2的遊戲中,GeForce RTX 5070表現也與RTX 4070 Ti SUPER相當,並且相對RTX 4070提升大概在20%到40%左右。

AI依然帶勁

在AI環節,這裏先通過UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA進行測試。FLUX.1是一個基於FP4模型,擁有120億個圖像生成模型參數,因此對顯存要求也非常高,必須要在16GB顯存以上才能完成。

Blackwell開始從硬件層面引入對FP4數據格式支持,則可以很好的解決這個問題。原因是FP4提供了一種較低的量化方式,類似於文件壓縮,能夠減少模型的大小。相對大多數模型默認使用的FP16精度相比,FP4所需的內存是FP16的不到一半,並且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,FP4可以通過NVIDIA TensorRT模型優化器的量化方式,確保質量不會有太多損失。

GeForce RTX 5070原生支持FP4,對GeForce RTX 4070差距有3.6倍。

另外在Procyon的Stable Diffusion 1.5 FP16,以及Stable Diffusion XL FP16的測試中,RTX 5070相對RTX 4070提升在16%到21%。

同樣是UL Procyon AI的文本生成基準測試中,選取了多個大語言模型LLMs作爲AI性能評估,包括Phi-3.5-mini-3.8B,Mistral-7B-v0.2 7B,Llama -3.1 8B,Llama-2 13B。RTX 5070與RTX 4070 Ti SUPER表現相當,且相對於RTX 4070提升在10%到140%,差距是很明顯的。

MLPerf-Client v0.5是由MLCommons聯盟開發的機器學習基準測試,成員來自哈佛大學、斯坦福大學、NVIDIA、谷歌的工程師和研究人員,旨在不同平臺下探討GPU的AI性能釋放,LLMs大語言模型正好是其中之一。這裏MLPerf-client使用Meta的Llama2-7B模型進行。

同樣,RTX 5070與RTX 4070 Ti SUPER表現相當,且相對於RTX 4070提升在10%到20%。

順帶一提,DLSS 4也已經在D5渲染器中得到了應用,已經可以在軟件菜單中找到Super Resolution,Ray Reconstruction和Frame Generation選項。另外DLSS 4 4X多幀生成還可以通過NVIDIA APP設置來實現。

實際幀率中,RTX 5070和RTX 4070 Ti SUPER相當,通過對DLSS 4的支持,表現是RTX 4070 DLSS 3將近一倍的幀率。

在視頻編輯測試中,我們能夠看到GeForce RTX 5070在創作力上的表現。其配備了1個第九代NVENC編碼器和1個第六代NVDEC解碼器,並且在硬件上提供對YUV 4:2:2支持。在拍攝、編輯、色彩校正的過程中,YUV 4:2:2是目前獲取更多顏色信息、減少文件大小,滿足帶寬需求的合理選擇。在YUV 4:2:2視頻中,完整的亮度值被保留,同時保留了一半的原始色度信息,YUV 4:2:2壓縮視頻幀僅佔YUV 4:4:4的三分之二,同時提供了YUV 4:2:0兩倍的顏色分辨率。

YUV 4:2:2相當於YUV 4:4:4與YUV 4:2:0之間的新選擇,並且已經成爲高端用戶和專業視頻攝像機提供的選擇,當然這也意味着原本以來CPU處理的方式會導致效率低下,用戶體驗不足。

在DaVinci Resolve 19的輸出選項中,可以看到GeForce RTX 5070能夠順利開啓4:2:2 10bit輸出。

這裏我們輸出一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材,GeForce RTX 5070花費時間大概在19秒左右的時間。

如果你是視頻編輯的基礎用戶,GeForce RTX 5070已經比擁有32線程的Core i9-14900K更能打,當然相對於擁有更多編解碼器的RTX 5090 D而言,差距也是明顯的。

另外在V-Ray 6 Benchmark GPU RTX性能測試中,GeForce RTX 5070相對GeForce RTX 4070提升47%。

外Blender Benchmark 4.3.0引入的Moster、Junkshop、Classroom三個參考場景作爲參考。GeForce RTX 5070相對GeForce RTX 4070提升幅度在4%到18%。

最後是SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。GeForce RTX 5070相對RTX 4070提升有20%到40%。

寫在最後:2K遊戲好手

NVIDIA GeForce RTX 5070 Founders Edition令人印象深刻的地方在於,以4599元的定價,獲得與RTX 4070 Ti SUPER的光柵性能,而後者目前市場價格將近7000元,性價比一下子就得以體現。而一旦獲得DLSS 4加持,畫風就完全不一樣了,RTX 5070可以在2K分辨率下輕鬆應對所有3A大作光線追蹤最高畫質,實際遊戲幀率是RTX 4070的2倍以上,這是以前這個價位不敢想象的。

遊戲之外的AI與創作領域,GeForce RTX 5070表現也同樣出色。得益於對FP4原生支持,未來AIGC效率將會變得更高,即便是對比更高階的RTX 4070 Ti SUPER,表現也可圈可點。依靠NVIDIA在行業內的影響力,更多專業軟件和AI應用也會加入到針對GeForce RTX 50系列GPU的優化中,很快我們就能看到GeForce RTX 5070越來越強。

如果有機會選擇,筆者更建議大夥考慮GeForce RTX 5070 Founders Edition版本,這一代的Founders Edition使用了更前沿的設計理念,在滿足散熱效果的同時,也將顯卡尺寸做得更小,更容易裝進小型主機中,對於主流玩家而言,體驗相當友好。

顯然,如果你在等待一款主流定位的GPU,並且在未來一段時間內獲得2K最高畫質流暢體驗,以及AIGC和內容創作的酸爽,在這個價位段下,競爭對手興許會在部分領域給予更高的性價比,但如果想獲得至始至終的流暢體驗,一定是非GeForce RTX 5070莫屬的。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com