一、前言
在2021年的英特爾Architecture Day活動上,英特爾正式發佈Xe微架構並官宣了旗下消費級獨立顯卡品牌“Intel Arc”(英特爾銳炫),計劃於2022年第一季度上市首代產品Alchemist。有意思的是,英特爾同時公佈了未來三代Xe微架構Xe2 HPG、Xe3 HPG 和 Xe NEXT Architecture,與之對應的產品代號分別爲Battlemage、Celestial和Druid,衆多細節這讓大家對初入獨立顯市場的英特爾銳炫充滿期待。
隨後,Alchemist如約而至,2022年Q1發佈了移動端A350M/A370M,Q3發佈了與GUNNIR藍戟合作的桌面端獨立顯卡A380,但關注度並不太高,真正意義上被大家廣泛關注的獨立顯卡是Q4發佈的A750、A770以及A580。
然而,隨之而來的兼容性不足、功耗與散熱控制不佳、驅動滯後等一系列問題讓英特爾銳炫身陷囹圄,第二代產品Battlemage的延期更是讓許多人猜測英特爾將放棄獨立顯卡產品線。
時間來到2024年6月,英特爾新一代Xe2 HPG架構在COMPUTEX 2024(臺北國際電腦展)上亮相;12月,大家期待已久的第二代銳炫獨立顯卡Battlemage正式發佈,相繼推出兩款基於Xe2 HPG架構的顯卡Intel ARC B580和B570,這讓之前的種種流言不攻自破。
Arc B580比Arc B570早一個月發佈,兩者採用相同的GPU核心BGM-G21,但Arc B570的Xe核心數量、GPU頻率、顯存容量/帶寬/速度等核心參數都比Arc B580更低一些,Arc B580售價2049元起,Arc B570售價1799元起。兩張顯卡的功耗控制都很優秀,TBP分別爲190W和150W,相比上代A770和A750(TBP 225W)更節能,體現出新架構在能效方面的優勢。
值得一提的是,英特爾沒有發佈Arc B570的公版顯卡,而是直接與廠商合作推出了非公版,其中最受關注的品牌就是GUNNIR藍戟。作爲英特爾入局GPU領域後在中國大陸的首家核心合作伙伴,藍戟誠意滿滿的推出了Photon,Tri和Index三個版本Arc 570,和藍戟Arc B580如出一轍。
本文,藉助藍戟Intel Arc B570 Photon 10G OC(下文簡稱藍戟B570 Photon)和大家探討一下Xe2 HPG架構做了哪些改進,聊一聊英特爾第二代獨立顯卡Battlemage針對之前的問題做了哪些優化,以及藍戟Arc B570 Photon 10G OC這張卡的實際表現。
二、新架構解讀
Xe2 HPG是英特爾第二代高性能圖形架構,在Xe HPG架構基礎上通過重構計算單元、強化光追單元強化、升級AI引擎以及大量的功能性優化和改進,顯著提升了資源利用率、優化了任務分配機制、加強了軟件兼容性等,實現了性能與能效的雙重突破。並且,前文提及的第一代 Xe HPG架構存在的幾個主要問題都得到了有效解決。
渲染切片是Xe2 HPG架構中的基本模塊,也是核心模塊,每個渲染切片包含4個Xe2 core、4個光追單元、2個像素後端和4個像素採樣器等,渲染切片可以根據需要進行堆疊和縮放,減少延遲並改善軟硬件握手。通過增加渲染切片的數量可以增加顯卡的3D性能和計算效率,區分出不同規格的顯卡型號。
Xe2核心在計算單元設計上進行了顯著升級,每個Xe2核心配備8個512bit XVE矢量引擎(傳統圖形計算)和8個2048bit XMX矩陣引擎(AI加速),支持SIMD16和SIMD32指令,並新增對TF32數據格式的優化,提升了計算資源分配的靈活性。此外,新增的 256KB共享L1緩存/SLM緩存減少了數據訪問延遲,提升了計算效率。
前代矢量引擎內部採用兩組計算模塊(每組含8 FP/8 INT單元),而Xe2核心將兩組合併爲單組,整合爲 16個FP單元、16個INT單元、4個EM(擴展數學單元)和2個FP64單元,矢量單元位寬翻倍、XMX矩陣單元的算力密度更高,這種設計減少了線程控制器和分派單元的冗餘,降低了指令延遲,同時支持 FP、INT/EM、XMX三路並行計算 ,提升單元利用率,尤其針對XeSS 2、AI推理和訓練任務以及LLM大語言運用提供更出色的AI加速效果。
Xe2核心的另一個重要部分是光線追蹤單元,它有3個遍歷管線,18個盒形交叉點和2個三角形交叉點,BVH緩存增大到16KB,是上代的2倍。儘管光追單元與Xe2核心解耦,但仍保持1:1配置,確保每個核心的光追資源獨立分配,避免共享資源導致的爭用問題。這種設計在保持靈活性的同時,兼顧了光追與通用計算的平衡。
光線追蹤通過模擬自然光的傳播路徑,實現了對陰影、反射、全局光照等效果的物理級還原。例如,在《賽博朋克2077》中開啓光線追蹤技術,光源(如霓虹燈、車燈)與場景物體互動時,陰影會根據距離和遮擋關係呈現柔和的漸變效果,溼潤的街道、玻璃表面和金屬材質會精確反射周圍環境細節(如廣告牌文字、建築輪廓),強化了賽博朋克美學的視覺衝擊。
BMG-G21這枚GPU芯片擁有5 個渲染切片,每個渲染切片包含4個Xe核心,共20個Xe核心;每個Xe核心都有8 個512位矢量引擎、8個2048 位XMX引擎、1個專用光線追蹤單元。據英特爾稱,與上代相比,BMG-G21的每個Xe內核性能提高了 70%,每瓦性能提高了50%。
視頻編解碼方面是英特爾顯卡的強項,爲了能充分發揮解碼和編碼工作負載中的出色性能,英特爾銳炫B系列媒體引擎採用雙 MFX 設計,能夠處理高達8K 10bit HDR 120 FPS 的編碼工作負載,支持AVC、VP9、H.265 HEVC、AV1 和全新的VVC引擎等,滿足視頻製作和流媒體專業人士在當今先進媒體環境中的需求。此外,它還提供對 XAVC-H 的強大支持,確保兼容更廣泛的專業級相機源內容的硬件加速。
三、XeSS2技術解讀
英特爾Xe超級採樣技術XeSS,以較低分辨率利用AI算法和硬件加速渲染出更高質量的圖像,並且在保持畫質不會有太大損失的前提下,大幅提高遊戲幀率。例如,開啓XeSS後可以將720p提升至1080p,從而降低顯卡對圖形渲染的負載,有效提升遊戲幀率。
隨着Xe HPG架構的升級,XeSS也更新到第二代,除了傳統的超級分辨率技術,又加入了兩項新技術:幀生成技術XeSS-FG和低延遲技術 XeLL。前者可提升遊戲幀數,顯著改善畫面流暢度;後者可減少鍵鼠與屏幕畫面之間的延遲,提升遊戲操作的響應速度和流暢度。
下圖是英特爾官方給出的《F1 24》遊戲測試數據,顯卡是Intel Arc B580。
在2K最高畫質下原生畫面平均幀率48fps,開啓XeSS後幀率可提升至82fps,開啓XeSS2後(同時開啓XeSS-SR和XeSS-FG)幀率可提升至136fps,是原生畫質的2.8倍,是第一代XeSS的1.6倍。
在2K最高畫質原生分辨率下游戲幀率48fps,顯示延遲57ms;僅開啓XeLL延遲降低至32ms,降幅約45%,遊戲幀率基本沒有變化。開啓XeSS超分後,延遲28ms,繼續開啓XeLL後,延遲降低至19ms,開啓XeLL+XeSS-SR+XeSS-FG後,延遲28ms,遊戲幀率提升至152fps,降低延遲和提升幀率的效果都非常顯著。
這裏我使用3DMARK Intel XeSS功能測試對藍戟B570 Photon進行了檢驗,XeSS關閉時,測試幀率27.79FPS;XeSS開啓後,測試幀率69.03FPS,性能差異約148.4%。由此可見,XeSS對遊戲幀數的影響巨大。
目前支持XeSS 2的遊戲並不多,希望後續英特爾加快推廣進度。還有就是,XeSS 2技術並沒有設置硬件壁壘,只要擁有XMX矩陣引擎的Xe架構的獨顯與核顯都能使用,包括Arc A系列和B系列獨顯,以及英特爾酷睿Ultra 200V的核顯也可以支持完整的XeSS 2。
四、開箱
藍戟B570 Photon的包裝設計與銳炫A系列截然不同,銳炫A系列的包裝設計主打時尚與光影效果,銳炫B系列則以簡約、內斂爲主基調,“PHOTON”加入了有趣的“折彎”設計,我還挺喜歡這個細節的。
左下角標註了XeSS、XMX、RAY TRACING(光線追蹤)和10GB MEMORY(10GB顯存)等幾項新架構的重要特性。
右下角標註了顯卡型號:intel ARC B570。
包裝盒是抽屜式設計,拉開後,在內盒等側面有一個“光”字,這是藍戟賦予銳炫B系列等名號。
打開包裝第一眼看到的是一枚非常漂亮的藍戟Photon系列專屬磁吸徽章,與顯卡背面的圖案遙相呼應,開箱儀式感拉滿。
五、外觀與細節展示
藍戟B570 Photon的外觀依然延續了上一代藍戟家族式的NEO美學設計,一體式純白塗裝,造型方正;導風罩表面有類似鏈條的線條紋理,既打破了純白色主體的單調,又呈現出簡潔、精緻的優雅氣質,穩穩拿捏了我這枚理工男的審美。
藍戟B570 Photon的尺寸約爲300*118*52mm(不含檔片),正面是三枚全新設計的環形風扇,名曰“幽刃”,波浪形扇葉邊緣,中軸圓環紋理增強了視覺動感。
當然,藍戟B570 Photon的風扇不只是在造型上做了改變,相比上代風扇,風壓提升了約26%,噪音降低了約11%,綜合性能有了顯著提升。
藍戟B570 Photon的基礎頻率從公版2500MHz提升至2690MHz,TBP從公版的150W提升至186W,使用單8Pin電源接口,配備5根6mm鍍鎳散熱管直觸GPU核心,半開放結構的高密度散熱鰭片,可提供高效散熱。
右側是銳炫顯卡標誌性燈牌,正常運行狀態是藍色呼吸效果,未插電源線會亮起紅燈提醒。
顯卡背板爲金屬材質,設計了四道鏤空槽,既能提升結構強度,又能引導氣流穿透散熱鰭片,提升散熱效率。
藍戟B570 Photon配備了1個HDMI 2.1接口和3個DP 2.1接口,其中,中間的DP 2.1接口支持UHBR 13.5,另外2個支持UHBR 10,最高可滿足8K@60Hz或4K@360Hz高規格顯示需求。
值得一提的是,藍戟B570 Photon的顯卡擋板做的非常精緻,鏤空的“GUNNIR”字樣以及漸變設計的網格紋理讓我不禁眼前一亮。
有一說一,白色主題的藍戟B570 Photon上機效果實在太讚了!之前裝的這臺白色海景房沒找到調性一致的白色顯卡,一直是我的心結。換上藍戟B570 Photon後瞬間與我的主機融爲了一體,有光無光都能輕鬆駕馭。
六、基準性能測試
本次測試平臺基於英特爾酷睿Ultra7 265K + 技嘉Z890M AORUS ELITE WIFI7 ICE
打造,驅動已升級官網最新版,系統版本Windows 11 24H2,開啓Resizable Bar和Above 4G Decoding,確保可以充分發揮藍戟B570 Photon的性能。
3DMark針對藍戟B570 Photon的性能測試結果如下:
2K分辨率 DirectX 12 遊戲的基準測試Time Spy,藍戟B570 Photon綜合測試結果13292分,顯卡得分12501分。
Speed Way是一項用於測試DirectX 12 Ultimate性能的顯卡基準測試,該測試結合了實時光線追蹤和傳統渲染技術來測量顯卡性能,場景含有光線追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果等,渲染分辨率爲2560×1440。
藍戟B570 Photon綜合測試結果1939分。
Steel Nomad是一種針對高端遊戲電腦的跨平臺、非光線追蹤基準測試,默認使用 DirectX 12 API。
藍戟B570 Photon綜合測試結果2641分。
Port Royal測試結合了實時光線追蹤和傳統渲染技術來測量顯卡性能。 場景具有光線追蹤反射,陰影(光線追蹤和陰影映射),具有光線追蹤反射的玻璃表面,體積照明,粒子和後處理效果。 渲染分辨率爲2560×1440。藍戟B570 Photon實時光追性能測試得分6744分。
七、遊戲體驗
在3DMARK測試顯卡性能的同時,預估了戰地5、APEX、GTA5、荒野大鏢客2、堡壘之夜等5款熱門遊戲的幀率,1080P和2K分辨率測試結果如下。實際遊戲表現又會如何呢?
《黑神話:悟空》
《黑神話:悟空》基於虛幻引擎5打造,支持Nanite虛擬幾何體,可導入數十億面片等高精度模型,細節表現力達到電影級;支持Lumen動態全局光照,可實時計算間接光照與反射,結合全景光線追蹤技術,精確模擬自然光效(如丁達爾效應、動態陰影),提升場景沉浸感;支持真實物理破壞效果,還原建築崩塌、毛髮與液體交互等效果。
遊戲中2K分辨率+低級光追+XeSS+高畫質,遊戲幀率66FPS左右,關閉光追遊戲幀率能達到77-80FPS。
《荒野大鏢客2》
《荒野大鏢客2》是迄今爲止我玩過視覺效果最震撼的開放世界遊戲之一,遊戲基於RAGE引擎打造,擁有極高的圖形細節,但也需要強大的硬件性能才能流暢運行。
在遊戲中,2K分辨率+高畫質並關閉抗鋸齒,遊戲幀率120FPS左右,比我想象中的高很多,遊戲運行非常流暢,沒有出現卡頓現象。
《賽博朋克2077》
《賽博朋克2077》由CD Projekt Red(CDPR)自主研發的遊戲引擎RedEngine打造,支持動態全局光照、高精度物理渲染和複雜粒子特效,尤其在光線追蹤技術上的表現突出,屬於硬件性能的“標杆級”測試工具。
在遊戲中,開啓2K分辨率+超級光追+Xe超採1.3hao j時,遊戲幀率52FPS,+Xe超採1.3啓低級光追時,遊戲幀率只要不開到超級光追,依然可以FPS,
《PUBG》
開啓2K分辨率+超高畫質,遊戲幀率100+FPS,遊戲內非常流暢,畫面質感也還不錯。
《CS2》
2K分辨率+高畫質,遊戲內正常場景的幀率維持在200+FPS,在煙霧內遊戲幀率130+FPS,遊戲非常流暢,畫面沒有出現卡頓、撕裂等異常現象。
八、AI性能測試
爲了保證測試結果的客觀性,AI性能測試使用UL Procyon 基準測試套件完成,需要對比顯卡AI性能的小夥伴可以參考詳細數值。
AI圖像生成測試
Stable Diffusion 1.5 FP16模型,測試總分1194,共耗時83.745s,速度5.234s/張。
參數設置:
批次大小:4
迭代步數:100
生成圖像數量:16
圖像分辨率:512*512
Stable Diffusion 1.5 INT8模型,測試總分7473,共耗時33.451s,速度4.181s/張,平均UNET速度:12.157it/s。
參數設置:
批次大小:1
迭代步數:50
生成圖像數量:8
圖像分辨率:512*512
AI文本生成測試
AI Text Generation Benchmark可以反覆且一致地測試多個LLM AI模型,測試的模型包括PHI 3.5 mini、MISTRAL 7B、LLAMA3.1 8B 和 LLAMA2 13B,使用OpenVINO運行測試,測試結果如下:
PHI 3.5 mini:總分2988、平均TTFT 0.29s、平均OTS 102.53tokens/s、加載時間3.09s;
MISTRAL 7B:總分2800、平均TTFT 0.41s、平均OTS 71tokens/s、加載時間4.59s;
LLAMA3.1 8B:總分2575、平均TTFT 0.4s、平均OTS 65.79tokens/s、加載時間5.02s;
LLAMA2 13B:總分1552、平均TTFT 1.09s、平均OTS 19.46tokens/s、加載時間8.17s。
生產力應用測試
這裏測試的生產力工具是大家平時常用的Adobe軟件(Ps+Pr+Lr),爲了保證數據客觀性,我依然使用UL Procyon對這幾款Adobe軟件進行更專業的性能測試,通過最後的分數量化電腦在執行編輯、導出任務時速度。
針對Adobe Photoshop和Lightroom的照片編輯基準測試分數:8237
UL Procyon照片編輯基準測試在照片編輯工作流程中使用Adobe Lightroom Classic和Adobe Photoshop。這項照片編輯基準測試首先將數字負片 (DNG) 圖像文件導入Adobe Lightroom Classic,然後應用各種預設;部分圖片會被裁剪、拉直和修改。在測試的第二部分中,將多個編輯和圖層效果應用於 Adobe Photoshop 中的照片上。
針對Adobe Premiere的視頻剪輯基準測試分數:27910
UL Procyon視頻編輯基準測試在視頻編輯工作流程中使用Adobe Premiere Pro,使用相關的應用來確保基準測試的分數可以反映出整個系統在實際使用時的表現。基準測試首先導入兩個視頻項目文件,項目時間線上包括各種編輯、調整和效果;第二個項目使用多個 GPU 加速效果。每個視頻項目會使用H.264編碼的Full HD格式和HEVC (H.265)編碼的4K UHD格式進行導出。
值得一提的是,Intel爲用戶提供了自研AI軟件AI PLAYGROUND,集成了AI創作、創作增強、大語言模型等AI創作功能,集成了主流AI模型並對設置過程簡化、優化,方便新手使用。
大語言模型集成了當前最熱門的滿血版DeepSeek R1。
九、散熱與噪音表現
“高功耗”是上一代A系列顯卡被用戶反饋最多的問題,到了B系列,得益於新架構的優化,這兩個問題得到有效解決。
在FurMark顯卡壓力測試中,2K分辨率滿載10分鐘測試,藍戟B570 Photon的溫度只有61°C,核心功耗114W,整卡功耗160W左右。而我之前測試過的上一代藍戟A750 Photon滿載時的核心功耗超過170W,整卡功耗超過220W。
藍戟B570 Photon的風扇支持智能啓停功能,桌面待機時轉速爲0,噪音47.8dB;顯卡滿載時風扇轉速1200轉,噪音48.6dB。可以說,這一代銳炫B系列顯卡的噪音控制灰常牛X。
十、總結
Intel ARC B570發佈之後,聽到最多的討論就是它與NVIDIA RTX 4060的對比,其實從整體表現來看,兩張顯卡的性能不相上下, 尤其憑藉10GB顯存和380GB/s帶寬的優勢,Intel ARC B570在2K分辨率遊戲、生產力創作、AI運算等方面的表現會優於NVIDIA RTX 4060。最重要的一點是,Intel ARC B570的價格不到2000元,而RTX 4060的價格普遍在2500元以上,這麼一對比,Intel ARC B570更具性價比。
OK,以上就是本次分享的全部內容,感謝大家觀看。
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com