英特爾Arc A750 Photon評測：不斷成長的GPU，高性價比創作利器

自打AMD與NVIDIA神仙打架爭奪高端市場開始，2000元以下的GPU能打的幾乎沒有。直至英特爾於2022年推出英特爾銳炫顯卡重返獨立顯卡市場，以Xe-Core爲基礎的GPU橫空出世，Xe-HPG架構入局消費級獨立顯卡市場，讓市場上兩家對抗的局面切換成了三足鼎立。

遊戲顯卡不是說造就能造的。這不僅需要先進的製程，高效的大規模並行處理能力設計，還需要受到遊戲引擎、從業人員的認可，在PC平臺上獲得優秀的兼容性。特別是以NVIDIA CUDA Core、Tensor Core、RT Core以及Game Ready驅動構建出遊戲生態的行業壁壘，想要突破是難上加難。

即便如此，英特爾Arc仍然以先進的設計理念和英特爾本身強大的行業號召力和研發能力讓Arc可以不斷升級，並且價格還相當出彩。以我們今天的主角英特爾Arc A750爲例，OC超頻版也不過1649元。講道理，還要什麼自行車。

光有價格是不夠的，只有性能充足才能對得起對性價比的描述。在I卡登場將近一年半之後，在遊戲、創作、AI、驅動優化方面有什麼樣的進展，不到2000元的花費在當下來看是否值當？現在就讓我們以藍戟GUNNIR Intel Arc A750 Photon 8G OC W爲例，奉上評測。

鍊金術士登場

在Xe-HPG中，代號Alchemist鍊金術士的GPU被第一個派上市場舞臺，按照規劃Intel ARC品牌在未來將包含Alchemist鍊金術士，Battlemage戰鬥法師、Celestial天人和Druid德魯伊數個架構，打出一套GPU組合拳。

在設計上，Xe-HPG並非13代酷睿以前核顯所採用的Xe-LP的擴充版本，而是進行了全新的設計，即引入了Xe-Core內核。Xe-Core可以理解爲向量與張量ALU的集合，配備L0和L1緩存單元。在邏輯層面上與Xe-LP子切片、NVIDIA SM（流式多處理器）接近。如果稍微瞭解一點GPU的同學可能會清楚，單元層級之間並非一成不變，例如NVIDIA在更新架構的時候就曾經對SM層級進行修改。

每個Xe-Core中會包含有16個矢量引擎（Vector Engines，VE）和16個矩陣引擎（Xe Matrix eXtensions，XMX）。其中每個矢量引擎在每個週期內可以處理256bit。如果再向下拆解，每個矢量引擎包含8個FP32 ALU，與Xe-LP EU大致相同。由於16個矢量引擎每個時鐘能夠處理128次FP32操作，即FMA吞吐量爲256 FLOPS，那麼在每時鐘吞吐量上也與NVIDIA Ampere GPU的SM相同。

在Xe-Core中，每16個矢量引擎與16個矩陣引擎配對，用於矩陣和張量計算，這裏英特爾使用了一個專有名詞來命名，即Xe Matrix eXtensions，縮寫XMX，可見其重要性。XMX主要用於AI加速、矩陣/張量計算，每個XMX引擎使用一個8深度脈動陣列制。XMX每個時鐘週期執行8個512位寬的矩陣計算運算。這些矢量和矩陣引擎由一個可以每個時鐘週期取回512B數據的寬加載/存儲單元支持，同時每個Xe-Core有512KB L1的數據緩存。

雖然SM、Xe-Core在矢量吞吐上相匹配，但是英特爾擁有2倍於NVIDIA的矩陣運算吞吐，能夠執行的數量是ALU數量的兩倍，這意味着英特爾GPU仍然傾向於在矩陣運算、人工智能計算上投入更多資源。

在Xe-Core的基礎上，Xe-HPG再向上一層的邏輯是渲染切片（Render Slice），與Xe-LP一樣，切片給英特爾GPU提供了大部分的功能。對於鍊金術士Alchemist而言，一個切片包含4個Xe-Core，4個光線追蹤單元，4個紋理採樣器、幾何/光柵化前端，2個像素後端。這樣4:4:4的佈局意味着Alchemist GPU內，每個Xe-Core都擁有自己的紋理採樣器和光線追蹤單元。

由於Alchemist GPU最高包含8個切片，因此滿配的GPU狀態包含32個Xe-Core，4096個FP32 ALU，支持DirectX 12 Ultimate，具備XMX矩陣引擎。然後再以此向下刪減，從而構成不同定位的獨立顯卡產品。

英特爾Arc A750便是如此。它採用了GD2-512 GPU，代號ACM-G10，基於臺積電6nm工藝打造，擁有217億個晶體管，核心面積達到406 mm²。相對A770，正好刪減掉了一個渲染切片單元，7個渲染切片單元共計擁有28個Xe-Core，28個光線追蹤單元，448個XMX引擎，基礎頻率爲2.05GHz，最高頻率可以達到2.4GHz，TDP 225W。

不僅如此，藍戟作爲英特爾Arc GPU的AIC廠商之一，也讓A750增色不少。作爲評測的GUNNIR Intel Arc A750 Photon 8G OC W，採用了白色的外觀設計更符合白色主機搭配的審美，配合一套名爲icicle多維散熱系統，能夠更好的確保顯卡的穩定表現。

例如三旋帆翼風扇本身支持智能啓停技術，能夠有效控制顯卡散熱噪音，並且五根鍍鎳散熱管+高密度散熱鰭片可以很好的提供散熱輔助效果。在實際測試時的壓力測試狀態下，可以看到GPU核心溫度最高58℃，顯卡外部溫度集中在電源部分，在20℃室溫環境下，溫度大概在45℃左右。

與此同時，GUNNIR Intel Arc A750 Photon 8G OC W供電部分使用了雙8pin設計，可以很好的兼容ATX 3.0之前的電源設計。

接口配置上，GUNNIR Intel Arc A750 Photon 8G OC W提供夠了1個HDMI 2.1和3個DisplayPort 2.0，這意味着Arc A750在接口上也可以支持8K分辨率的輸出。

遊戲驅動持續優化

現在讓我們進入實戰環節，這裏測試平臺採用了Core i9-14900K，iGame Z790D5 Ultra，iGame DDR5 16GB 6800*2 Ultra W作爲參考，並主要圍繞1080p最高畫質，以及3DMark基準進行測試。

在3DMark基準進行測試環節，主要使用了3DMark Time Spy，3DMark Time Spy Extreme，3DMark Fire Strike Extreme，3DMark Fire Strike Ultra，Port Royal作爲參考，在基礎水平上略優於GeForce RTX 3060 12GB表現。

遊戲環節讓我們更進一步。文章開頭我們就提過隨着時間推移，英特爾Arc GPU驅動對遊戲的匹配度越來越高、不斷升級。2024年1月，銳炫顯卡驅動再次迎來重大更新，最新驅動Game On支持多款遊戲新作，同時也爲20餘款熱門DX11、DX12遊戲帶來不同幅度性能提升。這裏我們用去年11月的31.0.101.4972驅動與最新的31.0.101.5333驅動作比較就能感受到在短短三個月的時間裏的顯著提升。

以《正當防衛3》爲例，在1080p最高畫質下，新驅動有了超過160%的增幅，遊戲由基本的流暢變成了170FPS以上高位運行。《文明6》提升幅度明顯，幀率提升超過35%，《消逝的光芒2：人與仁之戰》同樣也很出彩，讓這款跑酷遊戲可以在100FPS以上輕鬆運行。與此同時，《APEX》也有不錯的增幅。

再比如在《賽博朋克2077》較新的3A大作中，同樣是在1080p開啓高階光線追蹤的前提下，新驅動帶來的幀率提升達到40%以上。同時也能看到，XeSS超級採樣已經能夠在設置界面中直接開啓。

XeSS超級採樣技術（Xe Super Sampling）類似於火熱的NVIDIA DLSS，AMD FSR，通過一系列AI優化算法，以更低的運算資源作爲代價，換取更高的性能和圖像質量。它與DLSS類似，是一種結合空間和時間在AI圖像上進行提升的技術，即使用了空間數據（相鄰像素）和時間數據（前一幀運動物體向量）組合交於神經網絡進行學習。

事實上在宣佈ARC品牌之前，英特爾已經進行了很長時間的研發，目前已經對上百款遊戲提供了優化，讓Arc A750在新舊大作上運行越來越順暢。

例如在《反恐精英2》和《原子之心》中，能看到提升達到15%，而《獵殺:對決》提升則可以達到35%以上。

另外值得一提的還有英特爾Arc驅動直觀的控制面板，不僅提供了遊戲整理集合與酷炫的界面，同時也集合了廣播、捕獲、精彩時間抓取多種功能。還可以開啓置頂的性能面板，在遊戲運行過程中時刻監控GPU的性能表現。

AI亮眼，創作新能手

強大的並行處理能力讓GPU本身就非常適合內容創作工作，英特爾Arc A750在設計Xe Core、XMX引擎的時候，也有意將重心放在內容創作、AI加速、AV1編解碼等方面。舉個最直觀的例子，英特爾Arc的AV1編解碼能力非常彪悍，即使用DaVinci Resolve對一段2分鐘12GB的4K素材進行AV1編碼，實際使用時間甚至可以比GeForce RTX 4090還要快。

與此同時，我們也分別用RTX 3060 Ti、RTX 4090對H.265格式輸出進行對比，也能看得出英特爾Arc A750真的很猛。

AV1的優勢還可以直接使用在遊戲直播和串流中，原因是AV1編碼器比H.264效率更高，在相同帶寬或者體積下，AV1就能夠展現出更多清晰的細節。這裏我們用一段《反恐精英2》的AV1和AVC直播錄製進行對比，同一場景下，可以明顯看到AV1串流視頻的建築物與槍體輪廓更加清晰。

而在Procyon Benchmark中，我們還能看到英特爾Arc A750在視頻處理和圖片處理上的綜合表現，已經相當能打。

在Blender Benchmark渲染輸出中，選擇了主要檢測了Moster、Junkshop、Classroom三個輸出場景，表現如下，和RTX 3060旗鼓相當。

工程專業常見的SPECviewperf 2020。這是一款包含能源勘探、醫學、建築設計、機械設計、汽車設計、飛機設計領域的專業軟件圖形測試，包括包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流軟件。英特爾Arc A750在大部分專業軟件中已經可以流暢運行。

最後還需要一提的是英特爾Arc A750也有着不錯的AI性能表現。這裏我們以Stable Diffusion爲例作爲參考。Stable Diffusion是2022年推出的深度學習文本到圖像轉變的AICG工具，這套工具由初創公司Stability AI和非營利組織、學術人員共同合作開發，因此它相對需要收費的Midjourney有更好的開放性和擴展性，並提供一系列的插件實現更多功能，比如AI圖片修復、文本提示引導圖像，甚至是圖像翻譯等等，可以預見在未來會不斷融入更強大的功能。

Stable Diffusion運行的前提是需要至少8GB以上的顯存vRAM和AI性能足夠強勁的GPU進行，否則本地體驗不如直接購買雲端服務來的直接。通過在B站就可以直接獲取一鍵運行的資源，英特爾Arc A750能夠以中文界面輕鬆運行Stable Diffusion，即便對於新手玩家而言，配置也不再是問題。

這裏我們利用一段固定的文字描述來引導Stable Diffusion爲我們創建20張符合描述的建築風景圖片。在UI界面中設置Arc A750一次同時運算2張圖片，一共運行10次，即20張。每張圖片分辨率爲512x512分辨率，採樣步數設置爲50，採樣方式選擇Euler a。

文字描述參考如下：

beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette

在實際使用中可以看到，Arc A750輸出圖片效率和質量不錯，僅需要2分14秒就完成了20張圖片的生成，平均6.7秒生成一張圖片，按照每分鐘生成的圖像效率（Images Per Minute）的算法，公式爲60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute，最終生成效率在8.95 Images Per Minute @ 512x512，是一個很不錯的表現，特別是作爲一款1649元價位的GPU而言，表現非常出衆了。

寫在最後：性價比優秀的創作利器

英特爾Arc A750的優點在於強大的多媒體處理能力，特別是彪悍的AV1編解碼能力就算對抗旗艦級的GeForce RTX 4090也絲毫不輸。並且隨着英特爾持續不斷的驅動優化，玩家的遊戲體驗日益提升，英特爾Arc A750在主流遊戲上的性能表現也日趨成熟，部分遊戲場景在更新遊戲驅動後能獲得2倍以上性能提升，在目前1649元的定位下，着實讓人覺得賺大發了。