重磅!DeepSeek開源第二彈;混合推理模型Claude3.7同日上線!

2月23日,昨天DeepSeek啓動開源周,正式開源了第一個代碼庫FlashMLA,DeepSeek實測可以將讓H800內存帶寬達到3000GB/s、算力達到580TFLOPS,性能突破上限!今天DS也是讓全球徹底卷瘋了,繼續推出第二彈代碼庫DeepEP項目,爲MoE模型的訓練和推理提供了高效通信工具,與此同時,人工智能初創公司Anthropic,今天宣佈推出全球首個混合推理模型Claude 3.7 Sonnet,擊敗了DeepSeek-R1和OpenAI滿血版o1,號稱是迄今爲止最智能的模型!

首先是DeepSeek對DeepEP的官方介紹,這是全球第一個用於MoE 模型訓練和推理的開源 EP 通信庫,主要以高效算力協同爲核心目標,深度集成NVLink和RDMA技術,實現節點內/間超低延遲通信,同時提供訓練階段高吞吐量的預填充內核與推理階段低延遲解碼內核,顯著加速混合專家模型的計算流程。

DeepEP通過原生FP8調度支持,減少顯存佔用並提升運算效率,配合靈活的GPU資源控制機制,可實現計算與通信流水線重疊,在保證精度的前提下最大限度釋放硬件性能,爲大規模MoE模型訓練與推理提供高效通信解決方案。DeepSeek最近發佈的代碼庫都相對硬核,我在今天稍微晚些的時候還會繼續給大家做更詳細的解讀。

第二條重磅消息來自Anthropic,這家公司和DeepSeek類似,同樣也是業界內的知名公司,今天Anthropic帶來了最新的Claude 3.7 Sonnet,號稱其迄今最智能的模型及全球首款混合推理模型,這個模型突破性實現了雙模態思考,既能快速響應即時需求,又可通過分步推理展示詳細邏輯鏈,兼顧效率與深度。

目前Claude 3.7 Sonnet數學與編碼能力較前代3.5版本提升超10%,增強複雜任務處理水平,並且和DeepSeek-R1一樣,首日起向全球用戶免費開放,不過暫未上線“擴展思考”功能,此外Anthropic還配套推出Claude Code,開發者可通過終端直接委託工程級任務。Anthropic在長遠發展藍圖中將DeepSeek和OpenAI兩家公司視爲主要的競爭對手,未來AI社區的競爭還會更加激烈!

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com