比肩DeepSeek！阿里開源推理大模型，登頂全球第一！

3月7日消息，阿里巴巴在昨天凌晨，開源了全新的推理大模型通義千問QwQ-32B，通過大規模強化學習，QwQ-32B在數學、代碼及通用能力上實現質的飛躍，整體性能足以比肩DeepSeek-R1，目前QwQ-32B已經成功登頂開源社區Hugging Face大模型榜單！

根據阿里官方的實際測試數據，QwQ-32B在AIME24得分79.5（DeepSeek-R1爲79.8），遠超OpenAI o1-mini的63.6分，在LiveCodeBench得分63.4（DeepSeek-R1爲65.9）比同規模模型都要強，在LiveBench測試中以73.1分超過DeepSeek-R1的71.6分，QwQ-32B的綜合性能甚至比R1還要強！

QwQ-32B後面那個32B指的是參數規模達到320億，阿里直接用320億參數規模的千問，追上了6710億參數規模的R1（激活參數370億），而且QwQ-32B還實現了高性能推理模型在消費級顯卡上的本地部署，模型體積經Q4量化後壓縮至不足20GB，可直接在24GB顯存的RTX 3090/4090顯卡上全精度運行。

根據阿里千問的說法，QwQ-32B是在Qwen2.5-Plus基礎加上推理深度思考功能，性能提升主要是來源於大規模強化學習（昨天強化學習之父Sutton剛剛拿下計算機屆最高獎圖靈獎），阿里的思路和DeepSeek完全一樣，希望降低企業與個人用戶的使用門檻和成本，單次推理成本僅0.25美元。

QwQ-32B的模型權重、訓練代碼及工具鏈已經完全公開，阿里還提供了中文技術文檔，QwQ-32B已經成爲繼DeepSeek後登頂全球開源社區榜首的又一個國產大模型！另外，阿里最近的大動作其實一點也不比DeepSeek少，之前與DeepSeek-R1同期發佈的QWen2.5-Max就已經很強了，上週還開源了最新的視頻生成模型Wan 2.1，未來三年阿里還將在AI領域投資3800億美元，用於建設阿里雲和AI硬件基礎設施！