3月7日消息,阿里巴巴在昨天凌晨,開源了全新的推理大模型通義千問QwQ-32B,通過大規模強化學習,QwQ-32B在數學、代碼及通用能力上實現質的飛躍,整體性能足以比肩DeepSeek-R1,目前QwQ-32B已經成功登頂開源社區Hugging Face大模型榜單!
根據阿里官方的實際測試數據,QwQ-32B在AIME24得分79.5(DeepSeek-R1爲79.8),遠超OpenAI o1-mini的63.6分,在LiveCodeBench得分63.4(DeepSeek-R1爲65.9)比同規模模型都要強,在LiveBench測試中以73.1分超過DeepSeek-R1的71.6分,QwQ-32B的綜合性能甚至比R1還要強!
QwQ-32B後面那個32B指的是參數規模達到320億,阿里直接用320億參數規模的千問,追上了6710億參數規模的R1(激活參數370億),而且QwQ-32B還實現了高性能推理模型在消費級顯卡上的本地部署,模型體積經Q4量化後壓縮至不足20GB,可直接在24GB顯存的RTX 3090/4090顯卡上全精度運行。
根據阿里千問的說法,QwQ-32B是在Qwen2.5-Plus基礎加上推理深度思考功能,性能提升主要是來源於大規模強化學習(昨天強化學習之父Sutton剛剛拿下計算機屆最高獎圖靈獎),阿里的思路和DeepSeek完全一樣,希望降低企業與個人用戶的使用門檻和成本,單次推理成本僅0.25美元。
QwQ-32B的模型權重、訓練代碼及工具鏈已經完全公開,阿里還提供了中文技術文檔,QwQ-32B已經成爲繼DeepSeek後登頂全球開源社區榜首的又一個國產大模型!另外,阿里最近的大動作其實一點也不比DeepSeek少,之前與DeepSeek-R1同期發佈的QWen2.5-Max就已經很強了,上週還開源了最新的視頻生成模型Wan 2.1,未來三年阿里還將在AI領域投資3800億美元,用於建設阿里雲和AI硬件基礎設施!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com