阿里巴巴開源宣稱可媲美DeepSeek-R1的QwQ-32B模型

圖片來源:

Hugging Face

繼於去年11月釋出QwQ-32B-Preview模型之後，阿里巴巴旗下的通義千問（Tongyi Qianwen，Qwen）團隊本周四（3/6）正式開源了QwQ-32B。

Qwen團隊主要開發同名的Qwen基礎模型，而QwQ則是基於Qwen系列的推論模型，具備更深入的思考及推論能力，可於相對困難的下游任務中提供更好的表現。擁有325億個參數的QwQ-32B屬於中型推論模型，並宣稱其性能可媲美DeepSeek-R1與o1-mini等先進模型。

該團隊評估了QwQ-32B、DeepSeek-R1-671B、OpenAI-o1-mini、藉由DeepSeek-R1蒸餾而來的Qwen-32B模型，以及自DeepSeek-R1蒸餾而來的Llama-70B，在AIME24數學推論基礎測試、程式碼生成及相關任務LiveCodeBench測試、評估語言模型多方面能力的LiveBench、驗證自然語言指令能力的IFEval，以及函數調用（BFCL）上的能力，發現QwQ-32B在每個領域上的表現都與其它模型相當，甚或超越。

有興趣的開發者或研究人員可透過Hugging Face或是阿里巴巴的Alibaba Cloud DashScope API存取QwQ-32B。圖片來源_Qwen

熱門新聞