圖片來源: 

Hugging Face

繼於去年11月釋出QwQ-32B-Preview模型之後,阿里巴巴旗下的通義千問(Tongyi Qianwen,Qwen)團隊本周四(3/6)正式開源了QwQ-32B

Qwen團隊主要開發同名的Qwen基礎模型,而QwQ則是基於Qwen系列的推論模型,具備更深入的思考及推論能力,可於相對困難的下游任務中提供更好的表現。擁有325億個參數的QwQ-32B屬於中型推論模型,並宣稱其性能可媲美DeepSeek-R1與o1-mini等先進模型。

該團隊評估了QwQ-32B、DeepSeek-R1-671B、OpenAI-o1-mini、藉由DeepSeek-R1蒸餾而來的Qwen-32B模型,以及自DeepSeek-R1蒸餾而來的Llama-70B,在AIME24數學推論基礎測試、程式碼生成及相關任務LiveCodeBench測試、評估語言模型多方面能力的LiveBench、驗證自然語言指令能力的IFEval,以及函數調用(BFCL)上的能力,發現QwQ-32B在每個領域上的表現都與其它模型相當,甚或超越。

有興趣的開發者或研究人員可透過Hugging Face或是阿里巴巴的Alibaba Cloud DashScope API存取QwQ-32B。圖片來源_Qwen

熱門新聞

Advertisement