圖片來源: 

GitHub

前微軟亞洲研究院院長、創投家李開復創立的AI新創公司零一萬物(01.AI),本周宣布開發大型語言模型Yi-6B及34B並將之開源出來。

李開復旗下的私募基金創新工場於今年3月,成立開發生成式AI包括大型語言模型(LLM)及聊天機器人的新創公司零一萬物(01.AI),如同中國版的OpenAI,他本人則兼任這家公司的執行長。在成立8個月後,李開復在與彭博的訪談中公布名為Yi的首個LLM,包含60億及340億參數訓練的2個版本 。這個模型已透過GitHub開源給社群

李開復並指出,零一萬物獲得阿里巴巴控股及其他幾家金主的資金後,目前市值已突破10億美元。

根據零一萬物在Hugging Face的介紹,Yi是一組LLM,為上下文長度200K的基礎模型。它的特色之一是雙語(中/英文)模型。此外,雖然比起其他開源模型小得多,但根據Hugging Face列出的標竿測試,Yi-34B效能在數個指標例如在常識推理、閱讀理解及數學&編程測試中,效能比阿拉伯聯合大公國的Falcon-180B和Meta的Llama2-70B等大型模型還好。MMLU、CMMLU、C-Eval等測試中,也都拿下第一名位子。

這家業者目標市場不只是中國,也放眼全球。李開復說Meta Llama 2是開原碼社群的黃金標準,而Yi模型想提供另一選項。零一萬物預計12個月、18個月將再公告1,000億到4,000億參數的LLM。

熱門新聞

Advertisement