【本土LLM成果:台智雲福爾摩沙大模型】靠3種平行化技術提高訓練效率,加速繁中LLM產品化
平行化運算是訓練LLM不可或缺的關鍵。台智雲在2022年下半年展開研究,以資料平行化、張量平行化和工作流程平行化來打造福爾摩沙系列模型
2023-12-01
| 叡揚資訊 | AI Chatbot | AI對話機器人 | 繁中語料 | 大型語言模型 | LLM
【企業LLM實戰:叡揚資訊】實測多種LLM更走訪企業現場,歸納臺灣企業LLM應用3大挑戰
年初,專攻AI對話平臺的叡揚資訊開始嘗試不同的LLM,更參與了不少企業客戶LLM驗證。他們從這些實戰中,歸納出臺灣企業現在所面對的3大LLM課題
2023-11-30
前微軟亞洲研究院院長李開復創立的零一萬物(01.AI),公布其開源大型雙語(中/英文)模型Yi-6B及34B
2023-11-07
| 中研院 | CKIP-Llama-2-7b | LLM | 大型語言模型 | TAIDE
【剖析中研院大型語言模型事件的衝擊】為何臺灣必須擁有本土化的LLM
在10月6日國慶日前夕,中研院開源釋出了使用Llama 2所開發的繁中大型語言模型CKIP-Llama-2-7b,但由於一開始未說明該模型是明清人
2023-10-12
近期公開於Hugging Face平臺的大型語言模型FLM-101B,強調具備1,010億個參數及0.31TB token,研究人員強調開發成本只花了10萬美元,且效能媲美GPT-3和GLM-130B等知名模型
2023-09-18