| 大型語言模型 | 繁中 | LLM | 國科會 | TAIDE | 生成式AI

越來越難但非走不可的臺灣AI路

大型語言模型的競賽是一場馬拉松,現在才剛起步,各國、各大企業紛紛發展千億,甚至數千億量級參數的超大LLM模型。臺灣想要跟上,繁中訓練資料嚴重不足是第一個挑戰

2023-12-01

| 叡揚資訊 | AI Chatbot | AI對話機器人 | 繁中語料 | 大型語言模型 | LLM

【企業LLM實戰:叡揚資訊】實測多種LLM更走訪企業現場,歸納臺灣企業LLM應用3大挑戰

年初,專攻AI對話平臺的叡揚資訊開始嘗試不同的LLM,更參與了不少企業客戶LLM驗證。他們從這些實戰中,歸納出臺灣企業現在所面對的3大LLM課題

2023-11-30

| 李開復 | 01.AI | 大型語言模型 | Yi

李開復的AI新創公司公布並開源雙語AI LLM

前微軟亞洲研究院院長李開復創立的零一萬物(01.AI),公布其開源大型雙語(中/英文)模型Yi-6B及34B

2023-11-07

| HackerOne | 白帽駭客 | 生成式AI | OWASP | 大型語言模型 | LLM | 安全漏洞

超過6成的白帽駭客企圖利用生成式AI來發現漏洞

漏洞懸賞平臺HackerOne調查發現,有6成的白帽駭客開始利用生成式AI開發駭客工具,以找出更多的漏洞

2023-10-30

| 大型語言模型 | LLM | 微調 | 安全風險 | AI安全 | 模型安全 | GPT-3.5 Turbo | Llama-2

研究顯示微調LLM會削弱模型安全性

IBM研究院與普林斯頓大學、維吉尼亞科技大學聯合發表的論文指出,有三種方法可以透過微調LLM破壞開發者為模型加入的安全防護,例如數十萬組資料集中一旦含有不到100則的有害資料,就足以影響Meta Llama-2及OpenAI GPT-3.5 Turbo的安全性

2023-10-16

| 中研院 | CKIP-Llama-2-7b | LLM | 大型語言模型 | TAIDE

【剖析中研院大型語言模型事件的衝擊】為何臺灣必須擁有本土化的LLM

在10月6日國慶日前夕,中研院開源釋出了使用Llama 2所開發的繁中大型語言模型CKIP-Llama-2-7b,但由於一開始未說明該模型是明清人

2023-10-12

| FLM-101B | 大型語言模型 | LLM

研究人員以10萬美元開發出千億參數的大型語言模型

近期公開於Hugging Face平臺的大型語言模型FLM-101B,強調具備1,010億個參數及0.31TB token,研究人員強調開發成本只花了10萬美元,且效能媲美GPT-3和GLM-130B等知名模型

2023-09-18

| 大型語言模型 | Large Language Model | LLM | OSS-Fuzz | google

Google證實LLM可改善開源軟體漏洞測試計畫OSS-Fuzz

透過大型語言模型協助生成fuzz target程式碼,能擴大自動化開源軟體漏洞模糊測試計畫OSS-Fuzz的檢查範圍

2023-08-21

| 日語 | 大型語言模型 | LLM | Line | japanese-large-lm

Line日本開源自有大型語言模型

由Line日本打造的日語大型語言模型japanese-large-lm,以Apache License 2.0授權釋出,在HuggingFace Hub上釋出36億及17億參數版本

2023-08-17

| 生成式AI | 紐約著作人協會 | 大型語言模型 | 著作權 | 侵權 | 作家

作家連署要求AI使用版權內容生成作品時應提供補償

逾8千名作家簽署了紐約著作人協會發表的公開信,要生成式AI領導業者在使用受到版權保護的內容訓練AI時,應取得作家的同意並提供補償

2023-07-19

| google | Deepmind | 大型語言模型 | LLM | Gemini | ChatGPT | AlphaGo

Google DeepMind正在開發次世代AI聊天機器人,宣稱比ChatGPT更強大

DeepMind對媒體透露正在開發新大型語言模型Gemini,強調Gemini基於DeepMind棋藝AI模型AlphaGo,能比ChatGPT更具備規畫或解決問題的能力

2023-06-29

| AI幻覺 | 大型語言模型 | LLM | 惡意套件

研究證實ChatGPT的幻覺可助長惡意套件散布

安全風險管理廠商Vulcan研究發現,ChatGPT在回答常見的程式開發問題時,會提供不存在的Python與NPM套件資料,這讓攻擊者得以利用這類AI幻覺捏造出來的套件散布惡意程式

2023-06-14