| LLM | 繁中 | 合成資料 | Llama 3.1 | 推理 | 數學

鴻海要開源700億參數繁中大型語言模型FoxBrain

鴻海研究院日前揭露自家首款繁體中文大型語言模型FoxBrain,以Llama 3.1 70B模型為基礎,以120張H100 GPU和98B Token合成資料訓練而成,不只繁中能力超越Llama-3-Taiwan-70B,還具備良好的數學和邏輯推理能力。FoxBrain之後將開源。

2025-03-11

| IT周報 | LLM | fMRI | 大腦 | 認知障礙 | Nvidia | 奇美醫院 | 臺北榮總 | 動作捕捉 | 復健 | 視訊診療

MedTech醫療科技雙周報第39期:耶魯大學打造通用模型MindLLM,可將大腦影像訊號直接轉文字

耶魯大學打造MindLLM模型,可將腦部fMRI影像訊號直接轉為文字;英國醫學期刊一篇論文發現,LLM有輕度認知障礙;美國頂尖癌症研究中心聯手公雲業者,要加速癌症研究和藥物發現;Nvidia在自家平臺上架超強生物分子模型Evo 2

2025-03-03

| AI | 算力 | 數位身分 | LLM

GovTech月報第38期:數發部擬推動建立主權AI訓練語料資料庫;TAIDE釋出Llama 3.1版8B模型

數發部宣示將從算力、資金、資料、人才4個方面推動我國AI發展,計畫在今年提出資料創新利用發展條例草案,並將建立主權AI訓練語料資料庫。國科會TAIDE計畫近期釋出以Llama 3.1為基礎的TAIDE 8B模型,加速正體中文解碼速度提升20%。

2025-02-21

| 聯發科 | AI | LLM | 語音合成 | 函式呼叫 | G2PW | Decision Token | 繁中

如何讓模型更懂繁中知識?聯發科研究團隊揭技術關鍵

聯發創新基地一口氣釋出2款繁中多模態語言模型、1款臺灣語音合成模型,他們揭露幾個技術關鍵,像是採用LLaVA架構增添多模態能力、使用低學習率以保留基礎模型優點、建置大量繁中資料集,以及透過Decision Token來增強模型呼叫函式的判斷力、用G2PW來準確判斷讀音等。

2025-02-19

| Mistral AI | LLM | 中東 | 印度 | 本地部署

Mistral推出高效能、小型化區域語言模型Saba,專為中東與南亞市場設計

Mistral AI推出具240億參數的Mistral Saba語言模型,專為中東與南亞市場設計,透過高品質資料集提升語言理解,經效能最佳化並支援本地部署,以兼顧推理速度與資料隱私

2025-02-19

| AI | 聯發科 | 繁中 | 語言模型 | LLM | 語音合成 | App

聯發科一口氣開源2款繁中多模態小模型、符合臺灣口音的語音合成模型

聯發創新基地(MediaTek Research)開源2款繁中多模態模型Llama-Breeze2-3B和Llama-Breeze2-8B,分別能在手機和個人電腦上執行,還具備呼叫函式能力,可調用外部工具。他們還開源以3B為基礎的Android App,以及能生成臺灣口音的語音合成模型BreezyVoice。

2025-02-17

| Jetbrains | AI助理 | LLM | LM Studio | 開發者工具

JetBrains AI助理允許開發者介接本地模型,強化隱私與運算控制

JetBrains人工智慧助理新增本地語言模型支援,開發者可透過LM Studio在本地環境執行語言模型,降低對雲端依賴,提升隱私與資料掌控能力

2025-02-17

| LLM | OpenAI | o3-mini | Deliberative Alignment | jailbreak

資安研究人員聲稱突破OpenAI最新防禦機制,成功在新款機器學習模型o3-mini進行越獄

CyberArk研究員透露,他們對於才正式發表不久、搭載新資安防護機制的o3系列AI模型進行測試,結果發現還是能夠成功越獄,要求AI模型提供網路攻擊步驟及工具

2025-02-11

| IT周報 | 生成式AI | LLM | MMM | 市場調查 | RMN

Martech雙周報第70期:LLM都怎麼說你的品牌?Jellyfish推出對各大模型做「市調」的分析工具

本期Martech雙周報重點:Jellyfish推出可以整理並分析不同LLM對品牌認知的工具;Google開源支援更多數位行銷情境的MMM成效追蹤統計模型;Amazon推出相當於Perfomance Max和Advantage+的跨通路AI代投服務

2025-02-07

| Anthropic | AI安全 | 越獄攻擊 | 憲法式分類器 | LLM

Anthropic公開憲法式分類器,大幅降低AI越獄攻擊成功率

Anthropic推出憲法式分類器,透過預設規則與分類器訓練,提高大型語言模型防禦能力。在測試中,該技術將越獄成功率從86%降至4.4%,拒絕率僅增0.38%,現已開放測試平臺供試驗

2025-02-06

| SwiftKV | Snowflake | LLM | 知識蒸餾

Snowflake開源可縮減LLM推論時間50%的SwiftKV模型

Snowflake在Hugging Face開源SwiftKV模型,透過模型重組與知識蒸餾,將輸入提示處理計算減半,提升大型語言模型推論效率至2倍,適用於高負載企業應用

2025-01-17

| MiniMax | 基準測試 | LLM

中國AI公司MiniMax推出新LLM,支援400萬Token與多模態應用

中國MiniMax推出MiniMax-01系列,語言模型支援400萬Token上下文處理,性能與頂尖模型相當,多模態模型專注文本與影像結合,適用智慧助理與多媒體生成,定價具競爭力但存政策風險

2025-01-17