| 鴻海 | FoxBrain | LLM | 推理 | RLAIF | 資料過濾 | 分類

鴻海解析自家大語言模型FoxBrain技術亮點

鴻海日前在Nvidia GTC大會中說明自家大型語言模型FoxBrain技術亮點,包括在預訓練階段用LLM來過濾原始資料並分類、結合LLM和COSTAR框架來產出品質更好的訓練資料,以及在後訓練階段用LLM生成更多訓練資料、用LLM生成正確的推理過程,來強化FoxBrain推理能力等。

2025-04-01

| Google Cloud | 資料 | 平臺 | 法遵 | 自動化 | LLM | AI | 代理

擁抱GenAI的資料基礎該怎麼做?Google Cloud給企業5步驟參考

Google Cloud今日分享,企業擁抱AI時,需先培養的資料基礎5步驟,包括制定AI優先的資料策略、建置統一的資料平臺、運用AI將流程自動化、確保資料安全和資料治理,以及提高資料平臺效率並降低資料成本。

2025-03-25

| AGI | ARC-AGI-2 | 推理能力 | 效率評估 | LLM

新一代基準測試ARC-AGI-2登場,挑戰AI的推理效率與通用能力

ARC釋出新一代AGI基準測試ARC-AGI-2,作為衡量人工智慧通用能力與效率的標準,並揭示現行推理模型在少樣本情境下仍難以即時適應新任務

2025-03-25

| Nvidia | AgentIQ | LLM | 人工智慧代理

Nvidia推出AgentIQ開源工具加速跨框架AI代理整合

Nvidia開源AgentIQ Toolkit供開發者快速整合多代理人工智慧流程,支援跨框架運作與效能分析,推動人工智慧應用模組化與重用

2025-03-25

| 日本金融廳 | 金融AI | GAI | LLM | 金融科技

承諾支持金融機構穩健運用AI!日本金融廳發布AI討論文件,彙整130家日本金融機構GenAI應用情況、風險挑戰

日本金融廳近日發布AI討論文件,文件中包含130家日本金融機構運用AI的調查結果,統整了日本金融機構GenAI發展現況、應用案例,和挑戰。並且,日本金融廳也在報告中回應了金融機構對監管機構的期待,承諾會支持金融機構穩健運用AI。

2025-03-14

| 樂天集團 | 生成式AI | AI平臺 | LLM | 日文LLM

用GenAI強化營運、行銷與顧客體驗,樂天集團AI戰略帶來一年105億日圓利潤,明年更要創造雙倍效益

自建日文LLM,強化服務底層技術,打造內外部GenAI應用。下一步要用生成式AI打造串聯起全集團服務的應用,更發展全方位IT業務

2025-03-12

| eBay | 生成式AI | 蒸餾 | LLM | AI開發平臺

eBay升級AI開發平臺以支援自建3兆Token的LLM,下一步要蒸餾出多個小模型以降低應用成本

去年,eBay投資大量硬體算力並大幅提升硬體利用率及調度彈性,來支援大規模生成式AI開發和應用。今年,則要進一步強化自建模型,再利用蒸餾等技術打造專門用途的小模型,以在投入實際應用時能控管成本

2025-03-12

| AI21 Labs | Maestro | 生成式AI | LLM

AI21發表企業級AI規畫與調度平臺,解決LLM輸出不穩定的問題

AI21 Labs Maestro平臺強化大型語言模型生成結果的驗證與調度,協助企業掌控人工智慧應用準確性,並降低維運負擔

2025-03-11

| LLM | 繁中 | 合成資料 | Llama 3.1 | 推理 | 數學

鴻海要開源700億參數繁中大型語言模型FoxBrain

鴻海研究院日前揭露自家首款繁體中文大型語言模型FoxBrain,以Llama 3.1 70B模型為基礎,以120張H100 GPU和98B Token合成資料訓練而成,不只繁中能力超越Llama-3-Taiwan-70B,還具備良好的數學和邏輯推理能力。FoxBrain之後將開源。

2025-03-11

| IT周報 | LLM | fMRI | 大腦 | 認知障礙 | Nvidia | 奇美醫院 | 臺北榮總 | 動作捕捉 | 復健 | 視訊診療

MedTech醫療科技雙周報第39期:耶魯大學打造通用模型MindLLM,可將大腦影像訊號直接轉文字

耶魯大學打造MindLLM模型,可將腦部fMRI影像訊號直接轉為文字;英國醫學期刊一篇論文發現,LLM有輕度認知障礙;美國頂尖癌症研究中心聯手公雲業者,要加速癌症研究和藥物發現;Nvidia在自家平臺上架超強生物分子模型Evo 2

2025-03-03

| AI | 算力 | 數位身分 | LLM

GovTech月報第38期:數發部擬推動建立主權AI訓練語料資料庫;TAIDE釋出Llama 3.1版8B模型

數發部宣示將從算力、資金、資料、人才4個方面推動我國AI發展,計畫在今年提出資料創新利用發展條例草案,並將建立主權AI訓練語料資料庫。國科會TAIDE計畫近期釋出以Llama 3.1為基礎的TAIDE 8B模型,加速正體中文解碼速度提升20%。

2025-02-21

| 聯發科 | AI | LLM | 語音合成 | 函式呼叫 | G2PW | Decision Token | 繁中

如何讓模型更懂繁中知識?聯發科研究團隊揭技術關鍵

聯發創新基地一口氣釋出2款繁中多模態語言模型、1款臺灣語音合成模型,他們揭露幾個技術關鍵,像是採用LLaVA架構增添多模態能力、使用低學習率以保留基礎模型優點、建置大量繁中資料集,以及透過Decision Token來增強模型呼叫函式的判斷力、用G2PW來準確判斷讀音等。

2025-02-19