| IT周報 | 微軟 | 多模態 | google | Youtube | GAN | 輕量化

AI趨勢周報第229期:生成排版文件也可以!微軟發表多模態模型Kosmos-2.5

微軟發表多模態模型Kosmos-2.5,可生成排版文字區塊和Markdown格式的文字內容;Google開發逐步蒸餾技術,小資料小模型也能打敗LLM;可設計自然界所有蛋白質!微軟開源AI新框架EvoDiff;Google輕量化臉部編輯GAN模型,低階手機也能即時生成

2023-09-25

| IT周報 | 通用AI | 史丹佛大學 | 多模態 | 行動憑證 | 光田醫院 | CancerGPT | 藥物 | 協同作用

MedTech醫療科技雙周報第20期:什麼是通用醫療AI?史丹佛大學聯手北美頂大給定義

史丹佛大學認為,通用醫療AI應具備動態任務學習能力和多模態資料的輸入和輸出;國產醫療AI導入Azure,還結合ChatGPT快速產出報告;美國大學聯手打造CancerGPT,可良好預測癌症藥物協同作用;醫事人員行動憑證也有新應用情境了

2023-05-03

| google | 視覺語言 | PaLM-E | 多模態 | 機器人

Google發表具5,620億參數的多模態語言模型PaLM-E,實體機器人更能解決複雜長任務

Google透過將影像和感測器訊號,編碼成語言模型能夠執行的向量序列,持續輸入至PaLM-E,交由強大的Transformer網路進行處理,以解決實體機器人任務以及視覺語言問題

2023-03-09

| KOSMOS-1 | 微軟 | Multimodal Large Language Model | 多模態 | 大型語言模型

微軟展示不只看懂文字,還能理解圖像的AI模型

微軟認為若能增加多模輸入能力,將能大幅拓展語言模型用於高價值任務的可能性,因此發展出多模大型語言模型KOSMOS-1,除了能理解文字,也能看懂圖片及影像,可用於更多任務,像是為影片加字幕說明、看圖片回答文字問題、正確蒐集網頁資訊等

2023-03-07

| Meta | AI | 語言審查 | 多模態

Meta整合平臺言論審查模型,以降低運算資源消耗和維護複雜度

Meta藉由整合多個語言審查模型,共享跨系統的訊號,使得人工智慧能夠更好地辨識有害內容,同時還能降低維護模型的複雜度

2021-11-16