| KOSMOS-1 | 微軟 | Multimodal Large Language Model | 多模態 | 大型語言模型

微軟展示不只看懂文字,還能理解圖像的AI模型

微軟認為若能增加多模輸入能力,將能大幅拓展語言模型用於高價值任務的可能性,因此發展出多模大型語言模型KOSMOS-1,除了能理解文字,也能看懂圖片及影像,可用於更多任務,像是為影片加字幕說明、看圖片回答文字問題、正確蒐集網頁資訊等

2023-03-07

| OpenAI | ChatGPT | 大型語言模型

OpenAI啟動一系列計畫改進ChatGPT的偏見與預期外行為

OpenAI計畫讓用戶自定義模型行為,甚至運用公眾意見影響系統規則,以進一步改善ChatGPT的行為

2023-02-21

| IT周報 | Meta | 文字轉影片 | 自監督學習 | 北榮 | 大數據整合 | Nvidia | 大型語言模型

AI趨勢周報第198期: 文生圖不夠看,Meta AI最新模型能將文字轉為高品質影片

Meta AI發表文字轉影片系統Make-A-Video;CNN之父Yann LeCun:目前大多數AI都實現不了真正的智慧,但自監督學習有潛力;北榮建置醫療大數據基礎架構,下一步要展開資安避風港計畫;不必候補!OpenAI開放民眾直接使用DALL-E了

2022-09-30