國科會
重點新聞(0315~0321)
人才 國科會 TAIDE
國科會揭半導體AI人才策略、TAIDE進展和氣象AI規畫
3月20日,國科會召開第10次委員會議,揭露半導體AI人才和淨零策略,以及國產大語言模型TAIDE進展和氣象AI的運用計畫。就人才策略來說,國科會聯手國發會、經濟部、數位部、環境部、教育部、金管會等部會,根據2023年行政院科技顧問會議結論定出策略,目標是要延攬國際人才、培育國內人才,尤其是AI實作人才,實際作法則是要以獎勵制度提高技職體系育才、促進大學與產業合作,並推動AI全產業應用。此外,政府也將完善AI法制、資料基礎和運算環境。同時,他們還要利用AI和ICT優勢,來發展淨零科技,前陣子提出的晶創臺灣方案和淨零科技方案,就是這些策略的具體措施。
再來,國科會TAIDE團隊一方面盤點公、私部門資料,並個別洽談授權,整理了89.4GB的優質繁體中文資料,另一方面在去年12月,將超級電腦臺灣杉二號整合新購入的H100 GPU運算資源,並正式提供運算服務。而可商用的TAIDE-7B版本和限學研用的TAIDE-13B版本,已具備多輪對話和阻絕產生不恰當回應的能力,另也透過產學研合作打造不少應用,如智慧客服、行政常見問題回應、農業知識問答和中小學臺語教學等,接下來將重點支援公部門導入TAIDE,並預計4月中旬開源釋出TAIDE-7B。
另一方面,交通部氣象署也要運用AI,來提高氣象測報和防災預警能力。他們已規畫AI發展藍圖,要先打造良好的GPU運算環境,以利於AI應用和研發。同時,他們也要導入新技術,來提供鄉鎮尺度災害天氣特報資訊,還要建置金馬雷達,來擴大氣象雷達網拼圖,目標是要在劇烈天氣發生前的3至6小時提供預警。最後,他們也要擴大氣象大數據資料集,作為氣象科技、AI應用的發展基礎。(詳全文)
Nvidia 生成式AI 微服務
Nvidia推生成式AI微服務
在今年度GTC大會上,Nvidia宣布在Nvidia AI Enterprise 5.0平臺新添數十款生成式AI微服務,可分為NIM和CUDA-X兩大類別,前者主要提供最佳化的推論微服務,好來大規模部署AI模型,後者則瞄準需要資料處理、AI與高效能運算的各種應用。
其中,NIM是個容器化的推論微服務,內含預建的容器、產業標準API、特定領域程式碼和最佳化的推論引擎等,要縮小企業營運需求和AI部署間的差距,可將模型部署時間從幾周縮短至幾分鐘。CUDA-X則提供端對端的建置組塊,來支援資料準備、客製化和訓練工作,加速AI開發,如客製化語音與翻譯AI的Nvidia Riva微服務、路徑最佳化的Nvidia cuOpt或高解析度的天氣模擬Nvidia Earth-2等。Nvidia表示,企業可在不同基礎設施上部署這些微服務,如AWS、Google Cloud、Azure或Oracle Cloud Infrastructure。(詳全文)
蘋果 大語言模型 MM1
蘋果發表多模態大型語言模型MM1
繼去年底發表的多模態大型語言模型(MLLM)Ferret後,蘋果最近再發表另一個多模態系列模型MM1,最大型的版本具備300億參數。在開發這套模型前,蘋果團隊先是研究了各種多模態模型架構和資料選擇,比如圖像編輯器、視覺語言連接器和各種預訓練資料等,他們因此歸納出幾個重要發現。 舉例來說,要讓多模態預訓練模型在多種基準測試中,達到少樣本SOTA等級的表現,就得採用謹慎設計的訓練資料集,包括圖像搭配圖說、穿插搭配文字的圖像、純文字資料。而且,圖像編輯器加上影像解析度與圖像Token數量,也對模型表現有重大影響,視覺語言連接器的影響力反而可忽略不計。
於是,他們以這些發現為基礎,擴展後打造出MM1系列模型,包含密集模型和混合專家(MoE)架構變體,兩種都在預訓練指標中達到SOTA水準,且經過監督式微調後,還在多個基準測試中達到不錯的表現。受益於大規模預訓練,MM1具有更好的脈絡學習能力、多圖像推理能力,也能處理少量的思維鏈指令。(詳全文)
Grok-1 LLM xAI
xAI開源大型語言模型Grok-1
馬斯克去年成立的AI新創xAI,日前開源自家聊天機器人Grok底層大型語言模型(LLM)Grok-1,具3,140億個參數,採用混合專家架構,包括8個專家模型。這種架構,對任何Token的運算只會使用25%權重(即參數)。xAI表示,目前開源的Grok-1,是未經任何微調的基礎模型,而就表現來說,Grok-1在GSM8k、MMLU、HumanEval與MATH等基準評測上雖然尚未超越GPT-4,但都勝過GPT-3.5。Grok-1採Apache 2.0授權,可進行商業使用和修改,但無法註冊商標。(詳全文)
皮膚 資料集 Google
Google公開皮膚病狀圖片資料集
有鑒於當前皮膚科影像資料集的不足,Google聯手史丹佛大學醫學院,收集各種膚色、身體部位皮膚病狀的照片,然後發表皮膚病狀圖像網路(SCIN)資料集。這個資料集的出現,補足了臨床皮膚疾病資料集的不足,還能提高AI模型通用性。
進一步來說,SCIN資料集經仔細設計,透過新型群眾外包方式,收集各種條件的照片、詳細的貢獻者資訊,以及專業皮膚科醫師的標註。SCIN資料集收錄超過1萬張皮膚、指甲和頭髮狀況的圖像,這些圖像由本人自願貢獻,提供特寫和較遠距離的版本。這些照片還由一到三位皮膚科醫生標註,給出最多5個皮膚病狀,並附上每個標籤的信賴分數。Google表示,資料集包含單獨的標籤,以及衍生的聚合和加權差異診斷,可用於模型測試和訓練。(詳全文)
Stability AI 3D 多視角
Stability AI開源多視角影片生成模型SV3D
Stability AI以Stable Video Diffusion模型為基礎,開發一套Stable Video 3D(SV3D)模型,不只能生成高品質的3D多視角影片,品質還比前幾代好,效能也優於複雜的Zero123-XL模型。
Stable Video 3D模型有兩個版本,分別是SV3D_u和SV3D_p。其中,SV3D_u能用單一圖像,不需使用者設定攝影機參數,就能生成環繞物體的連續視角影片,而SV3D_p則在SV3D_u基礎上,不僅支援單一圖像生成影片,還能根據環繞物體的影片,生成指定攝影機路徑的3D影片。目前,Stable Video 3D供Stability AI會員使用,商業運用也可以。至於非商業用途,開發者可在Hugging Face下載模型權重,並參照Stability AI研究論文。(詳全文)
GPU Nvidia Blackwell
新一代高效能GPU來了,Nvidia發表Blackwell
Nvidia在今年度GTC開發者大會上,發表新一代專為生成式AI設計的處理器Blackwell,各大科技巨頭如AWS、微軟、Meta、OpenAI、Dell、Google、甲骨文、Tesla和xAI等都計畫採用。
由於生成式AI和多模態AI模型訓練需求越來越高,對運算的需求也日益增溫,Blackwell就是為解決這一挑戰而誕生。它是新一代GPU架構,是兩年前推出的Hopper架構的繼任者。Blackwell GPU是由2,080億個電晶體組成,採客製化的台積電4NP製程,所有Blackwell產品都配備2個具光罩限制的晶粒,藉每秒10TB的晶片互連技術,產生一個強大的GPU。此外,Blackwell支援第二代Transformer引擎,可加速大型語言模型和專家混合模型(MoE)的推論與訓練,並提高精度和準確度。而且,Blackwell在訓練上的FP8效能是Hopper的2.5倍,推論的FP4效能是Hopper的5倍,採用第5代NVLink技術則可達到Hopper的兩倍快。(詳全文)
Nvidia 人形機器人 基礎模型
Nvidia也拼人形機器人大腦,揭露通用基礎模型專案GR00T
在今年度GTC開發者大會上,Nvidia揭露全新專案Project GR00T,是一款專為人形機器人設計的通用基礎模型,可作為機器人大腦,來推動機器人技術和具體化AI(Embodied AI)領域研究。
Nvidia正開發各種GR00T技術,例如GR00T本身就是在Omniverse Isaac Sim模擬平臺上的iIsaac Lab應用進行模擬,並在雲端運算調度服務OSMO上進行訓練、部署至新的運算平臺Jetson Thor。其中,Jetson Thor是一款Thor系統單晶片的人型機器人電腦,能執行複雜任務、安全地與人類和機器人互動。負責具體化AI的Nvidia研究經理Jim Fan指出,Project GR00T可讓機器人理解多模態指令,如語言、影片或示範,還能執行各種有用任務。Nvidia正在與全球主要的人形機器人業者合作,來將GR00T部署到各種人形機器人上。(詳全文)
圖片來源/蘋果、Stability AI、Google、Nvidia
AI近期新聞
1. Google發表UI與資訊圖表理解模型ScreenAI
2. Amazon SageMaker整合Nvidia NIM推論微服務
資料來源:iThome整理,2024年3月
熱門新聞
2025-01-06
2025-01-07
2025-01-08
2025-01-08
2025-01-06