AI趨勢周報第253期：微軟Build 2024大會AI亮點盤點

微軟執行長Satya Nadella在今年度Build大會上揭露一系列AI亮點，不只有AI系列筆電Copilot+ PC，就Copilot技術架構本身來說，還包括從基礎設施底層、基礎模型層、資料層、AI工具層以及應用層的重大更新，如新推Phi-3-vision和Phi Silica模型、Azure AI Studio正式上線等。

圖片來源:

微軟

重點新聞(0524～0530)

生成式AI 微軟 Copilot

盤點微軟Build 2024大會AI重大更新

微軟在5月下旬展開今年度Build大會，主題聚焦生成式AI，亮點可分為AI筆電Copilot+ PC和整體的微軟Copilot技術架構更新。Copilot+ PC是今年首度亮相的AI系列筆電，結合了CPU、GPU和NPU，效能可達每秒40兆次處理（TOPS），可更快速執行AI應用。這系列筆電內建了40多個本地端AI模型和多種AI原生App，像是回顧Recall、圖像創作Cocreator、即時字幕與翻譯Live Caption等。這些筆電由微軟Surface和OEM合作夥伴提供，包括華碩、宏碁、Dell、聯想、HP和三星等，預計6月18日開始上市。

另一方面，在微軟Copilot技術架構更新部分，則可分為底層和應用層。就底層來說，基礎設施部分微軟正式推出基於AMD最新Instinct GPU的處理器ND MI300X v5，可更快、更有效率執行AI應用，另也公開預覽Cobalt 100晶片。往上一層到基礎模型層，不只正式在Azure AI中上架GPT-4o模型，也和Hugging Face擴大合作、納入所有Hugging Face模型到Azure AI，另也推出42億參數的Phi-3-vision模型和33億參數的Phi-Silica模型。而AI開發工具Azure AI Studio也正式上線，可用來打造AI應用。甚至，Azure AI Studio還推出客製化模型功能，允許使用者用自己的資料訓練客製化模型。

再往上一層來到資料層，微軟資料分析平臺Microsoft Fabric推出一項無程式碼/低程式碼的即時智慧（Real-Time Intelligence）SaaS解決方案，可用來更快速處理大量、顆粒度更細緻的PB級即時串流數據。在AI調度與工具鏈層，微軟推出程式開發外掛GitHub Copilot Extensions（私人預覽），開發者可用透過自然語言和自己習慣的工具，來打造、部署雲端應用，完全不必離開開發環境IDE或GitHub網站。第一波新添16個外掛。

工具層之上來到應用層，在這層，微軟推出Microsoft Copilot Connector連結器，可讓Copilot助理摒除障礙存取使用者資料、跨App和工作流程處理資料，來打造客製化模型。同時，微軟還針對M365 Copilot推出協作助理Team Copilot，專門處理複雜的協作任務，比如在協作工具Teams中管理會議、安排議程、管理時間和記錄重點。它還能管理Teams對話，摘要重要資訊、回覆群組問題等。甚至能扮演PM角色，確保任務管理看板Planner中的每個專案順利進行。Team Copilot預計今年晚些時候預覽。另一項Copilot產品線的延伸，則是在低程式碼助理開發平臺Microsoft Copilot Studio中，新添代理（Agent）的能力類別，讓開發者用來打造能主動回應數據和事件的智慧助理，還能執行特定任務和功能。（詳全文）

機器狗 臺大 國科會

臺大團隊打造工業用和居家用2款機器狗

在國科會產學合作計畫下，臺大機械系教授郭重顯帶團打造2款自主研發的AI機器狗NTU DogBot，包括54公分長、16公斤重的寵物型機器狗Oliver，以及93公分長、40公斤重的工作型機器狗Dustin。這些機器狗整合多項機電設計和AI技術，包括機械設計、控制工程、步態生成、自主導航、AI演算法等，臺大團隊也與國內企業探討機器狗使用情境，如在工廠或工地智慧巡檢、餐點/物流配送，要加速NTU DogBot導入相關場域，解決缺工和人力問題。

進一步來說，臺大團隊在2022年至2023年間，先以3D列印方式，研發出42公分長、4公斤重的小型機器狗，進行步態控制和自主定位與導航的概念驗證。後來，臺大團隊參與國科會產學合作研究計畫，相繼打造出Oliver和Dustin，兩款皆具自主定位導航能力，但Oliver具動作教導與AI視覺等功能、可進行語音和表情偵測與互動操控，適合居家應用，而Dustin適合工業巡檢與物品遞送，搭載各式工業用途感測器，如音噪、視覺、溫度、氣體等，還能結合Line Bot即時訊息回報。團隊盼以這兩款機器狗雛形為基礎，推動臺灣機器狗產業發展。

臺大團隊表示，機器狗在國外不僅商品化，還有具體應用場景，如美國機器狗用於電網巡檢、韓國機器狗投入物流配送、歐洲機器狗應用於地鐵隧道和管線的養護檢修等。而臺灣機器狗沒有太多實際導入案例，原因為造價與維護昂貴、客製化與AI開發技術支援不足等，郭重顯團隊研發成果可讓企業以較低成本導入場域，並提供客製化、組合式模組軟體架構，能快速針對企業需求調整，並採用開放式通訊介面，可整合企業端生產資訊和資料庫。（詳全文）

互連 開放標準 AI

Intel、AMD、微軟等IT巨頭合推AI網路互連開放標準

英特爾、超微（AMD）、博通（Broadcom）、微軟、Meta、思科和HPE等IT巨擘在5月30日宣布聯手發展網路加速器互連標準Ultra Accelerator Link（UALink），為系統OEM業者、IT專業人員、系統整合廠商，提供更容易整合、彈性擴充性的方法來打造AI基礎架構。

這個產業新標準，是要提供高速、低延遲的網路互連（Interconnect），來串聯不同廠牌的機器，實現資料中心內AI與HPC的系統擴充。UALink促進小組指出，他們將發展一套規格，來定義高速、低延遲的互連架構，擴大AI運算單位（Pod）中加速器和交換器之間的通訊。即將推出的UALink 1.0規格，將在一個AI運算單位中，支援最多1,024個加速器，允許GPU等加速器附加記憶體之間的直接載入和儲存。該促進小組已成立UALink聯盟，預計在2024年第三季正式成為法人公司，並發布1.0版規格，公開給聯盟會員。（詳全文）

ChatGPT Edu OpenAI 教育

OpenAI推出教育版ChatGPT Edu

OpenAI在5月底發表一款教育專用聊天機器人ChatGPT Edu，將推廣到全球校園中。ChatGPT Edu採最新的GPT-4o多模態模型，專為大學打造，可支援文字和視覺推論，也能進行資料分析等功能。此一版本具備企業級安全與控制能力，OpenAI將以教育機構負擔得起的價格來供應。

ChatGPT Edu的功能包括文本釋譯、撰寫程式碼、解決數學問題，也提供資料分析、網頁瀏覽及文件摘要等高階功能，還能建置客製化ChatGPT版本並於校內分享。此外，這款ChatGPT Edu還提供比免費版要多的訊息額度，支援逾50種語言並改善語言的品質和速度，且不會以用戶的資料及對話來訓練模型。（詳全文）

Claude 外部工具 Anthropic

Anthropic推新功能，Claude助理可使用外部工具了

AI新創公司Anthropic在5月30日揭露聊天機器人Claude新工具，讓Claude除了搜尋和回答問題外，還能整合API和外部資料源來執行更多任務，目前已正式上線、開放企業開發者使用。

這個新工具叫做Tool Use，透過它，Claude能和外部用戶端工具、API和功能互動，可用來執行多種任務，像是搜尋最新網頁資料、從文件中擷取資料輸入報表或執行客戶服務。Tool use目前已整合在Claude 3模型家族，供開發者可透過Anthropic Messages API、Amazon Bedrock、和Google Vertex AI存取使用。相關資源也在GitHub公開。另一方面，OpenAI的ChatGPT、微軟Copilot也都在去年推出類似擴充功能，可以外掛、API整合外部工具或服務，提供AI代理訂餐、訂票、網購、搜尋景點等即時資訊或更自動化的服務。（詳全文）

語音訂位 Line Chatbot

台灣大聯手Line、inline，打造餐飲AI語音訂位服務

最近，台灣大哥大與Line、碩網資訊、inline共同推出AI語音預約訂位服務，結合聊天機器人、生成式AI，來協助餐飲業者處理顧客來電訂位需求。這個訂位服務結合台灣大行動市話服務，讓手機能接聽市話來電，並結合碩網資訊的語意辨識、語音合成技術，Line的Clova聊天機器人，以及inline的線上訂位服務，讓商家不需要撥出人力接聽訂位電話，就能自動由AI協助完成線上訂位。

比如，消費者透過Google Map撥打商家電話，如果商家設定好Line Call來電，來電就會由AI應答，消費者只要以自然的口語說出想要預訂用餐，如5月30日晚上7點、4大2小，AI就會自動與消費者問答，完成訂位訊息，並通過inline完成線上訂位，再透過Line發送成功訂位資訊給消費者。若消費者以市話來電訂位，也能由Line聊天機器人協助完成，60秒即可。

技術上除使用Line聊天機器人和社群平臺，他們也導入ChatGPT-3.5來判讀用餐相關問題，例如店家周邊停車資訊、用餐時間限制、兒童用餐、座位等問題。為避免ChatGPT給出錯誤訊息，碩網也預先訓練ChatGPT應答資料，如ChatGPT判斷無法回答，則轉交真人接聽或Line一對一回應。（詳全文）

程式撰寫 Codestral Mistral AI

Mistral AI推出輕量級程式撰寫模型

法國AI新創公司Mistral AI最近發布輕量級程式撰寫輔助模型Codestral，能完成程式碼撰寫，也能撰寫測試，加速開發軟體專案的速度。Codestral以80多種程式開發語言的資料訓練而成，涵括Python、Java、C、C++、Bash、Swift和Fortran等語言。

該模型參數為220億，可作為指令語言模型，回答開發問題或執行開發任務，例如解釋程式碼片段、撰寫文件、因子分析，或產生開發者所需的程式碼。它也支援fill-in-the-middle（FIM）功能，能預測前綴、後綴字串預測中間元素，完成任何部份程式碼，對VS Code之類的軟體開發相當有幫助。Mistral AI相信其涵蓋廣度可擴大其專案適用性，結合此一模型可提升開發人員開發品質，減低錯誤及臭蟲的風險。Codestral已在MNLP-0.1授權下，在Hugging Face平臺開源。（詳全文）

GitHub 加速器 生成式AI

GitHub加速器資助11個開源AI專案

GitHub加速器（GitHub Accelerator）今年聚焦AI，根據促進新職業發展、影響廣泛社群、強化資安和提高開源AI開發者生產力等指標，挑出了11項專案，將提供資金援助、指導和社群等資源。進一步來說，今年入選的GitHub Accelerator專案涵蓋多個領域，包括模型最佳化與部署、測試與評估、AR/VR應用、無人導航、隱私與安全，以及開發者工具。

在模型最佳化與部署方面，unsloth AI專案能降低模型微調所需要的記憶體資源和時間，LLMware.ai簡化了企業採用檢索強化生成（RAG）技術的流程。LangDrive可透過API簡化大型語言模型的訓練和部署。在AI應用上，A-Frame專案讓使用者在瀏覽器中建立AR/VR與3D內容，Nav2則為機器人提供導航解決方案。

針對隱私與安全的專案有OpenWebUI，目標是發展可改善隱私和安全性的本地端LLM，另還有為安全團隊提供自動化代理的HackingBuddyGPT。此外，Web-Check提供AI驅動的網站安全檢查服務。而進階Python筆記本Marimo，則能簡化RAG部署Talkd.ai，可提高開發者生產力。（詳全文）

圖片來源／微軟、國科會、Anthropic、Line、Mistral AI

AI近期新聞

1. OpenAI開放自製GPTs、GPT-4o給免費版ChatGPT用戶存取

2. Opera AI瀏覽器將整合Google Cloud Gemini等模型

3. IBM Watsonx大型主機程式開發助理強化解釋功能，助開發者理解COBOL程式碼

資料來源：iThome整理，2024年6月

6月4日勘誤：第一則原文提及微軟自行研發的NPU，更正為NPU。

重點新聞(0524～0530)

熱門新聞