去年,微軟做了2件大事,影響今年AI戰略走向。
一是推出生成式AI助理微軟Copilot,短短1年更新了150多次,成為新一代微軟跨生產力工具的智慧小幫手。另一件事是,微軟也開始打造Copilot技術架構,提供技術資源和工具,來讓開發者打造自己的Copilot助理。甚至過去2年來,微軟聯手GitHub推出程式開發AI助理GitHub Copilot,搖身一變成為全球工程師愛用的熱門工具,光付費訂閱者就有180萬人。
可以說,微軟近期AI戰略鎖定Copilot本身、Copilot客製化開發能力,以及更便捷智慧的程式開發助手。
到了今年,微軟AI戰略又有何變化?下一步往哪前進?
微軟Build 2024的兩大AI戰略
他們在今年度Build大會上給了答案。在這場20萬人註冊、4千人親自至西雅圖參加的微軟Build 2024大會上,微軟執行長Satya Nadella開宗明義點出了今年發展3大元素:微軟Copilot、Copilot技術架構和AI系列筆電Copilot+ PC。
Satya並未過多著墨微軟Copilot,反而聚焦於後兩者,意味著這是微軟2024年的2大AI戰略。一如前述,Copilot技術架構並非新東西,是微軟去年就開始發展的架構,目標是滿足開發者需求,來打造客製化Copilot助理。
今年,Satya進一步詳解這個技術架構的組成,涵蓋底層的AI基礎設施、基礎模型、資料、AI調度和工具鏈,以及上層的Copilot應用、擴充外掛,還有AI安全與資安。這個架構,比去年揭露的更細緻。
微軟執行長Satya Nadella在今年度Build大會上點出Copilot架構和Copilot+ PC兩大AI戰略,其中後者有個Runtime重要基礎,以Windows Copilot函式庫和40多個本地端模型為核心。圖片來源/微軟
戰略1:Copilot技術架構
今年,基礎設施層有3大亮點,首先是遍布全球的資料中心將於2025年全數採用再生能源、零碳排,再來是過去6個月Azure雲端算力提高了30倍,最後是推出2款加速AI訓練和推論的虛擬機器(VM),包括ND MI300X v5和搭載Azure Cobalt 100處理器的系列虛擬機器。
在基礎模型部分,微軟生成式AI開發工具Azure AI Studio終於進入正式版,其上的強大多模態模型GPT-4o也正式上線。至於模型發展則朝2方向並行,一是延續微軟自建的Phi小型語言模型,新推更小更有效率的多模態模型Phi-3-vision,另一是深化第三方模型整合,包括擴大與Hugging Face合作、要導入其開源模型,同時也在模型即服務(MaaS)中納入第三方企業模型。
至於資料和AI工具層,分別主打即時串流資料分析服務Real-Time Intelligence、整合資料湖OneLake擴大RAG範圍,以及在AI程式開發工具GitHub Copilot Workspace中,推出程式開發外掛GitHub Copilot Extensions,首波推出16個外掛,包括微軟自建的GitHub Copilot for Azure外掛。
在應用層,則有橫跨資料壁壘的Microsoft Copilot Connector連結器、可扮演PM角色的協作助理Team Copilot,還有Microsoft Copilot Studio平臺更強大的代理能力類別,用自然語言來客製化智慧助理Copilot。
而AI安全與資安層,則以微軟去年發起的未來安全計畫(SFI)為核心,遵守安全設計、安全預設和安全維運3大原則,並以6項安全文化和治理作法來確保Copilot技術架構的安全。
這就是微軟今年端出的一大AI戰略。
戰略2:AI系列筆電Copilot+ PC
他們的第2大AI戰略,則要將雲端AI開發和應用能力延伸到裝置端,要將Windows打造成最開放的AI開發平臺。因此,微軟祭出了AI筆電Copilot+ PC戰略,其中一個重要基礎就是Windows Copilot Runtime。Satya稱之為Copilot技術架構到Windows作業系統的延伸,該Runtime以Windows Copilot函式庫為核心,向下支援AI框架和工具,向上用來打造高階AI應用與體驗。
其中,Copilot函式庫內含一系列API和演算法,這些API由40多個本地端模型驅動。第一波API在今年6月上架,包括用於影像特效的Studio Effects、即時字幕翻譯Live Caption、OCR、回顧使用者活動Recall User Activity和多模態模型Phi Silica等。接下來還會納入向量嵌入、檢索增強生成(RAG)、文本摘要等API。這些API,加速了使用者打造生成式AI應用和體驗的作業。
再來,Runtime支援的AI框架和工具有2大亮點,分別是Windows專用高效能低階API DirectML可原生支援PyTorch了,以及使用者可在DirectML和ONNX Runtime Web使用網頁原生ML框架WebNN。這意味著,AI開發的便利性更高了。
利用Runtime優勢,可打造出高階AI應用與體驗,Satya用微軟自己打造的原生AI應用程式來說明。比如回顧(Recall)透過對螢幕快照,將快照資訊轉為向量、儲存在語義索引中。當使用者想搜尋先前看過的資訊時,就能輸入關鍵字來啟動向量語意辨識、快速找出所需內容。又或是由5個本地端模型驅動的圖像創作(Cocreator),可根據簡單的筆畫快速生成逼真細緻圖畫,其他還有即時字幕翻譯,可隨時替影片、音檔添加字幕或翻譯為英語。這些程式,在Copilot+ PC系列筆電中皆能開箱即用。
不只原生AI程式,Runtime加上NPU等硬體優勢,還能優化第三方應用程式的AI功能,如Adobe系列程式、CapCut、Davinci Resolve、WhatsApp、LiquidText、Cephable等。這些程式在Copilot+ PC筆電上,都能獲得強化過的AI功能。
不單是Windows Copilot Runtime,Copilot+ PC這系列筆電,還有強大的硬體支撐。比如採用新型架構來優化NPU、CPU和GPU的資源使用,每秒能實現40兆次操作(TOPS),可更快執行AI推論。在處理器部分,首波筆電搭載高通Snapdragon X Elite和Snapdragon X Plus處理器,可實現45 TOPS。之後,微軟還會推出搭載英特爾Lunar Lake處理器和AMD Strix Point處理器的Copilot+ PC筆電。甚至他們預告,希望這類硬體架構的筆電,未來能搭載Nvidia GeForce RTX顯卡和AMD Radeon顯卡,從硬體上更進一步優化使用體驗。
持續深化Copilot技術架構、將Windows打造成AI開發平臺,這正是微軟Build 2024大會的2大AI戰略。
微軟如何用GenAI協助開發者工作
微軟開發者部門企業副總Amanda Silver 圖片來源/微軟
在微軟Build 2024大會上,負責程式開發工具設計、GenAI工具研發的微軟開發者部門企業副總Amanda Silver接受iThome專訪,特別說明GenAI如何協助開發者日常工作。
她點出,開發者最常面臨的痛點是工作不一致性,尤其開發者「通常使用30多種工具來完成工作,因此不斷在不同工具間切換,」她繼續說明:「每次切換環境時,平均需要23分鐘才能重新集中注意力。」這造成工作效率低下,而在程式開發工具中導入GenAI工具,來提供問答和指令操作,就能減少來回切換次數、提高效率。
Amanda Silver也分享微軟內部如何使用GenAI工具,她指出,程式開發最重要的是「正確的第一步」,因此,微軟自己有套正確啟動模板(Start Right Templates),內含儲存庫、工作流程、正式上線流程,無論開發者想打造什麼應用程式,都可使用這套模板,來滿足安全監管和生命周期管理。而開發者可將使用模板的知識,輸入到程式開發助理GitHub Copilot中,往後有人需要類似知識時,就能透過GitHub Copilot來存取最佳實踐,提高組織效率、形塑工作文化。
甚至,微軟也用GenAI來降低內部故障排除等技術問題支援的工作負擔。她解釋,微軟內部有套故障排除指南,供技術支援工程師參考、解決客戶面臨的技術問題。這些工程師還能將自己解決問題的知識,輸入到GenAI工具中,來形成一個更聰明的Copilot助理,降低整體從頭摸索的支援成本。
熱門新聞
2024-09-16
2024-09-16
2024-09-13
2024-09-13
2024-09-16
2024-09-16
2024-09-16