【深化Copilot技術架構，還要將Windows打造成AI開發平臺】微軟揭露年度2大AI戰略

圖片來源／微軟

去年，微軟做了2件大事，影響今年AI戰略走向。

一是推出生成式AI助理微軟Copilot，短短1年更新了150多次，成為新一代微軟跨生產力工具的智慧小幫手。另一件事是，微軟也開始打造Copilot技術架構，提供技術資源和工具，來讓開發者打造自己的Copilot助理。甚至過去2年來，微軟聯手GitHub推出程式開發AI助理GitHub Copilot，搖身一變成為全球工程師愛用的熱門工具，光付費訂閱者就有180萬人。

可以說，微軟近期AI戰略鎖定Copilot本身、Copilot客製化開發能力，以及更便捷智慧的程式開發助手。

到了今年，微軟AI戰略又有何變化？下一步往哪前進？

微軟Build 2024的兩大AI戰略

他們在今年度Build大會上給了答案。在這場20萬人註冊、4千人親自至西雅圖參加的微軟Build 2024大會上，微軟執行長Satya Nadella開宗明義點出了今年發展3大元素：微軟Copilot、Copilot技術架構和AI系列筆電Copilot+ PC。

Satya並未過多著墨微軟Copilot，反而聚焦於後兩者，意味著這是微軟2024年的2大AI戰略。一如前述，Copilot技術架構並非新東西，是微軟去年就開始發展的架構，目標是滿足開發者需求，來打造客製化Copilot助理。

今年，Satya進一步詳解這個技術架構的組成，涵蓋底層的AI基礎設施、基礎模型、資料、AI調度和工具鏈，以及上層的Copilot應用、擴充外掛，還有AI安全與資安。這個架構，比去年揭露的更細緻。

微軟執行長Satya Nadella在今年度Build大會上點出Copilot架構和Copilot+ PC兩大AI戰略，其中後者有個Runtime重要基礎，以Windows Copilot函式庫和40多個本地端模型為核心。圖片來源／微軟

戰略1：Copilot技術架構

今年，基礎設施層有3大亮點，首先是遍布全球的資料中心將於2025年全數採用再生能源、零碳排，再來是過去6個月Azure雲端算力提高了30倍，最後是推出2款加速AI訓練和推論的虛擬機器（VM），包括ND MI300X v5和搭載Azure Cobalt 100處理器的系列虛擬機器。

在基礎模型部分，微軟生成式AI開發工具Azure AI Studio終於進入正式版，其上的強大多模態模型GPT-4o也正式上線。至於模型發展則朝2方向並行，一是延續微軟自建的Phi小型語言模型，新推更小更有效率的多模態模型Phi-3-vision，另一是深化第三方模型整合，包括擴大與Hugging Face合作、要導入其開源模型，同時也在模型即服務（MaaS）中納入第三方企業模型。

至於資料和AI工具層，分別主打即時串流資料分析服務Real-Time Intelligence、整合資料湖OneLake擴大RAG範圍，以及在AI程式開發工具GitHub Copilot Workspace中，推出程式開發外掛GitHub Copilot Extensions，首波推出16個外掛，包括微軟自建的GitHub Copilot for Azure外掛。

在應用層，則有橫跨資料壁壘的Microsoft Copilot Connector連結器、可扮演PM角色的協作助理Team Copilot，還有Microsoft Copilot Studio平臺更強大的代理能力類別，用自然語言來客製化智慧助理Copilot。

而AI安全與資安層，則以微軟去年發起的未來安全計畫（SFI）為核心，遵守安全設計、安全預設和安全維運3大原則，並以6項安全文化和治理作法來確保Copilot技術架構的安全。

這就是微軟今年端出的一大AI戰略。

戰略2：AI系列筆電Copilot+ PC

他們的第2大AI戰略，則要將雲端AI開發和應用能力延伸到裝置端，要將Windows打造成最開放的AI開發平臺。因此，微軟祭出了AI筆電Copilot+ PC戰略，其中一個重要基礎就是Windows Copilot Runtime。Satya稱之為Copilot技術架構到Windows作業系統的延伸，該Runtime以Windows Copilot函式庫為核心，向下支援AI框架和工具，向上用來打造高階AI應用與體驗。

其中，Copilot函式庫內含一系列API和演算法，這些API由40多個本地端模型驅動。第一波API在今年6月上架，包括用於影像特效的Studio Effects、即時字幕翻譯Live Caption、OCR、回顧使用者活動Recall User Activity和多模態模型Phi Silica等。接下來還會納入向量嵌入、檢索增強生成（RAG）、文本摘要等API。這些API，加速了使用者打造生成式AI應用和體驗的作業。

再來，Runtime支援的AI框架和工具有2大亮點，分別是Windows專用高效能低階API DirectML可原生支援PyTorch了，以及使用者可在DirectML和ONNX Runtime Web使用網頁原生ML框架WebNN。這意味著，AI開發的便利性更高了。

利用Runtime優勢，可打造出高階AI應用與體驗，Satya用微軟自己打造的原生AI應用程式來說明。比如回顧（Recall）透過對螢幕快照，將快照資訊轉為向量、儲存在語義索引中。當使用者想搜尋先前看過的資訊時，就能輸入關鍵字來啟動向量語意辨識、快速找出所需內容。又或是由5個本地端模型驅動的圖像創作（Cocreator），可根據簡單的筆畫快速生成逼真細緻圖畫，其他還有即時字幕翻譯，可隨時替影片、音檔添加字幕或翻譯為英語。這些程式，在Copilot+ PC系列筆電中皆能開箱即用。

不只原生AI程式，Runtime加上NPU等硬體優勢，還能優化第三方應用程式的AI功能，如Adobe系列程式、CapCut、Davinci Resolve、WhatsApp、LiquidText、Cephable等。這些程式在Copilot+ PC筆電上，都能獲得強化過的AI功能。

不單是Windows Copilot Runtime，Copilot+ PC這系列筆電，還有強大的硬體支撐。比如採用新型架構來優化NPU、CPU和GPU的資源使用，每秒能實現40兆次操作（TOPS），可更快執行AI推論。在處理器部分，首波筆電搭載高通Snapdragon X Elite和Snapdragon X Plus處理器，可實現45 TOPS。之後，微軟還會推出搭載英特爾Lunar Lake處理器和AMD Strix Point處理器的Copilot+ PC筆電。甚至他們預告，希望這類硬體架構的筆電，未來能搭載Nvidia GeForce RTX顯卡和AMD Radeon顯卡，從硬體上更進一步優化使用體驗。

持續深化Copilot技術架構、將Windows打造成AI開發平臺，這正是微軟Build 2024大會的2大AI戰略。

微軟如何用GenAI協助開發者工作

微軟開發者部門企業副總Amanda Silver　圖片來源／微軟

在微軟Build 2024大會上，負責程式開發工具設計、GenAI工具研發的微軟開發者部門企業副總Amanda Silver接受iThome專訪，特別說明GenAI如何協助開發者日常工作。

她點出，開發者最常面臨的痛點是工作不一致性，尤其開發者「通常使用30多種工具來完成工作，因此不斷在不同工具間切換，」她繼續說明：「每次切換環境時，平均需要23分鐘才能重新集中注意力。」這造成工作效率低下，而在程式開發工具中導入GenAI工具，來提供問答和指令操作，就能減少來回切換次數、提高效率。

Amanda Silver也分享微軟內部如何使用GenAI工具，她指出，程式開發最重要的是「正確的第一步」，因此，微軟自己有套正確啟動模板（Start Right Templates），內含儲存庫、工作流程、正式上線流程，無論開發者想打造什麼應用程式，都可使用這套模板，來滿足安全監管和生命周期管理。而開發者可將使用模板的知識，輸入到程式開發助理GitHub Copilot中，往後有人需要類似知識時，就能透過GitHub Copilot來存取最佳實踐，提高組織效率、形塑工作文化。

甚至，微軟也用GenAI來降低內部故障排除等技術問題支援的工作負擔。她解釋，微軟內部有套故障排除指南，供技術支援工程師參考、解決客戶面臨的技術問題。這些工程師還能將自己解決問題的知識，輸入到GenAI工具中，來形成一個更聰明的Copilot助理，降低整體從頭摸索的支援成本。

相關報導

熱門新聞