在5月下旬的微軟Build 2024大會上,微軟執行長Satya Nadella一口氣揭露數十項新突破,還點出今年的2大重要AI戰略:支撐起AI開發和應用的Copilot技術架構,以及號稱史上最快的AI系列筆電Copilot+ PC。
大會進入Copilot+ PC主題時,Satya並未直接亮相AI筆電新品,而是興致勃勃地聊起一個重要基礎:Windows Copilot Runtime。微軟官網將它形容為「Copilot技術架構到Windows作業系統的延伸」,Satya則稱:「它會讓Windows成為最好的AI開發平臺!」甚至還比喻,就像Win32帶起圖形使用者介面GUI應用風潮一樣,Windows Copilot Runtime也將帶起AI應用大爆發。
這是因為,Windows Copilot Runtime是專為Windows作業系統設計的底層函式庫,內建多種模型API和工具,能用來更快、更有效率地執行AI開發工作和AI應用。
微軟執行長Satya Nadella指出,Windows Copilot Runtime是微軟AI筆電Copilot+ PC的重要基礎,以函式庫、本地端模型與API為核心,來驅動高階AI應用與體驗。圖片來源/微軟
特點1:專為AI設計的Windows函式庫
進一步來說,Windows Copilot Runtime的核心是「Windows Copilot函式庫與本地端模型」,向下支援微軟AI框架和工具鏈,向上可用來發展AI應用程式、提供一致的使用體驗。這3大層次加起來,就是一套完整的端到端Windows AI生態系統,「Windows Copilot Runtime就是這樣的系統」,微軟官網如此說明。
就Windows Copilot函式庫與本地端模型來說,它包括一系列即用型本地端API,這些API由40多個本地端AI模型和Windows內建的DiskANN等演算法驅動,使用者可用來打造AI應用和體驗。
第一波API在6月對開發者開放,包括工作室特效(Studio Effects)、即時字幕翻譯(Live Caption)、OCR、回顧使用者活動(Recall User Activity)和語言模型Phi Silica等。接下來,Windows Copilot函式庫預計還會新添向量嵌入、檢索增強生成(RAG)、文本摘要等API。其中,向量嵌入API還能用來打造開發者自己的向量儲存庫,能介接專屬App的資料,更客製化回答問題。
如何使用這些API?微軟舉例,開發者不需任何程式碼,就能在Copilot+ PC系列筆電上,將Studio Effects整合至自己的應用程式,比如創意濾鏡、人像模糊化、注視提詞機(Eye contact teleprompter)等。或是使用即時字幕翻譯API,來替音檔和影片即時添加字幕。
而驅動這些API的本地端模型,則有40多款小型語言模型,如Phi系列模型、近期新打造的Phi-3-vision,以及專為Copilot+ PC和NPU設計的33億參數SOTA模型Phi-Silica,延遲更低、更省能源。這意味著,所有Copilot+ PC都內建40多個小型語言模型。
特點2:支援多款AI框架與工具
除了函式庫與模型,Windows Copilot Runtime還支援底層AI框架與工具,像是微軟既有的AI框架DirectML、ONNX Runtime等。
Satya揭露底層工具2大亮點,開發者透過Windows中用於機器學習的高效能低階API:DirectML,就能獲得Windows作業系統對PyTorch開發框架的原生支援(開發者預覽版)。這意味著,Hugging Face上的上千個模型終於能在Windows中執行,而且微軟也正式推出GPU對PyTorch的支援,NPU支援也即將上線。
另一亮點是WebNN,也就是網頁原生的機器學習框架,可在Windows作業程式中透過DirectML和ONNX Runtime Web來執行。同樣是開發者預覽版,WebNN的出現,能讓開發者更好地利用筆電硬體資源,來提供更好的AI網頁App體驗。這2項就是Windows Copilot Runtime的底層工具亮點。
特點3:更多原生與第三方AI應用
不只支援AI工具,Windows Copilot Runtime還能向上發展AI應用與體驗,這部分有2大特點,一是微軟用Windows Copilot Runtime自建的AI應用程式,如使用者活動回顧(Recall)、圖像創作(Cocreator)、即時字幕翻譯、風格編輯(Restyle Image)等。
其中,回顧是透過對螢幕快照,將這些資訊轉為向量、儲存在語義索引中。當使用者想搜尋先前看過的資訊時,就能在回顧中手動捲動時間軸搜尋,或輸入關鍵字,來啟動向量語意辨識、快速找出所需內容。這些快照皆儲存在本地端,使用者可隨時刪除,或在設定中設置不想留存快照的特定網站或應用程式。但日前,為顧及使用者隱私,微軟預設回顧為關閉狀態。
再來,圖像創作則以小型語言模型和Stable Diffusion等共5款模型驅動,可根據文字提示和簡單筆畫,來即時生成逼真的圖像。即時字幕則支援筆電上任何音訊的語言翻譯,可將40多種語言翻譯為英文,離線也行。不只開發這些應用,微軟還用來優化既有的智慧助理Copilot,比如能在筆電上與玩家語音對話、給玩家XBox遊戲Minecraft的破關建議。
除了自建的AI應用,微軟Windows Copilot Runtime還正整合多個第三方應用程式,如專業級影像處理程式Davinci Resolve、影像剪輯程式CapCut、通訊軟體WhatsApp、聲音手勢控制程式Cephable、文件註解程式LiquidText和Adobe系列應用等,要用NPU來優化這些程式的AI功能。
因此微軟自建的AI應用程式,使用者可在Copilot+ PC筆電中開箱即用,要是在這系列筆電使用微軟整合的第三方應用程式,也能獲得筆電加持的AI功能。可以說,這個Windows Copilot Runtime,是支撐起Copilot+ PC這一系列AI筆電的重要基礎。
強大硬體撐起史上最快AI筆電
當然,光靠強大的底層系統驅動這系列筆電,還是不夠的。因此Satya點出,這系列筆電採用新型硬體架構,大幅優化NPU、CPU和GPU的資源使用,每秒能實現40兆次操作(TOPS)。微軟測試證實,這樣的硬體設計能更快進行AI模型推論,執行AI工作負載的效率還能提高100倍,續航力也更好,充電一次就能支援長達15小時的網頁瀏覽,或22小時的本地影片播放,後者比MacBook Air 15 吋還要久20%。
至於處理器部分,首批Copilot+ PC筆電採搭載高通Snapdragon X Elite和Snapdragon X Plus處理器,可實現45 TOPS。之後,還會推出搭載英特爾Lunar Lake處理器和AMD Strix Point處理器的Copilot+ PC筆電。甚至微軟預告,希望這類硬體架構的筆電,未來能搭載Nvidia GeForce RTX顯卡和AMD Radeon顯卡,來從硬體上更進一步優化Copilot+ PC筆電的使用體驗。
這些硬體和Windows Copilot Runtime優勢,正是微軟發豪語稱Copilot+ PC筆電是史上最快、最聰明筆電的底氣。
熱門新聞
2024-10-05
2024-10-04
2024-10-02
2024-10-03
2024-09-29
2024-10-01
2024-10-01