一早,看到OpenAI執行長Sam Altman在x上宣布:「OpenAI開始支援Anthropic的代理AI溝通框架MCP,先從SDK開始,幾個月後 ,ChatGPT桌面版也會支援。」我想到的第一個念頭就是,代理型AI爆發的轉捩點出現了。

MCP(Model Context Protocol)是最近幾個月AI圈最火紅的關鍵字,Anthropic打造出了許多開發人員愛用的Claude大語言模型。為了讓模型可以跟各種AI代理溝通,在去年11月,開源釋出了MCP框架,這是一個用於LLM模型溝通上下文資訊的協定,顧名思義就是提供一套標準的資料介接和交換方式,可以讓模型和第三方應用溝通,完成各種AI代理任務。

Anthropic創造了一個框架,讓不同軟體工具商,雲端服務商,將自家API的串接方式、可執行的功能描述,都打包到一隻MCP伺服器程式中,安裝到使用者電腦後,使用者就可以透過LLM來下指令操作這些MCP伺服器,完成各種AI代理工作,像是幫使用者到Gmail發信提醒某人。只要在電腦上裝好Claude桌面軟體,以及開源社群釋出的Gmail存取MCP伺服器,就可以做到上述這件事,安裝越多MCP伺服器,就像是裝了越多的LLM可用工具一樣,Claude模型能用AI代理來執行越多的任務。

去年吹起一股代理型AI浪潮,大型科技巨頭紛紛推出代理型AI的工具,叫好卻不叫座,只看到大量代理型AI的PoC驗證,較少看到大規模導入的企業,困難之一就是,需要事先定義、客製出一道道代理型AI的工作流程,預先撰寫程式,串接出LLM執行任務所需要的每一個步驟,相當麻煩又費工。

但是,MCP框架改變了每一個人,每一家企業需要自己事先製作代理型AI的模式,改由工具廠商製作一次自家App的串接方式,釋出讓LLM呼叫來使用。

在MCP框架中有三個關鍵的元件:具備模型能力的Host應用、下指令用的MCP用戶端、不同軟體或工具的MCP伺服器端。用AI代理呼叫Slack來比喻,Slack公司得自己開發一隻MCP伺服器,可以跟自家API介接。使用者則要在個人電腦中安裝一套Host應用,也要先安裝Slack公司的MCP伺服器號,個人電腦就能用AI代理來呼叫Slack。使用者只需對具備MCP用戶端功能的Chatbot,下指令要LLM呼叫Slack來完成任務,像是幫我整理不同Slack群組今天的討論內容。MCP用戶端可以呼叫Slack的MCP伺服器來完成這個任務。Host應用則負責記錄和管理,所有安裝到這臺個人電腦上的各家MCP伺服器程式。

許多人用Type-C協定的比喻,來形容MCP對GAI模型和AI代理的意義。MCP協定就像是萬能的Type-C協定,讓模型可以透過一套統一的做法,取得不同來源的資料,也能串接不同業者的App來下達指令。使用者不用寫任何程式,只需要動口或打出想完成的任務即可,剩下的工作都由GAI 模型透過MCP找到對應的資料,呼叫對應的App來執行。

只要使用者電腦上裝了某一家App的MCP伺服器,就能讓LLM直接呼叫這家App來用,完全不需要撰寫任何一行程式碼,也可能隨時組合到不同的代理AI工作流程中。MCP框架是代理型AI運作模式的一大突破。

所以,從MCP框架問世後,幾個月來,許多工具軟體商,網路服務業者,紛紛宣布支援,打造自家服務的MCP伺服器,要供使用者下載。開源社群也有不少人自製非官方的版本,如非官方的Gmail MCP伺服器等。

不過,MCP框架也不盡然都是優點或機會,也帶了新的風險,已有AI資安專家開始探討MCP框架的資安風險,像是金鑰憑證竊取、MCP伺服器入侵,提示指令注入攻擊等。若像XZ Utils程式庫供應鏈攻擊事件那樣,惡意攻擊者偽裝熱心開發者,提供知名服務的非官方MCP伺服器程式,例如Gmail。這些未經驗證的MCP伺服器,就可能成為個人電腦的新後門。

隨著OpenAI宣布對MCP框架的支援,意味著超過4億名ChatGPT用戶的個人電腦,未來都有機會具備MCP框架的能力,這也將吸引更多工具商,軟體商將MCP框架視為必備,代理AI可操控的工具量將會大量出現,進一步帶動代理型AI應用的爆發。MCP框架伴隨而來的資安風險,將是企業需要留意的新威脅,也會是臺灣資安產業的新機會。

專欄作者

熱門新聞

Advertisement