代理AI爆發的轉捩點

一早，看到OpenAI執行長Sam Altman在x上宣布：「OpenAI開始支援Anthropic的代理AI溝通框架MCP，先從SDK開始，幾個月後，ChatGPT桌面版也會支援。」我想到的第一個念頭就是，代理型AI爆發的轉捩點出現了。

MCP（Model Context Protocol）是最近幾個月AI圈最火紅的關鍵字，Anthropic打造出了許多開發人員愛用的Claude大語言模型。為了讓模型可以跟各種AI代理溝通，在去年11月，開源釋出了MCP框架，這是一個用於LLM模型溝通上下文資訊的協定，顧名思義就是提供一套標準的資料介接和交換方式，可以讓模型和第三方應用溝通，完成各種AI代理任務。

Anthropic創造了一個框架，讓不同軟體工具商，雲端服務商，將自家API的串接方式、可執行的功能描述，都打包到一隻MCP伺服器程式中，安裝到使用者電腦後，使用者就可以透過LLM來下指令操作這些MCP伺服器，完成各種AI代理工作，像是幫使用者到Gmail發信提醒某人。只要在電腦上裝好Claude桌面軟體，以及開源社群釋出的Gmail存取MCP伺服器，就可以做到上述這件事，安裝越多MCP伺服器，就像是裝了越多的LLM可用工具一樣，Claude模型能用AI代理來執行越多的任務。

去年吹起一股代理型AI浪潮，大型科技巨頭紛紛推出代理型AI的工具，叫好卻不叫座，只看到大量代理型AI的PoC驗證，較少看到大規模導入的企業，困難之一就是，需要事先定義、客製出一道道代理型AI的工作流程，預先撰寫程式，串接出LLM執行任務所需要的每一個步驟，相當麻煩又費工。

但是，MCP框架改變了每一個人，每一家企業需要自己事先製作代理型AI的模式，改由工具廠商製作一次自家App的串接方式，釋出讓LLM呼叫來使用。

在MCP框架中有三個關鍵的元件：具備模型能力的Host應用、下指令用的MCP用戶端、不同軟體或工具的MCP伺服器端。用AI代理呼叫Slack來比喻，Slack公司得自己開發一隻MCP伺服器，可以跟自家API介接。使用者則要在個人電腦中安裝一套Host應用，也要先安裝Slack公司的MCP伺服器號，個人電腦就能用AI代理來呼叫Slack。使用者只需對具備MCP用戶端功能的Chatbot，下指令要LLM呼叫Slack來完成任務，像是幫我整理不同Slack群組今天的討論內容。MCP用戶端可以呼叫Slack的MCP伺服器來完成這個任務。Host應用則負責記錄和管理，所有安裝到這臺個人電腦上的各家MCP伺服器程式。

許多人用Type-C協定的比喻，來形容MCP對GAI模型和AI代理的意義。MCP協定就像是萬能的Type-C協定，讓模型可以透過一套統一的做法，取得不同來源的資料，也能串接不同業者的App來下達指令。使用者不用寫任何程式，只需要動口或打出想完成的任務即可，剩下的工作都由GAI 模型透過MCP找到對應的資料，呼叫對應的App來執行。

只要使用者電腦上裝了某一家App的MCP伺服器，就能讓LLM直接呼叫這家App來用，完全不需要撰寫任何一行程式碼，也可能隨時組合到不同的代理AI工作流程中。MCP框架是代理型AI運作模式的一大突破。

所以，從MCP框架問世後，幾個月來，許多工具軟體商，網路服務業者，紛紛宣布支援，打造自家服務的MCP伺服器，要供使用者下載。開源社群也有不少人自製非官方的版本，如非官方的Gmail MCP伺服器等。

不過，MCP框架也不盡然都是優點或機會，也帶了新的風險，已有AI資安專家開始探討MCP框架的資安風險，像是金鑰憑證竊取、MCP伺服器入侵，提示指令注入攻擊等。若像XZ Utils程式庫供應鏈攻擊事件那樣，惡意攻擊者偽裝熱心開發者，提供知名服務的非官方MCP伺服器程式，例如Gmail。這些未經驗證的MCP伺服器，就可能成為個人電腦的新後門。

隨著OpenAI宣布對MCP框架的支援，意味著超過4億名ChatGPT用戶的個人電腦，未來都有機會具備MCP框架的能力，這也將吸引更多工具商，軟體商將MCP框架視為必備，代理AI可操控的工具量將會大量出現，進一步帶動代理型AI應用的爆發。MCP框架伴隨而來的資安風險，將是企業需要留意的新威脅，也會是臺灣資安產業的新機會。

代理AI爆發的轉捩點

專欄作者

熱門新聞