Big Sleep是Google Project Zero與DeepMind合作的研究成果,它採用Project Zero發展的AI框架Naptime(如上圖所示),將大型語言模型應用至真實世界的漏洞發現。(圖片來源/Google)

Google上周揭露AI抓漏專案Big Sleep,宣稱已利用它在10月找到了一個位於SQLite的堆疊緩衝區下溢漏洞,不管是SQLite現有的測試基礎設施,或是OSS-Fuzz都沒有發現該漏洞,相信這是AI代理工具於廣泛使用的實際軟體中,發現未知記憶體漏洞的第一個公開例子。SQLite開發者則在收到Google通知的當天便修補了該漏洞。

Big Sleep是由Google Project Zero團隊今年6月發表的Naptime專案(Project Naptime)衍生而來。Naptime旨在評估大型語言模型(LLM)於安全漏洞研究中的潛力,它開發了一個框架,讓LLM能夠模仿人類安全專家發現並展示安全漏洞的系統性方法,並經過Meta CyberSecEval2基準測試的驗證;而Big Sleep則是Project Zero與DeepMind的研究成果,它採用Naptime框架,並將LLM的應用從純粹的基準測試擴展到真實世界的漏洞發現。

推動Naptime與Big Sleep專案的動力之一,是因為發現有各種已修補漏洞的變種仍不斷遭到駭客利用,該趨勢顯示出模糊測試無法有效抓住這些變種,另一方面,駭客手動分析這些變種卻是一個具備成本效益的作法。

Google表示,與開放式漏洞研究相比,現有的大型語言模型更適合變種分析。提供一個起點,如先前漏洞的細節,能減少研究的模糊性,並基於「先前有一個漏洞,可能還有類似的漏洞存在」這樣具體的理論進行探索。

Big Sleep專案仍處於研究階段,並利用含有已知漏洞的小程式來進行評估,Google日前決定於SQLite上進行首次大規模的實際變種分析實驗,以測試相關的模型與工具,研究人員蒐集了SQLite程式庫最近的提交紀錄,手動刪除了那些微小的與僅涉及文件的變更,接著調整了提示,提供提交訊息與程式碼變更的差異對照,要求AI代理工具檢查程式庫的最新版本,尋找可能還未修復的相關問題,進而找出了SQLite上的堆疊緩衝區下溢漏洞。

Google認為,Big Sleep專案擁有具大的防禦潛力,得以在軟體發布前就發現軟體中的安全漏洞,讓漏洞在遭到駭客利用之前就被修復。人們需要一種方法來幫助防禦者找到那些模糊測試很難發現的錯誤,希望AI可以縮小此一差距。

熱門新聞

Advertisement