Deepmind在《Nature》期刊發表的論文,說明了他們如何運用深度增強學習,和模擬環境學習架構,在瑞士洛桑的可變配置環磁機(Variable Configuration Tokamak,TCV)上建置並運作控制器,成功控制核融合電漿。

研究人員不只可以使電漿保持穩定,還可以精確地將其雕塑成各種形狀,該研究成果代表著,增強學習系統可以用來控制過熱物質,讓科學家研究電漿在不同條件下的反應,提高對核融合反應爐的理解。

這項研究的意義,在於推進科學家在核融合發電的研究。科學家為了解決全球能源危機,希望能找到乾淨且無限的能源,而核融合目前看起來是一個絕佳的選項,透過融合隨處可見的氫元素,來獲得融合過程中所釋放出的強大能量,而這也是宇宙中,活躍恆星的能量來源。

要在地球上建立適合核融合的嚴苛環境並不容易,科學家使用托克馬克(Tokamak)又稱為環磁機的裝置,該裝置在甜甜圈形狀的真空外包覆電磁線圈,來將比太陽核心更熱的氫電漿約束在真空中。

但是環磁機中的電漿並不穩定,要維持可進行核融合所需條件非常困難,控制系統必須要協調環磁機中的電磁線圈,並且每秒數千次調整線圈電壓,避免電漿碰觸到容器壁,以免造成熱量損失和器材損壞。

而Deepmind與洛桑聯邦理工學院的瑞士電漿中心合作,開發了第一個深度增強系統,能夠自動控制線圈,將電漿穩定約束在環磁機中。

目前科學家在核融合的研究,仍受到許多限制,全球有數十個環磁機,這些裝置昂貴但需求量很大,TCV一次實驗只能維持電漿3秒,需要冷卻15分鐘,之後才能再次進行實驗,不僅如此,多個研究小組通常需要共用環磁機,而這也限制了可實驗的時間。

由於實體環磁機難以取得,於是研究人員轉而使用模擬器來加速研究,Deepmind先在模擬環境中控制TCV,接著才在真正的TCV上驗證結果。經過實驗證實,他們已經有能力將電漿雕塑成需要的形狀。雖然模擬環境更便宜更方便,但仍然需要克服許多障礙,像是電漿模擬器速度非常慢,一秒的模擬需要數小時的運算,此外,TCV的狀況每天都不同,研究人員需要開發演算法,來改進模擬結果以適用於真正的硬體上。

而且現有的電漿控制系統也很複雜,TCV上的19個電磁線圈皆安裝獨立的控制器,每個控制器都使用演算法即時估算電漿特性,來調整為相對應的電壓,而Deepmind的新方法,則以單個神經網路,一次控制所有線圈,自動學習可達到最佳電漿配置的電壓。

Deepmind在研究中,創建一系列電漿形狀,而電漿物理學家正在研究這些形狀的電漿,在產生能量上的可用性,像是雪花形狀的電漿,就被認為可以將廢能散布到容器壁的多個點上,有助於降低冷卻成本。另外,深度增強學習也能達到過去TCV從未做過的事,像是在穩定容器內同時維持兩個水滴形狀的電漿,研究人員提到,他們只改變要求,演算法就能自動找到適合的控制方式。

人工智慧再次展現推進科學研究的潛力,在能源領域上,人工智慧加速並協助發展核融合發電,而利用增強學習自動控制電漿的方式,也將改變未來TCV的設計。

熱門新聞

Advertisement