Google釋出了一個用於評估和比較各種天氣預報模型的框架WeatherBench 2,該框架可以計算包括機器學習模型和物理模型的天氣預測分數,使研究人員有微調和改進模型的依據。官方還開源WeatherBench 2評估程式碼,以及針對雲端最佳化的真實資料和基準資料集。

由於天氣預測技術的發展發向,正從物理模型逐漸轉移到機器學習模型,因此需要模型基準來評估模型間的能力,並確保機器學習模型值得信任。隨著運算能力提升,Google提到,當今7日天氣預報的準確性,相當於2000年的5日預報,也相當於1980年的3日預報,這些預測準確度的提升,對物流規畫、災害管理、農業甚至是能源,都有極大的價值。

不過,除了運算能力的提升外,當前另一股天氣預測的變革從演算法開始,較新的方法是使用機器學習技術,透過查看大量過去的天氣資料,預測接下來天氣的變化,有別於現行基於物理模型的天氣預測,是以數學方程式描述和模擬大氣、海洋、陸地和相關過程的動態和互動。

機器學習天氣預測目前已經有部分成果,像是Google DeepMind所開發的圖神經網路GraphCast,就可以在25公里的水平解析度下,預測10日天氣,結果也已經可以和先進的物理模型相比較。

機器學習模型的重要優勢,在於模型經過訓練之後,可以僅使用成本遠低於超級電腦的硬體運算,在數分鐘內計算出結果,而這對天氣預報領域帶來重大的效率提升和成本降低的可能性,因此無論是在歐洲中期天氣預報中心(ECMWF)的機器學習發展路線,還是美國國家海洋暨大氣總署(NOAA)的人工智慧戰略都可見端倪。

在發展機器學習天氣預測上,需要一個能夠反應天氣和下游應用各面性質的基準,而且能夠以公平且可重複的方式比較新舊模型。Google所推出的WeatherBench 2全球天氣模型基準,可提供一個可信、可重複的框架,評估和比較不同的預測方法。目前WeatherBench 2官方網站公開的模型比較,包含Keisler、GraphCast和Pangu-Weather機器學習模型,還有一些ECMWF高解析度整合預報系統,作為傳統天氣預報模型的代表。

天氣預報的評估存在一些挑戰,因為高解析度的天氣預報資料可能非常龐大,因此Google在開源統一程式開發模型Apache Beam上建置評估程式碼,供用戶將運算分割成小區塊,以分散式的方式進行評估。另外,Google針對不同解析度,並以雲端最佳化的資料格式,提供用來訓練大多數機器學習模型的ERA5資料集,官方提到,因為從各別檔案下載資料並進行轉換,非常耗時且需要大量運算資源,因此透過公開已經就緒的資料,可以大幅降低研究進入門檻。

Google與ECMWF合作,共同定義了天氣預報品質評分指標,更好地捕捉全球天氣預報的品質,WeatherBench 2能夠以同一標準評估不同的模型,包括機器學習模型與物理模型。除此之外,WeatherBench 2也考慮到更先進的概率預測,提供概率指標和基準。

比起傳統「明天下雨機率80%」,概率預測可以提供不同情境下的概率分布,像是「明天降雨量在0-10毫米的機率為60%,10-20毫米的機率為20%」這類預測,以捕捉更多天氣預報的不確定性。

同時,WeatherBench 2也針對機器學習預測的限制,提供研究範例,Google解釋,機器預測模型相對物理模型,在大氣不確定性上傾向採取保守策略,這會讓預測更為平滑(下圖),因此與真實情況不一致缺乏真實性,同時缺乏小尺度的結構。WeatherBench 2對此提供了研究範例,並且添加光譜指標來量化模型的模糊性,以評估模型是否傾向預測平滑的場景。

研究人員仍會繼續完善WeatherBench 2,添加包括站點觀測和降水資料集,並且嘗試將臨近預報和次季節預測納入基準中。

熱門新聞

Advertisement