AI助力鯨魚保育，Google新模型可精準辨識8種鯨魚叫聲

Google持續投入資源，開發可用於辨識鯨魚聲音的人工智慧模型，最新的多物種鯨魚聲音模型能夠辨識8種鯨魚的叫聲，並進一步細分其中兩種鯨魚的不同發聲類型，共可產生12個分類。這項技術不僅提升鯨魚聲音分類的準確性，也揭露了布氏鯨等難以觀察鯨種的行為模式，對鯨魚保育和生態研究提供有力的工具。目前該模型已公開供學術人員下載使用。

Google從2018年起，便與美國國家海洋和大氣管理局（NOAA）的太平洋群島漁業科學中心合作，展開鯨魚叫聲分類的研究工作。最初他們針對座頭鯨開發偵測模型，成功辨識座頭鯨的鳴叫聲，也揭露了座頭鯨在特定時間地點的鳴叫規律和模式，甚至發現了座頭鯨的新棲息地。

而在之後，Google又與加拿大漁業及海洋部（DFO）、Rainforest Connection合作，針對瀕臨絕種的南方定居型虎鯨開發偵測模型，並將其應用在水下麥克風監測網路，即時回報虎鯨位置給DFO和相關單位。

過去的這些研究成為Google開發多物種鯨魚聲音模型的基礎，該模型除了座頭鯨、虎鯨，現在可以辨識的鯨魚還包括藍鯨、長鬚鯨、小鬚鯨、布氏鯨、北大西洋露脊鯨和北太平洋露脊鯨。多物種鯨魚聲音模型的開發並不容易，因為鯨魚聲音的頻率範圍極廣，從藍鯨10 Hz的低頻到齒鯨超過 120 kHz的高頻，對模型的靈敏度要求極高。

研究人員在開發多物種鯨魚聲音模型時，首先將原始音訊轉換為時頻譜（Spectrogram），作為模型辨識聲音的基礎，每個時窗包含5秒鐘的聲音片段。接著，模型會對這些時頻譜進行處理，運用一種稱為梅爾刻度的方法調整聲音的頻率，並透過壓縮和正規化突出聲音的特徵。最後模型會根據處理後的時頻譜，將其分類為12種鯨魚鳴叫類別。

由於海中存在各種聲音，因此研究人員也加入大量的背景聲音訓練模型，以確保模型可以準確辨識鯨魚聲音並排除雜音。實驗結果顯示，多物種鯨魚聲音模型能夠良好地區分不同種類的鯨魚，特別是小鬚鯨和布氏鯨的聲音。

值得一提的是，NOAA最初確認布氏鯨獨特的「Biotwang」鳴叫聲，隨後研究人員利用Google的多物種鯨魚聲音模型對Biotwang聲音特徵進行標記，並應用在大量的音訊資料中，發現布氏鯨多次出現在太平洋西北地區，並且進一步揭露布氏鯨的族群差異和季節性遷徙習性。

熱門新聞