Google持續投入資源,開發可用於辨識鯨魚聲音的人工智慧模型,最新的多物種鯨魚聲音模型能夠辨識8種鯨魚的叫聲,並進一步細分其中兩種鯨魚的不同發聲類型,共可產生12個分類。這項技術不僅提升鯨魚聲音分類的準確性,也揭露了布氏鯨等難以觀察鯨種的行為模式,對鯨魚保育和生態研究提供有力的工具。目前該模型已公開供學術人員下載使用。

Google從2018年起,便與美國國家海洋和大氣管理局(NOAA)的太平洋群島漁業科學中心合作,展開鯨魚叫聲分類的研究工作。最初他們針對座頭鯨開發偵測模型,成功辨識座頭鯨的鳴叫聲,也揭露了座頭鯨在特定時間地點的鳴叫規律和模式,甚至發現了座頭鯨的新棲息地。

而在之後,Google又與加拿大漁業及海洋部(DFO)、Rainforest Connection合作,針對瀕臨絕種的南方定居型虎鯨開發偵測模型,並將其應用在水下麥克風監測網路,即時回報虎鯨位置給DFO和相關單位。

過去的這些研究成為Google開發多物種鯨魚聲音模型的基礎,該模型除了座頭鯨、虎鯨,現在可以辨識的鯨魚還包括藍鯨、長鬚鯨、小鬚鯨、布氏鯨、北大西洋露脊鯨和北太平洋露脊鯨。多物種鯨魚聲音模型的開發並不容易,因為鯨魚聲音的頻率範圍極廣,從藍鯨10 Hz的低頻到齒鯨超過 120 kHz的高頻,對模型的靈敏度要求極高。

研究人員在開發多物種鯨魚聲音模型時,首先將原始音訊轉換為時頻譜(Spectrogram),作為模型辨識聲音的基礎,每個時窗包含5秒鐘的聲音片段。接著,模型會對這些時頻譜進行處理,運用一種稱為梅爾刻度的方法調整聲音的頻率,並透過壓縮和正規化突出聲音的特徵。最後模型會根據處理後的時頻譜,將其分類為12種鯨魚鳴叫類別。

由於海中存在各種聲音,因此研究人員也加入大量的背景聲音訓練模型,以確保模型可以準確辨識鯨魚聲音並排除雜音。實驗結果顯示,多物種鯨魚聲音模型能夠良好地區分不同種類的鯨魚,特別是小鬚鯨和布氏鯨的聲音。

值得一提的是,NOAA最初確認布氏鯨獨特的「Biotwang」鳴叫聲,隨後研究人員利用Google的多物種鯨魚聲音模型對Biotwang聲音特徵進行標記,並應用在大量的音訊資料中,發現布氏鯨多次出現在太平洋西北地區,並且進一步揭露布氏鯨的族群差異和季節性遷徙習性。

熱門新聞

Advertisement