法庭語音辨識應用大圖解

司法院在國民法官法庭首次引進AI語音辨識技術，打造出專用於支援法律專業詞彙的語辨引擎，最多可辨別近20人的發言，平均正確率高達92%。使用這項技術，當庭即可快速產出逐字筆錄。

製作法庭筆錄有兩套系統，一套是語辨逐字稿系統（如圖左），可逐句在螢幕上顯示文字，接著將這些文字拋轉到另一套筆錄系統中（如圖右），方便書記官進行編修。從這項應用中可歸納5大特色。

特色1 專用法庭語辨引擎

為了在語音辨識中更準確地識別法律專用詞彙，司法院的中文語音辨識引擎使用超過1千萬筆裁判書和約180萬筆開庭筆錄，作為AI訓練資料，以優化語意模型和聲學模型。在國民法官模擬法庭測試中，準確度達92%。

特色2 近20人同步語辨

圖片來源／司法院

這套語音辨識系統最多可支援19人的發言，即使在辯論中遇到兩人同時說話，也能正確識別。這有助於避免在法庭辯論中因多人發言或插話而遺漏記錄。此外，審判長可以控制每個角色的麥克風狀態，來啟用或暫停語音辨識功能。

特色3 案件專用語自動微調

針對不同專業領域的案件，司法院審判系統會在開庭前一晚定時上傳語音辨識預學習檔案至語辨引擎，並以此訓練一個語意小模型，與原本的語意主模型配合使用。這樣可提高對該案件涉及的人名、公司名稱等關鍵詞彙的辨識正確率。書記官也可手動輸入關鍵字或上傳檔案（如起訴書），來進一步優化語辨效果。

特色4 逐字稿一鍵影像回放

不需要直接操作錄影回放系統，透過筆錄系統可將每段發言內容逐字記錄下來，並記錄相應的時間戳記，需要時就能迅速切換到指定錄影時間位置，查看該時段的發言或提示卷證的影像片段，還可以選擇不同視角進行觀看，以供庭上當事人或審判人員確認。

特色5 離線語音辨識模式

司法院語音辨識主機已經放置在國民法官法庭的資訊機房中，就算遇到法院與司法院無法連網時，辨識服務也能正常運作。此外，系統設計上具有高容錯和高可用（HA），當主機發生故障時，系統會自動切換至備援服務。

熱門新聞