資料來源:玉山金控,iThome整理,2021年8月

反洗錢(AML)一直是整個金融業兢兢業業、嚴陣以待的議題,他們拼命抓漏,也不願放過任何風險。對玉山銀行來說,更是如此。

用NLP快速分類、揪出特定名詞,加速負面新聞分類

反洗錢機制如此重要,玉山銀行靠AI模型和三大步驟,來簡化傳統耗時耗力的AML負面新聞蒐集工作。他們設計一套新AML黑名單偵測流程,以自然語言處理(NLP)技術來加速負面新聞辨識;新流程拆解了玉山舊有的人工閱讀和辨識作業,可分為負面新聞分類、事件聚合分析、黑名單資訊擷取三大步驟。首先,團隊先用人工標註的新聞資料,來微調NLP經典預訓練模型BERT,建立二元分類器、分辨負面新聞。再來,第二步進入事件聚合分析階段,將相似的新聞文章歸為同類。此處會由預訓練模型產出文章語意向量,再將語意相似的文章向量,歸為相同事件。

最後進入黑名單資訊擷取階段,利用人工標註的文章黑名單出現位置、外部訓練資料和BERT模型,打造一套人名辨識(NER)模型、罪名QA模型和地名擷取模型,來產出黑名單預測結果。

這些資訊,最終會呈現在前端介面,包括新聞文本、涉案人名、罪名和犯案地等,同仁可直接編輯、驗證,省下原本要手動查詢大量新聞、將文章複製貼上的時間成本。

而且,新流程在閱讀上也大有幫助。因為,傳統方法需要人工閱讀所有與特定人物相關的新聞,一個人可能就有上百篇,但NLP模型可直接分類文章、挑出有問題的幾篇新聞,再由人工精讀即可。未來,玉山銀行還要讓這套AML黑名單偵測模型學會更多技能,比如能進一步回答人與時間、地點和金額的對應關係,變得更聰明。

熱門新聞

Advertisement