2022AI年會
中研院資訊科學研究所研究員古倫維日前(11/19)分享中研院假新聞研究成果,團隊以自然語言處理(NLP)、強化學習(Reinforcement learning)等AI技術,來辨識新聞內容、規畫最佳投放正確資訊的路徑,要給接觸過假新聞的讀者正確資訊,打造為一套不同於事實查核方法的實驗平臺,來打擊假新聞影響,最快今年就會上線。
假新聞偵測並不難,難在後續因應之道
「假新聞的產生和偵測是一體兩面。」古倫維指出,生活中文字類、影片類的不實新聞隨處可見,但也有不少專家開發AI工具,來輔助揪出假新聞。然而真正的問題是,揪出假新聞後該如何因應。
她以新聞角度分析,若偵測到假新聞,最常見的作法是刪除該篇新聞,讓讀者點擊時,不再看到文章。但從讀者角度而言,讀者受推薦系統影響、接收到假新聞時,就對事實產生曲解,就像是「一個健康的人生病了,」古倫維表示,若只是偵測假新聞並將其刪除,並未「治療」病人、幫助其恢復健康。
於是,她思考,「有沒有辦法讓生病的人恢復健康、改變對特定事件的認知?」古倫維認為,現有的假新聞偵測模型十分常見,效果也不錯,但重點不只是偵測假新聞、刪除不實報導,而是得讓接觸到假新聞的讀者,得知事實真相。「這是假新聞研究非常重要的議題,」她強調。
不刪除假新聞的解方:貼標、給正確資訊和說明
因此,有別於刪除假新聞,坊間還有3種常見的「藥方」來治療接觸到假新聞的讀者。首先是貼標,也就是在文章中標註「假新聞」來提醒讀者。不過,這麼做有些缺點,比如文章未貼標,就容易被誤認為是正確資訊,但有可能只是尚未查證。
再來是給予正確資訊,也就是如事實查核中心一樣,挑出網傳假新聞,並附上查核過的事實資料,來告知讀者。但這麼做依然有些代價,像是得耗費大量人力來查證、確認真相,所耗費的時間成本也高,趕不上假新聞產出的速度。
另一個方法是給說明,也就是利用AI模型,根據假新聞特徵來自動產出解釋,告訴讀者為何該文章被歸類為假新聞。
中研院用強化學習打造實驗平臺,適時推播正確資訊給讀者
不過古倫維認為:「友善的媒體資訊傳播環境,才是決定讀者健康的關鍵,」因此,她與實驗室團隊決定從媒體環境下手,打造專屬平臺來提供多角度資訊,降低假新聞對讀者的影響。
比如,他們打造的系統首先會針對同一事件,提供不同媒體的立場,讓讀者了解不同媒體對相同事件的解讀,這就符合上述「貼標」的作法,讓讀者掌握更多媒體資訊。
再來,平臺會根據接觸過假新聞的讀者,提供正確資訊。由於使用者在網路上的閱讀行為,會在網路平臺商留下足跡,因此,當中研院假新聞實驗平臺偵測到使用者點擊過假新聞網頁,演算法就會觸發來推播澄清新聞給讀者。不過,這種偵測推播還可分為2種層面,一是點擊文章可能是假新聞,另一是確定為假新聞,若是前者,系統會推播相關資訊給讀者,若確定是假新聞,則推播澄清新聞給讀者。
但要在最佳時間點推播,就會是一大挑戰。於是,古倫維團隊打造一套強化學習模型,透過獎勵方式,來讓模型在讀者的閱讀路徑中,找出最佳的投放時機,把正確資訊傳給讀者。為此,他們先是建立由假新聞和經查核新聞組成的資料集,來訓練AI模型,讓模型找出最佳投放正確資訊的路徑,並給予模型最大獎勵。
特別的是,「零樣本(Zero-shot)能力對假新聞識別尤其重要!」古倫維強調,AI要能辨別假新聞、投放正確資訊,就得具備良好的零樣本表現。這個意思是,當模型遇到訓練資料中沒見過的數據,依然要能準確判斷,要辨識假新聞,就得具備這樣的能力。而他們的模型與其他模型表現相比,至少都有1.5至2倍的進步。(如下圖)
這套中研院假新聞實驗平臺,最快今年就會上線,不僅可用來提供正確資訊,還能產生報表,分析假新聞讀者群性質與行為等。
另一方面,古倫維團隊也做了一項反事實說明研究,來為假新聞提供反事實的解釋,讓讀者意識到自己讀到的是不實報導。這就是前述不刪除假新聞的「給說明」方法。
進一步來說,反事實是指,結果與事實相反,比如某人比賽輸了,這句論述「如果你昨天睡飽、今天比賽就不會輸」就是反事實。目前,反事實解釋已用於AI模型的結果解釋上,古倫維團隊也打造一套AI系統,來把反事實解釋用於假新聞說明上。
他們的系統包含3個步驟,首先,系統會根據假新聞言論,來生成各種問題,再從證據中尋找答案。接著,系統會找出答案與推論不一致之處,最後再用NLG模型生成反事實解釋。(如下圖)
古倫維團隊也進行2項實驗調查,一是找出最有效的反事實解釋方式,他們從近500位受試者的反應可看出,肯定句的反事實解釋最能發揮效用,不過,對已經熟知該事件且知道該文章是假新聞的讀者來說,用否定句反而更有效(如下圖)。另一份600多人的調查則證明,反事實解釋比其他假新聞說明方法更能改變認知。
未來,古倫維團隊還要利用知識圖譜(Knowledge graph),來擴大對假新聞的推論與證據收集。
熱門新聞
2024-12-24
2024-08-14
2024-12-22
2024-12-20
2024-12-23