臉書釋出圖像相似性資料集，促進圖片變造偵測技術發展

為了要打擊惡意改圖，臉書現在釋出圖像相似性（Image Similarity）資料集，提供用於偵測線上有害圖像變造的基準。圖像相似性資料集含有超過100萬張的圖像，其中有5萬張是由臉書所提供的查詢圖像。另外，臉書還舉辦了挑戰賽，以20萬美元的獎勵，廣邀研究人員來比賽，切磋偵測圖片變造的能力。

社交媒體上的錯誤訊息以及平臺遭到濫用的情況，使得不少相關團體著手提出解決方案，除了事實查核之外，還積極打擊偽造圖像，包括發展深度偽造（DeepFake）、惡意迷因偵測等技術，而臉書提到，最佳的解決方案，必須要與社群合作，因此他們集結眾人之力，創建了目前已知最大的圖像相似性資料集，內含包括由人或是自動編輯的圖像。

雖然大多數的用戶，都是出於良性或是娛樂的目的後製圖像，不過卻有部分惡意人士，透過變造圖像來傳播錯誤、暴力和仇恨訊息，而這可能使其他人受到傷害。

社交媒體運用內容追蹤和圖像相似性來阻擋，可能對社會產生負面影響的圖像或是影片傳播，透過結合人工和自動偵測工具，希望盡早發現裸露、暴力和已知錯誤的訊息，但是人工審查並無法大規模處理圖像，因此提高機器學習模型的辨識能力，才能夠有效改善這樣的問題。

圖像相似性指的是從大量不相關的圖像，找出遭到變造的圖像來源，這個技術並非是全新的概念，早被用於內容審查領域，諸如錯誤訊息、侵犯版權和詐騙等。圖像相似性檢測，是一種視覺內容追蹤方法，臉書提到，圖像相似性檢測的發展並未受到重視，針對像是分類或物體辨識等，針對其他視覺任務發展的模型，並無法在圖像相似性偵測上良好作用，而且缺乏大型標準化資料來源，無法測量圖像相似性演算法的效能，也阻礙了相關研究。

因此經過變造的圖片，通常能夠避開不夠強大的自動圖像檢測系統。為了要改進偵測系統的能力，臉書創建了Image Similarity資料集，希望讓基於機器學習技術的系統，能夠透過強化預測視覺內容相似性，使得線上服務可以大規模偵測遭到變造的圖像。

圖像相似性資料集能夠作為相似檢測的基準，其包含100萬張的圖像，和5萬張由人工與非人工編輯轉換的查詢圖像。為了避免這個資料集被惡意人士濫用，臉書將會先開放給同意資料集限制條款的挑戰賽參與者存取，在挑戰賽之後，臉書就會開放資料集，其他研究人員也只要同意使用條款，就可拿來研究使用。

熱門新聞