【直擊Web科技最前線：臉書研究院】偵測假帳號有新方法，改靠人際關係網絡提高分辨率

臉書在研究院的官方部落格中公開這項偵測假帳號的研究成果，能在新帳號發出少數交友請求時，辨別是否為假帳號。

隨著網路科技的發展，社交網站已成為許多人每天生活中的日常，臉書更是很多人每天都會使用的社交網路平臺，這個全球最大的社交網路平臺，每日用戶已超過15億，然而，為了維護社交平臺不被濫用，光是2018年第一季臉書就關閉了5.83億個假帳號，過了一年，關閉的假帳號數量高達將近22億個。

大量的假帳號如何攔截？臉書內部自有一套做法，包括透過各種偵測系統，封鎖來自特定IP位置的帳號申請要求，事先防堵假帳號，其次是偵測假帳號的異常行為，在帳號剛建立初期就予以移除，或是將可疑的帳號列為觀察名單，其他用戶檢舉惡意行為再移除。

近期，臉書在今年在臺舉行的Web Conference 2020分享了防堵假帳號的新方法，這是由哈佛博士生Adam Breuer和兩名臉書資料科學團隊成員Roee Eilat 和Udi Weinsberg 共同完成，臉書也將其成果在臉書研究院的官網上發表。

該團隊提到，假帳號建立有三個階段，首先是建立假帳號，接下來發送交友請求，以擴展社交網路連結，當達到一定規模後開始濫用的行為，例如大量的發送垃圾或惡意訊息。

不過，要偵測新建立的假帳號有困難，主要是因為這些帳號在建立的初期，發出的交友連結並不多，難以被查覺異常。

他們發現，假帳號和真實用戶兩者在發送交友請求上有很大的不同，假帳號發出的交友請求，遭拒絕的比率，高於真實用戶被拒絕的比率，這代表了人們有警覺性，傾向接受他們熟悉的(認識的人發出的請求)，拒絕那些他們不熟悉(假帳號的請求)。但這非絕對，實際上，真實的用戶也可能被拒絕，而假帳號也可能被接受。

如果一位用戶傾向接受真實用戶的交友請求，當他接受了一個交友請求，那麼發出請求的帳號可能是真實的用戶，相反的，如果交友請求被拒絕，那麼發出請求的帳號是假的可能性就會增加。即使用戶傾向接受假帳號的交友請求，當他接受交友請求，發出請求的帳號是假帳號的可能性也會增加。

他們也從數據上發現，假帳號為了提高被接受的可能性，會謹慎的挑選發出交友請求的目標。因此從新建立帳號（可能為真實用戶或假帳號）發出交友請求的目標對象，以及他們的反應(接受或拒絕請求)，作為判斷新帳號為真實或假帳號的可能性。

基於這個概念，臉書研究團隊提出一個新演算法SybilEdge，用以在假帳號建立的初期偵測出來，避免這些假帳號濫用社交網路服務。研究將新帳號定義為7天內建立，或是發出的交友請求在50個以內。

SybilEdge分兩階段，首先，以某段時期的資料，加上內容及行為分類器對實際濫用行為的結果，去訓練模型，這個階段提供訓練模型所需要的參數，接下來，實際對每個交友請求和反應(接受或拒絕)執行模型，更新對新帳號判斷為假帳號的可能性。

相較於傳統的假帳號偵測方法，多以可疑帳號的行為作為判斷，SybilEdge重視新帳號發出交友請求的目標用戶，演算法會特別增加目標用戶的權重，包括目標用戶受其他用戶(假帳號或真實帳號)的偏好程度，目標用戶收到交友請求後的反應（接受或拒絕），此外，當確信目標用戶能夠判斷帳號的真偽時，給予信賴權重。

研究團隊以AUC（AUC=1為完全的分類器，若AUC=0.5則代表隨機性質的分類器）衡量和SybilSCAR、SybilRank、SybilBelief等模型的表現，結果顯示SybilEdge的表現優於其他相關模型，在新帳號發出15個交友請求時，SybilEdge的AUC大於0.9。

熱門新聞