【直擊Web科技最前線：馬里蘭大學電腦科學系教授Jen Golbeck】社群平臺假帳號氾濫，40年老方法也能揪出灌水機器人

馬里蘭大學電腦科學系教授Jen Golbeck解釋，按照班佛定律（Benford's Law），以1為首位數字的出現機率，約30%，隨著數字越大，出現的機率則越小。這個方法，能有效在社群媒體上，揪出專門灌水讚數或轉推文章的假帳號機器人。（圖片來源／Jen Golbeck）

網路技術帶動社群媒體發展，讓大眾更快速與親友分享生活點滴，甚至用來打造個人品牌。但社群媒體的興盛，卻也產生假帳號買賣，專門替特定帳號衝讚數，或是投票灌水、分享特定貼文等。美國馬里蘭大學電腦科學系教授Jen Golbeck在今年大會中，分享自己如何以40年前的老方法，來揪出臉書、Twitter上的衝讚機器人。

Jen Golbeck指出，衝讚數的假帳號機器人因使用者需求而存在，讚數多，就越能放大自己的影響力。就市場行情來說，美金1元就能買到50至100個讚，便宜的價格更導致假帳號的猖獗。

也因此，各大社群平臺利用不同方法，來打擊假帳號。比如根據使用者特徵、好友數、活動時間、貼文內容和語句情感等特徵，訓練一套系統，來自動判斷帳號真偽。

採用40年班佛定律，從好友數、追蹤人數看出端倪

但Jen Golbeck認為：「還有一個更簡單的方法，能找出假帳號，」也就是班佛定律（Benford's Law）。班佛定律40年前興起，是指在日常生活的數據中，數字1到9出現的機率，以1最大，且隨著數字增長，出現機率遞減。

舉例來說，以1為首位數字的出現機率，約為30%，以9為首位數字的機率，則是4.6%。

於是，Jen Golbeck利用這個方法，從Twitter、臉書、Pinterest、Google Plus和LiveJournal等社群平臺中，找出帳號好友數和追蹤人數等數值分布，來核對是否符合班佛定律。

自掏腰包買轉推數，從中揪出俄羅斯假帳號軍團

為衡量班佛定律的符合程度，她採用卡方檢驗（Chi-square test）來檢測P值；如果P值小於0.05，就表示不符合班佛定律。

為展開研究，她自掏腰包，購買臉書和Twitter的讚數與轉推數，來轉推或按讚自己的貼文。她解釋，她先利用新設的帳號，發出無意義的貼文，比如只有一個數字，然後用買來的服務，來轉推或按讚這些貼文。

接著，她觀察，這些轉推或按讚的貼文中，有哪些陌生帳號也轉推或按讚。然後，她再分析這些陌生帳號及其追蹤者，來確認真偽。

在研究中，Jen Golbeck處理了數萬個帳號，「不出所料，幾乎所有帳號都符合班佛定律，只有100多個有問題。」

於是，她深入調查這100多個帳號，發現「除了1個是真人外，其餘都是一模一樣的俄羅斯機器人假帳號。」這些帳號隨機推文，內容不是從操作手冊節錄的句子，就是小說段落，「顯然由同一個演算法來控制。」

隨著進一步的調查，Jen Golbeck也發現，這些機器人，是一支俄羅斯假帳號軍團的一部分。她也在後來的幾年間，觀察這些機器人的行為。驚訝的是，這些行為模型並未改變。

「也許，這些機器人長期進行這些隨機、模擬人類的行為，是要讓自己的存在更合理，不被糾察系統抓到。」她推測，等到時機成熟時，其中幾個機器人帳號，也許會進行灌水、衝讚等行為。

而最好的解法，莫過於找出機器難以控制的行為特徵，來辨識帳號真實身分。

熱門新聞