人臉辨識對女性、深色人種辨識較差，微軟與IBM著手改進

圖片來源:

微軟

麻省理工學院媒體實驗室（MIT Media Lab）的研究人員Joy Buolamwini今年初曾公開批評，人臉辨識技術可能因為所使用的資料集及建立演算法的條件而造成偏差，例如辨識男性比辨識女性準確，辨識白人又比辨識黑人準確，而微軟與IBM則不約而同地在本周祭出改善人臉辨識偏差的措施。

MIT媒體實驗室測試了來自微軟、IBM與中國曠視（Megvii）的人臉辨識系統，卻發現這些系統辨識淺色人種性別的能力大過於辨識深色人種的性別，而辨識度最差的則是深色人種的女性。

其中，微軟在周二（6/26）宣布已更新該公司的人臉辨識技術，大幅強化系統辨識基於各種膚色之性別的能力。

微軟數位顧問服務技術長John Roach認為，在辨識深色皮膚的女性上有較高的錯誤率突顯了整個產業的挑戰—人工智慧技術只能跟用來訓練它們的資料一樣好，假使人臉辨識系統要對所有人類一視同仁，那麼所用來訓練的資料集就應該要能代表各式各樣的膚色、髮型、珠寶或眼鏡。

於是微軟與專家合作以企圖解決偏差及公平的問題，改善了性別分類系統，以讓所有膚色在性別辨識上都能有更好的結果，現在的新系統在辨識深色皮膚性別的錯誤率降低了20倍。

另一方面，IBM也同意人臉辨識的偏差來自於訓練系統缺乏不同的數據，因此決定在今年秋天公開釋出釋出兩個資料集供科技產業與研究社群使用。

其中一個是含有100萬張影像的人臉屬性與身分訓練資料集，它會同時被標註屬性與身分，利用Flickr影像的地理標籤來平衡來自不同國家的數據，還有主動學習工具以減少樣本選擇的偏差。目前全球最大的人臉屬性資料集只含有20萬張影像，且只單獨供應屬性或是身分，IBM的新數據集除了資料量更為龐大之外，還能將屬性與個人配對。

另一個資料集則包含了3.6萬張的人臉影像，且均勻分配在不同的種族、性別與年齡，此一多元化的資料集將可供人們評估自己的技術，或是協助演算法的設計者辨識及解決其人臉辨識系統上的偏差。

熱門新聞