日報

人臉識別系統的「種族偏見」

與識別東亞人種的臉相比,西方開發的算法更加擅長識別白種人的臉,反之亦然。

端傳媒記者 张可

刊登於 2016-09-17

還記得去年紅極一時的“How-Old”測試嗎?這個由微軟公司架設在雲計算平台 Azure 上的網站,可以從用戶上傳的照片中辨識出人物臉部,然後判斷性別和年齡。

How Old 測試主頁。
How Old 測試主頁。

業內人士分析指,網站接收圖片後,首先會對人臉位置進行檢測,然後根據瞳孔、眼角、嘴角、鼻子等明顯會隨年齡變化的27個位置作出分析。但由於技術原因,網站的識別準確度並不高,甚至在一些用戶眼中淪為笑談。另有醫學界人士認為,這一系統判斷年齡的最重要依據是臉部皮膚,因此拍照時的光線等因素對測試結果影響極大。

已發展多年的人臉識別(Face Recognition)技術目前廣泛應用於數碼相機、智能手機、門禁系統、監控系統和網絡認證等領域。不過,美國執法部門用於追蹤犯罪分子的人臉識別系統也有類似“How-Old”的準確性問題,甚至被指存在「種族偏見」。

執法部門人臉識別技術的可靠性未經受過考驗。FBI 是從多個州和聯邦數據庫搜集照片的,因此要測試它的精準度十分複雜。

美國政府問責局(GAO)今年6月的一份報告

MIT 科技評論指,美國聯邦調查局(FBI)和各地警方等執法部門已經高度依賴人臉識別技術來協助犯罪調查,但這項技術目前並不完善,甚至存在「種族偏見」,進而導致抓錯人。不過,這種「偏見」並非有意為之,密芝根州立大學(Michigan State University)生物識別技術研究小組首席研究員 Anil Jain 指出,人臉識別算法的系統設計和訓練數據庫可能催生了種族偏見。

在進入實際應用前,識別程式首先會通過練習評估訓練數據來「學習」人臉識別,訓練數據來自具有不同面部特徵的照片庫。Jain 表示,如果某個性別、年齡或種族的人群在訓練時沒有提供足夠樣本,最終必定影響算法在識別這類人時的準確度。

圖為美國紐約,一個監視器設在一幅印有不同人臉的牆。
圖為美國紐約,一個監視器設在一幅印有不同人臉的牆。

Jain 及其團隊於2012年進行的一項研究顯示,美國司法行政系統所使用的某些人臉識別算法在識別女性、非裔人士和青少年時,準確率相對較低,原因就是訓練數據中沒有足夠的樣本來代表這幾類人。德克薩斯大學達拉斯分校(University of Texas at Dallas)面部認知研究實驗室首席研究員 Alice O’Toole 的研究結果也表明,與識別東亞人種的臉相比,西方國家開發的算法更加擅長識別白種人的臉,反之亦然。

Jain 表示,這些算法近幾年雖然在識別不同種族、性別的人臉時表現出的性能差異有所縮小,但由於測試信息的不足,人們仍然很難了解當今人臉識別算法性能的具體情況。他指出,即使是 Google 與 Facebook 開發的最先進的人臉識別深度學習(Deep Learning)系統,在訓練數據樣本分布不均時,仍存在較高的識別錯誤率。

今年6月,美國政府問責局(Government Accountability Office,GAO)發布的一份報告,指責 FBI 並未合理測試其使用的人臉識別系統的準確度。目前最先進的人臉比對系統在使用罪犯檔案照片庫時,可達到近95%的準確率,但這是理想情況下的結果——因為罪犯檔案照是在充分光照、正常表情等限定條件下拍攝的。

MIT 科技評論指,美國許多州的行政執法機關與其供應商之間,對人臉識別算法的使用協議也並不透明。密歇根州警察局數字分析和識別部負責人 Pete Langenfeld 表示,他所在的部門並未對人臉識別算法在特定人群的準確性方面進行測試,他也不知道該算法的供應商是否有進行過此類測試。

這一現狀導致美國執法部門在抓捕識別準確率更低的女性、非裔人士和青少年時,更容易犯錯,進而釀成大禍。

4.12
FBI 人臉識別系統共擁有至少4.12億張人像照片的檢索權限,其中只有3000萬張是嫌犯照片。

聲音

GAO 這份報告讓人非常擔憂,同時表明 FBI 對人臉識別技術的使用範圍遠遠超過之前人們想像。FBI 在對人臉識別技術使用上的審查力度不夠,無論是與 FBI 合作的其他執法機關,還是 FBI 本身,都沒有採取適當措施來確保這項技術的準確性。

美國參議員 Al Franken

FBI 利用駕照照片創建了一個全國性的生物識別數據庫,這是一件令人匪夷所思的事情。

美國喬治城大學法學院隱私與科技研究中心執行主任 Alvaro Bedoya

人臉識別

特指利用分析比較人臉視覺特徵信息進行身份鑑別的計算機技術。廣義的人臉識別實際包括構建人臉識別系統的一系列相關技術,包括人臉圖像採集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術或系統。(資料來自維基百科)

來源:MIT科技評論微軟

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。