圓桌

英美利用大數據作家庭虐童預測,是否一個好方案?

近40萬人數據被用於構建算法以預測虐童概率,如何平衡可能造成的貧困或種族歧視與政府效率?

英國五個城市用大數據識別哪些家庭可能出現虐兒情況。

英國五個城市用大數據識別哪些家庭可能出現虐兒情況。攝:Fairfax Media via Getty Images

端小二2018-09-19 發起

利用算法對家暴紀錄、藥物濫用紀錄、兒童上學出勤率等特定指標分析進行虐童概率的預測,是個好的辦法嗎?

支持者認為這提高了政府資源使用效率,反對者則表示可能造成貧困及人種歧視的蔓延,且預測效率成疑,你怎麼看?

《衛報》日前指英國有至少五個城市引入用於兒童保護的數據分析預測系統,至少37萬人的數據被收集以對可能發生的虐童進行提前預測。早前,美國伊利諾州(Illinois)、緬因州(Maine)等地也進行了算法預測虐童的計劃,但同時,預測系統也引發隱私權及貧困或種族歧視的爭論。

英國地方政府在財務壓力下準備開發利用算法預測虐童概率的系統,以便可以更有效地集中資源進行干預。目前,已知至少有五個英國城市開始實施算法預測虐童的系統,有至少377,000人的數據被錄入不同的預測系統中。

Hackney和Thurrock聘請私營公司Xantura為其城市開發預測模型,Newham和Bristol則選擇內部自主研發,Brent開發的系統則主要針對幫派活動對青少年虐待的預測。

在Hackney和Thurrock,Xantura的系統主要通過對對家庭數據的運算來發出警告訊號,並將為何該家庭超過風險值的報告給社會工作者以進行必要的準備或行動。《衛報》獲得的一份合同顯示,最初被考慮納入預測模型的政府數據有:上學出勤率、開除紀錄、住房維修及欠款數據、反社會行為和家庭暴力的警方記錄,其中,拖欠房租及健康數據等部分數據類型最終被排除。

Hackney政府表示,此系統已生成350個風險警報,而在Thurrock則產生了300個,兩市區均聲稱其軟件的準確率約為80%。

事實上,在美國伊利諾州(Illinois)也曾進行過類似的計劃,他們與Eckerd Connects及Mindshare Technology兩間機構合作,對所轄地區各家庭中父母的年齡、過去的犯罪紀錄、家中濫用藥物的證據或是否存在外遇等數據進行分析,為兒童受虐待概率進行運算。然而他們在去年年底中止了這個計劃,經過運算,超過4,100名兒童受傷或死亡的概率高達90%以上,過於龐大的數字使預測失去了評估價值,而與此同時,不少兒童虐待事件在預測系統中並未發出警告。

與此同時,這樣的算法預測系統同樣引起了人們對個人隱私和歧視問題的爭議。英國負責管理個人數據使用的信息專員辦公室(ICO)表示,他們將詢問政府數據使用情況,以確保他們遵守數據保護法。然而,歧視問題則引起更大的爭議。

英國虐童預測系統的支持者們認為,算法可以讓政府的有限資源使用得更有效率,並可以幫助他們在悲劇發生前就及時採取行動。美國伊利諾州(Illinois)的技術支持者也認為,在孩子受傷前及時干預是政府的義務。

然而,反對者們則警告表示,這些系統可能會包含設計者的偏見,在無任何公眾監督的情況下,可能會使過去的刻板印象和歧視持續存在,尤其是可能會對貧困家庭等弱勢群體過度採樣。

倫敦大學學者Michael Veale便以公立學校和私立學校舉例表示,私立學校可能會被預測虐童概率小,但其實並不能保證私立學的孩子不會被家庭虐待。「當你預測這些事件時,往往會得到誤報,若你想確保不會錯過任何一個處於風險中的孩子,那麼你就需要廣撒網。」

事實上,在美國伊利諾州(Illinois)對預測系統的反對者也同樣提到,算法可能會著重觀測貧困及有色人種兒童,其若替代有經驗的兒童福利專業人員直接進行判斷,則不可避免造成偏見和歧視。

利用算法對特定指標分析進行兒童遭虐待概率的預測,是個好的辦法嗎?

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。