还记得去年红极一时的“How-Old”测试吗?这个由微软公司架设在云计算平台 Azure 上的网站,可以从用户上传的照片中辨识出人物脸部,然后判断性别和年龄。
业内人士分析指,网站接收图片后,首先会对人脸位置进行检测,然后根据瞳孔、眼角、嘴角、鼻子等明显会随年龄变化的27个位置作出分析。但由于技术原因,网站的识别准确度并不高,甚至在一些用户眼中沦为笑谈。另有医学界人士认为,这一系统判断年龄的最重要依据是脸部皮肤,因此拍照时的光线等因素对测试结果影响极大。
已发展多年的人脸识别(Face Recognition)技术目前广泛应用于数码相机、智能手机、门禁系统、监控系统和网络认证等领域。不过,美国执法部门用于追踪犯罪分子的人脸识别系统也有类似“How-Old”的准确性问题,甚至被指存在“种族偏见”。
执法部门人脸识别技术的可靠性未经受过考验。FBI 是从多个州和联邦数据库搜集照片的,因此要测试它的精准度十分复杂。
MIT 科技评论指,美国联邦调查局(FBI)和各地警方等执法部门已经高度依赖人脸识别技术来协助犯罪调查,但这项技术目前并不完善,甚至存在“种族偏见”,进而导致抓错人。不过,这种“偏见”并非有意为之,密芝根州立大学(Michigan State University)生物识别技术研究小组首席研究员 Anil Jain 指出,人脸识别算法的系统设计和训练数据库可能催生了种族偏见。
在进入实际应用前,识别程式首先会通过练习评估训练数据来“学习”人脸识别,训练数据来自具有不同面部特征的照片库。Jain 表示,如果某个性别、年龄或种族的人群在训练时没有提供足够样本,最终必定影响算法在识别这类人时的准确度。
Jain 及其团队于2012年进行的一项研究显示,美国司法行政系统所使用的某些人脸识别算法在识别女性、非裔人士和青少年时,准确率相对较低,原因就是训练数据中没有足够的样本来代表这几类人。德克萨斯大学达拉斯分校(University of Texas at Dallas)面部认知研究实验室首席研究员 Alice O’Toole 的研究结果也表明,与识别东亚人种的脸相比,西方国家开发的算法更加擅长识别白种人的脸,反之亦然。
Jain 表示,这些算法近几年虽然在识别不同种族、性别的人脸时表现出的性能差异有所缩小,但由于测试信息的不足,人们仍然很难了解当今人脸识别算法性能的具体情况。他指出,即使是 Google 与 Facebook 开发的最先进的人脸识别深度学习(Deep Learning)系统,在训练数据样本分布不均时,仍存在较高的识别错误率。
今年6月,美国政府问责局(Government Accountability Office,GAO)发布的一份报告,指责 FBI 并未合理测试其使用的人脸识别系统的准确度。目前最先进的人脸比对系统在使用罪犯档案照片库时,可达到近95%的准确率,但这是理想情况下的结果——因为罪犯档案照是在充分光照、正常表情等限定条件下拍摄的。
MIT 科技评论指,美国许多州的行政执法机关与其供应商之间,对人脸识别算法的使用协议也并不透明。密歇根州警察局数字分析和识别部负责人 Pete Langenfeld 表示,他所在的部门并未对人脸识别算法在特定人群的准确性方面进行测试,他也不知道该算法的供应商是否有进行过此类测试。
这一现状导致美国执法部门在抓捕识别准确率更低的女性、非裔人士和青少年时,更容易犯错,进而酿成大祸。