日报

AI也有性别和种族歧视?都是被人类教坏的

刊登于 2016-09-28

有研究指出AI正透过互联网学习,也学会了人类的种族偏见。
有研究指出,AI 在进行机器学习的同时,也学会了人类社会固有的性别歧视和种族偏见。

利用机器学习(Machine Learning)等数据处理方法,如今的人工智能(Artificial Intelligence,AI)程序已经可以模仿艺术大师画画为政客撰写演讲稿参与体育赛事报导,甚至担任创意总监帮助医学研究等。这一领域的领军者 Google 旗下的 Deepmind 公司开发的 AlphaGo 程序更是力克人类顶级棋手,让人工智能成为全球瞩目的焦点,这一成果同样离不开电脑对人脑创造出的数据“不知疲倦”的学习过程。

然而,越来越多的科学家发出警告指,AI 程序不仅学会了人类的知识和技能,它们同时也在学习人类的刻板印象(Stereotype)和偏见(Bias),甚至已经被“教育”成性别歧视者和种族主义者。

机器学习在日常生活中无处不在,这类算法已经应用于智能手机助理、图片搜寻、餐厅推荐等等,它们依靠从海量数据中提取人类不可见的模式来分析信息。但是,当这些数据里蕴含了人类的社会偏见时,电脑程序也自然而然地学会了。

美国史丹福大学助理教授 James Zou

美国史丹福大学助理教授 James Zou 近日撰文指,机械学习算法就如同新生儿一般,人们让它一口气读完几百万本书,而无须从字母、单词和语法开始教学——这种“教学法”确实收到奇效,但同时也存在问题。

比如,在处理词汇时,这类程序通常只考虑词语之间的相关度,即不同的词被同时提及的概率。Zou 举例称,其研究团队利用 Google 新闻的数据训练了一个 AI 程序,然后发出询问“男人之于电脑工程师就如同女人之于什么”,它快速地说出了答案:“家庭主妇”。在他们的测试中,这类带有刻板印象的答案数不胜数。

AI 程序在涉及种族议题时同样带有“偏见”甚至“歧视”。普林斯顿大学科研团队通过对词汇分析 AI 程序 GloVe 的研究发现,该程序认为听起来像白人的名字和“欢乐”、“平静”等正面词汇更接近,而听起来像非裔人士的名字则和“苦恼”、“战争”等负面词汇更接近。

科技专栏作家 Nathan Collins 撰文指,这些结果并不意味着 GloVe 或类似的 AI 程序天生就存在偏见,而是因为人类的文化和语言中有偏见。普林斯顿大学科学家也表示,AI 程序其实是“从显示历史不公正的训练数据中,获取到的有害偏见。”

可喜的是,这种缺陷有望通过技术手段得以弥补。微软研究院与波士顿大学合作,利用“词嵌入”(Word Embedding)技术让程序通过寻找单词之间的关系来处理语言,他们发现该方法能够训练程序忽略单词之间的某些关联。比如,他们的算法经过调整后,能够去除“前台”和“女性”之间的关联,但同时保留“女王”和“女性”的关联。研究人员表示,这项研究的重要方向之一就是消除 AI 的偏见,并指出:“这是一项很微妙的工作,需要理解种族、民族和文化中的刻板印象产生的直接和间接的偏见。”

不过,在 AI 变得更智慧之前,类似算法中隐藏的偏见已经闯祸。MIT 科技评论指,美国联邦调查局(FBI)和各地警方等执法部门高度依赖人脸识别(Face Recognition)技术来协助犯罪调查,但这项技术同样有着“种族和性别歧视”——这些算法在识别女性、非裔人士和青少年时的准确率相对较低,原因就是训练数据中没有足够的样本来代表这几类人。这一现状导致执法部门在抓捕女性、非裔人士和青少年时更容易犯错。

4
根据分析公司 Quid 的研究数据,在2015年,AI 企业的投资成本创下85亿美元的记录,这一数字大约为2010年的4倍。

声音

人工智能有望改变我们的生活,它其实已经引导了我们的购物方式、约会方式、导航、投资甚至更多。为了确保它能做的更好,我们所有的从业者需要走出自我限制,变得更有包容性。我们需要对到底是什么让我们成为了人类保持敏锐的意识,特别是微妙的、隐藏的东西。

Spare5 公司 CEO Matt Bencke

人们对现代科技持乐观态度,部分原因在于大家相信这是一种民主化力量——不被人类长时间学到的狭隘偏见所限制。但是最新研究发现,这只是海市蜃楼般的假象……我们从周围的世界学到偏见,AI 从我们身上学到偏见。

科技专栏作家 Nathan Collins

所有技术都会反映造物者的价值观,假若我们没有谨慎对待机器学习,那么我们创造出来的人工智能就会变成社会的缩影,一个被隐藏无数偏见却不自知的社会缩影。

品玩网编辑杜莉莉

机器学习

Machine Learning,是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜寻引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机械人等领域。(资料来自维基百科)

来源:The Conversation每日邮报Tech Crunch

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。

延伸阅读