AI也有性别和种族歧视？都是被人类教坏的

刊登于 2016-09-28

有研究指出AI正透过互联网学习，也学会了人类的种族偏见。 — 有研究指出，AI 在进行机器学习的同时，也学会了人类社会固有的性别歧视和种族偏见。

利用机器学习（Machine Learning）等数据处理方法，如今的人工智能（Artificial Intelligence，AI）程序已经可以模仿艺术大师画画、为政客撰写演讲稿、参与体育赛事报导，甚至担任创意总监、帮助医学研究等。这一领域的领军者 Google 旗下的 Deepmind 公司开发的 AlphaGo 程序更是力克人类顶级棋手，让人工智能成为全球瞩目的焦点，这一成果同样离不开电脑对人脑创造出的数据“不知疲倦”的学习过程。

然而，越来越多的科学家发出警告指，AI 程序不仅学会了人类的知识和技能，它们同时也在学习人类的刻板印象（Stereotype）和偏见（Bias），甚至已经被“教育”成性别歧视者和种族主义者。

机器学习在日常生活中无处不在，这类算法已经应用于智能手机助理、图片搜寻、餐厅推荐等等，它们依靠从海量数据中提取人类不可见的模式来分析信息。但是，当这些数据里蕴含了人类的社会偏见时，电脑程序也自然而然地学会了。
美国史丹福大学助理教授 James Zou

美国史丹福大学助理教授 James Zou 近日撰文指，机械学习算法就如同新生儿一般，人们让它一口气读完几百万本书，而无须从字母、单词和语法开始教学——这种“教学法”确实收到奇效，但同时也存在问题。

比如，在处理词汇时，这类程序通常只考虑词语之间的相关度，即不同的词被同时提及的概率。Zou 举例称，其研究团队利用 Google 新闻的数据训练了一个 AI 程序，然后发出询问“男人之于电脑工程师就如同女人之于什么”，它快速地说出了答案：“家庭主妇”。在他们的测试中，这类带有刻板印象的答案数不胜数。

AI 程序在涉及种族议题时同样带有“偏见”甚至“歧视”。普林斯顿大学科研团队通过对词汇分析 AI 程序 GloVe 的研究发现，该程序认为听起来像白人的名字和“欢乐”、“平静”等正面词汇更接近，而听起来像非裔人士的名字则和“苦恼”、“战争”等负面词汇更接近。

科技专栏作家 Nathan Collins 撰文指，这些结果并不意味着 GloVe 或类似的 AI 程序天生就存在偏见，而是因为人类的文化和语言中有偏见。普林斯顿大学科学家也表示，AI 程序其实是“从显示历史不公正的训练数据中，获取到的有害偏见。”

可喜的是，这种缺陷有望通过技术手段得以弥补。微软研究院与波士顿大学合作，利用“词嵌入”（Word Embedding）技术让程序通过寻找单词之间的关系来处理语言，他们发现该方法能够训练程序忽略单词之间的某些关联。比如，他们的算法经过调整后，能够去除“前台”和“女性”之间的关联，但同时保留“女王”和“女性”的关联。研究人员表示，这项研究的重要方向之一就是消除 AI 的偏见，并指出：“这是一项很微妙的工作，需要理解种族、民族和文化中的刻板印象产生的直接和间接的偏见。”

不过，在 AI 变得更智慧之前，类似算法中隐藏的偏见已经闯祸。MIT 科技评论指，美国联邦调查局（FBI）和各地警方等执法部门高度依赖人脸识别（Face Recognition）技术来协助犯罪调查，但这项技术同样有着“种族和性别歧视”——这些算法在识别女性、非裔人士和青少年时的准确率相对较低，原因就是训练数据中没有足够的样本来代表这几类人。这一现状导致执法部门在抓捕女性、非裔人士和青少年时更容易犯错。

声音

人工智能有望改变我们的生活，它其实已经引导了我们的购物方式、约会方式、导航、投资甚至更多。为了确保它能做的更好，我们所有的从业者需要走出自我限制，变得更有包容性。我们需要对到底是什么让我们成为了人类保持敏锐的意识，特别是微妙的、隐藏的东西。
Spare5 公司 CEO Matt Bencke

人们对现代科技持乐观态度，部分原因在于大家相信这是一种民主化力量——不被人类长时间学到的狭隘偏见所限制。但是最新研究发现，这只是海市蜃楼般的假象……我们从周围的世界学到偏见，AI 从我们身上学到偏见。
科技专栏作家 Nathan Collins

所有技术都会反映造物者的价值观，假若我们没有谨慎对待机器学习，那么我们创造出来的人工智能就会变成社会的缩影，一个被隐藏无数偏见却不自知的社会缩影。
品玩网编辑杜莉莉

机器学习

Machine Learning，是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜寻引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机械人等领域。（资料来自维基百科）

来源：The Conversation、每日邮报、Tech Crunch

本刊载内容版权为端传媒或相关单位所有，未经端传媒编辑部授权，请勿转载或复制，否则即为侵权。

AI也有性别和种族歧视？都是被人类教坏的

声音

机器学习

延伸阅读

如何让AI安全可靠？Google列出了需要注意的五大问题

防止人工智能成为人类“终结者”，Google提出“红色按钮”机制

企业应该为使用机器人缴税吗？欧盟正在考虑这件事

人脸识别系统的“种族偏见”

Google即时通讯应用 Allo 可以帮你聊天，他们觉得这一市场即将迎来突变