圆桌

有人训练AI精通仇恨言论,并在网上讨论区实验留言3万条,你如何看?

你如何看未来有人利用AI在社交平台上有目的地留言?

YouTube著名深度学习频道及机器学习专家Yannic Kilcher以1345亿个仇恨言论训练人工智能(AI),他称自己训练出“史上最恶劣的人工智能”,并将其命名为GPT-4chan。

YouTube著名深度学习频道及机器学习专家Yannic Kilcher以1345亿个仇恨言论训练人工智能(AI),他称自己训练出“史上最恶劣的人工智能”,并将其命名为GPT-4chan。影片截图

端小二2022-07-08 发起

你有试过在网络上遇到机械人(bot)吗?你认为他们的对话有多大程度接近真实?

你如何看未来有人利用AI在社交平台上有目的地留言?

你如何看将AI训练成精通使用仇恨言论的设计?它在现实生活中有用吗?

YouTube著名深度学习频道及机器学习专家Yannic Kilcher以1345亿个仇恨言论训练人工智能(AI),他称自己训练出“史上最恶劣的人工智能”,并将其命名为GPT-4chan。

用作训练GPT-4chan的仇恨言论来自4chan网站上的“政治不正确版面(Politically Incorrect,/pol/)从2016年至2019年间330万个帖文。GPT-4chan深度学习了如何在留言版上留言,Kilcher更将该版上的恶意留言风气转换为一种语言模型让人工智能学习,使其在讨论区内发布了多达3万条言论才关闭程式。

4chan及其政治不正确版

4chan是一个贴图讨论版网站,虽然网站会显示发文者身处的位置,但用户可以匿名地在网站的不同讨论版上任意发表言论,而只要不违法,基本上所有言论都是被允许的。因此,网站上经常会有许多暴力、极端和卑鄙的言论。

而“政治不正确版面”每天都会有约15万条新贴文,上要充斥着有关歧视以及不同政见的恶意言论。Kilcher将GPT-4chan放到这边留言,在不出24小时,发布了超过15000条暴力的言论。

用户在注册帐户时,必须通过一系列严格的保安测试确认自己并非机械人(bot)。但Kilcher就是利用付费用户不需要进行保安测试的特点,成功为他的人工智能注册了一个帐号,并用VPN将IP位址定位在位於坦桑尼亚以东的群岛国家——塞舌尔共和国。

GPT-4chan的回复速度十分快。按照网站规定,每则留言之间会有30秒的冷却时间,GPT-4chan就会在这30秒当中筛选回复的对象及回复的内容。

虽然GPT-4chan的回复十分真实,但后来因为它无法模仿用户传送图片,而时有出现空白回复,再加上发文数量异常地多,才引起用户怀疑它是机械人。有一部分用户更误会GPT-4chan是使用VPN的用户、政府特工或是一个团队。

做法违反人工智能伦理引发批评

不过,Kilcher的做法引起了不少人工智能研究者的批评。

首先,Kilcher在开始他的实验之前并没有通知用户或得到同意和监察。而且他还把GPT-4chan的程式副本发布在数据科学平台Hugging Face上,让人自由免费下载。在GPT-4chan的程式副本被Hugging Face停用前,更已被下载了逾1000次。

人工智能安全研究员Lauren Oakden-Rayner表示,Kilcher这次实验最大的问题,是他让所有人都可以自由地取得和使用程式。再者,Kilcher所创造的人工智能在一个公众可以接触得到,而且有不少青少年使用的讨论区上,发布上万则具攻击力和歧视的言论,这样的行为是毫无疑问的不会被人类研究伦理委员会通过。

有测试过GPT-4chan的程式的人,GPT-4chan的输出是有毒(Toxic)的。在他第一次进行测试时,机械人回复了带有种族歧视的单字。在第三次测试中,他输入了有关气候变化的句子,机械人则将回复拓展成关于罗斯柴尔德家族(Rothchilds)和犹太人背后的阴谋论。

日常中其实并不难见到留言机械人,例如现时最常见的便是被戏称为“乳房大军”的色情留言。不过我们真的可能完全分辨网络上的机械人吗?

你认为这场实验结果有没有为人们带来一些揭示?

文:端传媒实习记者符芷琳

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。