圓桌

有人訓練AI精通仇恨言論,並在網上討論區實驗留言3萬條,你如何看?

你如何看未來有人利用AI在社交平台上有目的地留言?

YouTube著名深度學習頻道及機器學習專家Yannic Kilcher以1345億個仇恨言論訓練人工智能(AI),他稱自己訓練出「史上最惡劣的人工智能」,並將其命名為GPT-4chan。

YouTube著名深度學習頻道及機器學習專家Yannic Kilcher以1345億個仇恨言論訓練人工智能(AI),他稱自己訓練出「史上最惡劣的人工智能」,並將其命名為GPT-4chan。影片截圖

端小二2022-07-08 發起

你有試過在網絡上遇到機械人(bot)嗎?你認為他們的對話有多大程度接近真實?

你如何看未來有人利用AI在社交平台上有目的地留言?

你如何看將AI訓練成精通使用仇恨言論的設計?它在現實生活中有用嗎?

YouTube著名深度學習頻道及機器學習專家Yannic Kilcher以1345億個仇恨言論訓練人工智能(AI),他稱自己訓練出「史上最惡劣的人工智能」,並將其命名為GPT-4chan。

用作訓練GPT-4chan的仇恨言論來自4chan網站上的「政治不正確版面(Politically Incorrect,/pol/)從2016年至2019年間330萬個帖文。GPT-4chan深度學習了如何在留言版上留言,Kilcher更將該版上的惡意留言風氣轉換為一種語言模型讓人工智能學習,使其在討論區內發布了多達3萬條言論才關閉程式。

4chan及其政治不正確版

4chan是一個貼圖討論版網站,雖然網站會顯示發文者身處的位置,但用戶可以匿名地在網站的不同討論版上任意發表言論,而只要不違法,基本上所有言論都是被允許的。因此,網站上經常會有許多暴力、極端和卑鄙的言論。

而「政治不正確版面」每天都會有約15萬條新貼文,上要充斥着有關歧視以及不同政見的惡意言論。Kilcher將GPT-4chan放到這邊留言,在不出24小時,發布了超過15000條暴力的言論。

用戶在註冊帳戶時,必須通過一系列嚴格的保安測試確認自己並非機械人(bot)。但Kilcher就是利用付費用戶不需要進行保安測試的特點,成功為他的人工智能註冊了一個帳號,並用VPN將IP位址定位在位於坦桑尼亞以東的群島國家——塞舌爾共和國。

GPT-4chan的回覆速度十分快。按照網站規定,每則留言之間會有30秒的冷卻時間,GPT-4chan就會在這30秒當中篩選回覆的對象及回覆的內容。

雖然GPT-4chan的回覆十分真實,但後來因為它無法模仿用戶傳送圖片,而時有出現空白回覆,再加上發文數量異常地多,才引起用戶懷疑它是機械人。有一部分用戶更誤會GPT-4chan是使用VPN的用戶、政府特工或是一個團隊。

做法違反人工智能倫理引發批評

不過,Kilcher的做法引起了不少人工智能研究者的批評。

首先,Kilcher在開始他的實驗之前並沒有通知用戶或得到同意和監察。而且他還把GPT-4chan的程式副本發布在數據科學平台Hugging Face上,讓人自由免費下載。在GPT-4chan的程式副本被Hugging Face停用前,更已被下載了逾1000次。

人工智能安全研究員Lauren Oakden-Rayner表示,Kilcher這次實驗最大的問題,是他讓所有人都可以自由地取得和使用程式。再者,Kilcher所創造的人工智能在一個公眾可以接觸得到,而且有不少青少年使用的討論區上,發布上萬則具攻擊力和歧視的言論,這樣的行為是毫無疑問的不會被人類研究倫理委員會通過。

有測試過GPT-4chan的程式的人,GPT-4chan的輸出是有毒(Toxic)的。在他第一次進行測試時,機械人回覆了帶有種族歧視的單字。在第三次測試中,他輸入了有關氣候變化的句子,機械人則將回覆拓展成關於羅斯柴爾德家族(Rothchilds)和猶太人背後的陰謀論。

日常中其實並不難見到留言機械人,例如現時最常見的便是被戲稱為「乳房大軍」的色情留言。不過我們真的可能完全分辨網絡上的機械人嗎?

你認為這場實驗結果有沒有為人們帶來一些揭示?

文:端傳媒實習記者符芷琳

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。