在網絡留言板就公共事務進行討論正變得日益困難,層出不窮的粗言穢語及網絡打手(編註:指受僱於特定的國家機關或企業,通過偽裝成普通網民,在網頁評論或論壇中發帖、回帖等對他人施加影響的人)的惡意騷擾讓許多人或一時激憤而「以暴制暴」,或擔心招致粗暴攻擊而放棄在網絡空間表達不同意見。對於鼓勵用戶更多參與討論的網站管理者而言,雖極力想避免「提供」這樣糟糕的用戶體驗,多數也只是收效甚微地增加人手予以引導。但真的別無良策嗎?
2月23日,Google 母公司 Alphabet 旗下的技術孵化公司 Jigsaw 宣布,他們與 Google 的反濫用技術團隊合作開發了名為“Perspective”的人工智能工具,將可以幫助新聞機構和在線內容發布平台識別出網站上那些「不堪入目」的留言,自動刪除或者實時反饋給管理者處理,為用戶創造更好的在線交流氛圍。
新聞機構通常鼓勵用戶參與與內容相關的討論,但往往發現通過排查數百萬條評論以找到那些惡意挑釁或辱罵言論,需要投入大量的人力、資金和時間,有的網站甚至因此關閉了評論功能。但這顯然不是理想的解決方案,我們認為機器學習技術可以幫助他們解決這一難題。
據 Google 官方網誌介紹,Perspective 是一種應用程式介面(API),使用機器學習模型來分析用戶留言對討論可能產生的影響,並按照「有毒」程度給出評分。Jigsaw 公司總裁 Jared Cohen 透露,Perspective 之前已經在紐約時報與維基百科進行過數月的測試,收集了數十萬條評論作為機器學習的培訓材料。而就在最近,英國媒體《經濟學人》和衞報也簽署了試用自動化審核工具的協議,以期更好地管理他們的評論區。
Jigsaw 產品經理 CJ Adams 則表示,該公司計劃將這項技術推廣到所有平台,但他沒有確認是否包括 Facebook 和 Twitter 等大型社交媒體。
去年美國總統大選之後,圍繞線上不當資訊的爭論久久不息,多國政府要求網絡公司對其平台上的言論承擔更多責任。在此之前,業績每況愈下的 Twitter 就已經決定進一步打擊網絡暴力,他們同樣宣稱將結合人工審查與機器學習技術遏制其平台上的仇恨言論與濫用行為。
而早在去年5月,包括 Google、Facebook、Twitter 和微軟在內的美國科技公司,就已經與歐盟達成了「反恐行為守則」協議,承諾在24小時內「審查大多數」被標記的仇恨言論,如有必要將立即刪除。
來源:財富、路透社、金融時報、TechCrunch