深度 Big Data, Big Brother

數據工廠裏的標記員:我們訓練人工智能,直到它取代我們

人工智能高效工作的背後,有賴於海量的數據學習,而數據標註員則扮演了老師的角色——他們手把手地教 AI 辨別物件、表情和動作,直到有一天被 AI 取代。


據報導中國目前有10萬全職、近百萬兼職的數據標註員。他們和小說中的機器人護工一樣,為外表光鮮的科技付出密集、艱辛的勞動,輔助人工智能不斷地接近無人之境,換句話說——他們都在為那個終將對他們取而代之的力量服務。 攝:Gabriel/端傳媒
據報導中國目前有10萬全職、近百萬兼職的數據標註員。他們和小說中的機器人護工一樣,為外表光鮮的科技付出密集、艱辛的勞動,輔助人工智能不斷地接近無人之境,換句話說——他們都在為那個終將對他們取而代之的力量服務。 攝:Gabriel/端傳媒

在劉宇昆的科幻小說《機器人護工》裏,一個美國家庭買了台機器人(機械人)護工照顧年邁中風的父親。護工既細膩又強壯,它常常給老人讀報紙,也能輕鬆將行動不便的老人抱起,美中不足的是,它偶爾會出現 bug,比如:陪老人過馬路時粗心大意、散步時又會被松鼠和蜂鳥吸引……直到後來,老人發現機器人護工原來是被人工操控的——在美國與墨西哥邊境的一間工廠裏,操控機器人的墨西哥女孩們蝸居在一排排的小隔間裏,像不知疲倦的機器人一樣工作。

在北京海淀區一間提供數據服務的工廠裏,數據標註員林雪正坐在電腦前,用自己新學到的400多個標籤給世界分類,比如:瓶裝礦泉水的標籤是「水」,裝水的馬克杯則要標在「家具」門類下。

貼標籤的目的,是像教小孩一樣教人工智能看圖識物。林雪的工作是在一張圖上把桌子、板凳、沙發等都用框標出來,再註明它們的名字和類別。她和同事們要標註成千上萬張這樣的圖片,以供人工智能學習。而在見識了海量外形、材質各異的桌子後,人工智能便會「一眼」認出桌子來。

據諮詢公司賽迪顧問預測,2018年,中國人工智能市場規模將超過406億元人民幣。勃興的市場牽引著年輕的廉價勞動力蜂擁而入。據科技智庫「甲子光年」報導,中國目前有10萬全職、近百萬兼職的數據標註員。他們和小說中的機器人護工一樣,用密集、艱辛的勞動輔助人工智能一步步接近無人之境。他們是光鮮科技投射在地上的陰影,終有一天,他們服務的力量將對他們取而代之。

觸摸世界的政經脈搏
你觀察時代的可靠伙伴

已是端會員?請 登入賬號

端傳媒
深度時政報導

華爾街日報
實時財訊

全球端會員
智識社群

每週精選
專題推送

了解更多
Big Data Big Brother