大陆深度

数据工厂里的标记员:我们训练人工智能,直到它取代我们

人工智能高效工作的背后,有赖于海量的数据学习,而数据标注员则扮演了老师的角色——他们手把手地教 AI 辨别物件、表情和动作,直到有一天被 AI 取代。

据报导中国目前有10万全职、近百万兼职的数据标注员。他们和小说中的机器人护工一样,为外表光鲜的科技付出密集、艰辛的劳动,辅助人工智能不断地接近无人之境,换句话说——他们都在为那个终将对他们取而代之的力量服务。

据报导中国目前有10万全职、近百万兼职的数据标注员。他们和小说中的机器人护工一样,为外表光鲜的科技付出密集、艰辛的劳动,辅助人工智能不断地接近无人之境,换句话说——他们都在为那个终将对他们取而代之的力量服务。摄:Gabriel/端传媒

端传媒记者 吴婧 发自北京

刊登于 2018-05-22

#Big Data Big Brother

在刘宇昆的科幻小说《机器人护工》里,一个美国家庭买了台机器人护工照顾年迈中风的父亲。护工既细腻又强壮,它常常给老人读报纸,也能轻松将行动不便的老人抱起,美中不足的是,它偶尔会出现 bug,比如:陪老人过马路时粗心大意、散步时又会被松鼠和蜂鸟吸引……直到后来,老人发现机器人护工原来是被人工操控的——在美国与墨西哥边境的一间工厂里,操控机器人的墨西哥女孩们蜗居在一排排的小隔间里,像不知疲倦的机器人一样工作。

在北京海淀区一间提供数据服务的工厂里,数据标注员林雪正坐在电脑前,用自己新学到的400多个标签给世界分类,比如:瓶装矿泉水的标签是“水”,装水的马克杯则要标在“家具”门类下。

贴标签的目的,是像教小孩一样教人工智能看图识物。林雪的工作是在一张图上把桌子、板凳、沙发等都用框标出来,再注明它们的名字和类别。她和同事们要标注成千上万张这样的图片,以供人工智能学习。而在见识了海量外形、材质各异的桌子后,人工智能便会“一眼”认出桌子来。

据咨询公司赛迪顾问预测,2018年,中国人工智能市场规模将超过406亿元人民币。勃兴的市场牵引着年轻的廉价劳动力蜂拥而入。据科技智库“甲子光年”报导,中国目前有10万全职、近百万兼职的数据标注员。他们和小说中的机器人护工一样,用密集、艰辛的劳动辅助人工智能一步步接近无人之境。他们是光鲜科技投射在地上的阴影,终有一天,他们服务的力量将对他们取而代之。

阅读全文,欢迎加入会员

华文世界不可或缺的深度报导和多元声音,了解更多

立即订阅

已经订阅?登入

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。

延伸阅读