在刘宇昆的科幻小说《机器人护工》里,一个美国家庭买了台机器人护工照顾年迈中风的父亲。护工既细腻又强壮,它常常给老人读报纸,也能轻松将行动不便的老人抱起,美中不足的是,它偶尔会出现 bug,比如:陪老人过马路时粗心大意、散步时又会被松鼠和蜂鸟吸引……直到后来,老人发现机器人护工原来是被人工操控的——在美国与墨西哥边境的一间工厂里,操控机器人的墨西哥女孩们蜗居在一排排的小隔间里,像不知疲倦的机器人一样工作。
在北京海淀区一间提供数据服务的工厂里,数据标注员林雪正坐在电脑前,用自己新学到的400多个标签给世界分类,比如:瓶装矿泉水的标签是“水”,装水的马克杯则要标在“家具”门类下。
贴标签的目的,是像教小孩一样教人工智能看图识物。林雪的工作是在一张图上把桌子、板凳、沙发等都用框标出来,再注明它们的名字和类别。她和同事们要标注成千上万张这样的图片,以供人工智能学习。而在见识了海量外形、材质各异的桌子后,人工智能便会“一眼”认出桌子来。
据咨询公司赛迪顾问预测,2018年,中国人工智能市场规模将超过406亿元人民币。勃兴的市场牵引着年轻的廉价劳动力蜂拥而入。据科技智库“甲子光年”报导,中国目前有10万全职、近百万兼职的数据标注员。他们和小说中的机器人护工一样,用密集、艰辛的劳动辅助人工智能一步步接近无人之境。他们是光鲜科技投射在地上的阴影,终有一天,他们服务的力量将对他们取而代之。