短视频前业者自述:用户数据像小圈子里的秘密,告诉一人,所有人都会知道

用户数据非常宝贵,但如果政府要,就一定要给。
2020年7月18日,中国江苏两位主播通过tiktok live出售小龙虾。
大陆 大数据 科技 隐私与安全

继在印度遭封禁后,拥有逾8亿全球活跃用户的TikTok又在美国收到“最后通牒”——限时90日内剥离其美国业务。困于中美两国摩擦中的TikTok亦在隐私问题上备受关注。今年1月,软件公司 Check Point 称,TikTok存在安全漏洞,黑客可入侵账户删改内容,并盗取用户电子邮件等私密资料,TikTok后表示已修复。就在2019年底,中国大陆明星李小璐和PGone的视频在未经创作者发布的情况下流出,亦引发了公众对用户隐私安全的担忧。

像TikTok这样的短视频网站后台,究竟是如何运转的?平台员工是否可以看到短视频草稿箱的内容并下载?为何类似内容在不同平台上频频出现?所谓的爆款内容又是如何炮制的?曾在中国大陆某短视频平台做运营的谭成(化名),在行业保密协议失效后,讲述了其在工作中看到的用户隐私保护乱象。以下是谭成的口述:

我第一次对个人隐私有印象是大二,大概10年前。在搜索网站实习的一位师兄回来告诉我们,一定要保护好电话号码,他根据我的电话找到了几天前的网购记录。

那个师兄所有社交媒体的账号都用太空卡,东西都不存网上。他离职的时候特地找了隐私部门的人,请对方把自己在数据库中的信息删掉。

这些事情你知道后会有两种心态,第一种是你会佛(注:网络用语,指无所谓),我那些可以看到后台的前同事就是这样;第二种是你觉得很可怕,但其实对于我们这种已在互联网留下很多痕迹的人来说,已经没太多可掩盖的了,只能说尽可能保护吧。

短视频大工厂:“大家会以为这个账号是真的”

短视频运营中,一个很重要的部分叫影子账户。

之前有人爆料说,其他平台上的信息被移植到了马蜂窝(注:大陆旅行论坛)上,其实这个事情太常见了,大家用爬虫技术建立影子账号(Shadow User)抢用户,互相爬来爬去,已经是一个业界行规。

在大多数UGC(注:用户生产内容)的互联网平台,用户会被分为自然用户和影子账号,自然用户一般仅占20%左右,占30%的已算很高了。互联网产品的一个衡量标准叫在线时长,就是一个人每天多少时间用这款产品。你每天除了吃饭、睡觉、正常工作之外,还剩多少时间能让这么多产品瓜分?

2020年2月15日,乘客在印度孟买火车站月台使用智能手机。
2020年2月15日,乘客在印度孟买火车站月台使用智能手机。

影子账户分内部影子和外部影子。外部影子就是其他类似产品的内容,比如视频行业有Instagram、抖音、Youtube、快手、bilibili等,还有一些国外你根本就不知道是什么名字的产品,内部影子则是平台不同地区的内容循环使用,比如韩国的同事觉得中国某账号不错,就复制到韩国区。

我们的后台很复杂。运营的页面有一些标签或账号,可以看到所有视频,旁边会分内部影子、外部影子。运营可以全选视频,直接点击生成一个影子账号,每一个视频又可以再编辑——换音乐、背景、重新编辑描述,及为账号上传头像。

影子账号的复制大致分三种。第一种是账号直接复制,原账号及内容会直接复制成另一个影子账号;第二种是将一个原账号内容分散至其他不同假帐号;第三种是集合同类型内容制作一个假账号。

运营团队会告诉技术人员要爬哪些账号和视频。在批量复制和搬运前,这些视频会先被机器过滤,去掉原平台logo,以及在中国——一些政治信息不能出现,在不同国家色情暴力的限制也都不一样。

在短视频行业,很多人都在做这样的工作,即使是一个中高层的运营也会做,这就是短视频生产的一个大工厂。这在短视频产品冷启动时期是非常惯用的方法,从最开始创造出一种繁荣的景象。而平台的增长,就是通过这些方式吸引用户,让自然用户的比例增大,但影子账户依旧存在。

一个非常好的运营,一天能做1000个假的“原创”视频,甚至很多可能都再编辑过,换个封面、加个标签,你在后台可以看到所有的操作信息和视频所有的数据。

于是,一个越南用户在Instagram上发的舞蹈视频,因为(和中国人)相貌相似,经过爬虫复制和再编辑音乐后,可能就变成了一个抖音中国账户的内容。被复制的内容下也会有很多评论、点赞和转发,一些是机器操作的,还有一部分可能是真人——因为大家会以为这个账号是真的。无论博主还是评论,你都不知道账户背后的控制者,也许是机器,也许是运营的人,也可能是自然用户。

一些用户也会喜欢自己的账号被复制,因为脸是不变的,无论哪个平台,大家会看到我的脸,我就在火。我们也不会复制很火的账号,会做的一般是一些中部偏上或是中部质量的,没什么影响力又有一小批粉丝的18线网红是最容易被复制的。如果他自己发现了没有异议就OK,我们不会主动去说。有异议的就投诉。

运营与审查:“你看到的每一条都不是偶然的”

所有你能看到的视频内容,只是说符合这个平台露出规律的内容,在这之前都有一个漫长的过程——审核和运营。一个短视频平台中国国内区可能审核就上百人,也有很多外国人,因为如果做海外,你可能听不懂他们在说什么。

审核会分好几道,机器先过至少2道或3道,筛选掉比如暴力色情、视频质量过低,也会监测原创,有个最基本的版权保护。机器之后是人工审核,在人手比较紧缺的时候,我们每个人都要去做。

人工审核每个人每天别的都不做,就只审视频。一页20个视频,一个人一天至少也得审二、三十页。审核团队是有绩效指标的,每天会规定你审核多少视频,而审核完的视频到运营又被打掉了多少,这就是审核团队的绩效。

审核并不是删除,其实是一个流量池里“踩”的概念,或者是隐藏。传统的网络里面也不存在删除这个概念,是抹不掉你痕迹的,只不过是你自己看到和没看到的区别而已。在后台,点入用户个人页面下就会知道哪些是用户删的,哪些是运营踩的。

2020年7月24日,北京,戴著口罩人们在电影放映前观看智能手机。
2020年7月24日,北京,戴著口罩人们在电影放映前观看智能手机。

一个视频被生产出来之后,就会先到一个大的流量池,审核会降低或隐藏曝光,通过审核的就在流量池里慢慢攀升,到达热门的位置,运营如发现它热门的原因是色情暴力,会重新打到池子里,如果觉得它没有攀升潜质,也会打回去。从这里面其实还会衍生出来一个精品池的概念,如果你是个新注册用户,进来我让你看到的全部都是热门视频里表现在头部的。这些阅读量也不一定是真的,它可能是运营给你布置的,这样你可以在流量池中更靠前,但随之你真实阅读量也会增加。

短视频的运营,就是评估网站视频里,有哪些是应该加推动顶到热门的,有哪些让它自然增长的,有哪些是想做广告曝光的。运营会决定视频的曝光率,你看到的每一条都不是偶然的。

增加曝光是后台的运作,可能就加了1万的流量,一个视频在整个供应流(注:用户看到的视频推荐界面)里面的排序就会靠前。目前的供应流,一种是每条信息的位置都有固定价格,需要广告商对位置竞价。另一种是根据你的注册信息评估你可能会喜欢看什么,根据以前你喜欢过什么视频推荐,以及我运营就是觉得这个视频好,想让你看到,加曝光然后把它插到你的供应流里面。同时,用我们自己软件制作的视频,获得的曝光会更高。另外还有一些视频或内容网站会在供应流里加一个类别——“我的关注”。

此外我们也会有策划,和媒体讨论发稿是一样的,所有的短视频平台都在想办法靠近或生产热点。

比如一些很火的神曲,他要成为一个流行的前提,就是很多人跟风或模仿。短视频公司有研发部门,人不多但都非常高学历,他们的工作就是研究音乐库,判断这些歌曲可能会给人的情绪带来什么样的波动,怎么影响人的心理,并考察歌曲的曲调和节奏与以前的流行歌之间有没有相通之处,来判断这个歌曲如果被接入到平台,成为一个人人都可以用的背景音乐,有没有可能爆,这是一个非常完备的流程。

再比如手机上每天发的推送,这也是有运营设置和数据驱动的。我之前跟研发部门提的需求是想提升我推送的量,过两天他们告诉我,你的这个国家在几点到几点发推送是最有效的,以及你推送的标识设成紫色的背景,会比设成红色的背景点击率高,这都是可以被精细化地运营到极致的。

短视频公司同样有政治任务,会有要求你生产某一个政治任务类型的视频,甚至有一些政府活动,也会要求有视频策划,比如我向国旗敬个礼、和国旗合照等。还有国旗的表情包,或《我爱你中国》的音乐,其实就是一个政治任务,它只是用这种方法去嵌入到短视频,让你不自觉地接受,觉得他就是个功能,但其实每个功能背后都是有原因的。

隐私黑洞:“隐私条款的结果,很多时候不是被保护了,而是你的隐私被让渡了”

如果没有接触过,超级大后台可能是非常难想像的一件事,所以它的权限挺严格的。它很多区块必须是你的账号有权限才能登录,而且只能用公司电脑登录,或者需要密钥,你离开了你的座位就需要关掉后台。但你接触过,就对能看到用户已删除或未发布的视频,并且还能把它下载下来,不会觉得奇怪,因为他是个太基础的功能。

用户后台页面,除头像等基本信息之外主要分两部分,第一部分是用户的所有信息,第二部分是用户所有的视频。

用户信息里,有手机号、地理位置、IP地址、设备信息等。你只要开了定位,或只要使用了设备联网,我就一定会知道你人在哪里。

在第二部分,点入到单个视频的时候,会看到上半部分是视频的信息(视频、拍摄设备、地点等),底下是所有运营操作痕迹,比如一审减了11万次曝光,二审顶了多少次曝光,运营在哪一天几分几秒,由谁操作,推到了热门,你全部都可以看到详细信息。

任何一个视频只要点击就可以直接从后台下载,下载后可从电脑里导到其他地方,要不要复制和发布,完全是看你个人的素质,没有人查,没有人审。我当时都经常下一些小动物的短视频给伴侣看,因为觉得很可爱。

2013年9月11日,苹果公司员工示范使用手机内置的指纹扫描功能。
2013年9月11日,苹果公司员工示范使用手机内置的指纹扫描功能。

所以明星李小璐和PGone的草稿箱视频在后台被看到太正常了,被人下载下来当然是不道德,但也是一个没什么门槛的事。这个事情焦点也不会在平台上,可能有人会小小问一下,但很多人其实已经习惯了自己隐私泄露的状态,所以很快就过去了,没有人会去想说短视频后台是一个多么强大的后台,你为什么能看到这些信息、下载这些信息。

其实隐私安全是很难保证的,这个世界上没有一个公司有义务或是好处,主动为你保护它。用户数据就像一个在小圈子里讲的秘密一样,你只要告诉了一个人,所有人都会知道。还有一个比较黑客的东西,其实应该是推荐和算法里面会看到,就是你手机的相册信息和听筒。

在一些购物软件里,比如我们聊到登山鞋,它有我的麦克风权限,当你打开软件的时候就会发现给你推荐了登山鞋。还有可以读取相册,比如你今天在相册里面存了一个咖啡杯,打开软件就会看到推荐咖啡杯,这已经不是特例了,盗取你的隐私是无孔不入的。

还有一些输入法,不管你登陆不登陆,其实你打字的数据都会被记录,被记录就被上传了。而网站的Cookie,无论你接受不接受,都会记录,我追踪这个信息问你同不同意,并不代表在其他层面我没有追踪你的信息,可能其他层面我根本就没问你。

一些社交媒体的隐私设置是有很细的项目可以管理的,比如“广告偏好”,看起来像只是决定你的广告而已,但其实点进来就会发现,感情状况、教育等所有的信息都跟你的隐私相关。进一步,你可能关了你所有隐私权限,但会允许对方根据你发布的贴文向你推送合适的广告,这本身就已经在让渡你的隐私权了,因为其实你并不知道所用软件广告供应的第三方是谁,你的数据会被提供给哪个供应商,不然为什么一些大社交平台年年因为个人隐私的事被告。

此外,你还需要选是不是同公司另一个平台可以看到你发布的信息,也就是说A可能会依据你在A旗下B的使用情况来推送广告。这些设定是特别细的,可能有一些默认都是开的。

所以基本上你要想让一个APP不去搜集到你的信息,其实是要做很多努力的。

新华社的视频编辑部有一个超级账号,权限跟我们运营的权限是一样的,可以随便查看和使用我们短视频库里面的视频。

至于说隐私条款修改,是法务要求必须给普通用户看的,但跟具体的一线工作人员是没什么关系的。首先那些条款,你绝大多数情况下也不会一条条看,都直接点击同意了。同时,所有法务都会把它再编辑成对平台最有利的。从修改条款到一线人员遵守条款,这中间是一个太长的链条。

而且隐私条款绝大多数情况下,其实是政府对平台的限制,所以你会看到隐私条款的后果,很多时候不是你的隐私被保护了,而是你的隐私被让渡了。

比如说,它要求你要绑定手机,甚至身份证号码。其实坦白讲,对于平台来说,你的手机号、身份证信息,对我们意义不大,我们不需要知道,需要知道的那个东西,叫用户画像。我需要知道你今年多大年龄,平常喜欢什么,平常还看什么APP,你会在什么时间打开手机,你用的设备是什么系统,你使用什么语言,你平常在哪发视频。

互联网公司的用户数据,其实是非常宝贵的,不会轻易让渡给其他公司,但如果政府要的话,就是一定要给。

我后来无意中在我们的系统里发现了一个项目,是新华社的视频编辑部有一个超级账号,他们的权限跟我们运营的权限是一样的,也就是他可以随便查看和使用我们短视频库里面的视频。

残酷观看

促使我辞职的一件事,是2018年底加州大火,当时有很多视频,研发部门的人就来找我,说可以去做这些视频的片段,推给另一个地区的人,他觉得流量一定会很高,因为这个事情很有噱头。当时我就很委婉地跟他说,这个视频他们不一定喜欢,然后他跟我说,看美国加州这些有钱人的房子被烧,难道不开心吗?

整个运营生产链完全没有任何道德和伦理可言,但身在其中的大部分人不会觉得这是问题,整个团队里好像就我一个人觉得很痛苦。我觉得短视频很可恶一点是,它剥夺了那些智识和机会本就相对缺乏的人、可以用来提升自我的时间,让你越来越接受这个现状。那些送外卖的人、小贩,他们时刻都拿着短视频在刷。

而且,有一些视频能带来很大流量的原因,不是因为这个事情有多牛逼,而是它很残酷。

我看过一个建筑工地小哥健身的视频,很火,但你会发现他身上所有的劳保装备都是不合格的,工地乌烟瘴气;还有一个农村的小男孩,他用所有捡来的废品给自己搭了个架子鼓,然后还特别酷;那个大概四五岁的小男孩给更小的孩子拿大铁锅做饭的视频,也特别火。但我会觉得很难受,他们没有得到正当教育,在世界上任何一个对儿童保护稍微好一点的国家,这样做饭的视频是要犯法的,是要报给警察机关去查的。

事实上,短视频平台是有这个数据,可以很快追踪到具体地点,但没有人做。

在这个行业里面,流量导向、热点导向、噱头导向,会让你整个人理解事情的逻辑完全错乱和扭曲。很多人在社会中应得到价值认可的机会被剥夺了,他们原本可以像多年前的苏珊大妈(Susan Magdalane Boyle)一样,但如今只能在短视频里,当一个那么多流量的人。

读者评论 21

会员专属评论功能升级中,稍后上线。加入会员可阅读全站内容,享受更多会员福利。
  1. @Dandirion 還有一本書willpower doesn't work 也是批判所謂的自制力論點,認爲人的行爲受制於環境,因此改變環境即可改變生活。

  2. 配合著中共治下,就是進一步討道德淪喪了

  3. 好文章!

  4. 被短视频展现出来的现实很残酷,所以不被展现出来、不被看到就万事大吉了吗?莫不是因为老爷心善见不得穷人。
    所谓自我提升的时间被短视频所占所以使底层打工者麻痹并安于现状的说法,也是十分地何不食肉糜。使残酷现实持续的,决不是她们「自我提升」志向的缺乏,也不是因为少了想处于不同现状的欲望和决心,这是稍微站在对方角度上考虑就能十分清楚的事情。
    新华社的后台账号很有意思。

  5. 後面的反思是數位落差。
    對於個資外泄,真正關鍵的是掌握這些資訊的政權如何使用,是否保障人權。現代社會的每個人都如同透明人,有效防止資訊繼續泄漏的就盡可能努力去防吧。

  6. 這篇真是好文,而且非常重要。端主編有考慮開放給公眾嗎?

  7. 影音平台背後的大方向,可以任人操縱的權限才叫人可怕。明白受訪者最後的慨歎,重點在於有大數據不是應該改進貧苦大眾的權利嗎?

  8. 好文,但希望內容能再多經過點整理和潤飾,而不是幾乎像逐字稿一樣。

  9. 好文章,我觉得字节比任何其他互联网公司都更受我党重视,因为头条和抖音分别掌控了不同阶层人的信息获取方式,或者说洗脑的途径,这也是我最看不起字节的地方,腾讯和阿里好在还有一些服务,字节只有洗脑

  10. 短视频就是劣币驱逐良币,我一直当检索工具用
    但是很容易沉迷的

  11. 我很认同 @Dandirion 的看法,我们应当基于「人」的角度去设计、评价和修改我们所创造和使用的一切「工具」,而不应当用「工具」为标准去衡量——或者说去考验一个「人」的自制力。要让工具去适应人,而不是人去适应工具。

  12. 个人觉得大众对隐私的丧失有些后知后觉,生活中其实早已无隐私可言,我从没相信过任何国内隐私保护条文。
    08年高中时候,就听闻2007年我们学校有学生因印了一批带反日情绪口号的tshirt,被国安局某些部门直接找上了门,不过情节不重,批评教育了事而已。
    大学时候谈恋爱,我十分确定ex通过他在公安局的关系查过我的开房记录,好笑的是婚姻关系那是都没有全国联网,一个江苏地级市的小派出所却可以查远在北方的我;同时我的亲属还有好友的爸爸,也都分别通过公安局的关系查过他们孩子的交友情况。好友爸爸查出她的ex父亲进过监狱,当时父女几近闹翻。加上我们搞语言处理的小圈子传说的一些“用安徽全省的电话记录训练语音识别模型”,还有无处不在的图像识别... 进入中国,已经没有隐私可言。更不用提2015年《国安法》了。
    自由的思想不能公开表达,时刻被监控,已经没有隐私可言。如今这些app对隐私的侵犯,围绕着的是流量即金钱;实际头脑一早就被盯住,如今只是加上钱包也被人剖开罢了。在现实的prc,此题无解。

  13. 私隱就像是美女的裙底春,男士們都知道不應看但人人都想看,而且能賣錢呢。

  14. 這篇好文章 謝謝端

  15. 端好像把評論他人留言的功能關掉了對嗎

  16. @sjl 的观点很有代表性,其中的核心预设是「有人天生就没有自制力」。这也是很难直接与用户对话 make a change 的要因。但事实果真如此吗?到底什么是自制力?停下来想想,至少能明白这个预设是值得推敲的。
    据我所知,以神经科学为基础的研究已经否认了这一点,研究支持自制力是可塑的。面向大众的内容可见基于哈佛公开课的书籍《自制力》(Possessiveness)。
    从教育学的角度而言,有一组概念值得更多人关注:固定思维 vs 成长思维。鸡汤地说,前者认为一切都已经注定,我们什么都改变不了,因此选择回避困难与挑战,觉得输了是很丢脸的事。后者则认为自身可以改变,失败意味着有不足、可改进,从而拥抱挑战。
    以上是对事实的甄别与探讨,是极其耗时耗力的。而且若我没有相关知识,还会落得一个「你也否认不了我,所以我说的有道理」的「下」场。但我认为这已经偏题太远了。简而言之,如今,以「为你好」之名的言说必然遭受「凭什么听你的」之抵触。有历史原因,也是伦理道德研究面临的挑战。
    既然「为你好」是偏题的角度,那切题的角度是什么?我认为,若是以「他开心我开心有什么不好」为幌子去行动,便是有意无意忽视两个「开心」的区别,是罔顾他人幸福。既然都是开心,那二者对调生活,愿意吗?以此判断,我认为虽粗暴但有效。这是谎言,是自欺。
    无论是不是短视频受众,无论是不是运营或开发,没人乐意生活在谎言中,没人乐意生活在自欺里。我想,这应当能作为一处共识。
    世界快速发展,事物的复杂性隐没了直观的善恶判断,人们要做什么只需要一个说得通的理由,而要否认什么却要面对各个层面甚至是不相关的扯皮辩论。我不时感慨「鲜有人会把自己当成是文革中的红卫兵」,但愿自己能真的别成为某种红卫兵。

  17. 很残酷。这些高科技新贵和赌场叠码仔没有什么区别,只不过后者被视为偏门黑道,而前者确一副翩翩君子模样,成为各国领导人的座上宾。在我们沉醉于科技改变世界的兴奋感中,却不愿思考这一切都建立在什么基础之上。互联网不是法外之地,这句话应该施加在互联网的运营者与内容提供者,而非使用者身上。我们需要更加严格的隐私法律去规范它们的行为。本文将矛头指向Tik Tok,但这绝不意味着其他互联网企业就与此无关。我们需要警惕的甚至不仅仅是隐私问题,巨无霸的Google,Facebook们在各自领域的垄断甚至超过了洛克菲勒的年代。洛克菲勒毫无疑问是个伟大的慈善家,他是个好人,但他的石油公司需要分成七家。现在是分拆Google的时候了吗?你想好怎样分拆它了吗?

  18. 好文章,謝謝端。

  19. 好文,不过作者认为让人上瘾的产品剥夺了他人不多的学习时间,但是这部分人要么是没兴趣学习,要么是没有钱学习,现代社会让人上瘾的产品那么多,游戏,电视剧,小说,没有自制力的人,即使没有短视频产品也不会去学习的. 不过互联网公司的逻辑确实是简单粗暴的把人物化为数据,多数人会对具体的个体产生同情,但是却很难对数据化的群体产生负罪感.