评论读书时间互联网政治

演算法比你更了解你自己

我们任由各种科技公司的数据团队收集、分析反应我们行为的资料,然后呢?

克里斯汀 · 鲁德(Christian Rudder)

刊登于 2016-05-07

#互联网政治#互联网#读书时间

【编者按】你用淘宝购物吗?你用支付宝理财、支付吗?你有微信钱包吗?你用博客来和亚马逊买书吗?我们早已习惯了在网路上的一举一动都会被记录下来。科技公司的技术团队已经成了最了解人类行为的一群人。深具侵略性的科技产品让我们对隐私的界定范围不断模糊。

克里斯汀 · 鲁德(Christian Rudder)毕业于哈佛大学数学系,交友网站OkCupid的共同创办人,他结合大数据分析技术与领域知识,分析线上交友网站的第一手资料和深度的文字探勘(text mining),写成这本《我们是谁?大数据下的人类行为观察》(Dataclysm: Who We Are, When We Think No One's Looking)。

以下是这本书的最后一章:数位面包屑。在分分秒秒的活动中,我们留下的个人讯息琐屑决定了我们是谁。演算法、大数据要退让到什么位置我们才感到舒适、安全?

脸书按赞的模式可以透露个人隐私。

脸书(Facebook)2009年启用“赞”(like)的按钮,改变了人们分享内容的 方式。这并不是脸书新创的想法,像是曾经风靡一时、现在人气 不再的 digg.com 和 del.icio.us 这些网站,多年前就已经引进了让人对文章按“赞”的功能。

然而,当时这些公司看重的是“内容”,脸书则是以强大的社群网络为基础,内容创作者能以轻松简单的方式,让所有人用那个小小的大拇指图样,对他们的作品表达喜欢。

这等于是创造了一种新的通用小货币:脸书对你写的文章、做的音乐之类并不会付什么钱,但却能让你享有获得肯定的兴奋,也能和朋友分享你做的一切。截至2013年5月,脸书每天有45亿个“赞”,而根据当年9月的报导,从开始到当时已累积了1.13兆个“赞”了。

这等于是创造了一种新的通用小货币:脸书对你写的文章、做的音乐之类并不会付什么钱,但却能让你享有获得肯定的兴奋,也能和朋友分享你做的一切。

在脸书新增按赞功能的同一年,麻省理工学院的学生开发出他们的同志雷达软体。这套演算法很能推断男性的性向,但其实道理也很明显:大家都猜得到,男同志就是比较容易有男同志的朋友。所以,这项同志雷达的创新之作,就是用宏观层面的资料,来做一些我们自己早就会私下做的事情。

在这之后,各种预测软体的能力突飞猛进;随著有愈来愈多资料可用,这种程式只会变得更快、更强大。到2012年,英国某团队已经发现,只 要从一个人按赞的资料,就能在以下主题得到相对的猜测准确率:

按赞的模式透露出你是什么样的人

再次强调,这里并没有看任何近况更新、评论、分享,或是任何用户自己打的字,完全只是看按赞的情况而已。等到你发现,居然有人只要从滑鼠(鼠标)点点点这档事,就能知道你爸妈在吵架,便晓得科学已经到了一种前无古人的境界了。甚至,一个人按赞的模式还能拿来预测智商:这个模型能够精准预测某人的标准智商测验得分,而且一个问题都不用问。

一个人按赞的模式还能拿来预测智商:这个模型能够精准预测某人的标准智商测验得分,而且一个问题都不用问。

这一切的根据不过就是脸书三年间取得的用户资料,而这些用户在之前几十年,都是活在没有脸书的情境之下。如果有人是 从小就玩脸书,情况又可能如何呢?

这就是纵向资料的黑暗面 (否则平常我是很爱纵向资料的)。雇主、学校和军方早就在用迈尔斯-布里格斯(Myers-Briggs,性格分类指标)和史丹佛- 比奈(Stanford-Binet,智力量表)之类的测验,你坐下来、尽力 表现,然后他们就依结果将你分类。在大多数情况下,你能够选择是否要加入。

然而现在逐渐演变成,你不过在过自己的生活, 就等于是在参加这些测验了。而且,整个结果大剌剌地摆在那里,任何人都能阅读判断。在面试之前,看到某个人的 Klout 分数是51分之类,这是一回事,但居然能知道他的智商,这又是另一回事了。

如果雇主开始运用各种演算法,推断你有多聪明或你是否在用药,你唯一的选择,就是要设法能够操纵这套系统,或者借用上一章的话,也就是“管理你的品牌”。

要打败机器,你就得像是台机器,但这也代表已经输给机器了。

要打败机器,你就得像是台机器,但这也代表已经输给机器了。而且,前提还是你有办法先猜测到自己该如何表现。你绝对想不到,在这个研究里,和智商最相关的就是会对“薯圈圈”(curly fries)按赞,谁可能倒推得出来啊。 然而,即使脸书对你知之甚详,仍然比较像是个“工作上的朋友”:虽然相处的时间很长,彼此关系还是有明确的界线。

脸书知道的就是你在脸书上的资料,但还有很多其他情况对你的了解更深入。如果你有一台 iPhone,苹果就会知道你的通讯录、行事历、照片、简讯、文字、你听了什么音乐、去了什么地方,而且因为手机有一个小陀螺仪,苹果连你走了几步都一清二楚。没在用 iPhone 吗?把“苹果”换成“谷歌”、“三星”、“威讯电信” (Verizon),结果也一模一样。

你戴 Nike 的运动手环 FuelBand 吗?Nike连你睡得好不好都知道。你买了Xbox One吗?微软知道你的心跳率。你用信用卡吗?只要你在零售店买了东西,你的个人识别资讯(PII)就会将统一商品代码(UPC)连结到在客户关系管理(CRM)软体里你的客户编号(ID),而这套软体就开始计算你下一个可能想买的东西是什么。 这只是整个企业资料现况的一瞥,想要完整叙述,得花上许多页才写得完。

至于政府的情况,由于政府只有透露部分,我们也就只知道片段。但我们确实知道的是,英国上下总共有590万部监视器,等于每11个英国人就有一部。

而在曼哈顿,光是在 14 街以南,就有 4,176 部。至于在城市道路以外的部分,则由卫星和无人飞机来补全。虽然我们不知道这些监视器究竟看了 些什么,但应该可以肯定的是:只要政府对你有兴趣,你一定难逃法眼。

除此之外,正如揭露美国政府秘密监听计划的爱德华 · 斯诺登(Edward Snowden)所透露,很多政府无法从监视器上看到的东西,仍然能好整以暇地从国安局内部网路(NSANet)终端机的荧幕上轻松取得,而这个地点是个机密。 正因为有太多事情发生,而公众又知道得太少,一般人对资 料的理解,必然与真实状况有极大落差。

《我们是谁?大数据下的人类行为观察》(Dataclysm: Who We Are, When We Think No One's Looking)

出版时间:2016年5月
出版社:马可孛罗文化
作者:克里斯汀 · 鲁德(Christian Rudder)
译者:林俊宏

我不得不说,光是因为放下手边的工作来写这本书,我敢肯定自己就已经落伍了。在许多方面,“分析”已经超越了资讯本身,成为真正的关键。目前得到最多媒体关注、也是最讨人厌的资料收集者,就是网路浏览器里的 cookie,还有那些盗窃信用卡号的骇客。然而,这种人拿到的其实也只是你生命的一小部分,而且他们还得先费尽千辛万苦才行。

不论他们的 JavaScript 写得多狡猾,基本上他们还是那种默片里的二流小坏蛋,留着小胡子、戴着高帽子的那一种。或者打个比较现代的比方:他们就像是《王牌大贱谍》系列里那个 白白胖胖的邪恶博士(Dr.Evil),根本整个世界都是他的人质, 但他居然只勒索个一.百.万美元,而真正能赚到几十亿美元的幕后头目,则是像 Acxiom 这样的资料公司。

这些企业资料行销业者,能够取得银行和刷卡纪录、零售购买纪录,以及像是纳税纪录之类的政府档案,他们对于人类行为的了解,远远超越了任何在网站上找模式的学者。

这些企业资料行销业者,能够取得银行和刷卡纪录、零售购买纪录,以及像是纳税纪录之类的政府档案,他们对于人类行为的了解,远远超越了任何在网站上找模式的学者。同时,各种国安机制所带来的种种资源和专业知识,则会让一般企业等级的资料探勘(data-mining))软体像踩地雷小游戏一样可笑。

我们损失了隐私,换回的是什么 ?

虽然我们用了“探勘”这个比喻,但资料其实并不是什么天然资源;资料必然有个源头,而这个源头就是你。政府和各家公 司,都在收集你私人生活的各个小部分,并且试图把它组回成一 个能够让他们利用的完整图像。

你丧失的隐私愈多,他们就能做得愈有效率。而任何对于隐私的讨论,最后的根本问题就在于如何妥协:你损失了隐私,能得到什么?我们总是在计算该如何妥协:公众人物出卖了自己的私人生活,好换取职涯上的进步。你想要订欧洲青年旅馆或买印度火车票的时候,也得想想要不要多花点钱,让自己多点隐私空间。

而和主题也相关的是,许多男女晚上出门的时候,也会让裙子变短一点、让衣服紧身一些,透过放弃一点隐私,换取一些注意的目光。所以,交换妥协这件事由来已久,但这里真正与过去不同之处,是妥协的对象及条件。

对象是企业时,除非你是想研究相关议题的经济学家,否则企业使用资料后对我们的好处并不明显。理论上,有了使用者资料,企业可以让广告更有针对性,也就是可以少浪费一些行销费用,商品价格也就能更低。至不济,公司如果将这些资料出售换得收入,就能免费提供某些对消费者真正有用的服务(例如脸书和谷歌)。

至于对象是政府的时候,我们让政府窥伺隐私,能得到的好处就没那么单纯了。 有了监视器,真的让我们更安全吗?各种安全监控,是不是 我们的保护毯?至少,自2001年以来,就未曾发生针对美国平民的恐怖攻击了(至少不是由大型恐怖组织所发动)。

这不能说没有意义,特别是对纽约人而言。然而,光是“没有发生”可 能不够有说服力。除非我们能够确知究竟阻止了哪些攻击,而不是本来就空穴来风,否则我们实在很难相信政府的说词。

就像德州的沙尘暴一样,许多与“九一一”事件相关的记忆已经逐渐远去, 但用颜色编码的“威胁等级”仍被不断提起,总让我觉得像是特地在为油田服务公司哈里伯顿(Halliburton,于伊拉克战争中获利颇丰)打广告。

政府认为人民不用什么都知道,抱着一种“你有需要知道的时候再说”的原则,实在很难令人相信所得到的资讯。于是,人民开始愈来愈注意政府发言的动机,而不是内容。 不论如何,我其实不知道国安局的各种大动作,究竟曾经阻止了多少犯罪,甚至是否曾经阻止任何犯罪。

政府只说了一切成功, 但并未透露时间、地点或方式。 在达不到理想之后,全面监控机制对于那些无法阻止的犯罪 行为,在破案时倒是大显神威。像是波士顿马拉松爆炸案,就是由安全监视器协助破的案,2005年的伦敦地铁爆炸案也是如此。 特别是在非同步犯罪中,犯罪分子遂行犯行后,要再过一段时间才会出现受害者,于是更需要有完整的资料才能追查。

而在这些调查中,媒体大声赞扬情报资讯的力量,这个监控国家一时也走路有风。这种资料用法目的明确,况且在地上还流着血的时候, 也不会有人去计较隐私/保护之间该如何平衡。

但每次呼喊“团结就是力量”之际,很多时候我们还是得靠着斯诺登这种吹哨者 (whistle-blower,指基于公益挺身揭弊的机构内部人员),才能知道政府究竟知道些什么。

国家安全局是美国政府的信号情报(signals intelligence)单位,而他们要找的信号,就在我们的资料里。我认识一些国安局的人。前面提过,我是数学背景,在哈佛拿的学位。虽然全系同学的大学毕业证书表面看起来没什么两样,但数学系其实分成两种人。

我这种人,就只是喜欢数学,而且程度还算不错。至于另一种人,则是神人等级的超级专家。大一有一堂高阶的“数学 25”,当时的我就已经没资格修了;而从这堂课上,还会再把超级精英抽出来,由系上特别邀请去修另一堂“数学 55”。

对那些真正的数学家来说,我修过最难的那些课,他们多半直接免修跳 过。在我修的高阶课程里,很多时候是由助教上课,他们还得打 所有成绩。这些助教常常比我年轻(有一个才十六岁),而且明明还是青少年,就已经开始读非常艰深的研究所课程。

我还记得,修到实变函数论(Real Analysis)的时候我很兴奋(而且感 觉真是一大挑战),但当时许多同侪(如果我还配称得上是他们的同侪)可能都觉得这实在像国中的课一样无聊。

现在我每次听到“国安局”,就会让我回想起那些日子,因为他们招的就是那另一种神人。 我会指出这一点,是因为很多人似乎不把政府人员看在眼里,说他们是官僚,只会盖章,认为只要一般民间资料分析公司 的人就能胜任那些工作。

然而这些在监控我们的人,可是非常非常聪明。我们可以希望他们能像过去的费曼和爱因斯坦一样,处理工作时不仅识见卓绝,还带着充满关怀的人性,不过我们能够肯定的是,他们正如过去的费曼和爱因斯坦,手上的工作具备了非人的巨大威力。

然而这些在监控我们的人,可是非常非常聪明。我们可以希望他们能像过去的费曼和爱因斯坦一样,处理工作时不仅识见卓绝,还带着充满关怀的人性,不过我们能够肯定的是,他们正如过去的费曼和爱因斯坦,手上的工作具备了非人的巨大威力。

有了演算法,还必须吃资料,而如斯诺登所透露,美国国安局可是像吃了超级食物一般。又或者说......他们其实是所有食物来者不拒。国安局会收集电话、电子邮件、简讯、照片,基本上 所有电子资讯都难逃掌握。显然,这里不是被动运作。

根据一份 流出的文件显示,他们最高的明文目的就是“掌控网路”。这项专案居然敢讲得如此直言不讳,也算令人佩服。斯诺登首批揭露 的文件中(由《卫报》和《华盛顿邮报》共同揭露),有一个关 于“棱镜计划”(PRISM)的简报档。这些简报可是毫不拐弯抹角:

可以看到,这里的资料简直无所不抓。一方面,配枪的人忽然开始对我们的脸书帐号感兴趣,对大家来说可不是什么好事。 但另一方面,看到他们做简报居然用的是微软的绘图工具,又觉得实在也没什么好怕的。

正因为棱镜计划深具侵入性,如果没有法院命令,无人有权查阅棱镜计划所得到的个人资料,至少理论上如此。其他的监控机制则主要针对后设资料(metadata),也就是各种通讯留下的痕迹。

以下是美国官方的隐私与民权监督委员会(Privacy and Civil Liberties Oversight Board)对于另一项计划的描述:

国安局 215 条款(Section 215)专案监控数百万个电话号 码,记录所有收发话纪录,包括通话长度,以及确切的通话时间为当日何时。国安局若锁定某电话号码进行分析,所有 和该号码有接触的电话,以及再与这些号码有接触的号码, 都会一样遭到监控、收集相关资料。

在此必须先声明,这里的监控完全不包括任何通话的实质内容。在这方面,其实和本书用的资料没有太大不同。不论我们或是这些人,都是只讲趋势、不讲个人。而同样根据他们所言,在国安局,要等到你的通话网路符合所谓的“威胁”模式,他们才会真正开始密切注意。

然而,虽然后设资料属于间接,但侵入性并不见得就比较小。 只要有心想跟踪,其实大家都会留下一些意想不到的资讯面包屑。本书到目前就已经提过许多例子,即使如此,还有许许多多我们没谈到的追踪方式。

例如,不管是高端的单眼相机,或甚 至只是你的 iPhone,所有数位相机拍摄的照片都会附加一个小小 的 Exif 档,里面除了记录拍摄时间,还有其他各种琐碎资料,例如光圈、快门速度,通常还有拍摄时的经纬度。

有了 Exif 档,就能让像是 iPhoto 这些程式轻轻松松将照片依“时刻”(Moments) 和地点排序,也能在地图上用小小的大头针图示显示你去过哪里。

然而,Exif 会泄露的可不只如此。以 OkCupid 的个人档案照片为例,愈好看的照片,愈有可能是很久很久以前拍的。换句话说,大家找到一张“好看的照片”之后,常常再也不换。

我们之所以知道这种事,也是因为 Exif 能告诉我们照片的拍摄时间。类 似这样的附加资料其实很常见,像是你每次打开哪个最爱的应用程式,GPS 座标就已经在一旁待命。

几乎你载入的每个网页,页边都藏着几十个只有一个像素的图像(就只是一个透明的点), 在载入“真正的”网页时,记录你的造访;这些像素并不知道你在做什么,只知道你造访的时间、地点。

但光是这样,就已经能让背后的公司对于你整个人的基本资料拥有满准确的猜测。 如果有人就是不想分享这些资料,该怎么办?会不会有些 人,就是宁愿自己去买东西、自己开心过日子?我本身很重隐私,老实说,有部分也是因为如此,我不太迷任何社群媒体,也从来不会把女儿的照片放上网路。

我是在2011年初开始用 Instagram,只把它当成网路相簿应用程式在用,当时这家公司还不大,而且我主要就是为了那些滤镜效果。我当时还以为这就像是摄影软体 Hipstamatic,没什么社群功能(我知道,这让我听起来完全像个老头)。等我太太发现她那老古板的先生在做什么之 后,她告诉我可以把帐户与其他人的帐户连结,而我也照做了, 因为不过就是点个按钮嘛!

但等到我发觉这不只是我和我自己的照片之后,忽然觉得 Instagram 失去了所有的吸引力。 会像我这样闭俗的人并不多。虽然人人都说担心,但大多数用户对于隐私其实没那么在意。

每次脸书又更新服务条款,把触手往我们的资料探得更深,民众会怒个一天,但隔天还是继续上脸书,就像是如果去戳一下蜂巢,发怒的蜜蜂一涌而出,但发现找不到人叮之后,就会乖乖再回巢。

每次脸书又更新服务条款,把触手往我们的资料探得更深,民众会怒个一天,但隔天还是继续上脸书,就像是如果去戳一下蜂巢,发怒的蜜蜂一涌而出,但发现找不到人叮之后,就会乖乖再回巢。

因为科技就是会这样不断步步进逼,而人类则是不断退缩,让现在的软体几乎都深具侵略性。譬如有些应用程式管的是减肥,有的管心跳率,甚至还有 “帮我的打扮打分数”的应用程式,把自己的打扮穿着上传网路,让大家为你提出时尚建议。女性也用各种应用程式来预测和管理自己的月经周期,珍娜 · 沃瑟姆就写道:“市场充斥此类软体,我认识的几乎每个女人都用。”

......

然而,就算有一些(甚至不少)人并不在意隐私问题,我还是不希望有任何人会因为这本书而使身分曝光。前面已经提过, 这里的分析都经过匿名,只做整体呈现,而且我处理原始资料也很小心,资料中绝无任何个人识别资讯(PII)。

而讨论到用户所发表的文字时(包括个人自我介绍、推特文字、近况更新、按赞等等),使用的都是公开的内容。至于用到用户个别纪录的时候,则是会将用户帐户名(ID)加密。

而且在任何分析中,资料范围都只列出必要的变项,避免能够回推到任何个人。 当然,我从来没想过要将资料回推到个人,而是要将资料连 结到整体所有人。这正是我在资料里看到的价值,也就是以隐私换取而来的价值:让我们能够从中学习。

这正是我在资料里看到的价值,也就是以隐私换取而来的价值:让我们能够从中学习。

微软研究院的资讯科学家贾伦 · 拉尼尔(JaronLanier)曾著有《谁拥有未来?》(Who Owns the Future?),他最近在《科学人》(Scientific American)杂志写道:“有极大量关于我们私人生活的资讯,正在储存、分析以及使用,希望未来能展现实际用途。”

我认为他讲到“极大量” 绝对没错,但最后一句却有问题。任何东西,不都是“希望未来能展现实际用途”吗?研究科学这件事,最重要的就是为了探索。铁矿石原本也只是石头,直到有人开始尝试。面包上的霉菌几千年来都只会让人生病,直到亚历山大 · 弗莱明(Alexander Fleming)发现也能做成盘尼西林。

图为一群记者正在使用电脑。

发挥资料正面的力量

目前,资料科学已经取得许多重大研究结果,不只能够描述、更能够改变人们的生活方式。我在前面已经提过了谷歌流感趋势,自从2008年推出之后,现在已经在超过25个国家上线,追踪疫情。虽然这项工具还不完美,但至少是个开端,各种资料结合之后,现在甚至能用来预防疾病,而不只是减轻疾病危害而已。

正如《纽约时报》去年的报导:“微软、史丹佛和哥伦比亚大学的科学家,运用谷歌、微软和雅虎搜寻引擎的搜寻查询资料,已经首次能够领先美国食品药物管理局的警示系统,找出处方药物不为人知的副作用。”

研究人员发现,帕罗西汀 (paroxetine)和普伐他汀(pravastatin)会造成患者血糖升高。在这里,牺牲一点生活上的隐私,换来活得多一点健康。 目前看来,似乎每天都有一点新进展。像是今天,我就发现 了一个叫做 geni.com 的网站,打算运用群众外包的力量,画出全人类的家谱。

如果成功,这家公司基本上就是为人类遗传物质画 出一个社群网络。上周,两位政治科学家则是推翻了一种大家常有的误解:以为共和党之所以能在众议院占多数,靠的是在画选 区的时候动手脚(gerrymandering)。

这两位作者用模型测试了全美各种可能的选区划分方式,结论等于是由电脑扮演憨第德 (Candide)的角色来告诉我们,现在这个分裂的世界,正是最美好的世界。

民主、共和两党僵局的真正成因,是美国实际的政治分布,而不是地区划分的问题。 这不过是开端。资料的脚步跑得飞快(早在2012年,脸 书每天收集的资料就已经有 500 TB),但分析也已经开始迎头赶 上。在纳特·西尔弗的推动下,“资料新闻学”成为新闻报导的主流,我们为了理解,就会将各种事物“量化”。

不论《纽约时报》、《华盛顿邮报》或《卫报》,都已经建立起强大的分析及视觉化团队,而且就算现在是记者和新闻界的财务寒冬,仍然持续投入资源,报导我们生活中的种种资料。 至于那些当红的赚钱企业,我们已经多次提及的谷歌则是起带头作用,将资料导向公益。

除了谷歌流感趋势、史帝芬斯-德维道维兹的研究,甚至还有许多比较不为人知但其实规模更宏大 的专案,例如“宪法专案”(Constitute),就是希望推动以资料为基础的宪政设计。大多数国家的公民通常只会关注一套宪法 (也就是自家那一套),但谷歌则是将自从1787年以来起草 的900部宪法完整收集在一起。

经过合并、量化之后,这些资料就能供新兴国家参考(目前全球每年大约会制定五部新宪法), 看看过去各种制度的成败,也就更可能让政府长长久久。在这里,资料能够带来更美好的未来,原因正如宪法专案网站所言: 在一部宪法里,“即使一个逗号也能造成天壤之别”。

正如我们所见,脸书的资料团队收集了庞大的人类行为及反应资料之后,已经开始发表这些深具价值的研究结果。抓住这种科学和牛顿定律的相似之处,麻省理工学院的艾力克斯.潘特兰 (Alex Pentland)把这种新兴科学称为“社会物理学”(social physics),他和团队也已经开始把这些社群资料带到现实世界, 与地方政府、电信业者和市民合作,将整个城市“资料化”。

......

至于如何在可能的优缺点间达到平衡,我希望自己能点出一 个方向,但老实说,我看不到有什么简单的解决方案。很有可能 是我已经涉入太深,无法看到全局。

我与拉尼尔看法相仿,认为规范是行不通的。但还是会有人尝试。我确定,一定会出现立意良善的新法,只可惜这些法律在印刷油墨都还没干之前,就会过时。

而且,我自己就是个资料收集者,早就亲眼见识到,就算你让使用者拥有世界上所有的隐私管控方式,大多数人就是懒得去用。OkCupid 问了女性:“妳是否曾经堕胎?”(这是第 3,686 题 配对问题,你看吧,我就说他们什么都问了。)就在这个问题的 正下方,有一个可以勾选的方框,可以选择要将答案保密。但在那些选了肯定答案的人当中,勾了方框的不到一半。

大部分的人,其实没那么在意隐私

所以,大多数人就算拿到工具也不会去用。只不过,或许 “大多数人”不该是我们的目标。一方面,不管真正会使用的人有多少,还是应该要让使用者有办法删除、甚至收回他们的资料。另一方面,也有可能隐私权的概念早已改变,让讨论这个概 念的人都过时了。

根据网路标准,拉尼尔和我都算是老人等级, 而英文俗语“将军打的总是上一场仗”可不只会发生在军队里而已。我可能已经不再知道什么是正确的、什么是可允许的。不同的文化、不同的世代,对于隐私就会有不同的定义。

虽然美国国安局赤裸裸地扩权,但民众似乎也没那么生气。 华盛顿特区早就看过许多号称“百万”的游行,像是百万民众、 百万母亲等等。

而近来,骇客组织“匿名者”(Anonymous)就号召了一项“百万面具游行”(Million Mask March),要抗议如棱镜计划、政府大规模监控等议题。但《华盛顿邮报》报导的第一句,就已经看出公众对这个议题兴趣了了:“数百名示威者......” 拉尼尔在该篇《科学人》文章中,主张应该对个人资料提供补偿,用市场力量重新找出隐私和价值之间的公式。

他建议,资料收集者应该在使用者资料出售的时候,提供小额款项给使用者。但对业者来说,这就像是要再多缴一笔税,结果不是转嫁到消费者身上,就是可能掀起一场割喉战,开始什么都要付费, 比现在的航空业一样。无论哪种方式,对我们而言,到头来都不划算。更别说这种方式要执行有多不切实际了。

相较之下,潘特兰的做法就比较可行,他称为“资料新政措施”(New Deal on Data)。讽刺的是,这里的原则让人想起古代 的英国普通法(English Common Law)。

他相信,个人资料就如同你拥有的其他事物,应该由你具备拥有、使用及处置的基本权利。换句话说,如果你觉得某个网站(或其他储存资料的档案库)滥用了你的资料,你就应该有权将资料移除。

另外,如果顺利发展出资料的市场机制,理论上你也应该能够把个人资料“带着走”,进行转售。这种简单的机制(也就是有个删除钮,加上剪下/贴上的选项)不仅更加可行,也会比强制补偿的机制来得公平。

事实上,站在企业的角度,我会认为民众提供资料后已经得到补偿了:不论是脸书或谷歌(和老朋友连络、搜寻各种资讯),使用这些服务都是免费的。

我前面说过,我自己对这些服 务提供的资料很少;但也因此,我从它们得到的也就少了。民众 得在这里自行做出取舍。不过很快可能就只剩下一个抉择:对于 这些服务,我究竟是要用,还是不用?分析功能已经太过强大, 个人可能怎样都无法抵抗。

目前只要有最简单的资讯,演算法就已经能够对某人做出许多推算;而且,这还是在只有几年资料可供运用的情况下。很快地,因为其他人没那么在意隐私,那些 “管理您的隐私设定”选单里,有半数方法就无法达到保护功能。只要透过推算,企业和政府还是能把你找出来。相关争论, 很快就会成为明日黄花。

等待资讯洪流平静的那天......

不论如何,我在本书前面提到资料就像一场洪水的时候,或 许有一点还讲得不够清楚:这场洪水至今仍然翻腾不休。必须 到洪水平静下来之后,我们才会知道真正的水位,得以处理资料过剩的问题。我期盼那天的到来。

同时,那些储存、分析、运用资料的人,有责任继续证明自己工作的价值,而且明确揭露自己的工作内容。否则,就算我讲了这么多,仍然得要承认拉尼尔的看法:我们不应该这样做。 科技是我们的新神话。无可否认,里面有一些神奇的部分, 然而,仍然是形象大过于实质。

科技是我们的新神话。无可否认,里面有一些神奇的部分, 然而,仍然是形象大过于实质。

科技成了神祇,成了泰坦巨人, 成了跨在整个地球上的太阳神巨像。 这正是科技产业常常给公众的印象,而且遗憾的是,科技界常常 、也自以为如此。然而,这里有的肯定是怪物,不是神祇。我们一 定都会好好记住这一点。

我们都是人,都有缺陷,终归一死,而且也都走在同一片幽暗的天空下。这股洪水是我们带来的,究竟会把我们推升向上,或是让我们溺死其中?不论为了自己或其他人,我都希望我们能从资料得出一些美好、真实、有人性的结果。

而且在过程中,如果各种科技、设备、演算法已经显得太崇高遥远,就该想起丁尼生(Tennyson)笔下那位年华老去的尤里西斯(Ulysses),下决心以一种稍微不同的方式,继续寻找我们的真理。奋战不懈、探索不息、找寻不休,但别忘记,退让也是一种美德。

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。