互聯網政治 讀書時間 觀點 Books · 書摘

演算法比你更了解你自己

我們任由各種科技公司的數據團隊收集、分析反應我們行為的資料,然後呢?


【編者按】你用淘寶購物嗎?你用支付寶理財、支付嗎?你有微信錢包嗎?你用博客來和亞馬遜買書嗎?我們早已習慣了在網路上的一舉一動都會被記錄下來。科技公司的技術團隊已經成了最了解人類行為的一群人。深具侵略性的科技產品讓我們對隱私的界定範圍不斷模糊。

克里斯汀 · 魯德(Christian Rudder)畢業於哈佛大學數學系,交友網站OkCupid的共同創辦人,他結合大數據分析技術與領域知識,分析線上交友網站的第一手資料和深度的文字探勘(text mining),寫成這本《我們是誰?大數據下的人類行為觀察》(Dataclysm: Who We Are, When We Think No One's Looking)。

以下是這本書的最後一章:數位麵包屑。在分分秒秒的活動中,我們留下的個人訊息瑣屑決定了我們是誰。演算法、大數據要退讓到什麼位置我們才感到舒適、安全?

臉書按讚的模式可以透露個人隱私。攝:Dan Kitwood/GETTY

臉書(Facebook)2009年啟用「讚」(like)的按鈕,改變了人們分享內容的 方式。這並不是臉書新創的想法,像是曾經風靡一時、現在人氣 不再的 digg.com 和 del.icio.us 這些網站,多年前就已經引進了讓人對文章按「讚」的功能。

然而,當時這些公司看重的是「內容」,臉書則是以強大的社群網絡為基礎,內容創作者能以輕鬆簡單的方式,讓所有人用那個小小的大拇指圖樣,對他們的作品表達喜歡。

這等於是創造了一種新的通用小貨幣:臉書對你寫的文章、做的音樂之類並不會付什麼錢,但卻能讓你享有獲得肯定的興奮,也能和朋友分享你做的一切。截至2013年5月,臉書每天有45億個「讚」,而根據當年9月的報導,從開始到當時已累積了1.13兆個「讚」了。

這等於是創造了一種新的通用小貨幣:臉書對你寫的文章、做的音樂之類並不會付什麼錢,但卻能讓你享有獲得肯定的興奮,也能和朋友分享你做的一切。

在臉書新增按讚功能的同一年,麻省理工學院的學生開發出他們的同志雷達軟體。這套演算法很能推斷男性的性向,但其實道理也很明顯:大家都猜得到,男同志就是比較容易有男同志的朋友。所以,這項同志雷達的創新之作,就是用宏觀層面的資料,來做一些我們自己早就會私下做的事情。

在這之後,各種預測軟體的能力突飛猛進;隨著有愈來愈多資料可用,這種程式只會變得更快、更強大。到2012年,英國某團隊已經發現,只 要從一個人按讚的資料,就能在以下主題得到相對的猜測準確率:

按讚的模式透露出你是什麼樣的人

再次強調,這裏並沒有看任何近況更新、評論、分享,或是任何用戶自己打的字,完全只是看按讚的情況而已。等到你發現,居然有人只要從滑鼠(鼠標)點點點這檔事,就能知道你爸媽在吵架,便曉得科學已經到了一種前無古人的境界了。甚至,一個人按讚的模式還能拿來預測智商:這個模型能夠精準預測某人的標準智商測驗得分,而且一個問題都不用問。

一個人按讚的模式還能拿來預測智商:這個模型能夠精準預測某人的標準智商測驗得分,而且一個問題都不用問。

這一切的根據不過就是臉書三年間取得的用戶資料,而這些用戶在之前幾十年,都是活在沒有臉書的情境之下。如果有人是 從小就玩臉書,情況又可能如何呢?

這就是縱向資料的黑暗面 (否則平常我是很愛縱向資料的)。僱主、學校和軍方早就在用邁爾斯-布里格斯(Myers-Briggs,性格分類指標)和史丹佛- 比奈(Stanford-Binet,智力量表)之類的測驗,你坐下來、盡力 表現,然後他們就依結果將你分類。在大多數情況下,你能夠選擇是否要加入。

然而現在逐漸演變成,你不過在過自己的生活, 就等於是在參加這些測驗了。而且,整個結果大剌剌地擺在那裏,任何人都能閱讀判斷。在面試之前,看到某個人的 Klout 分數是51分之類,這是一回事,但居然能知道他的智商,這又是另一回事了。

如果僱主開始運用各種演算法,推斷你有多聰明或你是否在用藥,你唯一的選擇,就是要設法能夠操縱這套系統,或者借用上一章的話,也就是「管理你的品牌」。

要打敗機器,你就得像是台機器,但這也代表已經輸給機器了。

要打敗機器,你就得像是台機器,但這也代表已經輸給機器了。而且,前提還是你有辦法先猜測到自己該如何表現。你絕對想不到,在這個研究裏,和智商最相關的就是會對「薯圈圈」(curly fries)按讚,誰可能倒推得出來啊。 然而,即使臉書對你知之甚詳,仍然比較像是個「工作上的朋友」:雖然相處的時間很長,彼此關係還是有明確的界線。

臉書知道的就是你在臉書上的資料,但還有很多其他情況對你的瞭解更深入。如果你有一台 iPhone,蘋果就會知道你的通訊錄、行事曆、照片、簡訊、文字、你聽了什麼音樂、去了什麼地方,而且因為手機有一個小陀螺儀,蘋果連你走了幾步都一清二楚。沒在用 iPhone 嗎?把「蘋果」換成「谷歌」、「三星」、「威訊電信」 (Verizon),結果也一模一樣。

你戴 Nike 的運動手環 FuelBand 嗎?Nike連你睡得好不好都知道。你買了Xbox One嗎?微軟知道你的心跳率。你用信用卡嗎?只要你在零售店買了東西,你的個人識別資訊(PII)就會將統一商品代碼(UPC)連結到在客戶關係管理(CRM)軟體裏你的客戶編號(ID),而這套軟體就開始計算你下一個可能想買的東西是什麼。 這只是整個企業資料現況的一瞥,想要完整敘述,得花上許多頁才寫得完。

至於政府的情況,由於政府只有透露部分,我們也就只知道片段。但我們確實知道的是,英國上下總共有590萬部監視器,等於每11個英國人就有一部。

而在曼哈頓,光是在 14 街以南,就有 4,176 部。至於在城市道路以外的部分,則由衛星和無人飛機來補全。雖然我們不知道這些監視器究竟看了 些什麼,但應該可以肯定的是:只要政府對你有興趣,你一定難逃法眼。

除此之外,正如揭露美國政府祕密監聽計劃的愛德華 · 斯諾登(Edward Snowden)所透露,很多政府無法從監視器上看到的東西,仍然能好整以暇地從國安局內部網路(NSANet)終端機的螢幕上輕鬆取得,而這個地點是個機密。 正因為有太多事情發生,而公眾又知道得太少,一般人對資 料的理解,必然與真實狀況有極大落差。

《我們是誰?大數據下的人類行為觀察》(Dataclysm: Who We Are, When We Think No One's Looking)

出版時間:2016年5月
出版社:馬可孛羅文化
作者:克里斯汀 · 魯德(Christian Rudder)
譯者:林俊宏

我不得不說,光是因為放下手邊的工作來寫這本書,我敢肯定自己就已經落伍了。在許多方面,「分析」已經超越了資訊本身,成為真正的關鍵。目前得到最多媒體關注、也是最討人厭的資料收集者,就是網路瀏覽器裏的 cookie,還有那些盜竊信用卡號的駭客。然而,這種人拿到的其實也只是你生命的一小部分,而且他們還得先費盡千辛萬苦才行。

不論他們的 JavaScript 寫得多狡猾,基本上他們還是那種默片裏的二流小壞蛋,留著小鬍子、戴著高帽子的那一種。或者打個比較現代的比方:他們就像是《王牌大賤諜》系列裏那個 白白胖胖的邪惡博士(Dr.Evil),根本整個世界都是他的人質, 但他居然只勒索個一.百.萬美元,而真正能賺到幾十億美元的幕後頭目,則是像 Acxiom 這樣的資料公司。

這些企業資料行銷業者,能夠取得銀行和刷卡紀錄、零售購買紀錄,以及像是納稅紀錄之類的政府檔案,他們對於人類行為的瞭解,遠遠超越了任何在網站上找模式的學者。

這些企業資料行銷業者,能夠取得銀行和刷卡紀錄、零售購買紀錄,以及像是納稅紀錄之類的政府檔案,他們對於人類行為的瞭解,遠遠超越了任何在網站上找模式的學者。同時,各種國安機制所帶來的種種資源和專業知識,則會讓一般企業等級的資料探勘(data-mining))軟體像踩地雷小遊戲一樣可笑。

我們損失了隱私,換回的是什麼 ?

雖然我們用了「探勘」這個比喻,但資料其實並不是什麼天然資源;資料必然有個源頭,而這個源頭就是你。政府和各家公 司,都在收集你私人生活的各個小部分,並且試圖把它組回成一 個能夠讓他們利用的完整圖像。

你喪失的隱私愈多,他們就能做得愈有效率。而任何對於隱私的討論,最後的根本問題就在於如何妥協:你損失了隱私,能得到什麼?我們總是在計算該如何妥協:公眾人物出賣了自己的私人生活,好換取職涯上的進步。你想要訂歐洲青年旅館或買印度火車票的時候,也得想想要不要多花點錢,讓自己多點隱私空間。

而和主題也相關的是,許多男女晚上出門的時候,也會讓裙子變短一點、讓衣服緊身一些,透過放棄一點隱私,換取一些注意的目光。所以,交換妥協這件事由來已久,但這裏真正與過去不同之處,是妥協的對象及條件。

對象是企業時,除非你是想研究相關議題的經濟學家,否則企業使用資料後對我們的好處並不明顯。理論上,有了使用者資料,企業可以讓廣告更有針對性,也就是可以少浪費一些行銷費用,商品價格也就能更低。至不濟,公司如果將這些資料出售換得收入,就能免費提供某些對消費者真正有用的服務(例如臉書和谷歌)。

至於對象是政府的時候,我們讓政府窺伺隱私,能得到的好處就沒那麼單純了。 有了監視器,真的讓我們更安全嗎?各種安全監控,是不是 我們的保護毯?至少,自2001年以來,就未曾發生針對美國平民的恐怖攻擊了(至少不是由大型恐怖組織所發動)。

這不能說沒有意義,特別是對紐約人而言。然而,光是「沒有發生」可 能不夠有說服力。除非我們能夠確知究竟阻止了哪些攻擊,而不是本來就空穴來風,否則我們實在很難相信政府的說詞。

就像德州的沙塵暴一樣,許多與「九一一」事件相關的記憶已經逐漸遠去, 但用顏色編碼的「威脅等級」仍被不斷提起,總讓我覺得像是特地在為油田服務公司哈里伯頓(Halliburton,於伊拉克戰爭中獲利頗豐)打廣告。

政府認為人民不用什麼都知道,抱著一種「你有需要知道的時候再說」的原則,實在很難令人相信所得到的資訊。於是,人民開始愈來愈注意政府發言的動機,而不是內容。 不論如何,我其實不知道國安局的各種大動作,究竟曾經阻止了多少犯罪,甚至是否曾經阻止任何犯罪。

政府只說了一切成功, 但並未透露時間、地點或方式。 在達不到理想之後,全面監控機制對於那些無法阻止的犯罪 行為,在破案時倒是大顯神威。像是波士頓馬拉松爆炸案,就是由安全監視器協助破的案,2005年的倫敦地鐵爆炸案也是如此。 特別是在非同步犯罪中,犯罪分子遂行犯行後,要再過一段時間才會出現受害者,於是更需要有完整的資料才能追查。

而在這些調查中,媒體大聲讚揚情報資訊的力量,這個監控國家一時也走路有風。這種資料用法目的明確,況且在地上還流著血的時候, 也不會有人去計較隱私/保護之間該如何平衡。

但每次呼喊「團結就是力量」之際,很多時候我們還是得靠著斯諾登這種吹哨者 (whistle-blower,指基於公益挺身揭弊的機構內部人員),才能知道政府究竟知道些什麼。

國家安全局是美國政府的信號情報(signals intelligence)單位,而他們要找的信號,就在我們的資料裏。我認識一些國安局的人。前面提過,我是數學背景,在哈佛拿的學位。雖然全系同學的大學畢業證書表面看起來沒什麼兩樣,但數學系其實分成兩種人。

我這種人,就只是喜歡數學,而且程度還算不錯。至於另一種人,則是神人等級的超級專家。大一有一堂高階的「數學 25」,當時的我就已經沒資格修了;而從這堂課上,還會再把超級精英抽出來,由系上特別邀請去修另一堂「數學 55」。

對那些真正的數學家來說,我修過最難的那些課,他們多半直接免修跳 過。在我修的高階課程裡,很多時候是由助教上課,他們還得打 所有成績。這些助教常常比我年輕(有一個才十六歲),而且明明還是青少年,就已經開始讀非常艱深的研究所課程。

我還記得,修到實變函數論(Real Analysis)的時候我很興奮(而且感 覺真是一大挑戰),但當時許多同儕(如果我還配稱得上是他們的同儕)可能都覺得這實在像國中的課一樣無聊。

現在我每次聽到「國安局」,就會讓我回想起那些日子,因為他們招的就是那另一種神人。 我會指出這一點,是因為很多人似乎不把政府人員看在眼裏,說他們是官僚,只會蓋章,認為只要一般民間資料分析公司 的人就能勝任那些工作。

然而這些在監控我們的人,可是非常非常聰明。我們可以希望他們能像過去的費曼和愛因斯坦一樣,處理工作時不僅識見卓絕,還帶著充滿關懷的人性,不過我們能夠肯定的是,他們正如過去的費曼和愛因斯坦,手上的工作具備了非人的巨大威力。

然而這些在監控我們的人,可是非常非常聰明。我們可以希望他們能像過去的費曼和愛因斯坦一樣,處理工作時不僅識見卓絕,還帶著充滿關懷的人性,不過我們能夠肯定的是,他們正如過去的費曼和愛因斯坦,手上的工作具備了非人的巨大威力。

有了演算法,還必須吃資料,而如斯諾登所透露,美國國安局可是像吃了超級食物一般。又或者說......他們其實是所有食物來者不拒。國安局會收集電話、電子郵件、簡訊、照片,基本上 所有電子資訊都難逃掌握。顯然,這裏不是被動運作。

根據一份 流出的文件顯示,他們最高的明文目的就是「掌控網路」。這項專案居然敢講得如此直言不諱,也算令人佩服。斯諾登首批揭露 的文件中(由《衛報》和《華盛頓郵報》共同揭露),有一個關 於「稜鏡計畫」(PRISM)的簡報檔。這些簡報可是毫不拐彎抹角:

可以看到,這裏的資料簡直無所不抓。一方面,配槍的人忽然開始對我們的臉書帳號感興趣,對大家來說可不是什麼好事。 但另一方面,看到他們做簡報居然用的是微軟的繪圖工具,又覺得實在也沒什麼好怕的。

正因為稜鏡計劃深具侵入性,如果沒有法院命令,無人有權查閱稜鏡計畫所得到的個人資料,至少理論上如此。其他的監控機制則主要針對後設資料(metadata),也就是各種通訊留下的痕跡。

以下是美國官方的隱私與民權監督委員會(Privacy and Civil Liberties Oversight Board)對於另一項計畫的描述:

國安局 215 條款(Section 215)專案監控數百萬個電話號 碼,記錄所有收發話紀錄,包括通話長度,以及確切的通話時間為當日何時。國安局若鎖定某電話號碼進行分析,所有 和該號碼有接觸的電話,以及再與這些號碼有接觸的號碼, 都會一樣遭到監控、收集相關資料。

在此必須先聲明,這裏的監控完全不包括任何通話的實質內容。在這方面,其實和本書用的資料沒有太大不同。不論我們或是這些人,都是只講趨勢、不講個人。而同樣根據他們所言,在國安局,要等到你的通話網路符合所謂的「威脅」模式,他們才會真正開始密切注意。

然而,雖然後設資料屬於間接,但侵入性並不見得就比較小。 只要有心想跟蹤,其實大家都會留下一些意想不到的資訊麵包屑。本書到目前就已經提過許多例子,即使如此,還有許許多多我們沒談到的追蹤方式。

例如,不管是高端的單眼相機,或甚 至只是你的 iPhone,所有數位相機拍攝的照片都會附加一個小小 的 Exif 檔,裏面除了記錄拍攝時間,還有其他各種瑣碎資料,例如光圈、快門速度,通常還有拍攝時的經緯度。

有了 Exif 檔,就能讓像是 iPhoto 這些程式輕輕鬆鬆將照片依「時刻」(Moments) 和地點排序,也能在地圖上用小小的大頭針圖示顯示你去過哪裏。

然而,Exif 會洩露的可不只如此。以 OkCupid 的個人檔案照片為例,愈好看的照片,愈有可能是很久很久以前拍的。換句話說,大家找到一張「好看的照片」之後,常常再也不換。

我們之所以知道這種事,也是因為 Exif 能告訴我們照片的拍攝時間。類 似這樣的附加資料其實很常見,像是你每次打開哪個最愛的應用程式,GPS 座標就已經在一旁待命。

幾乎你載入的每個網頁,頁邊都藏著幾十個只有一個像素的圖像(就只是一個透明的點), 在載入「真正的」網頁時,記錄你的造訪;這些像素並不知道你在做什麼,只知道你造訪的時間、地點。

但光是這樣,就已經能讓背後的公司對於你整個人的基本資料擁有滿準確的猜測。 如果有人就是不想分享這些資料,該怎麼辦?會不會有些 人,就是寧願自己去買東西、自己開心過日子?我本身很重隱私,老實說,有部分也是因為如此,我不太迷任何社群媒體,也從來不會把女兒的照片放上網路。

我是在2011年初開始用 Instagram,只把它當成網路相簿應用程式在用,當時這家公司還不大,而且我主要就是為了那些濾鏡效果。我當時還以為這就像是攝影軟體 Hipstamatic,沒什麼社群功能(我知道,這讓我聽起來完全像個老頭)。等我太太發現她那老古板的先生在做什麼之 後,她告訴我可以把帳戶與其他人的帳戶連結,而我也照做了, 因為不過就是點個按鈕嘛!

但等到我發覺這不只是我和我自己的照片之後,忽然覺得 Instagram 失去了所有的吸引力。 會像我這樣閉俗的人並不多。雖然人人都說擔心,但大多數用戶對於隱私其實沒那麼在意。

每次臉書又更新服務條款,把觸手往我們的資料探得更深,民眾會怒個一天,但隔天還是繼續上臉書,就像是如果去戳一下蜂巢,發怒的蜜蜂一湧而出,但發現找不到人叮之後,就會乖乖再回巢。

每次臉書又更新服務條款,把觸手往我們的資料探得更深,民眾會怒個一天,但隔天還是繼續上臉書,就像是如果去戳一下蜂巢,發怒的蜜蜂一湧而出,但發現找不到人叮之後,就會乖乖再回巢。

因為科技就是會這樣不斷步步進逼,而人類則是不斷退縮,讓現在的軟體幾乎都深具侵略性。譬如有些應用程式管的是減肥,有的管心跳率,甚至還有 「幫我的打扮打分數」的應用程式,把自己的打扮穿著上傳網路,讓大家為你提出時尚建議。女性也用各種應用程式來預測和管理自己的月經週期,珍娜 · 沃瑟姆就寫道:「市場充斥此類軟體,我認識的幾乎每個女人都用。」

......

然而,就算有一些(甚至不少)人並不在意隱私問題,我還是不希望有任何人會因為這本書而使身分曝光。前面已經提過, 這裡的分析都經過匿名,只做整體呈現,而且我處理原始資料也很小心,資料中絕無任何個人識別資訊(PII)。

而討論到用戶所發表的文字時(包括個人自我介紹、推特文字、近況更新、按讚等等),使用的都是公開的內容。至於用到用戶個別紀錄的時候,則是會將用戶帳戶名(ID)加密。

而且在任何分析中,資料範圍都只列出必要的變項,避免能夠回推到任何個人。 當然,我從來沒想過要將資料回推到個人,而是要將資料連 結到整體所有人。這正是我在資料裏看到的價值,也就是以隱私換取而來的價值:讓我們能夠從中學習。

這正是我在資料裏看到的價值,也就是以隱私換取而來的價值:讓我們能夠從中學習。

微軟研究院的資訊科學家賈倫 · 拉尼爾(JaronLanier)曾著有《誰擁有未來?》(Who Owns the Future?),他最近在《科學人》(Scientific American)雜誌寫道:「有極大量關於我們私人生活的資訊,正在儲存、分析以及使用,希望未來能展現實際用途。」

我認為他講到「極大量」 絕對沒錯,但最後一句卻有問題。任何東西,不都是「希望未來能展現實際用途」嗎?研究科學這件事,最重要的就是為了探索。鐵礦石原本也只是石頭,直到有人開始嘗試。麵包上的黴菌幾千年來都只會讓人生病,直到亞歷山大 · 弗萊明(Alexander Fleming)發現也能做成盤尼西林。

圖為一群記者正在使用電腦。攝:David Ramos/GETTY

發揮資料正面的力量

目前,資料科學已經取得許多重大研究結果,不只能夠描述、更能夠改變人們的生活方式。我在前面已經提過了谷歌流感趨勢,自從2008年推出之後,現在已經在超過25個國家上線,追蹤疫情。雖然這項工具還不完美,但至少是個開端,各種資料結合之後,現在甚至能用來預防疾病,而不只是減輕疾病危害而已。

正如《紐約時報》去年的報導:「微軟、史丹佛和哥倫比亞大學的科學家,運用谷歌、微軟和雅虎搜尋引擎的搜尋查詢資料,已經首次能夠領先美國食品藥物管理局的警示系統,找出處方藥物不為人知的副作用。」

研究人員發現,帕羅西汀 (paroxetine)和普伐他汀(pravastatin)會造成患者血糖升高。在這裏,犧牲一點生活上的隱私,換來活得多一點健康。 目前看來,似乎每天都有一點新進展。像是今天,我就發現 了一個叫做 geni.com 的網站,打算運用群眾外包的力量,畫出全人類的家譜。

如果成功,這家公司基本上就是為人類遺傳物質畫 出一個社群網絡。上週,兩位政治科學家則是推翻了一種大家常有的誤解:以為共和黨之所以能在眾議院占多數,靠的是在畫選 區的時候動手腳(gerrymandering)。

這兩位作者用模型測試了全美各種可能的選區劃分方式,結論等於是由電腦扮演憨第德 (Candide)的角色來告訴我們,現在這個分裂的世界,正是最美好的世界。

民主、共和兩黨僵局的真正成因,是美國實際的政治分布,而不是地區劃分的問題。 這不過是開端。資料的腳步跑得飛快(早在2012年,臉 書每天收集的資料就已經有 500 TB),但分析也已經開始迎頭趕 上。在納特·西爾弗的推動下,「資料新聞學」成為新聞報導的主流,我們為了理解,就會將各種事物「量化」。

不論《紐約時報》、《華盛頓郵報》或《衛報》,都已經建立起強大的分析及視覺化團隊,而且就算現在是記者和新聞界的財務寒冬,仍然持續投入資源,報導我們生活中的種種資料。 至於那些當紅的賺錢企業,我們已經多次提及的谷歌則是起帶頭作用,將資料導向公益。

除了谷歌流感趨勢、史帝芬斯-德維道維茲的研究,甚至還有許多比較不為人知但其實規模更宏大 的專案,例如「憲法專案」(Constitute),就是希望推動以資料為基礎的憲政設計。大多數國家的公民通常只會關注一套憲法 (也就是自家那一套),但谷歌則是將自從1787年以來起草 的900部憲法完整收集在一起。

經過合併、量化之後,這些資料就能供新興國家參考(目前全球每年大約會制定五部新憲法), 看看過去各種制度的成敗,也就更可能讓政府長長久久。在這裏,資料能夠帶來更美好的未來,原因正如憲法專案網站所言: 在一部憲法裡,「即使一個逗號也能造成天壤之別」。

正如我們所見,臉書的資料團隊收集了龐大的人類行為及反應資料之後,已經開始發表這些深具價值的研究結果。抓住這種科學和牛頓定律的相似之處,麻省理工學院的艾力克斯.潘特蘭 (Alex Pentland)把這種新興科學稱為「社會物理學」(social physics),他和團隊也已經開始把這些社群資料帶到現實世界, 與地方政府、電信業者和市民合作,將整個城市「資料化」。

......

至於如何在可能的優缺點間達到平衡,我希望自己能點出一 個方向,但老實說,我看不到有什麼簡單的解決方案。很有可能 是我已經涉入太深,無法看到全局。

我與拉尼爾看法相仿,認為規範是行不通的。但還是會有人嘗試。我確定,一定會出現立意良善的新法,只可惜這些法律在印刷油墨都還沒乾之前,就會過時。

而且,我自己就是個資料收集者,早就親眼見識到,就算你讓使用者擁有世界上所有的隱私管控方式,大多數人就是懶得去用。OkCupid 問了女性:「妳是否曾經墮胎?」(這是第 3,686 題 配對問題,你看吧,我就說他們什麼都問了。)就在這個問題的 正下方,有一個可以勾選的方框,可以選擇要將答案保密。但在那些選了肯定答案的人當中,勾了方框的不到一半。

大部分的人,其實沒那麼在意隱私

所以,大多數人就算拿到工具也不會去用。只不過,或許 「大多數人」不該是我們的目標。一方面,不管真正會使用的人有多少,還是應該要讓使用者有辦法刪除、甚至收回他們的資料。另一方面,也有可能隱私權的概念早已改變,讓討論這個概 念的人都過時了。

根據網路標準,拉尼爾和我都算是老人等級, 而英文俗語「將軍打的總是上一場仗」可不只會發生在軍隊裏而已。我可能已經不再知道什麼是正確的、什麼是可允許的。不同的文化、不同的世代,對於隱私就會有不同的定義。

雖然美國國安局赤裸裸地擴權,但民眾似乎也沒那麼生氣。 華盛頓特區早就看過許多號稱「百萬」的遊行,像是百萬民眾、 百萬母親等等。

而近來,駭客組織「匿名者」(Anonymous)就號召了一項「百萬面具遊行」(Million Mask March),要抗議如稜鏡計劃、政府大規模監控等議題。但《華盛頓郵報》報導的第一句,就已經看出公眾對這個議題興趣了了:「數百名示威者......」 拉尼爾在該篇《科學人》文章中,主張應該對個人資料提供補償,用市場力量重新找出隱私和價值之間的公式。

他建議,資料收集者應該在使用者資料出售的時候,提供小額款項給使用者。但對業者來說,這就像是要再多繳一筆稅,結果不是轉嫁到消費者身上,就是可能掀起一場割喉戰,開始什麼都要付費, 比現在的航空業一樣。無論哪種方式,對我們而言,到頭來都不划算。更別說這種方式要執行有多不切實際了。

相較之下,潘特蘭的做法就比較可行,他稱為「資料新政措施」(New Deal on Data)。諷刺的是,這裏的原則讓人想起古代 的英國普通法(English Common Law)。

他相信,個人資料就如同你擁有的其他事物,應該由你具備擁有、使用及處置的基本權利。換句話說,如果你覺得某個網站(或其他儲存資料的檔案庫)濫用了你的資料,你就應該有權將資料移除。

另外,如果順利發展出資料的市場機制,理論上你也應該能夠把個人資料「帶著走」,進行轉售。這種簡單的機制(也就是有個刪除鈕,加上剪下/貼上的選項)不僅更加可行,也會比強制補償的機制來得公平。

事實上,站在企業的角度,我會認為民眾提供資料後已經得到補償了:不論是臉書或谷歌(和老朋友連絡、搜尋各種資訊),使用這些服務都是免費的。

我前面說過,我自己對這些服 務提供的資料很少;但也因此,我從它們得到的也就少了。民眾 得在這裡自行做出取捨。不過很快可能就只剩下一個抉擇:對於 這些服務,我究竟是要用,還是不用?分析功能已經太過強大, 個人可能怎樣都無法抵抗。

目前只要有最簡單的資訊,演算法就已經能夠對某人做出許多推算;而且,這還是在只有幾年資料可供運用的情況下。很快地,因為其他人沒那麼在意隱私,那些 「管理您的隱私設定」選單裏,有半數方法就無法達到保護功能。只要透過推算,企業和政府還是能把你找出來。相關爭論, 很快就會成為明日黃花。

等待資訊洪流平靜的那天......

不論如何,我在本書前面提到資料就像一場洪水的時候,或 許有一點還講得不夠清楚:這場洪水至今仍然翻騰不休。必須 到洪水平靜下來之後,我們才會知道真正的水位,得以處理資料過剩的問題。我期盼那天的到來。

同時,那些儲存、分析、運用資料的人,有責任繼續證明自己工作的價值,而且明確揭露自己的工作內容。否則,就算我講了這麼多,仍然得要承認拉尼爾的看法:我們不應該這樣做。 科技是我們的新神話。無可否認,裏面有一些神奇的部分, 然而,仍然是形象大過於實質。

科技是我們的新神話。無可否認,裏面有一些神奇的部分, 然而,仍然是形象大過於實質。

科技成了神祇,成了泰坦巨人, 成了跨在整個地球上的太陽神巨像。 這正是科技產業常常給公眾的印象,而且遺憾的是,科技界常常 、也自以為如此。然而,這裏有的肯定是怪物,不是神祇。我們一 定都會好好記住這一點。

我們都是人,都有缺陷,終歸一死,而且也都走在同一片幽暗的天空下。這股洪水是我們帶來的,究竟會把我們推升向上,或是讓我們溺死其中?不論為了自己或其他人,我都希望我們能從資料得出一些美好、真實、有人性的結果。

而且在過程中,如果各種科技、設備、演算法已經顯得太崇高遙遠,就該想起丁尼生(Tennyson)筆下那位年華老去的尤里西斯(Ulysses),下決心以一種稍微不同的方式,繼續尋找我們的真理。奮戰不懈、探索不息、找尋不休,但別忘記,退讓也是一種美德。

讀書時間 互聯網 互聯網政治

2017 年 7 月,端傳媒啟動了對深度內容付費的會員機制。在此之前刊發的深度原創報導,都會免費開放,歡迎轉發,也期待你付費支持我們

如果你喜歡,就分享給更多人吧