中國大數據四問:官商民集體狂歡的背後,「數據利維坦」正在降臨?

光鮮表象之下,中國大數據產業是在穩步發展,還是在野蠻生長?在法律法規缺失的情況下,個人隱私與數據使用如何平衡?大數據的廣泛應用,是會帶來便捷高效的生活,還是讓威權變得堅不可摧?
大數據正以前所未有的力量影響著政府決策、商業活動乃至每個人的日常生活。業內預期,中國有望在2020年成為世界第一數據資源大國。圖為2017年5月27日,貴陽舉辦的2017中國國際大數據產業博覽會期間,一位參加者在數據分析中心。
數洞 大陸 大數據 威權政治 隱私與安全

在世界上任何一個國家或地區,「大數據」可能都沒有在中國這般光彩奪目——最高層視其為重要的執政資源、社會治理變革的關鍵所在,作為國家級的戰略部署強力推進;科技巨頭們渴望透過它掌握用戶行為、獲取更大利潤,不惜斥巨資對手中數據進行分析、挖掘和利用;普通民眾則在數據帶來的便利中自我陶醉——買着被精心推送的商品,看着被算法層層篩選過的新聞,隨時隨地掃碼付賬,卻將個人隱私忘得一乾二淨。

政府、企業和民眾,在對待大數據這件事上吊詭地實現了高度一致。大數據正以前所未有的力量影響着政府決策、商業活動乃至每個人的日常生活。中國也一舉成為大數據領域的排頭兵,不僅數據資源佔有量即將成為全球第一,在數據分析和數據交易領域也走在世界前列,政策的扶持、寬鬆的監管和民眾對於隱私的忽視,讓大數據和人工智能、基因編輯技術等一起,成為中國實現「彎道超車」的核心所在。

然而,光鮮的表象之下,中國的大數據交易產業是在穩步發展,還是在野蠻生長?在相關法律法規缺失的情況下,個人隱私與數據使用如何平衡?大數據的廣泛應用,是會帶來便捷高效的生活,還是會孳生出「數據利維坦」,讓威權變得更加堅不可摧?我們為你梳理了與中國「大數據」密切相關的四個問題。

圖為中國第一家以大數據命名的交易所——貴陽大數據交易所。
圖為中國第一家以大數據命名的交易所——貴陽大數據交易所內景。

什麼是「大數據」?它有什麼用?

當你去醫院看牙,蛀蟲長在哪顆牙齒上都會被錄入衞生部門的醫療數據庫;只要輸入關鍵字,民政部門就可以輕鬆知道你所在的街道有多少「單身狗」;你上個月買了兩本書、卻花三個鐘頭挑選指甲油的行為會被淘寶網精確記錄,你每天凌晨狂刷朋友圈的行為也會收入騰訊「囊中」,百度記下了你在情人節前搜索廉價機票的動作……成千上萬個「你」的數據被蒐集、整理在一起,形成大數據。

管理諮詢公司麥肯錫(McKinsey&Company)這樣定義「大數據」(Big Data):一種數據集合,其規模大到在獲取、存儲、管理、分析方面都大大超出傳統數據庫軟件工具的能力範圍。和傳統數據相比,大數據來源多元、種類繁多,更新速度非常快,且龐雜宂餘,需要經過「提純」才能產生價值。

這些數據主要握在政府管理部門、互聯網巨頭和移動通訊企業手中,涉及領域包括醫療、交通、金融、社交平台、網絡購物、通信記錄等等。

大數據要怎麼用呢?最簡單的例子:只要你在購物網站瀏覽過一次塑身衣,網站就會向你推薦五花八門的減肥產品,從減肥藥、健身球到產後私教課。這就是精準營銷,也是目前大數據應用最廣泛、成熟的領域。

除此之外,風險控制、精細化運營也是大數據應用較多的領域。比如說,電力公司的數據可以幫助金融行業控制風險,當某企業的用電量出現異常時,其經營面臨問題的可能性增大,銀行在放貸時就要慎重考慮。再比如,一個家電經銷商蒐集用戶資料,分析發現80後女性是主力軍,經銷商便在日後主推美容電器、吹風機等受80後女性喜歡的產品。

在政府管理方面,大數據的應用領域廣泛,如利用移動通信等大數據監控公共場所的人群流量。圖為2017年國慶期間,南京市的大量遊客聚集在中山陵園。
政府可以利用移動通信等大數據監控公共場所的人流量,來避免踩踏事件。圖為2017年國慶期間,大量遊客聚集在中山陵。

在政府管理方面,大數據的應用領域也很廣泛。比如,利用移動通信等大數據監控公共場所的人流量,來避免踩踏事件、調配公共交通;依據衞生部門的新生兒數據,教育部可規劃應相應建設多少小學、培養多少教師;通過監測社交平台的輿論,避免負面民意的聚集和爆發。

大數據的擁躉將其稱之為「新石油」,並聲稱我們正從金融資本主義時代邁向數據資本主義時代。狂熱信徒們相信大數據可以為各類問題提供普世解決方案,以色列歷史學家尤瓦爾·諾亞·哈拉里(Yuval Noah Harari)甚至認為,他們的熱乎勁兒簡直可以視為一種新宗教的誕生。

但擁躉眼中的美好未來橫亙着不少障礙,除了侵犯隱私和濫用的憂慮外,想要數據的人和擁有數據的人常常是錯位的。在上述例子中,銀行希望得到電力公司的數據,政府安全部門想拿到社交平台的數據,但這些數據能否開放及進行交易呢?

大數據如何交易?

在 Google 輸入「大數據交易」,可獲得超過208萬條結果。除了背靠地方政府建立的各類數據交易平台,阿里雲、京東萬象等互聯網巨頭也提供各類數據分析服務,類似的小公司更是不計其數。

目前交易市場最受歡迎的數據來自互聯網、金融、電信、醫療、交通和教育領域。交易形式主要有三大類:原始數據交易;按客戶需求、以原始數據為基礎分析趨勢或結果;為交易雙方提供中介服務。

進入交易市場的原始數據大多是交易平台從網上採集、整理來的數據。比如,有家平台收集了國內外50萬家酒店信息,包括地點、價格、評價等,打包出售,售價2500元。也有逐條收費的,某平台出售記錄心律失常的數據庫,每條數據0.01元。

不過,目前多數企業不具備分析大數據的能力,他們更願意帶着訴求、請數據公司從大數據中「打撈」出有商業價值的相關信息。阿里雲提供的「營銷引擎」就是這樣一種分析服務:以阿里巴巴龐大的用戶數據庫為基礎,利用數據標籤篩選出對口的消費人群,實現精準營銷。比如保健品公司想推銷一款高價鈣片,篩選人群的標籤則應包括中老年、常買保健品、單位時間內消費總額/單價高。

至於交易中介,它們本身並不擁有數據,只負責為交易雙方牽線搭橋。以貴陽大數據交易所(下稱「貴交所」)提供的一起中介服務為例:當地衞生部門決定交易一部分醫療數據,先和貴交所一起定出價格,再放入平台展賣。貴陽市一家制藥公司看中了,便向平台付錢買入這批數據,交易所得由貴交所和衞生部門四六分成。製藥公司則通過分析這批數據,開發了更有針對性的新葯。

「目前還是一個賣方定價的過程,」貴交所副總裁朱國輝對端傳媒表示。貴交所實行協議定價,買方也可以還價。貴交所是中國第一家大數據交易所,2015年在貴州政府的扶持下成立,曾得到國務院總理李克強的批示。

近兩年,從中央到地方,陸續出台了各類推動大數據發展的政策,貴州、上海、武漢、哈爾濱紛紛建起大數據交易中心,至今已超過20個。圖為貴陽大數據交易所。
近兩年,從中央到地方,陸續出台了各類推動大數據發展的政策,圖為貴陽大數據交易所。

近兩年,從中央到地方,陸續出台了各類推動大數據發展的政策,貴州、上海、武漢、哈爾濱等城市紛紛建起大數據交易中心,至今已超過20個。

這些背靠各地政府的平台在獲取政府數據接口時具有得天獨厚的優勢。一名交易所高管向端傳媒透露,平台交易的數據介於政府公開數據和秘密數據之間。

在交易平台上,政府是賣方也是買方。因為不同地區、不同部門的政府數據尚未打通,A地交通部門會購買B地的交通數據作為管理參考,公安部門也會想從通信企業購買數據。

中國的數據交易平台早在2010年左右就開始陸續建立,從業者起初都對未來自信滿滿,認定數據交易是個產值達萬億的新產業。但現實並非如此,根據《財經》雜誌今年1月刊發的一篇調查報導,有政府和國資背景的大數據交易所大部分生意寥寥,純市場化的數據服務公司盈利狀況也欠佳。

不少熟稔情況的業內人士在網絡平台討論:一些政府的大數據項目耗資百萬甚至千萬,但搭建的平台根本不具備數據處理能力,有而的承建企業只想套取政府為建設數據平台提供的土地資源和政策優惠。

截止2017年10月,獲國家政策扶持的貴陽大數據交易所,兩年多的累計交易額不過1.2億元(人民幣,下同)。大數據交易的業內高管對《財經》表示,少有年收入突破千萬的大數據交易所。在業界名聲頗盛的基礎數據提供商「數據堂」在經營好轉的情況下,半年仍虧損近400萬。據《財經》統計,這些正規平台一年的收入加起來還不到50億。

「大家還在探索、試錯,」朱國輝說。

中國的大數據交易現狀是怎樣的?

堅固的「數據壁壘」

「任何一個企業的高管都不會輕易讓出數據,因為風險遠遠大於收益,」朱國輝說,「數據的可複製性很強,一家企業付出很多代價積澱的核心數據,一旦流出會被很快複製。」

「拿走數據的多,貢獻數據的少。」貴交所執行總裁王參壽此前亦曾對媒體表示,不少企業以保護商業機密或節省數據整理成本等為理由,不願意交易自身數據,免費開放的就更是鳳毛麟角。

2017年6月,中國知名快遞企業順豐和阿里旗下的物流聯盟菜鳥展開「大戰」。順豐突然宣布關閉對菜鳥的數據接口,並爆料菜鳥率先發難封殺自己,目的是讓順豐將數據從騰訊雲挪換到阿里雲。「大戰」以國家郵政局出面調停告終,雙方同意恢復業務合作和數據傳輸。

這場戰爭暴露了企業間對大數據資源的激烈爭奪。「對一個市值2000億元的企業(順豐)來說,無償獻血給另一個公司(菜鳥),是不可能發生的,」快遞專家趙小敏對媒體表示。

2017年6月,順豐快遞和阿里旗下的物流聯盟菜鳥展開「大戰」。順豐突然宣布關閉對菜鳥的數據接口,並爆料菜鳥率先發難封殺自己,目的是讓順豐將數據從騰訊雲挪換到阿里雲。「大戰」以國家郵政局出面調停告終,雙方同意恢復業務合作和數據傳輸。
2017年6月,中國知名快遞企業順豐和阿里旗下的物流聯盟菜鳥展開「數據大戰」,最後在國家郵政局的介入下才偃旗息鼓。

企業為了保持競爭力、追求利益最大化,「保衞」數據無可厚非,但理應開放數據的政府,對數據遮遮掩掩的態度,難免有些站不住腳。

2016年,國務院總理李克強在中國大數據產業峰會上表示,中國超過80%的數據資源掌握在各級政府手裏。此前,國務院曾在2015年印發《促進大數據發展行動綱要》,首次在國家層面提出「公共數據資源開放」,要打通政府各部門數據共享、提升政府效能,並計劃在2018年年底前上線國家政府數據統一開放平台,2020年底前逐步向社會開放信用、交通、醫療等數十個領域的政府數據。

然而,推動數據開放的步伐比預想中慢很多。

從企業到政府都只想獲取,不願分享,令大數據交易難為無米之炊。

「很難,」朱國輝說,「貴陽的力度已經很大了,各個單位都是書記掛帥來做這個(數據開放),還會存在一些問題。」

中共官媒《人民日報》2月就刊文指出,不少基礎性、關鍵性數據被政府部門束之高閣,一些地方政府缺乏數據開放共享的意識,甚至把數據資源視為「私產」。

即使是相對成熟的政府數據平台,開放度也相當低。《南方週末》記者採訪了廣東佛山市南海區數據資源中心,發現無條件共享的數據只佔整個平台總數據的22%。

然而,即使是無條件共享的數據仍很難獲取。2016年,還在讀大四的王登科來到北京,和朋友創辦了一家數據平台,計劃通過網絡爬蟲蒐集政府公開數據,再整理、製成可參考的數據產品。但這一構想很快被證明行不通。

王登科發現,政府網站的數據接口總會不定期變更,令他們常常不得門而入;從網站上扒下來的很多數據格式不對,根本沒法使用。

從企業到政府都只想獲取,不願分享,令大數據交易難為無米之炊。

參差不齊的數據質素

除此之外,數據質素也令人擔憂。在大數據領域,質素指的是數據的一致性、精確性、完整性、時效性等。哈爾濱工業大學研究發現,國內的社保數據經常出現無法共享的問題,而公安、民政系統會有數據重複或不匹配的情況。

普元數據公司的產品總監王軒在接受媒體採訪時稱,在他們接觸眾多銀行案例中,經常會遇到這種情況,做完一個數據倉庫,客戶信息重名的上萬個,一個人有1000多個賬戶。

從前期制定數據標準到後期的數據處理,任何一個環節出錯都有可能導致數據質素出問題。

除此以外,還有「數據污染」的問題。「數據污染」一般有兩種情形:一種情況是原始數據傳輸過程中被惡意加入污染數據,例如黑市為增加收入,在數據中摻加無用、假的數據;另一種是在處理數據過程中造成的無意識破壞。

後一種情況事關數據處理能力。「我國大數據在底層技術上和國外差距特別大,技術都來源於 Google 等國外大公司,」國務院發展研究中心研究處處長李廣幹對媒體表示,中國的商業模式走在了技術前面。

而由此引發的思考是:在數據質量無法保證的前提下,依據大數據做出的判斷是否科學?會否反而加劇各類問題的嚴重程度,並形成惡性循環?

哈爾濱工業大學研究發現,中國的社保數據經常出現無法共享的問題,而公安、民政系統會有數據重複或不匹配的情況。
哈爾濱工業大學研究發現,中國的社保數據經常出現無法共享的問題,而公安、民政系統會有數據重複或不匹配的情況。

野蠻生長的數據黑市

另一個籠罩在數據交易領域上的陰影是黑市。

直到今天,中國仍沒有任何機構或組織制定跨區域、跨行業的大數據交易標準,法律法規對於數據的歸屬權問題更是語焉不詳。

「大數據(交易)各種標準的缺失、立法的缺失,是我們的一個瓶頸,」朱國輝說。採訪中,他多次提到「規避風險」(指侵犯隱私的風險)這個詞。

越原始的數據越值錢


貴陽大數據交易所副總裁朱國輝

2017年5月,因泄露客戶隱私,「數據堂」多位高管被帶走調查,公司市值從21億暴跌至7億。這令不少同行感到芒刺在背,紛紛對旗下業務展開排查整頓。貴交所也將交易標的從基礎數據逐漸轉變為數據分析結果,重要原因就是為了規避侵犯隱私。

但對一些買家來說,原始數據最有吸引力——它不但包含着準確的個人信息,還能無限次使用。在沒有明確交易標準的市場裏,黑市應運而生。

「越原始的數據越值錢,」朱國輝說。

據《財經》調查,黑市交易依然是中國數據交易的主流。經不完全統計,國內個人信息泄露數達55.3億條左右,平均每人就有4條相關的個人信息泄露。其中,80%的數據泄露來自「內鬼」,黑客僅佔20%。

黑市除了能買到個人身份證信息、借貸信息等原始數據,在價格上也極具競爭力。比如,正規渠道的人臉識別數據價格為每條0.1元,黑市價格則是前者的十分之一。

儘管媒體爭相報導個人數據在黑市裏「裸奔」的情況,但人們卻普遍表現冷漠,直到「徐玉玉案」的出現。2016年8月,因被詐騙電話騙走大學學費9900元,18歲的女孩徐玉玉心臟驟停,搶救無效死亡。經調查,主犯正是通過非法購買10萬條考生信息實施詐騙的。

發生在徐玉玉身上的悲劇引發了人們對於數據安全的關注,但另一個更棘手的問題也隨之產生——你產生的數據屬於你嗎?

你的數據屬於誰?

如何在政府和企業收集數據的同時,保護個人隱私?這是一條既難把握、又不斷變換的界線。目前,中國還沒有專門的法律法規來界定用戶隱私。2017年6月起實施的《網絡安全法》保護個人信息,包括但不限於公民的姓名、出生日期、身份證號碼、住址、電話等。但在大數據時代,這個界定範圍顯得很單薄。

中央民族大學法學院副教授李揚曾指出,中國傳統法律主要局限於公民隱私權的保護,但大數據時代,個人信息的邊界日益擴展和模糊,僅依靠傳統的隱私權的概念已難以保障個人信息。例如說,用戶的消費習慣、最常打車的路線等算不算隱私權?

如何在企業適度收集數據的同時,保護個人隱私?這是一條既難把握、又不斷變換的線。在大數據時代,個人信息的邊界日益擴展和模糊,僅依靠隱私概念已無法覆蓋個人信息的全部內涵。
如何在政府和企業收集數據的同時,保護個人隱私?這是一條既難把握、又不斷變換的界線。

2016年4月14日,歐洲議會(European Parliament)投票通過了商討四年之久的《一般數據保護法案》(General Data Protection Regulation, GDPR),該法案將於今年5月25日正式生效。法案要求:

  1. 設於歐盟內或為歐盟居民提供服務的企業或機構,如果收集、傳輸、保留或處理涉及 PII(Personal Identifiable
    Information,個人信息,如姓名、電郵、照片、IP 地址、照片、社交媒體帖子、醫療或財務信息),必須遵守 GDPR;
  2. 用戶可以要求系統停止記錄和使用自己的行為數據;
  3. 不能長期保存和使用用戶的行為數據,保存時限為一年半;

在保護隱私的基礎上,數據的歸屬權問題被進一步提出。

當你下載一個 App,對彈出來的安裝條款點擊「同意」時,App 的運營商便可獲取你的相關行為記錄,用作分析、精準營銷,甚至在「脱敏」(指脱掉姓名、身份證號等能鎖定身份的信息)後進行交易,此時,這些數據還屬於你嗎?

中國的法律對此尚無定論。去年3月通過的《民法總則》127條僅含糊表明:「法律對數據、網絡虛擬財產的保護有規定的,依照其規定」,但並未對數據的內涵和歸屬下定義。一些法律學者認為,用戶只是數據的產生者,沒有平台的運作和投入,數據就無法產生價值,因此數據的所有權應歸平台所有,但平台在使用數據時有保護個人隱私的義務。

這種看法引起一些用戶的不滿:大數據源於對個人數據的收集,之後雖然通過技術加工處理,但所有權仍應歸屬於個人。如果購物網站利用我的數據開發了新產品,我難道不該從收益中分一杯羹嗎?退一步講,我總有權利知道自己的數據被如何使用了吧?

當然,在現今中國,政府和企業顯然都沒有將數據所有權讓予用戶的打算。

「數據利維坦」正在降臨?

英國作家喬治·奧威爾(George Orwell)在小說《一九八四》中,建構了一個「老大哥」無時不刻不在盯着你的極權社會,充當「老大哥」的眼睛就是「電幕」——它高度敏感、且遍布各處,你的一舉一動和發出的每個聲響都會被它所監控,「一個背影都可能將你出賣」。

在法治缺失、民眾隱私意識淡薄的中國,大數據在帶來便捷生活和高效治理的同時,會否成為新時代的「隱性電幕」,成為不少人的擔憂。

和「電幕」相比,大數據介入人們生活的方式要温和得多。它不會時刻提醒「老大哥在盯着你」,讓你在權力的注視下保持高度警惕,卻能深入你的衣食住行、甚至親密關係——你每天出門的行程和使用的交通工具是數據、你在網上的瀏覽記錄和發表的言論是數據、你的朋友有哪些、常光顧的店鋪都會成為數據……你只需安心做你自己,大數據就可以在虛擬世界中為你勾勒出一幅八九不離十的肖像,並能對你未來的行為做出預判。這個時候,只要引入一套評分機制,甚至不用「老大哥」出手,就可以讓你乖乖聽話。

「你開個大奔馳每天上班,不如我騎共享單車積分高;你租個大房子一個人住,不如我一家數口租個小房子積分高;我十年積分夠了可以買房子,你分數不夠繼續積分,你想買的房子越大你需要積分的年限越高。你開個車喝水,瓶子一甩出去了,10分沒了,馬路不寬,公交車優先,你開個私家車到處受限。人家到春天都去義務植樹,你從來不去,一年又差100分。」這並非小說或電影中的情節,而是去年10月,河北雄安新區管委會負責人接受採訪時的原話。一個月後,科技巨頭阿里巴巴宣布與雄安新區達成戰略合作協議,誓言「用最先進的技術實力和創新資源,將雄安新區打造成未來城市的標杆和中國樣本」。

事實上,中國國務院在2014年就印發了一份《社會信用體系建設規劃綱要》(2014—2020年),計劃在2020年基本建立社會信用體系,屆時每個公民、企業甚至政府機構都會獲得信用評分,再配之以守信激勵和失信懲戒機制,以達致總理李克強所說的——「讓失信者寸步難行,讓守信者一路暢通」。

在這套社會信用體系中,你將如何被評分?《連線》(Wired)雜誌在去年10月的一篇長報導中,介紹了目前中國最大的個人征信平台之一、阿里巴巴旗下「芝麻信用」的評分機制,它大致包含五個方面:借貸記錄、履約記錄、個人特質、行為偏好與及人際關係,而這些數據主要都來自你在使用阿里巴巴旗下淘寶、天貓、支付寶等業務中的網絡行為。

2015年12月2日,倫敦一個關於大數據的展覽中,一名職員在數據資料投映前經過。
大數據對於社會管治帶來的變革將是顛覆性的。

可以預見,大數據對於社會管治帶來的變革將是顛覆性的。去年5月,阿里巴巴集團董事局主席馬雲,就在一次演講中宣稱大數據重新定義了計劃經濟和市場經濟——「大數據時代的出現讓人類進入了萬物互聯的時代,取得對數據進行重新處理的能力也遠遠超過過去,對世界的認識將會提升到一個新的高度,大數據讓預判和計劃都成為了可能。因此,我們需要對計劃經濟和市場經濟進行重新定義,市場經濟不一定會比計劃經濟更好。」

嗅到大數據將要帶來巨大變革的,當然不僅是科技巨頭。去年12月8日,十九屆中共中央政治局的第二次集體學習,就將主題聚焦在大數據。雄心勃勃的習近平對國家大數據戰略提出了「審時度勢、精心謀劃、超前布局、力爭主動」的十六字方針,要求各級官員深入了解大數據發展現狀和趨勢及其對經濟社會發展的影響,推進數據資源整合和開放共享,加快建設數字中國。

打通信息壁壘,形成覆蓋全國、統籌利用、統一接入的數據共享大平台,構建全國信息資源共享體系,實現跨層級、跨地域、跨系統、跨部門、跨業務的協同管理和服務。


習近平在十九屆中央政治局第二次集體學習時的講話

實現習近平提出的目標並非易事,如前文所述,目前中國數據交易行業存在諸多問題,而其中最核心的便是「數據壁壘」。只要企業和政府間、政府各部門之間的「數據壁壘」沒有打通,行之有效的社會信用體系就難以建立。如何打通「數據壁壘」?今年1月24日,人民網總裁葉蓁蓁提供了一個解決方案——「黨管數據」。他將大數據的重要性和「槍桿子」(軍隊)「筆桿子」(宣傳部門)並列,認為沒有「黨管數據」的強力介入、沒有行政力量強制打通數據壁壘,要想形成數據開放共享的大平台是不可能的,提出「黨管數據」既是趨勢也是必須。

人民網由中共最高級別的官媒人民日報主辦,在中央政治局集體學習大數據後,葉蓁蓁的這一提法頗引人關注,「黨管數據」議程會否被快速推進,「數據利維坦」是否正在降臨,這些問題的答案相信將在未來幾年內陸續揭曉。

(實習生李若一對本文亦有貢獻)


本文要點

  1. 大數據主要握在政府部門、互聯網巨頭和移動通訊企業手中,應用領域包括醫療、交通、金融、社交平台、網絡購物等等。

  2. 中國大數據交易市場最受歡迎的數據來自互聯網、金融、電信、醫療、交通和教育領域。交易形式主要有三大類:原始數據交易;按客戶需求、以原始數據為基礎分析趨勢或結果;為交易雙方提供中介服務。

  3. 近兩年,從中央到地方,陸續出台了各類推動大數據發展的政策,已有超過20個中國城市建立了大數據交易中心,但交易量普遍不大,絕大部分正規交易平台都處於虧損狀態。

  4. 中國的大數據交易面臨三大挑戰:堅固的「數據壁壘」、參差不齊的數據質素、野蠻生長的數據黑市。

  5. 目前中國的法律對於你產生的數據是否屬於你並沒有清楚的界定,但顯然政府和企業都沒有將數據所有權讓予用戶的打算。

  6. 中國的互聯網巨頭和決策層都預感到大數據對社會管治帶來的變革將是顛覆性的。習近平對國家大數據戰略提出了「審時度勢、精心謀劃、超前布局、力爭主動」的十六字方針。

  7. 「數據壁壘」是建立社會信用體系中最難攻克的關卡,對此,人民網總裁葉蓁蓁提出了「黨管數據」的方案,認為須用行政力量強制打通數據壁壘。

讀者評論 20

會員專屬評論功能升級中,稍後上線。加入會員可閱讀全站內容,享受更多會員福利。
  1. 「有而的」應為「而有的」

  2. 社會實驗下的掌控數據,未來是否會發展成有錢人能夠透過方法避開自己被數據化,而中產、窮人階層能夠免費使用一些服務,只要他們能夠願意提供數據。成為一個大實驗體。

  3. “党管数据”真是扎心了,这位人民网总裁就不怕“党管数据”之后,自己的数据被党一分析发现政治忠诚度不够高,然后被封杀?

  4. 为什么文几乎完全忽略阿里腾讯两大横跨线上线下无处不在的巨头呢?这俩才是掌控无数人的社交言论消费兴趣的数据利维坦啊。

  5. 在 iPad 端上,最后的本文要点有排版问题,这个宋体的数字看着很不舒服,“10”看着像“IO”。
    作为数据分析相关专业学生,个人在求职市场上的观察是,数据分析师(analyst)的需求远比美国小。多得是「数据平台工程师」,进行平台和分析工具的开发。觉得在分析端,如何正确的解读数据也许还有很大的缺口。

  6. 同意png兄的看法,大数据挖掘和分析在国内虽然刚刚起步,但是行业垄断企业对个人信息进行商业应用的深度和广度都在加强,更不要说背后还有更强大的政府机构。而对于专业大数据企业而言,通过合法的数据源进行数据采集举步维艰,一方面是政策限制,另一方面是数据垄断,这样的双重压力限制了大数据产业的发展。

  7. 問題不在技術本身,而在是誰支配技術。

  8. 我本身是做大數據的,在網上,你一生所看過的文章、寫過的任何東西、你的手機去過的 physical 地點、你在所有網站/apps 做過的動作,這一切的資料基本上都有個 copy, 保留在某個地方。一個不受人民監控的結構(例如一些政府)若有渠道和能力整合這些數據,它對人的控制能力將會無法想像。還有,big data 科技還有非常多的發展。人類基本上開始進入了「零私隱」時代。我個人覺得非常可怕。

  9. 最可惡的是那些協助邪惡發展大數據來限制公民權利的爪牙!那個馬臉的阿里還沾沾自喜在台上示範如何使用大數據來侵犯個人的隱私,台下的吃瓜觀眾還很佩服的樣子,真可悲!

  10. 對此,人民網總裁葉蓁蓁提出了「黨管數據」的方案,認為須用行政力量強制打通數據壁壘.<.---- 如果明著來的"黨管數據"枇不是老大哥, 那無言了

  11. 技术水平太弱就别玩数据了。比如文中提到那个扒数据的,竟然说数据格式不对无法使用…… 格式都给你搞好了还要你处理个屁unstructured data啊?🙄

  12. 看來還有人不了解, 甚至有意不理會背後的問題, 地球上別的地方也出問題, 不代表你自身的問題就不是問題

  13. 争来争去,到底科技革命利好垄断寡头还是普罗大众,取决于传播的深度和广度,但你就是没办法对抗科技发展的潮流

  14. 科技神

  15. 任何人在你国生活,本质上都和裸奔没有太大的区别

  16. 早日立法监管黑市,规范数据交易行为才是正道。目前数据挖掘技术主要集中在几家互联网巨头手里,但早晚会普及,能否阻止“原始”的数据流入市场是确保隐私的唯一途径。至于商业数据壁垒,巨头们肯定不会自己打破,但不排除提供给政府的可能。一句话,个人信息的采集无法阻止,关键在于如何选择有公信力的信息采集者,而数据产生后的交易行为需要立法来规范。

  17. 不懂技术的人瞎写技术的时候,满眼都是大数据人工智能机器学习,而且越是零编程经验喊得越响。欧盟的“被遗忘权”是个人诉讼的依据,整体上不改变企业和政府收集数据的行为,而且GCHQ等情报机构一直有事实上的豁免权,五只眼棱镜门才过去几年隐私就喊得震天响了。大陆一发展点什么,就是太快了请等等你的人民,我看没什么问题。只能是技术改变隐私的边界,不可能反过来隐私改变技术。

  18. 看到积分那段,想起了英剧《黑镜》中类似的一集。