中国大数据四问:官商民集体狂欢的背后,“数据利维坦”正在降临?

光鲜表象之下,中国大数据产业是在稳步发展,还是在野蛮生长?在法律法规缺失的情况下,个人隐私与数据使用如何平衡?大数据的广泛应用,是会带来便捷高效的生活,还是让威权变得坚不可摧?
大数据正以前所未有的力量影响著政府决策、商业活动乃至每个人的日常生活。业内预期,中国有望在2020年成为世界第一数据资源大国。图为2017年5月27日,贵阳举办的2017中国国际大数据产业博览会期间,一位参加者在数据分析中心。
数洞 大陆 大数据 威权政治 隐私与安全

在世界上任何一个国家或地区,“大数据”可能都没有在中国这般光彩夺目——最高层视其为重要的执政资源、社会治理变革的关键所在,作为国家级的战略部署强力推进;科技巨头们渴望透过它掌握用户行为、获取更大利润,不惜斥巨资对手中数据进行分析、挖掘和利用;普通民众则在数据带来的便利中自我陶醉——买着被精心推送的商品,看着被算法层层筛选过的新闻,随时随地扫码付账,却将个人隐私忘得一干二净。

政府、企业和民众,在对待大数据这件事上吊诡地实现了高度一致。大数据正以前所未有的力量影响着政府决策、商业活动乃至每个人的日常生活。中国也一举成为大数据领域的排头兵,不仅数据资源占有量即将成为全球第一,在数据分析和数据交易领域也走在世界前列,政策的扶持、宽松的监管和民众对于隐私的忽视,让大数据和人工智能、基因编辑技术等一起,成为中国实现“弯道超车”的核心所在。

然而,光鲜的表象之下,中国的大数据交易产业是在稳步发展,还是在野蛮生长?在相关法律法规缺失的情况下,个人隐私与数据使用如何平衡?大数据的广泛应用,是会带来便捷高效的生活,还是会孳生出“数据利维坦”,让威权变得更加坚不可摧?我们为你梳理了与中国「大数据」密切相关的四个问题。

图为中国第一家以大数据命名的交易所——贵阳大数据交易所。
图为中国第一家以大数据命名的交易所——贵阳大数据交易所内景。

什么是“大数据”?它有什么用?

当你去医院看牙,蛀虫长在哪颗牙齿上都会被录入卫生部门的医疗数据库;只要输入关键字,民政部门就可以轻松知道你所在的街道有多少「单身狗」;你上个月买了两本书、却花三个钟头挑选指甲油的行为会被淘宝网精确记录,你每天凌晨狂刷朋友圈的行为也会收入腾讯“囊中”,百度记下了你在情人节前搜索廉价机票的动作……成千上万个“你”的数据被搜集、整理在一起,形成大数据。

管理咨询公司麦肯锡(McKinsey&Company)这样定义“大数据”(Big Data):一种数据集合,其规模大到在获取、存储、管理、分析方面都大大超出传统数据库软件工具的能力范围。和传统数据相比,大数据来源多元、种类繁多,更新速度非常快,且庞杂冗余,需要经过“提纯”才能产生价值。

这些数据主要握在政府管理部门、互联网巨头和移动通讯企业手中,涉及领域包括医疗、交通、金融、社交平台、网络购物、通信记录等等。

大数据要怎么用呢?最简单的例子:只要你在购物网站浏览过一次塑身衣,网站就会向你推荐五花八门的减肥产品,从减肥药、健身球到产后私教课。这就是精准营销,也是目前大数据应用最广泛、成熟的领域。

除此之外,风险控制、精细化运营也是大数据应用较多的领域。比如说,电力公司的数据可以帮助金融行业控制风险,当某企业的用电量出现异常时,其经营面临问题的可能性增大,银行在放贷时就要慎重考虑。再比如,一个家电经销商搜集用户资料,分析发现80后女性是主力军,经销商便在日后主推美容电器、吹风机等受80后女性喜欢的产品。

在政府管理方面,大数据的应用领域广泛,如利用移动通信等大数据监控公共场所的人群流量。图为2017年国庆期间,南京市的大量游客聚集在中山陵园。
政府可以利用移动通信等大数据监控公共场所的人流量,来避免踩踏事件。图为2017年国庆期间,大量游客聚集在中山陵。

在政府管理方面,大数据的应用领域也很广泛。比如,利用移动通信等大数据监控公共场所的人流量,来避免踩踏事件、调配公共交通;依据卫生部门的新生儿数据,教育部可规划应相应建设多少小学、培养多少教师;通过监测社交平台的舆论,避免负面民意的聚集和爆发。

大数据的拥趸将其称之为“新石油”,并声称我们正从金融资本主义时代迈向数据资本主义时代。狂热信徒们相信大数据可以为各类问题提供普世解决方案,以色列历史学家尤瓦尔·诺亚·哈拉里(Yuval Noah Harari)甚至认为,他们的热乎劲儿简直可以视为一种新宗教的诞生。

但拥趸眼中的美好未来横亘着不少障碍,除了侵犯隐私和滥用的忧虑外,想要数据的人和拥有数据的人常常是错位的。在上述例子中,银行希望得到电力公司的数据,政府安全部门想拿到社交平台的数据,但这些数据能否开放及进行交易呢?

大数据如何交易?

在 Google 输入“大数据交易”,可获得超过208万条结果。除了背靠地方政府建立的各类数据交易平台,阿里云、京东万象等互联网巨头也提供各类数据分析服务,类似的小公司更是不计其数。

目前交易市场最受欢迎的数据来自互联网、金融、电信、医疗、交通和教育领域。交易形式主要有三大类:原始数据交易;按客户需求、以原始数据为基础分析趋势或结果;为交易双方提供中介服务。

进入交易市场的原始数据大多是交易平台从网上采集、整理来的数据。比如,有家平台收集了国内外50万家酒店信息,包括地点、价格、评价等,打包出售,售价2500元。也有逐条收费的,某平台出售记录心律失常的数据库,每条数据0.01元。

不过,目前多数企业不具备分析大数据的能力,他们更愿意带着诉求、请数据公司从大数据中“打捞”出有商业价值的相关信息。阿里云提供的“营销引擎”就是这样一种分析服务:以阿里巴巴庞大的用户数据库为基础,利用数据标签筛选出对口的消费人群,实现精准营销。比如保健品公司想推销一款高价钙片,筛选人群的标签则应包括中老年、常买保健品、单位时间内消费总额/单价高。

至于交易中介,它们本身并不拥有数据,只负责为交易双方牵线搭桥。以贵阳大数据交易所(下称“贵交所”)提供的一起中介服务为例:当地卫生部门决定交易一部分医疗数据,先和贵交所一起定出价格,再放入平台展卖。贵阳市一家制药公司看中了,便向平台付钱买入这批数据,交易所得由贵交所和卫生部门四六分成。制药公司则通过分析这批数据,开发了更有针对性的新药。

“目前还是一个卖方定价的过程,”贵交所副总裁朱国辉对端传媒表示。贵交所实行协议定价,买方也可以还价。贵交所是中国第一家大数据交易所,2015年在贵州政府的扶持下成立,曾得到国务院总理李克强的批示。

近两年,从中央到地方,陆续出台了各类推动大数据发展的政策,贵州、上海、武汉、哈尔滨纷纷建起大数据交易中心,至今已超过20个。图为贵阳大数据交易所。
近两年,从中央到地方,陆续出台了各类推动大数据发展的政策,图为贵阳大数据交易所。

近两年,从中央到地方,陆续出台了各类推动大数据发展的政策,贵州、上海、武汉、哈尔滨等城市纷纷建起大数据交易中心,至今已超过20个。

这些背靠各地政府的平台在获取政府数据接口时具有得天独厚的优势。一名交易所高管向端传媒透露,平台交易的数据介于政府公开数据和秘密数据之间。

在交易平台上,政府是卖方也是买方。因为不同地区、不同部门的政府数据尚未打通,A地交通部门会购买B地的交通数据作为管理参考,公安部门也会想从通信企业购买数据。

中国的数据交易平台早在2010年左右就开始陆续建立,从业者起初都对未来自信满满,认定数据交易是个产值达万亿的新产业。但现实并非如此,根据《财经》杂志今年1月刊发的一篇调查报导,有政府和国资背景的大数据交易所大部分生意寥寥,纯市场化的数据服务公司盈利状况也欠佳。

不少熟稔情况的业内人士在网络平台讨论:一些政府的大数据项目耗资百万甚至千万,但搭建的平台根本不具备数据处理能力,有而的承建企业只想套取政府为建设数据平台提供的土地资源和政策优惠。

截止2017年10月,获国家政策扶持的贵阳大数据交易所,两年多的累计交易额不过1.2亿元(人民币,下同)。大数据交易的业内高管对《财经》表示,少有年收入突破千万的大数据交易所。在业界名声颇盛的基础数据提供商“数据堂”在经营好转的情况下,半年仍亏损近400万。据《财经》统计,这些正规平台一年的收入加起来还不到50亿。

“大家还在探索、试错,”朱国辉说。

中国的大数据交易现状是怎样的?

坚固的“数据壁垒”

“任何一个企业的高管都不会轻易让出数据,因为风险远远大于收益,”朱国辉说,“数据的可复制性很强,一家企业付出很多代价积淀的核心数据,一旦流出会被很快复制。”

“拿走数据的多,贡献数据的少。”贵交所执行总裁王参寿此前亦曾对媒体表示,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据,免费开放的就更是凤毛麟角。

2017年6月,中国知名快递企业顺丰和阿里旗下的物流联盟菜鸟展开“大战”。顺丰突然宣布关闭对菜鸟的数据接口,并爆料菜鸟率先发难封杀自己,目的是让顺丰将数据从腾讯云挪换到阿里云。“大战”以国家邮政局出面调停告终,双方同意恢复业务合作和数据传输。

这场战争暴露了企业间对大数据资源的激烈争夺。“对一个市值2000亿元的企业(顺丰)来说,无偿献血给另一个公司(菜鸟),是不可能发生的,”快递专家赵小敏对媒体表示。

2017年6月,顺丰快递和阿里旗下的物流联盟菜鸟展开“大战”。顺丰突然宣布关闭对菜鸟的数据接口,并爆料菜鸟率先发难封杀自己,目的是让顺丰将数据从腾讯云挪换到阿里云。“大战”以国家邮政局出面调停告终,双方同意恢复业务合作和数据传输。
2017年6月,中国知名快递企业顺丰和阿里旗下的物流联盟菜鸟展开“数据大战”,最后在国家邮政局的介入下才偃旗息鼓。

企业为了保持竞争力、追求利益最大化,“保卫”数据无可厚非,但理应开放数据的政府,对数据遮遮掩掩的态度,难免有些站不住脚。

2016年,国务院总理李克强在中国大数据产业峰会上表示,中国超过80%的数据资源掌握在各级政府手里。此前,国务院曾在2015年印发《促进大数据发展行动纲要》,首次在国家层面提出“公共数据资源开放”,要打通政府各部门数据共享、提升政府效能,并计划在2018年年底前上线国家政府数据统一开放平台,2020年底前逐步向社会开放信用、交通、医疗等数十个领域的政府数据。

然而,推动数据开放的步伐比预想中慢很多。

从企业到政府都只想获取,不愿分享,令大数据交易难为无米之炊。

“很难,”朱国辉说,“贵阳的力度已经很大了,各个单位都是书记挂帅来做这个(数据开放),还会存在一些问题。”

中共官媒《人民日报》2月就刊文指出,不少基础性、关键性数据被政府部门束之高阁,一些地方政府缺乏数据开放共享的意识,甚至把数据资源视为“私产”。

即使是相对成熟的政府数据平台,开放度也相当低。《南方周末》记者采访了广东佛山市南海区数据资源中心,发现无条件共享的数据只占整个平台总数据的22%。

然而,即使是无条件共享的数据仍很难获取。2016年,还在读大四的王登科来到北京,和朋友创办了一家数据平台,计划通过网络爬虫搜集政府公开数据,再整理、制成可参考的数据产品。但这一构想很快被证明行不通。

王登科发现,政府网站的数据接口总会不定期变更,令他们常常不得门而入;从网站上扒下来的很多数据格式不对,根本没法使用。

从企业到政府都只想获取,不愿分享,令大数据交易难为无米之炊。

参差不齐的数据质素

除此之外,数据质素也令人担忧。在大数据领域,质素指的是数据的一致性、精确性、完整性、时效性等。哈尔滨工业大学研究发现,国内的社保数据经常出现无法共享的问题,而公安、民政系统会有数据重复或不匹配的情况。

普元数据公司的产品总监王轩在接受媒体采访时称,在他们接触众多银行案例中,经常会遇到这种情况,做完一个数据仓库,客户信息重名的上万个,一个人有1000多个账户。

从前期制定数据标准到后期的数据处理,任何一个环节出错都有可能导致数据质素出问题。

除此以外,还有“数据污染”的问题。“数据污染”一般有两种情形:一种情况是原始数据传输过程中被恶意加入污染数据,例如黑市为增加收入,在数据中掺加无用、假的数据;另一种是在处理数据过程中造成的无意识破坏。

后一种情况事关数据处理能力。“我国大数据在底层技术上和国外差距特别大,技术都来源于 Google 等国外大公司,”国务院发展研究中心研究处处长李广干对媒体表示,中国的商业模式走在了技术前面。

而由此引发的思考是:在数据质量无法保证的前提下,依据大数据做出的判断是否科学?会否反而加剧各类问题的严重程度,并形成恶性循环?

哈尔滨工业大学研究发现,中国的社保数据经常出现无法共享的问题,而公安、民政系统会有数据重复或不匹配的情况。
哈尔滨工业大学研究发现,中国的社保数据经常出现无法共享的问题,而公安、民政系统会有数据重复或不匹配的情况。

野蛮生长的数据黑市

另一个笼罩在数据交易领域上的阴影是黑市。

直到今天,中国仍没有任何机构或组织制定跨区域、跨行业的大数据交易标准,法律法规对于数据的归属权问题更是语焉不详。

“大数据(交易)各种标准的缺失、立法的缺失,是我们的一个瓶颈,”朱国辉说。采访中,他多次提到“规避风险”(指侵犯隐私的风险)这个词。

越原始的数据越值钱


贵阳大数据交易所副总裁朱国辉

2017年5月,因泄露客户隐私,“数据堂”多位高管被带走调查,公司市值从21亿暴跌至7亿。这令不少同行感到芒刺在背,纷纷对旗下业务展开排查整顿。贵交所也将交易标的从基础数据逐渐转变为数据分析结果,重要原因就是为了规避侵犯隐私。

但对一些买家来说,原始数据最有吸引力——它不但包含着准确的个人信息,还能无限次使用。在没有明确交易标准的市场里,黑市应运而生。

“越原始的数据越值钱,”朱国辉说。

据《财经》调查,黑市交易依然是中国数据交易的主流。经不完全统计,国内个人信息泄露数达55.3亿条左右,平均每人就有4条相关的个人信息泄露。其中,80%的数据泄露来自“内鬼”,黑客仅占20%。

黑市除了能买到个人身份证信息、借贷信息等原始数据,在价格上也极具竞争力。比如,正规渠道的人脸识别数据价格为每条0.1元,黑市价格则是前者的十分之一。

尽管媒体争相报导个人数据在黑市里“裸奔”的情况,但人们却普遍表现冷漠,直到“徐玉玉案”的出现。2016年8月,因被诈骗电话骗走大学学费9900元,18岁的女孩徐玉玉心脏骤停,抢救无效死亡。经调查,主犯正是通过非法购买10万条考生信息实施诈骗的。

发生在徐玉玉身上的悲剧引发了人们对于数据安全的关注,但另一个更棘手的问题也随之产生——你产生的数据属于你吗?

你的数据属于谁?

如何在政府和企业收集数据的同时,保护个人隐私?这是一条既难把握、又不断变换的界线。目前,中国还没有专门的法律法规来界定用户隐私。2017年6月起实施的《网络安全法》保护个人信息,包括但不限于公民的姓名、出生日期、身份证号码、住址、电话等。但在大数据时代,这个界定范围显得很单薄。

中央民族大学法学院副教授李扬曾指出,中国传统法律主要局限于公民隐私权的保护,但大数据时代,个人信息的边界日益扩展和模糊,仅依靠传统的隐私权的概念已难以保障个人信息。例如说,用户的消费习惯、最常打车的路线等算不算隐私权?

如何在企业适度收集数据的同时,保护个人隐私?这是一条既难把握、又不断变换的线。在大数据时代,个人信息的边界日益扩展和模糊,仅依靠隐私概念已无法覆盖个人信息的全部内涵。
如何在政府和企业收集数据的同时,保护个人隐私?这是一条既难把握、又不断变换的界线。

2016年4月14日,欧洲议会(European Parliament)投票通过了商讨四年之久的《一般数据保护法案》(General Data Protection Regulation, GDPR),该法案将于今年5月25日正式生效。法案要求:

  1. 设于欧盟内或为欧盟居民提供服务的企业或机构,如果收集、传输、保留或处理涉及 PII(Personal Identifiable
    Information,个人信息,如姓名、电邮、照片、IP 地址、照片、社交媒体帖子、医疗或财务信息),必须遵守 GDPR;
  2. 用户可以要求系统停止记录和使用自己的行为数据;
  3. 不能长期保存和使用用户的行为数据,保存时限为一年半;

在保护隐私的基础上,数据的归属权问题被进一步提出。

当你下载一个 App,对弹出来的安装条款点击“同意”时,App 的运营商便可获取你的相关行为记录,用作分析、精准营销,甚至在“脱敏”(指脱掉姓名、身份证号等能锁定身份的信息)后进行交易,此时,这些数据还属于你吗?

中国的法律对此尚无定论。去年3月通过的《民法总则》127条仅含糊表明:“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,但并未对数据的内涵和归属下定义。一些法律学者认为,用户只是数据的产生者,没有平台的运作和投入,数据就无法产生价值,因此数据的所有权应归平台所有,但平台在使用数据时有保护个人隐私的义务。

这种看法引起一些用户的不满:大数据源于对个人数据的收集,之后虽然通过技术加工处理,但所有权仍应归属于个人。如果购物网站利用我的数据开发了新产品,我难道不该从收益中分一杯羹吗?退一步讲,我总有权利知道自己的数据被如何使用了吧?

当然,在现今中国,政府和企业显然都没有将数据所有权让予用户的打算。

“数据利维坦”正在降临?

英国作家乔治·奥威尔(George Orwell)在小说《一九八四》中,建构了一个“老大哥”无时不刻不在盯着你的极权社会,充当“老大哥”的眼睛就是“电幕”——它高度敏感、且遍布各处,你的一举一动和发出的每个声响都会被它所监控,“一个背影都可能将你出卖”。

在法治缺失、民众隐私意识淡薄的中国,大数据在带来便捷生活和高效治理的同时,会否成为新时代的“隐性电幕”,成为不少人的担忧。

和“电幕”相比,大数据介入人们生活的方式要温和得多。它不会时刻提醒“老大哥在盯着你”,让你在权力的注视下保持高度警惕,却能深入你的衣食住行、甚至亲密关系——你每天出门的行程和使用的交通工具是数据、你在网上的浏览记录和发表的言论是数据、你的朋友有哪些、常光顾的店铺都会成为数据……你只需安心做你自己,大数据就可以在虚拟世界中为你勾勒出一幅八九不离十的肖像,并能对你未来的行为做出预判。这个时候,只要引入一套评分机制,甚至不用“老大哥”出手,就可以让你乖乖听话。

“你开个大奔驰每天上班,不如我骑共享单车积分高;你租个大房子一个人住,不如我一家数口租个小房子积分高;我十年积分够了可以买房子,你分数不够继续积分,你想买的房子越大你需要积分的年限越高。你开个车喝水,瓶子一甩出去了,10分没了,马路不宽,公交车优先,你开个私家车到处受限。人家到春天都去义务植树,你从来不去,一年又差100分。”这并非小说或电影中的情节,而是去年10月,河北雄安新区管委会负责人接受采访时的原话。一个月后,科技巨头阿里巴巴宣布与雄安新区达成战略合作协议,誓言“用最先进的技术实力和创新资源,将雄安新区打造成未来城市的标杆和中国样本”。

事实上,中国国务院在2014年就印发了一份《社会信用体系建设规划纲要》(2014—2020年),计划在2020年基本建立社会信用体系,届时每个公民、企业甚至政府机构都会获得信用评分,再配之以守信激励和失信惩戒机制,以达致总理李克强所说的——“让失信者寸步难行,让守信者一路畅通”。

在这套社会信用体系中,你将如何被评分?《连线》(Wired)杂志在去年10月的一篇长报导中,介绍了目前中国最大的个人征信平台之一、阿里巴巴旗下“芝麻信用”的评分机制,它大致包含五个方面:借贷记录、履约记录、个人特质、行为偏好与及人际关系,而这些数据主要都来自你在使用阿里巴巴旗下淘宝、天猫、支付宝等业务中的网络行为。

2015年12月2日,伦敦一个关于大数据的展览中,一名职员在数据资料投映前经过。
大数据对于社会管治带来的变革将是颠覆性的。

可以预见,大数据对于社会管治带来的变革将是颠覆性的。去年5月,阿里巴巴集团董事局主席马云,就在一次演讲中宣称大数据重新定义了计划经济和市场经济——“大数据时代的出现让人类进入了万物互联的时代,取得对数据进行重新处理的能力也远远超过过去,对世界的认识将会提升到一个新的高度,大数据让预判和计划都成为了可能。因此,我们需要对计划经济和市场经济进行重新定义,市场经济不一定会比计划经济更好。”

嗅到大数据将要带来巨大变革的,当然不仅是科技巨头。去年12月8日,十九届中共中央政治局的第二次集体学习,就将主题聚焦在大数据。雄心勃勃的习近平对国家大数据战略提出了“审时度势、精心谋划、超前布局、力争主动”的十六字方针,要求各级官员深入了解大数据发展现状和趋势及其对经济社会发展的影响,推进数据资源整合和开放共享,加快建设数字中国。

打通信息壁垒,形成覆盖全国、统筹利用、统一接入的数据共享大平台,构建全国信息资源共享体系,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。


习近平在十九届中央政治局第二次集体学习时的讲话

实现习近平提出的目标并非易事,如前文所述,目前中国数据交易行业存在诸多问题,而其中最核心的便是“数据壁垒”。只要企业和政府间、政府各部门之间的“数据壁垒”没有打通,行之有效的社会信用体系就难以建立。如何打通“数据壁垒”?今年1月24日,人民网总裁叶蓁蓁提供了一个解决方案——“党管数据”。他将大数据的重要性和“枪杆子”(军队)“笔杆子”(宣传部门)并列,认为没有“党管数据”的强力介入、没有行政力量强制打通数据壁垒,要想形成数据开放共享的大平台是不可能的,提出“党管数据”既是趋势也是必须。

人民网由中共最高级别的官媒人民日报主办,在中央政治局集体学习大数据后,叶蓁蓁的这一提法颇引人关注,“党管数据”议程会否被快速推进,“数据利维坦”是否正在降临,这些问题的答案相信将在未来几年内陆续揭晓。

(实习生李若一对本文亦有贡献)


本文要点

  1. 大数据主要握在政府部门、互联网巨头和移动通讯企业手中,应用领域包括医疗、交通、金融、社交平台、网络购物等等。

  2. 中国大数据交易市场最受欢迎的数据来自互联网、金融、电信、医疗、交通和教育领域。交易形式主要有三大类:原始数据交易;按客户需求、以原始数据为基础分析趋势或结果;为交易双方提供中介服务。

  3. 近两年,从中央到地方,陆续出台了各类推动大数据发展的政策,已有超过20个中国城市建立了大数据交易中心,但交易量普遍不大,绝大部分正规交易平台都处于亏损状态。

  4. 中国的大数据交易面临三大挑战:坚固的“数据壁垒”、参差不齐的数据质素、野蛮生长的数据黑市。

  5. 目前中国的法律对于你产生的数据是否属于你并没有清楚的界定,但显然政府和企业都没有将数据所有权让予用户的打算。

  6. 中国的互联网巨头和决策层都预感到大数据对社会管治带来的变革将是颠覆性的。习近平对国家大数据战略提出了“审时度势、精心谋划、超前布局、力争主动”的十六字方针。

  7. “数据壁垒”是建立社会信用体系中最难攻克的关卡,对此,人民网总裁叶蓁蓁提出了“党管数据”的方案,认为须用行政力量强制打通数据壁垒。

读者评论 20

会员专属评论功能升级中,稍后上线。加入会员可阅读全站内容,享受更多会员福利。
  1. 「有而的」應為「而有的」

  2. 社會實驗下的掌控數據,未來是否會發展成有錢人能夠透過方法避開自己被數據化,而中產、窮人階層能夠免費使用一些服務,只要他們能夠願意提供數據。成為一個大實驗體。

  3. “党管数据”真是扎心了,这位人民网总裁就不怕“党管数据”之后,自己的数据被党一分析发现政治忠诚度不够高,然后被封杀?

  4. 为什么文几乎完全忽略阿里腾讯两大横跨线上线下无处不在的巨头呢?这俩才是掌控无数人的社交言论消费兴趣的数据利维坦啊。

  5. 在 iPad 端上,最后的本文要点有排版问题,这个宋体的数字看着很不舒服,“10”看着像“IO”。
    作为数据分析相关专业学生,个人在求职市场上的观察是,数据分析师(analyst)的需求远比美国小。多得是「数据平台工程师」,进行平台和分析工具的开发。觉得在分析端,如何正确的解读数据也许还有很大的缺口。

  6. 同意png兄的看法,大数据挖掘和分析在国内虽然刚刚起步,但是行业垄断企业对个人信息进行商业应用的深度和广度都在加强,更不要说背后还有更强大的政府机构。而对于专业大数据企业而言,通过合法的数据源进行数据采集举步维艰,一方面是政策限制,另一方面是数据垄断,这样的双重压力限制了大数据产业的发展。

  7. 問題不在技術本身,而在是誰支配技術。

  8. 我本身是做大數據的,在網上,你一生所看過的文章、寫過的任何東西、你的手機去過的 physical 地點、你在所有網站/apps 做過的動作,這一切的資料基本上都有個 copy, 保留在某個地方。一個不受人民監控的結構(例如一些政府)若有渠道和能力整合這些數據,它對人的控制能力將會無法想像。還有,big data 科技還有非常多的發展。人類基本上開始進入了「零私隱」時代。我個人覺得非常可怕。

  9. 最可惡的是那些協助邪惡發展大數據來限制公民權利的爪牙!那個馬臉的阿里還沾沾自喜在台上示範如何使用大數據來侵犯個人的隱私,台下的吃瓜觀眾還很佩服的樣子,真可悲!

  10. 對此,人民網總裁葉蓁蓁提出了「黨管數據」的方案,認為須用行政力量強制打通數據壁壘.<.---- 如果明著來的"黨管數據"枇不是老大哥, 那無言了

  11. 技术水平太弱就别玩数据了。比如文中提到那个扒数据的,竟然说数据格式不对无法使用…… 格式都给你搞好了还要你处理个屁unstructured data啊?🙄

  12. 看來還有人不了解, 甚至有意不理會背後的問題, 地球上別的地方也出問題, 不代表你自身的問題就不是問題

  13. 争来争去,到底科技革命利好垄断寡头还是普罗大众,取决于传播的深度和广度,但你就是没办法对抗科技发展的潮流

  14. 科技神

  15. 任何人在你国生活,本质上都和裸奔没有太大的区别

  16. 早日立法监管黑市,规范数据交易行为才是正道。目前数据挖掘技术主要集中在几家互联网巨头手里,但早晚会普及,能否阻止“原始”的数据流入市场是确保隐私的唯一途径。至于商业数据壁垒,巨头们肯定不会自己打破,但不排除提供给政府的可能。一句话,个人信息的采集无法阻止,关键在于如何选择有公信力的信息采集者,而数据产生后的交易行为需要立法来规范。

  17. 不懂技术的人瞎写技术的时候,满眼都是大数据人工智能机器学习,而且越是零编程经验喊得越响。欧盟的“被遗忘权”是个人诉讼的依据,整体上不改变企业和政府收集数据的行为,而且GCHQ等情报机构一直有事实上的豁免权,五只眼棱镜门才过去几年隐私就喊得震天响了。大陆一发展点什么,就是太快了请等等你的人民,我看没什么问题。只能是技术改变隐私的边界,不可能反过来隐私改变技术。

  18. 看到积分那段,想起了英剧《黑镜》中类似的一集。