香港

还用肉眼看民意?他在Facebook Text-mining,要让政府不再“离地”

傅景华认为,传统的民意调查已不足以反映全面的民意,网络数据可弥补其不足。

端传媒实习记者 刘雪玲 发自香港

刊登于 2016-07-03

香港大学新闻及传媒研究中心副教授傅景华。
香港大学新闻及传媒研究中心副教授傅景华。

近年,网络和社交媒体已成了世界各地群众通讯联系、组织活动,以及动员的重要媒介。几场大型的社会运动,包括2010年的阿拉伯之春、2011年的美国占领华尔街,以及2014年的台湾太阳花学运,网络均发挥了举足轻重的作用。在2016年美国总统大选中,社交媒体更成为候选人的重要战场之一。

而在香港,网络亦已深入港人生活。根据2015年出版的《香港统计月刊》显示,全港使用互联网的人数,由2000年的186万人,上升至2014年的505万人,增幅达172%,近八成10岁及以上的港人有使用互联网服务。互联网的普及,令愈来愈多港人喜欢通过不同网络平台发表言论,话题涵盖各种类型范畴。而当中网上论政更蔚然成风:有人发泄对政府不满,有人支持政府施政;有人支持泛民,有人支持本土理念,各抒己见,甚至形成壁垒分明、派系林立的情况。

香港大学新闻及传媒研究中心副教授傅景华,近年专注研究中港两地的社交网络生态,研究项目包括将微博被删帖子“起死回生”的weiboSCOPE项目。2016年6月28日,傅景华到访端传媒,跟编辑部和端传媒读者分享他的社交网络研究项目,以及背后观察到的现象。

政府:舆论研究靠肉眼观察?这是大问题!

2011年,傅景华团队受香港特区政府的“中央政策组”委托,研究香港网络上的舆论,借此了解和分析网络民意。他表示,当年网络上的分享平台仍是以博客(Blogger)、讨论区为主,而当时政府观察民意的方法是:派两名同事在每天早上,花3至4个小时靠肉眼阅读网上帖文,然后撰写报告。

“这是一个大问题,因为晚上才是最好观察网络的时间。早上观察不但可能遗漏昨晚的帖文,即时性也不够,而且人眼的观察还是会有选择性的。”傅景华说。

为了能更有效率和较全面地呈现整个网络民意,傅景华设计了一个全自动的电脑系统,负责收集帖文、关键字、热门讨论内容等,以及每天的更新资料,如转发内容、新的活动和Facebook专页的资料等。

这个电脑系统每天不间断运作,将网民舆论统统收集在庞大的数据库中,然后每天早上七点钟,准时把过去24小时的数据传给香港政府。

要充分和全面了解市民的声音和诉求,傅景华认为政府再不能继续“离地”,轻视网络民意,应透过分析网络大数据辅助政策制订和讨论,同时也需要拟定一个公众参与政策(Public Engagement Policy),改善回复公众诉求的方法。

网络数据弥补传统民意调查不足

要掌握民意倾向,许多人首先想到的是电话调查、街头问卷。但在傅景华看来,这些传统的民意研究方法并不能全面掌握民意。

“你们平时有收到民调的电话吗?你们接听民调电话时,反应是怎样呢?会立即挂线吗?还是会先听是什么机构打来的呢?”傅景华指出,传统电话民调如果需要收集500个有效的电话调查样本,实际上需要拨出50000通电话,成功率只有1%;有些人听到来自民意调查的电话便会直接挂线,有些人会在接电话的途中挂线。

传统的民意调查能够真正反应民意吗?傅景华说,这愈发令人存疑。他引用了最近英国脱欧的例子,指出脱欧前的民意调查大多显示英国人较倾向留欧,但结果却意外地是脱欧胜出。传统的民意调查,看来已不足以反映全面的民意。

“所以我在想,网上信息会否是反映民意的另一种方法呢?”傅景华认为,收集网络数据的优点是能提供即时的民意走势评估。现时由钟庭耀带领的香港大学民意研究计划,调查每月进行一次,较难把握月份之间的民意浮动。而且,由于网上数据相比电话调查有更多情感文字表达,有助于呈现市民意见和分析背后原因。他曾试过以网络收集得来的数据,推测下一次港大民调的民情指数,发现在大多数时间,网络民意都能成功“预测”民情指数的趋向。

不过,网络民意也并非万能。对于以网络估算选举结果,傅景华却表示成功率只是“一半半”。“在香港的选民中,年长人士的比重是高的,但其实在人口上年轻人的比例是高的,所以很难估算。而且选举行为和观感态度是不同的,比如在一般民意调查上,老人家可能会因为看到政府的负面新闻,而影响了对政府的满意度,但在投票上行为就很实际了,会考虑实际利益。这个情况不只限于香港,英国脱欧的民意反差也是一样。”

从Facebook看社会撕裂

2013年,傅景华和团队还开展另一项有趣的研究计划。他预计2014年港人将会对香港政治制度改革(政改)有炽热的讨论,决定于2014年7月开始收集数据。他指出这次研究特别著眼于激烈的社会议题上,用以探讨社会民意撕裂(cyberbalkanization)的情况。他选择首先从Facebook入手收集资料,因为香港的Facebook用户比率位处全球首位,加上没有网络审查,人们能在网络上畅所欲言,很适合用来研究民意。

虽然傅景华仍有继续分析讨论区和网上新闻媒体,但重心开始转移到分析1万个活跃的Facebook专页的数据。“这两年讨论区的形势改变了很多,讨论内容较多是娱乐、色情、游戏等,就连高登讨论区也只有少数是关于社会的讨论。现在大部分公开社会讨论都转移至Facebook了。”

"透过Facebook的分享功能,我主要想看到人们对政府的态度,比如是负面与否。如果我们相信分享的内容能反映出人们自己认同的信息,那么他们把信息分享出去,而他们的朋友又再分享出去,只要数据量够大,我们就能从分享的行为上看到政改的意见分裂情况。”

他认为互相分享的频密程度越高,关系就越密切,并根据这个原则发现了两个最大群体:本土派和主流派。而在不同派别当中,各派会使用不同的语言表达方式,建立起自己的身份认同。美国学者安德森(Benedict Anderson)曾指出语言是建构“想像共同体”的重要工具。

因此,傅景华透过从Facebook帖文“挖掘文字”(Textmining),以电脑运算原则提取最大社群的特征关键字,比较本土派和主流派的言论用字分别:本土派使用较多的字词包括“本土”、“热血”,针对的对象则是“大陆”、“共产党”、“中国”和“左胶”;而主流派的热门用字包括“明报”、“政府”、“梁振英”等。“我们看到本土派言论较多针对‘大陆’、‘中国’,而主流派的对象则主要是‘政府’、‘梁振英’,没有针对中央。这可能与主流派的社会诉求有关,他们认为政改该是特区内的讨论,所以较少讲及共产党。”

网媒影响力关键,离不开“信任”

在人人都可以发言的网络世界,到底谁的影响力更大?

傅景华说,在虚拟网络上,表面上每个人都是一个媒体,每个人都能设立网站,但实际上“给人听到的能力低,只有百分之几的人有大的网络影响力”。

傅景华曾在2014年7月至11月期间,以滚雪球方式收集885个与香港相关的Facebook专页,并计算各专页的网络中介度(Betweenness,即左右网络资料流向的能力),以此量化专页的网络影响力,并制作了一个中介度排名。由于当时正值占领运动,中介度较高的专页都与社运相关,如香港独立媒体、学联、评论人健吾和学民思潮。

而自2014年7月开始,他和团队一直收集Facebook的数据,共收集了23个月,并比较两次观察的结果,发现Facebook专页的影响力排名已有不少更替。不少占领时的主导团体,例如学联、香港独立媒体,其影响力越来越低,取而代之的包括排名登顶的“100 毛”。“比如说100毛转发端的文章的话,就会产生信息爆炸!这是因为它的粉丝多。”

不过,在网络中,影响力变化很快。傅景华坦言,香港社交媒体话语权的转变,能发生于一夜之间。“就像100毛能否长期保持地位呢?我不知道。因为对于一种表现模式,网民很容易感到厌倦,只要有更潮的新媒体出现,就能轻易被取替了。”

然而,话语权的转变虽然很快,但他指出,“信任”则不容易被代替。若要提升网上新闻媒体的自身影响力,傅景华立即说:“建立trust(信任)吧!”“网络上没可能每个人都对你好,但若人们愿意信任你,愿意看你的报导,或者至少会看标题,那么他们也会较愿意在社交平台上分享。”

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。

延伸阅读