香港

還用肉眼看民意?他在Facebook Text-mining,要讓政府不再「離地」

傅景華認為,傳統的民意調查已不足以反映全面的民意,網絡數據可彌補其不足。


香港大學新聞及傳媒研究中心副教授傅景華。
香港大學新聞及傳媒研究中心副教授傅景華。攝:葉家豪/端傳媒

近年,網絡和社交媒體已成了世界各地群眾通訊聯繫、組織活動,以及動員的重要媒介。幾場大型的社會運動,包括2010年的阿拉伯之春、2011年的美國佔領華爾街,以及2014年的台灣太陽花學運,網絡均發揮了舉足輕重的作用。在2016年美國總統大選中,社交媒體更成為候選人的重要戰場之一。

而在香港,網絡亦已深入港人生活。根據2015年出版的《香港統計月刊》顯示,全港使用互聯網的人數,由2000年的186萬人,上升至2014年的505萬人,增幅達172%,近八成10歲及以上的港人有使用互聯網服務。互聯網的普及,令愈來愈多港人喜歡通過不同網絡平台發表言論,話題涵蓋各種類型範疇。而當中網上論政更蔚然成風:有人發洩對政府不滿,有人支持政府施政;有人支持泛民,有人支持本土理念,各抒己見,甚至形成壁壘分明、派系林立的情況。

香港大學新聞及傳媒研究中心副教授傅景華,近年專注研究中港兩地的社交網絡生態,研究項目包括將微博被刪帖子「起死回生」的weiboSCOPE項目。2016年6月28日,傅景華到訪端傳媒,跟編輯部和端傳媒讀者分享他的社交網絡研究項目,以及背後觀察到的現象。

政府:輿論研究靠肉眼觀察?這是大問題!

2011年,傅景華團隊受香港特區政府的「中央政策組」委託,研究香港網絡上的輿論,藉此了解和分析網絡民意。他表示,當年網絡上的分享平台仍是以博客(Blogger)、討論區為主,而當時政府觀察民意的方法是:派兩名同事在每天早上,花3至4個小時靠肉眼閱讀網上帖文,然後撰寫報告。

「這是一個大問題,因為晚上才是最好觀察網絡的時間。早上觀察不但可能遺漏昨晚的帖文,即時性也不夠,而且人眼的觀察還是會有選擇性的。」傅景華說。

為了能更有效率和較全面地呈現整個網絡民意,傅景華設計了一個全自動的電腦系統,負責收集帖文、關鍵字、熱門討論內容等,以及每天的更新資料,如轉發內容、新的活動和Facebook專頁的資料等。

這個電腦系統每天不間斷運作,將網民輿論統統收集在龐大的數據庫中,然後每天早上七點鐘,準時把過去24小時的數據傳給香港政府。

要充分和全面了解市民的聲音和訴求,傅景華認為政府再不能繼續「離地」,輕視網絡民意,應透過分析網絡大數據輔助政策制訂和討論,同時也需要擬定一個公眾參與政策(Public Engagement Policy),改善回覆公眾訴求的方法。

網絡數據彌補傳統民意調查不足

要掌握民意傾向,許多人首先想到的是電話調查、街頭問卷。但在傅景華看來,這些傳統的民意研究方法並不能全面掌握民意。

「你們平時有收到民調的電話嗎?你們接聽民調電話時,反應是怎樣呢?會立即掛線嗎?還是會先聽是什麼機構打來的呢?」傅景華指出,傳統電話民調如果需要收集500個有效的電話調查樣本,實際上需要撥出50000通電話,成功率只有1%;有些人聽到來自民意調查的電話便會直接掛線,有些人會在接電話的途中掛線。

傳統的民意調查能夠真正反應民意嗎?傅景華說,這愈發令人存疑。他引用了最近英國脫歐的例子,指出脫歐前的民意調查大多顯示英國人較傾向留歐,但結果卻意外地是脫歐勝出。傳統的民意調查,看來已不足以反映全面的民意。

「所以我在想,網上信息會否是反映民意的另一種方法呢?」傅景華認為,收集網絡數據的優點是能提供即時的民意走勢評估。現時由鍾庭耀帶領的香港大學民意研究計劃,調查每月進行一次,較難把握月份之間的民意浮動。而且,由於網上數據相比電話調查有更多情感文字表達,有助於呈現市民意見和分析背後原因。他曾試過以網絡收集得來的數據,推測下一次港大民調的民情指數,發現在大多數時間,網絡民意都能成功「預測」民情指數的趨向。

不過,網絡民意也並非萬能。對於以網絡估算選舉結果,傅景華卻表示成功率只是「一半半」。「在香港的選民中,年長人士的比重是高的,但其實在人口上年輕人的比例是高的,所以很難估算。而且選舉行為和觀感態度是不同的,比如在一般民意調查上,老人家可能會因為看到政府的負面新聞,而影響了對政府的滿意度,但在投票上行為就很實際了,會考慮實際利益。這個情況不只限於香港,英國脫歐的民意反差也是一樣。」

從Facebook看社會撕裂

2013年,傅景華和團隊還開展另一項有趣的研究計劃。他預計2014年港人將會對香港政治制度改革(政改)有熾熱的討論,決定於2014年7月開始收集數據。他指出這次研究特別著眼於激烈的社會議題上,用以探討社會民意撕裂(cyberbalkanization)的情況。他選擇首先從Facebook入手收集資料,因為香港的Facebook用戶比率位處全球首位,加上沒有網絡審查,人們能在網絡上暢所欲言,很適合用來研究民意。

雖然傅景華仍有繼續分析討論區和網上新聞媒體,但重心開始轉移到分析1萬個活躍的Facebook專頁的數據。「這兩年討論區的形勢改變了很多,討論內容較多是娛樂、色情、遊戲等,就連高登討論區也只有少數是關於社會的討論。現在大部分公開社會討論都轉移至Facebook了。」

「透過Facebook的分享功能,我主要想看到人們對政府的態度,比如是負面與否。如果我們相信分享的內容能反映出人們自己認同的信息,那麼他們把信息分享出去,而他們的朋友又再分享出去,只要數據量夠大,我們就能從分享的行為上看到政改的意見分裂情況。」

他認為互相分享的頻密程度越高,關係就越密切,並根據這個原則發現了兩個最大群體:本土派和主流派。而在不同派別當中,各派會使用不同的語言表達方式,建立起自己的身份認同。美國學者安德森(Benedict Anderson)曾指出語言是建構「想像共同體」的重要工具。

因此,傅景華透過從Facebook帖文「挖掘文字」(Textmining),以電腦運算原則提取最大社群的特徵關鍵字,比較本土派和主流派的言論用字分別:本土派使用較多的字詞包括「本土」、「熱血」,針對的對象則是「大陸」、「共產黨」、「中國」和「左膠」;而主流派的熱門用字包括「明報」、「政府」、「梁振英」等。「我們看到本土派言論較多針對『大陸』、『中國』,而主流派的對象則主要是『政府』、『梁振英』,沒有針對中央。這可能與主流派的社會訴求有關,他們認為政改該是特區內的討論,所以較少講及共產黨。」

網媒影響力關鍵,離不開「信任」

在人人都可以發言的網絡世界,到底誰的影響力更大?

傅景華說,在虛擬網絡上,表面上每個人都是一個媒體,每個人都能設立網站,但實際上「給人聽到的能力低,只有百分之幾的人有大的網絡影響力」。

傅景華曾在2014年7月至11月期間,以滾雪球方式收集885個與香港相關的Facebook專頁,並計算各專頁的網絡中介度(Betweenness,即左右網絡資料流向的能力),以此量化專頁的網絡影響力,並製作了一個中介度排名。由於當時正值佔領運動,中介度較高的專頁都與社運相關,如香港獨立媒體、學聯、評論人健吾和學民思潮。

而自2014年7月開始,他和團隊一直收集Facebook的數據,共收集了23個月,並比較兩次觀察的結果,發現Facebook專頁的影響力排名已有不少更替。不少佔領時的主導團體,例如學聯、香港獨立媒體,其影響力越來越低,取而代之的包括排名登頂的「100 毛」。「比如說100毛轉發端的文章的話,就會產生信息爆炸!這是因為它的粉絲多。」

圖:端傳媒設計部

不過,在網絡中,影響力變化很快。傅景華坦言,香港社交媒體話語權的轉變,能發生於一夜之間。「就像100毛能否長期保持地位呢?我不知道。因為對於一種表現模式,網民很容易感到厭倦,只要有更潮的新媒體出現,就能輕易被取替了。」

然而,話語權的轉變雖然很快,但他指出,「信任」則不容易被代替。若要提升網上新聞媒體的自身影響力,傅景華立即說:「建立trust(信任)吧!」「網絡上沒可能每個人都對你好,但若人們願意信任你,願意看你的報導,或者至少會看標題,那麼他們也會較願意在社交平台上分享。」

2017 年 7 月,端傳媒啟動了對深度內容付費的會員機制。在此之前刊發的深度原創報導,都會免費開放,歡迎轉發,也期待你付費支持我們

如果你喜歡,就分享給更多人吧