特首選戰 香港

臉書大數據告訴你:四名特首參選人,誰是網絡紅人?

當外界以為曾俊華搶佔網上支持輿論陣地,又或親建制人士一面倒支持林鄭月娥,大數據卻得出意想不到的結果。


圖:Wilson Tsang / 端傳媒

特首選舉將於3月26日舉行,為爭取大眾關注,參選人紛紛大打網絡戰,社交媒體被開闢成一個新戰場。不過在社交媒體中,我們常常生活於同溫層中,假若你支持其中一名參選人,你的臉書朋友可能也大多如此,但公眾輿情是否真的這樣?我們如何可以更客觀了解網絡輿情?

「慧科大數據」(www.ceelection2017.com)近日運用一套由語言學家團隊研發的系統,在社交媒體上分析了四位熱門參選人:胡國興、葉劉淑儀、林鄭月娥、曾俊華的網絡輿情,再提供數據給端傳媒進一步分析,最終發現許多意想不到的研究結果。由即日起,一系列研究結果將於端傳媒定期發布。

網絡輿情受什麽影響?

在香港,Facebook是最主要的社交媒體,用戶逾500萬;有調查並發現,近半香港人透過Facebook獲得新聞資訊。因此,由2017年1月1日到2月16日,「慧科大數據」系統選出了76個傳媒Facebook專頁,一共辨識出450011條跟四位參選人相關的帖文及留言。

這套由語言學家團隊研發的系統,能有效辨識廣東話詞組及本地網絡用語(如「高登」用語);同時,針對今次特首選舉,語言學家團隊聯同編輯團隊,每天更新選戰相關的最新詞組,審視其屬性,在帖文中識別出表達支持及不支持的內容。

圖:端傳媒設計部
  • 林鄭月娥1月16日宣布參選,網上支持度即日下降8.3%,不支持度則上升10.3%;之後一日,外界有指中央較屬意林鄭月娥,選情被看高一線,她的支持度也隨即大升20.5%,不支持度下跌19.4%,是統計期間其網上輿情波幅最大的一天。

  • 1月18日,林鄭月娥在受訪時回應外界視她為「梁振英2.0」,她澄清只是要延續梁振英施政理念,而非延續其路線,其支持度升至統計期間最高位,錄得34.3%。

  • 1月20日至22日,林鄭月娥連續三天爆出公關事件:包括落區時被傳媒拍下她不懂用八達通入閘;她在閉門活動中的言論流出,指她向傳媒高層說自己參選,是為了避免出現中央不任命特首的憲制危機;及在便利店買不到廁紙,要坐的士回政務司司長官邸。她的支持度逐日下降12%,跌至2.8%;但反對聲音同樣減弱,不支持度減少了8.6%,反映大眾對這些事件,並不非一面倒負面。

  • 林鄭月娥1月27日落區時,在沙田遇到一名操普通話的行乞老婦,林鄭月娥問候對方並給予500元,其不支持度隨即升至88%,是統計期內最高位。

圖:端傳媒設計部
  • 1月12日,林鄭月娥宣布辭職參選,而辭職一個月的曾俊華仍未獲中央批准,外界質疑曾俊華不獲中央支持,其不支持度超越支持度,出現「黃金交叉點」。

  • 曾俊華的支持度,在他1月13日接受網台訪問後一度回升,但隨後兩天,在中央仍未接納其辭職的情況下,外界對其選情信心動搖,支持度持續下滑了19.7%,不支持度也大幅上升了23.3%,在1月15日再次出現「黃金交叉點」;及至中央在1月16日接納曾俊華辭職後,民情才逆轉。

  • 1月19日,曾俊華宣布參選,並開設新Facebook專頁,支持度在隨後一天上升至統計期內最高位,錄得70.8%。

  • 林鄭月娥1月29日受訪時指放棄全民退保,是基於財政司司長的數據;曾俊華反駁「未計過這條數」,其不支持度這天升至統計期內最高位,達到48.9%。

圖:端傳媒設計部
  • 葉劉淑儀1月8日出席基層住屋展覽時,體驗躺在棺材房,有關照片在網絡上瘋傳,當天95.4%與她有關的網上言論,均屬不支持或負面。

  • 由1月15日葉劉淑儀宣布參選後,反對聲音漸趨緩和,其不支持度整體向下,至1月24日,雖然未有出現重大事件,但其網情出現「黃金交叉點」,支持度超越不支持度。慧科形容,這反映網民對她的態度較為飄忽。

  • 葉劉淑儀前年在車公廟被麒麟撞到,至1月30日農曆新年前夕,網民再次關注事件,其不支持度飆升至78.2%。

圖:端傳媒設計部
  • 1月6日,胡國興批評林鄭月娥未有諮詢公眾,便推行西九故宮的做法可能違法,其支持度升至統計期內最高的71.4%;他於1月23日再在Facebook發帖,諷刺林鄭月娥「不懂買廁紙」,其支持度在這一天升至64.4%,顯示其支持度通常依靠嘲諷對手得來。

  • 1月29日,胡國興不支持度升至統計期內最高的74.1%,但當日未有重大事件。慧科形容,胡國興在一月維持「正評多,但關注度低」;而慧科分析網民不支持的言論,主要與胡國興在去年10月28日,說「佔中好玩」的言論有關。

  • 胡國興在2月5日更新政綱,加入就《基本法》22條保障兩制的條文立法,其支持度和不支持度,在隨後兩日逐步上升,至2月7日分別錄得43.8%及25%,反映大眾對議題意見分歧。

不同群組網民,他們鍾情誰?

除了整體「支持度」與「不支持度」外,慧科大數據也按網媒專頁特性,將76個Facebook專頁歸類爲「年輕」如《100毛》、「知識份子」如《信報》、「親建制」如「港人講地」;未能歸類的則列為「其他」,不少主流媒體像《蘋果日報》、《明報》等都包括在內,佔的比重為四組中最大。

圖:端傳媒設計部
圖:端傳媒設計部
  • 曾俊華在「其他」傳媒的支持度明顯較高,但波幅也較大,在20%至75%之間上落;林鄭月娥的支持度則徘徊在0%至15%。

  • 相反,林鄭月娥在「其他」傳媒的不支持度偏高,平均約80%,拋離曾俊華。

  • 曾俊華的公關策略走「親民」路線,年輕人普遍較為受落,在針對年輕人的傳媒專頁中,曾俊華明顯較受觀迎,支持度在1月22日升至100%;其不支持度相對較低,部分日子甚至沒有出現相關言論。

  • 至於林鄭月娥,一直被年輕人詬病不懂網民心態,公關手法落伍,她在這個群組中,支持度大部分時間都低於20%;相反,在統計期內,她的不支持度有五天達到100%。

  • 在針對親建制的專頁中,林鄭月娥則較受歡迎,支持度在1月3日達到100%,不支持度也較低,反映林鄭月娥較受建制傳媒追捧。

  • 曾俊華雖然同屬建制陣營,但在親建制專頁,其支持度一直不及林鄭月娥,不支持的波幅也較大,顯示建制派對他的觀感不太一致。

誰是網民討論焦點?

如果將四名參選人放在一起分析,在同一天所有支持或不支持的言論,他們又是否能搶佔輿論陣地?

圖:端傳媒設計部
圖:端傳媒設計部
  • 外界一般認為林鄭月娥的支持度低,但事實上近30%日子,多於一半的言論都是支持林鄭月娥,大部分日子支持言論,比受到網民歡迎的曾俊華還要多;不支持度方面,同樣是林鄭月娥佔大多數,統計期內只有3天,不支持她的言論是少於一半,這反映了林鄭月娥一直是網民討論焦點,而大眾對她的評價各走極端。

  • 胡國興一向正評較多,不過當與其他參選人一併比較﹐只有1月24日,支持他的言論在四人中最多,意味他的關注度不高。

「負評」參選人時,網民用了什麽字眼?

「慧科大數據」也分析了網民評價參選人的用詞,並會定期更新政治用語的詞庫。

舉例說,「麒麟」本是瑞獸,但在是次選戰,當它跟其中一位參選人配搭上,便成為表達「不支持」的詞組之一。

圖:端傳媒設計部
  • 在不支持林鄭月娥的言論中,較多出現涉及「人身攻擊」的字眼,其中以其名字諧音「淋病」稱呼她,在過去六周中,有五周成為熱門詞的首位。

  • 1月1日至1月28日四周內,負評的言論往往涉及林鄭月娥的公關事件,熱門詞由「故宮/西九」,轉為「上帝」,再轉為「廁紙」和「行乞」。

  • 1月29日至2月11日兩周內,不支持林鄭月娥的言論,開始同時提及其主要對手曾俊華,又或提及網民對曾俊華的暱稱「薯片」。

圖:端傳媒設計部
  • 提及曾俊華的不支持言論較少,在統計的六周內,只有一周出現10個熱門詞,而且用字相對溫和,針對他個人的只有「hea」(編按:廣東話中指做事懶散)。

  • 1月1日至1月14日兩周內,「中央」成為負評曾俊華的熱門詞,留言普遍認為「中央」不信任曾俊華,但隨着中央在1月12日批准他辭職,「中央」的熱度隨之下降。

  • 1月1日至1月28日四周內,曾俊華在針對年輕人和知識分子的專頁,幾乎沒有錄得負面評論的字眼,反映他在這兩個群體中形象較正面。

圖:端傳媒設計部
  • 1月1日至1月14日兩周內,網民不支持葉劉淑儀的言論相對嚴苛,例如熱門詞首位的「十年」,網民有提及「十年以來不斷賣港」等。

  • 網民認為葉劉淑儀經常妒忌其他參選人,感到酸溜溜,戲稱她為「葡萄」,這個詞在林鄭月娥1月16日宣布參選後上榜,反映葉劉淑儀的選情越來越不被看好。

  • 不支持葉劉淑儀的言論中,林鄭月娥的名字較常出現,網民經常比較二人參選;至2月5日最後一周,不支持葉劉淑儀的言論中,其他三名熱門參選人的名字均有出現,反映她自身受到的關注不斷減弱。

圖:端傳媒設計部
  • 負評胡國興的熱門詞較少,字眼相對溫和,在針對年輕和知識分子的專頁,他錄得的負面批評,較曾俊華更少。

  • 在針對知識分子的專頁中,較常出現支持胡國興的言論,熱門詞包括「公平」、「公正」和「公義」,這些熱門詞並無出現在針對其他群組的專頁,顯示這些可能是知識分子重視的價值。

香港 2017香港特首選戰 香港特首

2017 年 7 月,端傳媒啟動了對深度內容付費的會員機制。在此之前刊發的深度原創報導,都會免費開放,歡迎轉發,也期待你付費支持我們

如果你喜歡,就分享給更多人吧