中國因素

旅遊網站馬蜂窩被爆八成點評抄襲,網上社區數據造假已是公開秘密?

有數據類自媒體23日發文表示此事件傳播中也有疑似水軍,但未知僱傭者是哪一方,有人稱公司營銷買「水軍」無可厚非,有人則反對,你怎麼看?


旅遊論壇網站馬蜂窩被爆點評抄襲。 圖:Imagine China
旅遊論壇網站馬蜂窩被爆點評抄襲。 圖:Imagine China

旅遊論壇網站馬蜂窩被爆點評造假,網上社區數據造假已是公開的秘密嗎?

有數據類自媒體23日發文表示此事件傳播中也有疑似水軍,但未知僱傭者是哪一方,有人稱讚揭露,也有人表示以用戶生產內容為主營的公司「抄襲」者眾,馬蜂窩只是「撞槍口」,你怎麼看?

如果可以選擇,水軍集合的繁榮,與真實的蕭條,你會怎麼選?

10月20日及21日,中國大陸自媒體帳號「小聲比比」連續發布兩篇文章,指估值約175億人民幣的旅遊論壇網站馬蜂窩涉及用戶評論抄襲及造假,馬蜂窩隨後回應稱,已進行了數據核查並反指爆料者為「有組織攻擊行為」。「小聲比比」22日晚再次發文反擊並被熱傳至閱讀量10萬以上,馬蜂窩隨後起訴提供數據的深圳乎睿數據有限公司及公眾號作者丁子荃(筆名:梓泉),獲北京朝陽區法院立案。

馬蜂窩創建於2006年,是總部位於北京的旅遊論壇網站,主要提供平台,讓註冊用戶分享旅行故事及世界各地旅遊攻略、共享酒店機票等旅行信息。馬蜂窩自稱旅行攻略及相關信息覆蓋全球95%以上熱門景區,含200多個國家及地區,用戶主要來自中國大陸、香港、台灣及馬來西亞等地。

馬蜂窩2012年底用戶達313萬人,居於中國大陸UGC型(User Generated Content,用戶原創内容)旅行網站榜首,2013年2月註冊用戶突破600萬。目前,其網站描述中稱已有1億位旅行者,涉及92萬家國際酒店信息,共2100萬條真實點評,3.8億次攻略下載,是「中國旅遊行業第一部『玩法』」。今年8月,馬蜂窩更被曝計劃融資3億美元,其網站市場估值達25億美元。

微信公眾號「小聲比比」表示,乎睿數據團隊的三個同學為美國常青藤高校數據挖掘、語意分析專業,一次點評時被商家反指為水軍團隊,因而決定建立一個篩選點評中水軍的的數據模型,並用當時廣告漫天的馬蜂窩進行練手。經四個月數據篩選,乎睿團隊發現馬蜂窩存在點評內容抄襲、內部員工搶占公開抽獎福利、水軍污染等多個問題,並在被幾家知名科技媒體拒絕刊載後於自媒體「小聲比比」上發出。

「小聲比比」10月20日至22日三日發表的《估值175億的旅遊獨角獸,是一座殭屍和水軍構成的鬼城?》《馬蜂窩開始毀滅證據了,但這水平真的哈哈哈哈哈哈哈哈》《我承認,我們是有組織攻擊馬蜂窩的》共三篇文章中,主要指出了馬蜂窩網站存在的以下問題:

  • 點評內容大量抄襲

乎睿數據團隊發現,馬蜂窩點評數量會在特定時間節點指數級上升,後斷崖式回落,且同一用戶出現性別相反自相矛盾、評論有明顯語句不順的翻譯跡象等狀況。

他們在馬蜂窩116萬家餐廳中選取了三分之一的樣本,並訂立標準為,一字不差的抄襲150個其他網站不同用戶的帳號為「抄襲帳號」,發現樣本中有7454個抄襲帳號,其中每個人從攜程、藝龍、美團、Agoda、Yelp中搬運抄襲了數千條點評,共抄襲572萬條餐飲類點評,佔其官網自稱總數的85%。

  • 網站抽獎或搶購福利等多分配予內部人員

乎睿數據發現,很多抄襲帳號活躍於各類官方抽獎中並屢次成為大獎的「幸運得主」。

  • 作為馬蜂窩核心競爭力的遊記部分也遭水軍的嚴重污染

文中指,遊記評論區是之前發現的抄襲帳號「第二戰場」,多發布「有沒有詳細介紹」、「沒更新完吧」等重複評論。與此同時,遊記中有很多違規的營銷遊記,其中有不少選改成低俗標題並置換商家照片的營銷遊記。

  • 問答板塊中,抄襲帳號在冷啟動及融資時期尤為活躍。

馬蜂窩10月22日曾發布官方回應,承認點評內容中存在部分抄襲,但虛假點評帳號「微乎其微」,稱原自媒體文誇大、歪曲事實,並指其是「已被查證的有組織攻擊行為」。「小聲比比」昨晚發完指馬蜂窩回應避重就輕,且並未回應除點評抄襲外的其他指控。馬蜂窩隨後起訴並獲立案。

然而有趣的是,數據類自媒體「知微數據」23日發文表示,在此事件的微博傳播上,他們也發現了疑似水軍的表現,主要發布該消息的三家媒體微博帳號轉發量數萬,但傳播最大深度僅6層,且轉發文本中90%僅為「轉發微博」,而有半數轉發者微博暱稱為「用戶XXXX」的形式。

「知微數據」提到,由於轉發文本中未表現明顯態度,因而無法判斷疑似的水軍是哪一方所為,但在@馬蜂窩旅遊 的微博回應中,高贊支持馬蜂窩的佔比高達85%,熱評描述的語句表達也非常相似。

面對馬蜂窩被爆料,有網民稱讚數據團隊的揭露,也有網民表示以用戶生產內容為主營的公司「抄襲」者眾,馬蜂窩只是「撞槍口」。事實上,在《我承認,我們是有組織攻擊馬蜂窩的》一文中,作者也指被記者採訪時無一例外提問「社區數據造假已經是公開秘密了,你在揭發時就沒有想到嗎?」然而作者也反問我們是想要活在水軍、造假、抄襲中的,還是活在一個沒那麼繁榮,但誠實能得到回報、真話可以得到保護的世界?

中國因素