讀者十論:「絕地求生」

「讀者十論」欄目每週擇選報導及圓桌話題中十條精彩讀者留言刊出。

【編者按】「讀者評論精選」欄目每週擇選報導及圓桌話題中十條精彩讀者留言刊出。部分留言可能會因應長度及語意清晰作節錄或編輯。

1. 釋放,回應《今時今日,誰來為「所有華人」說「黑貓中隊」的故事?》

看到當年對峙的老兵老了後互相贈禮,真是感慨。在歷史的大背景下的基層士兵只是可以消耗的工具,但脱離了戰場和大環境賦予的敵對意識,一個個其實都是活生生的人。

2. 咸鱼姬,回應《運營資格被凍結後,全球最大遊戲市場試圖「絕地求生」》

分級問題已經是老生常談了,從十幾年前網絡普及開始討論至今,所謂分級制依舊十劃都未有一撇。在12年以前,ACGN文化最興盛的時代,分級制都沒能提上日程,更勿論12年之後大家長上台,有的只會是惡名昭彰的楊永信們繼續輸出戒網癮治不聽話技術,各路官媒添油加醋呼天搶地控訴ACGN害人不淺,禁ACGN比禁煙積極十倍。

當年討論分級制,網友提到一個詞——自由裁量權。分級意味著界限分明,紅線明確,這對創作者而言當然有好處,但這不是大家長所希望的。界限越模糊,表述越曖昧,自由裁量權才越大,掌權者才能最大限度地管控創作者。沒有分級制,掌權者可以按需處罰,並且每一次處罰看上去都合乎法律,畢竟相關法律條文同樣包羅萬有,總有一條能把創作者關進籠子里。抄襲和盜版未必會把創作者逼上絕路,唯有審查和自由裁量權可以。

大家長會放棄控制慾嗎?不會的,大家長最害怕的是有一天發現小孩不再完全按照他的思維去走。分級是不可能分級了,這輩子都不可能分級的。

另一方面,大家長在害怕失去控制權的同時,也在害怕失去遊戲企業帶來的稅收。於是大家長靈光一閃,允許遊戲企業製作面向海外市場的遊戲,只能出口不能內銷。說到底,大家長依舊是把ACGN當毒草,但把毒草賣給海外賺賺外國人的錢還是可以接受的,完了還覺得自己很聰明,并沾沾自喜。

說起來,可能很多人都不記得,大陸曾經禁止銷售掌機了吧?時代其實一直沒有變。

3. 痂銘,回應《跨域洋垃圾:全球經濟、社會與空間的不均發展》

垃圾問題不單單是發達國家供給側的問題。之前看到的一篇日文報導有提到早期中國商家能夠給出兩倍於日本商家的價格去收購資源類垃圾,久而久之日本國內的垃圾回收產業萎縮,對輸出垃圾形成了一時難以改變的依賴。

4. 師機、micks,回應《很想買,但沒信心:消費降級,一個即將抵達的目的地?》

師機:所以文中的個人例子只是更加論證降級為消費觀念的變化,文中亦談到了宏觀數據與民間討論趨向。人們更多是保守焦慮擔憂,宏觀經濟數據對此有所反應。但事實上的消費降級按照作者列舉的例子不足以說明會出現。也許消費會降級,而之前的圖新奇虛榮過渡貪婪消費更加熱潮減退,但最要命的是當下消費者正在醖釀的,無論上下不管當下消費如何,對長遠未來越來越消極的信心與預期,這才是最終可能會造成事實消費降級的原因。

micks:其實之前的消費升級只是由於商品流通範圍和種類迅速發展(代購,網購)背景下全社會的消費試誤而已。當然也是互聯網巨頭為了推高股價的輿論導向下產生的一個term。現在的消費也是如此,否則想拼多多這些垃圾公司又怎麼能騙投資人的錢上市,圓那些創辦人的暴富夢?

5. FrankLiuPhD,回應圓桌話題《哈佛專家被查學術造假波及甚廣,我們該用什麼態度面對學術權威?》

首先需要強調的最基本的一點是,任何類型的學術造假(比如實驗的基本設計選擇,源頭數據的收集過程,數據篩選過程,統計模型的選擇,最後生成結果的修改以及闡述等)都是無法接受的。我僅在這裏討論沒有學術造假的前提下,我們該如何去理解所謂的學術權威下的研究結果?由於這篇回覆是一時興起寫成的,接下來分為多個角度的探討並沒有嚴格意義上的先後次序。有的論點長,有的短,但如果有不嚴謹需要補充的部分,請端友們一起探討。

第一,絕大多數涉及到利用統計模型來完成驗證的論文,都離不開所謂的「5%」統計顯著性(statistical significance)。舉一個不甚嚴謹但簡單易懂的例子。比如說如果一個人想驗證喝可樂是否會導致禿頭,那麼一個理想的情況是找來1000名各類體徵相同(性別,年齡,身高,體重,種族,遺傳史等等)的志願者,其中500個人每天喝可樂,500個人每天不喝。實驗反覆進行一段時間後比較兩組人群的脱髮情況。由於兩組人的本質區別在於是否喝可樂,如果最後喝可樂的那組人脱髮比不喝的人脱髮更多,那是不是能證明喝可樂導致禿頭呢?這裏就涉及到對統計結果的分析問題上。換句話說,我們不是簡單的比較「是否」多還是少,而是比較如果脱髮更多,多「多少」才能下這個結論。套用一句俗語,研究的世界沒有非黑即白,只是關注於灰的程度而已。

那這個5%的統計顯著性表示的是什麼?它代表了我們想比較的兩組人脱髮的差異是由於一個具體的系統因素,而不是偶然因素的影響而產生的。如果我們想驗證的是「喝可樂不影響脱髮」,那這個5%可以理解為:在觀察到的實驗結果基礎上,「喝可樂不影響脱髮」的情況有5%的可能性。那如果選擇的統計模型最後算出來的值(p-value)是3%,比5%小,那實驗人員往往可以很自信的下這個結論:「喝可樂不影響脱髮」的假設被拒絕(rejected)了。如果好事的媒體讀到了這篇論文,那實驗結果可能會被轉述成:「可樂還是秀髮?只能二選一!」

但如果這個可樂及脱髮的實驗統計結果算出來的值(p-value)是12%,比5%大,那該如何下結論呢?對於大部分的學術期刊來說,這個不顯著的結果就是:「喝可樂不影響脱髮」的假設不能被拒絕。換句話說,如果做實驗的人是一心想證明「喝可樂導致脱髮」,那看到這樣的數字,心絕對涼了一大半。至少,從他們的角度來看,文章沒有多大的賣點了。

可能看到這裏,沒有統計學背景的端友會問,為什麼要以5%為標準做比較?這個數字為什麼那麼神奇?為什麼在大多數情況下,比它小,就代表着能發表,比它大,就意味着要把實驗結果束之高閣了?

這個5%最初來源於現代統計學之父,Sir Ronald A. Fisher於1926的一篇文章(見標註1)的一個「one in twenty」的說法。不排除在沒有計算機的年代,1/20是一個比較好理解的百分比數字。這裏要強調的是,他本人從來沒有對這個所謂的5%念念不忘。至於為何後來的學者引用了這個數字,就不可而知了。

在這個第一點的討論裏,我們可以看到,學術界對所謂的一個特殊值(p-value)5%,以及衍生開來的所謂1%,10%,有着特殊的情感。因為它往往代表着論文是否能發表,科研課題是否可以繼續,研究基金是否能再申請到的一個分水嶺。

從這個角度,我們延伸開來討論第二個話題,能不能在不進行學術造假的前提下,有什麼辦法得到一個能通過統計顯著性的結果?一個簡單的辦法就是提高樣本的數量。

再舉一個例子。設想端的編輯部想測試是否應該在主頁面上投入不同類型的動態廣告,取代現有的靜態廣告,從而提高廣告的點擊率。假設端的用戶有400萬人,其中300萬用戶看的是以前的靜態廣告,100萬用戶看的是新的動態廣告。在這其中:300萬看靜態廣告的用戶裏,有13個人點開了廣告;100萬看動態廣告的用戶裏,有10個人點開了廣告。

這樣的比較結果在統計上來說是顯著的(比5%小的p-value)。也就是說,動態廣告的點擊率比靜態廣告的點擊率更大。但是,這個比例的增加卻沒有什麼實際上的具體意義,因為差別只有0.00057%。換句話說,如果僅僅只是想在現有的期刊框架上發表「動態的廣告比靜態的廣告更能吸引用戶的點擊」上來說,這個結果是可以被接受的。但如果是端的編輯部花費了20萬的專家諮詢費得來的這個結果,那就沒有什麼必要了。

現在討論的第三點,讓我們回到端小二原文裏的Anversa於2001年在《自然》上發表的造假論文:「研究團隊還表示,他們在試驗用鼠身上已證明可行。」

為什麼要用老鼠?或者具體說,為什麼現在用於癌症治療的藥物開發需要在老鼠身上做研究(注:Anversa的論文並未涉及癌症治療)?用哥倫比亞大學腫瘤學家Azra Raza的話來說(見標註2),在癌症治療的研究上,我們在老鼠身上觀察到的結果往往並不適用在人身上。那為什麼還要用老鼠呢?

因為太多的科學家和實驗室花費了大量人力財力在「老鼠模型」上。當這群科學家作為同行審批彼此研究基金項目申請報告的時候,他們沒有任何動力去否決「老鼠模型」,因為他們本身就是這個模型的受益者。

最後討論第四點,如果我們把目光轉到社會科學研究上(比如經濟學,心理學),什麼樣的論文才值得信賴?或者說,什麼樣的研究設計下作出的結果才能真正接觸到所要研究問題的本質?
這裏一個非常關鍵的詞就是隨機對照試驗(randomized controlled trial, RCT)。RCT在上述傳統的醫學研究,包括我在第一點裏舉的可樂及脱髮的例子裏,都是一個最基本的要求。可這並不代表這個方法論在社會科學研究裏能被廣泛運用。

為什麼一定要強調隨機對照呢?如果我們想要做出的結論涉及到因果關係(causality),比如喝可樂導致脱髮,回覆端的圓桌討論導致失眠,那我們必須得在我們的觀察樣本中把相關性(correlation)和因果關係區分開來。舉一個常見的例子。比如說夏天太陽大天氣熱,所以我們吃冰棍。但是夏天由於太陽大,我們也很容易被曬黑。所以說,吃冰棍的行為跟曬黑有正相關性,可我們不能論述說吃冰棍導致曬黑吧?

那在社會學研究裏,為什麼要強調隨機對照呢?因為如果樣本足夠大,平均來說,治療組(treatment group)和對照組(control group)的結果在理論上是沒有區別的。如果有區別,那區別就是來自於「治療」的方案(比如說前面提到的可樂,或者動態廣告)。

在這裏舉一個非常有趣的研究。芝麻街(Sesame Street)是一個非常受歡迎的兒童節目,很多的研究都證明,從小看芝麻街能幫助提高學習能力。(注:最有名的一個例子是當今最全才的數學家陶哲軒 Terence Tao,他兩歲的時候教其他五歲的小孩怎麼拼寫跟加法。大人問他哪裏學來的。他說是看芝麻街電視上學來的。)

那作為一個嚴謹的學者,如何才能證明芝麻街節目確實能提高小孩子的學習能力呢?如果僅僅只是比較看芝麻街節目的小孩跟不看芝麻街節目的小孩,那比較出來的結果也不能排除「芝麻街更能吸引聰明的小孩」這一說法。Kerney and Levine(見標註3) 就找到了一個非常好的隨機對照設定。首先,芝麻街是1969年才開始播放的,他們首先比較了1969年後一代的小孩跟前一代的小孩在學校裏的表現。其次,由於電視轉播技術的原因,在1970年左右住在南加州的人,由於轉播信號弱,他們看不到芝麻街的節目。所以第二個隨機比較就是,在1970年的時候,大約全國有1/3的小朋友看不到,2/3的小朋友看得到這個節目。那下一步就是比較這兩組小朋友們的學習表現。

但是,在其他的社會學研究裏,能找到隨機對照試驗的設定到底有多難呢?非常,非常的難。那如果研究的結果並不是來自於隨機對照的設定呢?那怎麼看待這個結果就見仁見智了。

希望端友們在看完以上的討論,能對所謂的權威研究,有一個新的角度。

標註1: Ronald A Fisher, 1926, 「The Arrangement of Field Experiments」 Journal of the Ministry of Agriculture, 33, 504.

標註2: Azra Raza, 2014: 「What Scientific Idea is Ready for Retirement?」 https://www.edge.org/response-detail/25429

標註3: M. S. Kearney, P. B. Levine, 2016, 「Early Childhood Education by MOOC: Lessons from Sesame Street」, NBER Working Paper https://www.nber.org/papers/w21229

6. anonym,回應圓桌話題《哈佛專家被查學術造假波及甚廣,我們該用什麼態度面對學術權威?》

亞里土多德去世後的數百年間,大多數學者都把他的世界觀視為千真萬確。只要他們能夠證明亞里士多德說過的某件事,他們便會心滿意足。這種現象有時被稱為「權威確定真理」——因為某個「權威」人土說某件事是正確的,便相相信它必定正確。

7.brianeyes88677,回應圓桌話題《哈佛專家被查學術造假波及甚廣,我們該用什麼態度面對學術權威?》

昨天才跟導師討論這件事。大家都一窩蜂的湧入做最熱門的東西,因為才好發文章、引用率才高,導致整個科研圈子變得很焦躁、急功近利,很少有人靜下心來好好思考基礎問題。如果抱持著我做這個研究的目的是能發頂級期刊論文,那肯定會做不好科研的,做研究出於內心興趣才是最重要吧。追逐熱點確實能給你帶來名利、升遷、評好教職,但那樣的科研真的是你想要的嗎?

近幾年的機器學習和量子計算領域就是這樣,所有人都在蹭熱點追求發熱門、高引用率的文章,心肌更是一堆人即便知道那明明是假的還繼續做下去。世界撤稿前20名的科學家幾乎都是中日韓學者,說明有多少人靠著造假拿到了博士學位、評上教授職、申請經費,雖然事後撤稿但藉由骯髒手段取得的利益已經拿到手了啊。先不論這十年浪費了多少人力金錢(因為科研中投入大量資源毫無產出是常有的事),但那些被施以錯誤療法的患者怎麼辦?醫生明明知道無效還讓病患去治療,這與毒疫苗般的謀殺何異?

8. 咸鱼姬,回應圓桌話題《造價千億的港珠澳大橋,經濟與政治是一本難算的賬?》

香港段貪腐造假能被發現因為過去的香港還算有一個正常的公民社會狀態,像北朝鮮就從來不存在貪腐超支造假這種事。香港大型基建造價高一部分源於人工貴,一部分源於物料需求,廉價勞動力從來不是值得誇耀的地方,偷工減料也不是。有些地方在通車前就發現有很多毛病,有些地方則是發生事故之後也沒發現有什麼毛病,到底哪個比較糟糕還真是難以抉擇。

9. micks,回應圓桌話題《造價千億的港珠澳大橋,經濟與政治是一本難算的賬?》

關於大橋經濟效益的價值。大橋的存在,通車在什麼方面促進了經濟?

通常以來,道路帶來的正面效益來自於更好的流通,實體的流通,人才的流通,而基於其定位,是促進香港內地的流通。

在我看來,大橋未開通前,其實香港和內地之間已經有良好的流通渠道,對於參與中港貿易、旅遊,這些沒有進步空間,買低賣高的行業而言即使有幫助也不會很大,當然對中港物流也有些助益。也就是說,大橋的效益是為一小部分不能再增強香港競爭力行業的人服務的。其效益就是幫香港一些把內地廉價貨物賣到香港,食水很深的貿易商和物流公司更方便的做這些事。

舉個例子,我家樓下領展的街市有一檔專門短期買一些內地東西。今天我看到了一個平底鍋,鍋面有蜂窩紋路很好認,在淘寶上是大路貨,零售價大概130人民幣左右,而在這個街市的攤位買360港幣左右。我在淘寶買,連轉運運費大概不會超過180港幣。也就是說,港珠澳大橋的功用之一就是更方便這些行業的從業者和經營者做這類買賣。

我本人並不了解這樣的經濟效益能帶動香港什麼,這樣的經濟效益有能促進香港的什麼核心競爭力,科學技術的發展。只會讓香港市民更傾向于做這些賺快錢,沒有技術含量的行業,促進香港把自己做不了的科技行業外流國內。是舍難取易,舍大取小,舍遠求近的發展策略。這又讓我想起財政預算案500億有350億是用來建地產項目的荒謬資源分配。我當初聽到這個預算案的時候真的是懷疑人生,沒有聽說過信息科技的發展是靠建房子的。阿里巴巴要建人工智能研究中心達摩院也是把錢花在請國外學術權威,行業專家和配套的「硬件」設備,相信它投的幾個億中不會有大部分用來找場地。

另一方面,對於促進國內同胞來香港旅遊消費的效益也不大。他們大多數是內地華南地區,對於他們而言香港的吸引力就在於進口產品比較便宜。對這群人而言他們只要能賺個差價,就算沒有大橋,高鐵他們乘搭動車和航空都是不錯的方法。所以對于增加本地旅遊業和對外零售實在只能說是錦上添花。

這座橋應不應該建,建的效益是不是對的起它的造價其實道現在是一目瞭然。

當然如果這座橋只是為本地的建築業經營這和地產發展商輸血,不失為一個「好」工程,至於超支,也不要賴立法會拉布,因為這個工程本身就是大白象式,輸血目標大於建造目的。拉布也只是為了阻止大橋對現實的負面效果(生態等無法量化的方面)能減少些。當然不可否認,無論怎麼樣,既得利益者都樂於成見。

但這也體現出香港的法律系統已經not function,官商勾結圍威喂的氛圍越發嚴重。如果是在古代,基本上就是進入(改革派提出改革—>利益既得群體和改革派開啟黨爭—>改革實施—>利益既得者在實行改革的各個階段扭曲政策—>改革效果背道而馳—>革新不了了之—>政府等死)的流程。

10. Vanadium,回應圓桌話題《「損害大學聲譽」擬被浸會大學納入違紀行為定義,你認同嗎?》

「損害學校聲譽」這條讓我想起了我的高中。

當時我所在的學校給我們制定的眾多規矩之一就是「不能損害學校聲譽」。還記得我上學時網絡上學校的貼吧還比較活躍,許多同學經常在上面發言,有的是討論學習內容的,還有的就是討論學校一些不盡如人意的地方,這些內容我們只能在網上討論,因為在學校討論被老師聽到是要受處分的。

不過貼吧上的討論也不過是對學校不讓學生帶首飾,掛墜,女生不能留長髮,劉海不能過眉毛等等規定的吐槽,還有各種衍生的段子。當時我們的教導主任是個政治老師,聽他交過的班的同學講他上課從不講課,從來就是宣傳所謂的「愛國主義」,還特別愛罵日本,說什麼日本人都是「流氓」,一罵能罵一節課。

有一次週一升旗儀式,快要結束時他突然上台拿起話筒,以一種近乎恐嚇的語調警告我們不要在百度貼吧上發表「侮辱學校」的言論,之前的不再追究,如果再有人發布不良信息學校就會根據那個人在網上發言的用詞習慣,貼吧發言,賬號名,帳號頭像等等在全校調查發言人的真實身份,捉到之後就立即開除。從那之後貼吧果然「正能量」許多,只剩下討論學習高考的內容。

儘管這樣,大多數學生畢業後談到學校的各種規定時都會予以肯定,在外面聽到有人說學校這麼做不妥時都各種「義憤填膺」,會說學校不制定這些規矩你能認真學習嗎…

編輯推薦

讀者評論 4

會員專屬評論功能升級中,稍後上線。加入會員可閱讀全站內容,享受更多會員福利。
  1. 你不如說「一國兩制」是奇觀。

  2. 一国之内大陆牌照不能进港澳,港澳牌照不能进大陆,也是奇观。

  3. 惊了,在评论区能见到论文,真的赞。

  4. 讨论一座大桥的经济价值,只是符号化地去定义为与内地多一条连接通道,而不从地理位置上分析是不是太过浮于表面?