恰好一個月前,1月27日大年初三凌晨12時許,一封來自香港大學李嘉誠醫學院的採訪邀請突然彈進記者的手機屏幕,通知當天下午3時有一場記者會,港大醫學院院長梁卓偉會更新他對新型冠狀病毒疫情的數學模型推算。
此前6天,年廿七,梁卓偉才就相同主題舉行過記者會,當時中國大陸以外的輸出個案只有4宗,這也成為他當天發布的數學模型的推算基礎之一。然而,疫情發展之快,無人能預料,第一次記者會翌日(1月22日)中午,輸出個案已上升幾近1倍,達到7宗,梁卓偉遂在Twitter發推文,指21日那天發布的推算因而不再有效。而大年初三的第二次記者會的內容,就是按當時最新的發展而更新估算的。
新冠病毒(COVID-19)疫情持續蔓延,截至2月27日公布的數據,中國政府公布確診人數為78,497人,死亡2,744人,而在韓國、義大利、日本、伊朗等地,已出現上百甚至上千的大量確診個案,全球的科研人員都正與病毒競賽,欲預測病毒的傳播規模和路徑,進而控制其進一步傳播。在香港,港大團隊已在《刺針》上發表其預測病毒在中國內地以至全球傳播規模的正式論文,香港中文大學(中大)正在模擬香港阻截新冠病毒疫情擴散措施的有效程度,論文尚未發表。而在英國、美國、德國等的科研人員都正在建立不同類型的數學模型,用數字和科學追擊病毒。
話說回頭,港大如此趕急的記者會通知,以至他們不斷修正的推算,反映的不只是疫情之下,學術論文發表要與光速競賽,也是「幕前」的臨床醫護人員,以至「幕後」的公共衞生學者對抗新發傳染病突襲之下的分秒必爭。到底數學模型是什麼?科研人員又是如何建立模型的?端傳媒就此採訪了正在建立相關數學模型的中大賽馬會公共衞生及基層醫療學院助理教授郭健安。另外,我們曾多次聯絡港大醫學院梁卓偉數學模型團隊邀約訪問,至截稿未獲回覆。
基於科學假設的沙盤推演
港大團隊的數學模型估算,武漢一個病例平均直接傳給2.68人。用流行病學家的說法,即「基本傳播系數」是2.68。
究竟什麼是數學模型?「你可以理解它是我們中學數學時所學的『方程式』。」中大賽馬會公共衞生及基層醫療學院副教授蔡錦輝告訴端傳媒,天文台的氣象學家使用數學模型預測天氣,而醫學界的流行病學家(Epidemiologist)則以數學模型預測疾病的走勢。流行病學家按疾病的特性,編寫不同的「方程式」,並在其中加入一連串的「假設」,運算後得出疾病走勢的估算,究竟快速上升,還是緩慢上升。
傳染病爆發後,必然要阻截其傳播。至於哪些措施有效?戴口罩?停課?全民在家工作?口岸測體溫?限制出入境?那就要以另一些數學模型去估算。中大同一學院的助理教授郭健安目前正是在建立這類模型,他對端傳媒表示,假若現時有5項措施可以阻截傳染病散播,流行病學家便運用數學模型去估算哪個最有效。他說,有時候數學模型預測某種阻截措施最有效,但其成本最高,這便要由政府去考慮要不要退而求其次,採用估算結果屬第二有效但成本可負擔的措施。
也許我們可以這樣說:數學模型就是流行病學家「沙盤推演」疫情走勢,以至預測阻截措施有多有效的方法。
第二次記者會後4天(1月31日),醫學期刊《刺針》(The Lancet)刊出了港大梁卓偉團隊的正式論文,詳述他們「沙盤推演」的詳情。被稱為世界上最大的人口遷移、為期40天的「春運」,今年由1月10日開始,跟此次疫情同期發生。人口大批流動,是傳染病擴散的「助力」。團隊的推算,以一個名為SEIR的數學模型為基礎。概括而言,此模型假設新冠病毒令一群沒有抵抗力的人(即S,susceptible),經過潛伏期(即E,exposed,受感染)、具傳染性(即I,infectious)及康復期(即R,recovered,此項也包括死亡)這樣的病發模式,來編寫方程式,以估算病毒的傳播情況。
當時醫學界對這個新發傳染病認識十分初步,港大團隊參考SARS或MERS的數據作假設,並納入在方程式中,包括假設新冠病毒的潛伏期與SARS及MERS近似,即平均為6天;又假設由一名病人傳給另一名病人所需日數(發病世代間隔/系列間隔,serial interval)與SARS在香港爆發時相同,即平均8.4日。另外,團隊亦假設2019年12月1至31日期間,武漢的疫情由持續的動物傳人並造成86宗個案而起。86宗的假設,是港大憑中國疾病預防控制中心(中國疾控)的公開資料,得知截至1月19日,有43宗確診個案曾在最可能是疫情源頭的武漢華南海鮮市場活動過,他們以此數的兩倍數來訂定。
團隊運用現成的數據,包括Official Aviation Guide的環球航班訂位數據、騰訊位置大數據,以及武漢當局2020年估計春運期間出入該市人數共三組,來估算每日乘坐飛機、火車或利用公路出城的人數。研究進行時,武漢及周邊地區在1月23至24日開始封城,團隊假設此後新冠病毒的傳播力在中國大陸大城市中出現三種情境:沒有下降、下降25%及下降50%,藉此模擬北京、上海、廣州、深圳及重慶五大城市的疫情走勢。
根據他們的估算結果,截至1月25日,武漢市受感染人數接近76,000人。參考中國國家衞生健康委員會(衞健委)的公布,截至2月27日公布的數據,武漢累計確診病例為47,824宗。
至於其他中國大城市,港大團隊當時估算,除了北京、上海、廣州及深圳四大城市可能出現80至113宗自武漢輸入的個案外,重慶同期估計輸入個案達461宗,主要原因是武重兩地陸上交通極之頻繁。他們又估算在新冠病毒的傳播力沒有下降的情況下,武漢的疫情高峰(拐點)將於4月出現;但若傳播力下降50%,則疫情上升速度緩慢,2020年上半年不會出現疫情高峰。
數學模型究竟是否疫情估算的「水晶球」?中國疾控中心主任高福曾於1月22日的新聞發布會上,回應外國傳媒問及英國有大學的數學模型估算中國有2,000人感染時指出,「事實是事實,知識理論是理論」,又稱:「這樣的模型是不是和事實相符合……我想,隨著大家對這個病毒的認識,會去驗證這個模型。」當天官方公布的全國確診個案為440宗。
此前一天,梁卓偉在第一次記者會上,曾談過數學模型的用途:它是給公共衞生當局評估「有沒有漏招」(作「有否失策」解,這裏兼指有沒有個案遺漏):「如果……(數學模型推算出來的)數字比(當局)所公布的確診個案多,(那麼當局)是否可以再加把勁抗疫與防疫?是否要再做好一點,往前多走一步,去檢視有什麼漏網之魚的可能?所以,這是(進行數學模型推算的)最重要目標。」
港大團隊的數學模型還估算,武漢一個病例平均直接傳給2.68人。用流行病學家的說法,即「基本傳播系數」是2.68(亦有譯作「基本繁殖率」,basic reproduction number,通常寫成R0)。
基本傳播系數反映的是傳染病的傳播力有多高。麻疹的傳染性極強,根據醫學文獻,估計它的基本傳播系數達14.5,即一個患者平均傳給14.5人,而SARS的是3.5。但是,中大的郭健安指出,傳染病的傳播力跟它的死亡率或住院率未必有關係。例如伊波拉病毒病的基本傳播系數是1.51,比上述梁卓偉團隊得出新冠病毒的基本傳播系數低,但伊波拉病毒病的平均病死率(average case fatality rate)是50%,比新冠病毒暫時所知的病死率2.3%高很多。
建模的困難:假設的偏差、數據的缺乏
港大團隊的數學模型,難以處理由武漢到香港/澳門之間轉換交通工具的情況,沒有再估算輸入香港個案的數字。
數學模型建構有它的難度。若納入的假設與實際情況有距離,可影響估算的準確度,「沙盤推演」出來的結果,可能會出現偏差。
港大團隊是於1月21日的首次記者會上,公布他們截至1月17日的數學模型的預測。港大團隊在該次記者會上,一度估算香港的輸入個案為零,上限為3宗,但在之後第二次記者會上,梁卓偉再沒有提及修訂後輸入香港個案的估算數字。
翻查香港的統計,從1月23日年廿九香港出現首宗新冠病毒的確診個案起計,至港大27日第二次記者會那天,共有8宗。經衞生防護中心流行病學調查後,均列為輸入個案(見個案編號1至8)。綜合政府發布的資訊所得,當中只有3宗是在中國大陸出發時坐直達的交通工具到港,其餘5宗,即超過一半均非直達,到港前,他們中途曾轉換交通工具,例如有個案是乘坐飛機至深圳,再經羅湖口岸入境;又有個案是乘坐高鐵,中途在深圳北站轉車到達香港。
第二次記者會上,梁卓偉承認,他的數學模型中所用的數據,難以處理由武漢到香港/澳門之間轉換交通工具的情況,尤其乘搭鐵路的人,當中很大部分在深圳及廣州轉乘到港。若按他的數學模型估算,只能捕捉以直達方式從武漢到港的輸入數字,因而會低估自武漢輸入港澳兩地的個案。
事有湊巧,1月27日這天,正是香港特區政府開始執行所有湖北省居民以及任何之前14日曾到湖北省的人,不能入境香港的新規定。
跟港大團隊差不多同期發布的數學模型,大都集中在估算疫情的可能規模,包括武漢本身以至擴散至中國以外的規模。例如,比港大早發布的英國倫敦帝國學院(Imperial College London)數學模型,第一次初步估算截至1月12日武漢有1,700宗個案,第二次初步估算截至1月18日武漢的個案為4,000宗;還有之後英國蘭開斯特大學(Lancaster University)的數學模型,初步估算截至1月22日,武漢有21,000宗;若疫情傳播力不減,則估算截至2月4日會有超過190,000宗,該數學模型預測泰國、日本、韓國、台灣、香港、美國、新加坡、馬來西亞、澳洲及越南等國家/地區出現輸入個案機會較其他的高。
值得留意的是,這三份初步估算發布時,連同港大第一及第二次記者會的內容,並不像港大團隊最終的《刺針》論文那樣,刊登在經過同儕評審(peer review)的醫學學術期刊上。而未經同儕評審程序的論文,只能視作初步結果。
中大的郭健安表示,疫情初期,的確需要這類數學模型估算新發傳染病的流行程度有多嚴重,以及可能影響範圍有多大,給有關當局以至公眾一個概念。不過,很多時候,這段時間所做的數學模型前設,是每個人受感染的機會均等。可是,社群之內人與人接觸的模式,是有差異的。
他舉例稱,有些人常外出,有些人不常外出,常外出的應該比不常外出的感染風險高。又例如三十多歲的人,社交圈子多是同輩,那麼這個年齡組別的傳染對象,理應也是同輩居多;至於四十多歲的一群,也許多已為人父母的關係,社交圈子除了同輩,還有兒童。故此,流行病學家隨後以數學模型預測感染規模時,應向前踏一步,把這些互動及連繫,納入方程式中,模擬社群中不同人的不同活動模式,從而得出反映現實的預測。郭健安透露,中大正在做這類型的數學模型研究。
此外,疫症初期所發表的數學模型估算結果,基於醫學界對該病所知有限,大有可能參考其他同類疾病的資料作假設,因此,隨後建構的數學模型,應該納入新發傳染病後來浮上檯面的資料作假設,目的也是為了得到貼近實際情況的預測。
非玩弄數學,最重要找出抗疫措施
中大團隊估算新冠病毒在香港的「基本傳播系數」為0.319,即一個病例平均直接傳給0.319人——簡單而言,這個系數少於1,表示疫情不能持續,大於1則表示爆發。
據美國醫療新聞網站STAT報道,正是因為超級電腦的應用,研究人員建構數學模型時,可以加入更多仔細的數據去反映人的活動及互動,使得估算結果更加接近現實。實踐下來,美國每年大約有廿多個團隊以數學模型來預測來季的流行性感冒走勢,彼此的估算結果及準確度(包括流行時間及高峰期)已相差無幾。
流行病學家在新冠病毒疫情上,是站在調查是次病毒如何散播及為何散播的前線人員,是「沙盤推演」的「操盤手」,他們所需要的,是來自不同領域的專業知識。
像梁卓偉,以至他團隊的成員港大公共衞生學院流行病和生物統計學分部教授胡子祺,以及中大的郭健安,均是流行病學家。他們的學術背景來自各方面,像梁卓偉是醫生,胡子祺是運籌學博士,郭健安本身為統計學家。另外,流行病學家中以建立數學模型作預測的,還有物理學家,像美國東北大學的Alessandro Vespignani,以及德國柏林洪堡大學的Dirk Brockmann;而在美國洛斯阿拉莫斯國家實驗室工作的Sara Del Valle,是應用數學家。流行病學數學模型的翹楚,則不得不提倫敦帝國學院的Neil Ferguson、蘭開斯特大學的Jonathan Read,以及美國哈佛大學的Marc Lipsitch等專家。
郭健安指出,從事數學模型建構的流行病學家,要先了解流行病學,了解疾病的自然史(即疾病本身的「生老病死」),之後才是建構數學模型。
郭健安參與的中大團隊也有因應新冠病毒的疫情,以香港最早的56宗確診數據建構數學模型,初步得出「基本傳播系數」為0.319(此初步數據未經同儕評審),即一個病例平均直接傳給0.319人。他稱,簡單而言,這個系數少於1,表示疫情不能持續,大於1則表示爆發。「香港的情況跟武漢不同,武漢的(基本傳播系數)大於1,因為(疫情)開始時,他們沒有任何干預措施(阻截病毒散播),……而香港是在有干預措施之下得出0.319的。」
其實,在流行病學家眼中,以數學模型估算出這些數字,只是對抗傳染病的一部分,最終目標是以運算來抗疫,輔助公共衞生當局作出適當對策。根據56宗個案確診經過的分析,中大團隊還發現這些個案從首次發病到隔離的平均堵截延誤日數為6.5天,其中本地個案的平均搗截延誤日數更達7.6天,意味著隔離有所延誤,值得政府注意。恰巧的是,在郭健安公布數據的翌日(2月19日)起,有發燒和呼吸道症狀或有輕微肺炎病徵的公立門診及急症室求診人士,須留深喉唾液樣本作化驗。郭健安之後認為,此舉可望縮短堵截延誤的情況。
「我們從事公共衞生的,不是玩弄數學。經數學計算而得出是2還是3(指「基本傳播系數」),並沒有意義。最重要的,是(利用數學模型)對抗疫情。所以說,利用數學模型的推算,找出一個最有成效的措施(阻截散播),才是我們要探討的問題。」郭健安說。
如果出了港大的都没有发表更没有发发在顶刊,钟南山的预测没有得到发表在柳叶刀有什么可抱怨的,无知还是装傻?
明顯有傷害到端的利益,端的主要收入來源就是靠文章,而且他搬運里面有最新的文章。這是明顯侵權。
第一次看到端在文章末尾注明“本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。”为啥只有今天发的前两篇文章有这段话呢。?话说GitHub上有一个项目 https://github.com/xiaotianzi002/Article-from-Theinitium,以PDF文档的形式搬运了端的很多文章,这种算侵权吗,还是处在模糊地带?