近日,香港大學社會工作及社會行政學系博士生白逸銘(Yiming Bai)、港大社會科學院副院長葉兆輝共6位學者合著的學術期刊文章被揭出現「AI 幻覺」(AI Hallucination),多項參考文獻為虛構和不存在,引發學術誠信和 AI 在學術界應用不善的爭議。
11月8日,一個名為「Katy Wong」的帳號在 Threads 上發文,附上該論文的連結,稱從朋友口中得知港大有幾位教授發表論文,當中包含大量的 AI 幻覺,「大家不妨自己去 references 度 click 吓 d hyperlinks,大部分都係死 link,Google Scholar 都 search 唔到嘅。(大家不妨自己去 references 按進那些超連結,大部分都是失效連結,Google Scholar 都搜尋不到)」該帳號又引述他朋友指有同事曾匿名舉報,但大學表示不接受匿名舉報,所以才代他們公開事件。
是次涉事論文為「Forty years of fertility transition in Hong Kong」,分析了香港近40年的生育率,從中推斷結婚率下跌為生育率下跌的主要驅動力。根據端傳媒統計,論文共列出61項參考文獻,包括學術論文、書籍、立法會文件和不同機構的報告等,當中至少有20多項為不存在——例如點擊數位物件識別符(DOI)或 Google Scholar 超連結後顯示「DOI Not Found」和「Sorry, we couldn't find this article」。而其中一篇虛構論文的署名作者為葉兆輝,在內文中亦有引註(in-text citation)。
此外,參考文獻中有一部分文獻未有按作者姓氏的英文字母排列,亦似乎不合乎格式規定。


涉及AI虛假論文題為《Forty years of fertility transition in Hong Kong》,作者包括港大社會工作及社會行政學系博士生白逸銘(Yiming Bai)、港大社會科學院副院長、社會工作及社會行政學系講座教授葉兆輝(Paul Yip)等。網上截圖
作者、期刊均未發現,葉兆輝致歉:「責任在於我同學生」
論文於今年10月17日刊登於英語中國人口學學術季刊「China Population and Development Studies」(CPDS)。CPDS 由中國國家衛生健康委員會主管和「中國人口與發展研究中心」主辦、德國出版社 Springer Nature 出版。葉兆輝是 CPDS 的編輯委員會成員之一。「中國人口與發展研究中心」的前身為「中國人口情報資料中心」,隸屬於國務院計劃生育領導小組辦公室,是首個國家級人口情報研究機構。
而根據 Springer Nature 網站顯示的投稿程序,當中一環為期刊(是次事件上,即 CPDS )的編輯閱讀文章並決定是否進行同行評審(peer review),而大多數的文章會經過兩位或更多屬同一領域專家評審。
事件引爆後,CPDS 在11月10日於 Springer Nature 網站刊登告示,指編輯部接獲該論文的作者報告,指參考文獻有一些「不匹配和錯誤」(mismatches and inaccuracies),屬於作者的疏忽。但編輯部認為這不影響論文的核心結論、實證資料的有效性或理論架構的完整度,亦確認文章的核心論證跟參考文獻問題無關。(The Editorial Office confirms the core argument chain is independent of references issues.)不過,告示未有提及為何 CPDS 未有發現虛構文獻。
涉事的論文共有6位作者,他們在論文的角色、為何未有發現參考文獻出錯等,是事件的重要關注點。第一作者白逸銘的研究範圍為青少年與性、人口健康和社會政策分析,她的指導教授為著名香港學者葉兆輝。其他作者為港大統計與精算學系副系主任屈錦培、同系的榮譽教授林國輝、吉林大學數學系副教授蘇鈵鈞和醫務衞生局高級統計師李若谷。
事件持續發酵,葉兆輝在11月9日向《香港01》表示,其學生、第一作者利用 AI 協助整理引用資料(Referencing)未有檢查清楚,導致引用部分出錯。作為通訊作者(corresponding author)的他又承認自己有責任並表示歉意,不過他強調論文通過兩次學術審查,內容並非捏造,無關學術誠信問題。他指其他作者是提供數據和意見,「責任在於我同學生」。
他又表示已主動聯絡期刊編輯,獲批准在未來數日重新上載正確版本。他形容該學生表現一直很好,今次是她首次使用 AI 協助引用工作。葉兆輝雖然對她失望,但指會給她機會,並已要求她修讀一個更好地使用 AI 的課程。
港大在11月10日回覆傳媒查詢,表示校方在科研中使用人工智能應用方面訂有嚴格規範及指引。港大又指對相關指控高度重視,已按既定程序對相關人士展開核查,如發現研究處理存在失誤,會按程序跟進處理。

AI 幻覺襲來,學術界如何應對?
香港不少大專院校自幾年前起引入 AI 應用程式供師生使用,並容許學生使用 AI 做功課。
當中,香港大學在2023年9月起免費為師生提供「Microsoft OpenAI」和「Dall-E」等 GenAI(生成式人工智慧)應用程式,並設有每位學生每月20次使用應用程式的限額。不過,校方規定使用 GenAI 完成作業的學生必須說明資料出處和引用來源等,老師亦需向學生提供指引。另外,港大亦提供不同 AI 檢測工具供導師使用。
而港大就 GenAI 使用的指引中,亦提醒論文作者須審查和編輯 GenAI 所生成的內容,以及記錄和註明 AI 的應用。
AI 幻覺是指 AI 模型生成的錯誤或誤導性結果,它們看似合理但與事實相悖或偏離語境,而這情況或源於訓練資料不足、有誤差,以及模型的假設有誤等。一項2023年的研究以 ChatGPT-3.5 和 ChatGPT-4 生成不同文獻回顧(literature review),發現前者有55%的參考文獻為捏造,後者亦有近兩成,而引用真實的參考文獻時亦被發現出錯。
就 AI 虛假文獻的衝擊,Springer Nature 今年4月宣布新增一項能偵測投稿稿件中不相關的參考文獻的 AI 工具。當工具偵測到一定數量的不相關參考文獻時,便會轉至小組作檢查和決定是否撤回。
台灣今年亦爆出類似的 AI 虛構參考文獻事件。中山大學社會學系教授葉高華發現屏東大學和南華大學的學生碩士論文參考文獻列出他未曾寫過的作品,從而揭發事件。其中一位學生使用 ChatGPT 免費版生成資料後沒有查核,之後因格式和標註方式看來無異樣而獲准上傳檢索系統。兩名學生最終需重寫論文。
