評論|田禾:如何科學地反駁諾獎得主沃森的「種族決定智商論」

種族思維的死穴,不是「政治不正確」,而是「道德不正確」和「事實不正確」。
諾貝爾獎生理及醫學獎得主詹姆斯·沃森 James Dewey Watson。
公共衛生

2019年1月, 諾貝爾獎生理及醫學獎得主詹姆斯·沃森(James Dewey Watson)因為美國公共電視網(PBS)的《美國大師》紀錄片重新回到公共視野。在紀錄片中,沃森表示:「智力水平上,黑人和白人的平均值的確有所不同,而我認為這個不同正是基因導致的。」沃森所在的冷泉港實驗室1月發表聲明,稱明確反對沃森的言論,指毫無科學依據、不計後果的言論應當受到譴責,並且不代表冷泉港實驗室、實驗室董事會、教員、學生的觀點;同時,實驗室決定收回沃森的所有榮譽頭銜

這並不是沃森第一次表達類似觀點。早在2007年,沃森在英國接受採訪時就曾宣稱非洲人智力不如白人,當時激起了強烈的公眾反彈,直接導致沃森被迫從冷泉港實驗室的領導層職務退休;而沃森也發表過不恰當的性別歧視言論,例如「基因改造可以讓女性變得更漂亮」等。十餘年後,沃森依舊「頑固不化」。

有人將沃森受到學術界普遍的抨擊,與當年伽利略被羅馬教廷強迫放棄日心說相提並論,指責「政治正確」壓倒「科學探索」。很遺憾,這種觀點屬於邏輯謬誤中的「虛假等同」,伽利略主張日心說是建立在經驗實證工作之上的。如果伽利略支持日心說是他拍腦袋想出來的,那麼我們只能說教廷限制言論,但不能說教廷限制科學。

然而更重要的問題在於,對沒有受過學術訓練的大眾而言,一個諾貝爾獎得主的言論,無論與其專業領域是否相關、有無文獻證據支持,很可能都自帶「科學」的光環。如果沃森只是一名籍籍無名的退休教授,幾次失言並不會在整個科學界激起如此浩大的反對聲浪,然而沃森是20世紀生物學的標誌性人物之一,學界如果對沃森的言論保持沉默,在大眾眼中無異於為其背書。如果一種觀點不是由數據和邏輯支持的,即使出自沃森這樣的諾貝爾獎得主之口,也不能被視為「科學觀點」。本文將全面剖析沃森言論的不恰當之處,甚至要指出,「種族與智力之關係」甚至不是一個真正意義上的科學問題。

詹姆斯·沃森和克里克(Francis Crick)。
詹姆斯·沃森和克里克(Francis Crick)。

當我們談論種族的時候,我們在談論什麼

在社會學上,「種族」是有效概念,但在遺傳學上,「種族」是個劣質概念。

如今,當我們使用「科學」這個概念時,指的是一種經驗實證、探尋和組織知識的系統方法。正經的科學工作者看到「種族與基因的關係」這個命題,首先要做的,是弄清楚「種族」和「智力」的定義。科學研究中定義一般分為兩種,一、理論定義,又稱為概念性定義;二、操作性定義。前者指向一個事物的本質性特徵,而後者是描述事物特徵時需要的測試過程。

操作性定義必須足夠清晰、客觀,使經過相關訓練、具有正常理性的人,都可以導出相同的結果;而一個概念性定義的出現有時會超前於科學家的實際觀測能力,但在邏輯上,從概念性定義導出操作性定義必須是可行的。是否能建立這樣的操作性定義,是一個命題成為「科學命題」的必要條件。一個典型的例子是「惡人死後會不會下地獄」:理論上,神學家可以給出「地獄」的概念性定義。然而「地獄」顯然是沒有操作性定義的,所以這個命題無法被科學地研究。

我們今天通常使用的「種族」這個概念,來自十八世紀歐洲學者的發明。瑞典植物學家現代生物分類學之父林奈(Carl Linnaeus)率先試用生物分類學方法研究人類社會。林奈提出人類可以按照膚色分為四大類:歐羅巴白種人、印第安紅種人、非洲黑種人,和亞洲黃種人;德國學者布魯門巴赫( Johann Blumenbach)在林奈的膚色分類法的基礎上又引入了比較解剖學,將人類分為五大類:蒙古人種、高加索人種、尼格羅人種、馬來人種、和印第安人種——這是今天美國常見的分類方法 (歐裔/白人,亞裔,非裔/黑人,北美原住民/印第安人,大洋洲島民)的雛形。

布魯門巴赫關於體質人類學的博士論文發表於1775年(要知道,達爾文的《物種起源》直到1859年才問世);1856到1863年,孟德爾進行了影響深遠的豌豆實驗,一般認為,豌豆實驗證實了基因的存在,從而奠定了現代遺傳學的基礎;1944年,埃弗里-麥克勞德-麥卡蒂實驗證明了DNA是遺傳物質;1953年,沃森和克里克提出了DNA的雙螺旋結構模型。又過了半個世紀,直到21世紀初,人類基因組計劃才基本完成。

換言之,今日人們習而不察的「種族」概念,發明於科學界對演化、遺傳、基因還近乎一無所知的時代。「種族」這種分類方法,其依據的科學知識,實在是很粗淺的。

今天強大的測序技術令研究人員獲得了豐富的基因組數據,並以此為基礎重建人類歷史上的遷徙和演化事件,這個學科叫做分子人類學(註1)。對今天的整個人類社會而言,分子人類學最重要的發現或許是:人類的演化是一個連續的光譜,現存的人類,即使並非日常語言中所謂的「混血兒」,其基因也是一個大雜燴。正因為人類基因組的共同性遠大於差異性, 任意兩個個體之間的差異不到1%,科學家才需要絞盡腦汁來改善測序技術,發展各種統計方法,來解讀這些細小差異。

可能有人會說,布魯門巴赫那一批歐洲學者雖然沒有現代生物學的基本知識,但這並不代表其創立的分類方法是毫無依據的,他們提出「種族」時已經考慮了地理群聚的要素,而空間上的鄰近,往往意味着更多基因庫的交流,因此同一「種族」之間具有更多的基因同源性,在科學史意義上,種族分類法不失為有意義的嘗試。

但這種解讀並不代表「種族」是一個我們應該沿用不疑的概念。這裏暫且不談傳統的種族觀與種族主義、殖民主義之間千絲萬縷的聯繫,僅就生物學層面而言,這套學說也至少有如下幾個問題。一、人類基因組本來是一個連續的光譜,而「白種人」、「黃種人」、「黑種人」這種說法卻讓人覺得分立的種群是真實存在的;二、群體邊界的確定在基因組水平上看完全是主觀的,例如非洲作為現存所有人類的共同祖源,「非裔」的內部基因庫的多樣性顯著超過了歐洲人種和東亞人種,然而這些差異卻被「非裔」這個籠統分類掩蓋了;三、對決定外在體質特徵的少量基因賦予了超常的權重;四、抹殺了人類的遷徙和演化的時間順序,例如走出非洲後的智人先到達西亞,繼而到達東亞,並取代了東亞的原住民(例如「北京猿人」),擴散到了整個東亞大陸——而在傳統的種族劃分方法看來,「非洲人」與「東亞人」是平行概念。

正因為「種族」作為一個生物學概念漏洞百出,今天分子人類學研究者更願意使用「祖源」(ancestry)這個概念。祖源關心的,是現代人類的生物學祖先在歷史上的地理分布。

在現實生活中,「種族」與「祖源」脱節的例子俯拾皆是。 比如奧巴馬(歐巴馬),他的父親是來自肯尼亞的非裔,母親是歐洲後裔,從遺傳學角度看, 奧巴馬的基因組中具有同等比例的歐洲和非洲的祖源。然而美國社會大部分人毫無疑問視其為非裔黑人。換言之,奧巴馬之所以成為「黑人」,並不是因為他體內的「黑人基因」比「白人基因」佔更大的權重,而是因為「黑人」這個概念本身就是在特定的政治和文化語境下約定俗成的概念。

在公共生活中,圍繞「種族」的討論具有特殊的複雜性。在遺傳學意義上,「種族」是個劣質概念。在自然科學史上,新概念被後續研究爭位的情況其實並不罕見,如曾經長期困擾物理學界的「以太」。對此,科學共同體的解決方法是將已被證偽的概念從學科共同語言中剔除。實際上,今天的學習物理的學生不會再糾結於「以太」,因為這個概念根本不會作為教科書中的正式內容出現。

然而在我們討論社會與政治生活時,「種族」作為社會建構之存在並不需要遺傳學證據來支持,只要社會的大部分成員仍然認為「種族」是真實存在的,並運用「種族」這個認知來完成身份認同、群體動員、資源分配等活動,「種族」就是一個社會學意義上的有效概念。「某某種族」具有「某種遺傳學特徵」的斷言,從生物學視角看經常是漏洞百出。然而「黑人性命也是命」(Black Lives Matter)這種社會運動,本身指向的是社會建構意義上的種族,這時候,我們並不能因為「種族」作為生物學概念具有各種缺陷,就輕易斷言「種族」是偽概念——這樣我們會立刻掉入另一個陷阱:從廢奴運動到民權運動先人為爭取種族平權的種種論述,以及當代學者對涉及種族的結構性歧視的精細研究,豈不都成了偽命題?一味向不熟悉種族議題歷史流變的當代公眾強調「種族」是偽概念,帶來的困惑只怕多於啟蒙。

2018年,哈佛大學醫學院學者David Reich在《紐約時報》上發表了題目為「遺傳學在如何改變我們對『種族』的理解」一文,試圖探討這個極為棘手的「種族」問題:一方面,種族是一個「社會建構」,一種隨時間和國家變化的人群分類方式;另一方面現代基因組學的確揭示了不同人群中的遺傳差別。Reich此文在英語知識界激起了不少反對的聲音,反對者憂心Reich此文會讓「科學種族主義」沉渣泛起。

對這場辯論雙方的主要觀點,華東師範大學劉擎教授已經在「2018西方思想年度述評」一文中做了出色的概括。劉擎教授將這場爭論概括為「科學探索與政治正確的爭論」。筆者看來,與其說這是「科學探索」與「政治正確」之間的矛盾,不如說是種族這一概念作為「已淘汰的科學概念」與「社會建構之真實」之間的張力。

弔詭的是,由於大部分人接觸到的是作為「社會建構之真實」的「種族」,這反而放大了很多人將「種族」作為「科學之真實」討論的衝動。反對Reich的聲音看起來似乎有悖智力誠實的原則,背後的擔憂卻是有真切現實關懷的:一般而言,今天的公眾不會赤裸裸擁抱舊日種族主義論述,但其知識儲備對種族主義的思維方式未必具有真正的免疫力。在這個輿論戰場上,遺傳學家需要找到合適的方式,向公眾交待關於人類基因多樣性的發現——不然只會被真正的種族主義者劫持話語。Reich的努力,或許技術層面並非完美,但方向上卻是值得肯定的。

1957年的詹姆斯·沃森。
1957年的詹姆斯·沃森。

當我們談論智力的時候,我們在談論什麼

大眾往往高估在學術上取得過人成就所需要的內稟智力,卻低估時空環境和群聚效應對創造性活動的重要意義。

我們再來討論一下什麼是「智力」。這裏我們將「智力」定義為綜合的認知能力。要研究遺傳與智力的關係,我們首先要考慮智力在多大程度上可以被準確地度量。

首先,用學業成績和教育水平來估計智力水平是極其不可靠的,「某族的孩子很少上大學,說明這個族群智力有問題」這種流行說法是不折不扣的錯誤認知。大量社會科學研究都證實了家庭社會地位、經濟條件、育兒方式等因素與學業成績具有強相關性。2015年,《紐約時報》根據哈佛和伯克利大學的一篇經濟學論文繪製了一張圖表,橫軸為父母的經濟收入相對值,縱軸為子女入大學的比例。這張圖表揭示的現實堪稱冰冷:在美國,父母收入與子女接受大學教育的機會幾乎成完美的線性正相關。換言之,家庭社會經濟因素對子女學業的影響幾乎是壓倒性的。即使控制了這些變量,學生的性格特質也可能影響其學業表現,比如盡責性和情緒穩定性較好的學生很可能會在現代教育體制中佔有優勢,但這顯然是非智力因素。

既然用學業表現反推智力不可行,那麼智力可不可以被直接測量呢?大部分人都聽說過一種叫做「智力量表」的測量方法,其結果可以換算為「智商」。今天心理學家最常用的是韋克斯勒智力量表,考察的內容包括語詞理解(verbal comprehension)、知覺推理 (perceptual reasoning)、即時記憶(working memory)、處理速度(processing speed)四大項,其下又分為十幾個子項。研究人員發現,這四項能力有很高的相關性,一個被試如果在一方面表現出色,在其它三個方面也更有可能獲得更高的分數。因此,一些心理學家假設,存在一種「一般性的智力」(g-factor,g因子),這種能力與腦生理因素有關,也可能具有遺傳性。不過這個假說是存在爭議的,和血壓、血糖、尿蛋白這些可以直接測量的生理指標不同,g因子是從其它可觀測指標間接推衍而來,對這種概念的使用,嚴謹的研究人員一般會格外小心。(註2)

智力存在流體智力與晶體智力的分別。流體智力指的是不受既有知識束縛的推理、記憶、運算等能力,而晶體智力指的是將語言、知識、經驗、技能結合的能力。流體智力一般在二十歲早期達到頂峰,之後逐漸下降,也就是所謂的「年輕人腦子好」,而晶體智力是可以隨着年齡和經驗的增長不斷上升的,在大腦出現顯著的生理病變之前並不會下降。韋克斯勒智力量表同時考察流體智力與晶體智力。隨着社會進步,針對特定人群的縱向追蹤往往發現,同一人群的流體智力與晶體智力的測量結果會在長時間內不斷提升,這叫做「弗林效應」(Flynn Effect)。因此智商測試的常模(供統計分析的標準量數)必須不斷更新,否則今天的人去做幾十年前的智商測試,很可能發生「自己是天才」的誤會。

另一個要注意的問題是,由於智商測試的常模是與社會發展水平有關的,因此不同群體之間很可能沒有可比性。發達地區的營養水平、教育投入、信息渠道,與落後地區相比,經常有霄壤之別。用同一套測驗題目和常模去比較發達地區人群和落後地區人群的智商,前者常有顯著優勢,但這並不代表發達地區人群具有任何「基因優勢」。這就好比將相同的種子分別灑在肥沃和貧瘠的土壤中,落到優勢環境中的種子大概率會生出更茁壯的苗來。

當我們看到一則關於智力的研究資料時,要注意研究的時代。19世紀和20世紀早期的智商測驗存在明顯的社會和文化背景偏好。例如20世紀早期,美國優生學盛行,從紐約港埃利斯島入境的移民一般要接受美國當局進行的智商測驗。測試發現,來自東歐的猶太人普遍「智力低下」。實際上,美國猶太人在學術、藝術、商業等多個領域成就非凡,當年埃利斯島的「研究成果」今天看來無異於是天大的笑話。這裏面的問題在於:一、忽視了社會綜合發展水平對智力測驗結果的影響;二、沒有矯正文化背景、特別是語言背景對測試的影響。

正因為文化和經濟背景對智力測試結果存在顯著影響,使得這種方法在同質群體內部或許還有一定可信度,但在用於比較不同社會發展水平和文化背景下的群體時,要得出有意義的結論就困難得多了。此外,即使在同一個國家或地區內部,不同群體能享受的社會資源也可能存在極大差異。典型的實例如歐美發達國家內部的少數族裔可能在嬰幼兒營養水平、社區教學條件、父母經濟背景、社區人際資源等一系列社會經濟指標上和「主流人群」都存在顯著差異。如果弱勢群體能在同一個智力測試中和優勢群體表現得同樣出色,那才是違背了既有的科學範式。

「低智力族群」的鏡像是「高智力族群」的神話, 例如東歐阿什肯納茲猶太人經常被用來當作智力超群族裔的典型:猶太人佔世界總人口僅為0.2%,卻貢獻了超過20%的諾貝爾獎得主。其實大眾往往高估在學術上取得過人成就所需要的內稟智力,卻低估時空環境和群聚效應對創造性活動的重要意義。

智力成就極高的猶太人,他們的生活環境經常與兩個城市有關:奧匈帝國治下的維也納,和20世紀的紐約——二者都是人文薈萃的國際性都市。維也納的猶太人在大屠殺之前曾達到10%,紐約的猶太人口比例達到12%——今天紐約的猶太人口僅次於特拉維夫。納粹統治之前的維也納和紐約都以包容性聞名,而猶太人之前以長期經商為生,在這樣的城市中不難躋身中產階級。任何一個族群如果在這種量級的城市中有相當數量的中產階級人口,大概都會「天才」輩出的。在我們充分理解這些環境因素之前,不應當輕易將阿什肯納茲猶太人的成績歸結為智力超群。

猶太人佔世界總人口僅為0.2%,卻貢獻了超過20%的諾貝爾獎得主。其實大眾往往高估在學術上取得過人成就所需要的內稟智力,卻低估時空環境和群聚效應對創造性活動的重要意義。
猶太人佔世界總人口僅為0.2%,卻貢獻了超過20%的諾貝爾獎得主。其實大眾往往高估在學術上取得過人成就所需要的內稟智力,卻低估時空環境和群聚效應對創造性活動的重要意義。

智力與基因的關係能被科學地研究嗎

雙胞胎實驗有力證明智力與基因有關,但雙胞胎實驗的研究對象顯然是沒有祖源或「種族」上的差異的。

基因對智力有多大影響?答案是很大。研究人員為了分析「先天」與「後天」的影響,經常採用「雙胞胎實驗」:同卵雙胞胎的基因組、胚胎發育環境幾乎是完全相同的,而異卵雙胞胎的胚胎發育環境相近、基因組有一半不同。 在有些情況下,雙胞胎未必會在原生家庭中一同長大,可能出現被不同家庭收養的情況,這樣就有四種養育情況:

同卵雙胞胎—共同養育、 同卵雙胞胎—分開養育、 異卵雙胞胎—共同養育、 異卵雙胞胎—分開養育。

研究人員分別測試雙胞胎的智商,並計算二者智力的相關係數。結果發現相關程度從高到低依次為:同卵雙胞胎-共同養育、 同卵雙胞胎-分開養育、 異卵雙胞胎-共同養育、 異卵雙胞胎-分開養育。同卵雙胞胎即使分開養育,其智力相關性仍然高於共同養育的異卵雙胞胎。雙胞胎實驗的結論已經被多個獨立研究重複,具有相當的可靠性。

雙胞胎實驗有力證明智力與基因有關,但雙胞胎實驗的研究對象顯然是沒有祖源或「種族」上的差異的。如前所述,直接比較不同族群的智力測試結果,是不能證明差異很大的人群之間存在智力差異的。假如有人仍然試圖進行這樣的「科學探索」,還有一種「迂迴」方法:如果我們能找到「聰明基因」,並證明一個特定人群具有更多的「聰明基因」,不就可以得出結論說這個群體在智力上具有「基因優勢」了嗎?

科學家能不能發現影響智商的基因呢?答案是,目前科學家擅長的,是發現可導致嚴重智力缺陷的基因突變。例如苯酮尿症(phenylketonuria,PKU)的患者的苯丙氨酸羥化酶基因發生突變,結果無法正常代謝苯丙氨酸。這種異常代謝可以影響嬰兒和兒童時期的大腦發育。患兒必須從出生起嚴格控制飲食,否則會出現嚴重的智力缺陷。然而攜帶正常的苯丙氨酸羥化酶基因並不會令人智力超常,換言之,研究智力缺陷,很多時候並不能增加我們對正常智力運作模式的理解。主要困難在於,智力是一個多基因性狀。如果有幾百個基因可能影響到智力的高低,而每個基因只發揮很小的作用,那麼在浩瀚的基因組上抓出這樣的基因是極其艱鉅的。

對研究多基因性狀,目前科學家最常用的方法叫全基因組關聯分析(Genome-wide association study,GWAS)。簡單的說,這是對基因組的大數據分析。科學家需要兩組數據:被分析人群的全基因組測序結果和可量化的特定性狀,目標是發掘與特定性狀相關的基因變異。當分析樣本足夠大的時候,噪音會逐漸被壓低,而真正的信號就有可能從海量數據中浮現。

學過信號與數據分析的人都聽過一句話: 「廢料進,廢品出」(Garbage in, garbage out)。意思是如果輸入的原始數據質量出了問題,那麼再高明的分析方法也得不出有有意義的結果。今天全基因組測序技術已經達到了相當的準確度,但並不是所有的性狀都可以被精確量化的:

如果我們去比較不同人群的身高,我們可以很有信心的說,拿到的身高數據是非常可靠的。畢竟物理學家對長度的定義已經達到了「一米等於光在真空中行進299792458分之1秒的距離」的精度,而標準長度測量工具已經極為普及,從「概念性定義」和「操作性定義」兩個角度考察,身高都是一個具有極高信度的物理量;

但如果我們就II型糖尿病和基因去做全基因組關聯分析,問題就要複雜一些了——II型糖尿病人的生活習慣、發病年齡、嚴重程度是存在個體差異的,要怎樣把描述性的指標轉化為有意義的量化參數呢?這並不是顯而易見的。

對智力做全基因組關聯分析又要比研究生理數據更為複雜。如前文所言,智力測驗依賴於常模的質量,其結果具有一定的不確定性。如果甲的身高為1.65米,乙的身高為1.6米,那我們可以斷言甲比乙高。但如果甲的智商測驗結果是130,乙是125,我們能不能肯定得說甲更「聰明」呢?大概只能說二者智力相似。

此外,智力測試結果是與文化和經濟背景相關的,這種方法在比較同質群體內部智力差異的時候或許還有一定效力,而用於比較社會經濟階層和文化差異極大的群體時必須慎之又慎。假設我們用同一個智力量表考察美國富有白人社區的小孩和中國貧困山區留守兒童,再用這兩個群體的基因組信息做關聯分析,大概率會發現決定頭髮顏色的基因是與智力「顯著相關」的,但這種研究方法顯然是荒謬的。

實際上,來自荷蘭的一個研究團隊的確就智力進行了全基因組關聯分析。 2018年,阿姆斯特丹自由大學的Danielle Posthuma小組在 《自然-遺傳學》上發表文章,宣稱 205 個基因組位點、1016個基因與智力有關。這個研究的對象限於歐洲發達國家的白人,樣本數量達到了27萬人之多。研究智力遺傳的困難,可見一斑。

我們姑且假設阿姆斯特丹自由大學的研究結果具有相當高的質量。現在我們手上有了長達1016個基因的清單。注意這個清單只是說這些基因與智力有相關性,但是相關性並不代表因果性。一般來說,遺傳學家想搞清楚一個基因是否參與決定某個性狀,會做兩件事:一、把這個基因突變甚至敲除,觀察生物體的性狀是否就此改變;二、修復被破壞的基因,觀察被改變的性狀是否逆轉。問題是,科學家不可能在人體上進行這樣的實驗。如果我們研究的是與糖尿病有關的基因,那麼我們可以建立小鼠模型,測量小鼠的胰島素分泌水平、血糖濃度等生理指標,但用其它生物模擬人類的認知活動是不現實的。人類智力活動的關鍵在於人類通過語言和符號交流的能力,即使是和人類最接近的黑猩猩,其符號能力也不如人類的幼兒。科學家能做到的大概是觀察這些基因對神經細胞和組織發育的影響,但從單個細胞到完整個體的智力活動,其間存在巨大的鴻溝,任何在細胞水平進行的研究意義終歸是有限的。

此外,還有一種關於智力的「演化模型」:在複雜的人類社會,智力更高的人會獲取更多的社會資源,因此有更高的機會將基因傳給後代,經過數千年的演化,「聰明基因」會在 「發達社會」中的人口富集。這作為一個假說的確是可以初步成立的。但要變成一個有價值的學說,還要用實證填上邏輯鏈條上的一些環節。智力更高的人真的會擁有更多的後代嗎?這並不是一件「顯而易見」的事,因為在有文字記載的大部分人類歷史中,並不存在現代意義上的「績優社會」(meritorious society),而在等級社會中,智力優勢能不能轉化資源優勢,進而轉化為更多的後代呢?如果是,基因頻率改變的速度快到足以產生顯著差別嗎? 而到了現代社會,人類的生育行為又發生了變化,學業表現更好的人群,尤其是女性,經常自願降低生育率。如果沒有足夠的實證研究,這個模型只能停留在「假說」的階段。

任何敢於言之鑿鑿宣稱「基因導致兩個族群智力不同」的人,即使是諾貝爾獎得主,也只能以「偽科學販子」視之而已。

考慮到智力測試的不確定性、文化和經濟因素對智力測試的干擾、研究多基因性狀的困難程度、和現有科學知識的局限性,今天任何敢於言之鑿鑿宣稱「基因導致兩個族群智力不同」的人,即使是諾貝爾獎得主,也只能以「偽科學販子」視之而已。

沃森其人,與DNA結構的一段公案

沃森素以放言無忌著稱,PBS紀錄片風波並非沃森第一次陷入爭議。在沃森的所有爭議中,最有名的大概要屬他、克里克(Francis Crick)與羅莎琳·富蘭克林(Rosalind Franklin)關於DNA結構的一段公案。

20世紀50年代初,學術界開始形成共識:DNA是承載遺傳信息的化學物質。然而DNA如何行使遺傳功能仍然是個謎團,為此必須理解DNA的分子結構。 當時就這個問題展開競爭的大致有三個團隊:劍橋大學卡文迪許實驗室的沃森和克里克;倫敦大學國王學院的威爾金斯(Maurice Wilkins)與富蘭克林;加州理工的鮑林(Linus Pauling)。 沃森和克里克初出茅廬,年輕氣盛;威爾金斯與富蘭克林都是訓練有素的晶體學家,但是二人關係不睦,完全無法形成合力;而鮑林已被公認為化學界不世出的天才,對分子的結構有着超凡的洞察力。

摘得「聖盃」的是資歷最淺的劍橋小分隊。1953年,沃森和克里克在《自然》雜誌上發表了一篇劃時代的論文,這篇短小精練的論文闡明了DNA的三維結構,宣告了分子生物學時代的到來。

然而沃森和克里克的榮譽來得並不是毫無爭議。在1953年的論文中, 沃森和克里克的DNA結構模型包括了三個要點:一、DNA的骨架結構為雙螺旋;二、鹼基在雙螺旋內側成線性排列;三,兩條螺旋上的鹼基通過氫鍵互補配對。對理解遺傳機制來說,後兩點可能更為重要,而這正是沃森和克里克的原創性貢獻;但是沒有富蘭克林的晶體學數據,後兩點大概還要停留在假設的階段。

可以說,富蘭克林獲得了最為關鍵的實驗數據,而沃森和克里克對數據的理解和整合則高出一籌,然而富蘭克林的名字僅在論文末尾致謝部分出現。

羅莎琳·富蘭克林 Rosalind Franklin。
羅莎琳·富蘭克林 Rosalind Franklin。

更嚴重的是,這些數據甚至不是通過正大光明的渠道獲得的。揭示DNA為雙螺旋結構的晶體衍射照片(科學史上俗稱「51號照片」)是威爾金斯在沒有預先徵求富蘭克林同意的情況下,擅自出示給沃森的。沃森立刻意識到,「X」形的衍射圖案意味着DNA的結構是雙螺旋。然而,沃森不可能只看了一眼照片就解析出相關參數,而莫名的「好運」這時再次眷顧了沃森和克里克:富蘭克林對51號照片的分析報告送到了劍橋大學卡文迪許實驗室主任布拉格(Lawrence Bragg)手中,布拉格將報告轉交給了手下的蛋白質晶體學專家佩魯茨(Max Perutz,1962年諾貝爾化學獎得主),而佩魯茨將報告送到了富蘭克林的競爭對手沃森和克里克眼皮底下——仍然是在她本人不知情的前提下。

佩魯茨後來辯解說,之前富蘭克林已經在小規模的會議上展示過報告中的很多數據,所以他以為報告已無秘密可言。諷刺的是,沃森也參加了富蘭克林的那次報告,不過當時他只注意到了富蘭克林「不善修飾,像個女學生」,對報告的重要性卻毫無知覺,甚至沒有做筆記。

1962年,沃森、克里克與威爾金斯因為揭示DNA結構而共同分享諾貝爾生理及醫學獎。不過,如果不是富蘭克林因為卵巢癌已與1958年逝世,最為公允的獲獎組合應該是沃森、克里克與富蘭克林。

2007年,沃森出版個人回憶錄《雙螺旋》,書中他寫下發現DNA結構的故事,但卻將重要的貢獻者富蘭克林描繪為性格怪癖、不近人情的老姑娘,而且有誇大己方智力貢獻的嫌疑。這種輕浮的態度招致了學界不少批評,最終沃森不得不追加了一段後記,來肯定富蘭克林的學術貢獻;但他在這本書中對富蘭克林的不公評價,也成了後界批評他「性別歧視」的多半來源。

然而我們可以就此斷定沃森是個無可救藥的厭女症患者嗎?2012年,女性生物科學家瓊安·斯代茨(Joan Steitz)榮獲Pearl Meister Greengard獎,在頒獎儀式中她談到,60年代初她剛被哈佛博士班錄取時,曾被某知名生化教授以「這種嚴肅領域不適合女性」的理由拒絕進入實驗室;是詹姆斯·沃森,當時還年輕的教授,熱情洋溢地歡迎她進入實驗室,開啟了她的學術生涯。

50年代的歐美學術界,很大程度上是白人男性俱樂部,與其說他們對女性和少數族裔懷有赤裸裸的惡意,不如說他們囿於偏見而拒絕自省。

回顧歷史,我們至少可以說,沃森和克里克沒有按照學術規範尊重富蘭克林的智力成果,事後也沒有充分肯定富蘭克林的原創性貢獻。不過富蘭克林的際遇,與其說是遇人不淑,不如說是當時整個社會對女性的智力和獨立性普遍缺少尊重的必然結果,即使是號稱「唯才是舉」的學術界也並不例外。如果51號照片的所有者是鮑林這樣成名已久的男性科學家,沃森和克里克二人行事是否會有所顧忌?答案多半是肯定的。有人會說,這並非因為鮑林身為男性,而是因為他已有的學術地位,問題是,在那個年代,女性要通過自己的成功被男性主導的學術界「看到」、進而獲取相應的學術地位,本來就困難重重。

實際上,晶體學當時已經是女性比較活躍的領域。在富蘭克林之前,已經有若干女性前輩在晶體學界開創出自己的天地。例如開女性入選英國皇家學會先河的朗斯戴爾(Kathleen Lonsdale),和蛋白質晶體學的先驅、牛津大學的霍奇金(Dorothy Hodgkin),但不論是學界還是大眾媒體,都常以戲噱口吻來談論這些女性的成就。正因為這種風氣無所不在,男性科學家很可能甚至意識不到自己對女性同行的的歧視。

50年代的歐美學術界,很大程度上是白人男性俱樂部,而沃森是那個時代的產物。 他無視常規、恃才傲物,但在天才時刻之外,沃森其實和同時代相當數量的白人男性並無二致,與其說他們對女性和少數族裔懷有赤裸裸的惡意,不如說他們囿於偏見而拒絕自省。

而沃森,年少成名,25歲取得了劃時代的科學成就,34歲榮獲諾貝爾獎,但其一生的學術高峰也就此定格在揭示DNA結構的時刻。中年後,沃森把更多的精力放在了管理工作上,先後領導著名的冷泉港實驗室和人類基因組計劃。也許是榮譽和地位讓沃森更有「底氣」抗拒外界的呼聲,時代改變了,沃森沒有變。當年站在科學前沿的弄潮兒,今天已經變成了脱離時代的老古董。

2001年8月15日,紐約市美國自然歷史博物館內有關人類基因組的展品。
2001年8月15日,紐約市美國自然歷史博物館內有關人類基因組的展品。

種族思維和中國大眾

為什麼中國人的種族思維如此根深蒂固?

對中文輿論場而言,「沃森失言風波」真正耐人尋味的,是這種挑戰「政治正確」的姿態如何意外地和中國大眾的種族意識發生共振。

筆者作為一個長居美國的中國留學生,不得不面對一個尷尬的日常現實:一方面,華人作為北美社會中的少數族裔,本身經常淪為白人強勢話語權的受害者;另一方面, 居住在美國的第一代華人移民,相當一部分熱衷於傳播針對其他族裔的刻板印象,其中不乏從中國名牌高校畢業後赴美深造的「高等華人」。如果試圖向這些人指出這種行為本質上已經涉及種族歧視,很可能聽到這樣的辯解:我只是在陳述事實,十個指頭尚不一樣長,不同族群之間怎麼會沒有差別?

這種辯解背後的謬誤此處不再贅述,但論者的心態倒是頗可尋味。一個來自幾乎不存在種族多樣性的社會的中國人,種族意識的發生和維持可能的確涉及不同的社會機制。

在美國社會中,占主導地位的白人和其他少數族裔在宏觀層面上是混居的。雖然白人和少數族裔可能存在嚴重的居住隔離,但是在日常工作生活中,不同族裔之間仍然有大量接觸機會。一個白人傳播種族偏見,無論有心還是無意,最終結果是鞏固在現實社會中對本族有利的權力秩序,在社會資源分配上擠壓弱勢族裔空間,而這種秩序會成為種族偏見循環傳播的温床。在這種情況下,社會意識和社會結構之間形成正反饋。

然而一個居住在漢族聚居區的中國人,傳播「黑種人智力不如白種人和黃種人」這種偽科學,卻幾乎沒有從現實中獲利的可能,畢竟大部分中國人日常並不會與其他族裔發生有意義的接觸,就算形成「黃種人高於黑種人」的意識,這種意識也沒有多少塑造社會現實的機會。那麼為什麼中國人的種族思維如此根深蒂固呢?

一種可能的解釋是:塑造今日中國人的種族意識的關鍵,是20世紀早期中國國族的建構歷程。彼時恰是科學種族主義大行其道的年代,台灣大學的奇邁可的著作《成為黃種人:種族思維簡史》對種族思維在東亞社會的傳播有着精彩的梳理。2015年,北京大學的歷史學者羅新為之撰寫了一篇及其在中文知識界流傳甚廣的書評《我們不是黃種人》,羅新教授的文章觸及了一個中國人集體意識中的神話,這個神話是如此深入人心,以至於大部分人根本意識不到這是神話,倒像是「太陽從東邊升起」一樣的「常識」:中國人的種族思維,其源頭未必是為了維持「我者」對「他者」的現實優勢,而是為了防禦關於「我者」的「認知失調」——如果中國人要繼續作為「黃種人」存在,邏輯上必然要承認「白種人」和「黑種人」的存在,以及「科學種族主義」的那一套分類方法。在這個大前提下,各種關於「種族」的刻板印象自然層出不窮。

那麼中文思想界可以做什麼呢?要回答種族本質主義(racial essentialism)為何錯誤,答案不應該是「政治正確」——今時今日,「政治正確」已經被摻入了太多的「稻草人」,不管是其擁護者還是反對者,都難以就一個混沌不清的論述框架進行有效的討論。我們應該訴諸普世的道德原則,以及自然科學和社會科學的實證研究。種族思維的死穴,不是「政治不正確」,而是「道德不正確」和「事實不正確」。

(田禾,北京大學元培學院化學學士,洛克菲勒大學化學生物學博士,哈佛大學博士後)

註1:分子人類學家發現:今天的人類,也就是所謂現代智人,其共同祖先來自非洲——這與大量的化石和考古證據相符。現代人類群體遷徙和分化的事件順序不是線性的,更像一條多次分岔的河流,而支流之間又可能重新匯合。智人走出非洲的時間點要比之前猜測的晚近得多,大概在十萬到七萬年之前。分子人類學揭示了人類演化過程中很多有趣的歷史,例如走出非洲後的智人與尼安德特人存在基因庫交流,而今天的非洲人基因組中就鮮有來自尼安德特人的成分。

註2:韋克斯勒智力量表創立於20世紀上半葉,經過數十年的改進,已經具有相當好的穩定性,也就是說同一個人在不同時間接受測驗,得出的結果差異很小。韋克斯勒智力量表的效度得到了很多心理學家的承認。

智商是一種「標準分」,假設群體智商服從正態分布,平均值定義為100,標準差為15。假如某人智商130,那麼這個人的智商在人群中處於前3%的位置。韋克斯勒智力量表是一個頗為複雜的測試,需要在專業人員主持下實行,至於網絡上各種智商測試,基本可視為自娛自樂。

讀者評論 25

會員專屬評論功能升級中,稍後上線。加入會員可閱讀全站內容,享受更多會員福利。
  1. 写的太好了…深入浅出…社科相关学生表示膜拜

  2. 好文!值得收藏再读。我也认为质化分析意义非凡,量化并不一定就高级。

  3. 强,这篇文章提高了我的认知。

  4. 端最近开大了,文章很硬核,感激涕零

  5. 太好了
    在外和那些华人辩论让我身心俱疲
    而且是愤怒,己所不欲勿施于人对他们来说是不需要兑现的

  6. Political correctness always obstructs scientific progress.

  7. Race Differences in Intelligence: An Evolutionary Analysis is a 2006 book by controversial race and intelligence writer Richard Lynn reviewing selected literature on IQ testing and arguing for in part genetic racial differences and with a discussion on the causes and consequences.
    Reviews of the book fault the selection of data used, the methodology, and the conclusions drawn from the data, resulting in criticism that it is “the sort of book that gives IQ testing a bad name.”
    Richard Lynn (born 20 February 1930) is a controversial English psychologist and author. He is a former professor emeritus of psychology at Ulster University, having had the title withdrawn by the university in 2018, and assistant editor of the journal Mankind Quarterly, which has been described as a “white supremacist journal”

  8. 基因的而且確千種萬種,然只能說,「決定外在體質 (黑、白、黃、褐) 特徵的少量基因」對於人來說,重要性不是一般的大。
    正如上一遍遊戲文章中的機械生命「波伏娃」,人多少都是活在鏡面,從鏡像中的自己來決定思考—-無論這種鏡像是真的一面鏡中反映抑或集體評價;從思考、附會,然後上升到認知。
    從小毀容者在成長過程很容易遭受不必要的壓力,從社會紛圍中、從鏡子中與自己外貌與其他人的差別中找到自己—-即使智力與容貌正常者一般無異。這下就容易理解多了。
    然而,衝出這種思維慣性卻是很難,米歇爾不也被指「成為了一個白人」而招受批評嗎?
    我相信,黑人之間的智力確實有共通點的,這種共通點目前看—-主要或源自決定外表的基因。然我們大多數人均遠離種族衝突激烈花旗五十州,對於這些遠來的黑膚色、貌相迵異的人們,正如我們對待那些種族類近的毀容者,不該出現的羞辱這盡量免了吧!正如看到說臉上身上生肉瘤的被人說脾氣怪、有人甚至叱他到一邊去的時候,我們會義憤填膺、搖頭嘆息;那般長得黑皮厚唇卻遭指智力低下、生性懶惰,何嘗不是一種強勢者對卑下者的欺凌?進一步說,黑人即使有這樣那樣的不足,那亦是出於彼個人問題、出於其彼族社會問題,上升附會到容貌決定—-也太荒唐了吧!隨便歸咎於外貌並不能使自身得益,反而加深了該種族集體困境—-將使種族內每一個成員更難逃脫這些不足,因為長相是他們視覺上最顯著、最容易引發聯想的特徵。
    「性相近、習相遠。」
    人一開始並不是天性如此,只是習慣使然、風氣使然。

  9. 沃森又双叒叕来了啊?每隔几年都能看到,都有既视感了。

  10. 深入淺出,好看!
    質化分析做得好,其意義完全不輸給量化資料。分析命題的真偽或是名詞定義是否來自社會建構這都不是丟個量化資料就可以講清楚的。

  11. 这篇文章写得很好,作者的文字功底出众。看完后大致感觉:沃森的言论确实不妥;但种族与智商似乎也并非一定没有关系。

  12. 人类喜欢把复杂的事物拆开,放进一个又一个盒子里,然后为了盒子上的标签和归类方式吵得面红耳赤,有时还会大动干戈。
    不要叫我黄种人,不要叫我汉族人,不要叫我中国人,不要叫我亚洲人!我就是这个地球上生活着的一个地球人!

  13. 作者的結構很清晰,但在解釋智力的部份的可以更清晰,科學門外漢表示看不懂

  14. Rosalind Elsie Franklin 才是雙螺旋結構的真正發現者吧

  15. @Bd: Lynn, R. (2006). Race differences in intelligence: an evolutionary analysis. Washington Summit Publishers. 这篇作为例子就很不错。不知道您有何看法?

  16. 楼下说量化的先给个数据先?

  17. 这篇大量使用质化而不是量化的说理,没有直接反驳原本论点的,这是我非常不希望在科普中看到的。这些观点都存在不可证伪性,作为假说可以,但如果要用来反驳现有研究结论则不妥,事实上如果你提出的是解释现有研究假说,反而从某种程度上支持了对方的实验数据。我们要做的是去研究如何客观地用新的模型来证明种族和智商的关联只是被基因给混淆了(所谓「伪关系」),而不是去质疑作者人格和背景,或是硬要把强迫给学者标签政治立场,我们不是《追梦学术圈》,文革迫害这种事情还是少做。另外科普中一些偏颇(G 因子的可依赖性并不低,事实上在行为学里有专门的分支去做关联分析)。

  18. 恰好在加拿大学种族学,补充一下,“种族”所代表的政治社会意义远大于其生物医学意义,它是一种有目的的身份构建,这种身份构建也时常变化。历史上的意大利人,西班牙人在美国也有不被当做“白人”的时候。
    西方人由殖民时代开始构建的种族论在很明显的塑造中国人的认知格局,很多并非事实却形成了人们习以为常的“知识”,这种错误的“知识”又反向促进了国内的高涨的民族主义和意义不清的种族观。使得国内民众在讨论涉外问题时偶尔也会出现“白皮猪”“黑鬼”“猴子”这样极具种族主义色彩的侮辱性言论。
    总之作者写的非常好,希望以后有机会继续读到这样的高质量的文章。

  19. 写得真好。

  20. 我觉得两边还是在争不同的事情。
    那边说的是“假设某种100%科学的种族划分方法,某种100%公正的智力测试方法,我们用该智力测试得到的数据,并以某种100%公正统计方法来计算该种族划分得到的各种族的平均智力水平。种族间的智力水平差异肯定是存在的”。
    这里论证的是没有所谓公正的种族划分方法、智力测试方法;以及鼓吹前述观点的人往往在智力/种族上的概念是错误的,并带有沉重的偏见;乃至智力/种族本身不是良好的科学概念。
    一个在说存在性,一个在说可观测性。还是谁也不能说服谁

  21. 好文章。不过有一点不认可,文中说g不如血糖、血压之类可直接测量的量来得坚实,但我觉得g本身是就是指一种相关性,说「g存在」本身就是在说「四项(或者更多)认知能力测试结果的高度相关性存在」,即g本身就是一种「关系性实体」,这是和血糖、血压不同的。换句话说,对分项认知能力结果的相关性的分析就是对g的直接测量,而不是文中说的推测性测量,在这个意义上g和血糖血压在可靠性上是基本等同的。

  22. 中国的种族多样性跟日本、韩国比高很多了。如果跟印度、美国、俄罗斯比的话,中国社会的种族多样性确实很低吧。而且汉族占了92%,汉族内部父系上的分子人类学差异非常小的。在中国大多数地方几乎是没有种族多样性可言的

  23. 奇邁可是台灣大學的教授而非香港大學

    1. 謝謝您指出,已修正!

  24. 推好文,梳理得很詳盡。但作者也有自己的盲點,例如到最後居然說「一個來自幾乎不存在種族多樣性的社會的中國人」——中國的種族多樣性並不低,這句話顯示出即便自身在研究相關議題,也偶爾會落入國家長年教育所建構的刻板印象中。