评论|田禾:如何科学地反驳诺奖得主沃森的“种族决定智商论”

种族思维的死穴,不是“政治不正确”,而是“道德不正确”和“事实不正确”。
诺贝尔奖生理及医学奖得主詹姆斯·沃森 James Dewey Watson。
公共卫生

2019年1月, 诺贝尔奖生理及医学奖得主詹姆斯·沃森(James Dewey Watson)因为美国公共电视网(PBS)的《美国大师》纪录片重新回到公共视野。在纪录片中,沃森表示:“智力水平上,黑人和白人的平均值的确有所不同,而我认为这个不同正是基因导致的。”沃森所在的冷泉港实验室1月发表声明,称明确反对沃森的言论,指毫无科学依据、不计后果的言论应当受到谴责,并且不代表冷泉港实验室、实验室董事会、教员、学生的观点;同时,实验室决定收回沃森的所有荣誉头衔

这并不是沃森第一次表达类似观点。早在2007年,沃森在英国接受采访时就曾宣称非洲人智力不如白人,当时激起了强烈的公众反弹,直接导致沃森被迫从冷泉港实验室的领导层职务退休;而沃森也发表过不恰当的性别歧视言论,例如“基因改造可以让女性变得更漂亮”等。十余年后,沃森依旧“顽固不化”。

有人将沃森受到学术界普遍的抨击,与当年伽利略被罗马教廷强迫放弃日心说相提并论,指责“政治正确”压倒“科学探索”。很遗憾,这种观点属于逻辑谬误中的“虚假等同”,伽利略主张日心说是建立在经验实证工作之上的。如果伽利略支持日心说是他拍脑袋想出来的,那么我们只能说教廷限制言论,但不能说教廷限制科学。

然而更重要的问题在于,对没有受过学术训练的大众而言,一个诺贝尔奖得主的言论,无论与其专业领域是否相关、有无文献证据支持,很可能都自带“科学”的光环。如果沃森只是一名籍籍无名的退休教授,几次失言并不会在整个科学界激起如此浩大的反对声浪,然而沃森是20世纪生物学的标志性人物之一,学界如果对沃森的言论保持沉默,在大众眼中无异于为其背书。如果一种观点不是由数据和逻辑支持的,即使出自沃森这样的诺贝尔奖得主之口,也不能被视为“科学观点”。本文将全面剖析沃森言论的不恰当之处,甚至要指出,“种族与智力之关系”甚至不是一个真正意义上的科学问题。

詹姆斯·沃森和克里克(Francis Crick)。
詹姆斯·沃森和克里克(Francis Crick)。

当我们谈论种族的时候,我们在谈论什么

在社会学上,“种族”是有效概念,但在遗传学上,“种族”是个劣质概念。

如今,当我们使用“科学”这个概念时,指的是一种经验实证、探寻和组织知识的系统方法。正经的科学工作者看到“种族与基因的关系”这个命题,首先要做的,是弄清楚“种族”和“智力”的定义。科学研究中定义一般分为两种,一、理论定义,又称为概念性定义;二、操作性定义。前者指向一个事物的本质性特征,而后者是描述事物特征时需要的测试过程。

操作性定义必须足够清晰、客观,使经过相关训练、具有正常理性的人,都可以导出相同的结果;而一个概念性定义的出现有时会超前于科学家的实际观测能力,但在逻辑上,从概念性定义导出操作性定义必须是可行的。是否能建立这样的操作性定义,是一个命题成为“科学命题”的必要条件。一个典型的例子是“恶人死后会不会下地狱”:理论上,神学家可以给出“地狱”的概念性定义。然而“地狱”显然是没有操作性定义的,所以这个命题无法被科学地研究。

我们今天通常使用的“种族”这个概念,来自十八世纪欧洲学者的发明。瑞典植物学家现代生物分类学之父林奈(Carl Linnaeus)率先试用生物分类学方法研究人类社会。林奈提出人类可以按照肤色分为四大类:欧罗巴白种人、印第安红种人、非洲黑种人,和亚洲黄种人;德国学者布鲁门巴赫( Johann Blumenbach)在林奈的肤色分类法的基础上又引入了比较解剖学,将人类分为五大类:蒙古人种、高加索人种、尼格罗人种、马来人种、和印第安人种——这是今天美国常见的分类方法 (欧裔/白人,亚裔,非裔/黑人,北美原住民/印第安人,大洋洲岛民)的雏形。

布鲁门巴赫关于体质人类学的博士论文发表于1775年(要知道,达尔文的《物种起源》直到1859年才问世);1856到1863年,孟德尔进行了影响深远的豌豆实验,一般认为,豌豆实验证实了基因的存在,从而奠定了现代遗传学的基础;1944年,埃弗里-麦克劳德-麦卡蒂实验证明了DNA是遗传物质;1953年,沃森和克里克提出了DNA的双螺旋结构模型。又过了半个世纪,直到21世纪初,人类基因组计划才基本完成。

换言之,今日人们习而不察的“种族”概念,发明于科学界对演化、遗传、基因还近乎一无所知的时代。“种族”这种分类方法,其依据的科学知识,实在是很粗浅的。

今天强大的测序技术令研究人员获得了丰富的基因组数据,并以此为基础重建人类历史上的迁徙和演化事件,这个学科叫做分子人类学(注1)。对今天的整个人类社会而言,分子人类学最重要的发现或许是:人类的演化是一个连续的光谱,现存的人类,即使并非日常语言中所谓的“混血儿”,其基因也是一个大杂烩。正因为人类基因组的共同性远大于差异性, 任意两个个体之间的差异不到1%,科学家才需要绞尽脑汁来改善测序技术,发展各种统计方法,来解读这些细小差异。

可能有人会说,布鲁门巴赫那一批欧洲学者虽然没有现代生物学的基本知识,但这并不代表其创立的分类方法是毫无依据的,他们提出“种族”时已经考虑了地理群聚的要素,而空间上的邻近,往往意味着更多基因库的交流,因此同一“种族”之间具有更多的基因同源性,在科学史意义上,种族分类法不失为有意义的尝试。

但这种解读并不代表“种族”是一个我们应该沿用不疑的概念。这里暂且不谈传统的种族观与种族主义、殖民主义之间千丝万缕的联系,仅就生物学层面而言,这套学说也至少有如下几个问题。一、人类基因组本来是一个连续的光谱,而“白种人”、“黄种人”、“黑种人”这种说法却让人觉得分立的种群是真实存在的;二、群体边界的确定在基因组水平上看完全是主观的,例如非洲作为现存所有人类的共同祖源,“非裔”的内部基因库的多样性显著超过了欧洲人种和东亚人种,然而这些差异却被“非裔”这个笼统分类掩盖了;三、对决定外在体质特征的少量基因赋予了超常的权重;四、抹杀了人类的迁徙和演化的时间顺序,例如走出非洲后的智人先到达西亚,继而到达东亚,并取代了东亚的原住民(例如“北京猿人”),扩散到了整个东亚大陆——而在传统的种族划分方法看来,“非洲人”与“东亚人”是平行概念。

正因为“种族”作为一个生物学概念漏洞百出,今天分子人类学研究者更愿意使用“祖源”(ancestry)这个概念。祖源关心的,是现代人类的生物学祖先在历史上的地理分布。

在现实生活中,“种族”与“祖源”脱节的例子俯拾皆是。 比如奥巴马(欧巴马),他的父亲是来自肯尼亚的非裔,母亲是欧洲后裔,从遗传学角度看, 奥巴马的基因组中具有同等比例的欧洲和非洲的祖源。然而美国社会大部分人毫无疑问视其为非裔黑人。换言之,奥巴马之所以成为“黑人”,并不是因为他体内的“黑人基因”比“白人基因”占更大的权重,而是因为“黑人”这个概念本身就是在特定的政治和文化语境下约定俗成的概念。

在公共生活中,围绕“种族”的讨论具有特殊的复杂性。在遗传学意义上,“种族”是个劣质概念。在自然科学史上,新概念被后续研究争位的情况其实并不罕见,如曾经长期困扰物理学界的“以太”。对此,科学共同体的解决方法是将已被证伪的概念从学科共同语言中剔除。实际上,今天的学习物理的学生不会再纠结于“以太”,因为这个概念根本不会作为教科书中的正式内容出现。

然而在我们讨论社会与政治生活时,“种族”作为社会建构之存在并不需要遗传学证据来支持,只要社会的大部分成员仍然认为“种族”是真实存在的,并运用“种族”这个认知来完成身份认同、群体动员、资源分配等活动,“种族”就是一个社会学意义上的有效概念。“某某种族”具有“某种遗传学特征”的断言,从生物学视角看经常是漏洞百出。然而“黑人性命也是命”(Black Lives Matter)这种社会运动,本身指向的是社会建构意义上的种族,这时候,我们并不能因为“种族”作为生物学概念具有各种缺陷,就轻易断言“种族”是伪概念——这样我们会立刻掉入另一个陷阱:从废奴运动到民权运动先人为争取种族平权的种种论述,以及当代学者对涉及种族的结构性歧视的精细研究,岂不都成了伪命题?一味向不熟悉种族议题历史流变的当代公众强调“种族”是伪概念,带来的困惑只怕多于启蒙。

2018年,哈佛大学医学院学者David Reich在《纽约时报》上发表了题目为“遗传学在如何改变我们对‘种族’的理解”一文,试图探讨这个极为棘手的“种族”问题:一方面种族是一个“社会建构”,一种随时间和国家变化的人群分类方式;另一方面现代基因组学的确揭示了不同人群中的遗传差别。Reich此文在英语知识界激起了不少反对的声音,反对者忧心Reich此文会让“科学种族主义”沉渣泛起。

对这场辩论双方的主要观点,华东师范大学刘擎教授已经在“2018西方思想年度述评”一文中做了出色的概括。刘擎教授将这场争论概括为“科学探索与政治正确的争论”。笔者看来,与其说这是“科学探索”与“政治正确”之间的矛盾,不如说是种族这一概念作为“已淘汰的科学概念”与“社会建构之真实”之间的张力。

吊诡的是,由于大部分人接触到的是作为“社会建构之真实”的“种族”,这反而放大了很多人将“种族”作为“科学之真实”讨论的冲动。反对Reich的声音看起来似乎有悖智力诚实的原则,背后的担忧却是有真切现实关怀的:一般而言,今天的公众不会赤裸裸拥抱旧日种族主义论述,但其知识储备对种族主义的思维方式未必具有真正的免疫力。在这个舆论战场上,遗传学家需要找到合适的方式,向公众交待关于人类基因多样性的发现——不然只会被真正的种族主义者劫持话语。Reich的努力,或许技术层面并非完美,但方向上却是值得肯定的。

1957年的詹姆斯·沃森。
1957年的詹姆斯·沃森。

当我们谈论智力的时候,我们在谈论什么

大众往往高估在学术上取得过人成就所需要的内禀智力,却低估时空环境和群聚效应对创造性活动的重要意义。

我们再来讨论一下什么是“智力”。这里我们将“智力”定义为综合的认知能力。要研究遗传与智力的关系,我们首先要考虑智力在多大程度上可以被准确地度量。

首先,用学业成绩和教育水平来估计智力水平是极其不可靠的,“某族的孩子很少上大学,说明这个族群智力有问题”这种流行说法是不折不扣的错误认知。大量社会科学研究都证实了家庭社会地位、经济条件、育儿方式等因素与学业成绩具有强相关性。2015年,《纽约时报》根据哈佛和伯克利大学的一篇经济学论文绘制了一张图表,横轴为父母的经济收入相对值,纵轴为子女入大学的比例。这张图表揭示的现实堪称冰冷:在美国,父母收入与子女接受大学教育的机会几乎成完美的线性正相关。换言之,家庭社会经济因素对子女学业的影响几乎是压倒性的。即使控制了这些变量,学生的性格特质也可能影响其学业表现,比如尽责性和情绪稳定性较好的学生很可能会在现代教育体制中占有优势,但这显然是非智力因素。

既然用学业表现反推智力不可行,那么智力可不可以被直接测量呢?大部分人都听说过一种叫做“智力量表”的测量方法,其结果可以换算为“智商”。今天心理学家最常用的是韦克斯勒智力量表,考察的内容包括语词理解(verbal comprehension)、知觉推理 (perceptual reasoning)、即时记忆(working memory)、处理速度(processing speed)四大项,其下又分为十几个子项。研究人员发现,这四项能力有很高的相关性,一个被试如果在一方面表现出色,在其它三个方面也更有可能获得更高的分数。因此,一些心理学家假设,存在一种“一般性的智力”(g-factor,g因子),这种能力与脑生理因素有关,也可能具有遗传性。不过这个假说是存在争议的,和血压、血糖、尿蛋白这些可以直接测量的生理指标不同,g因子是从其它可观测指标间接推衍而来,对这种概念的使用,严谨的研究人员一般会格外小心。(注2)

智力存在流体智力与晶体智力的分别。流体智力指的是不受既有知识束缚的推理、记忆、运算等能力,而晶体智力指的是将语言、知识、经验、技能结合的能力。流体智力一般在二十岁早期达到顶峰,之后逐渐下降,也就是所谓的“年轻人脑子好”,而晶体智力是可以随着年龄和经验的增长不断上升的,在大脑出现显著的生理病变之前并不会下降。韦克斯勒智力量表同时考察流体智力与晶体智力。随着社会进步,针对特定人群的纵向追踪往往发现,同一人群的流体智力与晶体智力的测量结果会在长时间内不断提升,这叫做“弗林效应”(Flynn Effect)。因此智商测试的常模(供统计分析的标准量数)必须不断更新,否则今天的人去做几十年前的智商测试,很可能发生“自己是天才”的误会。

另一个要注意的问题是,由于智商测试的常模是与社会发展水平有关的,因此不同群体之间很可能没有可比性。发达地区的营养水平、教育投入、信息渠道,与落后地区相比,经常有霄壤之别。用同一套测验题目和常模去比较发达地区人群和落后地区人群的智商,前者常有显著优势,但这并不代表发达地区人群具有任何“基因优势”。这就好比将相同的种子分别洒在肥沃和贫瘠的土壤中,落到优势环境中的种子大概率会生出更茁壮的苗来。

当我们看到一则关于智力的研究资料时,要注意研究的时代。19世纪和20世纪早期的智商测验存在明显的社会和文化背景偏好。例如20世纪早期,美国优生学盛行,从纽约港埃利斯岛入境的移民一般要接受美国当局进行的智商测验。测试发现,来自东欧的犹太人普遍“智力低下”。实际上,美国犹太人在学术、艺术、商业等多个领域成就非凡,当年埃利斯岛的“研究成果”今天看来无异于是天大的笑话。这里面的问题在于:一、忽视了社会综合发展水平对智力测验结果的影响;二、没有矫正文化背景、特别是语言背景对测试的影响。

正因为文化和经济背景对智力测试结果存在显著影响,使得这种方法在同质群体内部或许还有一定可信度,但在用于比较不同社会发展水平和文化背景下的群体时,要得出有意义的结论就困难得多了。此外,即使在同一个国家或地区内部,不同群体能享受的社会资源也可能存在极大差异。典型的实例如欧美发达国家内部的少数族裔可能在婴幼儿营养水平、社区教学条件、父母经济背景、社区人际资源等一系列社会经济指标上和“主流人群”都存在显著差异。如果弱势群体能在同一个智力测试中和优势群体表现得同样出色,那才是违背了既有的科学范式。

“低智力族群”的镜像是“高智力族群”的神话, 例如东欧阿什肯纳兹犹太人经常被用来当作智力超群族裔的典型:犹太人占世界总人口仅为0.2%,却贡献了超过20%的诺贝尔奖得主。其实大众往往高估在学术上取得过人成就所需要的内禀智力,却低估时空环境和群聚效应对创造性活动的重要意义。

智力成就极高的犹太人,他们的生活环境经常与两个城市有关:奥匈帝国治下的维也纳,和20世纪的纽约——二者都是人文荟萃的国际性都市。维也纳的犹太人在大屠杀之前曾达到10%,纽约的犹太人口比例达到12%——今天纽约的犹太人口仅次于特拉维夫。纳粹统治之前的维也纳和纽约都以包容性闻名,而犹太人之前以长期经商为生,在这样的城市中不难跻身中产阶级。任何一个族群如果在这种量级的城市中有相当数量的中产阶级人口,大概都会“天才”辈出的。在我们充分理解这些环境因素之前,不应当轻易将阿什肯纳兹犹太人的成绩归结为智力超群。

犹太人占世界总人口仅为0.2%,却贡献了超过20%的诺贝尔奖得主。其实大众往往高估在学术上取得过人成就所需要的内禀智力,却低估时空环境和群聚效应对创造性活动的重要意义。
犹太人占世界总人口仅为0.2%,却贡献了超过20%的诺贝尔奖得主。其实大众往往高估在学术上取得过人成就所需要的内禀智力,却低估时空环境和群聚效应对创造性活动的重要意义。

智力与基因的关系能被科学地研究吗

双胞胎实验有力证明智力与基因有关,但双胞胎实验的研究对象显然是没有祖源或“种族”上的差异的。

基因对智力有多大影响?答案是很大。研究人员为了分析“先天”与“后天”的影响,经常采用“双胞胎实验”:同卵双胞胎的基因组、胚胎发育环境几乎是完全相同的,而异卵双胞胎的胚胎发育环境相近、基因组有一半不同。 在有些情况下,双胞胎未必会在原生家庭中一同长大,可能出现被不同家庭收养的情况,这样就有四种养育情况:

同卵双胞胎-共同养育、 同卵双胞胎-分开养育、 异卵双胞胎-共同养育、 异卵双胞胎-分开养育。

研究人员分别测试双胞胎的智商,并计算二者智力的相关系数。结果发现相关程度从高到低依次为:同卵双胞胎—共同养育、 同卵双胞胎—分开养育、 异卵双胞胎—共同养育、 异卵双胞胎—分开养育。同卵双胞胎即使分开养育,其智力相关性仍然高于共同养育的异卵双胞胎。双胞胎实验的结论已经被多个独立研究重复,具有相当的可靠性。

双胞胎实验有力证明智力与基因有关,但双胞胎实验的研究对象显然是没有祖源或“种族”上的差异的。如前所述,直接比较不同族群的智力测试结果,是不能证明差异很大的人群之间存在智力差异的。假如有人仍然试图进行这样的“科学探索”,还有一种“迂回”方法:如果我们能找到“聪明基因”,并证明一个特定人群具有更多的“聪明基因”,不就可以得出结论说这个群体在智力上具有“基因优势”了吗?

科学家能不能发现影响智商的基因呢?答案是,目前科学家擅长的,是发现可导致严重智力缺陷的基因突变。例如苯酮尿症(phenylketonuria,PKU)的患者的苯丙氨酸羟化酶基因发生突变,结果无法正常代谢苯丙氨酸。这种异常代谢可以影响婴儿和儿童时期的大脑发育。患儿必须从出生起严格控制饮食,否则会出现严重的智力缺陷。然而携带正常的苯丙氨酸羟化酶基因并不会令人智力超常,换言之,研究智力缺陷,很多时候并不能增加我们对正常智力运作模式的理解。主要困难在于,智力是一个多基因性状。如果有几百个基因可能影响到智力的高低,而每个基因只发挥很小的作用,那么在浩瀚的基因组上抓出这样的基因是极其艰巨的。

对研究多基因性状,目前科学家最常用的方法叫全基因组关联分析(Genome-wide association study,GWAS)。简单的说,这是对基因组的大数据分析。科学家需要两组数据:被分析人群的全基因组测序结果和可量化的特定性状,目标是发掘与特定性状相关的基因变异。当分析样本足够大的时候,噪音会逐渐被压低,而真正的信号就有可能从海量数据中浮现。

学过信号与数据分析的人都听过一句话: “废料进,废品出”(Garbage in, garbage out)。意思是如果输入的原始数据质量出了问题,那么再高明的分析方法也得不出有有意义的结果。今天全基因组测序技术已经达到了相当的准确度,但并不是所有的性状都可以被精确量化的:

如果我们去比较不同人群的身高,我们可以很有信心的说,拿到的身高数据是非常可靠的。毕竟物理学家对长度的定义已经达到了“一米等于光在真空中行进299792458分之1秒的距离”的精度,而标准长度测量工具已经极为普及,从“概念性定义”和“操作性定义”两个角度考察,身高都是一个具有极高信度的物理量;

但如果我们就II型糖尿病和基因去做全基因组关联分析,问题就要复杂一些了——II型糖尿病人的生活习惯、发病年龄、严重程度是存在个体差异的,要怎样把描述性的指标转化为有意义的量化参数呢?这并不是显而易见的。

对智力做全基因组关联分析又要比研究生理数据更为复杂。如前文所言,智力测验依赖于常模的质量,其结果具有一定的不确定性。如果甲的身高为1.65米,乙的身高为1.6米,那我们可以断言甲比乙高。但如果甲的智商测验结果是130,乙是125,我们能不能肯定得说甲更“聪明”呢?大概只能说二者智力相似。

此外,智力测试结果是与文化和经济背景相关的,这种方法在比较同质群体内部智力差异的时候或许还有一定效力,而用于比较社会经济阶层和文化差异极大的群体时必须慎之又慎。假设我们用同一个智力量表考察美国富有白人社区的小孩和中国贫困山区留守儿童,再用这两个群体的基因组信息做关联分析,大概率会发现决定头发颜色的基因是与智力“显著相关”的,但这种研究方法显然是荒谬的。

实际上,来自荷兰的一个研究团队的确就智力进行了全基因组关联分析。 2018年,阿姆斯特丹自由大学的Danielle Posthuma小组在 《自然-遗传学》上发表文章,宣称 205 个基因组位点、1016个基因与智力有关。这个研究的对象限于欧洲发达国家的白人,样本数量达到了27万人之多。研究智力遗传的困难,可见一斑。

我们姑且假设阿姆斯特丹自由大学的研究结果具有相当高的质量。现在我们手上有了长达1016个基因的清单。注意这个清单只是说这些基因与智力有相关性,但是相关性并不代表因果性。一般来说,遗传学家想搞清楚一个基因是否参与决定某个性状,会做两件事:一、把这个基因突变甚至敲除,观察生物体的性状是否就此改变;二、修复被破坏的基因,观察被改变的性状是否逆转。问题是,科学家不可能在人体上进行这样的实验。如果我们研究的是与糖尿病有关的基因,那么我们可以建立小鼠模型,测量小鼠的胰岛素分泌水平、血糖浓度等生理指标,但用其它生物模拟人类的认知活动是不现实的。人类智力活动的关键在于人类通过语言和符号交流的能力,即使是和人类最接近的黑猩猩,其符号能力也不如人类的幼儿。科学家能做到的大概是观察这些基因对神经细胞和组织发育的影响,但从单个细胞到完整个体的智力活动,其间存在巨大的鸿沟,任何在细胞水平进行的研究意义终归是有限的。

此外,还有一种关于智力的“演化模型”:在复杂的人类社会,智力更高的人会获取更多的社会资源,因此有更高的机会将基因传给后代,经过数千年的演化,“聪明基因”会在 “发达社会”中的人口富集。这作为一个假说的确是可以初步成立的。但要变成一个有价值的学说,还要用实证填上逻辑链条上的一些环节。智力更高的人真的会拥有更多的后代吗?这并不是一件“显而易见”的事,因为在有文字记载的大部分人类历史中,并不存在现代意义上的“绩优社会”(meritorious society),而在等级社会中,智力优势能不能转化资源优势,进而转化为更多的后代呢?如果是,基因频率改变的速度快到足以产生显著差别吗? 而到了现代社会,人类的生育行为又发生了变化,学业表现更好的人群,尤其是女性,经常自愿降低生育率。如果没有足够的实证研究,这个模型只能停留在“假说”的阶段。

任何敢于言之凿凿宣称“基因导致两个族群智力不同”的人,即使是诺贝尔奖得主,也只能以“伪科学贩子”视之而已。

考虑到智力测试的不确定性、文化和经济因素对智力测试的干扰、研究多基因性状的困难程度、和现有科学知识的局限性,今天任何敢于言之凿凿宣称“基因导致两个族群智力不同”的人,即使是诺贝尔奖得主,也只能以“伪科学贩子”视之而已。

沃森其人,与DNA结构的一段公案

沃森素以放言无忌著称,PBS纪录片风波并非沃森第一次陷入争议。在沃森的所有争议中,最有名的大概要属他、克里克(Francis Crick)与罗莎琳·富兰克林(Rosalind Franklin)关于DNA结构的一段公案。

20世纪50年代初,学术界开始形成共识:DNA是承载遗传信息的化学物质。然而DNA如何行使遗传功能仍然是个谜团,为此必须理解DNA的分子结构。 当时就这个问题展开竞争的大致有三个团队:剑桥大学卡文迪许实验室的沃森和克里克;伦敦大学国王学院的威尔金斯(Maurice Wilkins)与富兰克林;加州理工的鲍林(Linus Pauling)。 沃森和克里克初出茅庐,年轻气盛;威尔金斯与富兰克林都是训练有素的晶体学家,但是二人关系不睦,完全无法形成合力;而鲍林已被公认为化学界不世出的天才,对分子的结构有着超凡的洞察力。

摘得“圣杯”的是资历最浅的剑桥小分队。1953年,沃森和克里克在《自然》杂志上发表了一篇划时代的论文,这篇短小精练的论文阐明了DNA的三维结构,宣告了分子生物学时代的到来。

然而沃森和克里克的荣誉来得并不是毫无争议。在1953年的论文中, 沃森和克里克的DNA结构模型包括了三个要点:一、DNA的骨架结构为双螺旋;二、碱基在双螺旋内侧成线性排列;三,两条螺旋上的碱基通过氢键互补配对。对理解遗传机制来说,后两点可能更为重要,而这正是沃森和克里克的原创性贡献;但是没有富兰克林的晶体学数据,后两点大概还要停留在假设的阶段。

可以说,富兰克林获得了最为关键的实验数据,而沃森和克里克对数据的理解和整合则高出一筹,然而富兰克林的名字仅在论文末尾致谢部分出现。

罗莎琳·富兰克林 Rosalind Franklin。
罗莎琳·富兰克林 Rosalind Franklin。

更严重的是,这些数据甚至不是通过正大光明的渠道获得的。揭示DNA为双螺旋结构的晶体衍射照片(科学史上俗称“51号照片”)是威尔金斯在没有预先征求富兰克林同意的情况下,擅自出示给沃森的。沃森立刻意识到,“X”形的衍射图案意味着DNA的结构是双螺旋。然而,沃森不可能只看了一眼照片就解析出相关参数,而莫名的“好运”这时再次眷顾了沃森和克里克:富兰克林对51号照片的分析报告送到了剑桥大学卡文迪许实验室主任布拉格(Lawrence Bragg)手中,布拉格将报告转交给了手下的蛋白质晶体学专家佩鲁茨(Max Perutz,1962年诺贝尔化学奖得主),而佩鲁茨将报告送到了富兰克林的竞争对手沃森和克里克眼皮底下——仍然是在她本人不知情的前提下。

佩鲁茨后来辩解说,之前富兰克林已经在小规模的会议上展示过报告中的很多数据,所以他以为报告已无秘密可言。讽刺的是,沃森也参加了富兰克林的那次报告,不过当时他只注意到了富兰克林“不善修饰,像个女学生”,对报告的重要性却毫无知觉,甚至没有做笔记。

1962年,沃森、克里克与威尔金斯因为揭示DNA结构而共同分享诺贝尔生理及医学奖。不过,如果不是富兰克林因为卵巢癌已与1958年逝世,最为公允的获奖组合应该是沃森、克里克与富兰克林。

2007年,沃森出版个人回忆录《双螺旋》,书中他写下发现DNA结构的故事,但却将重要的贡献者富兰克林描绘为性格怪癖、不近人情的老姑娘,而且有夸大己方智力贡献的嫌疑。这种轻浮的态度招致了学界不少批评,最终沃森不得不追加了一段后记,来肯定富兰克林的学术贡献;但他在这本书中对富兰克林的不公评价,也成了后界批评他“性别歧视”的多半来源。

然而我们可以就此断定沃森是个无可救药的厌女症患者吗?2012年,女性生物科学家琼安·斯代茨(Joan Steitz)荣获Pearl Meister Greengard奖,在颁奖仪式中她谈到,60年代初她刚被哈佛博士班录取时,曾被某知名生化教授以“这种严肃领域不适合女性”的理由拒绝进入实验室;是詹姆斯·沃森,当时还年轻的教授,热情洋溢地欢迎她进入实验室,开启了她的学术生涯。

50年代的欧美学术界,很大程度上是白人男性俱乐部,与其说他们对女性和少数族裔怀有赤裸裸的恶意,不如说他们囿于偏见而拒绝自省。

回顾历史,我们至少可以说,沃森和克里克没有按照学术规范尊重富兰克林的智力成果,事后也没有充分肯定富兰克林的原创性贡献。不过富兰克林的际遇,与其说是遇人不淑,不如说是当时整个社会对女性的智力和独立性普遍缺少尊重的必然结果,即使是号称“唯才是举”的学术界也并不例外。如果51号照片的所有者是鲍林这样成名已久的男性科学家,沃森和克里克二人行事是否会有所顾忌?答案多半是肯定的。有人会说,这并非因为鲍林身为男性,而是因为他已有的学术地位,问题是,在那个年代,女性要通过自己的成功被男性主导的学术界“看到”、进而获取相应的学术地位,本来就困难重重。

实际上,晶体学当时已经是女性比较活跃的领域。在富兰克林之前,已经有若干女性前辈在晶体学界开创出自己的天地。例如开女性入选英国皇家学会先河的朗斯戴尔(Kathleen Lonsdale),和蛋白质晶体学的先驱、牛津大学的霍奇金(Dorothy Hodgkin),但不论是学界还是大众媒体,都常以戏噱口吻来谈论这些女性的成就。正因为这种风气无所不在,男性科学家很可能甚至意识不到自己对女性同行的的歧视。

50年代的欧美学术界,很大程度上是白人男性俱乐部,而沃森是那个时代的产物。 他无视常规、恃才傲物,但在天才时刻之外,沃森其实和同时代相当数量的白人男性并无二致,与其说他们对女性和少数族裔怀有赤裸裸的恶意,不如说他们囿于偏见而拒绝自省。

而沃森,年少成名,25岁取得了划时代的科学成就,34岁荣获诺贝尔奖,但其一生的学术高峰也就此定格在揭示DNA结构的时刻。中年后,沃森把更多的精力放在了管理工作上,先后领导著名的冷泉港实验室和人类基因组计划。也许是荣誉和地位让沃森更有“底气”抗拒外界的呼声,时代改变了,沃森没有变。当年站在科学前沿的弄潮儿,今天已经变成了脱离时代的老古董。

2001年8月15日,纽约市美国自然历史博物馆内有关人类基因组的展品。
2001年8月15日,纽约市美国自然历史博物馆内有关人类基因组的展品。

种族思维和中国大众

为什么中国人的种族思维如此根深蒂固?

对中文舆论场而言,“沃森失言风波”真正耐人寻味的,是这种挑战“政治正确”的姿态如何意外地和中国大众的种族意识发生共振。

笔者作为一个长居美国的中国留学生,不得不面对一个尴尬的日常现实:一方面,华人作为北美社会中的少数族裔,本身经常沦为白人强势话语权的受害者;另一方面, 居住在美国的第一代华人移民,相当一部分热衷于传播针对其他族裔的刻板印象,其中不乏从中国名牌高校毕业后赴美深造的“高等华人”。如果试图向这些人指出这种行为本质上已经涉及种族歧视,很可能听到这样的辩解:我只是在陈述事实,十个指头尚不一样长,不同族群之间怎么会没有差别?

这种辩解背后的谬误此处不再赘述,但论者的心态倒是颇可寻味。一个来自几乎不存在种族多样性的社会的中国人,种族意识的发生和维持可能的确涉及不同的社会机制。

在美国社会中,占主导地位的白人和其他少数族裔在宏观层面上是混居的。虽然白人和少数族裔可能存在严重的居住隔离,但是在日常工作生活中,不同族裔之间仍然有大量接触机会。一个白人传播种族偏见,无论有心还是无意,最终结果是巩固在现实社会中对本族有利的权力秩序,在社会资源分配上挤压弱势族裔空间,而这种秩序会成为种族偏见循环传播的温床。在这种情况下,社会意识和社会结构之间形成正反馈。

然而一个居住在汉族聚居区的中国人,传播“黑种人智力不如白种人和黄种人”这种伪科学,却几乎没有从现实中获利的可能,毕竟大部分中国人日常并不会与其他族裔发生有意义的接触,就算形成“黄种人高于黑种人”的意识,这种意识也没有多少塑造社会现实的机会。那么为什么中国人的种族思维如此根深蒂固呢?

一种可能的解释是:塑造今日中国人的种族意识的关键,是20世纪早期中国国族的建构历程。彼时恰是科学种族主义大行其道的年代,台湾大学的奇迈可的著作《成为黄种人:种族思维简史》对种族思维在东亚社会的传播有着精彩的梳理。2015年,北京大学的历史学者罗新为之撰写了一篇及其在中文知识界流传甚广的书评《我们不是黄种人》,罗新教授的文章触及了一个中国人集体意识中的神话,这个神话是如此深入人心,以至于大部分人根本意识不到这是神话,倒像是“太阳从东边升起”一样的“常识”:中国人的种族思维,其源头未必是为了维持“我者”对“他者”的现实优势,而是为了防御关于“我者”的“认知失调”——如果中国人要继续作为“黄种人”存在,逻辑上必然要承认“白种人”和“黑种人”的存在,以及“科学种族主义”的那一套分类方法。在这个大前提下,各种关于“种族”的刻板印象自然层出不穷。

那么中文思想界可以做什么呢?要回答种族本质主义(racial essentialism)为何错误,答案不应该是“政治正确”——今时今日,“政治正确”已经被掺入了太多的“稻草人”,不管是其拥护者还是反对者,都难以就一个混沌不清的论述框架进行有效的讨论。我们应该诉诸普世的道德原则,以及自然科学和社会科学的实证研究。种族思维的死穴,不是“政治不正确”,而是“道德不正确”和“事实不正确”。

(田禾,北京大学元培学院化学学士,洛克菲勒大学化学生物学博士,哈佛大学博士后)

注1:分子人类学家发现:今天的人类,也就是所谓现代智人,其共同祖先来自非洲——这与大量的化石和考古证据相符。现代人类群体迁徙和分化的事件顺序不是线性的,更像一条多次分岔的河流,而支流之间又可能重新汇合。智人走出非洲的时间点要比之前猜测的晚近得多,大概在十万到七万年之前。分子人类学揭示了人类演化过程中很多有趣的历史,例如走出非洲后的智人与尼安德特人存在基因库交流,而今天的非洲人基因组中就鲜有来自尼安德特人的成分。

注2:韦克斯勒智力量表创立于20世纪上半叶,经过数十年的改进,已经具有相当好的稳定性,也就是说同一个人在不同时间接受测验,得出的结果差异很小。韦克斯勒智力量表的效度得到了很多心理学家的承认。

智商是一种“标准分”,假设群体智商服从正态分布,平均值定义为100,标准差为15。假如某人智商130,那么这个人的智商在人群中处于前3%的位置。韦克斯勒智力量表是一个颇为复杂的测试,需要在专业人员主持下实行,至于网络上各种智商测试,基本可视为自娱自乐。

读者评论 25

会员专属评论功能升级中,稍后上线。加入会员可阅读全站内容,享受更多会员福利。
  1. 写的太好了…深入浅出…社科相关学生表示膜拜

  2. 好文!值得收藏再读。我也认为质化分析意义非凡,量化并不一定就高级。

  3. 强,这篇文章提高了我的认知。

  4. 端最近开大了,文章很硬核,感激涕零

  5. 太好了
    在外和那些华人辩论让我身心俱疲
    而且是愤怒,己所不欲勿施于人对他们来说是不需要兑现的

  6. Political correctness always obstructs scientific progress.

  7. Race Differences in Intelligence: An Evolutionary Analysis is a 2006 book by controversial race and intelligence writer Richard Lynn reviewing selected literature on IQ testing and arguing for in part genetic racial differences and with a discussion on the causes and consequences.
    Reviews of the book fault the selection of data used, the methodology, and the conclusions drawn from the data, resulting in criticism that it is "the sort of book that gives IQ testing a bad name."
    Richard Lynn (born 20 February 1930) is a controversial English psychologist and author. He is a former professor emeritus of psychology at Ulster University, having had the title withdrawn by the university in 2018, and assistant editor of the journal Mankind Quarterly, which has been described as a "white supremacist journal"

  8. 基因的而且確千種萬種,然只能說,「決定外在體質 (黑、白、黃、褐) 特徵的少量基因」對於人來說,重要性不是一般的大。
    正如上一遍遊戲文章中的機械生命「波伏娃」,人多少都是活在鏡面,從鏡像中的自己來決定思考----無論這種鏡像是真的一面鏡中反映抑或集體評價;從思考、附會,然後上升到認知。
    從小毀容者在成長過程很容易遭受不必要的壓力,從社會紛圍中、從鏡子中與自己外貌與其他人的差別中找到自己----即使智力與容貌正常者一般無異。這下就容易理解多了。
    然而,衝出這種思維慣性卻是很難,米歇爾不也被指「成為了一個白人」而招受批評嗎?
    我相信,黑人之間的智力確實有共通點的,這種共通點目前看----主要或源自決定外表的基因。然我們大多數人均遠離種族衝突激烈花旗五十州,對於這些遠來的黑膚色、貌相迵異的人們,正如我們對待那些種族類近的毀容者,不該出現的羞辱這盡量免了吧!正如看到說臉上身上生肉瘤的被人說脾氣怪、有人甚至叱他到一邊去的時候,我們會義憤填膺、搖頭嘆息;那般長得黑皮厚唇卻遭指智力低下、生性懶惰,何嘗不是一種強勢者對卑下者的欺凌?進一步說,黑人即使有這樣那樣的不足,那亦是出於彼個人問題、出於其彼族社會問題,上升附會到容貌決定----也太荒唐了吧!隨便歸咎於外貌並不能使自身得益,反而加深了該種族集體困境----將使種族內每一個成員更難逃脫這些不足,因為長相是他們視覺上最顯著、最容易引發聯想的特徵。
    「性相近、習相遠。」
    人一開始並不是天性如此,只是習慣使然、風氣使然。

  9. 沃森又双叒叕来了啊?每隔几年都能看到,都有既视感了。

  10. 深入淺出,好看!
    質化分析做得好,其意義完全不輸給量化資料。分析命題的真偽或是名詞定義是否來自社會建構這都不是丟個量化資料就可以講清楚的。

  11. 这篇文章写得很好,作者的文字功底出众。看完后大致感觉:沃森的言论确实不妥;但种族与智商似乎也并非一定没有关系。

  12. 人类喜欢把复杂的事物拆开,放进一个又一个盒子里,然后为了盒子上的标签和归类方式吵得面红耳赤,有时还会大动干戈。
    不要叫我黄种人,不要叫我汉族人,不要叫我中国人,不要叫我亚洲人!我就是这个地球上生活着的一个地球人!

  13. 作者的結構很清晰,但在解釋智力的部份的可以更清晰,科學門外漢表示看不懂

  14. Rosalind Elsie Franklin 才是雙螺旋結構的真正發現者吧

  15. @Bd: Lynn, R. (2006). Race differences in intelligence: an evolutionary analysis. Washington Summit Publishers. 这篇作为例子就很不错。不知道您有何看法?

  16. 楼下说量化的先给个数据先?

  17. 这篇大量使用质化而不是量化的说理,没有直接反驳原本论点的,这是我非常不希望在科普中看到的。这些观点都存在不可证伪性,作为假说可以,但如果要用来反驳现有研究结论则不妥,事实上如果你提出的是解释现有研究假说,反而从某种程度上支持了对方的实验数据。我们要做的是去研究如何客观地用新的模型来证明种族和智商的关联只是被基因给混淆了(所谓「伪关系」),而不是去质疑作者人格和背景,或是硬要把强迫给学者标签政治立场,我们不是《追梦学术圈》,文革迫害这种事情还是少做。另外科普中一些偏颇(G 因子的可依赖性并不低,事实上在行为学里有专门的分支去做关联分析)。

  18. 恰好在加拿大学种族学,补充一下,“种族”所代表的政治社会意义远大于其生物医学意义,它是一种有目的的身份构建,这种身份构建也时常变化。历史上的意大利人,西班牙人在美国也有不被当做“白人”的时候。
    西方人由殖民时代开始构建的种族论在很明显的塑造中国人的认知格局,很多并非事实却形成了人们习以为常的“知识”,这种错误的“知识”又反向促进了国内的高涨的民族主义和意义不清的种族观。使得国内民众在讨论涉外问题时偶尔也会出现“白皮猪”“黑鬼”“猴子”这样极具种族主义色彩的侮辱性言论。
    总之作者写的非常好,希望以后有机会继续读到这样的高质量的文章。

  19. 写得真好。

  20. 我觉得两边还是在争不同的事情。
    那边说的是“假设某种100%科学的种族划分方法,某种100%公正的智力测试方法,我们用该智力测试得到的数据,并以某种100%公正统计方法来计算该种族划分得到的各种族的平均智力水平。种族间的智力水平差异肯定是存在的”。
    这里论证的是没有所谓公正的种族划分方法、智力测试方法;以及鼓吹前述观点的人往往在智力/种族上的概念是错误的,并带有沉重的偏见;乃至智力/种族本身不是良好的科学概念。
    一个在说存在性,一个在说可观测性。还是谁也不能说服谁

  21. 好文章。不过有一点不认可,文中说g不如血糖、血压之类可直接测量的量来得坚实,但我觉得g本身是就是指一种相关性,说「g存在」本身就是在说「四项(或者更多)认知能力测试结果的高度相关性存在」,即g本身就是一种「关系性实体」,这是和血糖、血压不同的。换句话说,对分项认知能力结果的相关性的分析就是对g的直接测量,而不是文中说的推测性测量,在这个意义上g和血糖血压在可靠性上是基本等同的。

  22. 中国的种族多样性跟日本、韩国比高很多了。如果跟印度、美国、俄罗斯比的话,中国社会的种族多样性确实很低吧。而且汉族占了92%,汉族内部父系上的分子人类学差异非常小的。在中国大多数地方几乎是没有种族多样性可言的

  23. 奇邁可是台灣大學的教授而非香港大學

    1. 謝謝您指出,已修正!

  24. 推好文,梳理得很詳盡。但作者也有自己的盲點,例如到最後居然說「一個來自幾乎不存在種族多樣性的社會的中國人」——中國的種族多樣性並不低,這句話顯示出即便自身在研究相關議題,也偶爾會落入國家長年教育所建構的刻板印象中。