3号染色体 历史
我们已经发现了生命的奥秘。
——弗朗西斯·克里克
1953年2月28日
1902年,年仅45岁的阿奇博尔德·加罗德(Archibald Garrod)已经是英国医疗体系的中流砥柱。他是著名教授阿尔弗雷德·巴林·加罗德爵士(Alfred Baring Garrod)的儿子,加罗德爵士关于痛风(一种典型的上流社会疾病)的研究论文被认为是医学研究史上的一次巨大成功。阿奇博尔德·加罗德自己也在医学领域颇有建树,并因为第一次世界大战期间在马耳他的医疗工作而被加封为爵士。而后他又获得了当时医疗领域的最高荣誉:继伟大的威廉·奥斯勒爵士(William Osier)之后,任牛津大学医学院钦定讲座教授(Regius Professor)[1]之职。
你可能会把他想象成典型的爱德华七世时期的那种人:着装严肃乏味、言辞木讷迟钝、头脑死板僵硬、脾气暴躁、讲究礼节、严重阻碍着科学进步,如果这样想的话你就大错特错了。正是在1902年,阿奇博尔德·加罗德大胆地提出了一个猜想,这个猜想显示他的思想其实遥遥领先于他那个时代的人。他在不知不觉中就参与破解了有史以来最大的生物学谜团——什么是基因。事实上,他对基因的认识如此出色,以至于在他去世很长时间以后,才开始有人理解他所说的:基因是单一化学物质的配方。而且,加罗德认为他找到了其中一个。
在伦敦的圣巴塞洛缪医院和大奧蒙德街(儿童医院)工作期间,加罗德无意中发现了一些患者患有一种罕见但不太严重的疾病——黑尿病。除了类似关节炎这种不舒服的症状外,他们的尿液和耳垢暴露在空气中后,会根据所吃的具体食物而变成微红色或漆黑色。1901年,其中一位小男孩患者的父母生下了他们的第5个孩子,结果也患有这种疾病。这让加罗德开始思考这种疾病是不是家族遗传的。他注意到这两个患儿的父母是表亲。所以他回去重新分析了其他的案例:4个家庭中有3个都属表亲结婚,且17例黑尿病患者中有8例互为二代表亲。但是这种疾病并不是简单地从父母传给孩子。大多数患者能够生育正常的子女,但在正常子女的后代中可能会再次出现这种疾病。幸运的是,加罗德了解最新的生物学理论。他的朋友威廉·贝特森(William Bateson),对于格雷戈尔·孟德尔(Gregor Mendel)的研究成果被重新发现而感到颇为激动,正在撰写著作以推广并捍卫孟德尔遗传学理论。所以,加罗德知道他所遇到的正是孟德尔所说的隐性遗传:一种携带性状。只有同时从父母双方那里都遗传到了这种特性,才会表现出来。加罗德甚至引用了孟德尔植物学理论中的术语,称这种人是“化学突变体”。
加罗德从中获得了灵感。他认为,或许只有在父母双方同时将其遗传给子女时,才会出现这种疾病,究其原因,是因为这些人体内缺少了某种物质。加罗德不仅精通遗传学,而且对化学了解得也很透,他知道黑色的尿液和耳垢是由一种叫作尿黑酸的物质大量堆积所造成的。尿黑酸可能是人体化学反应的一个正常产物,但在大多数人体内,这种物质会被降解并排出体外。加罗德推测,尿黑酸在体内累积的原因可能是原本用来负责降解尿黑酸的催化剂没有起作用。他认为,这种催化剂一定是一种由蛋白质构成的酶,而且肯定是一种遗传物质(即我们现在所说的基因)的产物。在那些患者体内,该基因编码了一种有缺陷的酶;携带者并未受到影响,是因为从父母另一方那里遗传得来的正常基因可以进行补偿。
于是,加罗德提出了“先天性代谢缺陷”这个大胆的假说,其中一个影响深远的假设是:基因的存在是为了产生化学催化剂,每个基因对应一种高度专业化的催化剂。也许基因就是制造蛋白质催化剂的机器。加罗德写道,“某种酶的缺失或故障,导致新陈代谢过程中某一步骤出现问题,进而导致了先天性代谢缺陷”。因为酶是由蛋白质构成的,它们无疑是“个体化学差异的载体”。加罗德的书出版于1909年,得到了广泛的好评。但是评论者们完全未抓住要领,他们认为加罗德只是在谈论罕见疾病,而没有意识到他谈的是对所有生命都适用的基础原理。加罗德的理论在被忽视了35年之后才得以重见天日。那时,遗传学领域中的新观点如雨后春笋般涌现,但加洛德已经去世10年了。[1]
我们现在知道,基因的主要用途是存储制造蛋白质所需的配方。正是蛋白质完成了人体内几乎所有的化学、结构和调节功能:它们产生能量,抵抗感染,消化食物,形成毛发,转运氧气等。人体内的每一种蛋白质都是通过翻译基因的遗传密码而得来的。这句话反过来说就不完全正确了。因为有些基因,例如1号染色体的核糖体RNA基因,从不翻译蛋白质。但即使是这些基因,也会间接参与到其他蛋白质的制造过程。加罗德的猜想基本上是正确的:我们从父母那里遗传得来的是一套规模庞大的配方,用以制造蛋白质,以及制造蛋白质所需要的机器。除此之外,别无他物。
与加罗德同时代的人可能无法理解他的观点,但起码给了加罗德应有的荣耀。加罗德站在了巨人肩膀上,但对于这个“巨人”格雷戈尔·孟德尔而言,却没有那么幸运了。孟德尔和加罗德的背景差异巨大。孟德尔的教名为约翰·孟德尔(Johann Mendel),1822年出生于摩拉维亚北部一个叫作海因策多夫(Heinzendorf,现改名为Hyncice)的小村庄。他的父亲,安东,是一个小佃农,通过为雇主工作来抵租。约翰16岁那年正就读于特罗保(Troppau)文法学校且成绩优异,但是父亲被一颗倒下的树砸伤,全家生计难以维持。安东把农场卖给了他的女婿,用以支付儿子继续上学以及后来在奥洛穆茨(Olmütz,现改名为Olomouc)大学的学费。但是生活仍然艰难,约翰需要一个更富有的赞助者,所以他成为奥古斯丁(Augustinian)会的一名会士,并取名格雷戈尔。他在布鲁恩(Brünn,现改名为Brno)的神学院里艰难地完成了学业,成为一名神父。他做了一段时间的教区神父,但并不成功。后又进入维也纳大学学习,试图成为一名科学教师,然而却没能通过考试。
后来孟德尔又回到了布鲁恩,作为一个31岁的人,又无一技之长,就只好在修道院生活。他擅长数学和象棋,对数字敏感,性格开朗。他也是一个热情的园丁,从父亲那里学会了如何嫁接和培育果树。正是在这里,他扎根于乡间生活,获取民间知识,为他日后在遗传学领域的洞察力奠定了基础。当时,家畜和苹果育种者们对于颗粒遗传的原理已经有了模糊的认识,但是没有人进行过系统的研究。孟德尔在书中写道:“没有一个试验能够做到这样的程度——根据不同世代准确无疑地确定每一代里不同性状的数量,或确定它们之间的统计关系。”听到这里,想必大家都已经不禁开始打瞌睡了。
于是,34岁的孟德尔神父在修道院的花园里开始了一系列针对豌豆的试验。试验持续了8年,种植了超过30 000多株不同的豌豆,仅在1860年一年就种了6000株,这一系列试验最终永远地改变了世界。后来,他自知完成了非常重要的工作,便把研究成果发表在了《布鲁恩自然科学研究学会会报》,所有顶级图书馆都收藏了这份期刊。但是,他的工作一直未能得到认可。随着孟德尔升任为布鲁恩修道院院长,他也逐渐失去了对园艺的兴趣,变成了一个和蔼、忙碌但却不是很虔诚的修道士(在他的文章中提到美食的次数,可是比提及上帝的次数还多)。他的晚年是在日益激烈和孤独的、反对政府向修道院征收新税的运动中度过的。孟德尔成为最后一个纳税的修道院院长。孟德尔晚年回首往事的时候,或许会认为他这一生最大的成就是让唱诗班学校的一个19岁天才少年莱奥什·雅那切克(Leos Janacek),成为布鲁恩唱诗班的指挥。
在修道院的花园里,孟德尔一直在对不同品种的豌豆植株进行杂交。但这可不是业余园丁在玩票,而是一个大规模的、系统的、经过深思熟虑的科学试验。孟德尔选择了7对性状不同的豌豆品种进行杂交:圆粒种子对皱粒种子,绿色子叶对黄色子叶,饱满豆荚对皱缩豆荚,灰色种皮对白色种皮,绿色未成熟豆荚对黄色未成熟豆荚,腋生花对顶生花,高茎对矮茎。他前期尝试了多少次,我们不得而知。所有这些性状不仅是代代相传的,而且都是由单一基因决定的,所以他一定进行了初步研究并预判了结果,才选出了这7对性状。每一对杂交出来的后代都与亲本中的一方相同,而另一个亲本的性状似乎不见了。但事实并非如此。孟德尔让杂交后代自体受精,结果大约1/4的个体中又完全重现了消失的亲本性状。他数了又数,发现第二代豌豆共有19 959株,其中显性性状14 949株,隐性性状5010株,比例为2.98:1。正如罗纳德·费希尔爵士(Sir Ronald Fisher)在20世纪所指出的那样,这一比例非常接近3,令人生疑。别忘了,孟德尔的数学很好,他在试验之前就很清楚这些豌豆遵循的是什么样的公式。[2]
孟德尔像着了魔一样,他把试验对象从豌豆换成了吊钟花、玉米等其他植物,都得到了同样的结果。他知道自己在遗传学方面有了大发现:遗传特征不会混杂在一起。遗传的核心是一些坚硬、不可分割、量子化的微粒。遗传物质不像液体或血液那样可以进行融合,相反,它更像是很多小颗粒临时混杂在了一起。回想一下,这种现象其实一直是显而易见的,否则该怎么解释在一个家庭中会既有蓝眼睛的孩子又有棕眼睛的孩子呢?达尔文也多次暗示了这个问题,尽管他的理论是建立在遗传特性的融合性上。他在1857年给赫胥黎(Huxley)的信中写道:“我最近隐约想到,通过真正受精而完成的繁殖过程其实只不过是两个不同个体遗传物质的混合,而非真正的融合……除此之外,我想不出其他原因能够解释为什么后代与它们的祖先竟是如此之像。”[3]
在这个问题上达尔文很是忐忑。他当时刚受到一位苏格兰工程学教授的猛烈抨击,这位教授有一个很奇怪的名字,弗莱明·詹金(Fleeming Jenkin)。他指出了一个简单却无懈可击的事实:自然选择和融合遗传是互相矛盾的。如果遗传物质均匀融合起来了,那么达尔文的理论就不太可能是正确的,因为每一个新的、有利的变化都可能会在融合过程中被其他因素给稀释掉。詹金用一个故事举例说明了他的观点:一个白人试图通过与黑人生育后代的方式去把岛上的人都变白,然而他的白人血统很快就被稀释到不值一提的地步了。达尔文内心知道詹金是对的,甚至连一向强势的托马斯·亨利·赫胥黎都被詹金的观点弄得哑口无言。但是达尔文也知道,他自己的理论也是正确的。他无法调和这两者,要是他读过孟德尔的文章就好了。
事后看来,很多事情都是显而易见的,但仍然需要一个天才来戳穿这层窗户纸。孟德尔的成就在于他揭示了大部分遗传性状看起来像是融合在了一起,其唯一的原因就是这些遗传性状是由多种不同的“颗粒”所构成的。19世纪早期,约翰·道尔顿(John Dalton)已经证明了水实际上是由亿万个坚硬的、不可再分割的小微粒——原子——所构成的。这一理论击败了与之竞争的“连续性理论”。现在,孟德尔证明的其实是生物学上的“原子理论”。构成生物的原子曾有过五花八门的名字,光在20世纪头一年里使用过的名字就有因子、芽球、原生粒、泛生粒、生源体、遗子和遗子团,但是最终流传下来的是基因这个名字,并一直沿用至今。
从1866年起,在随后的4年时间里,孟德尔不断地把他的论文和想法寄送给慕尼黑的植物学教授卡尔·威廉·内格里(Karl Wilhelm von Nägeli),他越来越大胆地指出自己发现的重要意义。但在这4年里,内格里竟全然不得要领。他给这位执着的修道士写的回信彬彬有礼,但又不失高人一等的姿态。他劝告孟德尔去研究山柳菊,不过这也未免太过荒谬了:山柳菊是单性繁殖的,也就是说它虽然需要通过授粉来进行繁殖,却无法接受授粉者的基因。所以针对山柳菊的杂交试验结果很是奇怪。后来孟德尔不再与山柳菊纠缠,转而研究蜜蜂。他针对蜜蜂做了大量的实验,但结果如何,无从得知。他发现蜜蜂那奇特的“单倍二倍体”遗传方式了吗?
与此同时,内格里发表了一篇关于遗传学的长文,其中不仅没有提到孟德尔的发现,而且还引述了能极好地契合孟德尔理论的一项自身工作,可自己却浑然不知。内格里提到,如果把一只安哥拉猫与另一个品种进行交配,安哥拉猫所特有的纹理就会在下一代消失得无影无踪,但在第三代小猫的身上又能重现出来。要想解释孟德尔所说的隐性遗传,恐怕没有比这更好的例子了。
不过,在孟德尔的有生之年,他差点就得到了认可。查尔斯·达尔文(Charles Darwin)很善于从他人的工作中汲取灵感,他甚至向一位朋友推荐过一本福克(W. O. Focke)的书,书中引用了14篇孟德尔的论文,然而达尔文自己却似乎并未注意到。直到1900年,孟德尔的理论才被重新发现,这时距离他和达尔文去世已经很久了。三位植物学家胡戈·德弗里斯(Hugo de Vries)、卡尔·科伦斯(Carl Correns)和埃里希·冯·切尔马克(Erich von Tschermak),在三个不同的地方几乎同时发现了孟德尔的学说。他们都辛辛苦苦地在不同物种上重复了孟德尔的工作之后,才得以重新翻出孟德尔的论文。
孟德尔理论太令生物学界感到意外了。在演化理论中,任何的遗传都不是突然发生的。事实上,孟德尔理论似乎是在动摇着达尔文所辛辛苦苦建立起来的这一切。达尔文认为,演化就是自然选择之下的那些细微的随机变化的累积。如果基因是一些坚硬的微粒,如果遗传性状可以在隐匿了一代之后又完好地再现,那么它们是如何逐步产生这些微妙变化的呢?在20世纪早期的时候,从多个角度来看孟德尔理论都是完胜达尔文理论的。当威廉·贝特森说颗粒遗传至少限制了自然选择的作用时,他道出的其实是当时很多人的想法。贝特森是一个头脑混乱、文风沉闷的人。他认为演化是跳跃的,从一种形式跳到另一种,没有中间过渡。为了推销这个古怪的理论,他在1894年出版了一本书,说到遗传是颗粒性的。从那时起,他便一直受到“真正”达尔文主义者的猛烈攻击。难怪他会张开双臂欢迎孟德尔,并第一个把它翻译成英文。贝特森写道:“孟德尔的发现并未与正统理论(物种产生于自然选择)相违背。”这听起来就像一个神学家声称自己是圣保罗(伦敦的保护神)的真正诠释者。他还写道:“然而,现代科学研究的目的无疑是为了去掉自然规律有时被赋予的超自然属性……坦率地讲,我们不能否认,达尔文的著作中有一些段落在某种程度上鼓励了对于自然选择理论的滥用。但是如果孟德尔的论文到了达尔文的手里,这些段落必然会被立刻修改掉,这一点我大可以放宽心。”[4]
但是,恰恰是大家都不怎么喜欢贝特森,而他却极力推崇孟德尔遗传学说,使得欧洲的演化论学者对孟德尔学说表示怀疑。在英国,孟德尔学派和“生物统计”学派之间的激烈论战持续了20年。这场战火一直烧到了美国,不过在美国,两派之间的争论并不那么激烈。1903年,美国遗传学家沃尔特·萨顿(Walter Sutton)注意到,染色体的行为就像孟德尔遗传因子一样,它们成对出现,一条来自父方,一条来自母方。了解到这个发现之后,美国遗传学之父托马斯·亨特·摩根(Thomas Hunt Morgan)立马转而支持孟德尔学派。于是,不喜欢摩根的贝特森放弃了原本正确的立场,转而攻击染色体理论。科学发展史往往是由这些琐碎的争斗所决定的。最终贝特森默默无闻,而摩根却成就了一番伟业,创立了一个硕果累累的遗传学派,并以他的名字命名了遗传距离的单位——厘摩。在英国,直到1918年,依靠罗纳德·费希尔敏锐的数学思维,达尔文理论和孟德尔理论才得以最终和解:孟德尔理论非但没有否定达尔文理论,反而出色地证明了它的正确性。费希尔认为,“达尔文理论结构并不完整,孟德尔理论恰好弥补了其中缺失的部分”。
然而,突变的问题依然存在。达尔文理论立足于遗传的多样性,而孟德尔理论提供的是遗传的稳定性。如果基因是生物学上的原子,那么改变它们就会像炼金术那样成为异端邪说。基因突变方面的突破性进展是随着第一次人工诱导突变而来的,完成这一突破的是一位与加罗德和孟德尔完全不同的人。除了爱德华七世时代的医生和奥斯定会的会士,我们还必须提到好斗的赫尔曼·乔·马勒(Hermann Joe Muller)。马勒是众多杰出犹太科学家中的典型,20世纪30年代他们作为难民穿越大西洋,只不过马勒是向东走了。他是土生土长的纽约人,父亲是一家小型金属铸造公司的老板。马勒后来被哥伦比亚大学的遗传学专业所吸引,但与他的导师摩根合不来,于是便在1920年搬去了得克萨斯大学。在对待才华横溢的马勒的时候,摩根的态度显露出了一丝反犹主义的痕迹,但这种态度在当时并不少见。马勒一生都在到处树敌。1932年,他不仅婚姻触礁,还被同事窃取了他的想法(他自己是这么说的),在自杀未遂之后,他离开得克萨斯去了欧洲。
马勒的伟大之处在于,他发现了基因突变是可以人为诱导的,后因此成就而获得了诺贝尔奖。这与几年前欧内斯特·卢瑟福(Ernest Rutherford)发现原子是可嬗变的,比较类似。也就是说,在希腊语中意为“不可切割”的“原子”一词,其实是不恰当的。1926年,马勒自问道:“在生物过程中,突变是独特的存在吗?它是否真的不可被人工改变或控制?它是否和最近在物理学领域发现的原子嬗变情形相当?”
第二年,他回答了这个问题。马勒通过用X射线照射果蝇的方法使果蝇的基因发生突变,这样果蝇后代会出现新的畸形。他认为,突变“并不像遥不可及的上帝一样,站在遗传物质的坚固城堡里捉弄我们”。就像原子一样,孟德尔的遗传颗粒也必定有一些内在结构。这些结构可被X射线改变。改变之后仍是基因,只是不再是以前的基因了。
人工诱导突变开启了现代遗传学。1940年,两位科学家乔治·比德尔(George Beadle)和爱德华·塔特姆(Edward Tatum)利用马勒发现的X射线诱导基因突变的方法,制造出了一种名为脉孢菌(Neurospora)的面包霉菌的突变体。然后他们发现,突变后的面包霉菌无法产生某种化学物质,因为它们的某种酶失活了。他们提出了一条生物学法则:一个基因对应一种酶。这条法则后被证明是基本正确的,在当时的遗传学家中也很流行。这其实是把加罗德的旧假说以现代生物化学的方式重新进行了阐释。3年后,莱纳斯·鲍林(Linus Pauling)得出了一个惊人的推断:一种主要影响黑人的严重贫血症,究其病因,是由于其血红素蛋白基因产生了错误,从而使得红细胞变成镰刀状。这个基因错误看起来就像是一个真正的孟德尔突变。事情逐渐变得明朗起来:基因是蛋白质的配方;突变其实就是基因改变所引起的蛋白质改变。
与此同时,马勒却没有继续活跃在人们的视野中。1932年,出于对社会主义以及选择性生育(即优生学)的狂热执念,他横渡大西洋去到了欧洲。他希望看到孩子们被精心培养成马克思或列宁的模样,不过在他的书再版时,他很识时务地将其目标改为了林肯和笛卡尔。他是在希特勒上台前几个月到达柏林的。在那里他看到,由于老板奥斯卡·沃格特(Oscar Vogt)没有驱逐手下的犹太人,纳粹分子便砸毁了实验室,这令他惊恐不已。
马勒继续向东迁到了列宁格勒(现圣彼得堡),他来到了尼古拉·瓦维洛夫(Nikolay Vavilov)的实验室,刚到不久,孟德尔理论的反对者特罗菲姆·李森科(Trofim Lysenko)就得到了斯大林的支持。李森科为了支持自己的一些不切实际的理论,开始迫害孟德尔遗传学理论的支持者。他认为,小麦适应新环境,就像俄罗斯人民适应新的政权制度一样,可以通过训练来完成,而不需要培育;不该劝诫那些持不同意见的人,他们应该直接拉出去枪毙。后来瓦维洛夫死于狱中。一直抱有幻想的马勒把自己有关优生学的新著送了一本给斯大林,但听说并不受待见。于是,马勒便找了个借口及时开溜了。后来他参加了西班牙内战,在国际纵队的血库工作,后来又去了爱丁堡。他还是像往常那样厄运连连,刚到爱丁堡,第二次世界大战就爆发了。他发现在苏格兰漆黑的冬天,戴着手套在实验室里做科学研究太难了,于是他想尽办法回到了美国。但是,没有人想要一个好斗、易怒的社会主义者,更何况他讲课不好,而且还在苏联待过。最终,印第安纳大学给了他一份工作。第二年,他因发现人工诱导突变而获得了诺贝尔奖。
但是基因本身仍然神秘且捉摸不透。基因本身定是由蛋白质构成,但它又能决定蛋白质的成分,这种关系着实让人摸不着头脑。细胞里似乎没有其他东西可以比基因更为复杂而神秘了。确实如此,不过染色体上倒是有些神秘之物:一种叫作DNA的不起眼的小核酸。1869年,在德国的图宾根镇,一位名叫弗雷德里希·米歇尔(Friedrich Miescher)的瑞士医生从浸满脓液的伤兵绷带上首次分离出了DNA。米歇尔本人猜测到了DNA可能是遗传的关键。在1892年写给叔叔的信中,他惊人地预见到DNA可能会传递遗传信息,“同所有语言一样,只要24~30个字母就能组成词汇,表达概念”。但是,那时没有人注意到DNA,它被认为是一种相对简单的物质:只有四种不同的“字母”,又怎么可能传达遗传信息呢?[5]
受马勒的感召,一个名叫詹姆斯·沃森的19岁少年来到了印第安纳州的布卢明顿市,他成熟自信,已经获得学士学位。他看起来不像是能解决基因问题的人,但他确实解决了这个问题。在印第安纳大学,他师从了意大利人萨尔瓦多·卢里亚(Salvador Luria)(由此可见,沃森与马勒并不合得来)。沃森产生了一种执念:基因是由DNA组成的,而不是蛋白质。为了寻找证据,他去了丹麦,由于对那里的同事不满,又在1951年10月去了剑桥。偶然的机会,他认识了卡文迪什实验室同样聪明的弗朗西斯·克里克,两人都对DNA的重要性坚信不疑。
之后的事情就都众所周知了。克里克不够成熟,已经35岁了,还没有拿到博士学位。一枚德国炸弹摧毁了伦敦大学学院的设备,本来利用这些设备他应该可以测量出热水在压力下的黏度。对他而言,这反倒是一种解脱。之后他从停滞不前的物理学生涯转向生物学,但还没有取得显著成功。那时他已经从剑桥实验室枯燥乏味的工作(在那里他被安排测量细胞在外力之下吞噬了一些颗粒之后的黏性)中逃离出来,正忙着在卡文迪什实验室学习晶体学。但他没有耐性潜心研究自己的课题,也不屑于坚持研究小课题。他的爽朗、自信和才智,以及他总是喜欢自作聪明地为人答疑解惑,使得他在卡文迪什实验室开始讨人嫌了。那时人们大多痴迷于蛋白质研究,而克里克却不敢苟同。基因的结构是一个重大问题,他怀疑DNA是答案的一部分。在沃森的蛊惑之下,他放弃了自己的课题,沉迷于研究DNA。由此,科学史上一个伟大的、友好竞争的、高产的组合就诞生了:一位是年纪轻轻、雄心勃勃、懂得一些生物学知识的美国人,另一位是年岁较长、才华横溢但不够专注、懂得一些物理学知识的英国人。他们必然能够擦出火花。
在短短几个月内,他们利用其他人辛苦收集但未分析透彻的数据,做出了可能是有史以来最伟大的一项科学发现——发现了DNA的结构。比起阿基米德从浴缸里跳出来那次,这回更值得大书特书。1953年2月28日,弗朗西斯·克里克在老鹰酒吧(Eagle Pub)里宣布“我们发现了生命的奥秘”。但是沃森仍保持万分谨慎,生怕自己搞错了。
不过,没有找到任何毛病。突然间,一切就都清楚了:DNA包含了一种密码,它们写在两条优雅的、相互缠绕的双螺旋阶梯上,长度可以无限延伸。这种密码借助于字符之间的化学亲和力进行自我复制,并通过一种在当时还未破解的密码手册来给出蛋白质的配方。要知道,DNA和蛋白质之间的关系可正是通过这本密码手册对应着联系起来的。发现DNA结构的非凡意义在于,它让一切看起来如此简单,却又如此美妙。正如理查德·道金斯所说[6]:“在沃森-克里克之后,分子生物学真正的革命性意义在于它已经被数字化了……基因的‘机器代码’与计算机代码惊人地相似。”
沃森-克里克的DNA结构发表的一个月之后,英国新女王加冕,在同一天,一支英国探险队征服了珠穆朗玛峰。除了《新闻纪事报》上的一小则报道外,双螺旋结构没能登上其他报纸。但在今天,大多数科学家都认为,它是近百年乃至近千年来,最为重大的发现。
DNA结构发现之后,接踵而来的是多年的诸般困惑。基因密码本身,即基因表达自身的语言,顽强地保持着它的神秘性。对沃森和克里克来说,发现密码也不难,其实把推测、物理学和灵感结合起来就可以了。然而破译密码却需要真正的智慧。很明显,密码是由A、C、G、T这四个字母所组成的。而且几乎可以肯定的是,它被翻译成了组成蛋白质的20种氨基酸。但是怎么翻译?在哪里翻译?又是通过什么方式翻译的呢?
多数的好点子都源自克里克,包括他所提及的衔接分子,即我们现在所说的转运RNA。在没有任何证据的时候,克里克就认定这种分子一定是存在的。后来果然出现了。不过,克里克还有一个非常好的点子,堪称历史上最伟大的错误理论。要知道,克里克的“无逗号密码”理论远比自然母亲所用的方法更为考究。它是这样工作的:假设密码的每个词中有三个字母(如果只有2个,则总共只有16种组合,未免太少了),假设密码里没有逗号,并且词之间没有空隙,现在,再来假设这个密码不包括那些若在错误位置开始读就可能会读错的词。打一个布赖恩·海耶斯(Brian Hayes)曾用过的比方:现在,先想出所有可以用A、S、E和T这四个字母来组成的三字母英文单词:ass,ate,eat,sat,sea,see,set,tat,tea和tee。然后去除那些如果从错误位置起始就可能被误读为另一个词的单词。比如,ateateat组合可能被误读为“a tea tea t”或“at eat eat”或“ate ate at”。在基因密码里这种三联体密码,只能保留其中一种。
克里克对A、C、G和T做了同样的处理,他首先排除了AAA、CCC、GGG和TTT。然后他把剩下的60个词按每3个分为一组,每组包含3个相同的字母,字母的顺序是循环的。例如,ACT、CTA和TAC在同一组,因为在这一组中C总是在A后面,T总是在C后面,A总是在T后面;但是ATC,TCA和CAT就是另一组了。每组只有一个词会被保留下来,最后正好还剩下20个。而蛋白质编码表也刚好有20个由氨基酸组成的字母。一个4种字母的密码给出了一个20种字母的字母表。
克里克告诫人们不要把他的想法太当回事,但却徒劳。“在破译密码这事上,我们用来推测这套密码的论据和假设还不够充分,理论上讲,我们不应对它抱有太大的信心。我们提出这个推论,是因为它能从合理的物理学假设出发,以一种简洁的方式给出了‘20’这个神奇的数字。”但是,双螺旋结构一开始也并没有获得什么证据方面的支持。兴奋之情日渐高涨。在此之后的5年里,所有人都认为这个推论是正确的。
但是空谈理论时代已然过去。1961年,当所有人都还在琢磨克里克推论的时候,马歇尔·尼伦伯格(Marshall Nirenberg)和约翰·马特伊(Johann Matthaei)通过一种简单的方法破译了这个密码表中的一个“词”:只用U(尿嘧啶,相当于DNA中的T)制造出一段RNA链,并将其扔进氨基酸溶液中。在这个溶液中,核糖体将大量的苯丙氨酸拼接在一起,制造出了一个蛋白质。密码表中的第一个词就这样被破译了:UUU代表苯丙氨酸。“无逗号密码”理论终究还是错了。过去我们认为它的伟大之处在于,它不会出现所谓的移码突变,即一个字母的丢失使得后面的一切都失去了意义。然而,大自然却选用了另一种方法,虽然不那么考究,但却更能兼容其他错误。它出现了很多重复:多个三字母词表达的均是同一个意思。[7]
到了1965年,随着全部遗传密码的破译,开启了现代遗传学的时代。那些在20世纪60年代的前沿性突破,已然成为90年代的常规,见怪不怪。因此,在1995年重新回顾阿奇博尔德·加罗德研究的那些早已过世的黑尿病患者时,科学可以明确地告诉我们是在哪个基因上发生了什么拼写错误才导致他们患病的。这个故事是20世纪遗传学的一个缩影。别忘了,黑尿病是一种非常罕见但不太危险的疾病,通过调整饮食就可以轻易地治好。因此,多年来科学家都没有再去研究它。1995年,鉴于其在遗传学历史上的重要地位,两名西班牙人展开了对它的研究。他们制造出了一种曲霉菌(一种真菌)的突变体,这种突变体在苯丙氨酸存在的情况下会大量累积紫色色素,即尿黑酸。与加罗德的推测一致,这种突变体中有一种功能缺陷的蛋白质,即尿黑酸双加氧酶。通过用特殊的酶去分解真菌基因组,这两名西班牙人找出了不同于正常霉菌基因组的片段,并读取了其中的密码,并最终找到了出问题的基因。之后他们在人类基因库中进行搜索,期望找到与真菌基因组中的这个基因足够相似的人类基因。他们找到了。在3号染色体的长臂上,有一段DNA字母序列,与那个真菌基因有52%的相似性。从黑尿病患者体内找到这个基因,并把它和正常人体内的同一基因进行比对,结果他们找出了致病的关键:两者的基因在第690个字母或第901个字母上与正常基因有所不同。每个患者都是因为这两个字母中的一个出了错,从而导致蛋白质无法发挥正常功能。[8]
这个基因只是众多普通基因的一个缩影,它们在身体的既定部位日复一日地做着相同的工作,一旦出了问题,就会引发一种疾病。它不会给人带来惊奇,也没有独特之处。它与智力或同性恋没有关系,它不能告诉我们生命的起源,它不是自私的基因,它不能违背孟德尔定律,它不会致死或致残。实际上,地球上的每一种生物都有完全相同的基因——即使是面包霉菌也有,并且做着与人类完全相同的事情。然而,编码尿黑酸双加氧酶的基因无愧于它在历史上所占的一席之地,因为它的故事是整个遗传学发展的缩影。这个不起眼的小基因展示出了一种足以让格雷戈尔·孟德尔眩晕的美。因为是它让抽象的孟德尔理论有了具体、实在的表达:一个关于微小的、缠绕在一起的、相互配对的双螺旋故事,关乎那些由四字母组成的遗传密码,也昭示了所有生命在化学上的统一性。
[1] 钦定讲座教授(Regius Professor)是由英国最高统治者授予的一项至高无上的荣誉,用以表彰那些有利于经济增长和提高生产力的学者。在过去,此席位一般是在创立教授职位时产生,并以皇家赞助人的身份授予,是对英国大学里优异的学术表现和大学科研对现实世界的影响力的一种认可。——译者注