勃布·古尔德斯坦因

我认识一位女科学家,她只要眼睛睁着就在做实验,可以几个星期不间断。如果重大发现在即,她会变得更痴迷。在这种情况下,请你想想看,如果没能争得第一,被别人抢了先,那是什幺滋味儿:几个月甚至几年的工作会变成完全多余,没有价值。

我当科学家25年,虽然在重大发现上没有落在别人后面,但是对这个现象非常感兴趣:一个令你着迷的问题有了答案固然会让你兴奋,可是有人先你一步公布答案又会把你气死。

有这样一个着名的案例,即1961年对基因代码DNA语言的解读。20世纪最辉煌的两位遗传学家西德尼·布伦纳和弗朗西斯·克里克从1953年就开始研究这个问题,但在1961年,一个不大有人认识的美国生化学家先发制人,抢先公布了他的研究成果。

2010年,档案管理员公布了布伦纳的信件和实验笔记,里面还夹着克里克丢失的论文。从这些信件和当时他们的举动中,我敢说自己看到了他们对这一划时代的发现被抢先公布做出的反应:他们非常激动。

或者至少看上去如此。我去找过布伦纳,问过他。

想找到布伦纳可不容易。他在新加坡、日本的冲绳、美国的弗吉尼亚和加利福尼亚都有实验室,而且还经常旅行。我在圣地亚哥找到他的一位管理助手,终于联系到他。还算幸运,十来天后我们都要在英格兰停留一天。

我找到他家,门廊很矮,我得弯腰低头才能进去。布伦纳已88岁高龄,是唯一在世的分子生物学奠基人。他有着浓浓的眉毛,笑起来就像圣诞老人。因为年事已高,他的行动比较迟缓,但是他的思维很敏捷。我很高兴能够再次拜读他于20世纪五六十年代发表的研究文章,以便听懂他说的内容。

我们坐在一间很小但明亮的屋子里,里面到处都是物。布伦纳的脚敲击着地面,开始跟我讲他最初解码的事。典型的蛋白质由几百个氨基酸组成,相互之间的连接就像一串珠子:珠子有20多种,有些相互紧挨着,有些贴着水,因此每一串珠子在水中自然折叠成一种形状,构成生命机器的零件。有些蛋白质看上去像一根根细小的棒子和杠杆,它们工作起来也像棒子、杠杆以及相互咬合的砖块和齿轮。

布伦纳告诉我,在20世纪50年代以前,许多科学家认为“蛋白质是模糊的聚合物”,只不过是不同形状的珠子,不断重复,没有确定的序列。但是到了1953年,人们发现蛋白质有确定的序列,DNA似乎是一种密码,由A、T、G、C四个字母组成,DNA里的每个基因似乎是正确组合蛋白质的一组指令。因此,出现了一个很重要的问题:它们是怎幺组合起来的?

DNA编码的这4个字母显然不是每个字母只代表一种氨基酸,因为那样的话,编码不会超过4个,而实际上有20个;如果是两个一组,即AT、AG、AC、TA等,就有16种组合,也不够;如果是三个字母一组,就会有64种组合,又多于20种。因此,DNA里最小的词可能是三个字母,但也有可能是四个或更多。

现在,让我们看一下胰岛素这个蛋白质的编码有多复杂。我们知道胰岛素的DNA序列是这个样子的:

即使是现在,解读DNA到蛋白质的编码仍然是一个巨大的挑战。而在1953年,尽管没有人知道这个DNA序列,还是在努力尝试破解这个密码。理论物理学家乔治·伽莫夫提出,每个氨基酸珠子可能正好被卡在DNA双螺旋之间钻石形状的空间内。他认为DNA可能是一种按照正确顺序串珠的物理模板,就像一排栓孔一样,可以插入不同形状的钉子,而且DNA的4个字母正好圈定20个这样的孔。

布伦纳和克里克都没有想到伽莫夫的编码行得通,“因为首先他是在双向解读,可是DNA只有一个方向,这一点伽莫夫或是忽略了或是不理解”。到了1956年9月,布伦纳发现伽莫夫的编码使得有些氨基酸不能毗邻,因此不可能正确。

伽莫夫的编码虽然不正确,但他的想法启发了布伦纳和克里克。伽莫夫思考问题的方式就像个密码员,他想的是信息和代码,这对当时的生命科学家来说是新玩意儿。布伦纳说:“当时研究蛋白质的数百位生化学家都只对一个问题感兴趣,即肽键的能量是从哪里获得的。”布伦纳和克里克受到伽莫夫的启发,开始按照信息传送的方式来思考。

这个思路引出一些聪明的想法。1957年2月,克里克提出“我们体内解读DNA的机器可能知道DNA序列中的每个词在哪里结束,下一个词从哪里开始”的观点,比如“Theboyatepieandham”这类由三联字母的单词组成的句子,即使没有间隔或标点符号我们也能解读,其原因不只是它包含有意义的单词,还因为如果我们的起点不对,就没有哪三个字母能组成有意义的单词。克里克提出,在DNA编码里可能也存在特殊意义的单词,就是它们规定了生产蛋白质的机器的读码框架。

1958年,布伦纳看到了一位同事对DNA病毒的研究结果,茅塞顿开,猜测一种被称为原黄素的氮蒽色素可能引起DNA中单个字母的增删,这样就可以从框架中读出DNA来。他与克里克一起开始在培养皿中培养DNA病毒。如果DNA病毒中的蛋白质正常而且DNA中的变化未能使产生的蛋白质失去性能,它们就会感染细菌,在菌苔上留下典型大小的孔洞。布伦纳告诉我:“能从这些孔洞来预测DNA内部的结构情况,简直太不可思议了。”

布伦纳和克里克组合了突变体,结果发现诱发染色的突变体多数会受到其他诱发染色的突变体的抑制。他们推测,该染色有时会增删一个字母,他们把这样的变化称为“+”和“-”。“+”和“-”的结合常常使病毒恢复正常,就像通过在同一序列中得到或失去一个字母从而恢复正常的读码框架一样;而“+”与“+”、“-”与“-”的结合绝对不会那样。

这些结果是有意义的。如果他们的理论正确,那幺布伦纳和克里克就步入了通向最终解码的正确轨道。经过8年的努力,虽然他们仍无法解读DNA中的单个字母,但似乎至少能够通过可预见的方式改变字母。布伦纳夜以继日地工作,克里克虽然很少做实验,但也为此绞尽脑汁。

然后,令人意想不到的事发生了。

1961年8月,5000多位科学家齐聚莫斯科,参加一个为期5天的生物化学国际研讨会。会议进行2天后,克里克的一位名叫马特·梅塞尔森的朋友告诉他一个消息:基因码的第一个词(密码子)被别人解开了。美国生化学家马歇尔·尼伦伯格提交了报告,说他把单个重复的字母置于制造蛋白质的体系中时,产生了一个由该氨基酸的某个重复单位组成的蛋白质。首个密码子被解决,而且在不久后,尼伦伯格的方法会解开整个编码。

我总喜欢想象如果我是克里克会怎幺办。尼伦伯格是受好奇心驱使的一个人,他的研究结果是特大新闻:人们长期探寻的答案很快就有了,基因编码会被解开。可是对一个想以自己的名字为发现命名的人来说,这个新闻实在是坏得不能再坏了。克里克和布伦纳近十年的研究将变为多此一举。

我相信,自己遇到这种情况时的反应会很体面。我不会为了自己把尼伦伯格的发现说成一文不值,为了“证明”它不能令人信服生编硬造一些理由;我也不会返回自己的实验室,加快研究速度以便尽早发表自己的成果。但是,克里克的反应更为不同寻常,值得我们效仿。在克里克主持的一个大型会议上,他请尼伦伯格当着1000多人的面再宣布一次研究结果。当尼伦伯格讲完时,克里克感情充沛地上前拥抱了尼伦伯格。我试着想象两个同时代的人在会议室里自发地拥抱,尤其当一位是遗传学家,另外一位是生化学家时。生化学家玛克辛·辛格曾给尼伦伯格提供过实验所需的RNA,他告诉我说,“生化学家和遗传学家是有嫌隙的”。

莫斯科会议之后不久,克里克和布伦纳做出了一项重要贡献。当时,他们知道在病毒DNA里增删一两个字母会使产生的蛋白质失去作用。但当他们增删三个字母时,发现蛋白质的作用恢复了。这个结果暗示,DNA编码是由三个字母组成的词合成的。这在当时也是解开密码的一个重要组成部分。

尼伦伯格及其同事完成的解码工作的积极性无论怎样讲也不夸张,因为现代生物学的多数重大进步都依赖它。我自己的实验室也天天都在用它。对分子生物学家来说,它是所有未来发现的基础。当然,尼伦伯格是在前人的基础上完成这一工作的,而且许多其他科学家,包括布伦纳和克里克,也通过其他重大发现对他的结果进行了提炼和升华。那些没能来得及公布自己研究结果的人也得到了激励,按照布伦纳的说法,“我们可以腾出手来研究更为重要的问题”。

现在,我们在很多时候也会面对同样的问题。在我看来,克里克与布伦纳的反应就是一个很好的榜样。我想,对所有科学家来说也都一样,就像临别时布伦纳给我的忠告:“做最好的实验,永远说实话。就这样。”