道金斯:基因是数字化信息


基因之河。图scilib.narod.ru

(作者R.道金斯,伊甸园之河,王直华译,摘选)基因之河指的是一条DNA之河,它是在时间中流淌,而不是在空间流淌。它是一条信息之河,而不是骨肉之河。在这条河中流淌的,是用于建造躯体的抽象指令,而不是实在的躯体本身。这些信息通过一个个躯体,并对其施加影响;然而信息在通过这些躯体的过程中却不受躯体的影响。这条河流经一连串的躯体,不仅不会受这些躯体的经历与成就的影响,而且也不受一个潜在的、从表面上看,更具威力的“污染源”的影响,那就是:性。

在你的每一个细胞中,都有一半基因来自你母亲,另一半基因来自你父亲,这两部分基因肩并肩地相依相伴。来自你母亲的基因与来自你父亲的基因最紧密地结合在一起,创造了你——他们的基因的不可分割的精妙混合体。但是来自双亲的基因本身并不融合,仅仅是发挥它们各自的作用,基因本身都具有坚实的完整性。

进入下一代的时刻到来了,一个基因或者进入这个孩子的体内,或者不参与这样的行动。父亲的基因不会与母亲的基因混合,它们独立地完成重组。你身体内的一个基因,或者来自你的母亲,或者来自你的父亲。这个基因来自你的4位祖辈之一,而且仅仅来自他们中的某一位;进一步推论,这个基因来自你的8位曾租辈之一,而且仅仅来自他们之中的某一位。依此规律,可以追溯到更远的世代。

作为一个物种,其特征是:任何一个物种的所有成员流过的基因之河都是相同的,而同一物种的所有基因都必须做好准备,相互成为良好的伙伴。当一个现有物种一分为二的时候,一个新的物种就诞生了。基因之河总是适时分出支流。从基因的角度来说,物种形成(即新物种的起源)便是“永别”。经历一个短期的不完全的分离之后,这支流与主流不是永远分道扬镳,就是其中之一或双方都趋向干涸、消失。两条河在各自的河道之内是“安全”的,通过性的重组,河水互相混合、再混合。但是,一河之水永远不会漫过自己的河岸,去污染另一条河流。一个物种分裂为两个物种之后;两套基因就不再互为伙伴了。它们不会再在同一个躯体中相遇,因此也就无从要求它们和睦相处。它们之间不再有任何交往。这里所说“交往”的字义是指两套基因各自的暂时载体——个体之间的性交。

现在,DNA之河或许已经有了近3000万条支流。所以这样说,是因为据估计现在地球上大约存在着这么多个物种。而且,还有一种估计,现存物种的总数)只不过是地球上曾经存在的物种总数的 1%。由此可以得出,地球上总共曾经存在过30亿条DNA河的支流。今日的3000万条支流之间,已经发生了不可逆转的分离。

分子生物学的研究表明,在任何情况下,大动物类群之间的接近程度,比我们通常想象的要大得多。你可以把遗传密码看作是一本词典。在这本词典里,要把一种语言的64个单词(4个字母中取3个,共64种可能的三联体)标绘到另一种语言的21个单词(20种氨基酸加 1个标点符号)上。两次64:21的排列完全相同的可能性极小,只有100万亿亿亿分之一。然而,事实上,所有迄今为止我们所见到的动物、植物和细菌,它们的遗传密码完全一样。地球上一切有生命的东西肯定都是一个祖先的后裔。没有人对此提出质疑。以昆虫和脊椎动物为例,人们在研究中发现,不仅它们的遗传密码本身,甚至遗传信息的排序也惊人地相似。一个相当复杂的遗传机制决定了昆虫的体节的分化,而在哺乳动物中也发现了不可思议的相似遗传机制。从分子角度来说,所有的动物互相之间都有相当近的亲缘关系,甚至植物也一样。你不得不到细菌中去寻找我们的远亲。即使如此,细菌的遗传密码同我们的也一样。为什么能对遗传密码做如此精确的计算,而对解剖图作同样的精细研究就不可能?原因就在于遗传密码是严格数字化的,而数字是可以精确计算的。

弗朗西斯•克里克(Francis Crick)和詹姆斯•沃森(JamesWatson)是揭开基因分子结构之谜的人。我认为他们应当像亚里士多德和柏拉图那样世世代代受到尊敬。他们获得了诺贝尔生物学和医学奖,他们应该获此殊荣。然而,与他们的贡献相比,这奖励是微不足道的。谈论继续不断的革命,在字眼上几乎是矛盾的,然而不仅仅是医学,还有我们对生命的全部理解都会发生一次又一次的革命。这些革命是观念变化的结果,而观念上的变革是这两个年轻人在1953年发起的。基因本身,以及遗传疾病只不过是冰山的一角而已。在沃森和克里克之后,分子生物学真正的革命性变化,是它已变成数字式的了。

下面这段科学幻想小说的情节还是说得通的,只是技术上与今天不同,比今天的技术略微超前了一些而已。吉姆•克里克森(Jim Crickson)教授被外国的邪恶势力绑架,他们逼迫克里克森在一个生物战实验室里工作。为了拯救世界文明,他所应该做的最重要的事情,就是把一些绝密的信息传递给外部世界。然而,所有正常的联系渠道都断绝了。只有一个例外,DNA密码有64个三联体“密码子”,足够组成一个包括26个大写字母和26个小写字母的完整英文字母表,外加10个数字、一个空格符号和一个句号。克里克森教授从实验室的样品架上取来一种恶性流感病毒,用无懈可击的英语句子将他要传达给外界的完整情报,设计在病毒的基因图谱中。他在设计的基因图谱上一遍又一遍地重复发布他的情报,还加上了一个极易辨认的“标志”序列,就是说,为首是10个引导数字。他让自己感染了这种病毒,然后到一个挤满了人的房间里不停地打喷嚏。一个流感浪潮横扫全球。世界各地的医学实验室都开始分析这种病毒基因图谱的排序,以期设计出一种疫苗来对付它。人们很快就发现,病毒的基因图谱中有一个奇怪的重复的模式。引导数字引起了人们的警觉:这些数字是不可能自发产生的。

于是有人无意中想到采用密码分析技术来解决问题。这样,没费多少工夫,克里克森教授所传递的英文情报就被人们读懂了,消息传遍了全世界。

我们的基因系统(也是我们这颗行星上所有生命的通用基因系统)是彻底数字化的。你可以一字不差地把《新约全书》编入人类基因图谱中由“闲置”DNA占据的部分,这些DNA还没有被利用,至少是没有被人体以通常的方式利用。你体内的每一个细胞都含有相当于46盘巨大的数据磁带的信息,通过无数个同时工作的“读出磁头”将数字符号取出。在每一个细胞中,这些磁带——染色体——所包含的信息是一样的,但不同类型细胞中的读出磁头根据它们自己的特殊目的,挑出数据库中不同部分的信息。这就是为什么肌肉细胞会不同于肝细胞。这里没有受到心灵驱使的生命力,没有心跳、呻吟、成长,也没有最初的原生质,神秘的胶体。生命仅仅是无数比特数字信息。

基因是纯粹的信息,是可以被编码、再编码和译码的信息,在这些过程中,其内容不会退化,也不会改变。纯粹的信息是可以复制的,而且由于它是数字信息,所以复制的保真度可以是极高的。

DNA符号的复制,其精确度可与现代工程师们所做的任何事情相媲美。它们一代代被复制,仅有的极偶然的差错只足以引起变异。

在这些变种中,那些在这个世界上数量增多的编码组合,当它们在个体内解码和执行时,显然能自动地使个体采取积极步骤去保持和传播同样的DNA信息。我们——一切有生命的物质——都是存活下来的机器,这些机器按照程序的指令,传播了设计这个程序的数据库。现在看来,达尔文主义就是在纯粹数码水平上的众多幸存者中幸存下来的。

现在看来,不可能有其他的情况。我们可以想象一下模拟式的基因系统。我们已经知道,模拟信息经过连续若干代的复制之后会产生什么样的后果:变成了一片噪声。在设有许多放大器的电话系统中,在多次转录磁带的过程中,在复印再复印的过程中——总之,在累积退化过程中,模拟信号极易受到损害。因此,复制只能进行有限的几代。然而,基因则不然,它可以自我复制千万代而几乎没有任何退化。达尔文的进化论之所以成立,仅仅是因为复制过程是完美无缺的——除去一些分立的变异,自然选择法则决定了这些变异或者被淘汰,或者被保留下来。只有数字式的基因系统能够使达尔文的进化论在地质时代中永放光华。1953年是双螺旋年,它将被看作是神秘论生命观和愚昧主义生命观的末日,而达尔文主义者则把1953年视为他们的学科最终走向数字化之年。

;