- 第一推动丛书·综合系列(套装共8册)
- (美)梅拉妮·米歇尔等
- 5485字
- 2025-04-18 14:27:22
生命的起源
关于生命的起源有很多理论,但都无法从科学上让人完全满意,主要是因为直接证据太少了。我们对一些事情很有信心。首先,生命在地球上的出现从原则上只有3种可能途径。生命可以是:(1)来自宇宙其他地方;(2)通过物理和化学规律以外的某种力量的作用在地球上出现;(3)通过自然的化学和物理过程在地球上出现。第3种可能又分为有合理可能性和基本不可能(例如奇迹)的情形。目前没有证据表明生命起源于其他地方,但如果在火星或木卫二上发现了基于DNA的生命将会彻底改变这一点,而违背已知物理和化学定律的起源不在考虑的范围。因此,科学家们只有一种选择,就是研究地球上有可能存在的化学场景,当然NASA也一直在资助在火星和太阳系其他地方探测生命的实验。
化石和地质证据表明生命在地球上出现于35亿年前,但不会早于42亿年前,有微弱证据表明可能是38亿年或之前。留存下来最古老的岩石大约是在38亿年前形成,虽然名为锆石的晶体更古老。这个时期地球上的环境相当不稳定。标准的太阳系模型表明当时的太阳亮度只有现在的75%,这意味着海洋会结冰,但二氧化碳和甲烷等温室气体的存在以及温度更高的行星内核可能会让地球表面足够温暖,让海洋保持液态。有许多火山释放气体。事实上,大部分早期地球模型都将火山喷发作为大气的大部分或全部来源。氢、碳、氧、氮和硫都有,但对于这些元素的化学形式还有争议。
最大的未知是大气的氧化态。现在的大气中有很多氧气,但科学家们都认为这是光合作用的结果。生命通过分解水(H2O)和释放氧气(O2)维持大气中的氧分子,所需的能量来自阳光。氧分子具有化学活性,如果没有光合作用很快会从大气中消失。在氧化条件下,碳会成为二氧化碳(CO2),氢会成为水(H2O),氮以氮气(N2)或硝酸根离子的形式存在,硫则成为硫酸根
。硫和氮溶于水或束缚在岩石中。与氧化相对的是还原。原子与氢而不是氧结合。这种情形下,碳会成为甲烷(CH4),氮会成为氨(NH3),硫会成为硫化氢(H2S),氢会以分子形式(H2)存在,氧则存在于水(H2O)中。介于两种情况之间的是水、氮分子、二氧化碳或一氧化碳(CO)以及硫元素(固体)。其他化合物包括甲醛(CH2O)和氰化物(HCN)都有可能。
通过深入研究地质过程和仔细分析最古老岩石的化学,地球化学对早期大气成分的认识被不断改变。目前的模型倾向于认为是有少量氧分子的中性或适度的还原性条件(H2 O、N2、CO2,可能有CO、S和/或H2 S)。在火山口附近,局部可能具有很强的还原性条件,现在依然是这样。通过太阳光、干湿循环、频繁闪电以及大量火山活动,会发生大量由氢、碳、氮、氧和硫参与的化学反应,形成大量碳基分子。土卫六上现在可能正在发生类似的过程,土卫六的大气含有甲烷和氨,具有很强的还原性条件。由于存在基于碳、氢和氮的复杂有机分子,它的大气呈现出朦胧的橙色。土卫六很冷,因此氧大部分封存于冰冻的水中。
被引用最多的生命起源理论可以追溯到达尔文1871年写给约瑟夫·胡克的信:
经常有人说,如果第一次产生生命的所有条件都存在,它就会一直存在。但如果(噢!多么大的如果啊!)我们设想在温暖的小池塘里,有各种氨和磷酸盐、光、热、电,等等,蛋白质通过化学方式得以合成,并产生更复杂的变化,在今天这些物质会马上被蒸发或吸收,使得生命来不及形成。
今天,达尔文说的“温暖的小池塘”更常见的说法是“原始汤”,由氨基酸、糖、核苷酸和其他各种有机物溶解在水里进行反应形成的浓汤。这个构想还有许多问题没有解决。首先,虽然大部分关键化合物在实验室中在合理的条件下可以产生出来,但所需的条件对于所有化合物并不是一样的。因此只能设想不同的化合物是在不同的池塘中产生出来,然后碰巧以正确的顺序组合到一起。另一个问题是,要产生出聚合物(蛋白质、多糖和核酸都是聚合物),“汤”的浓度要足够高,这在海洋里是不可能的,因为当水太多时,作为生命特征的有机物的化学性质不稳定,很快就会分解。
为了解决这些问题提出了许多构想,包括在干涸的池塘里浓缩,在冰上形成的小水窖里浓缩,催化黏土表面的特殊化合,与热岩接触的特殊环境中,比如在水底火山附近,在沉积物(泥巴)中化合,以及在太阳星云中化合,然后被彗星和陨石带到地球上。所有这些想法都开启了新的探索维度,但现实是目前还没有人能证明在实验室条件下如何生成所有所需的化合物,并且合理地解释这种条件在早期地球曾经很普遍。
不考虑化学细节,深入研究过这个问题的人都认同生命的形成有两个关键。需要出现能自维持的连锁化学反应网络,也就是代谢的前身,以及各种化学反应的催化和调控,组成受指令控制的网络。需要催化是因为许多现代代谢反应在常温下都不会发生。在所有现代生命形式中,催化和控制都是通过蛋白质酶完成的,而蛋白质酶的结构是由DNA编码的信息决定的。复杂引擎能对现代生命起作用是因为这种信息可以复制,并受到累积性选择。
专家们对于代谢和指令谁先谁后一直有很大争议。先有鸡还是先有蛋?一些人认为信息编码分子的自复制肯定是种子事件。因为一旦实现了自复制,对指令进行扩展,实现对其他反应的催化(包括自复制反应)就不是很难的事情了。多年来,对DNA编码蛋白质和蛋白质参与合成DNA的认识使得这个难题被认为是问题的关键。让人吃惊的是,这个问题在20世纪80年代就从原理上被解决了,却并没有解决生命起源问题。重要的发现是,与DNA非常类似的信息携带分子RNA能催化化学反应。因此在原理上可能存在RNA分子能催化自身的合成。还没有化学家能生成出这样的分子,但如果这个分子能够通过随机化学反应合成,并位于核苷三磷酸(RNA的化学前身)的浓汤中,它就能自发复制自己。由于这种假想的分子能在其结构中编码生成更多RNA分子所需的信息,它也就能自动进入复杂引擎的循环,它的后代必然会很快变成越来越好的复制者。这个思想使得在20世纪80年代出现了一种生命起源早期的构想,称为“RNA世界”——自复制RNA分子的池塘,RNA分子相互竞争空间和核苷三磷酸。在选择压力下,这些RNA分子(通过进化过程)逐渐“学会了”编码蛋白质酶,能催化更简单的分子形成核苷三磷酸,并最终产生出现代细胞生物化学网络所需的所有生物化合物。在这个构想中,复杂生物化学网络所展现的结构是复杂引擎作用于化学系统的自然结果。
这是一个很有吸引力的构想,但虽然最近有一些突破,还是没有人能令人信服地解释所需的核苷三磷酸是如何产生出来并形成足够高的浓度从而合成出RNA链,也没有找到能自复制的小RNA。另一方面,自复制分子作为关键的第一步的总体想法仍然很有吸引力,一些科学家正在不断努力寻找能使其发生的条件。
代谢在前的构想有更久远的历史。最近的一个版本是斯图尔特·考夫曼提出的。其中的思想是,关键的第一步不是自催化的复制分子,而是自催化自维持的化学反应网络。他称之为“自催化集”。这似乎很有可行性。在一个多少有些随机的化学反应系统(汤)中,会(随机)形成一些简单的聚合物。单体能形成二聚体(两个单体连到一起)和三聚体(三个单体连到一起),二聚体和三聚体又形成四聚体、五聚体、六聚体,等等。随着连接的单体数量越来越多,可能产物的数量迅速增加。最初,这些聚合物的浓度很低。
一些聚合物有一个特点是能催化特定的化学反应,例如一些蛋白质和RNA就有催化作用。因此不难想到在反应汤中会有一些小聚合物,而其中一些能催化化学反应。至于是催化何种反应并不重要。催化反应的化学产物会迅速增加(因为催化),从而形成新的反应和新的聚合物。一旦形成新的催化,化学网络的许多细节就会改变。只要有一个催化反应能间接导致其催化物浓度的增长,在反应产物和催化物之间就能建立正反馈环。最让人感兴趣的是小聚合物通过加速比如说特定的二聚体与三聚体结合,从而催化大聚合物的形成。小聚合物催化这种反应的可能性已经被证实。例如,很简单的聚合物双甘氨肽(甘氨酸是最简单的氨基酸,双甘氨肽由两个甘氨酸结合形成)在高浓度盐水中能催化一些氨基酸和小缩氨酸的聚合,这在干涸的池塘中有可能实现。产生的新聚合物又能与其他小聚合物结合产生出更大的聚合物,每种新产物都具有催化某种反应的可能性。如果小聚合物催化形成大聚合物的概率足够高,这个过程必然导致越来越多的正反馈环形成。
整个想法看似有点不现实,但考夫曼和他的同事已经用计算机模拟证明了它确实可行。通过假设随机选取的聚合物催化聚合物反应的概率,当最初的反应汤中化合物种类足够多之后,就会出现“催化闭环”,从而使得网络只要有简单的化合物原料供应就能自我维持。在第9章就是用自催化自维持的生物化学网络来定义生命。如果考夫曼的观点是正确的,今天细胞中的生物化学/蛋白质组/调控网络就是从这些早在第一个细胞甚至RNA或DNA出现之前就形成了的自催化生物化学网络不断演化而来。在很早的某个时候,这个网络逐渐加入了指令(很有可能是以RNA的形式),指令可以更有效地管理和累积目的性信息。指令也更容易进化。
这个构想有一个吸引人的特点是普遍性。所需的不是特定的化合物的功能,而是催化闭环,只要满足一定的普遍性条件以及化合物种类数量足够多就可以。不过同期它假说一样,要让人信服,必须能在实验室展示具体的化学过程。在已知的早期地球条件下,到底哪种催化聚合物是可行的?多肽(短蛋白质)是一个好的候选,因为氨基酸可以在各种模拟的早期地球条件下产生,短多肽具有催化活性,并且多肽是现在生命所使用的催化剂(细胞酶是长多肽)。但还没有人能在实验室实现基于人工多肽的自催化集,在实现之前,有理由持怀疑态度。
自催化模型的一个有趣特点是,聚合物就其本质来说,在序列中编码了所催化的反应的信息。因此,聚合物自催化集在其多个聚合物中分布式编码了其自身繁殖所需的信息。选择将有力地塑造这样的系统中涌现出的动力学和细节。如果某些网络反应能合成出核苷酸和核苷酸多肽,那么从自催化集到RNA的清晰路径就不难想象了。
RNA和自催化集在传统上被视为生命起源的两个不同选项,经常被认为一个是“信息在先”,一个是“生物化学在先”。但就如我们看到的,它们并不一定冲突。如果催化剂引入了RNA, RNA的世界就能从之前的自催化化学网络中产生出来,并且这个网络还不断给它提供核苷三磷酸。
总的来说,信息在先模型需要信息分子的随机形成,而且这种信息分子要刚好能催化其自身的复制。只要是能自复制的分子就会自动进入复杂引擎循环(假设其复制还可以再完善)。由于RNA序列能催化特定的化学反应,因此不难想象,这种自催化反应如果存在的话,通过进化将可以构建出生物化学网络,在最初的原料耗尽后能继续提供复制所需的原料。
与之对比,生物化学在先模型则猜想,生物化学网络在将分布式催化和调控信息升级为专门的信息编码分子(RNA或DNA)之前,已经变得相当复杂。根据这种猜想,有了专门存储和利用信息的分子的加入,复杂引擎才会全力开动,但在此之前选择已经作用于已存的生物化学网络。根据这种观点,最初的信息分子不是自复制,而是同自繁殖网络的其他化学成分一起合成。
逻辑分析无法判断哪一个思想更接近真相。只有在实验室中建立起合理的早期地球地质化学条件,通过实验证实,才能最终判断它们(或其他理论)是不是正确。
生物化学在先的思想有一个吸引人的特点是,在有明确编码指令信息的分子出现之前,选择就起到了重要作用,并且选择绝对不要什么复杂技术。无论是生命还是非生命,选择在自然界都广泛存在。生物化学模型也不怎么依赖特定的低概率事件。一旦具有特定属性的系统足够复杂,它就会自组织成自催化集。
对于信息在先模型,通过简单的概率计算就能看出最初的自复制分子所能编码的目的性信息的量多么有限。估算是这样:假设系统随机生成携带信息的分子的速率是每秒一个。这是活细胞中大肠杆菌RNA聚合酶转录一个基因所需的时间。原始的复制系统基本不可能有这么高的效率,因此这是保守估计。然后假设每秒都有大量分子合成。为了论证需要假设一个具体的数字,假设为6×1023,也就是化学中的1摩尔。这个量很大,会产生很多的单体分子。让时间持续1亿年(2×1015秒)。这么久大约会产生1039个分子。
如果这些分子都是RNA(有4种化学基作为信息编码字母),则可以编码2130比特信息。也就是说,这个系统1亿年可以穷尽搜索130比特宽的信息空间。这意味着经过1亿年大部分65碱基长或更短的RNA会被生成出来(每个碱基2比特),但大部分更长的分子不会出现(随机合成)。如果我们的产物用完地球上所有的碳原子(很荒谬的假设),能探索的信息空间也不会超过200比特宽。由于长度和可能序列的数量呈指数关系,因此出现在早期地球上的具有特定意义的聚合物序列的长度不会超过100个单体分子,50是更合理的上限。因此,通过简单的数学计算就能得出结论,最初的信息分子如果是随机生成的话,不可能很长。
100比特(50个RNA单体)的信息还不及一行字。“煮蛋3分钟然后加盐和胡椒”的指令就有大约100比特信息。信息在先模型必须要能够构造出50单位的聚合物,并折叠成能催化自身复制过程的形状(提供合适的简单前身分子)。目前还没有发现这样的分子;但也不能下结论说不存在。而对于RNA分子连接酶的活性则已经了解得很清楚。连接酶能将两个聚合物连接成更大的聚合物。RNA连接酶可能在最初的自复制RNA的产生过程中起到了重要作用。生物化学在先模型的一个主要优点是最初的编码信息不需要具有自复制功能,只要能改进网络性能就可以。在生物化学在先模型中,概率问题似乎是被逐步克服,不需要依赖高度不可能的步骤(最初的催化闭环事件的概率目前还无法计算,专家目前的估计范围从“基本肯定”到“基本不可能”都有!)。总结一下,生命起源的关键事件是信息编码分子或信息编码自催化网络的自复制,目前还无法判断哪个更可信。两者都是基于选择。