在进化生物学界,一直有一个“鸡生蛋,蛋生鸡”的悖论存在。一方面,大自然利用半保留复制的方式,从上一代向下一代传递基因,这个过程依赖聚合酶的催化“协助”;另一方面,聚合酶的产生又源自基因的转录和翻译。那么,在原始地球上,生命最初的遗传信息怎么传递的呢?是依靠酶,还是依靠核酸?时至今日,RNA病毒的遗传信息复制似乎给了我们一些启发,它们通过RNA指导的RNA聚合来复制基因组。原始地球上生命遗传信息的自我复制很可能也是如此,只不过整个过程没有酶的参与,而可能使用带有有机离去基团的活化核苷酸。对这一过程的化学机理以及哪类序列更适合非酶复制等问题,目前学术界并不清楚,原因主要在于实验条件下重现这一过程极具挑战性。
近日,针对这一涉及生命起源与进化的重大科学问题,德国斯图加特大学有机化学系的Clemens Richert教授团队取得了重要进展。在无酶参与的情况下,他们在以C和G作为碱基的未活化二核苷酸混合物稀水溶液中复制了长达12个核苷酸的RNA序列。根据目前已有的报道,这创造了无酶参与RNA序列自我复制的长度记录。相关工作发表于Angew. Chem. Int. Ed.。
Clemens Richert教授团队。图片来源:斯图加特大学
在以往的研究中,核酸非酶合成模拟实验只能使用含胞嘧啶(C)核苷酸的同聚体作为模板,形成寡聚鸟嘌呤(G)核酸链。遗憾的是,同聚体序列并不能代表生物基因。人们在研究混合序列时遇到了挑战,迄今为止,能合成4种碱基混合序列的案例屈指可数,在优化反应条件下,最高记录也只有7个碱基长度的序列(图1)。相比之下,Richert团队最近将这一记录推进到了12碱基序列。
图1. 以往研究推测的核酸非酶合成机理。图片来源:Angew. Chem. Int. Ed.
Richert团队在前人的研究基础上,选择单体核苷酸、二聚体核苷酸(即二核苷酸)作为构建模块(building blocks),引用易于进行非酶复制的G/C碱基序列作为模板,在4 °C特定优化缓冲溶液中进行反应。在规定时间间隔抽取等份试样,用MALDI-TOF质谱法进行分析,反应获得的延伸产物用HPLC标样比较法进行验证。
图2. 本文研究所涉及的序列。图片来源:Angew. Chem. Int. Ed.
他们首先使用引物2和复制区域含10个碱基的模板1进行实验(图3A),当构建模块选择单核苷酸CMP和GMP时,检测出单核苷酸序列3为主产物,也就是只延伸了一个碱基。当构建模块选择二核苷酸CG和GG时,质谱检测到延伸了10个碱基的产物序列(图3B)。若用CMP、GMP、CG和GG作为构建模块,则反应检测到的产物序列与只选择二核苷酸构建模块的反应产物相似(图3C)。若用所有含G、C的二核苷酸(GC、GG、CC、CG)作为构建模块,则反应再次检测到延伸了10个碱基的产物序列(图3D)。