“我是四川成都人,2008 年汶川大地震让我更加认识到生命的脆弱和生活的美好,也让我产生了研究生命科学的想法,希望可以用己所学造福更多的生命。”美国杜克大学博士后、北京生命科学研究所博士毕业生杨斧表示。
(来源:杨斧)
15 年后,杨斧的这一梦想再进一步。2023 年,他以一作身份在 Nature 发表了一篇关于生命科学的论文。
论文中,杨斧回答了一个长期悬而未解的问题:即在被整合到基因组之前,转座子是如何形成互补链 DNA 的。此外,他还描述了替代末端连接修复机制的一种新作用。
(来源:杨斧)
评审专家表示这项研究的证据令人信服,是对理解逆转座子复制和跳跃机制的重大进步。尤其值得一提的是,本次发现在多种生物体中都已得到验证。
在正常细胞和组织里,逆转座子通常可以被很好地抑制。但是,其活性在肿瘤发生、神经退行性疾病和衰老过程中,会出现显著的上升。
而本次研究明确了环状 DNA 在逆转座子复制中的核心作用,对于理解其在以上生命过程中的意义至关重要,并提供了能起到潜在干预作用的新策略。
另外,很多逆转录病毒比如导致艾滋病的人体免疫缺陷病毒(HIV,human immunodeficiency virus),在其传染周期中也会形成环状 DNA。如果 HIV 病毒具有类似逆转座子的复制模式,那么抑制环状 DNA 的形成或能成为治疗 HIV 感染者的新策略。
原因在于,此次研究发现在逆转座子跳跃的过程中,绝大多数新合成的 DNA 形成了环状 DNA。
进一步研究之后,杨斧等人发现逆转座子利用了宿主的一种叫做“末端连接修复”的 DNA 损伤修复机制,以此来形成环状 DNA 从而促进其转座。
其表示:“这个发现颠覆了教科书中的传统观点,此前人们认为逆转座子复制过程中产生的环状 DNA 是复制失败的副产物。相反,我们的研究强调了环状 DNA 的形成在逆转座子复制和转座中的重要性。”
鉴于转座子的活性在癌症、神经退行性疾病、和衰老过程中会呈现显著上升,因此本次成果暗示着环状 DNA 在这些转座子相关研究中具备潜在的核心作用。
日前,相关论文以《反转录转座子劫持 ALT-EJ 用于 DNA 复制和 eccDNA 生物发生》(Retrotransposons hijack alt-EJ for DNA replication and eccDNA biogenesis)为题发在 Nature,杨斧是第一作者,杜克大学教授张钊担任通讯作者 [1]。
图 | 相关论文(来源:Nature)
19 世纪,英国科学家查尔斯·达尔文(Charles Darwin)搭乘小猎犬号(HMS Bealge)开始了五年的环球航行。
根据旅途中的所见所闻,达尔文完成了《物种起源》一书,提出了物竞天择的观点,并认为所有物种都是从少数共同祖先演化而来,这也是近代科学史上最重要的成果之一。
后来,为了纪念达尔文的伟大成就,科学家用小猎犬号命名了果蝇的逆转座子 HMS-Bealge。这也是杨斧此次研究中的主角。
“从这个故事里我学到了两点:科学研究要善于利用新的技术,要有勇气挑战人们的传统观点。”杨斧表示。
2000 年,当人类基因组测序草图发布的时候,人们惊奇地发现只有不到 2% 的基因组序列编码,可以构成人体的蛋白质。相反,有将近一半的基因组序列来源于转座子。
转座子,又称为跳跃基因,是一种可以在基因组中移动的元件,于 1951 年被美国遗传学家芭芭拉·麦克林托克(Barbara McClintock)发现。
虽然在最初 30 年,转座子并不被人们所认可。但是从 1980 年代开始,对转座子的研究获得了学界的广泛认可。芭芭拉·麦克林托克也因这项成果独享了 1983 年的诺贝尔生理学和医学奖。
在人类基因组中,很大一部分转座子是逆转座子。在基因组中,逆转座子以一种“复制粘贴”的方式来繁殖以及增加其拷贝数量。
具体来说,逆转座子先是从基因组中已有的拷贝处生成 RNA,然后以 RNA 为模版合成 DNA 并插入到基因组中的新位点。
这些插入可能会导致遗传变异、基因组损伤、动物繁殖障碍等一系列疾病,比如肿瘤、神经退行性疾病、甚至驱动衰老的发生等。
另一方面,人们也驯化了一些转座子编码的蛋白为己所用。比如:免疫系统利用转座子编码的 RAG 基因促进抗体重排从而来提升免疫力,哺乳动物利用逆转座子的 Syncytin 蛋白形成母婴屏障从而为胎儿提供保护。
转座子和其宿主这种有趣的“寄生”和“共生”关系,塑造了很多基本的生命过程。因此,深入探索逆转座子在生物体中的跳跃机制,对于人类健康具有重要意义。
历经四十多年的研究,学界已经获得不少关于逆转座子的知识。然而,具体如何实现“复制粘贴”?人们依旧不是很清楚。
杨斧的博后导师张钊教授,研究逆转座子已有十五年有余,并已建立一套能在机体水平上检测逆转座子活性的平台。
在本次课题组中,他们用一个标签来标记果蝇的逆转座子 HMS-Beagle。然后,通过基因组测序来确认逆转座子跳跃插入的新位点。
但是,目前传统的短读长测序技术通常只能读取小于 300 遗传信息碱基对。由于逆转座子含有重复序列,并且在基因组中存在众多拷贝,采用短读长测序技术很难精确确认其在基因组中的位置。
为此,他们采用最新的长读长测序技术,来追踪逆转座子跳跃过程的终产物。长读长测序技术的好处在于,可以直接阅读 DNA 序列,并且读长往往可以达到百万碱基对,远远超过常用的短读长测序技术。
后来,该团队发现仅仅只有 10% 的新合成逆转座子插入了基因组的新位点。相反,有 90% 形成了环状 DNA。
为验证上述发现,课题组开发一项新型环状 DNA 测序技术,进一步确认这不仅仅是被标记的逆转座子,原因在于其他果蝇体内天然存在的逆转座子,在跳跃的过程中也形成了大量环状 DNA。
杨斧说:“我们为这项新发现感到兴奋,但当我们和病毒学家讨论这个问题时,他们却不这么认为,他们认为逆转座子和逆转录病毒很类似。”
HIV 病毒,是目前最著名的逆转录病毒。早在 1990 年代,人们就知道在感染宿主过程中会形成环状 DNA。
出版于 1997 年的《逆转录病毒》教科书中也记录了这一点。并且,书中认为环状 DNA 是通过病毒两端的长末端重复序列的相互*而形成,而这种环状 DNA 仅仅是复制失败的副产物。
为了检验书中的观点,杨斧等人逐一降低了同源*通路中关键的 7 个基因。即便如此,依然可以形成环状 DNA。
为进一步探究逆转座子在复制过程中,到底是如何形成环状 DNA 的。该团队建立了果蝇的遗传筛选系统,后来发现逆转座子并非利用经典的同源*修复或非同源性末端连接,而是利用一种名为“替代末端连接”的修复通路来形成环状 DNA。
替代末端连接通路中的因子,在逆转座子的复制过程中能够发挥作用,从而能够介导复制过程中的一个环化步骤,进而推动合成逆转座子的互补链 DNA。
阻断逆转座子的环化过程,会导致单链 DNA 的积累,并阻止逆转座子插入基因组的新位点。
这也说明,本次发现挑战了过去将环状 DNA 仅仅视为复制失败副产物的观点。相反,杨斧等人的研究强调了环状 DNA 的形成,在逆转座子复制和转座中的重要性。
综合来看,本次成果始于几个意外的发现。例如,当课题组追踪逆转座子复制终产物时,DNA 测序结果显示逆转座子更倾向于形成环状 DNA,而不是直接整合到基因组中。
而且,不同于常理的是,这些环状 DNA 的形成对于逆转座子实现整合至关重要。这些发现促使他们更加深入地研究逆转座子复制的机制。
杨斧说:“我们的优势在于使用了最先进的技术和平台。通过使用纳米孔测序,我们克服了传统短读长测序的局限性,从而能对环状 DNA 进行准确的量化。”
同时,本次工作也证明了实验和计算方法结合的潜力。从计算和分析实验结果、再从分析结果提出新假设、并进一步通过实验来验证。
这种实验和计算分析相结合的方法,为深入研究基因组进化和疾病的复杂机制铺平了道路。
(来源:Nature)
不过,本次研究主要依赖于遗传学手段。后续,该团队会采取更多的生物化学方法,细化每一个参与因子的具体作用。
前面提到,杨斧是四川省成都市人。谈及自己名字中的“斧”他表示:“‘斧’字有两重含义。第一,我是剖腹产的,‘斧’铭记母亲赋予我生命的不易;第二,‘斧’出自《文心雕龙·原道》‘斧藻群言’,父母希望我能继承和发展先贤成就。”
而他的确没有辜负父母的期望。其本科就读于四川大学创新班,本科毕业后来到北京生命科学研究所读博。
北京生命科学研究所成立于 2003 年,是一个探索生命科学研究新机制的试验田。杨斧表示:“我在袭荣文教授的指导下开始研究成体干细胞和它们的微环境之间的相互作用。随着研究的深入和袭荣文老师的鼓励,我找到了自己的研究兴趣点——转座子。”
获得博士学位后,杨斧来到美国卡耐基研究所进行博士后训练。卡耐基研究所,是转座子研究的高地。该校有两位著名科学家在转座子领域作出了巨大贡献。
其中一位便是前文提到的芭芭拉·麦克林托克教授,她曾首次发现玉米基因组中存在转座子。二十世纪八九十年代,艾伦·C·斯普拉德林(Allan C. Spradling)利用 P 转座子在果蝇中建立了一系列的遗传工具,极大地丰富了科研手段。
杨斧的博后导师张钊教授,则结合果蝇遗传工具和现代测序技术,来研究宿主和转座子的相互调节和影响,此前已经发表多篇重要论文。
2019 年,杨斧跟随张钊来到杜克大学继续做博士后研究。不久之后,杨斧即将寻找教职。他说:“我主要想在国内一流的高校和研究所建立独立的实验室,并和志同道合的同学和老师更深入地继续研究转座子和环状 DNA。”
参考资料:
1.Yang, F., Su, W., Chung, O.W.et al. Retrotransposons hijack alt-EJ for DNA replication and eccDNA biogenesis. Nature 620, 218–225 (2023). https://doi.org/10.1038/s41586-023-06327-7