新基因起源:从自然进化到人工设计

作者单位:中国科学院天津工业生物技术研究所
文章来源:《生物工程学报》March 25, 2017, 33(3): 324−330

摘 要: 生命体系历经 40 多亿年的自然进化,创造了无数丰富多彩的功能基因,保障了生命体系的传承与繁荣。然而生命体系的自然进化历程极其缓慢,新的功能基因产生需要数百万年时间,无法满足快速发展的工业生产需求。利用合成生物学技术,研究人员可以依据已知的酶催化机理和蛋白质结构进行全新的基因设计与合成,按照工业生产需求快速创造全新的蛋白质催化剂,实现各种自然界生物无法催化的生物化学反应。尽管新基因设计技术展现了激动人心的应用前景,但是目前该技术还存在设计成功率不高、酶催化活性较低、合成成本较高等科技挑战。未来随着合成生物学技术的快速发展,设计、改造、合成和筛选等技术将融合为一体,为新基因设计与创建带来全新的发展机遇。

基因是生命体的基本功能单元,由DNA编 码,可转录成 mRNA,并翻译成蛋白质行使功能。各种精彩纷呈的基因功能,如光合作用、 新陈代谢、细胞分裂、个体发育等无不彰显了基因的神奇和生命的无穷魅力。在生命亿万年的进化历程中,新功能新基因的呈现是生命体环境适应性进化的基本保障。正是由于生物进化过程中不断产生的全新功能基因,使得生物具有应对变化莫测的地球环境的本领,从而在地球上生存了数十亿年,并逐步改造地球环境, 直至今天形成了我们看到的适合人类居住的 家园。

1 新基因的自然起源进化

在生命从简单到复杂的进化历程中,基因数量展示了由少到多的变化趋势,如简单的原核生物一般基因数量在几百到几千,而复杂高 等的真核生物则有多达几万个的功能基因。然而新基因从何而来,新功能如何产生,又是如何参与生物进化过程等科学问题一直是困扰进化生物学家的难题。早在 1970 年日本进化学家 Ohno 首次系统阐述了新基因如何通过基因重复起源,并且认为基因重复是新基因产生的主要分子机制。1993年华人进化学家龙漫进教授 首次用实验方法发现并解析了第一个由两个不同基因片段嵌合的新基因,证明了基因嵌合起 源的分子机理。2000 年之后,生物学研究进入了基因组时代,迅猛发展的基因组技术和庞大的基因组数据为基因起源与进化研究提供了绝佳的机遇。通过比较分析近缘物种的基因组序列,研究人员发现了多种新基因起源的分子机制,包括基因重复、基因分裂与融合、基因转 座、基因横向迁移、基因嵌合和基因从头起源 (从非编码区起源) 等。新基因起源与进化的基础理论得到了前所未有的快速发展。

基因重复后其中一个拷贝积累突变并产生 新功能的起源机制已经广为人知,或者不同功能来源的基因片段组合然后产生全新的功能基因的机制也被研究得相当清楚,但是新基因如何由非编码区起源,新功能如何从无到有的创造一直被认为是小概率事件,其起源进化机制也知之甚少。王文等以模式生物果蝇为研究对 象,系统分析了黑腹果蝇基因组中的新基因起源机制。他们发现除了基因重复起源机制之 外,还有 12%的新基因是从头起源的,表明从头起源新基因在物种进化过程中占据了很高的比例,可能发挥了很重要的生物功能。其后, 李丹等以酿酒酵母为模型深入研究了从头起源 新基因的功能,发现从头起源新基因 MDF1 在 酵母有性生殖和营养生长过程中发挥了重要作用,并且提高了该物种在多变环境下的适应能力。尽管从头起源新基因是从没有生物功能的非编码区域产生的,但是其在物种适应性进化过程中具有不可替代的作用。

由于所有蛋白质都需要通过核糖体与其信使 RNA (mRNA) 结合进行翻译,因此利用高通量测序技术检测被核糖体结合的 mRNA 的原理,研究人员理论上可以观察到基因组中所有编码蛋白质的基因。利用该技术,Carvunis 等发现除广为人知的 6 000 多个编码基因之外, 酿酒酵母的基因组中还有 1 900 多个新的编码基因。Stern-Ginossar 等采用同样的技术,解析了一个人源病毒基因组中所有的蛋白质翻译事件,发现了上百个未被注释的新编码基因。 同样地,刘晓秋等在经典的模式病毒 Lambda 噬菌体中,发现了 50 多个新编码基因,占到了过去几十年该病毒中已知基因总数的 80%。在这些新发现的编码基因当中,部分基因已经证实有翻译的蛋白质,部分基因在近缘物种间非常保守,很可能是有生物学功能的。而且有意思的是,这些新的编码基因绝大多数都是新近起源或从头起源的新基因。因此,这种新的基因发掘技术完全颠覆了传统编码基因的研究策略,为新基因的进化研究开辟了一片全新的 天地。

2 新基因人工设计研究进展

新基因自然进化起源都是以百万年为单位,新基因产生速率极其缓慢,远远无法满 足日益增长的工业生产的需求。基于数学、物理、 计算科学、工程科学与生命科学的深度融合,合成生物学推动了从认识生命到设计生命的质的变革,带来了生命科学领域的第三次革命。 合成生物学为新基因研究带来颠覆性的理念和方法。在 DNA 合成技术的武装下,人工设计与 合成全新的功能基因成为了可能。依据有机化学反应原理和已有的蛋白质结构模板从头设计 新的酶催化剂已经获得成功。未来随着新基因设计技术进步,人类可以根据工业生产的需求创造出完全不同于自然生命体系的具有新基因新功能的“人造生命”,这将为生命科学研究带来前所未有的变革。

新基因设计是指按照研究者的意愿,设计和制造出自然界不存在的、具有特定生物学功能的全新蛋白质编码基因。1988 年 Regan 等首次人工设计了可成功折叠的蛋白质,但只有少数成功折叠的蛋白质具有生物活性。近期刘海燕等通 过能量优化和精巧的高通量筛选设计,进一步提高了设计可折叠蛋白质的成功率。然而蛋白质的成功折叠并不意味着具有生物活性。为此, Baker 等开发了一套基于 Rosetta 算法的新酶设计流程,设计了大量具有生物功能的新酶。研究人员首先构建酶催化过程中氨基酸残基与过渡态底物相互作用的量化模型,搜索与模型匹配的已知蛋白质结构框架,并将模型与蛋白质结构框架进行整合,优化底物亲和力、结合电势能和结构稳定性等,最终合成表达并通过实验筛选出具有生物功能的蛋白质 (图 1A)。很多具有重要生物功能的新酶被设计出来 (表 1),如催化 羟醛缩合反应 (Retro-aldol reaction) 、Kemp 消 除反应 (Kemp elimination reaction,图 1B) 、狄尔斯-阿尔德反应 (Diels-Alder reaction) 。同时生物代谢途径也可以借助于新酶设计进行重新构建,例如 Siegel 等利用新酶设计创建了以二 氧化碳为原料合成羟基丙酮的关键催化酶,并在大肠杆菌中构建了该合成途径。这些蛋白酶的成功设计充分证明新酶设计策略具有巨大发展潜力。






3 新基因设计的挑战与机遇

尽管新酶设计已经取得了一定的成功,但是依然面临诸多挑战。首先,新基因设计成功率还较低。活性中心的催化基团与过渡态底物模型构建,模型与骨架蛋白匹配,骨架蛋白质的残基构象等都会影响新酶设计的成功率或新酶的性 能。例如在 Kemp 消除反应的酶设计中,羧酸基团作为广义碱与非极性底物间存在相互作用,但是由于羧酸基团的构象自由度较大,如果不能准确计算羧酸基去溶剂化效应的能量消耗及熵减, 可能使羧酸基团不适合行使广义碱的作用,进而使反应无法发生。因此我们还需要深入研究酶的催化机理及其计算模拟,如优化分子力场准确计算催化位点与底物、溶剂等作用力,改进催化过渡态能垒计算方法,改善蛋白骨架构象模拟方法等。同时由于蛋白质每个位点都有 20 种可能性,氨基酸之间的相互作用包括氢键、范德华力等多种分子作用力,还存在与溶剂、底物、产 物等相互关系,因此蛋白质结构预测计算难度极 大,计算设计需要的计算机资源也非常高。Baker 等构建了一 套基于 Rosetta 的 计 算平台 (boinc.bakerlab.org/rosetta/),可以通过蛋白 质设计爱好者共享计算资源来满足蛋白质结构预测的需求。因此我们还需要通过优化新酶设 计算法和计算资源增加新酶设计成功率,为生物催化创造出更多令人惊奇的新反应。

其次,新蛋白酶的设计需要将催化活性中心与蛋白质骨架进行嵌合,而嵌合过程难免会影响蛋白质的结构和稳定性。同时蛋白质骨架与酶催 化过程的协同还需要进一步优化,因此新设计的蛋白酶催化活性都普遍偏低,还达不到工业生产 的要求。研究人员需要利用经典的酶定向进化和 理性改造方法提高新设计酶的催化性能。例如, 基于 2012 年 Althoff 等新设计出的 Retro-aldol 酶,2016 年 Obexer 等利用超高通量微流控的方法对该酶进行定向进化,最终得到酶活提升 109 的突变体。新酶设计方法与传统酶工程方法 结合大大提高了新酶设计的实用性,可进一步开发新酶设计的工业应用潜力。

最后,由于新设计的基因都是自然界不存在的基因,基因功能的测试和鉴定离不开 DNA 合成技术。DNA 合成成本大幅降低,为新基因设计提供了极好的发展机遇。目前 DNA 合成技术发展非常快,不仅合成成本大幅降低,合成 通量也大幅提高。比如利用高通量DNA 芯片合成技术,可以设计与合成各种突变类型的新基因,结合高通量筛选技术,实现新基因合成、 密码子优化和酶活改造等多种功能于一体。因 此,新酶设计方法与高通量自动化 DNA 合成技术结合,可进一步提高新酶设计的成功率和新酶的表达催化性能,实现新基因的按需设计, 满足工业生产需求。

4 结语

合成生物学以工程化理念为导向,对生物体进行有目标的设计、改造乃至重新合成。合成生物学促进了对生命密码从“读识”到“设计” 的质变,对揭示生命本质具有重要意义,而由此形成的创新思想、使能技术及工程平台,能促进生物技术革命,被预测为可望改变世界的 十大颠覆性技术之一。随着合成生物技术的快速发展,以此为基础的新基因设计技术,将颠覆式创造各种新功能基因,完全突破自然进化 的局限,加快新生物功能基因产生速度。按照 人类需求快速创建的新功能基因,可极大提高自然生物功能改造与创新的速度,并由此可创建超越自然功能的“人造生物体系”,为解决工业、农业、医药等领域的重大需求提供全新的生物学方案,为我国转变发展方式、引领产业创新发展提供重要技术支撑。

;