专访戴俊彪:合成基因中国何以效率最高

用化学物质合成生命,人类正一寸寸向“造物主”的角色挪近。

2017年3月10日,美国《科学》杂志以特刊的形式发表了“人工合成酵母基因组计划(Sc2.0)”的里程碑式阶段性成果——继2014年美国科学家人工合成真核生物酵母3号染色体后,新的5条酵母人工染色体被攻克,来自中国的3个研究团队占据其中4条。

清华大学生命科学院戴俊彪实验室攻克的是目前酵母中最长的那条染色体。坐在中国科学院深圳先进技术研究院12楼休息区的沙发上,43岁的戴俊彪习惯性地泡了咖啡,准备接受澎湃新闻(www.thepaper.cn)的专访。

在一个小时的采访中,戴俊彪回忆了攻克该项课题的4年时间里,他经历的两位学生知难而退、实验遇阻停摆一年、测序结果糟糕等波折。2015年底,他终于将实验结果成文,投稿《科学》杂志,报告了实验室用创新的分级组装方法,合成酵母中最长的染色体——12号染色体。

按照自然规律合成酵母染色体就像改造二手房,在搭建时,需要把房子拆开来看看,在保证房子结构稳定的前提下,设计类似的东西。至于这项研究的意义,简而言之,人类已经可以在实验室里编写“生命密码”了,人造基因可以和野生型高度相似。

时间回拨到2012年4月的一天,作为基因合成领域的大佬级人物,美国科学院院士杰夫·博克(Jef Boeke)第一次来到中国。在清华大学南门外的一个会议室里,博克决心和来自各国的生物学家讨论如何实现酵母16条染色体的人工合成。最终,这次会议成为了Sc2.0项目的起点。

博克已经意识到,这项覆盖1200多万个碱基对[注:碱基对是一对相互匹配的碱基(即A—T, G—C,A—U相互作用)被氢键连接起来。]的工作如此浩瀚,以一己之力是无法完成的,那么发起一次类似“人类基因组计划”的国际项目似乎是个最佳的解决方案。

戴俊彪是那次会议的与会者,他还有一个身份是博克曾经的博士后。出生于江苏,在南京大学和清华大学完成本科和研究生教育后,戴俊彪赴美国爱荷华大学攻读博士学位,后来又以博士后身份辗转至约翰·霍普金斯大学博克的实验室,并在此期间获得该校医学院颁发的Albert Lehninger研究奖。

参与Sc2.0,加入到人工合成酵母染色体的大军中,这对于戴俊彪来说,是件顺理成章的事。2000年,一到美国,戴俊彪就开始和酵母打交道,一接触就是10多年。当主导Sc2.0项目的博克对如何加快进程一筹莫展时,戴俊彪对他说:“我帮你做最长的一条染色体。”

“12号是我最喜欢的一条染色体。”戴俊彪解释原因时脱口而出,“因为你去看,它实际上是酵母里面最长的一条染色体。”同样重要的是,12号染色体独一无二的“个性”吸引着他去一探究竟。

12号染色体上有一个特殊的区域,由编码核糖体RNA(核糖体是将mRNA翻译变成蛋白质的机器,由一些蛋白质和RNA组成)的基因重复排列构成。该基因不仅仅有着特异的表达调控方式,而且在不同的细胞中它可能重复150次,也可能重复100次。为什么会这样?是什么决定的?提起12号染色体有多特殊,戴俊彪的语速快了些。

好奇心是科学家探索未知最大的牵引,戴俊彪揽下了第12号染色体的合成任务。

拼接33块“砖头”途中,一波三折

“一开始我对这个项目非常乐观。”戴俊彪说,2011年,他以中共中央组织部第一批“青年千人计划”身份回到母校清华大学组建实验室。在那年9月入学的新生中,他挑了一位专攻酵母染色体合成项目的学生。

Sc2.0项目有较为统一的操作规范,将酵母的染色体划分为每30kb(千碱基对)为一段的“染色体砖块”,实验室的任务是将它们一块块由天然的染色体“替换”成由化学物质合成的人工染色体,一块块“人工砖块”最后“垒”成整条染色体。

戴俊彪面对的12号染色体有近1Mb(1Mb=1000kb)长,需要分为33个30kb长的“砖块”,覆盖100万左右个碱基对。按照Sc2.0的方法,合成时需要从头开始,按照先后顺序“垒砖块”。

前期的测试顺风顺水。戴俊彪对标准方法稍作修改就开始了第一个“砖块”的合成,只花了两周的时间。

“按这个计算的话,两个星期干一个,33个不需要多少星期就把它全部都弄完了,是吧?所以我们当时也设了目标,说我们争取在1-2年之内把这个项目整个都做完。”戴俊彪回忆说。

就在以为可以一路绿灯前往目的地时,戴俊彪遇到了路被堵住的问题。以字母ABCD依次标记染色体的“砖块”的话,戴俊彪在A、B、C上都没有遇到困难,“D碰到了一点点问题,E实际上是一个比较大的问题,然后F没问题,G也没问题,H是把整个项目停滞了差不多一年时间”。

之所以停,是因为Sc2.0的策略是“一旦哪个地方出了问题以后,一定要把它修改好了以后,你才能往下弄,做下一个”。这在2014年博克合成3号染色体(300kb)时没有展露问题,但一旦染色体增至3倍长,这种策略拖延进展、耗时耗力的缺点就出现了。

按照顺序合成到H砖块时,戴俊彪和学生举步艰难,每次一把人工合成的部分加入,放进细胞,酵母就停止生长了,或者“零零星星长出来几个很小的”。这意味合成的部分没有被整合进去,是失败的。

“那段时间大家压力挺大的,因为前面做了几个月还比较顺利,然后后面差不多有一年的时间,一点进展都没有,就整个全是在找各种各样的问题。”戴俊彪说,因为在H砖块上“问诊”一直出不了结果,有位学生选择放弃,转到别的实验室。

不能一直这么“憋”着,戴俊彪觉得不能继续等着,他开始设计分级组装的方法,“不如我们先跳过这一段(H),可以把这一段恢复为野生型(注:野生型指的是酵母原本天然的染色体)的,然后再往后做,就是先不管这一段。”毕竟,H砖块还只是第8块,后面未知的25块也可能有类似的问题。

戴俊彪整合了整个实验室的人力,分为五六个组,有的组负责在每个菌株中只将其中一个“砖块”替换成人工的,以此核查问题,有的组负责将没有问题的菌株合并在一起。

砖块终于拼接成一条全人工合成的染色体,戴俊彪说他们第一次合成后的想法是“总算一条弄完了,管他这上面有什么问题也好,反正都拼完了”,就去华大基因测序,看看和野生型的序列相不相符。

分析完一看,“哇,一塌糊涂”。因为偷懒,外源用作载体的DNA片段也掺和在酵母的染色体中,“嵌入了一些本来不应该存在的”。还有一个问题是,有点片段重复了,本来是30kB长的片段成了50kb。

“那时候又是一个巨大的打击,”戴俊彪说,“一看过去,整条染色体完全没法用。”

那就再推倒重来吧。他们找出了问题区域,针对性地重新构建,重新拼接,“非常小心地避免掉了之前的问题”,最终拿到了想要的结果。

问及拿到理想的测序结果时是惊喜还是意料之中,戴俊彪说:“总算搞定了,总算完成了,这么一种感觉。不是说特别惊喜,只是说这个石头终于放下来了。实验室小伙伴们的共同努力终于可以有了收获。”

戴俊彪实验室全家福,2016年摄于清华园。图片中间穿天蓝色T恤的是戴俊彪。

目前,其他几个团队已经开始借鉴戴俊彪团队的分级组装方法。戴俊彪说,自己这个“痛苦了很久”总结出来的经验或可成为Sc2.0的标准。

为什么是中国团队完成了66.7%?

截至目前,Sc2.0已经完成酵母16条染色体中的6条,中国团队独立完成4条,占任务完成量的66.7%。Sc2.0项目有全球10个高校、200来名科学家参与。为什么是中国团队而不是其他国家率先完成?

作为亲历者,戴俊彪告诉澎湃新闻(www.thepaper.cn),在他看来,主要的原因是“我们的动作快”,以及“我们国内投入的人会更多”。

人工合成酵母染色体从一个实验室开始转为国际项目,大约在2011年、2012年,Sc2.0项目依托于中国国家863计划“合成生物技术”重大项目而起。戴俊彪说,时任科技部基础司司长张先恩“看到合成生物学的趋势和方向”,推动合成生物学的各个项目,为Sc2.0项目的正式开始奠定了基础。2012年,张先恩还曾应邀三国六方合成生物学国际会议,作了“中国合成生物学展望”的演讲。

Sc2.0项目成立之初,每个团队会“认领”各自的项目,避免重复。戴俊彪说,在2012年在北京召开的首次会议上,中国团队很快做了决定,安排资金和学生着手做这件事。但国外一些团队“说我们要干这个事情,但是我要先申请来这个钱,才能再干。所以他们都会有一个比较长时间的。虽然说我要这条染色体,但真正开始做,中间差不多都有一年的时间。”

对于戴俊彪来说,2012年正是他回国,刚开始组建自己实验室的时期,受惠于比较充足的启动资金,他决定先将部分钱用于这个在他看来“挺有意思的项目”。

“我觉得这是一个很好的时机,刚成立自己的实验室,清华给了不错的支持。要是申钱来做的话,我到现在说不定还没有开始做这件事。”戴俊彪说。

而在人力的投入上,令戴俊彪印象深刻的是一张另一个中国团队——天津大学元英进教授团队的照片:组了5个队,每个队有12个左右的学生,除了7个研究生和1个博士生之外,全是本科生。“他们拍的照片挺酷的,”戴俊彪说,他们有时候会开玩笑说,“是放了一个连的军力上去,然后就把它做出来了。”

天津大学元英进教授团队。 Sc2.0官网 图

但在国外其他团队,戴俊彪透露,一条染色体的合成可能交给一个研究生和博士生完成,这会让“效率和速度非常非常慢”。

总结而言,戴俊彪说,“这是天时、地利、人和都有的时候,把它弄起来了。”

从本科生的“苦力”到机器人自动化生产

人类基因组测序的成本已经在近20年时间里,从30亿美元降至1000美元。戴俊彪则见证了合成基因的成本从1美元每个碱基对,降至如今批量时2-5美分一个碱基对。

一个染色体少则几十万个碱基对,如果找商业公司合成,按照1美元每个碱基对,是一笔昂贵的科研成本。有意思的是,为了让前期耗时耗钱的基础工作有更好的处理方式,在戴俊彪还是博克的博士后时,博克在约翰·霍普金斯大学开设了一门名为“Build-A-Genome”的课程。只要有基础生物学知识和操作技能,学生就可以选上这门课,每周15-20小时,合成750bp大小的DNA。

前期基础而繁重的“工匠活”交给本科生完成,这样的模式被认为是一种一箭双雕的方式。对于实验室而言,只需要买来成本价仅为10美分的短链DNA片段,而人力成本是零。这比商业公司开出的价格单(1美元每对)要低得多。对于学生而言,在实践操作的过程中学习合成生物学的基础知识点,也能在整个Sc2.0项目中留下自己的痕迹。

2007年至2013年,有42位来自计算机专业、生物工程、化学与生物分子工程、生物物理学的本科生完成课程,他们的照片和简介出现在Sc2.0的网站上。

值得一提的是,这种模式也为全球其他高校所用,比如天津大学将“Build-A-Genome”的模式搬至国内。此次,天津大学完成了酵母两条染色体的合成,背后有参与这个课程的61位本科生和研究生,在近4个月的时间内完成了2-4kb长的片段合成。

2013年,随着商业化基因合成产业的成本日愈下降,“Build-A-Genome”课程开始做出调整,由组建750bp长的DNA短链变为3kb长的DNA短块。

戴俊彪说,现在已经不再依赖本科生的“苦力”,因为商业化的成本甚至要更低。在他看来,可以预期的是,不久的将来,在谈论基因合成的价格时,不再是以一个碱基对为单位,而是一美元可以合成多少万的碱基对。

如同基因测序成本的瀑布式下降依靠测序仪的进化,基因合成成本下降也将受惠于自动化生产和芯片研发。一个正在走进现实的场景是,机械臂和机器人代替人力,控制芯片,自动化地批量合成基因。

甚至,在戴俊彪看来,将来人类不再临摹自然的“板书”基因,自己设计基因,也不是不可能。

合成基因大事表:

2010年,由美国遗传学家Craig Venter团队完成第一个由合成基因组支持存活的原核生物;

2011年,美国生物学家Jef Boeke团队合成单细胞真核生物酿酒酵母第9号染色体的右臂和第6号染色体左臂;

2014年,美国生物学家Jef Boeke团队合成第一条真核生物染色体——酿酒酵母的第3号染色体;

2017年,美国、英国、中国学者合成酿酒酵母的第2号、5号、6号、10号、12号染色体。

;