植物 CRISPR 基因组编辑技术的新进展
作者单位:华中农业大学 作物遗传改良国家重点实验室
摘要: 在过去的4年中,CRISPR/Cas9 基因组编辑技术成为生命科学领域的革命性工具,为植物学基础研究和农作物遗传改良提供了高效、快速而又廉价的遗传操作工具。利用 CRISPR/Cas9 系统可以实现精准的knock-out 和 knock-in 等遗传操作,也可用于靶向激活或抑制基因的表达。在 CRISPR/Cas9 被广泛地用于基因组编辑的同时,它的编辑能力、效率和精确度也在不断地改进和完善,特别是 CRISPR/Cpf1 系统的发掘和单碱基编辑技术的创建,使 CRISPR 系统正逐步成为一个理想的遗传工程技术平台。此外,利用 CRISPR/Cas9技术改良的农作物品种也已经涌现,这必将推动精准基因组编辑技术在农作物遗传改良中的应用和发展。
基因组包含了生物生长发育和生理功能的全部遗传信息,是开展生物学研究的出发点。近 10 年来,随着新一代 DNA 测序技术的发展,基因组测序的成本下降了近万倍 (www.genome.gov/sequencingcostsdata),越来越多的农作物完成了高质量的参考基因组的绘制。因此,读懂“基因组序列的―含义”并将之用于农作物改良成为“后功能基因组学”时代植物学研究的主要仸务。植物基因功能的解析和农作物的遗传改造需要进行各种遗传操作 (Genetic modification)。在过去的 20 年中,物理化学诱变、T-DNA 插入突变和基于 RNAi、artificial microRNA 的靶向基因抑制技术被广泛地用于拟南芥、水稻等模式生物的基因功能解析。自2010年TALEN(Transcription activator like effector nuclease)技术和2013年 CRISPR/Cas9 (Clustered, regularlyinterspaced, short palindromic repeat/CRISPR associated protein 9 system) 技术用于基因组编辑以来,对不同农作物进行遗传操作的能力有了前所未有的提高。这些技术不仅推动了生物学基础研究的发展,而且在疾病治疗、农作物育种、生物能源等方面都展现出巨大的潜力和产业化价值。
基因组编辑技术就是利用人工设计和改造的核酸酶对基因组进行精确的定点修饰,包括对基因组进行靶向基因敲入 (Knock-in)、基因功能敲除 (Knock-out) 以及有目的的片段替换。CRISPR/Cas9 的发现为生物学的基础理论研究和转化应用提供了简单、强大的基因组编辑平台,因此迅速成为遗传操作的主流工具。同时,CRISPR/Cas9 也一直以前所未有的速度发展和更新。本文旨在简要介绍 CRISPR/Cas9 相关技术的原理,重点介绍近两年出现的与植物相关的新技术,以及 CRISPR/Cas9 用于农作作物遗传改良的潜力及其面临的挑战,为 CRISPR/Cas9在农作物中的应用提供有益的参考。
1 .CRISPR/Cas9 靶向基因编辑的原理
1.1 CRISPR/Cas9 的工作原理
CRISPR/Cas 是细菌和古细菌中的一种适应性免疫系统,能特异地降解入侵噬菌体或外源质粒的 DNA,其中 CRISPR 是“成簇和规律间隔的短回文序列”的简称,而 Cas 是指与 CRISPR RNA 结合的蛋白。在 2012 年,Jinek 等解开了化脓链球菌 Streptococcus pyogenes 的 Ⅱ 型CRISPR/Cas9 系统作用机制,并证明Cas9 核酸酶 (本文专指 Strepcococcus pyogenes 的 Cas9)可以在一个人造的小 RNA 分子 (称为 gRNA,即Guide RNA) 的引导下去靶向切割 DNA 双链。
利用 Cas9/gRNA 标靶特定的 DNA 位点只需满足 2 个条件 (图A):
1) gRNA 的 5′端 20 nt(Nucleotides) 的引导序列 (称为Spacer或Guide sequence) 与靶DNA位点的序列 (称为Protospacer)互补匹配;
2) 靶位点必须存在 PAM (Protospacer-adjacent motif),其中使用最广的化脓链球菌Cas9 的 PAM 序列为 5’-NGG-3’。
在使用CRISPR/Cas9 进行基因组编辑时,一般用 Pol Ⅱ(RNA polymeraseⅡ,Ⅱ型 RNA 聚合酶) 启动子表达含核定位信号的 Cas9,用 Pol Ⅲ (RNA polymerase Ⅲ) 启动子表达 gRNA,Cas9/gRNA复合体识别靶 DNA 后在 PAM 前面的第 3 个和第 4 个脱氧核酸之间切割 DNA 双链,形成 DSB(Double stranded DNA break,双链 DNA 断裂)。与早期的 TALEN 和锌指核酸酶 (Zinc-finger nuclease) 两种靶向 DNA 技术相比,Cas9/gRNA更容易操作和实现,成本也更低,因此迅速成为主流的基因组编辑工具。
CRISPR/Cas9 系统在植物中的主要应用 图A
1.2 CRISPR/Cas9 的应用概况
1.2.1 基因组序列编辑
CRISPR/Cas9 靶向编辑基因组序列的原理是利用 Cas9 和靶位点特异的 gRNA 切割基因组,在设计的靶位点处形成 DSB (Double strandbreak),然后利用生物体内的 DSB 修复过程来对 DNA 序列进行修改(图A)。
1) 靶向基因敲除 (Knock-out)。
如图A所示,Cas9 和 gRNA 在切割靶位点后,形成的 DSB主要以 NHEJ (Non-homologous end joining)的方式进行修复,而 NHEJ 是一种易出错的修复方式,会在 DSB 的位置引入小的核酸插入或缺失(Insertion and deletion,indel)。Indel 的引入造成靶基因蛋白翻译产生移码,从而破坏基因功能。基于 CRISPR/Cas9 的靶向基因敲除技术最早在拟南芥、水稻、烟草、小麦、大麦、玉米、大豆、马铃薯、番茄等模式植物和重要农作物中建立,随后在各种不同的植物中都得到了验证。通过对 CRISPR/Cas9 编辑过的水稻和拟南芥材料进行多代观察和基因型检测,结果表明 CRISPR/Cas9 产生的突变可以稳定遗传到后代植株。除了通过引入 indel 外来敲除基因功能外,CRISPR/Cas9 还可以用来对染色体进行其他的遗传操作。比如,用 Cas9 和一对 gRNA来精确地删除一段染色体 DNA (图B)。在染色体上靶向切除特定片段对非编码 RNA或启动子区 (如 microRNA 或 cis-element) 的研究具有重要价值,因为这些区域很难通过小的 indel 来破坏其功能。此外,CRISPR/Cas9 甚至能用来创建染色体异常 (如大片段缺失、易位、倒位) 的突变体。比如,Zhou 等利用 CRISPR/Cas9 和一对gRNA 从水稻染色体上删除了 1 个 115–245 kb(Kilo base pairs) 大片段,其中包含了 2–3 个不同的基因簇。在过去的 4 年中,CRISPR/Cas9靶向基因敲除已迅速成为植物研究中最流行的反向遗传学研究工具。
CRISPR/Cas9 系统在植物中的主要应用 图B
2) 靶向基因敲入/替换 (Knock-in)。
在植物的染色体上定点插入或替换 (Knock-in) 一段序列一直是一个难以攻克的技术难题,而 TALEN和 CRISPR/Cas9 技术极大地降低了这一技术的难度。Knock-in 依赖的是 DSB 的同源重组修复(Homology-directed repair,HDR) 修复途径 (图A):当 Cas9/gRNA 切割靶位点后,如果细胞中有与靶位点序列同源的 DNA 供体 (DNAdonor) 片段时,位于供体 DNA 上的基因片段会通过 HDR 重组整合到 DSB 的位置。虽然植物原生质体中可以利用 CRISPR/Cas9 技术来实现 Knock-in 或靶向基因替换,但很难在稳定的植株获得成功。
目前,有两种比较通用的策略可用于提高植物 knock-in 的效率。一是利用小麦矮缩病毒WDV (Wheat dwarf virus) 为 DNA donor的载体,通过提高 donor DNA 的拷贝数,从而大幅度地提升 Knock-in 的效率。这一策略在两种主要农作物水稻和小麦中得到了验证,特别是在水稻中 Knock-in 的效率最高可达 19.4%。二是利用 Cas9 和一对 gRNA 从 DNA donor 上 “剪切”一段序列后,再“粘贴”到植物基因组的靶位点上。这一策略利用的是主导 DSB 修复的 NHEJ通路。在 2016 年,中国科学院遗传与发育生物学研究所的高彩霞和李家洋实验室合作,通过巧妙的靶位点设计,在水稻中利用 CRISPR/Cas9实现了这一“剪切/粘贴”式的靶向基因敲入和替换。在 CRISPR/Cas9 的基础上,这些新的策略为 knock-in 高效率地用于植物遗传改造提供了可能。
1.2.2 靶向基因转录调控
除基因组编辑功能以外,CRISPR 技术的高扩展性保证了这一技术可以与多种功能蛋白融合而行使其他遗传操作。这一技术的核心是借助 gRNA 靶向基因组上特定位点的能力,利用dCas9 (Dead Cas9,无DNA切割活性的Cas9) 和gRNA 将不同功能的效应蛋白运输到染色体上的特定位置发挥功能 (图C)。比如,将 dCas9与转录激活结构域 (Activation domain, AD) 融合,利用 gRNA 将 dCas9-AD 引导到启动子区域后就可以实现靶基因的转录激活。在这一技术中,往往需要多个 gRNA 同时靶向目的基因的启动子才能有效提高靶基因的表达。而另一个精妙设计的策略解决了这个问题:将 gRNAscaffold作为招募转录调控组件的平台来调控靶基因的表达。例如,将 MS2 (RNA 配体)融合gRNA,而 MS2 的特异结合蛋白 MCP 融合 AD片段,这样 dCas9/gRNA-MS2/MCP-AD 的复合体靶定在目的基因启动子上激活转录。这一技术的巧妙之处在于可以将多个 MS2 整合在gRNA scaffold 序列中,从而使用单个 gRNA 就能招募多个 MCP-AD 来有效地激活靶基因表达。与基于 CRISPR/Cas9 靶向基因转录激活类似,将不同的功能蛋白 (转录抑制、表观遗传修饰的蛋白元件) 用于 dCas9/gRNA 这一平台,就可以实现转录抑制或表观调控等不同的遗传操作。这些基因组编辑相关的衍生技术为生物学研究提供了更丰富、更便利的遗传学工具。
CRISPR/Cas9 系统在植物中的主要应用 图C
2 CRISPR/Cas9 技术 的优化
2.1 降低 CRISPR/Cas9 的脱靶
脱靶一直是 CRISPR/Cas9 技术的主要困扰。CRISPR/Cas9 基因组编辑技术诞生之际,即有报道 Cas9/gRNA 在动物细胞系中存在脱靶效应:一些与 gRNA 引导序列不完全匹配的 DNA 位点(脱靶位点) 也会被 Cas9 脱靶编辑,引入非预期的基因突变 (Off-target effects)。脱靶效应的存在便成为了 CRISPR/Cas9 最大的不足。为了解决这个问题,科学家们作出了很多积极的尝试。在早期的研究中,将 Cas9 点突变(D10A 或者 H804A) 后修饰为切口酶 (Cas9nickase,Cas9n) 或者将 dCas9 与 FokⅠ融合为1 个切口酶,这样需要设计 1 对 gRNA 靶定 1 个位点才能形成 DSB,将脱靶的概率降低了几个数量级。也有研究表明缩短 gRNA 的引导序列至 17–18 nt 可以降低脱靶风险;或者将Cas9 蛋白与其他 DNA-binding 结构域融合也可以有效地降低脱靶率。这些策略虽然大大降低了脱靶效应,但是也将这项技术复杂化,而且并没有从本质上改进 Cas9 的特异性。随着Cas9/gRNA 复合体的结构被解析,研究者们设计出具有高切割活性和高特异性的 Cas9 变异体,这些“高保真”版本的 Cas9 对 DNA 与 gRNA间碱基错配是零容忍的,可用来实现精准的遗传操作,基本上解决了对 CRISPR/Cas9 脱靶问题的困扰。
在植物 CRISPR/Cas9 基因编辑试验中,脱靶现象并没有动物中的严重,但也发现了个别脱靶编辑的现象,这可能是由于靶位点设计时未使用高特异性的 gRNA 引起的。全基因组序列分析的结果表明,拟南芥、水稻等基因组小、序列重复性不高的物种中,完全可以设计出足够的高特异性 gRNA 来编辑 90%的基因。目前已有许多生物信息学工具可以用于脱靶分析、设计低脱靶概率的 gRNA,如 CRISPR-PLANT、E-CRISP、CRISPR-P等。通过设计高特异性的 gRNA 或使用新型“高保真”版本的 Cas9,可望有效地消除 CRISPR/Cas9 脱靶现象对植物基因组编辑的影响。
2.2 优化 gRNA 的表达
CRISPR/Cas9 简单、强大的多位点编辑能力是其显著优点之一。实现多位点编辑需要同时表达多个 gRNA 分子,目前主要有 3 种策略来利用 1 个载体同时表达多个 gRNA。一是在质粒载体中克隆多个表达单元,每个单元含 1 个Pol Ⅲ启动子和 gRNA。第二种是利用 Csy4核酸酶将含多个 gRNA 的转录本切割成单个的gRNA,其中 gRNA 之间用 Csy4 的 RNA 底物连接起来。三是将生物体的内源转运 RNA(Transfer RNA,tRNA) 与 gRNA 融合,将多个tRNA-gRNA 结构串联排列为 1 个多顺反子,利用生物体内的 tRNA 加工酶来将此多顺反子切割成成熟的 gRNA,实现多位点编辑。除此之外,具有自我切割功能的核酶 (Self-cleavage ribozyme) 也可以用于多个 gRNA 的表达 。这些不同方法为植物遗传操作提供了成熟的多位点 CRISPR/Cas9 基因组编辑技术。
2.3 降低 PAM 的限制
DNA 靶 位 点 必 须 存 在 PAM 是 限 制CRISPR/Cas9 用于基因组编辑的主要因素。根据几种模式植物的参考基因组的序列分析,一般基因组上平均每 100 bp 有 6−11 个 PAM(5′-NGG-3′)。这一出现频率虽然已基本能够满足常规基因功能研究的需要,但是极大地限制了 CRISPR/Cas9 的应用范围。
为了消除或减弱PAM依赖性对CRISPR/Cas9的限制,需要寻找或创建识别不同 PAM 序列的CRISPR/Cas9 用于基因组编辑。在过去的 3 年,已有多个 CRISPR/Cas9 系统被发掘出来,极大地扩展了 CRISPR/Cas 靶向基因编辑的空间。此外,研究人员通过对最常用的化脓链球菌的 Cas9 进行工程改造,修改 Cas9 蛋白中与PAM 识别相关的氨基酸位点,得到了识别5′-NGAN-3′和 5′-NGNG-3′等不同 PAM 序列的Cas9 突变体,并已经用于植物基因组编辑。综合这些新进展,已有的 CRISPR/Cas9 工具基本具备了靶向全基因组的能力。
3 超越 CRISPR/Cas9
3.1 靶向单碱基编辑
在基因组编辑技术中,最常见的应用是通过 CRISPR/Cas9 在靶位点引入 indel,从而破坏靶基因的功能。但在农作物遗传改良的实践中,很难通过完全破坏基因功能来获得有育种或应用价值的材料,更多的是需要定向修改单个或几个碱基来改变基因的功能,从而定向改良作物的农艺性状。因此,高效率定向转换基因组的序列是 CRISPR/Cas9 技术用于遗传改良实践的关键,而单碱基编辑技术正满足了这一需求。
基于 CRISPR/Cas9 靶向编辑单个碱基的原理如图D所示,将 Cas9n (或 dCas9) 与胞嘧啶脱氨酶 (Cytidine deaminase) 融合,当 gRNA 引导融合蛋白到靶位点时,靶位点附近的胞嘧啶 C被脱氨酶转换为尿嘧啶 U,而 U 与胸腺嘧啶 T 的具有相同的碱基配对规则,在 DNA 复制或修复时U 会转换为 T,从而完成 C→T 的碱基转换。为了提高 C→U→T 的效率,在编辑工具中会加入相关元件来抑制 U→C 的回复修复。目前已有2 个构建成功的单碱基编辑工具:一是美国麻省理工大学的 David Liu 实验室构建的 BE (Baseeditor) 系统——由 dCas9 或 Cas9n 与哺乳动物的脱氨酶 APOBEC1 融合而得到;二是 dCas9或 Cas9n 与 AID (Activation-induced deaminase)融合得到的Target-AID、CRISPR-X和TAM系统。这些不同的单碱基编辑工具在具体的设计上略有差别,能够编辑的靶碱基的窗口也稍有不同,但在动物细胞中都能实现高效率的 C→T单碱基替换。
CRISPR/Cas9 系统在植物中的主要应用 图D
虽然利用 Cas9 介导的 knock-in 也可以实现单碱基的替换,但 HDR 的效率和实现的难易程度与 BE、Target-AID/TAM/CRISPR-X 等单碱基编辑工具无法比拟。在哺乳动物细胞系中同时编辑 APOE4 和 p53 两个基因上的单个碱基时,Cas9 介导的 HDR 的碱基转换效率最高不超过0.3%,而BE3系统的效率达到了惊人的58%−75%(APOE4) 和 3%−8% (p53)。最新的结果也表明,利用 CRISPR/Cas9 改造的单碱基编辑工具特异性非常高,没有检测到脱靶编辑。这些CRISPR 单碱基编辑工具,将基因编辑技术推向了一个新的高度,为 CRISPR/Cas9 技术用于临床治疗、基础研究及作物遗传改良奠定了重要基础。
由于单碱基编辑在作物遗传育种中有巨大的应用潜力,因此这些编辑技术被迅速地应用到农作物中。比如将 BE (Cas9n-APOBEC1)用于水稻、小麦和玉米,可以在 protospacer 的3−9 bp 的编辑窗口中实现 C→T 的精确替换,效率最高可达到 43.48%。而把 Target-AID 用在水稻中,通过对 ALS (Acetolactate Synthase) 基因进行单碱基替换,获得了耐除草剂的水稻材料。这些成功的示例初步展示了 CRISPR/Cas9单碱基编辑的巨大潜力。
3.2 基于 CRISPR/Cpf1 系统的基因组编辑技术
来自化脓链球菌的 CRISPR/Cas9 用于基因组编辑的巨大成功促使研究人员寻找和改造其他的 CRISPR/Cas9 系统来扩充基因编辑工具箱,目前最具潜力的是 CRISPR/Cpf1 系统,被认为是新一代基因组编辑工具中的佼佼者。2015 年美国麻省理工大学的 Zhang Feng 实验室首先发现了Ⅱ类 CRISPR 系统第 5 亚家族的成员Cpf1 核酸内切酶,并证实了来自氨基酸球菌属Acidaminococcus、毛螺科菌属 Lachnospiraceae和 弗 朗 西 斯 氏 菌 属 Franisella novicida 的AsCpf1、LbCpf1 和 FnCpf1 三个高度同源蛋白都具有 RNA 引导的 DNA 内切酶的活性,而且AsCpf1 和 LbCpf1 用于动物的基因组编辑效率接近原来的 CRISPR/Cas9 系统。
与 Cas9 比较,Cpf1 在基因组编辑中具有以下几个优势:1) Cpf1 的引导 RNA 更短,但引导序列 (即 DNA 靶位点) 更长 (~24 nt);2) Cpf1的特异性优于 Cas9,在脱靶分析实验中没有检测到 Cpf1 的脱靶现象;3) Cpf1 可以将CRISPR RNA array 切割成多个引导 RNA,更容易实现多位点编辑;4) Cpf1 识别的 PAM 为5′-TTTN-3′ (AsCpf1 和 LbCpf1) 和 5′-TTN-3′(FnCpf1),极大地扩充了基因组编辑的范围;5)Cpf1 在进离 PAM 的 protospacer 区形成 5 个碱基突出 (Overhang) 的切口,形成的突变类型与Cas9 不同,更易于引入 indel,从而提高 knock-out的效率。
Cpf1 的这些特点使其在基因组编辑中更具优势。因此基于 CRISPR/Cpf1 的基因编辑系统迅速被用于水稻和拟南芥等模式生物的基因组编辑和靶向基因转录调控。水稻中利用CRISPR/Cpf1 系统靶向基因敲除的效率与原有CRISPR/Cas9 技术没有显著差别。CRISPR/Cpf1系统简单易行的多基因编辑能力也在水稻中得到了验证。此外,CRISPR/Cpf1 也可以改造为靶向基因调控的工具,在拟南芥中实现了靶向基因表达抑制。总的来说,CRISPR/Cpf1将是媲美甚至超越 CRISPR/Cas9 的植物基因组编辑平台。
4 基因组编辑用于农作物遗传改良
虽然 CRISPR/Cas9 基因组编辑技术成为植物遗传操作首选工具的时间很短,但在农作物的遗传改良中已展现了巨大的应用价值。比如在小麦中,利用基因组编辑技术精确地靶向突变 MLO 基因的 3 个拷贝,直接获得了对白粉病具有广谱抗性的小麦材料;在水稻中,利用 CRISPR/Cas9 系统在温敏核雄性不育基因TMS5 中引入了特异性突变,并开发了新的不育系材料,有望加速温敏核雄性不育系在水稻杂交育种中的应用。CRISPR/Cas9 也被植物学家们改造为抵抗病毒的新工具,在拟南芥、烟草中利用 Cas9 和靶向双生病毒的 gRNA,实现了植物对靶病毒的免疫。随着CRISPR/Cas9技术的快速扩张,越来越多基因编辑的农作物将进入实际应用阶段。
DNA-free 基因组编辑技术的建立和成熟,将进一步推动 CRISPR/Cas9 技术用于农作物遗传改良的步伐。DNA-free 基因组编辑是指将预先体外表达的 Cas9 蛋白 (或 Cpf1) 和合成的gRNA 直接转入植物细胞完成对靶基因的编辑,然后将编辑的细胞再生出完整的植株。由于整个过程不涉及仸何外源 DNA,因此除了编辑的靶位点外,不会产生额外的遗传修饰。此技术最早在拟南芥、烟草、莴苣和水稻 4 种植物体原生质体中得到了验证。随后,在玉米、小麦等关键粮食作物中建立了DNA-free的CRISPR/Cas9基因编辑技术。DNA-free 技术将有可能进一步消除公众对基因组编辑农作物的担忧,有望加速 CRISPR/Cas9 技术在作物遗传改良中的应用。
基因组编辑作物的出现也促使监管部门重新审视 CRISPR/Cas9 和 TALEN 等技术所改良的农作物品种,特别是它们与传统转基因作物间的不同。美国农业部明确表示基因组编辑改良的蘑菇和土豆品种,由于最后产品中无外源 DNA,因此可等同于传统育种得到的农作物品种。在 CRISPR/Cas9 技术快速发展并被广泛用于不同作物的今天,如何管理基因组编辑技术改良的农作物新品种,将是一个重要的议题。
5 展望
CRISPR/Cas9 技术的出现提供了一个简单、廉价、精准的遗传操作平台,不仅能为基础研究提供强大支持,也将加速功能基因组学研究成果向产品的转化,为农作物遗传改良注入新的动力。