单碱基基因编辑系统的应用和展望

摘 要:基因编辑技术是近年来取得突破性进展的颠覆性技术之一。CRISPR/Cas9 基因编辑系统简便、高效,被广泛应用于基因功能研究和利用。尽管 CRISPR/Cas9 可以高效靶向目的基因,但其定点修饰依赖于效率低下的同源重组机制,因此精准编辑基因的能力有待提高。单碱基编辑技术(base editor,BE)通过将Cas9切口酶(Cas9 nikase, Cas9n) 或无核酸酶活性的 Cas9(nuclease dead Cas9, dCas9)与胞嘧啶脱氨酶形成融合蛋白,并通过 sgRNA(单链向导 RNA) 将融合蛋白靶向靶位点,在不切割双链 DNA 的情况下对靶基因位点的单个碱基进行胞嘧啶 C→胸腺嘧啶 T 或鸟嘌 呤 G→腺嘌呤 A 的精准编辑。目前,单碱基编辑技术已在植物、动物以及人细胞中进行了高效的基因定点突变,在 农业、生物医学研究甚至基因治疗中有广泛的应用前景。本综述就单碱基编辑系统的发展和应用进行回顾和展望。

1 基因编辑的介绍

基因组编辑(简称为基因编辑)技术是利用人工核酸酶对基因组进行靶向修饰的遗传工程技术, 是当今生命科学领域的研究热点。人工核酸酶主要包含锌指核酸酶(zinc finger nuclease, ZFN)、TALEN (transcription activator-like effector nucleases)核酸酶以及 CRISPR/Cas9(clustered regularly interspersed short palindromic repeats)系统的 Cas9 酶,其中 TALEN 技术和 CRISPR/Cas9 技术分别在 2012、2013 和 2015 年被《科学》杂志评为十大科学突破之一。利用这些技术,人们可以根据自身研究的需求 对感兴趣的基因进行敲除或过表达等操作,进而研究基因的功能和调控机制。CRISPR/Cas9 基因编辑 系统由于设计简便及高效的特点,已被广泛地运用到农业和生物医学研究。CRISPR/Cas9 基因编辑系 统虽然提高了基因敲除及定点修饰(包括定点突变及基因插入等)的效率,但是基于同源重组机制的 基因定点突变效率仍然偏低。为了提高定点突变的效率,一项结合 CRISPR/Cas9 和胞嘧啶脱氨酶的 单碱基编辑系统被相继报道。利用该系统可以在不产生双链 DNA 断裂的情况下,利用 sgRNA 将 Cas9- 胞嘧啶脱氨酶-尿嘧啶糖基化酶抑制子三者构成的融合蛋白靶向与 gRNA(sgRNA 中与目标 DNA 互 补配对的序列)互补配对的靶位点,并将该靶位点的胞嘧啶(C)的氨基去除,从而使得 C 变成尿嘧 啶(U),随着 DNA 的复制,U 又会被胸腺嘧啶(T)替代,最终实现单碱基 C→T 的精确、高效突变。 单碱基编辑技术为基因编辑技术的研究和应用增添了一种重要的工具。

2 CRISPR/Cas9 系统

CRISPR/Cas9 系统是存在于细菌和古细菌中的一种免疫防御机制,用来抵抗噬菌体以及外源 DNA 的入侵,基于 CRISPR 系统开发而来的基因编辑系统已经被广泛地运用于动物、植物和人细胞的基因编辑。CRISPR/Cas9 基因编辑系统的核心是一个 RNA-蛋白复合物,由能与基因组中靶 DNA 序列互补结合的 sgRNA 和 Cas9 核酸酶两部分组成。当该复合物与靶位点结合之后,会 激活 Cas9 的核酸酶活性,从而切割靶 DNA,产生双链断裂(DSB)的 DNA 损伤。DSB 进一步激活 细胞内的 DNA 损伤修复机制,主要包括易错的非同源末端连接(nonhomologous end joining, NHEJ) 以及高保真的同源重组修复(homologous recombination,HDR)。非同源末端连接的修复方式会在靶位点处产生 DNA 片段的插入或缺失(indels),导致移码突变,从而造成靶基因的功能丧失,成为无效等位基因(null allele)。当通过同源重组的方式进行修复时,需要内源的同源序列或者外源导入的同源序列作为修复模板,在靶位点处敲入外源片段或引入点突变。但是,在细胞中,同源重组的效率远远地低于非同源末端连接,导致靶位点处修复结果不可控,并倾向于产生核苷酸的插入和 缺失。此外,利用该系统进行基因编辑可能会产生脱靶效应,在基因组非靶向位置诱发 DSB,影响脱靶位点基因或附近基因的正常功能。

3 单碱基基因编辑系统的组成

基于 CRISPR/Cas9 基因编辑系统,2016 年 4 月,哈佛大学生物化学家 David Liu 组率先在《自然》 杂志上报告了一种新的基因编辑工具—单碱基编辑系统。同年,日本神户大学 Akihiko Kondo 组和我国上海交通大学的常兴组先后发表了类似的研究报告。单碱基编辑系统主要由 sgRNA 和融合蛋白两部分组成,其中融合蛋白一般由改造的 Cas9 蛋白、胞嘧啶脱氨酶和尿嘧啶糖基化酶抑制子三 者构成,而常兴组的融合蛋白仅包含 Cas9 和胞嘧啶脱氨酶两部分。sgRNA 通过与靶位点互补配 对,引导融合蛋白结合到靶位点发挥作用。融合蛋白中的胞嘧啶脱氨酶能够使非互补链中相应的胞嘧啶 C 经脱氨基作用转变为尿嘧啶 U,而 DNA 复制进一步使得 U 被 T 代替,而互补链上原来与 C 的互补碱基鸟嘌呤 G 将会变成腺嘌呤 A,而尿嘧啶糖基化酶抑制子则能够抑制 U 的切除,最终实现非互补链上的 C 替换为 T 和互补链上 G 替换为 A 的精确编辑。

根据融合蛋白中 Cas9 蛋白突变体的不同,可以将该系统分为两类,一类是选用了无核酸内切酶活性的 dCas9,选用这种蛋白的单碱基编辑系统进行编辑时不会造成切割靶 DNA;另一类是选用了有单链 DNA 切口酶活性的 Cas9n,选用这种蛋白的单碱基编辑系统进行编辑时会在靶基因位点的一条 DNA 单链产生切口,再以互补链为模板进行合成修复。由于 Cas9n 和 dCas9 仍保持与 sgRNA 结合的能力,但均不会引起双链 DNA 的断裂,从而抑制了由 NHEJ 介导的 DNA 片段的插入或缺失的发生。

目前该系统中常用到的胞嘧啶脱氨酶为大鼠的 APOBEC1(apolipoprotein B mRNA-editing enzyme catalytic polypeptide-like protein )、 七鳃鳗 (sea lamprey) 来源的激活诱导性胞嘧啶脱氨酶 (activation-induced cytidinedeaminase, AID)类似物(PmCDA1)及人源的 AID(hAID)。David Liu 组首先比较了四种胞嘧啶核苷脱氨酶的效率,发现 rAPOBEC1 效率最高。利用 rAPOBEC1 酶,他们系统地研发了第一代单碱基编辑系统 rAPOBEC1-XTEN-dCas9(base editor 1,BE1)。David R Liu 组在此基础上开发了第二代和第三代单碱基编辑系统 rAPOBEC-XTEN-dCas9-UGI ( BE2 ) 和 rAPOBEC-XTEN-Cas9n-UGI(BE3)。而 Akihiko Kondo 组也单独开发了 dCas9-PmCDA1-UGI 和 Cas9n-PmCDA1-UGI系统,常兴组则开发了基于人源AID和dCas9的dCas9-AIDx 碱基编辑系统。

单碱基编辑系统只能将在胞嘧啶核苷脱氨酶活性位点附近的 C 脱氨基,这个区域称为活性窗口。通常胞嘧啶脱氨酶 rAPOBEC1 的活性窗口为 5 个核苷酸,为距离 PAM 最远端数起的第 4-8 位核苷酸,这样的话就会使活性窗口中的非靶向的碱基也会发生替换作用。David R Liu 试图通过三种方式来缩短活性窗口,提高基因编辑的精准性。首先,将 APOBEC1 和 Cas9 之间的连接蛋白从 XTEN 换成不同数量的 GGS 重复序列,他们发现这样并不能够缩小单碱基编辑系统的活性窗口。其次, 使用 15 nt 到 20 nt 长度不等的 gRNA 也没有得到稳定地缩短活性窗口的效果,而使用长度更短的 gRNA 会使得单碱基编辑系统的活性明显降低。最后发现通过对胞嘧啶脱氨酶进行突变,可以降低酶的活性、改变底物的结合、底物的构象,或者直接降低底物进入胞嘧啶脱氨酶活性区域的能力,从而缩小单碱基编辑系统的活性窗口。他们针对大鼠 rAPOBEC1 重要的催化位点 W90 分别做了 3 种 突变(W90A,W90Y 和 W90F),结果发现 W90 突变成 A 后,该系统失去了催化活性,而突变成 Y 2017年9月 世界科技研究与发展科技前沿与进展或 F,只是轻微地降低了编辑活性,但是却可以缩小活性窗口,精准地编辑 2-3 个胞嘧啶核苷。他们后来又对 rAPOBEC1 的催化位点 R126 跟 R132 分别做了突变,发现 R126E 和 R132A 突变同样可以 将活性窗口缩小为 3 个胞嘧啶核苷。同时针对脱氨酶的结合位点和催化位点做 W90Y、W126E 和 W132E 的 3 个位点突变,结果显示在平均编辑效率只降低了 2.9 倍的情况下可以将编辑活性窗口精确 到 1 个胞嘧啶核苷,提高了编辑的精准性。

目前常用的化脓性链球菌的 Cas9(SpCas9)蛋白只能识别含有 NGG 或 NGA 的 PAM(Protospacer adjacent motif)序列的靶位点,限制了单碱基基因编辑系统的靶向范围。为了扩大剪辑编辑系统的靶 向范围,David R Liu 通过将金黄色葡萄球菌的 Cas9(SaCas9)、SaCas9 突变体(SaCas9-KKH)、SpCas9 突变体(SpCas9-VQR、SpCas9-EQR、SpCas9-VRER)替代 SpCas9,扩大了碱基编辑系统识别的 PAM 序列的范围(NGG、NGA、NGAN、NGAG、NGCG、NNGRRT 和 NNNRRT),拓展了碱基编辑系统的应用范围。

4 单碱基基因编辑系统的应用

4.1 单碱基基因编辑系统在人类疾病治疗方面的应用

来自上海交通大学的常兴课题组率先开发了 dCas9-AIDx 碱基编辑系统,并将其应用到肿瘤研究中。在肿瘤疾病治疗过程中,基因上特定位点的碱基突变会使部分肿瘤细胞对抗肿瘤药物产生耐药性, 如在慢性髓系白血病(chronic myloid leukemia, CML)患者的治疗中,常使用伊马替尼药物抑制癌细 胞中 BCR-ABL 激酶的活性,从而抑制白细胞的过度增殖。但是,在治疗过程中,癌细胞会通过特定基因序列点突变(如常见的 T315I 突变)后产生耐药性,这也是目前肿瘤治疗的一大障碍。针对这 个问题,常兴课题组在 CML 患者来源的 K562 细胞系中表达了 dCas9-hAIDx 的融合蛋白,由于没有使用 UGI,因此 AIDx修饰的胞嘧 C 及互补的鸟嘌呤 A 可以随机地向其它三种碱基转变。他们使 用 sgRNA 文库将 dCas9-AIDx 靶向到 ABL 基因的第 6 个外显子,诱导点突变的发生。通过用伊马替尼药物筛选,将伊马替尼耐药的细胞与筛选前细胞的 ABL 的第 6 个外显子进行深度测序分析,发现 了 10 个与伊马替尼耐药相关的基因突变位点,包括了在临床中已被证实的 T315I 突变。该研究证明,可以利用此系统筛选肿瘤细胞产生耐药性的突变,探究肿瘤疾病的耐药机制,开创了筛选肿瘤耐 药突变的新方法,结合第二代测序技术在临床中的应用,将有助于癌症病人耐药的早期发现,提高癌症病人的生存率。

4.2 单碱基基因编辑系统在动物模型方面的应用

目前,大多数关于单碱基编辑系统的研究报告主要基于细胞实验,而其在动物模型开发中的应用将有利于研究人员深入研究疾病发生和发展的机理。韩国首尔大学 Jin-Soo Kim 组率先发表了他们将 rAPOBEC-XTEN-Cas9n-UGI(BE3)系统运用于小鼠疾病模型制备的研究成果。针对小鼠的抗肌萎缩蛋白基因 Dmd 以及酪氨酸酶基因 Tyr,分别设计了特异识别的 sgRNA,通过显微注射 sgRNA 和 rAPOBEC1-XTEN-Cas9n-UGI 融合蛋白的 mRNA 或者电转染 sgRNA 和 rAPOBEC1-Cas9n-UGI 蛋白的 复合物的到小鼠受精卵。在所获得的 9 只 Dmd 的 F0 代小鼠中,有 5 只小鼠是产生了靶位点的碱基突 变,包括一只纯合子突变小鼠(CAG>TAG)。进一步通过免疫染色发现,这只纯合子 Dmd 突变小鼠 几乎检测不到该蛋白的表达。而通过电转染 gRNA 和 rAPOBEC-XTEN-Cas9n-UGI 融合蛋白的复合物, 产生了 7 只 Tyr F0 后代小鼠中均检测到靶基因突变,包括 3 只纯合子 Tyr 突变小鼠。同时,Jin-Soo Kim 等还在子代小鼠中发现了部分小鼠的靶位点发生了碱基删除。

同一时间,中山大学黄军就课题组也利用单碱基编辑系统研究了该技术在制备小鼠疾病模型中的 效率。与 Jin-Soo Kim 团队不同,他们利用保真性更高、且无核酸酶活性的 Cas9 突变体 dCas9-HF2(D10A/N497A/R661A/H840A/Q926A/D1135E) 来 构 建融合蛋白rAPOBEC1-XTEN-dCas9-HF2-UGI(HF2-BE2)从而避免了 Cas9n 对靶 DNA 的切割,降低碱基编辑系统的脱靶效应 。 针对 Tyr 基因 , 该课题组设计了2条 sgRNA ,分别与 rAPOBEC1-XTEN-dCas9-HF2-UGI 的 mRNA 注射到小鼠受精卵中。通过检测胚胎的基因型,发现 HF2-BE2 在碱基编辑的效率可以高达 50%(22/44),并产生 1 个纯合的突变胚胎。将注射后的胚胎移 植到假孕鼠中,他们发现两条 sgRNA 产生突变 F0 代小鼠的效率分别为 18.2%(2/13)和 63.6%(7/11), 其中有 4 只 F0 代小鼠的皮毛出现黑白嵌合现象,另外还有 1 只小鼠皮毛完全白化,从而在分子水平 及表型上证明了 HF2-BE2 系统能高效编辑靶基因,并获得无嵌合现象的后代。与 Jin-Soo Kim 的发现 2017年9月 世界科技研究与发展科技前沿与进展类似,黄军就课题组也发现了碱基编辑系统会在胚胎中产生碱基的缺失,并首次报道了在小鼠胚胎中 由碱基编辑系统诱导产生的靶位点处的碱基插入以及临近位点的脱氨基。由于所用的 dCas9-HF2 不具有核酸酶活性,他们认为,碱基的插入和缺失是由于胞嘧啶脱氨基后产生的 U 被碱基切除修复机制识别,并被切除从而产生无碱基位点,无碱基位点再进一步转化成 DNA 双链损伤,从而导致碱基插入和缺失的产生。

以上两项研究结果充分地证明了单碱基编辑系统能高效地用于制备疾病动物模型,但仍需进一步优化来提高特异性及降低碱基插入和缺失的产生。

4.3 单碱基基因编辑系统在植物方面的应用

转基因技术在改良作物性状方面已经做了大量的工作,但由于外源基因的导入和公众科普的缺乏, 使得转基因作物的推广和应用存在较大的难度。作物在漫长的人工选育过程中,人类通过人工选择的方式定向选育具有优良性状的基因突变株,但该过程耗时、耗力且不可控。利用同源重组技术,可以获得定点修饰的优良植物株,但由于同源重组的效率太低,因此可行性不高。单碱基编辑技术在人细胞中高效编辑单个碱基的结果,提示可以通过该系统在农作物中的进行定点可控的基因编辑,进而快速、高效地获得优良性状的植株。

中科院的高彩霞团队率先成功地将单碱基编辑技术运用到三大重要农作物小麦,水稻和玉米的性状改良上,并且取得了国际瞩目的影响。她们构建了密码子优化的 rAPOBEC1-XTEN-dCas9n-UGI 和 rAPOBEC1-XTEN-dCas9 -UGI 两种融合蛋白,通过针对三大农作物共 7 个基因位点进行单碱基编 辑实验,结果发现选用 Cas9n 可以获得较高的单碱基编辑效率。研究还发现在作物中胞嘧啶核苷脱氨酶的作用活性窗口为 7 个核苷酸序列,从距离 PAM 最远端数起的第 3 到第 9 位核苷酸,这相对于在动物细胞中的编辑窗口更广。她们还尝试采用土壤杆菌为载体,携带 Cas9n-XTEN-rAPOBEC1-UGI 融合蛋白和 sgRNA,编辑水稻内一种衰老控制基因 OsCDC48。研究结果显示单碱基编辑效率在 5.0%-32.5%,靶位点处没有发现核苷酸序列的随机插入或缺失,而且预测可能的脱靶位点处也没有发 现突变。同一时间,中科院上海生命科学研究院的朱健康团队和中国农业科学院作物研究所的夏兰琴 团队也分别报道了运用单碱基编辑系统对水稻基因进行单碱基编辑。这三个独立的研究表明, 单碱基编辑系统可以在农作物中取得高效的编辑效率,为改良作物品种带来新希望。

最近,美国农业部官方宣布基因编辑的部分玉米、土豆和黄豆新种是非转基因产品,不受转基因法规监管。因此,我国需要加大对基因编辑技术育种的支持力度,这将会使我国在育种领域获得国际领先的地位。

5 单碱基基因编辑系统目前仍存在的问题

单碱基编辑系统能够在不引起双链 DNA 断裂的情况下,由 gRNA 靶向到靶位点,利用胞嘧啶核苷脱氨酶进行碱基编辑,是新一代基因编辑工具。目前该系统仍然存在一定的缺陷。

第一、由于酶功能的限制,目前单碱基编辑系统只能实现单个碱基 C→T 或 G→A 的编辑,限制了碱基编辑系统的应用。

第二、受到 PAM 识别区域的限制,单碱基基因编辑的靶向范围有限。可以利用 SaCas9、Cpf1 等核酸酶及其突变体替代 SpCas9 可以进一步拓展单碱基编辑系统的识别靶点范围。

第三、单碱基编辑系统仍然会导致靶位点产生极少量 DNA 序列插入或缺失。虽然目前的单碱基编辑系统均不能切割靶 DNA 的双链,但 Jin-Soo Kim 组利用 Cas9n 蛋白介导胚胎的单碱基编辑时发 现靶 DNA 位点会产生随机 20bp 的缺失。高彩霞团队在编辑农作物的报告中同样使用了 Cas9n, 也发现了 0.01%-0.22%的插入缺失(indels)突变。Jin-Soo Kim 组推测这些 indels 的产生是由于 Cas9n 切割单链 DNA 引发的。黄军就团队为了避免单链 DNA 切割,使用了 dCas9-HF2 酶介导单碱基编辑, 但其结果仍然发现靶位点存在少量的 indels。因此如何避免或降低 indels 的发生仍需进一步的研究。

第四、单碱基编辑系统的活性窗口仍然较大。目前研究结果表明,在针对靶基因位点进行编辑时会导致临近的 C 碱基也发生突变。此外,单碱基编辑系统中胞嘧啶核苷脱氨酶本身就具有结合 DNA 进行脱氨基的作用,如 AID 酶会倾向结合 WRC(W=A/T,R=A/G)序列,可能会在细胞中引起脱靶效 应。已有的研究显示,定位在细胞核内的 APOBEC3B 酶的过高表达可以作为细胞发生癌变的指标之 一,暗示着导入大量外源的胞嘧啶核苷脱氨酶可能会存在一定的安全隐患。

第五,单碱基编辑系统的脱靶效应。Jin-SooKim 开发了 Digenome-Seq.技术,在体外比较了靶向 2017年9月 世界科技研究与发展科技前沿与进展 EMX1 和 HBB 的单碱基 BE3 编辑系统和 Cas9 酶的特异性,发现 BE3 单碱基编辑系统的脱靶位点远 远少于 Cas9 酶,但在细胞内的实验还是发现单碱基编辑系统存在脱靶效应。最近,David R Liu 团队通过用利用具有更高特异性的 Cas9n-HF1(D10A/N497A/ R661A/Q926A/D1135E)替代野生型的 Cas9n 开发了 HF1-BE3 单碱基编辑系统。他们发现 Cas9n-HF1 能提高单碱基编辑系统的特异性。有 意思的是在 Cas9-HF1 酶不切割的位点,Cas9n-HF1-BE3 仍然有脱靶效应,说明 Cas9n-HF1-BE3 的特异性有可能比 Cas9-HF1 酶差。

6 总结与展望

单碱基编辑系统自出现以来,被证明了可以在人细胞、动物和植物中进行高效的单碱基编辑。尽管目前该系统还存在一些缺陷,但通过优化可以提高其效率、特异性和安全性。比如通过对胞嘧啶核苷脱氨酶的突变优化,有望在保持它催化活性的情况下缩短它的活性窗口,从而使编辑更加精准。 另外还可以通过在 sgRNA 的 5’端加上 GG 序列,或者通过用蛋白或者 mRNA 来替代表达载体,都可以降低碱基编辑系统的浓度及作用时间,提高剪辑编辑系统的特异性。针对高浓度的胞嘧啶脱氨酶导入细胞核可能会产生非靶向突变的安全隐患,可以将胞嘧啶核苷脱氨酶分割到两个载体中表达, 只有当两部分都由 sgRNAs 引导到靶位点才能二聚化形成具有活性的胞嘧啶脱氨酶,从而降低脱靶的 风险。总而言之,单基因编辑技术已经在人疾病研究、人类疾病相关动物模型制备、动物和植物育种等方面显现出巨大的潜力,该技术的进步将推动我国及全世界在生命科学研究、农业生产和生物医药等领域的快速发展。

;