水稻功能基因组研究未来
张启发实验室的水稻试验田。图孙滔
(中国农业科技导报,肖景华,吴昌银,张启发)水稻在农作物中基因组最小,并与玉米、大麦及小麦等其他禾本科粮食作物存在广泛的共线性,已成为禾谷类作物基因组研究的模式植物。此外,水稻中有高效成熟的遗传转化体系,拥有丰富的种质资源,研究历史悠久。自1998 年启动国际水稻基因组测序计划以来,水稻基因组和功能基因组研究取得了巨大的进展。伴随着新一代高通量、高精度测序技术的发展,水稻功能基因组学的研究正不断深入,并开始推动作物遗传育种理念和育种技术手段的革新。
水稻和拟南芥分别是单子叶和双子叶基因组研究的模式植物。拟南芥全基因组测序于2000年底完成,2001 年国际上启动了拟南芥功能基因组研究计划,目标是揭示全部基因的功能,全面阐明拟南芥的生物学基础。
水稻是第一个完成全基因组测序的作物。水稻基因组的精确测序于2004 年完成。根据2011 年10 月发布的最新注释,水稻基因组大小约为373Mb, 预测编码55 986 个基因,其中39 045 个非转座子基因编码49 066 种转录本,16 941 个转座子基因编码17 272 种转录本。随着研究的深入这些预测数据还将不断的发生变化。中国、韩国、美国、日本、澳大利亚、法国、荷兰以及位于菲律宾的国际水稻研究所等都实施开展了水稻功能基因组研究的计划,包括构建功能基因组研究的技术平台和大规模的功能基因组研究,取得了许多重大进展。
1998 年,我国作为主要发起和参与国参与了国际水稻基因组测序计划(IRGSP)。2002年完成了超级杂交稻亲本籼稻9311 的全基因组草图和籼稻广陆矮第四号染色体的精确图谱的绘制。2005 年,IRGSP 公布了粳稻品种“日本晴”的全基因组精确序列。继完成水稻基因组精确测序后,我国适时启动了水稻功能基因组研究,“九五”末期开始水稻突变体库的构建工作,2002 年启动水稻功能基因组研究重大专项,“十一五”和“十二五”水稻功能基因组获得了国家的连续支持。
水稻功能基因组研究的技术平台
水稻突变体库资源利用突变体来分离和鉴定基因是最直接有效的方法,构建突变体库是功能基因组研究的重要内容。华中农业大学、中国科学院上海植物生理研究所和中国科学院遗传与发育生物学研究所等单位共创建水稻插入突变体约27 万株系,分离得到T-DNA 和Tos17的侧翼序列总数已达到96 437 条。突变体材料和数据实现了全球共享,对国内外水稻功能基因组研究起到了很大的支撑作用。
水稻全基因组表达谱利用Affymetrix 全基因组表达芯片,系统地完成了优良杂交稻汕优63 及其亲本珍汕97 和明恢63 全生育期和不同胁迫条件(低氮、低磷、干旱和低温等)的全基因组表达谱分析, 建成了表达谱数据CREP(collection of rice expression profiles)的信息平台(http:/ / crep. ncpgr. cn/ )。
全长cDNA 文库全长cDNA 文库提供了覆盖基因全长的mRNA 的反转录序列,在确定基因编码区域、分析转录和翻译水平上基因的调控及基因的表达等方面发挥着不可替代的作用,分离克隆基因的全长cDNA 成为水稻功能基因组研究的重要平台之一。粳稻品种日本晴已经有38 000 全长cDNA 克隆的信息可以在KOME页面检索到。中国水稻功能基因组研究主要致力于籼稻品种的全长cDNA 分离。中科院国家基因研究中心公布了籼稻品种广陆矮4号的10 081 条全长cDNA 序列和明恢63 的12 727条全长cDNA 序列, 收录于RICD网站( http:/ / www. ncgr.ac. cn/ ricd/ )。同时还新收录了非洲栽培稻2 045条全长cDNA 序列。水稻全长cDNA 文库序列的建立, 极大地促进了基因克隆的进程。研究者们不仅获得了大量基因序列的结构信息,对于比较不同品种基因表达差异,基因功能和表达蛋白的分析具有较大的意义。
新一代测序技术在基因功能分析中的运用我国科学家率先开发了基于新一代测序技术的高通量基因型鉴定方法,与目前广泛应用的分子标记相比,新方法在速度上加快了20 倍,在精度上提高了35 倍。完成了明恢63 和珍汕97的全基因组重测序,构建了包含25 万个SNP 标记的明恢63 和珍汕97 杂交分离群体238 个重组自交系的超高密度遗传连锁图。基于以第二代测序仪为基础的高通量基因型分析平台,我国科学家成功开展了水稻全基因组关联分析工作。
中国科学院国家基因研究中心完成了中国水稻517 个地方品种的低丰度测序,构建了一套高密度的水稻单倍体型图谱。2011 年底又完成了950 份较有代表性的水稻品种的重测序,利用构建的水稻高密度基因型图谱开展抽穗期和产量性状的全基因组关联分析[10] 。2012 年研究人员获得了来自446 个地理上不同的普通野生稻和1 083个栽培籼稻和粳稻品种的基因组序列,并绘制出水稻全基因组遗传变异的精细图谱,并据此开展了栽培稻驯化研究。
重要农艺性状功能基因
水稻功能基因组项目实施以来,分离克隆了一大批控制水稻高产、优质、抗逆和营养高效等重要农艺性状的功能基因,为水稻品种改良储备了基因资源。
我国科学家已克隆了控制株高、抽穗期和穗粒数的主效基因Ghd7 ,籽粒产量、株高和抽穗期多效基因Ghd8 ,粒长主效基因GS3 , 粒重基因GS5 , 粒宽主效基因GW2 ,粒重和品质基因OsSPL16 ,直立密穗基因DEP1 和控制籽粒灌浆的基因GIF1等影响水稻产量的相关基因。相关论文在Nature 系列杂志上发表,研究结果表明,这些基因对水稻产量性状的遗传改良具有重大的应用前景。
目前,40 个抗白叶枯和48 个抗稻瘟病的基因已经被克隆及功能验证。由我国科学家分离克隆的白叶枯主效隐性抗病基因xa13 已经被广泛应用于南亚国家的水稻育种中。分离克隆的抗谱较宽的抗稻瘟病的主效基因Pi9 / Piz-t / Pi2 ,Pi-d2表现出很好的应用价值。同时我国科学家在水稻抗褐飞虱主效基因中也取得了重大进展,Bph1-Bph9 已在栽培稻中鉴定出来,利用栽培稻和野生稻种质资源,率先分离克隆的抗褐飞虱基因Bph14 已运用于抗虫水稻的培育中。
水稻生产中会遭受不同程度的干旱、盐、重金属、冷害等的胁迫,导致水稻减产。目前已经有100 多个基因被鉴定为对逆境有不同程度的抗性。如我国科学家分离鉴定出的SNAC1和OsSKIPa基因,超量表达后对干旱具有明显抗性。将耐盐基因SKC1 导入轮回亲本获得的近等基因系对盐的耐受性大大增加。
氮、磷营养高效利用基因。在磷肥利用上,已初步明确OsPT2 、OsSPX1等基因在磷的吸收转运中的功能。
“稻2020” 研究计划———水稻功能基因组未来发展方向
针对全球水稻功能基因组研究的现状,综合水稻功能基因组研究的发展态势,我国科学家提出了“稻2020”研究计划———水稻功能基因组全球合作倡议:拟通过水稻生物组学(功能基因组学、表观基因组学、蛋白组学和代谢组学等)方面的研究,到2020 年最终阐明水稻基因组所有基因的功能及重要农艺性状等位基因的功能多样性,并将上述的研究成果运用到水稻遗传改良中。该项计划得到了世界多国科学家的积极响应,正在发展成为水稻功能基因组研究的国际合作计划。
建立国际共享的水稻功能基因组研究的技术平台和基因资源
继续完善补充插入突变体和全长cDNA 文库。根据计算,为使水稻基因组的每个注释基因至少有1 个T-DNA 插入,需要至少576 441 个插入事件。在国际同行的共同努力下,目前已经获得了大约675 000 个突变体,能定位到水稻染色体上的侧翼序列已达到319 969 个。
需要进一步获得T-DNA 插入突变体的侧翼序列标签。另外,通过其他方法来构建突变体库,作为没有T-DNA 标签区域的重要补充。通过化学和辐射的方法,可以产生高密度的突变随机分布于整个基因组,只需要相对较小的突变体群体就能获得全基因组饱和诱变。化学诱变EMS 和MNU 诱导单核苷酸的变异创造多样的点突变,TILLING 技术能有效的筛选点突变。由于籼稻的转化效率低,理化诱变是籼稻突变体库的重要补充。amiRNA(artificial microRNA) 是近年来发展的一项基因沉默的新技术,在拟南芥和水稻中都得到成功的应用,已经成为研究水稻基因功能的有用工具。人工合成的miRNAs 既能够特异性地沉默单一基因,也可以同时沉默多个相关但不相同的基因。利用amiRNA 技术创造的转基因株系,不仅能有效的鉴定基因的表型,还能为突变体库提供有益的补充。最近, 新开发的TALENs技术能快速简便的靶向敲除目标基因表现出应用潜力。
明确水稻全部基因的生物学功能
基因功能鉴定的一项重要工作就是基因功能缺失突变体的表型鉴定。高产、优质、对多种生物/ 非生物逆境的优良抗性及对营养元素的高效利用等重要农艺性状是研究的重点。有些性状可以在正常的生长条件下直接观测,有一些性状(如抗旱、氮磷高效利用)则需要在特定的处理条件下才能检测得到。另外,许多性状的检测如胚乳组成和营养物质利用等,则需要借助物理和化学分析手段。因此,需要在生物/ 非生物逆境胁迫或土壤养分等不同的生长条件下采用多种分析手段(如结合代谢组学手段等)对基因突变体(包括插入突变体、特异的基因沉默突变体等)进行表型鉴定,用系统分析的方法把基因和表型变化联系起来,最终为每个基因进行功能注释。
系统的表观基因组学和基因表达分析,明确基因的调控网络
在水稻全基因组精确测序完成后,所面临的新的挑战是发掘鉴定全部的基因编码区,非编码基因的转录区和转录调控区,表观遗传学修饰区域如DNA 甲基化、组蛋白甲基化和已酰化等。表观遗传修饰对基因表达、调控、遗传有重要作用,是许多重要生物学现象的基础,表观基因组学已成为水稻功能基因组研究的重要内容。研究内容主要包括:不同发育阶段、不同生物/ 非生物胁迫下的细胞或组织水平的表观基因组和转录组研究;以表观遗传谱及转录谱为基础的调控元件鉴定;系统地描述全基因组的表达调控,以及在不同生长发育阶段和不同环境条件的表观调控。
蛋白质组和蛋白互作组学
近年来,蛋白质组学已逐渐成为植物功能基因组研究的重要手段。真正生命功能的“执行者”是蛋白质,从mRNA 转录到蛋白质的翻译并不是简单的对应,蛋白质组学则将基因组序列信息与特定组织器官中蛋白质的种类连接起来。国际上目前水稻蛋白质组学主要集中在对水稻各组织器官的蛋白质组分进行分离及比较,研究环境胁迫下的基因组表达变化,已经建立了一些水稻蛋白质组的数据库(http://gene64.dna.affrc.go.jp/rpd/ ),包括各组织器官,亚细胞及不同发育期的双向电泳图谱,其中水稻蛋白质组数据库包含了23 张参考图,有详细的采样部位、样品制备、电泳条件和鉴定方法。完整的水稻蛋白组学还有待深入研究不同发育阶段、不同胁迫下蛋白质翻译后修饰,以及蛋白质之间相互作用复杂的网络关系。
挖掘栽培稻和野生亲本的自然变异和基因组多样性
水稻的遗传资源极为丰富。栽培稻包括亚洲栽培稻和非洲栽培稻两种,亚洲栽培稻又分为籼、粳两个亚种,Oryza 属还有约20 种野生稻种。国际水稻基因库中收集了105 000 份亚洲和非洲栽培稻,以及5 000 余份不同生态型的野生近缘种质。此外,各水稻主产国还建立了各自的国家种质资源库。这些种质资源库中包括了可以用于研究和育种应用的各种基因资源。从实际利用的角度来说,往往可以从核心种质库(具有最大遗传多样性的最小种质资源的集合)中来发掘控制重要农艺性状的基因。目前新的测序技术使大规模的品种测序成为现实。对包括野生种在内的水稻种质资源深度测序,对丰富的遗传基因进行评价可以发掘大量的抗病虫、抗瘠、抗旱、品质和产量等重要基因,将对水稻基因功能的系统鉴定及作物遗传育种产生重大的影响。深度测序可以极致地发掘水稻全基因组SNP。随着各种不同种质资源中SNP 标记的开发和遗传作图群体的构建,控制重要农艺性状的基因将以前所未有的速度被克隆。
发展生物信息学,建立海量数据搜索和分析的数据库平台,数据共享
数据库为水稻研究提供了极大的便利。目前可以从多个数据库查询水稻的基因组、突变体、全长cDNA、基因产物和功能分析等信息,且新的数据和分析工具还在不断的整合到数据库中。水稻科学家们需要致力建立一个完善的公共水稻注释数据库,该数据库可以与其他数据库较容易地整合,为使用者提供海量数据搜索和分析的服务平台。
建立以基因组研究成果为基础的分子设计育种技术
水稻功能基因组研究的最终目的是实现“设计育种”,以满足全球水稻生产中高产、优质、多抗性以及高养分吸收效率的多样化需求。设计育种包括四个层次的设计:能够在现有生态条件下,最大程度利用日光的适宜群体结构,突破生产上限;能实现该群体结构的个体构型(理想株型);构成该个体构型的各种性状包括高产、优质、多抗和营养高效利用;鉴定产生这些性状的各种基因和调控网络。同时还要发展全基因组组装的方法,实现设计育种。
开发面向育种应用的高通量、低成本的全基因组分子标记技术以满足水稻育种中多样化的需求,以最终实现育种过程集成化的目标。水稻功能基因组学研究过程中积累的知识和技术将大大加快水稻遗传育种工作的进程。
我国是农业大国,农业的可持续发展是经济发展和社会稳定的基础。当前,农业资源匮乏、自然灾害频发、生态环境破坏,农业生产与资源环境之间的矛盾日益突出,发展“少投入、多产出、保护环境”的现代绿色农业,培育“少打农药、少施化肥、节水抗逆、优质高产”的绿色新品种对保障我国农业安全具有重要的战略意义。
作物遗传改良的实质是对基因资源的合理利用。随着水稻功能基因组研究的不断深入,最终将从分子、细胞、物种和进化各层面阐明全部基因的生物学功能,揭示植株生长发育、环境应答以及生物环境互作的分子调控网络。水稻功能基因组研究不仅为作物产量、品质、抗病、抗虫、抗逆、营养高效等各种性状的改良提供大量的基因,而且还大大丰富和发展了遗传学理论,使得人们能从基因及其表达调控机制来认识表型和性状遗传。
功能基因组学的研究成果使得作物改良由过去的以机遇性为主的育种发展到设计性育种,人们将能在实验室设计作物基因型,组装基因,从而大大提高作物遗传改良的目的性和针对性,提高育种效率。