基因测序在作物育种中的应用

基因农业,2013-08-22

1953年4月25日,当Watson和Crick在《Nature》杂志上发表DNA分子双螺旋模型的时候,估计他们并没有意识到自己已经打开了一个崭新学科——分子生物学——的大门。DNA测序已经成为揭示生命本质的钥匙。

1977年,Sanger等发表了Sanger测序法,使得大规模、自动化的DNA测序成为可能。经过若干技术改进后,Sanger测序法逐步成为DNA测序的主要技术,并成功地测定了包括人类基因组在内若干生物体的基因组序列。然而,由于Sanger测序法成本过高、测序通量较低、耗时耗力等缺点,限制了DNA测序的广泛应用。

从20世纪90年代末开始,科学家着手研究各种低成本、高效率的DNA测序技术以替代Sanger测序法。从1998年焦磷酸测序技术的展露头角,到2001年自动化焦磷酸测序仪雏形的问世,再到2005年第一台454 NGS测序仪的上市,高通量测序仪作为“新一代测序技术”已经进入生物学家的视野。紧随其后的Illumina Genome Analyzer和SOLiD也成为高通量测序仪阵营中的生力军。从此,DNA测序技术进入了高通量、低成本、高效率、高质量的“新时代”。

一个物种的全基因组序列是科学家们揭示该物种生命本质的基本依据和重要线索。而模式植物和重要农作物的全基因组、转录组信息则大大促进了基因组学辅助育种技术的发展。从Sanger测序技术逐步完善以来,科学家们利用Sanger测序法,已经逐步测定了水稻、杨树、葡萄、木瓜、高粱、大豆和玉米等的基因组全(或部分)序列。

植物基因组通常较大且结构复杂,用Sanger测序技术来测定农作物的全基因组序列不仅花费巨大且费时费力,大大限制了基因组信息在农业生物技术中的应用效率、深度和广度,而由于高通量测序技术极大地降低了DNA测序的成本和复杂性,使得低成本、高通量、快速的全基因组测序(重测序)成为可能。

2005年,Margulies等人研制出基于焦磷酸测序技术的全自动测序仪(454),并成功用该测序仪对一种支原体进行了“全基因组霰弹法”基因组测序。测序仪经过约4个小时的运行后,给出了约25 Mbp的测序原始数据,经过序列拼接后,得到了覆盖基因组96%区域的高质量基因组序列(准确率99.96%)。Margulies等的工作不但揭开了高通量DNA测序时代的序幕,也第一次证明了以短片段为特点的高通量测序技术应用在原核生物全基因组测序及拼接的可行性。

与原核生物相比,真核生物的基因组大小差异很大,这些差异主要来自于基因组中大片段的高度重复序列。例如,四大谷类作物之一的大麦基因组(约5Gbp)就包括了约80%的重复序列。虽然焦磷酸测序技术被多次应用在微生物基因组和高等植物的质体基因组测序上,但对于含有大量重复序列的植物基因组,高通量测序技术所产生的相对较短的测序片段(约为50~500 bp)在重复序列区域表现出相当大的拼接和组装困难。这种困难也间接限制了WGS策略应用在植物的全基因组测序工作上。

2007年,Velasco等对基因组大小约为504.6 Mb的杂交葡萄进行了全基因组测序。他们的工作表明:结合Sanger测序技术和高通量测序技术,足以实现对复杂的杂合基因组进行全基因测序和组装拼接。

2009年发表全基因组测序工作的黄瓜,是世界上第一个完成全基因组测序的蔬菜作物,对黄瓜本身和其他瓜类作物的遗传改良、基础生物学研究、植物维管束系统的功能和进化研究发挥了重要的推动作用。工作人员正是利用Sanger测序技术及高通量测序技术对黄瓜进行测序。这也是第一个高通量测序技术参与完成的农作物的全基因组测序工作。

茄科植物马铃薯是世界上最重要的非谷物类粮食作物,也是世界上第三大重要粮食作物。由于马铃薯具有基因组结构复杂——高度杂合的同源四倍体、严重近交衰退和极易感染病害和虫害等特点,马铃薯育种工作比较困难。马铃薯基因组的测定无疑将对其育种与培育新品种有巨大的帮助。2011年, 国际马铃薯基因组测序联盟发表了马铃薯基因组测序及拼接组装结果——86%的基因组序列拼接成功、39031条蛋白编码基因被发现并注释,并提出两处基因组加倍现象的证据。由此,高通量测序技术在农作物(植物)的全基因组测序工作中又向前迈进了一大步。

白菜是我国栽培面积和消费量最大的蔬菜作物之一。包括中国农业科学院在内的多国科学家组成的“芸薹属基因组测序联盟”于2003年6月正式启动了“白菜基因组测序计划”。项目组最先确定以大白菜为材料,利用Sanger测序技术,以“BAC by BAC”的方式进行全基因组测序。2008年10月,黄瓜基因组测序及组装工作的顺利完成,使科学家们发现利用高通量测序技术进行植物全基因测序的可行性与优势,于是工作组决定改变计划,终止原先的所有测序活动,完全使用高通量测序技术从头以测序。工作组于2011年发表了白菜基因组的测序、拼接及有关分析结果。

伴随着生物信息学的发展,高通量测序技术已经逐步取代Sanger测序法,成为全基因组测序工作的首选技术,以其高通量、低成本、高效率的特点,大大加快了人们了解生命本质的步伐。

;