粮食作物基因组研究大全
来源:华大基因
俗语有云,民以食为天。基因科学家们在解读整个“蓝色星球”的过程中,视线从未远离粮食作物。一是由于全球自然环境和社会环境的变化,耕地减少,人口增加,以有限的耕地养活越来越多的人,不可谓是一个艰巨的任务;再者,粮食作物本身就是一个奇妙的存在,比如,为什么有的植物只能观赏,有的植物却能作为粮食?为什么青稞可以在海拔4、5000米的高原上生存,还含有丰富的营养来养活藏族人民?千百年前谷子和水稻是一家,他们分化后各自的特性是什么?立马奉上干货,解答你的疑问。
五谷之首——水稻
doi:10.1126/science.1068037(迄今为止被引用次数已达2592次)
2002年4月5日,由华大基因等中国研究机构完成的《水稻(籼稻)基因组的工作框架序列图》发表在Science杂志上。地球上一半以上的人类所赖以生存的粮食作物——水稻的基因序列由我国科学家独立绘制完成,并获得成功解读,此举不仅有利于世界粮食安全,还是同为禾本科的玉米、小麦、大麦、高粱和甘蔗等其他作物的理想研究模型。
通过对水稻基因组序列框架图的详尽分析,华大基因的科学家估计,水稻基因组中基因总数在46022至55615个之间,并基本确定了其中一万多个基因的功能。科学家发现,水稻的这些不编码蛋白质的“垃圾”序列多位于基因之外,据此估计超级杂交稻“杂种优势”的奥秘很可能与这些“宝贝”有关。
中国科学家的所有数据已经向全世界公开,过去的几个月里,这些数据被全世界的科学家广泛下载。《科学》主编鲁宾斯坦表示,在某种意义上,中国科学家的加入促进了整个水稻基因组研究,也促进了私营公司的数据向世界开放。
营养之王——谷子
doi:10.1038/nbt.2195(迄今为止被引用次数已达69次)
2012年5月14日,由深圳华大基因研究院和张家口市农业科学院等单位合作完成的谷子基因组研究成果于Nature Biotechnology上在线发表。在本研究中,科研人员成功构建了谷子全基因组序列图谱,获得了谷子的全基因组序列图谱(组装得到的基因组大小约为423Mb,N50达到了1.0Mb),并通过基因组注释和分析发现,谷子基因组中的重复序列约占整个基因组的46%,大约含有38,801个蛋白质编码基因。为揭示谷子抗旱节水、丰产、耐瘠和高光合作用效率等生理机制的研究提供了新的途径,并为高产优质、抗逆谷子新品种的培育奠定了坚实的基础。
谷子是二倍体自花授粉作物,和水稻大约在5000万年前(50Mya)开始分化,二者分化之后的基因组结构仍存在明显的共线性。研究人员发现谷子的2号和9号染色体分别由水稻的7号和9号、3号和10号染色体融合而成,同时,他们发现这两次融合事件也发生在高粱的染色体中,由此,研究人员推测这两次染色体融合事件应该发生在谷子和高粱分化之前。此外,研究人员还发现了谷子独立分化出来之后的一次特异性染色体融合事件,即谷子的3号染色体是由水稻的5号和12号染色体或高粱的8号和9号染色体融合而成。这些染色体重组事件是物种遗传变异及物种分化的重要基础。
大豆回家
doi:10.1038/ng.715(迄今为止被引用次数已达183次)
《诗经.大雅.生民》“艺之荏菽,荏菽旆旆”中的“菽”是豆类的统称。三千年后,大豆传播到世界各地。曾受僱东印度公司的水手Samuel Bowen在1765年把大豆带到现称乔治亚州的地方种植,现在美国已成为年产八千万吨的世界第一大豆生产国,而中国这个大豆之乡,产量远远无法满足内需,每年倒要花数十亿美元从美国进口大豆。
2010年11月15日,华大基因、香港中文大学、农业部、中国科学院等单位合作的“大豆回家”项目研究成果“31个大豆基因组重测序揭示遗传多样性和进化选择模式”在 Nature Genetics上在线发表。
这是世界上首次大规模获得野生和栽培大豆群体基因组数据。研究人员运用新一代测序技术对17株野生大豆和14株栽培大豆进行了全基因组重测序,总共发现了630多万个SNP(单核苷酸多态性位点),建立了高密度的分子标记图谱。在“重测序”基础上,华大基因研究院的研究人员通过自主研发的SOAP denovo软件,分别对野生大豆和栽培大豆的测序数据进行组装拼接,除得到大量SNP外,还发现了栽培大豆获得或丢失的野生大豆基因。而大量的野生大豆和栽培大豆的基因差异揭示了大豆基因组在驯化过程中发生变化的机制,使重新找回人为耕种选育中流失的优秀基因成为可能。
2012年1月17日,华大基因(BGI)与美国密苏里大学国家大豆生物技术中心正式签署合作协议,并宣布双方将共同开展1008株大豆的基因组测序项目。双方将首先对100株大豆进行基因组测序研究,密苏里大学负责提供样本,华大基因则主要负责DNA建库、测序以及相关的生物信息学分析等工作。
第五大禾谷类作物——高粱
doi:10.1186/gb-2011-12-11-r114
随着全球气候的变化和人口不断增长,如何在保护环境的前提下,提高粮食产量和发展新型清洁型能源是摆在全球科学家们面前的一道难题。原产自非洲地区的高粱,目前是世界上第五大禾谷类作物,具有耐热、耐旱和高产的特征。
华大基因、中国科学院植物研究所和新加坡淡马锡研究所共同完成了甜高粱基因组变异的基因组研究,成果于2011年11月21日在国际著名杂志Genome Biology上在线发表,研究为深入挖掘甜高粱优良性状基因以及促进遗传育种改良等研究提供了非常有价值的参考。
除此之外,2013年8月28日,华大基因和澳大利亚昆士兰大学的科研人员对高粱进行了全基因组测序及分析。该研究比较了44个高粱品种的基因组序列,发现高粱基因组中存在大量的遗传变异,为今后高粱及其它粮食作物的育种改良提供了宝贵的遗传资源,同时也为解决全球日益严峻的粮食问题奠定了重要的科研基础。最新研究结果于Nature Communications杂志上发表。
宜食宜燃——玉米
doi:10.1038/ng.2313(迄今为止被引用次数已达82次)
doi:10.1038/ng.2309(迄今为止被引用次数已达91次)
玉米既是重要的粮食之一,也是理想的燃烧原材料,众多科学家对如何改善玉米营养价值和培育优良品种有着深入的研究。
2012年6月4日,由华大基因、冷泉港实验室、加州大学戴维斯分校等全球17所科研机构合作完成的两项玉米基因组学研究成果于国际权威杂志Nature Genetics上同期发表。
科研人员对105个野生和栽培玉米品种进行了测序和分析,成功构建了第二代玉米单体型图谱,并对玉米的遗传多样性进行了全面分析,推测玉米的结构变异与很多重要的农艺性状具有密切的关联。此外,在研究影响玉米基因组大小的主要因素时,研究人员发现染色体结(一种密集的DNA结构,chromosomal knobs)的存在或缺失造成了“种内”玉米基因组大小出现很大的差异;而在“种间”进行比较时,他们发现玉米基因组大小的变化则主要与大量的转座子有关。
考古学及遗传学证实玉米大约驯化自10,000多年前,在驯化过程中,玉米经历了一次特殊的表型转变,这使其更加容易满足人类的需求。华大基因和加州大学戴维斯分校主导完成了第二篇玉米的研究文章,对75个玉米株系(包括野生玉米、美洲各地的传统品种和现代改良玉米品系)进行全基因组重测序,并对玉米驯化进行了全面的评估分析。发现玉米在经过人工驯化之后又产生了新的遗传多样性,并推测这很有可能是由于野生近缘物种的基因渗入所导致的。此外,研究数据还表明在玉米的驯化过程中,千百年前古代农民应用的人工驯化方法似乎比现代育种学家所使用的方法发挥了更大的作用。
穷人的肉——木豆
doi:10.1038/nbt.2022(迄今为止被引用次数已达117次)
木豆是世界第六大食用豆类,也是迄今为止唯一的一种木本食用豆类作物。木豆原产于印度,距今大约已有6000年的栽培历史,在世界的半干旱地区是重要的食材,由于其高蛋白含量被称为“穷人的肉”,与谷类一起搭配食用可保证当地居民的膳食平衡。
2011年11月7日,由国际半干旱地区热带作物研究所(ICRISAT)主导,华大基因、美国冷泉港实验室、美国国家基因组资源中心等单位共同合作完成的木豆基因组研究成果在国际权威杂志Nature Biotechnology上在线发表。
研究人员通过新一代测序技术对木豆的DNA进行测序、组装和注释,推测出木豆的基因组大小约为833.07Mb(组装得到的基因组大小约为605.78Mb),并预测其含有48,680个基因。研究人员发现了一些木豆所特有的耐旱基因,这些基因可以被转入到大豆、豇豆或者菜豆等其他豆类植物中,从而提高这些豆类的耐旱性,这将有助于改善干旱地区贫困农民的生计。
五谷亚军——小麦
doi:10.1038/nature11997(迄今为止被引用次数已达50次)
doi:10.1038/nature12028(迄今为止被引用次数已达64次)
从一粒小小的麦种,经历漫长的自然选择与近万年的人工驯化,并衍生出如今穗大粒多、颗粒饱满的普通小麦,小麦也成为全球最重要的粮食作物之一。
当今作为主流粮食作物的普通小麦是一个异源六倍体,由A、B、D三套子基因组共同组成,其基因组达16Gb之多,为小麦的分子生物学及基因组学研究带来巨大的挑战。前期研究已经证实D基因组的祖先供体来源于粗山羊草DD,乌拉尔图小麦是A基因组的供体。
华大基因分别与中国科学院遗传与发育生物学研究所、中国农业科学院作物研究所等单位合作完成了普通小麦A、D基因组供体乌拉尔图小麦及粗山羊草的基因组测序及分析工作。这两项研究成果于2013年3月25日在Nature上在线发表,将为科研工作者研究小麦进化史提供全新的视角,为多倍体小麦遗传育种提供宝贵资源。
通过对基因组的测序、组装、注释及相关基因的深入分析,研究人员发现,乌拉尔图小麦基因组中与抗病相关的一些基因发生了扩张,使其抗病能力得以增强。该研究还用全基因数据证实,重复序列扩张对于小麦家族进化过程中基因组大小的增加至关重要。同时,研究人员还鉴定出了重要作物性状相关基因,如与水稻中控制谷粒长度GASR7的同源基因TuGASR7参与控制小麦籽粒长度和粒重。此外,该研究还筛选出大量的遗传分子标记,将有助于通过基因组分子标记辅助选择促进分子育种。
在另一项研究中,研究人员通过对粗山羊草基因组的深入分析,发现大量与抗病能力相关的基因(如NBS-LRRl基因等)所发生的显著扩张增强了小麦的抗病性;与对抗非生物应激反应相关的基因所发生的扩张,增强了小麦的抗逆性及适应性;此外,与小麦特有品质相关的基因扩增,促使小麦的品质性状得到改良,从而成为唯一能够制作馒头、面包、饺子等多种食品粮食作物。研究人员还在粗山羊草基因组中鉴定出大量的转座子,使小麦的基因组迅速膨大。据推测,基因组膨大约发生在300万年前,可能与当时地球的气候变化有关。
正是由于D基因组的加入,使小麦的抗病性、适应性与品质得到大大改良,从而才使小麦“走出新月沃”,走向世界各地,成为世界上种植区域最广的第一大粮食作物。小麦D基因组的供体种粗山羊草遗传多样性丰富,其中蕴含着许多优良基因。D基因组框架图的构建及开发利用将有助于进一步丰富小麦遗传多样性、促进其品种改良。
多倍体研究模型——棉花
doi:10.1038/ng.2371(迄今为止被引用次数已达83次)
棉花是全球重要的经济作物之一,它可作为一种纤维植物为纺织行业提供重要的天然原料,也可作为油料作物为食品行业提供棉籽油等。除经济价值外,棉花更是研究多倍体型、细胞伸长以及细胞壁合成的重要模型。
由华大基因、中国农业科学院棉花研究所和北京大学等多家单位合作完成的二倍体棉属植物——雷蒙德氏棉的基因组研究成果于2012年8月26日在Nature Genetics杂志上在线发表。在本研究中,科研人员成功绘制了高质量的雷蒙德氏棉基因组图谱,并对其进化机制及相关功能基因进行了初步分析,为进一步加快棉花品种的遗传改良,提高产量质量,培育抗病虫害棉花新品种奠定了重要的遗传学基础,同时也向全面揭示棉属植物基因组迈进了重要一步。
在本研究中,科研人员对一株连续自交六代的纯系雷蒙德氏棉的DNA样本进了全基因组测序,测序覆盖度达103.6X,组装得到的雷蒙德氏棉基因组大小约为775.2Mb,随后,他们将73%的组装序列定位到13条染色体上。通过从头预测、同源预测及EST数据比对,研究人员对该基因组进行了注释,并鉴定出40,976个蛋白编码基因,其中92.2%与转录组数据相匹配。经过与其他已知序列的植物物种比较后,他们发现雷蒙德氏棉基因密度较低,转座因子比例较高,其中大部分来源于长末端重复序列扩增(LTR)。
油料作物种子中的“女王”——芝麻
doi:10.1186/gb-2014-15-2-r39
芝麻被称作油料作物种子中的“女王”,在中国、日本和其它东亚国家一直被视为传统上的健康食物。芝麻中的抗氧化成分已经被药理学家们发现,并在降低血脂和胆固醇水平上发挥其潜在的药理特性。此外,较高含油量和较小的基因组,使芝麻成为研究油脂合成的重要物种。
2014年2月27日,华大基因和中国农业科学院油料作物研究所、哥本哈根大学等多家单位的科研人员成功完成芝麻基因组的测序与分析,研究成果已于Genome Biology上在线发表。成果对研究芝麻油脂合成以及芝麻素抗衰老功能性成分的合成机制提供了新思路,为植物进化和比较生物学研究提供了宝贵的遗传资源。
研究人员对遗传型为“13号种子”芝麻进行了基因组组装,得到大小为337Mb高质量的基因组序列,包含大约27148个基因。研究还发现芝麻油脂合成基因总数虽然较少,但与油脂分子转运有关的基因LTP1较大豆等发生了显著扩张,同时,与油脂降解有关的基因LOX和LAH却显著收缩。研究人员认为这些油脂基因家族尤其是类型I油脂运输基因的扩增,油脂降解相关基因家族的收缩导致了在芝麻中油脂含量明显高于大豆中的含量。
芝麻油的保存期明显长于其他食用油,原因在于芝麻中所含的一种特殊物质——芝麻素。这种物质能够增加油质的稳定性,并且芝麻素具有很强的抗氧化性,目前临床已证实具有治疗癌症及心血管疾病等功效。芝麻素的合成涉及到两个关键的编码基因DIR和PSS,通过11个物种的比较分析,研究人员在芝麻和西红柿中发现了DIR同系物,但PSS同系物仅存在于芝麻中,这同时也体现了芝麻特定产物的遗传基础。
藏民之宝——青稞
青稞,在西藏语中称为Ne,在分类学上是一种裸大麦。青稞是西藏人民的主食,种植面积占西藏耕地的70%。青稞在青藏高原经过3500~4000年的驯化栽培,已经适应极端高原气候。
2014年3月2日,西藏自治区农牧科学院与华大科技联合宣布完成青稞基因组图谱的绘制。该项科研成果将为深入揭示西藏青稞这一裸大麦品系的起源、驯化及栽培选育过程等奠定了坚实的遗传学基础。
研究人员采用高测序深度及长读长配合的测序方法,对西藏的地方青稞品种Lasa Goumang 进行了全基因组测序及图谱绘制。结果显示,青稞基因组大小约为4.5Gbp,组装的基因组大小3.89Gbp,共包含39,197个蛋白编码基因,重复序列含量高达80%以上。同时为了研究青稞的高原抗旱适应性,研究人员对不同干旱条件下的青稞叶子组织进行了转录组测序,以分析干旱耐受条件下的基因表达调控机理。研究人员还将青稞与小麦(A、D)、水稻、高粱、玉米等单子叶植物的基因组做了比较分析,研究进化机制,从比较基因组方向进一步解析青稞的生物学特质,为后续优良栽培品种选育和改良奠定基础。