中国花生基因组计划取得阶段性研究成果

千年基因,2012-12-17

近日,由山东圣丰种业科技有限公司、广东省农业科学院、山东省农业科学院和Macrogen千年基因联合启动的中国花生基因组计划取得了阶段性研究成果,该成果报告会于Macrogen千年基因圆满举办。本次会议总结了中国花生基因组计划的阶段性研究成果及国际上花生基因组研究的进展,并讨论了花生基因组计划后期的研究方向,以便将研究成果更好地指导花生遗传育种。参加本次会议的主要包括山东圣丰种业科技有限公司科研总监李洪杰,广东省农业科学院作物研究所梁炫强研究员、陈小平博士,山东省农业科学院花生研究所所长禹山林研究员,国际半干旱热带作物研究所(ICRISAT)基因组中心负责人Rajeev Kumar Varshney,Macrogen中国项目总监于越,Macrogen集团CIO Hwanseok Rhee、de novo信息分析负责人ChangHoon Kim、NGS部门项目总监Jong-So Kim。

花生栽培种(AABB)是异源四倍体,由A基因组和B基因组组成,采用目前的测序技术直接对四倍体基因组进行测序组装较困难,容易造成序列拼接错误。且花生A基因组与B基因组的相似度达98%,两者所含的优质基因大致相同,因此中国花生基因组计划主要对二倍体野生型A基因组进行测序。所有测序工作均在Macrogen国际最高质量标准的大型基因组学实验室完成,该实验室已通过ISO9001 & ISO13485 & CLIA 国际质量标准认证,并拥有454&454+、HiSeq 2000、MiSeq、Ion Torrent、ABI 3730等多种测序平台,其丰富的国际项目执行经验使各个测序平台的优势均能在Macrogen得到最佳体现。其中,454平台的读长为360-560bp,每个run的数据产量约0.5G。454+平台的读长为700-1000bp,每个run的数据产量为0.9G。HiSeq 2000平台的读长为100bp,每个run的数据产量为600G。

在全基因组de novo测序时,454&454+平台较长的读长能够显著改善基因组的拼接效果,与此同时,HiSeq 2000平台较高的数据产出量能够对454&454+的测序数据进行补充,以便更大程度提高基因组覆盖度、contig N50和scaffold N50长度,并对454&454+数据的组装结果补gap,从而最终获得较完整的基因组图谱。近期在Nature发表的已完成测序的物种,如大麦、香蕉、番茄、鳕鱼、倭黑猩猩等均以454为主要测序平台,并结合HiSeq 2000平台,大麻、西班牙耐药菌的基因组测序均以454+作为主要平台。

中国花生基因组计划以454&454+平台为主,结合HiSeq 2000平台进行测序,目前已完成了大部分HiSeq 2000测序和部分454&454+测序,组装和测序正同步进行中。根据目前测序结果的分析得知,花生A基因组大小为1.38G,与之前预期的1.4G接近。一般情况下,重复度超过50%即为基因组比较复杂的物种,而花生A基因组的重复序列比例高达70%,这对组装提出了巨大的挑战。针对此问题,Macrogen技术团队结合之前在玉米、白菜、马铃薯、油棕榈、可可等多个物种的研究经验,针对不同数据采取不同组装方法并进行多次摸索和尝试。本次成果报告会中,Macrogen de novo信息分析负责人ChangHoon对目前的组装结果做了报告,结果表明454+长达1000bp的读长能够更好地跨越花生A基因组的高度重复区域,从而显著改善基因组拼接效果。与会人员均对高复杂度花生A基因组的组装结果充满信心,中国花生基因组计划预计于2013年1月完成全部测序工作,并于同年上半年完成文章初稿的撰写。

另外,针对目前国际上花生基因组的研究进展,与会人员讨论了中国花生基因组计划今后的研究方向。在完成花生A基因组的测序后,我们将针对中国现有的品种开展大规模的重测序和转录组测序,并结合性状调查的结果进行全基因组关联分析,以最大限度最快速度将测序的结果应用于育种的实际工作中。

论文链接:Deep sequencing analysis of the transcriptomes of peanut aerial and subterranean young pods identifies candidate genes related to early embryo abortion

花生转录组测序的结果已发表于Plant biotechnology journal:
http://onlinelibrary.wiley.com/doi/10.1111/pbi.12018/suppinfo

;