BGISEQ-500宏基因组测序应用性能测试结果发表于GigaScience

2017年12月24日,深圳华大生命科学研究院宏基因组研究所转化应用实验团队首次公开了使用BGISEQ-500对健康人群肠道样本进行深度宏基因组测序的数据,并通过一系列的性能评估,展示了BGISEQ-500宏基因组测序应用性能的优异性、准确性、稳定性及跨平台一致性,相应成果发表于GigaScience。

据悉,BGISEQ-500新型桌面化测序系统自2015年推出以来,因其高通量、高质量、便捷性、低成本等特点已被广泛应用于人全基因组测序 (Whole Genome Sequencing,WGS)、RNA-Seq、Small RNA-Seq等研究领域。

为评估BGISEQ-500的宏基因组测序应用性能,该研究团队收集并提取了20例健康成年人粪便DNA,采用BGISEQ-500的SE100测序策略完成该20例样本的深度宏基因组测序。同时,研究人员随机选择8例DNA样本作为技术重复,产出8对文库构建重复与8对测序重复数据集以评估该测序平台的稳定性,并完成全部20例DNA样本在Illumina HiSeq2000 与HiSeq4000双平台的测序以评估跨平台数据的一致性 (图1)。

针对BGISEQ-500数据特征,研究人员开发了宏基因组数据质控流程,结果显示,质控后高质量数据占原始数据的96.06%,其中Q30超过90.56%。这一结果显示了BGISEQ-500的高质量性;同时,基于文库重复数据集与测序重复数据集的评估显示:在定性层面,BGISEQ-500平台内的两组技术重复内可稳定检测的基因数高达99.5%以上,在定量层面,两组数据间的基因相对丰度相关性可高达0.92以上,物种相对丰度相关性可高达0.99(图2)。这一结果显示了BGISEQ-500平台内高稳定性;此外,对BGISEQ-500与HiSeq2000的比较展示: 跨平台数据集可稳定检测的基因一致性高达91.8%,对平台间基因丰度的统计检验仅检出3.25%显著差异基因。两平台在物种丰度的相关性仍达94.8%(图3)。有趣的是,这些差异基因在GC含量上存在一定的平台特异性,表现为高GC含量的基因在HiSeq2000平台相对丰度偏高;该一发现随后在BGISEQ-500与HiSeq4000的数据集比较中也得到了验证。

这一结果表明了BGISEQ-500 与 HiSeq2000&4000的跨平台高一致性。

此外,来自Joslin diabetes center的Dr. Kostic及其团队也受邀参与了该数据集的评估工作,证实了物种GC含量及其在BGISEQ-500与HiSeq2000间的物种丰度间的独立性,表明极少数差异基因的GC偏向性对物种的定量并无显著影响。

综上,该研究团队表示,通过对BGISEQ-500在平台内、平台间的宏基因组定性和定量性能全面评估,全面证实了BGISEQ-500平台对宏基因组应用的高度可行性,其高通量的测序能力与更经济的测序成本也将为未来大规模的宏基因组研究提供可行的技术与平台支撑。

文章链接:Assessment of the cPAS-based BGISEQ-500 platform for metagenomic sequencing


图1. BGISEQ-500平台内技术重复一致性。

图2. BGISEQ-500与HiSeq2000/HiSeq4000平台间的一致性评价。

图3. BGISEQ-500与HiSeq2000平台间差异基因的比较。

;