下一代测序技术(NGS)展望



自从哈佛大学遗传学家 George Church 和 454 Life Sciences 公司 Jonathan Rothberg 掀起下一代测序 NGS 的革命以来,已经过去了将近十年。毫不夸张地说,这段时间以来 NGS 技术已经发生了翻天覆地的变化,在测序通量突飞猛进的同时,测序成本直线下降。

想当年 454 Life Sciences 公司测序 580-kb 的细菌基因组,需要四小时的工作循环。而今年一月份 Illumina 公司发布的 HiSeq X™ Ten 测序系统,能够以千元成本测序完整的人类基因组,最多每天能测序 600 billion bp。

如今,下一代测序技术给生命科学领域带来了彻底的改变。而 NGS 领域本身也在经历着某种意义上的变革。正因如此,基因组学 Archon X 奖(Archon Genomics X Prize)不得不于 2013 年 8 月宣布取消,因为测序成本的直线下降已经使竞赛变得毫无意义。Church 的团队是该竞赛仅有的两只报名队伍之一,他认为参赛者们是否能够完成竞赛任务还很难预料。但无论如何,既然竞赛已经启动,总得让人家比完吧。

言归正传,下一代测序领域的 2013 年既忙碌又喧嚣,在开年之际让我们对这一领域发生的最新进展做个小结吧。

454 Life Sciences

2013 年 10 月, 454 Life Sciences 宣布将于 2016 年中旬逐步淘汰其焦磷酸测序仪器,GS Junior 和 GS FLX+。据该公司介绍,从扩展性和成本角度看,454 平台作为首个商业化的 NGS 系统已经基本上走到尽头,很难再对其进行升级和改良。Roche 的 Beth Button 指出,公司正在寻求新的测序合作伙伴。2013 年 9 月,该公司宣布与昔日的竞争对手 Pacific Biosciences 合作,拟基于 PacBio 公司的SMRT技术进行诊断产品的开发。

Illumina

2014 年 1 月 Illumina 公司发布了两个以 Solexa 测序技术为基础的新测序平台,HiSeq X Ten 和 NextSeq™ 500。

据该公司介绍,定 价$250,000 的台式 NextSeq 500 兼具了样品制备和测序功能。“它按钮式的操作,可以在许多常见测序应用之间切换。该系统能够在一天内测序整个人类基因组和多达 16 个外显子组。”NextSeq 500 运行 75 个测序循环只需 12 小时。

HiSeqX Ten 系统以 10 台仪器为单位销售,据称可以实现千元成本的人类基因组测序。该系统现定价 1000 万美元,能够在三天时间内生成 1.8 terabases 的数据,相当于每天约 600 Gb,比 HiSeq 2500 强十倍。

华盛顿大学的 Elaine Mardis 表示,HiSeqX Ten 系统针对的应该是提供人类基因组测序的服务产业,因为很少有研究机构能用到如此高的通量。“要想实现千元成本,就需要正确的样本量,”她说。当然,高通量还意味着更为复杂的数据分析。

Mardis 的团队曾作过计算,为了跟上 HiSeqX Ten 他们可能需要花费 800 万美元在信息学设施上。此外,实现千元成本意味着每年需要测序 18,000 到 20,000 个基因组。“我要测序许多肿瘤基因组,”她说。“但数量还远远不够。”

Life Technologies

已被 Thermo Fisher 收购的 Life Technologies 拥有两款 NGS 平台, SOLiD 和 Ion Torrent 。据 Thermo 的 Andy Felton 介绍,公司已经将工作的重心放在后者身上。“绝大多数研发工作已经转移到 Ion 上,”他说。

目前的 Ion PGM 系统可使用最新的 Ion 318 芯片,产出多达 6 million 400bp 的读取,也就是说 4 小时运行的产量能达到 2 Gb。而新 Ion Proton™ 使用 Ion PI™ 芯片,能够产出 80 million 200 bp 的读取,即每次运行产量达到 10 Gb 至 14 Gb。

据介绍,今年公司将会推出用于转录组测序的新 Ion PII 芯片,每张这样的芯片可产出 300 million 100bp 的读取,随着系统改良甚至可能达到 200bp。

此外, Life Technologies 公司正在研发一种新的聚合酶,Hi-Q。据 Felton 介绍,Hi-Q 能“显著提高精确性”,减少 90% 的插入/缺失误差。这种酶将于今年的中旬实现全面商业化。

Pacific Biosciences

Pacific Biosciences 公司以长读取的下一代测序技术著称。据该公司的创始人 Steve Turner 介绍,在新测序化学 P5-C3 的帮助下,如今 PacificBio 的测序读长已经达到了 8.5kb。P5-C3“提供了一个保护性的支架”,可以阻止酶和荧光团之间发生身体接触,避免酶受到潜在的光学损伤。

“我们已经很大程度上减少了系统中的光学损伤,我们相信现在测序读长受到的限制,只来自于样品本身,” Turner 说。 样品本身的限制是指,读长越长就越难生成不含损伤位点或缺口的测序模板,而这样的缺口会导致测序过早中止。

目前 PacBio ® RS II 和 SMRT Cell 系统,每次运行可产出 50,000 个读取(约 400 million bp)。这一数字会在接下来的一年中继续增涨, Turner 说。“我们预计在 2014 年内,令测序读长再增加50%,并于 2015 年达到 20,000bp。”

最近研究人员发表文章向人们展示,在新装配方法 HGAP 的帮助下(hierarchical genome-assembly process),可以实现只利用 PacBio 化学法对真核基因组进行从头装配。一月份,该公司公布了对黑腹果蝇(Drosophila melanogaster)进行的完整二倍体基因组装配,生成了长达 24.6 Mb 的重叠群(contigs), N50 值为 15.2 Mb( N50 值反映了重叠群的长度)。就在上周, PacBio 公司又公布了一个 54x 覆盖度的单倍体人类基因组装配,生成了“3.25 Gb 的基因组装配,重叠群 N50 值为 4.38 Mb,其中最长的重叠群达到 44 Mb。”

Oxford Nanopore

Oxford Nanopore 公司无疑是纳米孔测序的领导者,这一技术也被称为第三代测序。该公司 2013 年 10 月份宣布,将在 2014 年年初推出 USB 大小的 MinION ™ 测序仪,为客户提供先期体验(early-access)。

与其他类似先期体验项目不同的是, Oxford Nanopore 公司不会局限于传统的测序中心,而是向广大的个人用户敞开大门。该公司准备在接下来的一周发出邀请。

Oxford Nanopore 公司强调,不是每个 MinION Access Program(MAP)申请者都会在第一轮受到邀请,而且公司提供的 MinION 数量也可能少于申请者的要求。这些仪器将在六周内进行发送。

2012 年, Oxford Nanopore 公司在 AGBT 大会上描述了两个测序系统, MinION 就是其中之一,另一个产品是 GridION™。据公司发言人称, MinION 的大小使其更容易受到人们的关注,它的灵活性和测序能力将推动 NGS 进一步迈向普罗大众。

Oxford Nanopore 公司希望通过 MinION Access Program 评估测序系统的实用性、对不同应用的适应性、数据分析、以及公司的物流运输和试剂分配等。这些数据将有助于未来开展的 GridION 先期体验项目,不过该公司还未公布这一项目的具体启动时间。

广泛的应用前景

在下一代测序技术不断进步的同时,它的应用也越来越广泛。据 Mardis 介绍,下一代测序在临床领域的应用快速增涨。越来越多的研究者选择下一代测序的多基因 panel 对肿瘤进行研究,或者通过外显子测序鉴定潜在的药物靶点。在诊断儿童遗传学疾病时,人们也逐渐抛开了传统的诊断方法,转而使用全外显子组测序。

Mardis 补充到, NGS 检测有两大优势,它既可以帮助人们确定治疗方案,也可以为患儿父母评估他们未来子女患同样疾病的风险。实际上 Church 认为,用下一代测序进行(致病基因)携带者筛查,是 NGS 的“杀手锏”。

“任何考虑使用辅助生殖手段的人…都应当知道精子捐献者是否携带与严重疾病有关的隐性等位基因,”他说。“人们已经发现了数百个能够预测疾病的基因,现在也有不少服务可以对它们进行准确的检测。”

最近, Church 作为共同作者发表了一项新研究。据他介绍,这是首次发表用 NGS 进行携带者筛查的文章,他们的方法“充分提高了质量并且降低了成本”。研究团队使用padlock探针,在194个细胞系中抽出并测序了15个有临床意义的基因,其中55个细胞系来自于携带上述基因突变的个体。

下一代测序的另一个新兴的应用领域是单细胞 RNA 测序。“单细胞 RNA 测序能向我们展示,相同细胞中 RNA 表达的天然随机性,这一点非常吸引人。” Mardis 说。

Church 介绍到,他即将发表的一篇文章描述了一种新的测序方案,称为荧光原位测序(fluorescent in situ sequencing)。这一技术将荧光原位杂交和 RNA -Seq结合起来,能够计数并确定不同转录本在组织切片中的空间定位。

Church 的团队通过荧光原位测序证实,转录本会依据伤口的愈合情况在成纤维细胞中呈不对称分布。

这样的数据在十年前简直难以想象。同样,我们也很难想象 NGS 在未来十年又会发生怎样的翻天覆地的变化。

延伸阅读:

2014年技术展望:下一代测序、RCR/克隆、蛋白分析、细胞分析

了解更多:

Next-Gen Sequencing 2014 Update

;