纳米孔测序技术尚不成熟

纳米孔测序,是国际上最受人关注的测序技术之一。其创新的电信号检测和单分子长链测序,让全世界的科研工作者翘首以待。作为纳米孔技术的领跑者,英国牛津纳米孔公司今年在全球选择了几家著名的实验室,测试它们的样机。今年的美国人类遗传学学会年会于10月18日开始在圣地亚哥举行,笔者有幸亲眼目睹了牛津纳米孔公司MinION的现场演示,技术之创新,令人惊叹。然而,在仔细研究了纳米孔测序仪的技术参数之后,笔者认为:纳米孔测序目前尚不成熟。

技术不成熟之疑

首先是尺寸问题。

MinION的尺寸之小,大大出乎笔者意料,竟然只有一支笔的长度,重大约100克,太神奇了。要知道,无论是Illumina、Pacbio还是IonProton都是100斤以上的大家伙。MinION完全颠覆了测序仪的形象,从第一眼看到MinION,我就觉得纳米孔技术被称之为第四代基因测序仪,丝毫不为过。MinION直接通过USB连接到笔记本电脑电脑上,原始的电流信号通过网络传到英国的服务器上,进行碱基识别。

其次是测序长度。纳米孔测序没有测序长度的说法,因为它完全颠覆了测序读长的定义。事实上,它总是能够完整地把一条DNA链从头测到尾,因此它的测序读长就是DNA的长度。极端的情况是,一整条染色体都可以从头测完,但是一般来说样本制备时DNA会断开。根据加州大学圣克鲁兹分校(UCSC)报道的用户使用结果,一般读长平均为1kb~5kb,这个读长完全是因为样本打断到了这个尺寸。我看到最长的读长竟然长达120kb,太神奇了! 也就是说,纳米孔测序一次读长就可以覆盖大部分的病毒基因组了。对于很多小基因组,连组装都省去了。纳米孔的平均读长可达4.3kb。毫无疑问这是迄今为止所有测序仪中测序最长的。

再者是测序错误率。纳米孔测序错误率非常高,高到现有的序列对比软件都无法应对。UCSC的生物信息学专家测试了BWA、Bowtie等等,每一种都不太适合。而测序错误率也因软件不同而相差巨大,大约为35%的错误率。具体而言,平均10个碱基,就有3.5个测序错误。其中3%的插入错误,16%的删除错误,16%的错配。高达35%的错误率意味着基因突变检测成为纳米孔测序的禁区,也成为纳米孔测序的致命弱点。纳米孔技术无法像PacBio一样做环形测序,纳米孔公司的人也承认没有找到大幅度降低错误率的办法。纳米孔测序的错误率是物理学中的一个基础问题,即物体的尺寸小到纳米级别时,测量时的随机性就成为一个难以逾越的屏障。

还有测序速度的问题。一个MinION有500个纳米孔在并行测序,每个孔每秒测30bp,因此,要测到1G的数据,需要3天时间。在测大型基因组,比如人的基因组时,纳米孔测序在速度上并无太大优势,因为它并行的通量的限制。但是,在测病毒、细菌等小型基因组时,纳米孔测序的速度优势就非常明显。

样本的制备也有点让人失望。原本说是只要DNA提取出来就可以直接上机测序的,而事实上需要四步,最短要90分钟,分别为打断、末端修复、末端加A和加接头。这样做的主要目的是降低DNA穿过纳米孔的速度。

纳米孔测序的应用及销售

纳米孔测序最大、最有优势的应用是什么?

首先,英国一所大学介绍了使用MinION的快速测序,能够在20分钟内检测出沙门氏菌。在传染病快速检测方面有明显优势。

其次,在人基因组复杂的区间,比如HLA,纳米孔的超长读长有很好的应用。利用长度长的优势,和二代测序结合,协助组装基因组。

第三,纳米孔的长片段测序和Illumina短序列测序相结合,方便基因组组装。

但是,纳米孔测序不适合做无创产前诊断、肿瘤基因突变,也不适合做新生儿遗传性疾病筛查。

什么时候开始销售?目前尚无任何关于纳米孔技术何时进入市场的消息,因为纳米孔公司自己承认技术还不成熟,生物信息学工具缺乏,不具备进入市场的条件。纳米孔公司的策略是,先给少数专业的实验室测试,鼓励测试用户开发基于纳米孔的测序应用,开发适合纳米孔的生物信息学工具,这一过程也许需要两三年,等这些条件具备之后再开始市场销售。

总结起来,纳米孔技术产品的出现意味着第四代测序技术的诞生。但纳米孔测序真正给基因组学研究和临床应用带来重要的变化,还有非常长的路要走。也许10年之后,我们能看到一个成熟、快速、准确的第四代测序。

(作者系南方科技大学副教授)

;