系列 | NGS测序十年记:Solexa闪亮登场
早些年,人们在谈到新一代测序仪时,经常会提起Solexa,而不是Illumina。这是一家低调的公司,规模也不大,但是测序技术却非常新颖。它开发出的测序仪,在通量上领先于其他竞争产品。收购Solexa,也成为Illumina的转折点,从此踏上高速发展的道路。
Solexa成立于1998年的夏天,创始人是剑桥大学的化学家。它的核心是可逆测序技术,也就是在大规模并行的芯片上,通过直径为1微米的孔,每次测序一个碱基并成像。他们的目标是每次运行能获得10亿个碱基(1 Gb)。这在当时简直就像天方夜谭。风投告诉他们,如果能实现1 Gb的十分之一,就已经很不错了。
之后经过一系列改进,并从瑞士测序公司Manteia处收购了簇生成技术,也就是将DNA链扩增成含有1000个相同分子的簇,Solexa的测序仪渐入佳境,读长也从最初的12 bp稳步提高到25 bp。最后,研发人员开始建立IT系统,来管理和评估数据的质量。至此,Solexa的测序仪已初具雏形。
2005年初,Solexa决定测序第一个真正的基因组,著名的ΦX174噬菌体基因组。2月的一个周末,生物信息学家Clive Brown发邮件给同事,标题上写着:“我们做到了!”噬菌体基因组被重新测序,且准确性超过99.9%。有趣的是,他们并没有发表文章。他们感兴趣的是专利。
过了一年,Solexa正式推出1G Genetic Analyzer,宣称能够在3个月内以10万美元完成人类基因组测序。对于10万美元的数字,CEO John West是这样解释的:“人类基因组有30亿个碱基,重测序的覆盖度大约是15倍。因此需要45亿个碱基。如果每个运行要两天,那就是90天。流动槽的定价将从3000美元降至1000美元,因此45个流动槽是45000元。如果考虑到仪器价格(40万美元)和五年折旧,那么三个月就是20000元。”
不过,West的承诺在2006年并没有实现。对于30 bp的读长而言,人类基因组的组装是一项巨大的信息学挑战。当时,Sanger研究院每周已经产生了10-15 Gb的数据。Clive Brown开发出一款名为the pipeline的软件给客户使用,之后,它演化成为大家熟悉的CASAVA。
2006年11月,Illumina CEO Jay Flatley向Solexa发出了6.5亿美元的收购要约,以补充Illumina当时的基因分型和基因表达平台。此次收购被剑桥大学新闻办公室认为是“剑桥大学最成功的商业化故事之一”。Flatley表示:“这次收购可能会被证明是最成功的收购之一,以及生命科学史上的新技术引进。”
Flatley的预言并没有错。到2007年2月,Illumina已经售出了12台仪器,之后又接到了几十个新订单。尽管它的读长远不及454,但通量和每Gb的成本相当有利。到年底,GA仪器的安装数量已超过200台,并在2008年再次翻番。2008年春天,Illumina推出了GA II,硬件和软件都经过升级,读长提高到50 bp,通量达到每次运行3 Gb。彼时,他们终于达到了10万美元人类基因组测序的里程碑。
之后的故事大家也许都听过了。2008年5月,荷兰科学家利用GA首次绘制出女性的个人基因组图谱。11月,《Nature》杂志发表了三个人类基因组图谱:炎黄一号 – 第一个亚洲人图谱;第一个癌症病人图谱;第一个非洲人图谱。这都有GA的功劳。
当时,Illumina并非没有竞争对手。除了454,Sanger测序的领导者ABI也在开发新一代测序平台。Illumina抢先进入市场,拔得头筹。正如Illumina科学家John Milton 所言,这是GA领先SOLiD系统的主要原因。“一旦进入基因组中心,每个人都经过培训,那么他们就会坚持使用[这种技术]。”这也是Sanger研究院坚持使用Illumina平台的主要原因。
当然,ABI并非等闲之辈,他们也在奋力追赶。