从100万年到21小时,细数基因检测“进化史”

21小时47分12秒,这组数据被定格为了千人全基因测序的“中国速度”。

4月20日,来自“华大基因”的公号发出了一则消息:“华大基因、阿里云和安徽医科大学在深圳、杭州、合肥共同宣布,基于华大基因开发的新一代基因元计算平台BGI Online,在21小时47分12秒内完成了1000例人类全外显子组数据的分析。”

据了解,此次“千人基因组”项目共处理了1000份人类全外显子组数据,总数据量达2TB。整个分析全程无人值守、无命令操作,仅仅点击了四次鼠标就启动了11000多项分析任务,成功率也达到了100%。

全基因组测序的科研市场

从华大放观全球,从2005年第一代测序仪Roche 454单次产生400MB的基因序列文件,到2010年第二代测序仪Illumina Hiseq 2000单次产生200GB的基因序列文件,基因测序的速度在短短五年内就提升了500倍。

相比较人类基因缓慢的进化速度,有关基因组测序速度和能力的进化在这短短的20年内可谓“天翻地覆”。

1977年,当剑桥大学的F.Sanger等人发明了利用DNA聚合酶的双脱氧链终止原理测定核苷酸序列的方法之后,研究人员发表了第一个进行全基因组测序的噬菌体的基因组PhiX174(全长5375个碱基),那时在一年内可对1000个碱基对进行测序。当时研究者预计:若按照现有的测序方法,就是对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间;若是对人类进行全基因组测序,则需花费100万年的时间。

2001年,六个国家的科学家花了11年的时间、30亿美金,共同发表首个人类基因组工作草图。两年后,全世界最早的人类全基因组参考序列公布。

到了2006年,全基因组测序的花费降至了2000万美元;2007年,二代测序技术诞生,并将全基因组测序的花费近一步降低至200万美元,在二代测序技术的推波助澜下,2008年,全基因组测序成本降至20万美元,2010年降至一万美元以下。彼时,进行全基因组测序的时间成本已经从11年再次下降到了数周时间。

“其实在2008年之前,由于进行全基因组测速的花费高、耗时长,二代测序的市场我们常常称之为科研市场,也就意味着这项技术在那时是不具备普及性和临床使用价值的。”Illumina大中华区总经理赵瑞林对《第一财经日报》记者表示。

从科研市场向临床迈进 作为全球测序设备的“鼻祖”,测序设备生产商Illumina借着基因检测的浪潮在近几年异军突起,股票价格由2001年时的15.94美元上涨至如今的140美元,最高峰时期涨幅达到了24倍,市值高达205亿美元。

而对于Illumina来说,近几年最值得他们骄傲的当属Illumina HiSeq X10测序系统,对于这套系统,业内有个很生动的比方:就好比汽车工业里的十万元家轿车,从此开启了测序市场的井喷时代,它将单次全基因组测序的成本降至了1000美元以下。

“X10的诞生意味着全基因组测序市场真正进入了临床时代,事实上,Illumina现在也希望可以借此从一家纯粹的科研仪器公司转型变为一家临床公司。”赵瑞林表示。

从公共信息可知,HiSeq X Ten是一套共10台超高通量测序仪,专为大规模人类全基因组测序而打造。购买一套至少10台机器起买,每台HiSeq X价格均超过为100万美元。在2014年,一套HiSeq X Ten可在三天时间内,测出180个人的全基因组,前不久刚刚完成私有化的药明康德就曾在2014年购入过一套X10系统,希望借此布局自身的基因检测业务。

“在基因检测领域的下一个兵家必争之地就是癌症和产前筛查。事实上,早在2015年,中国就已经变成了仅次于美国的第二大测序市场,其中很多客户都来自于民营企业。”赵瑞林表示。

在前端测序市场,尽管目前三代测序还未在国内得到发展,但更多企业已经将目光放至了更为先进的四代测序市场。

相比于前面三代测序技术,第四代测序技术是真正实现单分子检测和电子传导检测相结合的测序方法,完全摆脱了洗脱过程、PCR扩增过程。作为最有希望实现1000美元基因组,甚至100美元基因组的技术,纳米孔技术具有超高读长、高通量、更少的测序时间和更为简单的数据分析,实现了从低读长到超高读长、从光 学检测到电子传导检测的双重跨越。

在2014年6月,罗氏公司以3.5亿美金价格收购了涉及四代测序概念的美国纳米孔测序公司Genia Technologies;同在6月,罗氏公司联合风投再次共同投资美国纳米孔测序公司Stratos Genomics1500万美金。罗氏公司还与IBM公司共同研发固态纳米孔技术。而Illumina和lifetech也在着力发展或投资纳米孔测序技术。

回归国内,2015年华大基因曾在全球发布了一款基因组数据分析云计算平台服务产品BGI Online,并携手阿里云合作。据了解,该平台的主要功能定位为了对海量的新一代测序数据进行分析、存储和共享。阿里云高级专家孟方介绍,BGI Online平台通过阿里云提供的混合云部署模式可以解决华大内部客户高速低延时的数据传输需求,并使得华大基因的数据存储、分析计算可以更加低成本。

“我们的目标是使用自主知识产权的测序仪和云端分析平台,在24小时内完成一个人从全基因组测序、分析到解读的全过程。虽然面临着不小的挑战,但生命的价值值得我们为之努力。这样的努力势必会使中国在未来数十年在生命科学、生物产业获得持续增长的强劲动力。”华大基因股份有限公司CEO尹烨说。

;