对话EBP团队中国成员:数据将免费对外共享

比人类基因组计划更宏大的地球生物基因组计划(Earth BioGenome Project, EBP)即将启动,目标是破译地球上所有生命的基因组。华大基因成为该项目的发起者之一,并有两名科学家加入了地球生物基因组计划团队。

近日,地球生物基因组计划参与者之一、深圳国家基因库副主任、生物多样性基因组学研究负责人张国捷博士近日在接受澎湃新闻(www.thepaper.cn)记者邮件采访时表示,开展地球生物基因组计划最大的困难在于,需要展开全球范围内的协作,项目的产生的数据量会达到1EB(1EB=1024TB,1TB=1024GB),庞大的数据量和运算量将极大地挑战IT存储和运算技术。而由华大基因运营的中国国家基因库未来将在物种资源和基因组数据信息保存上发挥重要的作用。

在此之前,“人类基因组计划”“曼哈顿原子弹计划”和“阿波罗登月计划”被称为自然科学史上的“三大计划”。而地球生物基因组计划比人类基因组计划更宏大,它是第一个真正的全球大型基因组测序项目,号称要对“地球上的所有生命”进行测序。该项目将首先集中完成约9330个真核生物科级别代表性物种(eukaryotic family)的基因组,从而获得与人类参考基因组相当或比人类参考基因组更好的参考基因组。接着,在14万-20万个真核生物属(eukaryotic genera)中,对来自每个属的一个物种进行基因组草图绘制。最后,对剩下的150万个已知的真核生物物种(eukaryotic species)的基因组进行低覆盖测序。

“不同的物种与人类一起组成了大自然生态系统。地球的每个角落也都能找到生物的存在。要了解整个地球的生物信息,就需要组成全球共同协作的工作计划,以完整地覆盖地球上的所有物种。”张国捷向澎湃新闻记者表示。

澎湃新闻了解到,华大基因在生物多样性基因组学研究上已经有十几年的积累,此次受到邀请加入这一计划,成为项目的发起单位之一。地球生物基因组计划的官方网站显示,全球共有140余家大学及科研机构参与其中,其中不乏来自哈佛大学、耶鲁大学、剑桥大学等名校的专家学者。华大基因理事长杨焕明院士与张国捷也成为该项目的成员。除了华大基因,中国参与该项目的机构还包括:中国沈阳生态应用研究所、中国科学院土壤研究所、中国科学院青藏高原研究所、北京动物园、浙江省微生物研究所等。

张国捷向澎湃新闻记者表示,相比此前已经开展的人类基因组计划,地球生物基因组计划需要基于新的样品存储标准,对全球物种资源做更精细和深入的调查和收集。该项目会对精细度不同的基因组进行分析和进一步测序。

“精细的基因组图谱不仅可以告知有哪些基因,还能知道基因的顺序,基因的控制开关元件等对基因功能有重要影响的信息。基因组框架图可以提供绝大多数的基因信息,可满足大部分的研究需要。”张国捷解释称。

地球生物基因组计划产生的数据量将超过1EB,相当于1亿部高清电影,播放2.3万年。张国捷项目目前面临的困难就在于庞大的数据量和运算量将极大地挑战IT存储和运算技术。这一工作需要全球协作,不是一个国家能主导和完成整个计划。

张国捷指出,制定测序标准是工作的第一步。眼下未解决的难题还包括经费的筹集、样品资源收集、数据的存储和计算、公众以及人才的教育等问题。但他相信通过大范围的国际协作,相信这些问题都将可以解决和克服。

尽管目前项目分工还未确定,但张国捷表示,华大基因在过去数十年中的研究积累的基因组学测序和分析技术,以及长期积累的学术协作网络,将在其中发挥重要的作用。同时,华大基因运营的国家基因库也会在物种资源和基因组数据信息保存上发挥重要的作用。

地球生物基因组计划项目组预计项目需要40亿美元的投入,若资金到位后,该计划有望在十年内完成。而此前,人类基因组计划花费的时间长达13年,资金投入30亿美元,但其数据量却不可与地球生物基因组计划同日而语。

张国捷表示:“这主要得益于测序技术的进步,极大地缩短了测序的周期和成本。高通量测序可以同时高效地对多个物种进行测序。”

据了解,人类基因组计划的完成,不仅推动全新DNA技术的诞生,其中许多技术都成为现代医疗领域的核心技术,而另一方面,也催生了一个价值200亿美元的巨大市场。公开资料显示,目前基因测序的成本已经从最初的1亿美元降至1000美元左右。而地球生物基因组计划将继续推动基因测序成本的下降,由此而来的产业受益面将继续扩大。

张国捷表示,未来地球生物基因组计划的数据将会免费与社会共享,这些资源和信息在基础研究、农业、医药、卫生方面将有潜在的广阔应用。

以林木业为例,在人类演化和生活的进程中,人类学会了用经济价值和企业利润来决策如何使用土地,但对某个自然区域之于地球的整体生存能力是盲目的。森林可以作为木材获得市场价值,同时也能作为下游城市的水净化系统,这种自然系统的能力区别于经济价值被称为自然资本。而地球基因组计划所收集的数据在未来将帮助人类构建一个经济分析的框架和中心,以促进未来恢复自然或开发的工作。而地球基因组的工作就是构建这一框架的早期阶段。

在过去数年内,华大基因一直在鼓励民众参与到基因测序的项目中。此前,华大基因在香港开展的紫荆花基因组项目已经成功地向公众募集了足够的经费。未来,地球生物基因组计划也将吸引更多的IT界人士参与,组织开发更为友好简便的分析工具,也许会让更多的公众参与数据的分析。

除了积极参与地球生物基因组计划,华大基因还在人工合成染色体方面做出了贡献。3月10日,国际顶级学术期刊《科学》,同时刊发了中国科学家4篇研究长文,介绍了真核生物基因组设计与化学合成方面的系列重大突破,在该项目中,我国人工合成了4条真核生物染色开启了“再造生命”新纪元。而该项目中也有来自华大基因的科学家。

华大基因相关人士向澎湃新闻记者介绍,破解生物基因组与人工合成染色体,就好比“读”和“写”两个方面,二者相辅相成。

;