基因测序携大数据打通上下游

新技术和新需求让基因测序、精准医疗以及相关设备器械领域逐步实现从技术端口向健康管理平台的角色转变。围绕生命医疗大数据,产业链上中下游都在回归健康管理、临床诊疗本质,数据与商业逻辑深度结合,促使传统基因测序和相关器械设备领域加速融入医药产业链。

数据融入临床需求

近年来,全球基因组学应用行业不断实现技术突破,行业发展势头良好,科研、医疗卫生机构和普通民众对基因测序的接受程度越来越高。据BCCResearch预计,基因测序行业将保持快速增长势头,2020年市场规模将达138亿美元,年复合增长率为18.7%。

由于基因科技的大规模应用必须建立在大量基因数据的积累和解读基础之上,所以基因测序产品和生物信息分析是基因检测细分市场的瓶颈和核心,其中的数据解读与服务是整个行业最有价值的部分,体现了基因公司的研发实力,拥有先进技术和能力的企业便具备了生命健康产业的核心竞争力。

在近日于深圳举行的“第二届基因组云计算技术开发者大会”上,北京荣之联科技股份有限公司董事长王东辉称,基于基因检测和精准医疗产生的大数据产业,未来发展方向主要包括为B端用户提供数据服务和为C端用户提供健康管理。“颠覆传统信息分析以计算为中心的技术架构,转变为‘以生命数据’为中心;在医疗数字化方面,围绕医学智能辅助诊断、影像三维可视化系统,将疾病治疗从依赖二维经验转变为三维、可量化的数字体系,显著提高诊断精准性。”

从学术突破到工具国产化,中国基因测序器械设备产品和检测临床服务正在逐步融入医药核心产业链条。药明康德集团企业明码生物首席技术官、中国区负责人孙洪业博士表示,基因数据只有交换才能创造价值,而分析计算和共享的基础是标准,只有依靠标准化的计算能力和分析产品才能支持临床大型队列研究和药物研发转化,从输入、过程、结果三个环节提供完善流程和可视化分析。

以一个美国CLIA认证实验室的病人为例,其样本中获取的临床级别测序数据,参照已有病人的测序数据,利用基因组注释和临床序列分析工具,通过数据拼接和变异寻找,比对全基因组数据进行深度分析低频变异,测序与解读均具有不可替代的重要性和唯一性。显然,从感染性疾病,到基因性出生缺陷和恶性肿瘤,从精准诊断、治疗到康复,基因测序及相关器械设备产品将更全面地提供精准的检测、完善的解决方案和有竞争力的价格,满足未被满足的临床需求。

横向资源协调合作

创新制造以智能化为典型特征,要求中国医药企业以新技术提升运营效率。精准医疗是未来医疗行业的发展趋势,而精准医疗发展必须依托大数据平台,因为平台运营与数据服务是生物医疗产业发展的重要环节,基础设施供应商合作并采用联合运营的方式,才能为医疗机构、测序企业等数据提供方企业提供产业支持保障。

值得关注的是,从生命大数据提供方企业的角度,包括华大基因、诺禾致源、金域检验、药明康德、达安基因等,数据都需要“存、管、算、察”的强大核心功能支撑,以实现数据空间分布式存储应用,解决存储空间和数据持久化、数据解耦、分级部署、数据发现、动态重组、信息分析调度、跨集群分布式计算等复杂性问题。

随着人类基因组测序成本以“超摩尔定律”速度下降,与之相匹配的基因组数据分析成本也在下降,尤其是在2016年至今,短短一年,基因数据分析成本的下降速度远远超过了基因测序成本下降的速度。现在,单个人的全基因组数据分析成本已经降低至100元人民币以内。

基因大数据分析包括十几个步骤,如果每个企业做数据分析面对不同的步骤选择差异化方法,如何来组织不同的工具更优地高效分配计算任务,这是目前整个基因测序、云计算、器械设备研发等软硬件企业都在致力于优化的战略性工作。北京聚道科技(GeneDock)有限公司CEO李夏戎指出,不仅需要每个企业聚焦自身的底层数据优化,还需要产业链横向跨步骤协同。“包括GATK算法优化,加速计算运转过程,减少CPU开销,并且同产业链合作伙伴一同将技术封装,制定数据压缩、存储方案;基因测序公司也需要将数据调整成分布式,从而协同开发更加易用的操作流程。”

华大基因CEO尹烨表示,检测成本下降,如今已不是单个公司凭技术挖掘就可以解决的,“从上游医疗器械设备厂商,到中游基因测序企业,再到下游健康服务平台,基因检测产业基于生命大数据各环必须共有、共为、共享;全行业预计到2020年能够将单个人的全基因组测序和分析总费用控制在2000元人民币以内,数据分析流程标准化和费用快速下降,将有望提前实现行业预期。

;