全球联盟GA4GH开放更多BRCA变异数据,推动全球基因组信息共享
继去年十月发布第一类可公开访问的BRCA变异数据后,全球基因组学与卫生联盟(GA4GH)又发布了第二类BRCA变异数据,整合了全球公共数据库中超过1.3万个变异信息,属于研究水平证据等级。
GA4GH先后发布两类BRCA变异数据
全球基因组学与卫生联盟(GA4GH)是由350多个组织组成的国际联盟,旨在创建通用的工具和方法安全地共享基因组和临床数据。该组织去年十月发布了第一类可公开访问的BRCA变异数据,帮助医护人员和公众了解哪些变异是致病的,哪些是良性的,哪些是还没有具体分类的。第一类变异数据的分类是由一支称作“ENIGMA”的专家团队审核的,发布在BRCA Exchange门户网站上。
最近,GA4GH又发布了第二类BRCA变异数据,整合了全球公共数据库中超过1.3万个变异信息。此次的数据发布是BRCA Challenge的一部分,BRCA Challenge是GA4GH推出的一个示范项目。
BRCA Challenge临床工作小组主管Rachel Liao说,“GA4GH公开发布的第二类数据主要针对研究人员、遗传咨询人员,以及希望看到变异分类细微差别的人。”
第二类数据包含了所有公共数据库中的信息,例如NIH的ClinVar数据库、LOVD数据库、外显子集成联合(ExAC)数据库,以及千人基因组计划,包含了BRCA的变异数据并以一致的格式呈现。研究人员如今可以在BRCA Exchange网站中搜索出某种特定变异的信息列表,然后查看不同数据库的注释信息,不用再像以前一样从不同的数据库中分别下载数据,那些数据库中使用的格式、数据定义和数据元素往往不同。
Liao说,“这个计划促进了数据的合并,使数据信息能够更好地应用于研究中,最终提高变异分类的准确性。BRCA Challenge的整体目标就是提高变异分类准确性。”
如果某种变异并不在第一类数据中,可能是由于ENIGMA小组还没有审查该信息。这并不意味着还没有一个统一的变异分类标准。Liao说,“我们发现很多病人和医生在网站中没有找到某种变异信息,就会进入我们的研究部分查看证据。然而即使没有这些信息,你仍然需要进行临床决策。”
BRCA1和BRCA2是高度变异基因。这两个基因中发生的很多变异都会增加携带者患上遗传性乳腺癌和卵巢癌的风险,但是有一些突变非常罕见,因此无法确定这些突变与癌症的相关性。GA4GH希望当遗传性肿瘤检测成为最具竞争力的诊断市场之一时,BRCA Exchange门户网站可以成为提供BRCA变异信息的一站式服务平台。
诊断公司间的竞争和合作
自从最高法院在2013年判定Myriad Genetics公司多项BRCA1/2的专利无效后,之前被该公司垄断的BRCA诊断领域竞争开始增多。实验室开始在多个方面展开竞争,包括检测价格、周期和变异分类的准确性,尤其是很多诊断公司开始竞相减少鉴定BRCA基因中意义未知变异(VUS)的检测数量,这些变异与疾病的关联往往都是未知的。
Myriad公司拥有一个私有数据库,数据库中包含了接受过检测的200万患者的信息,因此与竞争对手相比,该公司能够更加明确地识别致病变异或良性变异。根据2013年的数据显示,Myriad公司具有最低的VUS检测率,其中在BRCA1中0.6%的检测会识别VUS,BRCA2中1.6%的检测会识别VUS。最近,该公司提供的数据显示,其Pheno历史加权算法判断VUS升降级的准确率超过99.5%,从而实现更加准确的分类。
但研究人员、实验室和患者群体开始鼓励数据共享和使用公共数据库,从根本上打破数据孤岛。利用一些资源,其他研究机构开始和Myriad竞争。例如,来自诊断公司Invitae和斯坦福大学的研究人员利用Invitae公司的NGS panel对病人进行BRCA1/2检测,将得到的结果与这些病人之前接受Myriad公司检测的结果进行比较,发现99.8%的结果一致。Invitae公司是使用公共数据资源进行变异分类的。
如今BRCA1/2的共享数据资源越来越多。美国犹他大学及其亨斯迈癌症研究所(Huntsman Cancer Institute)和非盈利实验室Arup去年发布了一个这些基因的开源变异数据库。Quest公司推出了BRCA Share计划,同意资助功能研究来增强通用突变数据库(UMD)中BRCA1/2变异的分类,该数据库设在法国国家健康与医学研究院(INSERM)。Ambry Genetics公司上个月资助了1万个癌症病人的外显子测序,并公开分享了整合的等位基因频率数据。
这些实验室在投资公共变异资源的同时,也开始竞争遗传肿瘤检测市场和BRCA突变检测市场。包括Myriad在内,很多实验室与一些顶尖的癌症中心合作,通过一个称作PROMPT的注册中心收集病人的变异信息,增强对遗传癌症中致病变异和VUS的理解。
BRCA变异分类的质量
然而,Myriad公司管理者认为,如今存在的公共变异数据库不应该被用到临床决策中。在去年发表的一项研究中,Myriad比较了5个数据库中对116个BRCA变异的致病分类情况,包括乳腺癌信息中心数据库(BIC)、LOVD数据库、ClinVar数据库、INSERM的UMD数据库和人类基因突变数据库(HGMD),结果发现在所有数据库中仅4个变异的分类是一致的。
那些支持数据共享和公共数据库的人也承认,公共数据库需要进行清理和定期更新,在GA4GH BRCA Exchange发布的第二类数据中,不同数据库对变异的分类就存着差异。
用户在访问这些研究水平的数据时,应该有弹窗信息提醒他们,此部分的分类信息来自原始提交者,并没有经过专家审查。作为BRCA Challenge变异分类评估的专家小组,ENIGMA的专家们一直在努力将BRCA Exchange网站中第二类研究部分的变异信息移到第一类临床级别数据中。
BRCA Exchange的第一类变异数据中约有1000个变异属于错义突变,这些变异没有明确的分类。对于截短突变(truncating variant),可以直接判断其蛋白产物是否能够正常作用。Liao提到,ENIGMA的专家们很快将会把约1500个截短突变(truncating variant)移到第一类变异数据库中。
NIH的临床基因组资源(CliGen)是专家们建立的一个临床相关基因和变异的权威资源库,该资源库目前已确认ENIGMA作为一个专业的变异分类团体。ENIGMA有一套自己的变异分类流程,但是GA4GH计划向专家们提供自动化的生物信息工具,帮助他们简化和加快分类工作。
同时,BRCA Challenge的专家们也在尝试使第二类研究水平的变异数据能够尽可能地方便用户使用。他们提出对所有变异都配一个同义词列表,确保非遗传学专家输入的不是标准术语时,也能搜索出对应的变异信息。Liao评论说,“与现有数据库相比,这将是一个显著的提升。”
GA4GH未来的计划
第二类数据的发布为GA4GH计划在今年年底发布的第三类和第四类数据打下了基础,后两类将包含病例水平证据的变异数据。这个部分的数据将不对公众开放,只有得到资格认证的研究人员才能收集这些变异证据用于分类,这同时也是为了保护提供数据的病人和家庭的隐私。
Liao说,“有的时候我们可以利用公共数据进行致病性或者良性变异分类,但是更多时候我们还需要结合个人的家系、分离分析和病情,而这些信息往往需要考虑个人隐私或者个人身份信息。”
GA4GH还希望针对体细胞癌症建立一个类似于BRCA Exchange的资源。目前该组织已经推出了Matchmaker Exchange,允许全世界的研究人员相互交流罕见疾病的基因研究;以及Beacon项目,促使研究机构安装服务器,使外部人员同样能够简单查询基因组数据。
通过这一系列的项目,GA4GH希望强调全球基因组信息共享的重要性,这也是该组织在日本京都举行的国际人类遗传学大会上公布BRCA Challenge的最新数据的原因。Liao说,“我们希望和全球的组织进行合作,把所有使用BRCA Exchange工具的研究人员、拥护者以及患者联合起来建立一个全球联盟。”
为了实现这个目标,GA4GH不久将推出一个在线社区,到时候全世界所有从事BRCA1/2基因研究的人们都可以在这个社区中进行交流。
本文来源于:测序中国
欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ