AJHG:基因组数据共享存漏洞,全球联盟探讨安全措施


基因组数据分享对生物医学研究的进步至关重要。基因组数据包括身份信息,然而从另一方面来说,基因组数据的分享对个人隐私造成了威胁。倘若有人从唾液及其他组织或从其他基因信息服务器获取一个人的基因组信息,他们便可进一步查询该基因组信息是否与一些疾病(如肺癌、心脏病或自闭症)有关。

关于基因组数据分享的安全性问题,目前斯坦福大学医学院研究人员正在研究如何填补数据分享漏洞让基因组数据更安全。斯坦福大学遗传学博士后Suyash Shringarpure和遗传学教授Carlos Bustamante开发了一种新技术可识别和预防网络黑客对全球基因组数据库的攻击。目前这两位研究人员正与全球基因健康联盟调查人员合作,研究结果于10月29日发表在《美国人类遗传学杂志》上,除了探讨如何填补基因组数据分享的漏洞,本研究还包括如何分析基因组混合物,例如怎样分析来自不同犯罪现场的样品等。

基因组数据库网络是研究人员之间数据共享的重要平台,研究人员可在服务器上申请访问更完整的基因信息。例如研究人员可在美国国立研究院创建的基因组数据集网络服务器(信标系统)中寻找特定的基因变异。Bustamante说,“信标系统是一个很好的解决方案,研究人员可在该系统“ping”基因组集合,且可在外部ping数据集并搜寻数据集中的特定突变,例如罕见疾病患者可在此系统中找到与其相似的其他患者。

信标系统的脆弱性,基因组数据共享存在漏洞

许多基因组数据集都和特定的疾病有关。但问题就出现在这里,若不安好心的用户在该系统的疾病数据集中获得个人基因组数据,便可根据此来判断此人或与其相关的人是否患有该疾病。在信标系统中,黑客可以剖析个体的具体情况。Bustamante表示,“与全球基因健康联盟合作,我们可以证明该系统的漏洞,更重要的是我们可以改变政策使风险降到最低。”

为了保护数据捐赠者的身份,目前Beacon Project(信标系统计划)已经采取了措施,包括鼓励信标运营商对个人基因组进行重新命名,使名称及其他信息与个人基因组信息不产生直接关联。

尽管做了这些努力,Shringarpure和Bustamante估计获取个体基因组的用户仍能在信标系统中将信息对号入座。例如在一个包含1000个个体基因组的信标系统中,斯坦福大学的方法仅需要5000次查询便可识别到具体以及相关个体的信息。

目前联邦法律并没有覆盖至所有的基因信息来保护与健康有关的个体信息,但信息披露对个体的影响是显著的。例如虽然国家反基因歧视法案不允许保险公司因个体存在基因突变而提高保险费,但该法案并不适用其他形式的保险,如长期护理、残疾或人身保险。

更好的安全措施正在研究中

Beacon Project对未来基因组的研究具有巨大的价值。填补数据共享的安全漏洞对于Shringarpure、Bustamante以及全球基因健康联盟来说非常重要。在本次论文中,斯坦福大学研究人员提出了各种补救措施,包括禁止匿名人员查询该系统、合并数据集增加搜索确切数据的难度、要求访问用户通过批准、设定用户准入限制(设定小型基因组信息坐标)。

全球基因健康联盟主席Peter Goodhand说,“我们欢迎并期待与本文作者合作与互动,以确保Beacon Project发挥最大的价值,同时尊重数据共享者的隐私。”

Goodhand还表示,该组织的缓解措施遵循隐私和安全政策,这些措施包括聚合多个信标数据以增加数据库的大小来掩盖数据的真实来源,创建一个信息预算体系来跟踪信息被披露的速度以及当信息披露超过某个阈值后设定访问限制,设定多级安全访问通道,包括对向用户申请访问并保证其没有特殊企图。

Shringarpure和Bustamante还将此技术应用于混合DNA序列的解释上,研究人员试图从许多类似的混合物中确定一个DNA序列。DNA混合物常常与取证有关,涉及微生物及生态学的研究范畴。Bustamante举例说,如果犯罪现象有多个人的DNA,DNA混合物的解释可以帮助调查人员确定一个特定嫌犯或受害者。事实上,调查人员还可在信标系统中使用类似的分析方法寻找那些在地铁站或其他公共场合与犯罪嫌疑人接触过人。

本文来源于:生物探索

欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ


;