Nat Meth:新型算法可确定基因组突变位点


导读:冷泉港实验室的研究团队设计了一种全新的方法来分析基因组序列——Scalpel,通过复杂的算法精确定位插入或缺失突变的基因组位点,此方法可用于患有孤独症、强迫症以及妥瑞士综合症的病人。相关研究成果发表于8月18日的Nature Methods上。

人类基因组包含有30亿个碱基,很难想象插入或移除一个DNA碱基会对身体健康产生多大的影响。而实际上,这种插入或删除确实会戏剧性地改变生物功能,甚至造成诸如孤独症或癌症等多种疾病。但是,想要察觉这些突变是十分困难的。最近,冷泉港实验室(CSHL)的一个研究团队设计了一种全新的方法来分析基因组序列,精确定位插入或缺失突变的基因组位点,此方法可用于患有孤独症、强迫症以及妥瑞士综合症的病人。

人类基因组中的“字母”包含了蛋白质信息,三个“字母”构成一个“单词”——三联体密码子,通过密码子进行翻译。众多单词再组装成一个句子,即成为一个特殊的蛋白质。在此过程中,如果有一个字母意外插入或删除,那么三联体密码子则会移位,导致后续的所有序列全部改变,这种移码突变将会造成蛋白质错误翻译。丢失单个蛋白质也会对细胞造成毁灭性的影响,例如功能紊乱,甚至是一些严重疾病。

DNA的插入和删除使得基因组的长度和序列千变万化,每个突变的波及范围从一个至上千个DNA碱基不等,并且这些突变也可以是重复的。尽管现如今基因组测序技术已经有了突破性进展,然而突变的多样性仍然使得确定突变位点充满挑战。

CSHL的科学家们,包括助理教授Mike Schatz,、Gholson Lyon、Ivan Iossifov和教授Michael Wigler,设计了一个发掘现存基因组数据集以寻找突变位点的方法。这一方法称作Scalpel,它是从集合所给基因组区域的所有序列开始。Scalpel,包含了一个计算机公式或者说算法,然后为所给区域创建一个新的序列,这就像拼凑谜语的破碎片段一样。

定量生物学家Schatz说到:“这些突变就像基因组中的精细切口,在这些切口处DNA插入或者删除,Scalpel为我们提供了一种放大镜头,使得我们能够精确定位切口的位置。”这些信息对于理解疾病相关突变是十分关键的。8月18日的Nature Methods上发表了这一研究,研究团队利用Scalped方法对患者样品进行了突变检索。CSHL的一位研究人员Lyon,也是一位职业精神病医师,他和他的团队对一位患有严重妥瑞士综合症和强迫症的患者基因组进行分析,确定并证实了超过一千个突变位点,从而展示了此种方法的精准度。

CSHL团队展示了一种类似的分析方法用于检索孤独症相关突变。他们建立了一个包含有593个家庭的数据集,这些家庭中都是只有一个孤独症患儿,而其他家庭成员均正常。研究人员发现593个家庭中具有总数达到330万个的突变位点,且大多数都为相对无害的。但是,仍有几十个突变是明显具有孤独症特异性的。Schatz说:“所有这些都增进了我们对于自发突变导致孤独症的理解和认识。”

然而,此工具应该获得更加广泛的应用。“我们正在和植物学家、癌症生物学专家以及其他专家学者进行合作,寻找突变位点”,chatz说,“这个工具十分强大,我们正试图揭示生命树中,基因组新片段的影响。”

;