PNAS: 解码基因组的新方法

来自哥伦比亚大学的研究者们开发出了一种计算机工具,能够对基因组中最难以解码的片段进行翻译。基于这一手段,研究者们能够更进一步地理解DNA如何指导生物体的发育,衰老以及疾病的发生。

(Mann Lab/Columbia's Zuckerman Institute)

基因组相当于机体的"指导手册",它以DNA的形式储存了生物体最原始的信息,它决定了生物体的各种性状以及患病的风险。但由于该"手册"是由生物语言书写的,因此进行解码变得十分有挑战。如今,来自哥伦比亚大学的研究者们开发出了一种计算机工具,能够对基因组中最难以解码的片段进行翻译。基于这一手段,研究者们能够更进一步地理解DNA如何指导生物体的发育,衰老以及疾病的发生。

这项研究发表在最近一期的《PNAS》杂志上。

"像果蝇这么简单的生物,其基因组中也具有1.2亿个碱基对,由于工具的限制,其中大部分基因片段的信息还没有得到解析",该研究的作者,来自哥伦比亚大学的独立研究员Richard Mann博士说道。"然而,我们开发的算法则能够对这些遗传密码进行逐一解析,从而得到更加完整的DNA密码图谱"。

遗传学家满长期以来都想发现DNA背后隐藏的秘密,其中一个例子就是一类叫做Hox的基因家族。历经几十年的探索,研究者们发现尽管每个单独的Hox基因对生长特征的影响都是独立的,但hox转录因子结合DNA的序列具有极高的相似性。

2015年,作者等人发现Hox转录因子也会与其它DNA位点进行结合,尽管亲和程度较低。研究者们认为这些低亲和力的位点对于Hox多种调控效应的实现具有关键的作用。不过如何鉴定这些基因组位点仍然是不小的挑战。

为了解决这一问题,作者等人建立了分析遗传活性的计算机模型。

早在几年之前,作者等人开发了一种叫做SELEX-seq的基因测序手段,能够系统性地分析所有Hox结合位点,但该技术也存在缺陷,即需要对重复的DNA片段反复测序。虽然每一轮测序都会得到新的信息,不过低亲和力的位点仍然难以被检测到。

为了解决这一问题,作者等人开发了更为复杂的计算机算法,能够首次对SELEX-seq实验中所有序列的表现进行分析,该算法名为BRLB。

作者认为该算法能够帮助科学家们拼接转录因子结合以及激活的DNA序列,这对于寻找降低患病风险的遗传疗法十分重要。

参考文献:

Chaitanya Rastogi et al, Accurate and sensitive quantification of protein-DNA binding affinity, Proceedings of the National Academy of Sciences (2018). DOI: 10.1073/pnas.1714376115

本文来源于:生物谷

欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ

;