Nature Methods:三篇文章介绍基因组中定位调控序列新技术

近期Nature Methods杂志上发表了三篇文章,介绍了在基因组中定位调控序列的新技术,阐述了进行数据分析时面临的主要问题。科学家们利用染色质对DNAse消化和Tn5转座的敏感性,对基因组的调控序列进行定位和解读。

近来越来越多的证据显示,许多遗传学差异并非直接影响基因,而是改变控制基因开/关的调控序列。

活化的调控序列上结合有转录因子,转录因子是识别特定DNA序列的蛋白。一旦转录因子结合,就会招募其他蛋白,使附近的基因开始转录。在指定细胞中鉴定所有活跃的调控序列,对于理解基因组的作用机制非常重要。

常用的染色质免疫沉淀法,直接检测与转录因子结合的DNA序列。这种方法一次只能提供一个转录因子的信息,而细胞中可能有数百个转录因子处于活跃状态。

染色质由一系列盘绕着DNA的核小体组成。转录因子与基因组结合时,取代了核小体的位置,暴露出DNA,使其对酶的切割更为敏感。在此基础上,人们可以利用染色质对DNase的敏感性,鉴定活化的调控序列。

DNase-seq方案包括,用DNase I优先切割核小体被取代的DNA序列。对生成的短片段进行测序,并将其定位到基因组上,以鉴定对酶敏感的“染色质打开”区域。一些转录因子的结合位点,显示出高度特异性的DNase I剪切模式。这种“DNase足迹”,常被用于检测特定转录因子的结合。

Vierstra等人对DNase-seq方法进行了扩展,提出了称为DNase-FLASH的方案(Nase I–released fragment-length analysis of hypersensitivity)。他们对DNase切割后的dna片段进行了两端测序,在基因组中定位这些片段的末端,可以反映片段的长度。研究显示,当两次DNase切割发生在核小体之间的区域时,生成≤200bp的短片段。当DNase切割跨越一个核小体时,生成约200–500bp的长片段。这一方法可以帮助人们鉴定,调控序列及其旁边的核小体。

Buenrostro等人提出了ATAC-seq法(ssay for transposase-accessible chromatin using sequencing),通过Tn5转座酶,优先标记和测序核小体之间的DNA。ATAC-seq提供的信息与新DNase-seq法差不多,但步骤更为简单,需要的细胞也更少。在无法获得大量细胞的情况下,ATAC-seq更有帮助。例如,可以在癌症组织或iPS生成的细胞中,用ATAC-seq检测调控序列。此外,ATAC-seq也有望成为有用的诊断工具。

He等人也对DNase-seq片段进行了双端测序,他们主要考量DNase I浓度和片段大小对结果的影响。同样他们也发现,短片段主要源自于核小体之间的区域,而长片段跨越了核小体。研究指出,短片段对鉴定转录因子的结合更有用,长片段可以提供核小体的间隔信息。

研究显示,DNase I和Tn5的切割偏好,已经成为鉴定转录因子结合的一大挑战。研究人员使用无核小体和转录因子的“裸”DNA,展现了DNase I切割的强烈偏好。他们指出,之前许多DNase印记分析,反映得更多的是切割偏好,而不是转录因子的真实结合情况。

原文链接:

Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position

Coupling transcription factor occupancy to nucleosome architecture with DNase-FLASH

Refined DNase-seq protocol and data analysis reveals intrinsic bias in transcription factor footprint identification

;