胡松年最新文章:利用转录组数据分析非编码RNA

基因转录表达是一个复杂、精确并具有时空特异性的过程。目前对转录组的研究主要集中在蛋白编码基因上。近几年,一个新的转录组研究工具——大规模并行cDNA测序技术(RNA-seq)为更深入地研究转录组带来了希望。来自中国科学院北京基因组研究所的胡松年研究组近期发表文章,提供了更加全面的对小鼠非编码RNA的注释信息,为小鼠非编码RNA的功能和进化研究奠定了基础。


基于第二代测序技术的大规模并行RNA测序技术(RNA-seq)的发展为人们提供了一个前所未有的方法来无偏差地鉴定非编码RNA,特别是在哺乳动物中组织特异性表达的低丰度非编码RNA。大幅度地提高了测序通量的RNA-seq技术促进了后续转录本丰度的测量。与早期的基因表达系列分析(serial analysis of gene expression, SAGE)和表达序列标签(expressed sequence tag, EST)等测序方法相比,RNA-seq具有捕获几乎全部转录本的能力。另外,与多聚腺苷酸RNA-seq(mRNA-seq)方法相比,去核糖体RNA的RNA-seq(rmRNA-seq)被认为具有更高的准确性与全面性。

随着RNA-seq数据的快速增长,非编码RNA特别是lincRNA也被快速鉴定出来。目前,在小鼠、人、黑猩猩等生物中已发现了几千个lincRNA。一些新发现的lincRNA的功能已经得到了很好的验证。这些lincRNA通过多种作用机制来发挥各种功能,包括表观修饰和基因表达调控,以及作为蛋白信号复合物的“支架”等。

最近研究报道,大多数剪接事件是高度组织特异的,并且lncRNA在特定组织有严格的表达模式。为了阐释小鼠非编码RNA的多样性和动态变化,在这项研究中,研究人员开发了一套流程来鉴定小鼠非编码RNA。

通过覆盖了主要组织类型的15个小鼠组织数据(14个公共数据库中来自ENCODE的mRNA-seq数据和1个自产的rmRNA-seq数据),鉴定出了16249个非编码基因。与蛋白编码基因相比,这些新鉴定的非编码RNA具有表达量低、组织特异性强和保守性低的特征。这一研究不但扩展了小鼠非编码RNA数据集,而且为小鼠非编码RNA的功能研究提供了数据来源。期望通过此工作为非编码RNA研究提供一个新的视角。

利用RNA-seq数据,可以鉴定出大量的非编码RNA,特别是lincRNA,并且发现这些非编码RNA是多个生物学过程中重要的调控因子。利用深度测序获得的15个小鼠组织RNA-seq数据探索非编码RNA在小鼠不同组织中的多样性和动态变化。依据自定的标准,在这15个组织中共鉴定出16249个非编码基因(对应21569个非编码RNA)。研究这些非编码RNA的多种特征,可以发现与蛋白编码基因相比,非编码RNA通常比较短,外显子个数少,表达量低,组织特异性强。而且,这些非编码RNA有明显的转录起始和转录延伸信号(H3K4me3、H3K27me3、H3K36me3修饰,RNAPⅡ结合位点以及CAGE)的富集。基因集富集分析结果表明,lincRNA与多个生物学过程相关,如免疫反应、肌肉发育和有性生殖等。

这一研究提供了一个鉴定和分析非编码RNA特别是lincRNA的方法。更重要的是,研究拓展了目前小鼠的lincRNome,为今后lincRNA的生理学功能研究奠定了基础。这项研究获得的这些非编码RNA的注释信息可以为功能实验提供数据源。每个lincRNA特定的功能还需要进一步的实验验证,就像验证生存和大脑发育所需的lincRNA那样。希望将来对lincRNA的生理学和病理学研究可以在人类疾病治疗中得到应用。


参考文献:Zhao Y H, Liu W F, Zeng J Y, et al. Identification and analysis of mouse non-coding RNA using transcriptome data. Sci China Life Sci, 2015, 58, in press, doi: 10.1007/s11427-015-4929-x

本文来源于:生物通


欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ

;