RNAcentral:非编码RNA序列的国际数据库

摘要 : RNAcentral,第一个统一所有类型的非编码RNA数据的资源,已由RNAcentral联盟启动。它聚集了来自一个专家数据库联合会的信息,并提供方便的浏览工具。RNAcentral的首次发行包含大约800万个序列。

自20世纪50年代以来,科学家曾经把RNA看作是一种中间分子,提供稳定DNA和蛋白质之间的联系。然而,在过去的十年里,很明显RNA在生物体中发挥着更广泛的作用。研究人员已经发现了很多不同类型的RNA,但是直到现在,这些数据还没有被放置在一个地方。

在RNAcentral之前,寻找由特定基因组编码的RNA,需要从几个独立的资源提取信息,例如从miRBase提取micrornA,从HAVANA提取lncRNA信息。

EMBL-EBI蛋白质序列资源带头人Alex Bateman解释说:“目前已经发表了很多的非编码rna数据,但是每种子类型都是独立保存的。这是第一次,我们有一个中心地带,在这里你可以找到所有:piRNAs、核糖体RNA等等一切。大量信息通常被锁定在补充材料中,或者只被称为非标准的基因名称。RNAcentral,是向产生像蛋白质序列那样容易访问的RNA序列,迈出的一大步。”

RNAcentral 1.0提供十种不同专家数据库的数据访问,并提供稳定的登录号,可以始终用于文献、其他分子数据库和搜索引擎中。RNAcentral网站的特点是分面检索,这可让用户根据来源、物种和分子功能,搜索不同的RNA序列。进一步的专家数据库预计将在未来发布。

RNAcentral联盟起源于Wellcome genome Campus在2010年举办的一次研讨会,当时RNA团体的成员聚集在一起,讨论集中访问RNA数据方面的不足。

曼彻斯特大学的Sam Griffiths-Jones解释说:“看到这个项目取得的成果,真的很让人欣慰。非编码RNA序列和功能性信息的增长是惊人的,并且没有显示出放缓的迹象,对这些数据通用资源的更大需求前所未有。RNAcentral联盟成员合作产生的这个资源,代表RNA领域的一个巨大进步。”

由于来自英国生物技术和生命科学研究委员会(BBSRC)的资助支持,世界各地的合作机构才能走到一起,就一个共同的问题,形成一种切实可行的解决方案。

BBSRC首席执行官Jackie Hunter教授说:“非编码RNA的基础研究有许多潜在的应用,包括疾病诊断、新疗法和生物技术。现在,由于下一代测序,可利用的数据越来越多,迫切需要信息学工具来破解它们。RNAcentral是一种至关重要的资源,将把信息整合和集成为统一数据,并提高世界各地研究人员对数据的发现和利用。”

这一资源利用EMBL-EBI的基础设施,尤其是欧洲核苷酸档案(ENA)提供的数据提交和交叉参考服务。它利用来自国际核苷酸序列数据库合作(INSDC)的全球同步数据。

RNAcentral的未来版本将包括关于RNA结构、修饰、分子间相互作用和功能的附加数据类型和信息。相关文章发表于近期的《Nucleic Acids Research》杂上,详细地描述了RNAcentral工具及特点。

论文标题:RNAcentral: an international database of ncRNA sequences

作者:生物帮

;