分子植物卓越中心发布植物多组学数据驱动的上下游调控因子挖掘平台

9月8日,The Plant Journal 期刊在线发表中国科学院分子植物科学卓越创新中心/植物生理生态研究所张一婧研究组搭建的挖掘植物基因及基因组位点上下游调控因子的网络平台,论文题为Plant Regulomics: A Data‐driven Interface for Retrieving Upstream Regulators from Plant Multi‐omics Data。该工作系统分析并整合了64个植物物种上万套组学数据,以此推测用户输入基因(或列表)及基因组位点(或列表)的上下游调控因子,这一大数据驱动的平台为进行准确深入的功能及调控网络研究提供了重要线索。

随着高通量测序技术的发展,大量非模式植物特别是各种作物的全基因组序列被公布,对所研究基因及位点或由高通量数据获得的基因列表及位点列表进行功能挖掘并推测上下游调控因子的需求极为迫切。但是除少数几个通路研究相对深入的模式植物,如拟南芥、水稻外,大量植物基因的功能注释高度依赖于与模式物种已知功能基因进行同源序列比对,由于植物物种高度分化,多样性非常复杂,完全基于序列相似性预测功能准确度比较低。特别的,基于同源比对的方法无法推测上游调控因子。快速积累的组学数据提供了大量实验证据,比如,转录组数据获得的差异表达基因列表代表一组基因对于某种处理或突变体具备相似的响应,通过免疫共沉淀测序能够获得一组受相同转录因子调控的基因和位点,通过整合蛋白组学信息可以获得与一组蛋白互作最普遍的蛋白,很有可能是这组因子的核心调控蛋白。综上,通过整合多组学实验证据能够帮助准确推测上下游因子及调控网络。

Plant Regulomics整合了拟南芥、水稻、玉米、大豆、番茄和小麦6个植物物种的上万套转录组和表观组数据集,蛋白与蛋白相互作用数据,其它来源的电子注释信息,以及另56个全基因组测序的植物物种与这6个物种之间的同源基因对,通过进一步的数据加工处理,开发了一个多组学大数据驱动的基因及基因组位点(列表)的功能及调控网络挖掘平台。

该研究工作由分子植物卓越中心团队独立完成。研究员张一婧为论文的通讯作者,博士生冉晓娟、赵飞、王月均为共同第一作者。该项目受到中科院战略科技先导专项及基金委面上项目的资助。

文章链接

平台地址

分子植物卓越中心发布植物多组学数据驱动的上下游调控因子挖掘平台




;