不同的组织中基因表达更有可能遵循了一种物种特异性模式
去年年底,小鼠ENCODE(DNA元件百科全书)研究团体的成员在PNAS杂志上发表了一篇重要的论文,报告称在各种不同的组织中基因表达更有可能遵循了一种物种特异性模式,而非组织特异性的模式。例如,对比人类心脏,小鼠心脏中一些基因的表达模式与小鼠其他组织,如脑或肝脏中基因表达模式更为相似。
而在本月早些时候,芝加哥大学的Yoav Gilad在推特(Twitter)上对这些研究结果提出了质疑。在大约12条不超过140 个字符的推特博文中,Gilad提出发布在PNAS的研究结果是异常的——这是由于一些组织样品按不同的批次进行测序所导致。如果消除这种“批次效应”,小鼠和人类组织则会以一种组织特异性方式聚类,由此证实了以往的一些结果,而不再支持小鼠ENCODE研究团队的结论。
5月19日,在f1000 Research期刊发布的一篇论文稿中,Gilad和合著者Orna Mizrahi-Man详细描述了他们重新分析小鼠ENCODE数据得出这一不同结论的过程。研究人员获得了来自小鼠ENCODE研究小组的原始数据、分析程序和其他的细节。随后他们提取了有关每个样本测序时间及测序方式的信息,将人类和小鼠组织与测序通道(lanes)匹配起来。Gilad和Mizrahi-Man发现,大多数样本都是根据物种聚类分批进行的测序;小鼠组织在一个批次进行测序,人类组织在另一个批次进行测序。在5个测序批次中只有一个批次包含了来自人类和小鼠两个物种的组织。
当Gilad和Mizrahi-Man应用一些统计学方法来消除这一明显的批次效应时,基因表达物种特异性聚类现象消失。Gilad说:“当你校正了这一批次效应,以及对研究的设计时,你不会再看到按物种聚类。你会看到按组织聚类。”
方法、机器或个体实验者之间的微小差异都可以影响实验的输出结果,在其他的一些研究中也曾报道过这样的一些批次效应。为了避免这种问题,通常要设置实验使得批次效应不会与生物学变量发生重叠。Gilad说,在这种情况下对来自两个物种的样本进行更多次的测序也许会证明有帮助。在Gilad看来,不获得更多的数据,无法确定小鼠ENCODE研究关于物种特异性基因表达的结论。
约翰霍普金斯大学计算生物学家Steven Salzberg(未参与研究工作)认为这次重新分析 “全面、仔细……且真的非常具有说服力。”
Salzberg说:“他们揭示出的批次效应以一种非常严重的方式破坏了这些结果。我认为这是无法逃避的事实:PNAS论文的主要结论是不正确的。”
和Salzberg一样,有几个研究人员在推特上对Gilad和Mizrahi-Man重新分析的结果表达了惊喜。对许多人而言,这些最新的结果呼应了他们自身对去年发布的这些结果产生的怀疑。譬如,Gladstone研究所的心血管研究人员Benoit Bruneau就写道:“我终于感到轻松了。这些论文曾让我感到困惑。现在我知道了原因为何。”
原文标题:Comparison of the transcriptional landscapes between human and mouse tissues
原文摘要:Although the similarities between humans and mice are typically highlighted, morphologically and genetically, there are many differences. To better understand these two species on a molecular level, we performed a comparison of the expression profiles of 15 tissues by deep RNA sequencing and examined the similarities and differences in the transcriptome for both protein-coding and -noncoding transcripts. Although commonalities are evident in the expression of tissue-specific genes between the two species, the expression for many sets of genes was found to be more similar in different tissues within the same species than between species. These findings were further corroborated by associated epigenetic histone mark analyses. We also find that many noncoding transcripts are expressed at a low level and are not detectable at appreciable levels across individuals. Moreover, the majority lack obvious sequence homologs between species, even when we restrict our attention to those which are most highly reproducible across biological replicates. Overall, our results indicate that there is considerable RNA expression diversity between humans and mice, well beyond what was described previously, likely reflecting the fundamental physiological differences between these two organisms.
作者:秩名