分子表型:Science、Nature等顶级期刊引领的热点研究


恩格斯说:“任何一门科学的真正完善在于数学工具的广泛应用。”在生命科学领域,分子表型(molecular phenotype)这一概念的出现、发展与应用正是数学与微观生命调控过程完美结合的一个典范。而且,分子表型的发展路径,正是由Science、Nature等顶级期刊所引领。

(一)分子表型的出现

可以从不同层次的窗口(window)观察生命的表现,从原子水平、分子水平、细胞水平、个体水平、群体水平、生态水平、甚至宇观水平,都可以对生命进行观察。通常,观察的记录可以叫做表型(phenotype)。近年来,从我们肉眼看得见或常规仪器可测的表型(比如身高、体重),到肉眼看不到、需要特殊仪器测定的表型,表型的内涵已经有了极大的发展。统计/数学是表型机理研究的重要手段,因此统计/数学研究对象的微观化发展,即分子表型的发展,已构成了目前生命科学领域的重要研究热点。

表型的微观化,到底可以微观化到什么程度?有意义的表型微观化可以达到基因的表达水平(mRNA丰度),而且也是目前可以理解的表型的极致了(当然,以后不能排除晶体数据可作为更细的表型数据)。其实,表型的微观化发展的思维并不难,但一步到位,将表型拓展到微观的极致,得有第一个吃螃蟹的人才行。

首先将mRNA丰度,即基因表达水平作为表型对待的人是Jansen 和Nap。Jansen 和Nap在2001年的Trends in Genetics杂志提出了将mRNA丰度纳入统计遗传分析框架的genetical genomics,可以将这篇概念性的perspective文章作为分子表型的“始作俑者”,至今已被引用805次。

在publish or perish的残酷竞争环境中,荷兰的Jansen等人并没有抢到用mRNA丰度实际数据作为分子表型研究的首发,而是被美国抢了先,Brem等人利用酵母数据抢先在2002年的Science杂志发表了第一篇genetical genomics的实际数据的研究文章,他们在文中发展了顺式eQTLs、反式eQTLs的概念,至今已被引用1048次,远远高于最早提出genetical genomics概念的Trends in Genetics文章。在高等生物中,数据收集要慢得多,成本亦更高,等Schadt等人收集完玉米、小鼠、人的数据,2003年才在Nature杂志以“Genetics of gene expression surveyed inmaize, mouse and man”为题发表出来,可能因为涵盖对象更广,至今已被引用1272次,反而比先发的酵母文章多了200多次。

genetical genomics或eQTLs引领了成千上万的研究,在Google搜索引擎中,用OR的逻辑符检索,该领域检索结果已经超过1000万个条目,是名符其实的研究热点。不过,个人感到比较疑惑的是,在后续成千上万的研究中,Jansen 和Nap文章的引用数远远小于Brem、Schadt文章的引用数。难道Nature、Science的名气已经可以掩盖10.0-20.0杂志上学术思想上的首发?亲们,你能告诉我原因么?


(二)Science、Nature等顶级期刊引领了分子表型的发展路径

mRNA丰度,一步就跳到了分子表型微观化的极致,那么分子表型下一步该如何发展?当然,是往mRNA与宏观表型之间发展。mRNA与宏观表型之间可以挖掘什么分子表型?首先自然想到的是表观遗传标记(epi-marks)!但做表观遗传的科学家们都太习惯于从湿实验角度思考问题了,真正将表观遗传标记作为分子表型的研究直到10年后才正式报到。McVicker等人在2013年的Science杂志发表了组蛋白修饰分子表型的遗传解析文章,Schmitz等人也在2013年的Nature杂志发表了甲基化分子表型的遗传解析文章。植物细胞表型的遗传解析文章也在2013年的Nature Genetics杂志发表,细胞表型无疑可以作为分子表型发展路径上的自然延伸。可见,分子表型的每一步新发展,都能在世界最顶级的Science、Nature等杂志上找到它第一次出现的踪影,或者说Science、Nature等顶级杂志引领了分子表型的发展路径。


(三)几点思考

1. 下一步,分子表型又会是什么呢?组织?器官?抑或是其他?

2. 分子表型可以从全基因组水平,以更加全面、系统、深入的视角认识微观生命调控过程,推演微观生命调控机理,可以高效地解决传统湿实验不能解决的很多问题,比如基因间调控关系的批量挖掘。

3. 数量分析手段对现今的生命科学研究越来越重要了,我们应主动接受它,而不要排斥它。随着分子表型高通量检测成本的下降,分子表型这一概念将会越来越多地应用到各个分支领域。

4. 分子表型从某种程度上提供了一种“研究范式”,湿实验科学家不要认为被抢了“饭碗”,拒绝这种“研究范式”。

5.学科交叉是创新的重要途径,分子表型这一概念是基因组学与统计遗传交叉创新的产物,并且进一步延伸到了其他组学,它为微观生命调控机理的认识提供了新颖的手段与视角。

6. 从分子表型的发展路径还可以看出,在publish or perish环境中,美国人比欧洲人更会抢先,学术竞争中尤其要“提防”老美。

;