微小基因smORFs: 一直被忽视的基因宝藏
生物探索,2013-08-26
导读 近日,科学家发现一种小开放阅读框(smORFs),由于这种基因序列长度很短,编码的氨基酸通常小于100个,因此很难被发现和鉴别。而最新的研究显示,果蝇和人类体内拥有同源的smORFs,它们共同控制心肌的收缩,这表明这种smORFs在5.5亿年的进化过程当中非常保守。
人类与果蝇的心跳都依赖于一种微小的基因,由于它们长度很短,常常被人们忽略。这一类基因所编码的蛋白质仅有30个氨基酸甚至更少,属于一个神秘的序列组群,叫做小开放阅读框(smORFs)。
人类基因组包含成千上万的smORFs,但是由于长度太短,它们很难被鉴别。除了少数已被验证的个例外,没有人知道它们究竟起什么作用。但是同源的smORFs能够同时控制人类和果蝇的心脏,经过5.5亿年的进化,这一角色仍然保留着。近日,苏塞克斯大学的Juan Pablo Couso找到了一些证明这些微小基因重要性的证据,引发了人们对这一类基因的关注。他的研究论文近日发表在Science杂志上。
Couso说:“可能有成千上万的这类基因有待我们分离、鉴定和研究,遗憾的是我们居然一直错过对它们的发现。”
大多数的人类蛋白约包含500个氨基酸,而根据定义,smORFs只编码含有100个或更少氨基酸的蛋白质。使用传统的方法,很难将这些小基因与随机序列区分,“这些小基因逃过了传统基因发现算法,因此大部分发现都是无心插柳,” 哈佛大学的生理学家Alan Saghatelian说。
例如,在2003年,Couso注意到他的一个果蝇的腿比正常果蝇少。后来他和研究人员们发现,这种畸变是由发生在tarsal-less的突变引起的,而这个基因十分微小,仅仅编码11个氨基酸。然而,tarsal-less只在昆虫和一些甲壳类动物中存在,因此拥有更广泛意义的smORFs仍然有待研究。“论文的最大突破是我们发现了一种新的smORF,它在人类和动物之间进化相当保守,” Couso说。
Tarsal-less最初被描述为一个能够调控其它基因的长非编码RNA(lncRNA),这种RNA不被翻译成蛋白质。通过研究果蝇体内类似的lncRNAs,Couso实验室的一个学生Emile Magny鉴定出了两个smORFs,分别由28和29个氨基酸组成。这两个smORFs都是在pncr003:2L(现更名为sarcolamban)基因中找到的。
Sarcolamban在肌肉(包括心肌)内表现活跃,当Magny删除了该基因,果蝇出现心跳不稳定的情况——这个缺陷可以通过添加这两个smORF编码的肽来解决。在心脏内,sarcolamban在肌质网表现活跃,肌质网通过释放大量的钙使肌肉收缩,以响应神经元发出的电信号。倘若没有 sarcolamban存在,钙的释放量降低、释放时间简短,导致肌肉收缩不规律。
该研究小组还发现,人类体内含有sarcolamban的同源基因——编码30个氨基酸的sarcolipin和phospholamban。这两个基因也同样控制着肌质网的运动,其中sarcolipin在前人的研究中已经表明与心率失常相关。“这个基因是众所周知的,因为通过临床研究证明其与心律失常有关,但还没有人证实这其实是由smORF引起的,”Couso说。
尽管历经了5.5亿年的进化分离,这些来自共同祖先基因的smORFs,似乎在心脏控制上发挥着相同的作用。研究小组证实了这一点,研究人员展示了人类和果蝇的smORFs 可以互换:人类的sarcolipin和phospholamban能够改善果蝇因sarcolamban缺失造成的心律失常现象。
这可能仅仅是冰山一角。几个研究小组通过系统搜寻各种基因组已经发现了几千个smORFs,但它们的作用还不清楚。“我们可以确定,它们就存在于那里,但是还不知道它的功能,新的工作表明,这些元素不仅是未知的,而且非常有趣,” Saghatelian说。
Couso怀疑大约有五分之一的lncRNAs包含了被用来制造蛋白质的smORFs。他表示,在这个新的基因池里不知道还会有什么新的发现,未知的东西太多了。
补充文献:Conserved Regulation of Cardiac Calcium Uptake by Peptides Encoded in Small Open Reading Frames
(DOI: 10.1126/science.1238802)