小小的线粒体与强大的基因测序技术

线粒体(mitochondrion)是一种极微小的细胞器,直径只有0.5到1.0微米左右,存在于大多数真核生物的细胞中,是细胞进行有氧呼吸的主要场所。在这里,细胞中的糖类、脂肪和氨基酸被最终氧化、释放出最多能量,供给生命活动的需要,因此线粒体也被称为“能量工厂”或“动力室”。

除了为细胞提供能量,线粒体还参与细胞分化、细胞周期、细胞信息传递和细胞凋亡等过程。线粒体功能异常会引起多种线粒体病,通常使大脑、肌肉和心脏等耗能较多的器官受到影响。近年的研究还发现线粒体与神经退行性疾病(帕金森氏症和早老性痴呆症)、耳聋、糖尿病、衰老和肿瘤的发生有密切关系。因此,研究线粒体的结构、代谢和功能,可以帮助人类了解和治疗线粒体变异引起的疾病。

“线粒体夏娃”

线粒体拥有自己的遗传物质,即线粒体DNA(mtDNA),也叫线粒体基因组,多数是环状结构,少数是线型结构。因物种的不同,线粒体基因组的大小也不相同,一般植物细胞中最大,也更复杂,100~2500 碱基对(kb);动物细胞中比较小,约为10~39千个kb;哺乳动物的最小,约为16.5kb。线粒体基因组携带的基因数量并不多,迄今已知,它编码2种线粒体核糖体RNA(rRNA,12S及16S)、22种线粒体转运RNA(tRNA)和13种呼吸作用相关酶的亚基(每种约含50个氨基酸残基)。

线粒体基因在复制过程中相当保守,尤其是在细胞减数分裂期间不发生重排,只是位点突变率高,所以特别适合用做系统进化分析,有利于检查出物种间在较短时期内基因发生的变化,已经成为遗传进化研究中方便而得力的信息来源。而且,因为精子细胞含有非常少的细胞质,使得男性的线粒体DNA不能遗传给后代,而女性卵细胞中的线粒体DNA则会传递给后代。因此,利用线粒体基因构建的进化树反映的是母系脉络的进化关系和种群进化史。科学家曾对世界不同地区和民族的女性进行了线粒体DNA调查,认为现代人的线粒体来自于约15万年前的一位女性,这位母系祖先被称为“线粒体夏娃”,是利用线粒体基因组研究群体遗传学的典型例子。同理,通过检测现代人线粒体基因组,可以理清各民族、各地人的母系血缘关系;通过检测古生物化石的牙髓或骨髓腔中残留的线粒体DNA序列,可弄清历史上人类各个民族、种族、家族间的母系血缘关系、迁徙路线等。

隐藏的变异

值得注意的是,每个线粒体中常有2~10个基因组备份,而每个细胞中又含有几个(如酵母)至上千个(如在肝脏等代谢旺盛的器官中)线粒体不等。所以,每个细胞中就含有线粒体几十至几千个线粒体基因组。线粒体基因组在自身更新复制过程中,即使出现复制错误或者变异,也会因为细胞中其他多个备份而在表型和功能上表现不出来。这样,经过一代代复制、遗传和筛选,有些有意义的变异就被保留并富集下来,最终形成了线粒体基因组单核苷酸变异的多态性(SNP)。

这种隐藏的核苷酸变异情况,通过二代高通量测序技术,很容易被检测出来。因为二代高通量测序技术,可以一次并行对几十万到几百万条DNA分子进行序列测定,高覆盖度的测序使得细胞中多备份的线粒体基因组上携带的SNP能够被准确而高效地检测出来,用于深入解析隐藏在线粒体基因组中的变异和进化信息。

物种的测序

现代人类饲养的家畜,是被人类高度驯化的动物,与人类生产生活密不可分。为了达到人类需要的独特经济性状,其进化方向长期被人为干扰和人工选择,已形成众多的品种或品系,遗传背景非常复杂。利用线粒体基因组,可以帮助人类理清这些家畜的起源以及种群迁移和扩张路径。

随着二代高通量测序技术的完善,越来越多物种的线粒体基因组被深度测序,如人、灵长类(猴、大猩猩)、大型哺乳动物(非洲象、牛、羊、马)、鼠类(家属、负鼠)、犬、猫、鸭嘴兽、鸟类(原鸡、绿头鸭、吐绥鸡)。生物信息学工具对高覆盖度基因测序的分析,使得我们可以清楚而准确地区分在线粒体基因组中检测到的众多SNP位点,是线粒体基因组本身因多拷贝而在复制过程中产生的变异(即本底噪音),还是在进化过程中积累、沉淀下来的有意义突变。再通过分析这些有义突变位点在线粒体基因组结构中的位置、对应的核酸和氨基酸特点和功能等信息,揭示物种或种群在进化过程中对自然环境或人工选择的适应和进化规律。比如,我们曾对中国特有17头家猪、2头野猪和国外9头家猪、2头野猪的线粒体基因组进行比较分析,在排除线粒体基因组本身因多拷贝而在复制过程中产生的变异噪音之后,清晰地发现了我国小型猪种和大型猪种在线粒体基因组的蛋白编码区具有明显的差异。而这些编码蛋白是与呼吸作用和能量代谢相关的重要酶类,暗示了小型猪和大型猪在长期进化过程中,可能某些有关能量代谢相关基因的突变,通过自然或人工的长期选择后,产生了体型大小的区别。这是应用二代高通量测序技术对线粒体基因组深度测序、再利用生物信息学挖掘出隐藏在线粒体基因组序列中遗传信息的例子。

诚然,虽然线粒体DNA在遗传学研究中占据了重要地位,但是线粒体DNA序列中的信息只能反映所考察的群体中的雌性成员的演化进程,而不能代表整个种群。这一缺陷需要由对父系遗传序列(如Y染色体上的非重组区)的测序弥补。广义上来说,只有既考虑了线粒体DNA信息、又考虑了核DNA信息的遗传学研究,才能为种群的进化史提供全面的线索。另一方面,相对于基因组而言,线粒体基因组能提供的信息还是有很大局限性,有很多参与线粒体功能的蛋白是由核基因编码、运输给线粒体的。因此,必须将线粒体基因组与核基因组共同分析,才能为系统进化分析和揭示线粒体功能异常所导致的线粒体疾病提供正确的遗传学信息。在强大的新一代测序技术的支持下,相信这些科学难题都将一一找到答案,使医疗健康水平得到提高。

;