解开人类宏基因组奥秘的统计学突破


今天,在西雅图举行的2015年联合统计会议(JSM 2015)上,统计学家和生物群落研究专家Katherine Pollard指出,统计学领域取得的许多进展,正在帮助我们解开人类微生物组(生活在人体表面和人体内的大量微生物)的奥秘。

Gladstone研究所高级研究员、加州大学旧金山分校流行病学和生物统计学教授Pollard,在一次关于统计学、微生物组和人类健康的邀请会议上,做了题为“Estimating Taxonomic and Functional Diversity in Shotgun Metagenomes”的报告。

Pollard指出:“我们才刚刚开始了解微生物在人类生物学中发挥的复杂作用,很显然,微生物菌群的变化跟宿主的疾病有关,有时候会引发或治疗疾病。一些最好的证据与自身免疫性疾病相关,这类疾病在美国呈上升趋势,也许是由于抗生素的使用,也可能是由于在童年期间缺乏接触不同的微生物。‘卫生假说’认为,健康风险不能归因于人类遗传学和行为,可能来自于个人之间的微生物组成差异。”

更重要的是,一种给定的微生物物种,当存在于两个人体内时,可能分享的相同基因还不到50%。这些差异与微生物群落的功能能力有关,包括糖代谢、生物合成和双组分系统相关的基因。两个人虽然在他们肠道中具有相同的细菌物种,却可能与这些细菌之间发生非常不同的相互作用,因为不同的菌株不总是做同样的事情。”

因为这个原因,非常重要的是,我们不仅要确定一个给定样品中存在的微生物类型,而且要确定每个菌株的遗传构成。然而,这提出了一个相当大的数据挑战,要求精确分析宏基因组数据的统计分析方法和软件有所突破。Pollard说:“对人体中微生物总DNA样本的宏基因组测序的发展,已经使我们能够估计特定微生物和微生物基因的丰度。但是,正如任何新技术一样,宏基因组学有很多偏差和错误,在我们精确比较样本数据之前必须进行解析纠正。这限制了我们对于‘在许多环境中微生物变异的范围和影响’的认识,最重要的是人类肠道微生物组。”

宏基因组学带来了许多分析上的挑战,从DNA序列读数错误,到解码这一序列来自于数百种微生物中的哪一种。一个最大的问题在于,一个给定的人,其体内的微生物菌株,从未被测序。据估计,即使在研究充分的人类肠道微生物组中,平均而言,43%的物种丰度不能通过可用的微生物参考分析方法而捕获。

为了解决这个问题和其他微生物的研究问题,Pollard和生物信息学研究生Stephen Nayfach,开发了一套新的统计软件,可快速、准确地估计宏基因组中微生物的存在和作用。他们的程序——称为MicrobeCensus、ShotMAP和PhyloCNV,取得了重大的方法改进,使科学家可以使用短至50个bp的测序读长,来准确地量化人类微生物组中的特定菌株。

使用这些新的工具,Pollard的实验室研究发现,与瘦人相比,肥胖的人有较低的细菌比例(从门杆菌细菌到门厚壁菌)。虽然科学文献和一般媒体已经表明这种关联值得注意,但是有几则报道对其存在提出了质疑。

为了检测这种关联的有效性,Pollard的研究小组,对于体重指数(BMI)和肠道微生物的分类组成之间的关系,进行了广泛的评估。他们对来自多项研究的数据进行了荟萃分析,并没有发现BMI和任何细菌种类的相对丰度之间有密切的联系。

她说,这些新的统计学进展,将使科学家能够进行其他形式的微生物组学研究,例如识别某些微生物物种和基因,它们是疾病发作的生物标志物,或开发靶定微生物组的药物。
她总结道:“显然,微生物在宿主生物学中起到了重要作用,但是这种作用是复杂的,分析的同时必须考虑饮食、药物和宿主基因这些因素。”

本文来源于:生物通


欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ

;