提出群体遗传学新算法

计算基因组学旨在发展理论和方法学,对基因组数据进行数据挖掘、信息提取。其中对遗传多态性,如基因频谱、单倍型结构等进行建模,利用群体基因组水平的遗传变异数据来推断群体的历史和变迁是群体遗传学的核心内容。传统的群体遗传学分析方法通常基于小样本数据。日前,中科院北京基因组所陈华课题组提出一个群体遗传学新算法,相关成果发布于《分子生物学与进化》杂志。

日新月异的测序新技术正在产生海量的基因组序列数据,这些大样本或群体水平的测序数据为基因组时代的群体遗传学研究提供了前所未有的机遇。陈华课题组的新方法克服了大样本时的数值计算问题,首次实现了对大样本全基因组数据进行高效计算的群体遗传学分析,可用于检测群体的增长模式,有效推断一万年以内的群体大小变化的相关参数。新算法拥有若干计算上的优势:该方法给出解析形式的公式,不依赖于仿真,计算便捷高效,而且在大样本时无数值问题;具有很好的灵活性,能涵盖复杂的群体模型。

;