人才强校︱刘剑锋团队在《Bioinformatics》在线发表数量遗传学最新成果

本网讯 近日,生物信息学著名杂志《Bioinformatics》 (5-Year IF: 8.561)在线发表动物科学技术学院刘剑锋团队纵向数据全基因组关联分析方法研究的新成果:“Efficient Multivariate Analysis Algorithms for Longitudinal Genome-wide Association Studies”。

纵向数据指的是一个个体有多个表型测量值,并且表型值随时间发生动态变化,研究纵向数据是探究复杂性状的动态控制机制的有效手段。然而现存的纵向数据分析方法大多忽略了不同时间点之间的相关性或者存在计算瓶颈。鉴于此,本研究基于矩阵特征分解和估计育种值重转化思想,系统性提出纵向数据全基因关联分析优化检验方法和方差组分估计策略,并开发形成实际应用计算平台GMA。相对于已有分析方法,GMA显著提高关联分析的检验功效和计算效率,对于非平衡纵向数据(不同个体测量表型的时间点不统一),分析万条以上记录数据可在数小时内完成,而相应的对于平衡纵向数据(不同个体测量表型的时间点统一),运行时间在十分钟完成。他们将GMA方法应用到团队产生的奶牛产奶性状非平衡数据和公共数据库下载的小鼠生长性状平衡数据,发现主效QTL的效应轨迹和表型变化轨迹一致,说明主效QTL可能决定表型轨迹的形状。同时,对于小鼠的生长性状,GMA新定位到了一个QTL,这个QTL的效应轨迹呈现中期和初末期效应相反的情况,与表型轨迹不一致,说明其他微效QTL可能对表型轨迹起到调节的作用。GMA方法为纵向复杂性状基因挖掘、遗传解析和基因组选择实际应用提供了可行条件。

动科学院刘剑锋教授是该论文的通讯作者,团队博士研究生宁超是论文的第一作者,团队成员周磊副教授和康慧敏博士、加州大学河滨分校的Shizhong Xu教授以及密歇根大学的Xiang Zhou教授是本研究的合作作者。

图注:The phenotypic and significant SNPs changing pattern for body weight in the mouse data. (A) The average phenotypic values plotted against age (from week 1 to week 16 incremented by 1); (B) The predicted growth trajectories of QTL effects for all significant SNPs between 112Mb and 128Mb on chromosome 10 by the GMA-fixed method; (C) The predicted growth trajectories of QTL effects for all significant SNPs between 75Mb and 88Mb on chromosome 13 by the GMA-fixed method; (D) The predicted growth trajectories of QTL effects for all significant SNPs between 118Mb and 125Mb on chromosome 10 by uvMLM-min method.

;