动植物有统一DNA序列

生物通,2012-5-10

大型数据分析已经正式纳入了国家计划——近期美国白宫科学与技术政策办公室宣布了“大型数据研究和发展倡议(Big Data Research and Development Initiative)”。近期来自密苏里大学的多学科研究人员发表了题为“Long Identical Multispecies Elements in Plant and Animal Genomes”的文章,利用开创性的计算机算法,直面迎击大型数据的挑战,发现了不同植物和动物物种中统一的DNA序列。

文章的第一作者,密苏里大学计算机科学助力教授Dmitry Korkin表示,“我们的计算算法发现了多种植物基因组中完全不同位置上,统一的DNA序列”,“从来没有人进行过这样规模的分析。”

另外一位作者,动物科学助力教授Dmitry Korkin补充道,“我们的发现揭示了植物进化的一些奥秘”,“植物基因组相关基础研究将能提供原始材料,促进机械和农作物研发技术。”

之前的研究曾在不同物种动物DNA中发现统一的代码,但是在这项最新研究之前,计算机程序还未能在植物DNA中找到统一的序列,因为研究人员并未在同一点上发现统一的区域。

研究人员已经进行了六种动物基因组:狗,鸡,人类,小鼠,猕猴和大鼠的比对分析,同样六种植物物种:拟南芥,大豆,水稻,棉花,白杨,高粱和葡萄也进行了基因组比对。比对所有的基因组序列需要48台计算机处理器,进行四个星期的分析,每小时完成一百万的搜索,总共要完成32亿次搜索。

研究人员发现了统一的植物物种序列,并指出这些序列与动物存在进化差异。植物和动物都是复杂的多细胞生物,与相同的环境条件进行反应,比如摄入氧气,水,与天气变化协调等,但是植物的基因组编码在处理这些方面具有不同的方式。

研究人员研发了新型计算方法,为进化探讨不同遗传机制和功能奠定了基础。而且这种新方法也有助于发展新型仪器。

“这一计算机算法还可以用于识别生物整个蛋白质组中的相同序列模式”,Korkin说,“这将能用于发现已有药物的新靶标,以及这些药物的副作用”。(来源:生物通 张迪)

论文链接:Long Identical Multispecies Elements in Plant and Animal Genomes

;