不同植物种类存在相同基因序列
中国科技网,2012年04月11日,作者: 毛黎
中国科技网讯 在美国白宫科学和技术办公室宣布大数据研究和开发倡议后,庞大数据分析已成为美国国家优先发展项目。美国密苏里大学研究人员与加州大学和亚利桑那大学的研究人员9日表示,他们利用开创性的计算机算法寻找不同种类植物和动物的相同DNA序列,解决了重要的生物难题。
过去没有人能够开展如此大规模数据的分析研究。密苏里大学计算机科学助理教授德利特里·库尔金表示,他们的计算机算法发现,相同的DNA序列存在于多种植物基因组内完全不同的位置。动物学助理教授加文·科南特说,他们的发现帮助解决了某些有关植物进化之谜。植物基因组的基础研究为药物和作物的研发提供了原料,并提高了相关技术。
此前的研究发现,不同种类动物DNA的中存在着相同的遗传密码长符。但是,在库尔金他们的研究完成前,计算机程序从未有能力寻找植物DNA中相同的序列,这是因为在相同的点(区域)上没有找到相同的片段。
在新的研究中,库尔金他们对犬、鸡、人、家鼠、猕猴和田鼠这6种动物的基因组进行了比较;同时还比较了拟南芥、大豆、大米、杨木、高粱和葡萄这6种植物的基因组。为完成所有的基因序列对比,科学家利用48台计算机处理器,以每小时100万条检索的速度工作了4周,检索总量约为320亿条。通过植物基因组对比,虽然科学家找到了不同植物之间相同的序列,但他们同时也指出,植物序列进化存在着不同。
科南特表示,人们也许期望看到的是趋同进化,但是分析研究结果却并非如此。植物和动物均为复杂的多细胞生物,必须应对多种天气以及许多相同的环境条件,如飞翔于空中和游弋水中,但是面对环境挑战,它们解决问题的基因组密码却不相同。
研究人员的工作为未来认知植物和动物形成不同遗传机制的原因以及这些机制如何发挥作用奠定了基础,也为获得更多改善人类生活的发现创造了条件。除有望促进遗传科学的潜能用以治疗疾病外,分析遗传密码的计算机程序本身还能帮助开发新药物。库尔金认为,相同的计算机算法可以用来寻找一种生物完整蛋白组中相同的序列模式,为现有的药物或了解这些药物的副作用寻找新的目标。(记者 毛黎)
总编辑圈点
DNA中四种核苷酸奇妙的排列组合,构成了包含生命遗传特征的密码。实际上,不同物种之间基因的区别并不是那么大——如果说大猩猩基因与人类相似度高达98%还可以想象,那您能想象人类和一种名为斑马鱼的小鱼间的基因相似度也有87%吗?所以说,在不同物种中找到相同DNA序列并不是天方夜谭,前提就是具备强大的数据分析能力。要知道,当初的人类基因组计划花了10年时间、30亿美元才完成对一个人的基因组测序,如果以这样的速度和耗费,那完成本文的研究几乎就是不可能的任务。