Nature子刊:长读长DNA分析会导致错误

研究表明,读取长串DNA的先进技术会产生有缺陷的数据,这些数据可能影响基因研究。

新方法可以读取很长的“遗传密码”,准确率高达99.8%,然而,如果样本是超过30亿碱基的基因组,这相当于数百万个错误。

这些错误可能错误地表明一个人的基因差异会增加某种疾病的风险。研究员说,这些技术产生的数据应该被谨慎解释,因为它可能会给人类和动物的遗传信息解析带来问题。

以前的基因测序技术重点是读取短串DNA,然后将这些序列拼凑在一起,耗时耗力。这种方法对读取单基因很有用,但不适用于整个生命体研究。

爱丁堡大学的专家们研究了最近发表的三项人类基因组序列研究(都采用的长读长技术)。他们发现,即使使用了修正软件,这些数据仍然包含数千个错误。研究小组认为,如果将这些技术用于临床研究或患者诊断,可能会产生重大影响。

文章发表在《Nature Biotechnology》杂志,爱丁堡大学Roslin研究所的Mick Watson教授说:“长读长技术的强大令人难以置信,但很明显,我们不能依靠软件工具来纠正数据中所有错误,可能还需要一些实际操作的专业知识。这一点很重要,因为我们正在越来越依靠基因组技术来了解我们周围的世界。”

参考资料:

Errors in long-read assemblies can critically affect protein prediction

免责声明:基因测序产业网转载文章出于传递产业信息之目的,且明确注明来源,如有侵权请联系删除。本平台对转载文章保持中立,不对所包含内容的准确性、可靠性或完整性提供明示或暗示保证,仅作参考。

;