欧洲科学家成功实现DNA存储数据

搜狐科学,2013-01-25

据国外媒体报道,欧洲分子生物学实验室(EMBL)旗下附属机构欧洲生物信息学中心的研究人员日前发现,可以以DNA的形式存储数据,这一存储材质可以将数据存储达万年之久。这一新发现被刊登在自然杂志上,一杯DNA可以将高清的视频存储1亿小时。

从数据的存储来看,硬盘通常价格不菲,并要求具有持续的电量。而磁带尽管没有电量要求,但在十年内也会变坏。这就对数据量十分庞大的生物科学带来了麻烦,包括DNA序列。这项研究成果标志着将核酸用于存储信息的方法已经朝着更为实用性方向迈进。

科学家发现的这种存储介质比目前的硬盘或磁带等更紧凑、更耐用。这一项目的负责人、欧洲生物信息研究所(EBI)的尼克•高盛(Nick Goldman)表示:“我们已经知道DNA是一个良好的信息存储介质,因为我们能够从长毛象的骨髓中加以提取。此外,这一存储介质体积小,密度大,不需要任何电力储备,因此传输和保存十分简便。”(尚力)

【CNW.com.cn独家译稿】研究人员在本周《自然》杂志中发表的一篇论文中称,这种编码方式能够在大约一茶杯DNA中存储至少1亿小时的高清视频。

位于英国的欧洲生物信息研究所(EMBL-European Bioinformatics Institute)的研究人员称,他们已经存储了编码版本的马丁·路德·金(Martin Luther King)《我有一个梦想》的演讲的.MP3文件,以及一个欧洲生物信息研究所照片的.jpg文件和一些文本文件。

欧洲生物信息研究所的这篇研究报告的共同作者尼克·戈尔德曼(Nick Goldman)在声明中称,我们已经知道DNA是存储信息的一种强大的方法,因为我们能够从数万年前的长毛猛犸象骨头中提取DNA并且搞清楚其意义。DNA还非常小、密度大并且不需要电力进行存储。因此,运输和保存都很容易。

读取DNA非常简单。但是,写DNA一直是一个巨大的障碍。有两个难题:第一,使用当前的方法,只能制造短字符串的DNA。第二,读和写DNA很容易出错,特别是在相同的DNA字母重复的时候。

尼克和共同作者、欧洲生物信息研究所副所长伊万·伯尼(Ewan Birney)创建了一个克服这两个问题的代码。这种新方法需要合成来自编码信息的DNA。欧洲生物信息研究所与加州的电子和生物分析测量仪器厂商Agilent Technologies合作传输这种数据,然后以DNA方式对这个信息编码。

Agilent公司的艾米丽·勒普鲁(Emily Leproust)说,Agilent从网站下载文件,然后合成几十万个DNA来代表这个数据。这个结果看起来就像一小片灰尘。

Agilent然后把这个样本邮寄给欧洲生物信息研究所。那里的研究人员能够排列这个DNA的顺序并且正确地解码这个文件。

这并不是第一次展示DNA是存储数据的有效方法。去年秋季,哈佛大学的研究人员展示了以DNA二进制代码的方式用HTML格式存储一本书的700亿个副本的能力。

研究人员通过DNA制作者创建了二进制代码以保存这本书的文本。这本书的名字是“Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves in DNA”(复活:合成生物学如何以DNA方式改造自然和我们自己)。

哈佛大学研究人员在DNA存储媒介中每平方厘米存储5.5PB或者100万GB数据。由于存储数据的流程较慢,研究人员认为,DNA存储介质目前仅适用于数据存档。

哈佛大学威斯研究所高级科学家和解释这门科学的论文的高级作者瑟里拉姆·库苏里(Sriram Kosuri)当时说,用大约4克DNA就能存储全世界的信息。全世界目前的信息量是1.8ZB。

由于数据的大幅度增长,研究人员正在寻求用越来越小的数据包存储数据。

据市场研究公司IDC最新发表的“数字宇宙”研究报告称,在未来8年里,产生的数字数据量将超过40ZB,相当于地球上的每一个男人、女人和儿童有5200GB数据。

在现在至2020年期间,大多数数据不是人类制造的,而是由机器产生的,因为机器之间要在数据网络上对话。例如,这包括机器传感器和智能设备与其它设备之间的通讯。

尼克说,我们创建一个使用分子形式的容错的代码。我们知道这将在1万年或者更长的时间里保持正确的状态。只要有人知道这个代码是什么,如果你有能够读取DNA的机器,你就能够读取这个信息。

研究人员表示,这个开发过程的下一步是完善编码方案和探索实用性,为商业上可行的DNA存储模式铺平道路。(编译/胡杨)

;