日报

微软研发DNA存储技术,可造方糖大小的数据中心

刊登于 2016-04-15

微软(Microsoft)研究院与华盛顿大学(University of Washington)的分子信息系统实验室(MISL)合作研发高密度 DNA 串数据存储技术。
微软(Microsoft)研究院与华盛顿大学(University of Washington)的分子信息系统实验室(MISL)合作研发高密度 DNA 串数据存储技术。

据科技网站 Computer World 报导,微软(Microsoft)研究院与华盛顿大学(University of Washington)的分子信息系统实验室(MISL),共同研发了一项将人工合成 DNA 作为数据存储介质的技术,可能会为人类在资讯爆炸时代的信息存储问题提供一个解决方向。

国际调查机构 IDC 预计,2020年全球信息量将达到40ZB(编注:1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB),是2015年的约15倍,“尽管并非所有信息都需要保存,但世界生成数据的速度快于存储容量的增长”。

微软和华盛顿大学的研究人员表示,DNA 可以高密度地存储信息,1立方毫米的 DNA 就可以存储1EB 的数据。此外,DNA 保存信息的时间也更加长久。研究人员称,采用 DNA 串数据存储技术,即使在恶劣环境中其半衰期也超过500年,大大超出一般磁带和硬盘的保存期限。

生命产生了神奇的 DNA,它能高效地存储与基因和生命活动有关的所有信息,而且非常紧凑和持久。我们将用 DNA 来存储图像、视频、文档等数据,保存时间可以长达数百或数千年。

华盛顿大学计算机科学和技术副教授 Luis Ceze

DNA 数据存储技术近年来发展神速。1999年,研究人员用 DNA 存储技术编码并恢复了一条23个字母长的信息;到2013年,科学家就可以将美国民权运动领袖马丁·路德·金(Martin Luther King)《我有一个理想》的演讲 mp3 文件编码到 DNA 中。

相对于从 DNA 读取数据来讲,对 DNA 编码存储数据一直是更大的难题,因为此前的方法只能合成短链 DNA,且容易出错。不过微软和华盛顿大学的人员表示,他们开发了一种“新颖的方法”来解决这个问题。他们将由1和0构成的数据字符串转换成 DNA 序列中的4种碱基——腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),并在编码时加入了相当于街道门牌号的信息便于读取。

在一项实验中,研究团队用这种方法将图片文件的数据编码为人工合成 DNA 片段的核苷酸序列,之后再从更大的 DNA 池中取回相应的核苷酸序列并重建图像,发现没有丢失1个字节的信息。

不过,华盛顿大学的研究人员也表示,目前这项技术还面临很大的障碍,就是“大规模读写 DNA 的成本和效率比较低”,这意味着读写“DNA 硬盘”需要更长的处理时间,对硬盘的要求也更高。微软表示,希望未来能把这项技术和现有硅技术硬盘结合起来,创造出更安全快速的大容量硬盘。

100
研究人员,与目前的数字存储技术相比,DNA 将数据存储的紧密度提高了数百万倍。

声音

我们认为把 DNA 作为存储介质来探索相关系统设计问题的时机已经成熟。

项目研究人员

我们用一系列分子生物学实验证明了我们系统设计的可行性,我们成功地将数据存储在 DNA 内,并执行随机读取完整读回了原来的数据。

华盛顿大学计算机科学和技术副教授 Luis Ceze

DNA

DNA(deoxyribonucleic acid),即脱氧核糖核酸,是一种生物大分子,可组成遗传指令,引导生物发育与生命机能运作。主要功能是资讯储存,可比喻为“蓝图”或“食谱”。其中包含的指令,是建构细胞内其他的化合物,如蛋白质与核糖核酸所需。带有蛋白质编码的 DNA片 段称为基因。其他的 DNA 序列,有些直接以本身构造发挥作用,有些则参与调控遗传讯息的表现。 (资料来自维基百科)

来源:Computer WorldcnBeta凤凰科技微软新闻中心科技日报

本刊载内容版权为端传媒或相关单位所有,未经端传媒编辑部授权,请勿转载或复制,否则即为侵权。

延伸阅读