据科技网站 Computer World 报导,微软(Microsoft)研究院与华盛顿大学(University of Washington)的分子信息系统实验室(MISL),共同研发了一项将人工合成 DNA 作为数据存储介质的技术,可能会为人类在资讯爆炸时代的信息存储问题提供一个解决方向。
国际调查机构 IDC 预计,2020年全球信息量将达到40ZB(编注:1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB),是2015年的约15倍,“尽管并非所有信息都需要保存,但世界生成数据的速度快于存储容量的增长”。
微软和华盛顿大学的研究人员表示,DNA 可以高密度地存储信息,1立方毫米的 DNA 就可以存储1EB 的数据。此外,DNA 保存信息的时间也更加长久。研究人员称,采用 DNA 串数据存储技术,即使在恶劣环境中其半衰期也超过500年,大大超出一般磁带和硬盘的保存期限。
生命产生了神奇的 DNA,它能高效地存储与基因和生命活动有关的所有信息,而且非常紧凑和持久。我们将用 DNA 来存储图像、视频、文档等数据,保存时间可以长达数百或数千年。
DNA 数据存储技术近年来发展神速。1999年,研究人员用 DNA 存储技术编码并恢复了一条23个字母长的信息;到2013年,科学家就可以将美国民权运动领袖马丁·路德·金(Martin Luther King)《我有一个理想》的演讲 mp3 文件编码到 DNA 中。
相对于从 DNA 读取数据来讲,对 DNA 编码存储数据一直是更大的难题,因为此前的方法只能合成短链 DNA,且容易出错。不过微软和华盛顿大学的人员表示,他们开发了一种“新颖的方法”来解决这个问题。他们将由1和0构成的数据字符串转换成 DNA 序列中的4种碱基——腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),并在编码时加入了相当于街道门牌号的信息便于读取。
在一项实验中,研究团队用这种方法将图片文件的数据编码为人工合成 DNA 片段的核苷酸序列,之后再从更大的 DNA 池中取回相应的核苷酸序列并重建图像,发现没有丢失1个字节的信息。
不过,华盛顿大学的研究人员也表示,目前这项技术还面临很大的障碍,就是“大规模读写 DNA 的成本和效率比较低”,这意味着读写“DNA 硬盘”需要更长的处理时间,对硬盘的要求也更高。微软表示,希望未来能把这项技术和现有硅技术硬盘结合起来,创造出更安全快速的大容量硬盘。