日報

微軟研發DNA存儲技術,可造方糖大小的數據中心

刊登於 2016-04-15

微軟(Microsoft)研究院與華盛頓大學(University of Washington)的分子信息系統實驗室(MISL)合作研發高密度 DNA 串數據存儲技術。
微軟(Microsoft)研究院與華盛頓大學(University of Washington)的分子信息系統實驗室(MISL)合作研發高密度 DNA 串數據存儲技術。

據科技網站 Computer World 報導,微軟(Microsoft)研究院與華盛頓大學(University of Washington)的分子信息系統實驗室(MISL),共同研發了一項將人工合成 DNA 作為數據存儲介質的技術,可能會為人類在資訊爆炸時代的信息存儲問題提供一個解決方向。

國際調查機構 IDC 預計,2020年全球信息量將達到40ZB(編注:1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB),是2015年的約15倍,「儘管並非所有信息都需要保存,但世界生成數據的速度快於存儲容量的增長」。

微軟和華盛頓大學的研究人員表示,DNA 可以高密度地存儲信息,1立方毫米的 DNA 就可以存儲1EB 的數據。此外,DNA 保存信息的時間也更加長久。研究人員稱,採用 DNA 串數據存儲技術,即使在惡劣環境中其半衰期也超過500年,大大超出一般磁帶和硬盤的保存期限。

生命產生了神奇的 DNA,它能高效地存儲與基因和生命活動有關的所有信息,而且非常緊湊和持久。我們將用 DNA 來存儲圖像、視頻、文檔等數據,保存時間可以長達數百或數千年。

華盛頓大學計算機科學和技術副教授 Luis Ceze

DNA 數據存儲技術近年來發展神速。1999年,研究人員用 DNA 存儲技術編碼並恢復了一條23個字母長的信息;到2013年,科學家就可以將美國民權運動領袖馬丁·路德·金(Martin Luther King)《我有一個理想》的演講 mp3 文件編碼到 DNA 中。

相對於從 DNA 讀取數據來講,對 DNA 編碼存儲數據一直是更大的難題,因為此前的方法只能合成短鏈 DNA,且容易出錯。不過微軟和華盛頓大學的人員表示,他們開發了一種「新穎的方法」來解決這個問題。他們將由1和0構成的數據字符串轉換成 DNA 序列中的4種鹼基——腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),並在編碼時加入了相當於街道門牌號的信息便於讀取。

在一項實驗中,研究團隊用這種方法將圖片文件的數據編碼為人工合成 DNA 片段的核苷酸序列,之後再從更大的 DNA 池中取回相應的核苷酸序列並重建圖像,發現沒有丟失1個字節的信息。

不過,華盛頓大學的研究人員也表示,目前這項技術還面臨很大的障礙,就是「大規模讀寫 DNA 的成本和效率比較低」,這意味着讀寫「DNA 硬盤」需要更長的處理時間,對硬盤的要求也更高。微軟表示,希望未來能把這項技術和現有硅技術硬盤結合起來,創造出更安全快速的大容量硬盤。

100
研究人員,與目前的數字存儲技術相比,DNA 將數據存儲的緊密度提高了數百萬倍。

聲音

我們認為把 DNA 作為存儲介質來探索相關係統設計問題的時機已經成熟。

項目研究人員

我們用一系列分子生物學實驗證明了我們系統設計的可行性,我們成功地將數據存儲在 DNA 內,並執行隨機讀取完整讀回了原來的數據。

華盛頓大學計算機科學和技術副教授 Luis Ceze

DNA

DNA(deoxyribonucleic acid),即脱氧核醣核酸,是一種生物大分子,可組成遺傳指令,引導生物發育與生命機能運作。主要功能是資訊儲存,可比喻為「藍圖」或「食譜」。其中包含的指令,是建構細胞內其他的化合物,如蛋白質與核醣核酸所需。帶有蛋白質編碼的 DNA片 段稱為基因。其他的 DNA 序列,有些直接以本身構造發揮作用,有些則參與調控遺傳訊息的表現。 (資料來自維基百科)

來源:Computer WorldcnBeta鳳凰科技微軟新聞中心科技日報

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。

延伸閱讀