Storage: il futuro è scritto nel DNA
Già da anni, come è possibile ad esempio vedere dalla lista di articoli in calce a questa notizia, il DNA viene indicato come una risorsa potenzialmente rivoluzionaria per lo storage dei dati. A confermare la veridicità di questo scenario, passando dal semplice campo delle ipotesi a quello della sperimentazione, ci hanno pensato di recente due ricercatori della Columbia University e del New York Genome Center. Yaniv Erlich e Dina Zielinski sono riusciti infatti di recente a memorizzare svariate tipologie di dati sull’acido nucleico che contiene le informazioni riguardanti i nostri patrimoni genetici. Tra gli altri, come è possibile leggere su Wired, materiali di una certa “consistenza” come un filmato e un sistema operativo.
I risultati delle loro sperimentazioni sono stati illustrati su Science. “A reliable and efficient DNA storage architecture” (traduzione: "Una architettura di storage affidabile ed efficiente") il titolo dell’articolo, del quale riportiamo di seguito la breve introduzione e l’abstract rimandando al sito della pubblicazione scientifica per la sua lettura integrale.
Il DNA ha il potenziale per assicurare lo storage di grandi quantità di informazioni. Ciononostante, le metodologie finora adottate sono riuscite a sfruttare solo una frazione del potenziale massimo realmente ottenibile. Erlich e Zielinski presentano una nuova metodologia, DNA Fountain il suo nome, che si approssima a questa soglia potenziale massima per nucleotide. I due ricercatori hanno dimostrato una efficiente procedura di codificazione delle informazioni – arrivando a immagazzinare un intero sistema operativo per personal computer – su del DNA che potrebbe essere successivamente reinterpretato con un processo scalare successivo all’attivazione di vari cicli di reazione a catena della polimerasi.
Abstract
Il DNA è un medium interessante per la conservazione delle informazioni digitali. In questo lavoro rendiamo conto di una strategia di storage, chiamata DNA Fountain, che è molto robusta e punta a definire la capacità informativa per nucleotide. Adottando il nostro approccio siamo riusciti ad archiviare un intero sistema operativo per computer, un film e altri file per uno totale di 2.14 × 106 bytes negli oligonucleotidi del DNA. Siamo riusciti inoltre a ritrovare perfettamente quelle informazioni da una copertura di sequenziamento equivalente ad una singola porzione di sequenziamento con la tecnica Illumina. Abbiamo anche sperimentato un processo che permette tecniche di recupero 2.18 × 1015 usando campioni del DNA originale e siamo stati in grado di decodificare perfettamente i dati. Infine abbiamo esplorato i limiti della nostra architettura per ciò che concerne i bytes per singola molecola e abbiamo ottenuto un recupero perfetto da una densità di 215 petabytes per grammo di DNA, un ordine di grandezza maggiore rispetto a quelli riportati nei precedenti resoconti in materia.