Archiviazione dati nel DNA

archiviazione-dati-nel-dna

Il DNA, o acido desossiribonucleico, è il materiale ereditario in quasi tutti gli organismi, compresi gli esseri umani. Quasi tutte le cellule del corpo di un essere vivente hanno lo stesso DNA. Le informazioni nel DNA sono memorizzate come un codice composto da quattro basi chimiche: adenina (A), guanina (G), citosina (C) e timina (T). Il DNA umano è costituito da circa 3 miliardi di basi e più del 99% di queste basi sono le stesse in tutte le persone. L’ordine, o la sequenza, di queste basi determina le informazioni disponibili per costruire e mantenere un organismo, in modo simile al modo in cui le lettere dell’alfabeto appaiono in un certo ordine per formare parole e frasi.

Le basi del DNA si accoppiano tra loro, A con T e C con G, per formare unità chiamate coppie di basi. Ogni base è anche attaccata a una molecola di zucchero e una molecola di fosfato. Insieme, una base+zucchero+ fosfato sono chiamati nucleotide. I nucleotidi sono disposti in due lunghi filamenti che formano una spirale chiamata doppia elica. La struttura della doppia elica è in qualche modo simile a una scala, con le coppie di basi che formano i pioli della scala e le molecole di zucchero e fosfato che formano i lati verticali della scala.

Gli ingegneri biologici del MIT hanno trovato un modo per utilizzare il DNA per archiviare e recuperare facilmente file di dati. Questo potrebbe essere un passo verso l’utilizzo del DNA per archiviare enormi quantità di immagini, testi e altri contenuti digitali.

Sulla Terra in questo momento, ci sono circa 10.000 miliardi di gigabyte di dati digitali, e ogni giorno gli esseri umani producono e-mail, foto, tweet e altri file digitali per altri 2,5 milioni di gigabyte di dati. Gran parte di questi dati sono archiviati in enormi strutture note come data center exabyte (un exabyte è 1 miliardo di gigabyte), che possono avere le dimensioni di diversi campi da calcio e costare centinaia di milioni di Euro per la costruzione e la manutenzione. Ecco perché molti scienziati ritengono che una soluzione alternativa risieda nella molecola che contiene le nostre informazioni genetiche: il DNA, che si è evoluto per immagazzinare enormi quantità di informazioni ad altissima densità. Ogni nucleotide, equivalente a un massimo di due bit, è di circa 1 nanometro cubo (un milionesimo di milllimetro cubo), un exabyte (miliardo di Gigabyte) di dati archiviati come DNA potrebbe stare nel palmo della nostra mano, ed una tazza da tè piena di DNA potrebbe, almeno teoricamente, memorizzare tutti i dati del mondo attuale. Un’altra proprietà interessante è che il polimero del DNA, una volta creato, non consuma energia e può essere conservato per sempre.

Gli scienziati hanno già dimostrato di poter codificare immagini e pagine di testo come DNA. Tuttavia, era anche necessario un modo semplice per trovare ed estrarre il file desiderato da una miscela di molti pezzi di DNA. Gli ingegneri biologici del MIT hanno ora trovato un modo per farlo, incapsulando ogni file di dati in una particella di silice da 6 micron (6 millesimi di millimetro), che è etichettata con brevi sequenze di DNA che ne rivelano il contenuto. Utilizzando questo approccio, i ricercatori hanno dimostrato di poter estrarre con precisione singole immagini memorizzate come sequenze di DNA da una massa in grado di contenere miliardi di Gigabyte.

I sistemi di archiviazione digitale codificano testo, foto o qualsiasi altro tipo di informazione come una serie di 0 e 1. Questa stessa informazione può essere codificata nel DNA usando i quattro nucleotidi che compongono il codice genetico: A, T, G e C. Ad esempio, G e C possono essere usati per rappresentare 0 mentre A e T possono essere usati per rappresentare 1.

Un ostacolo a questo tipo di archiviazione dei dati è il costo della sintesi di grandi quantità di DNA. Attualmente costerebbe 1.000 miliardi di dollari scrivere un petabyte di dati (1 milione di gigabyte). Per diventare competitivo con il nastro magnetico, che viene spesso utilizzato per archiviare dati, si stima che il costo della sintesi del DNA dovrebbe diminuire di circa sei ordini di grandezza. Si prevede che questo accadrà entro un decennio o due, in modo simile a come il costo di archiviazione delle informazioni sulle unità flash è diminuito drasticamente negli ultimi due decenni.

A parte il costo, l’altro principale collo di bottiglia nell’utilizzo del DNA per archiviare i dati è la difficoltà nel ritrovare un file desiderato tra tutti gli altri presenti in archivio. Attualmente, i file di DNA vengono recuperati convenzionalmente utilizzando la PCR (reazione a catena della polimerasi). Tuttavia, uno svantaggio di questo approccio è che può causare l’estrazione di file indesiderati. Inoltre, il processo di recupero della PCR richiede enzimi e finisce per consumare la maggior parte del DNA che era nel pool. Staremmo quindi bruciando il pagliaio per trovare l’ago.

Come approccio alternativo, il team del MIT ha sviluppato per questo la nuova tecnica di recupero, che prevede l’incapsulamento di ogni file di DNA in una piccola particella di silicio. Ogni capsula è etichettata con “codici a barre” di DNA a filamento singolo che corrispondono al contenuto del file. I ricercatori hanno dimostrato che le capsule potrebbero contenere file di DNA fino a un gigabyte di dimensioni. Ogni file viene etichettato con codici a barre corrispondenti a etichette come “gatto” o “aereo”. Quando i ricercatori vogliono estrarre un’immagine specifica, utilizzano primer che corrispondono alle etichette che stanno cercando, ad esempio “gatto”, “arancione” e “selvaggio” per un’immagine di una tigre, o “gatto”, “arancione” e “domestico” per un gatto domestico. Questo processo di recupero consente di utilizzare per la ricerca costrutti logici booleani come “presidente E U.S.A. E 18° secolo” per generare come risultato “George Washington”, in modo simile a ciò che viene recuperato con una ricerca di immagini in Google. Allo stato attuale dei test presso il MIT siamo alla velocità di ricerca di 1 kilobyte al secondo.

Per i “codici a barre” che etichettano le capsule di silicio, i ricercatori hanno utilizzato sequenze di DNA a filamento singolo da una libreria di 100.000 sequenze, ciascuna lunga circa 25 nucleotidi. Se si mettono due di queste etichette su ciascun file, si possono etichettare in modo univoco 10 miliardi di file diversi. Con quattro etichette su ciascuna capsula si possono etichettare in modo univoco cento miliardi di miliardi di file.

I ricercatori del Politecnico federale di Zurigo hanno sviluppato nel 2019 un’architettura di archiviazione utilizzando il DNA, che hanno chiamato “DNA-of-things” (DoT), in cui hanno fuso il DNA in oggetti di uso quotidiano, incapsulandolo in nanoparticelle di silice. Queste nanoparticelle fanno quindi parte del materiale che viene utilizzato per creare gli oggetti interessati, ciascuno dei quali è stato realizzato con la stampa tridimensionale o altre tecniche di colata. La tecnologia DoT è stata utilizzata per la prima volta stampando in 3D un coniglietto con incorporate le istruzioni per realizzare il coniglietto stesso.

Siamo solo agli inizi dell’utilizzo del DNA come sistema per memorizzare in modo stabile e duraturo dati, ma come possiamo vedere le prospettive sono affascinanti.

Redazione

Fonte: news.mit.edu

CHIUDI