Datenspeicher DNA

(26.02.2020) DNA ist schon länger als molekularer Datenspeicher im Gespräch. Mit der enzymatischen DNA-Synthese-Technik könnte es funktionieren.
editorial_bild

Editorial

Die riesigen Datenmengen, die im Zeitalter von Big Data täglich produziert werden, verbrauchen einen gewaltigen Speicherplatz. Dass Festplatten, CDs oder Speicherkarten hiermit überfordert und nicht für die Ewigkeit geschaffen sind, treibt die Suche nach alternativen Speichersystemen an. DNA-Sequenzen zur Codierung und Decodierung von Daten übertreffen technische Speichermedien in mehrerlei Hinsicht. Mammut-DNA ist der lebende Beweis für ihre Beständigkeit und auch in puncto Platzbedarf ist DNA kaum zu schlagen. Eigentlich braucht man also „nur“ eine praktikable und präzise Technologie, mit der sich Daten in Form von DNA-Sequenzen codieren und speichern lassen. Laut einer Gruppe um George Church und Richie Kohman von der Harvard Medical School in Boston könnte dies mithilfe der enzymatischen DNA-Synthese tatsächlich möglich sein.

Editorial

Oligos als Anker

Funktionieren soll das Ganze folgendermaßen: An eine Strept­avidin-benetzte Glasoberfläche werden zunächst 25 Nukleotid-lange Initiator-Oligos über ihren 5‘-Biotinschwanz gebunden. Diese Oligos dienen nur als Verankerung, von der die eigentliche Synthese ausgeht. Der Glas-Chip ist nur gut einen Quadratzentimeter groß und trägt drei mal vier Spots von 100 Mikrometern Durchmesser. Somit sitzen auf dem Chip an zwölf Positionen Initiator-Oligos. In ihrer Sequenz kann man einen Barcode unterbringen, der Rückschluss auf die Position innerhalb des Chips liefert und somit Multiplex-Sequenzierung ermöglicht. Alternativ bringt man den Barcode im Zuge der eigentlichen Code-Synthese an.

Das Werkzeug für die DNA-Synthese ist die terminale Deoxynukleotidyl-Transferase (TdT), ihr Baumaterial sind dNTPs. Reguliert wird die TdT-Aktivität durch Kobalt-Ionen (Co2+), die als Cofaktor fungieren. Da dem Enzym für jeden Syntheseschritt jeweils nur eines der vier Nukleotide angeboten und überschüssiges Material anschließend weggespült wird, lässt sich eine Wunschsequenz zusammenbauen. In früheren Arbeiten setzte das Team Apyrase ein, um überschüssige dNTPs, etwa dATP, vor dem Einbau des nächsten Bausteins, zum Beispiel dTTP, zu beseitigen.

Editorial

Licht setzt Ionen frei

Ihnen kam aber noch eine bessere Idee. TdT arbeitet nur in Gegenwart von Co2+-Ionen. Über die Verfügbarkeit des Cofaktors lässt sich also auch die Enzymaktivität regulieren. Church und seinen Kollegen fanden einen Weg, Co2+ quasi auf Knopfdruck bereitzustellen und wieder auszusperren. Sie nahmen dafür DMNP-EDTA, einen photolabilen Chelator, der bei UV-Licht zerfällt. Ohne Bestrahlung hat der Chelator Co2+ fest im Griff, das hierdurch für TdT unerreichbar bleibt. Durch Licht wird Co2+ jedoch freigesetzt.

Da sich die zwölf Positionen auf dem Chip punktgenau und zeitlich individuell mithilfe eines sogenannten Digital Micromirror Device (DMD) mit UV-Licht ansteuern lassen, kann man ein Dutzend verschiedene Sequenzen in einem Aufwasch fabrizieren. Nehmen wir an, Position eins soll um „AGC“ und Position zwei um „GC“ wachsen. In diesem Fall setzt man zuerst dATP zu und beleuchtet nur Position eins. Position zwei bekommt von dem dATP zwar automatisch etwas ab, kann aber mangels Co2+ nichts damit anfangen. Nach einem Waschschritt gibt man dGTP zu und beleuchtet beide Positionen, nach dem nächsten Waschschritt dCTP, wieder für beide Positionen. Fertig.

Die Co2+-Freigabe aus dem Chelator ist eine Einbahnstraße. Einmal per UV zerstört, bleibt das photolabile DMNP-EDTA inaktiv, fängt also nicht etwa im Dunkeln die Co2+-Ionen wieder ein. Die Belichtung ist jedoch auf einen engen Punkt beschränkt, weshalb drumherum reichlich Chelatormoleküle unbehelligt und somit intakt bleiben. Durch Diffusion wandern die Co2+-Ionen in die Peripherie, wodurch die Enzymaktivität abklingt. Je nachdem, wann das Enzym vorübergehend (bis zum nächsten Syntheseschritt) zum Erliegen kommt, hat es wenige oder viele Moleküle (durchschnittlich drei bis acht) des gerade angebotenen dNTPs verbaut.

Die Länge ist egal

Für die Codierungsstrategie ist es aber egal, ob eine Sequenz am Ende AAAAGGCCCC, AGCC oder AAGGGGGCC heißt. Wichtig ist nur, welcher Buchstabe auf welchen folgt – und nicht die Länge eines Homopolymers. Damit nicht allzu lange Polymere entstehen, die unnötig Material verbrauchen und die Sequenzierung erschweren, haben die Forscher optimale Beleuchtungsdauern für die vier Bausteine ermittelt. So verarbeitet TdT zum Beispiel dATP schneller als dCTP.

Die Codierung der Sequenzdaten nutzt ein ternäres System aus sogenannten Trits. Sie erfolgt auf Basis von drei Ziffern 0, 1 und 2. Diese Ziffern stehen für alle möglichen Transitionen, die eine wachsende Sequenz durchlaufen kann. So gibt es für Nukleotid A die drei Möglichkeiten, auf C, G oder T zu wechseln. Für C wiederum die drei Möglichkeiten, auf A, G oder T zu wechseln und so weiter. Bei der Decodierung von DNA wirft ein Computeralgorithmus einfach informationslose Sequenzen heraus, es kürzt also zum Beispiel AAAAGGCCCC (raw strand) auf das Wesentliche, nämlich AGC (compressed strand).

Ob das Ganze nach Plan funktioniert, überprüften die Forscher ohne die wachsende DNA-Kette vom Chip loslösen zu müssen. Hierfür nutzten sie eine sogenannte Splint-End-Ligation, die so konzipiert war, dass im Fall eines korrekten endständigen Nukleotids ein Fluoreszenzsignal an der jeweiligen Chip-Position erschien.

Nukleinsäure als Brücke

Bei der Split-End-Ligation dient eine kurze, einzelsträngige Nukleinsäure als Brücke. Eine Brückenseite existiert in vier Ausfertigungen und ist komplementär zur gerade synthetisierten Sequenz (also ein Homopolymer des letzten Bausteins, zum Beispiel AAAA), die andere ist komplementär zu einem 3‘-Cy3-fluoreszenzmarkierten Adapter. Beide Seiten der Brücke paaren sich mit ihren jeweiligen komplementären Partnern zum Doppelstrang und führen somit synthetisiertes Oligonukleotid und Adapter zusammen. Eine Quick-Ligase verschweißt die Naht. Erscheint an der entsprechenden Position des Chips ein Fluoreszenzsignal, belegt dies die korrekte Arbeit der TdT. Die wachsende Länge der Oligos nach jedem Syntheseschritt lässt sich durch elektrophoretische Trennung auf einem denaturierenden Gel verfolgen.

Ist die Synthese fertig, können die DNA-Moleküle mittels Formamid und EDTA vom Chip gelöst und gelagert beziehungsweise sequenziert werden. Für ihren DNA-Speicher fanden die Forscher um Church und Kohman auch gleich eine kreative Verwendung – und zwar als Tonträger. Als Testsequenz wählten die US-Forscher zwei Takte der Erkennungsmelodie des Nintendo-Videospiels „Super Mario Brothers“ aus den achtziger Jahren. Mit dem ternären DNA-Sequenzsystem verschlüsselten sie, an welcher Stelle der Melodie ein bestimmter Ton ertönt und wie lang er dauert. Eine Pause (Stille) definierten sie auf gleiche Weise als Ton im nicht-hörbaren Frequenzbereich.

Andrea Pitzschke

Lee H. et al. (2020): Photon-directed multiplexed enzymatic DNA synthesis for molecular digital data storage. BioRxiv, doi: 10.1101/2020.02.19.956888

Foto: Steampunk USB Flash Drive (gesehen auf Etsy)






Letzte Änderungen: 26.02.2020