Editorial

Ausgeschlachtete Kits und Hausmacher-Transposase
Produktübersicht: NGS-Library-Präparations-Kits

NGS-Library-Präparations-Kits im Überblickpdficon

(13.05.2022) Die Herstellung von NGS-Bibliotheken ist einer der größten Kostenfaktoren bei der Sequenzierung von DNA oder RNA. Mit modifizierten Kits und eigenen Protokollen lässt sich einiges einsparen.

Das National Human Genome Research Institute der National Institutes of Health in Bethesda, USA, schätzt, dass die im Rahmen des Humgenomprojekts 1999 begonnene und etwa 15 Monate dauernde Sequenzierung des Humangenoms mit Sanger-Sequenzierern weltweit etwa 300 Millionen Dollar verschlang. Nach dem Siegeszug des Next Generation Sequencing (NGS) vor etwa fünfzehn Jahren sanken die Kosten jedoch dramatisch und durchbrachen 2016 schließlich die Marke von 1.000 Dollar für das Sequenzieren eines menschlichen Genoms. Danach bewegten sie sich aber trotz neuer und immer effizienterer Sequenzierer nur noch langsam nach unten. Das Sequenzier-Zentrum der Universität Bonn verlangt aktuell zum Beispiel 834 Euro für die Ganzgenom-Sequenzierung (Whole Genome Sequencing, WGS) eines humanen Genoms.

p_22_05a
Die Sequenzier-Kosten sinken längst nicht mehr so schnell wie während des Durchbruchs des Next Generation Sequencings zwischen 2006 und 2010. Ein wesentlicher Grund dafür sind teure Kits für die Konstruktion der Sequenzier-Bibliotheken. Illustration: NHGRI

Für die verlangsamte Kostenreduktion sind vor allem NGS-Library-Präparations-Kits verantwortlich, die für die Herstellung der obligatorischen Sequenzier-Bibliotheken nötig sind. Die Preise für die Kits sind längst nicht in dem Maß gesunken wie die restlichen Sequenzier-Kosten und fallen bei der Sequenzierung immer stärker ins Gewicht. Davon können insbesondere Forscher und Forscherinnen ein Lied singen, die nicht nur die DNA oder RNA in einer einzigen Probe sequenzieren wollen, sondern in hunderten oder tausenden Proben – etwa für die Analyse von Bakteriengenomen oder bei klinischen Anwendungen. Überträgt man die Herstellung der NGS-Bibliotheken einer NGS-Core-Facility, wird die Sache richtig teuer – obwohl diese meist Freundschaftspreise für Institutsangehörige machen und mehr oder weniger zu Selbstkostenpreisen arbeiten. Aber selbst dann sind je nach verwendeter Technik schnell mal zwischen fünfzig und hundert Euro pro Probe fällig.

Verwirrende Vielfalt

Selber machen ist natürlich günstiger, aber auch zeitaufwendiger – und das passende NGS-Library-Prep-Kit beziehungsweise das beste Protokoll aus den zahllosen Varianten auszuwählen, ist eine Wissenschaft für sich. Dabei sind die grundlegenden Schritte der Library-Konstruktion immer gleich und zumindest auf dem Papier auch nicht allzu kompliziert. Ist das Ausgangsmaterial genomische DNA, wird diese zunächst mit physikalischen oder enzymatischen Methoden fragmentiert. Startet der Experimentator für eine RNA-Sequenzierung mit RNA, wird die mRNA aus der Gesamt-RNA extrahiert, chemisch fragmentiert und danach revers transkribiert. Anschließend werden die Enden der DNA- oder cDNA-Fragmente mit passenden Adaptern für die jeweilige NGS-Plattform versehen. Adapter für die Short-Read-Sequenzierung mit Illumina-Geräten enthalten einen Linker, der mit den Oligos auf den Illumina-Flusszellen hybridisiert. Für die Long-Read-Sequenzierung mit PacBio-Sequenzierern werden spezielle SMRT-Bell-Adapter an die Enden angehängt; Adapter für die Nanoporen-Sequenzierung sind mit einem Helikase-Protein verbunden, das die Translokations-Geschwindigkeit der DNA durch die Nanopore steuert.

Die konkrete Ausgestaltung der Library-Prep-Kits variiert aber von Hersteller zu Hersteller und wird von diesen fortlaufend optimiert, was zu einer wahren Flut immer neuer Kits führt, die zu den bereits etablierten hinzukommen. Dass manche Hersteller ihre aktualisierten Kits auch noch umbenennen, macht die Sache nicht gerade übersichtlicher.

Adapter-Einbau

Besonders groß ist die Vielfalt der Library-Prep-Kits für die Illumina-Sequenzierung, die das Next Generation Sequencing nach wie vor dominiert. Bei Illuminas traditionellen TrueSeq-Kits werden die von der Fragmentierung etwas zerzausten Enden der DNA-Stücke zunächst repariert und geglättet. Um die Ligation mit den Adaptern zu erleichtern, hängt man danach ein Adenin (A) an die 3‘-Enden der Fragmente, das komplementär ist zu einem Thymin (T) am 5‘-Ende der Adapter. Letztere enthalten alles, was für die Sequenzierung auf Illumina-Maschinen nötig ist: P7- und P5-Sequenzen, die an die entsprechenden Plätze auf der Flusszelle des Sequenzierers binden, Rd1-SP- und Rd2-SP-Motive für die Sequenzier-Primer sowie Index-Sequenzen zur Identifizierung der Proben. Das originale ­TrueSeq-Protokoll, das auch andere Kit-Hersteller übernahmen, funktionierte tadellos, benötigte jedoch ein bis zwei Mikrogramm DNA als Ausgangsmaterial und war durch die vielen Reinigungsschritte ziemlich zeitaufwendig. Illumina stampfte die weitverbreiteten TrueSeq-DNA-Kits deshalb 2014 ein und brachte als Nachfolger den TrueSeq-Nano-Kit heraus. Am Prinzip der Adapter-Ligation hat sich bei diesem nichts geändert, die Längenselektion der DNA-Fragmente sowie die nötigen Reinigungsschritte erfolgen jedoch mithilfe von Beads. Das verkürzt das ein bis zwei Tage dauernde Protokoll des ursprünglichen TrueSeq-Verfahrens auf wenige Stunden und als Ausgangsmaterial genügen schon 100 Nanogramm DNA.

Noch einfacher und schneller funktioniert die Herstellung von NGS-Bibliotheken mithilfe der Transposase Tn5, welche die DNA fragmentiert und zugleich die Sequenzier-Primer (Rd1-SP, Rd2-SP) an die Enden hängt. Die Tn5-Transposase stammt ursprünglich aus dem Tn5-Transposon von E. coli, das aus zwei invertierten DNA-Sequenzen besteht, die drei Antibiotika-Resistenzgene einrahmen. In E. coli bindet die Transposase an ein Sequenzmotiv an den äußeren Enden (OE) der invertierten Sequenzen und bildet hierdurch einen homodimeren Komplex, der die Transposon-DNA ausschneidet und in eine Ziel-Sequenz integriert.

Hyperaktive Transposase

Diesen Prozess nutzt man bei der sogenannten Tagmentation für die Herstellung von NGS-Bibliotheken aus. Dazu wird die OE-Sequenz mit den Sequenzier-Primern verknüpft und als Donor-DNA für eine mutierte Tn5-Transposase verwendet, die erheblich aktiver ist als der Wildtyp. Setzt man anschließend eine genomische DNA zu, schneidet die hyper­aktive Tn5-Transposase diese entzwei und integriert die Fragmente jeweils zwischen zwei Donor-DNAs, die an den Enden mit den Sequenzier-Primern versehen sind. Die fehlenden P5- und P7- sowie Index-Sequenzen ergänzt man anschließend mit einer PCR.

Eigentlich ein perfektes System für die schnelle und einfache Herstellung von NGS-Bibliotheken, wäre nicht der hohe Preis für die Kits, der im Wesentlichen auf die Tn5-Transposase zurückgeht. Insbesondere bei der Sequenzierung vieler Proben hilft da nur eines: Die Transposase selbst reinigen und ein eigenes Protokoll für die Tagmentation auf die Beine stellen. Eine Vorlage hierfür liefert zum Beispiel die Gruppe von Lars Steinmetz am European Molecular Biology Laboratory (EMBL) in Heidelberg. Das Team ergänzte die hyperaktive Tn5-Transposase dazu mit einem His-Sumo-Tag, der die Reinigung erheblich erleichtert (G3 8 (1): 79-89). Nach der Expression in E. coli wird das His-Sumo-Tn5-Fusionsprotein auf eine Nickel-Säule aufgetragen und nach der Eluation von der Säule mit einer His-getaggten Protease inkubiert, die das Sumo-Anhängsel abknabbert. Die Protease lässt sich danach ebenfalls mithilfe einer Nickel-Säule entfernen.

Um die Hausmacher-Tn5 unabhängig von den üblichen Tagmentations-Kits verwenden zu können, ersetzte das Team die Reagenzien und Puffer der Kits durch günstigere Produkte von Drittherstellern oder stellte sie selbst her. Die Heidelberger nutzten zum Beispiel einen üblichen TRIS-Puffer mit 25 Prozent Dimethylformamid für die Tagmentation mit der gereinigten Tn5-Transposase sowie eine High-Fidelity-Polymerase für die PCR. Auch das Tagmentations-Protokoll des Teams ist einfach durchzuführen: Die Transposase wird zunächst mit den entsprechenden Sequenzier-Adaptern beladen und dann mit der cDNA inkubiert. Die nach der Tagmentation erhaltenen DNA-Fragmente werden schließlich mithilfe einer PCR mit den restlichen für die Sequenzierung benötigten Adaptern versehen.

Bleibt aber immer noch die DNA-Extraktion, wenn genomische DNA als Ausgangsmaterial für die Konstruktion der NGS-Bibliothek dient, etwa für eine Ganzgenom-Sequenzierung. Auch dieser Schritt lässt sich mithilfe der selbst gereinigten Tn5-Transposase umgehen. Steinmetz und Co. dachten sich ein Library-Prep-Protokoll für Hefezellen aus, mit dem man sich die Reinigung der DNA sparen kann und stattdessen direkt mit der Herstellung der Bibliothek startet (G3 11(1): jkaa009).

Die Zellwand der Hefen wird dazu zunächst mit Zymolyase verdaut. Anschließend erhitzt man die entstandenen Sphäroplasten ein paar Minuten auf 95 Grad Celsius, um sie aufzulösen und gleichzeitig die Zymolyase zu inaktivieren. Ein Aliquot des erhaltenen Extrakts wird danach direkt in die Tagmentations-Reaktion mit der Tn5-Transposase eingesetzt. Das Protokoll der Heidelberger dauert nicht einmal drei Stunden und liefert nach Angaben der Gruppe genauso hochwertige NGS-Bibliotheken wie kommerzielle Tagmentations-Kits – und das zu einem unschlagbar günstigen Preis von 34 Cent je Probe.

Reagenzien-Tausch

Wer nicht vollständig auf den üblichen Ablauf der Tagmentations-Kits verzichten will, kann die Bestandteile des Kits auch einfach nur modifizieren, um Geld zu sparen. Die simpelste Maßnahme ist die Verdünnung der teuren Tn5-Transposase. Die Einsparung, die sich mit einer fünfzigfach verdünnten Tn5-Transposase erzielen lässt, genügte Aaron Darlings Team an der University of Technology Sydney in Australien jedoch nicht. Um den Preis weiter zu drücken, schmiss die Gruppe sämtliche Original-Reagenzien aus einem kommerziellen Tagmentations-Kit heraus und ersetzte sie in ihrem sogenannten Hackflex-Protokoll durch günstigere Produkte anderer Hersteller (bioRxiv, doi: org/10.1101/779215). Die Inkubations-Temperaturen und -Zeiten des ursprünglichen Kits übernahmen die Australier jedoch eins zu eins, lediglich die PCR-Parameter passten sie an die neu hinzugekommene Polymerase an. Das Hackflex-Protokoll ist etwa vierzehnmal günstiger als das kommerzielle Kit und liefert NGS-Bibliotheken mit vergleichbarer Qualität. Man muss jedoch etwas Zeit für die Herstellung der Puffer und Reagenzien einplanen, die man aber auch in größeren Mengen auf Vorrat produzieren kann.

Illumina mit Nanoporen

Zwei Fliegen mit einer Klappe schlägt die Rolling-Circle-to-Concatemeric-Consensus (R2C2)-Methode von Christopher Vollmers Gruppe an der University of California Santa Cruz. Das raffinierte R2C2-Protokoll wandelt die kurzen DNA-Stücke beliebiger Illumina-Bibliotheken in längere DNA um, die für die Nanoporen-Sequenzierung geeignet ist (bioRxiv, doi: org/10.1101/2021.10.30.466545).

Im ersten Schritt wird die DNA der Bibliothek mit einem sogenannten DNA-Splint zirkularisiert, dessen Enden mit den P5- und P7-Adaptern kompatibel sind. Anschließend vervielfältigt man die ringförmige DNA mit einer Rolling-Circle-Amplifikation. Die dazu eingesetzte Phi29-Polymerase synthetisiert ein langes lineares DNA-Molekül, auf dem die ursprüngliche Sequenz in Tandem-Repeats angeordnet ist, die sich beständig wiederholen. Für die Nanoporen-Sequenzierung muss man danach nur noch die entsprechenden Sequenzier-Adapter an die Enden der linearisierten DNA hängen. Durch die R2C2-Technik erreicht die Nanoporen-Sequenzierung eine ähnlich hohe Genauigkeit wie die Illumina-Sequenzierung. Die Kalifornier setzten die Methode insbesondere für die schnelle und kostengünstige Überprüfung von Illumina-Bibliotheken ein, bevor sie diese für zeitaufwendige und teure Sequenzier-Projekte verwenden.

Der Kreativität sind bei der Anpassung von NGS-Library-Präparations-Kits an die eigene Forschung oder finanzielle Situation also fast keine Grenzen gesetzt. Auch bei den Kits auf den nächsten Seiten dürften einige dabei sein, die nur darauf warten, modifiziert zu werden.

NGS-Library-Präparations-Kits pdficon


(Erstveröffentlichung: H. Zähringer, Laborjournal 5/2022, Stand: April 2022, alle Angaben ohne Gewähr)




Letzte Änderungen: 13.05.2022