Editorial

Sequenzieren in dunklen Löchern

(18.8.15) Den Titel "Sequenzierer der 3. Generation" beansprucht neben dem Nanopore MinION auch der RS II von Pacific Biosciences. Wie funktioniert die Kiste und was kann sie?
editorial_bild

An dieser Stelle haben wir bereits zwei mal über das Sequenzier-Wunderkästchen "MinION" der Firma Oxford Nanopore berichtet (hier und hier). Es wird daher Zeit, auch die andere Technologie anzuschauen, die ebenfalls unter dem Schlagwort "Sequenzierer der dritten Generation" daherkommt, aber ganz anders funktioniert als die Zigarrenschachtel aus Oxford: die Single-Molecule-Real-Time-(SMRT-)Methode von Pacific Biosciences, verbaut im Gerät PacBio RS II.

Worum geht's noch mal bei "3rd Generation Sequencing" und wieso eigentlich "dritte Generation"?

Eine kurze Ahnenreihe:

1. Generation

Die traditionellen DNA-Sequenziermethoden der ersten Generation (also im Wesentlichen das Sanger-Verfahren und dessen Fortentwicklungen) sind äußerst akkurat und liefern lange "Reads" (kontinuierlich abgelesene Sequenz-Stückchen). Sie sind aber furchtbar langsam.

Editorial

2. Generation

Verfahren der zweiten Generation (die Sequenzier-Kisten von lllumina, IonTorrent oder das mittlerweile ausrangierte 454-Pyrosequencing von Roche) sind deutlich schneller, machen dafür aber recht viele Fehler. Und die Hochdurchsatz-Maschinen spucken nur wenige hundert Basenpaare kurze Sequenz-Schnipsel aus. Das bereitet Bioinformatikern oft Kopfzerbrechen und ist vor allem bei de novo Sequenzierungen lästig; also immer dann, wenn man sich beim Zusammenbau eines bisher völlig unbekannten Genoms nicht an einem Referenz-Genom entlang hangeln kann.

3. Generation

Methoden der kommenden dritten Generation sollen zum einen noch schneller und billiger sein (Zukunftsvision, beim Hausarzt: "Wir sequenzieren schnell ihr Genom, setzen Sie sich doch noch einen Moment ins Wartezimmer"). Auch die Reads sollen wesentlich länger sein als bei den Geräten früherer Generationen. Und idealerweise sollten neue Methoden bei allem Geschwindigkeitsrausch wieder weniger Fehler machen.

Wie Oxford Nanopore diese Visionen angeht, haben wir uns schon angesehen. Wie probiert's PacBio?

Wie andere Sequenzierverfahren zuvor arbeitet auch die PacBio-Kiste mit fluoreszenz-markierten Nukleotiden, die einer DNA-Polymerase zum Einbau angeboten werden. Die DNA-Polymerase arbeitet sich an der zunächst einzelsträngigen Vorlage-DNA entlang und baut komplementäre, unterschiedlich markierte Nukleotide in den neu synthetisierten Strang ein. Die Neuheit des PacBio-Geräts ist, dass man der DNA-Polymerase kontinuierlich bei der Arbeit zusieht. Beim traditionellen Sanger-Verfahren bricht die DNA-Synthese dagegen ab, sobald ein markiertes Nukleotid an die Reihe kommt, und am Ende vieler solcher Ereignisse wird ausgewertet. Und auch bei den Geräten der zweiten Generation geht es meist im Stop-and-go-Verfahren vorwärts.

Der Polymerase über die Schulter schauen

Nicht so beim PacBio: Die Synthese läuft dort immer weiter, im Prinzip wie in der Zelle. Der Detektor liest in Echtzeit mit, welches Nukleotid die Polymerase gerade an die jeweils komplementäre Position des Vorlage-Strangs einbaut. Ein entscheidender Trick dabei: Die Fluoreszenz-Markierung hängt, anders als bei anderen Verfahren, am Phosphatrest der Nukleotide – und dieser (und mit ihm die Markierung) wird sowieso wieder abgeschnitten, sobald das nächste Nukleotid drankommt. Es wird also immer nur ein Nukleotid nach dem anderen ausgelesen. Die Geschwindigkeit, mit der das Gerät Sequenzen liest, ist quasi identisch mit dem Arbeitstempo der DNA-Polymerase. Die Reads sind typischerweise um 3.000 Basenpaare lang, können aber 20.000 und mehr Basenpaare erreichen.

Der Polymerase bei der Arbeit zusehen – das klingt allerdings einfacher, als es ist. Würden zahlreiche Polymerasen gleichzeitig in der gleichen Lösung vor sich hin synthetisieren, jeweils an anderen DNA-Positionen, würden sich die Signale überlagern. Damit nicht genug der Schwierigkeiten: Die fluoreszenz-markierten, noch nicht eingebauten Nukleotide in der Lösung könnten ein starkes Hintergrundrauschen erzeugen, das das Signal unter sich begraben würde.

Die PacBio-Ingenieure haben diese Probleme gelöst, indem sie die DNA-Polymerase auf dem Boden winziger Löcher fixierten. Und zwar pro Loch nur eine Polymerase.

Diese Vertiefungen haben weniger als 100 nm Durchmesser. Es ist darin fast vollständig dunkel, denn die Wellenlänge des sichtbaren Lichts ist eigentlich zu groß, um so ein Mini-Loch auszuleuchten. Einige Anteile des von unten eingestrahlten Anregungslichts dringen aber etwa 10 nm weit vor. Das "Beobachtungslicht" erreicht damit gerade so das am Boden fixierte Enzym. So kann das Gerät die Synthesearbeit der DNA-Polymerase verfolgen, die in der Lösung herumschwimmenden, markierten Nukleotide (die andernfalls das Signal verrauschen würden) bleiben dagegen größtenteils im Dunkeln. "Zero Mode Waveguide" heißt dieses Mini-Loch, und auf einen Chip passen mehrere zehntausend dieser Detektionsgrübchen.

Der Fehlerteufel muss noch ausgetrieben werden

Soweit zur Theorie. Was taugt die Methode in der Praxis? Seit 2010 sind die ersten SMRT-Sequenzierer außerhalb der Entwicklungslabore im Einsatz. Ferrarini et al. haben damit beispielsweise ein 150.000 Basenpaare langes Chloroplasten-Genom de novo sequenziert und berichten, dass sie damit einige Unklarheiten in einem parallel gewonnen Illumina-Datensatz beseitigen konnten.

Aber ähnlich wie Konkurrent Nanopore kämpft auch PacBio damit, dass die Sequenzier-Knechte mehr Fehler machen, als sich die Praktiker wünschen. Die Fehlerrate beim einmaligen Ablesen eines DNA-Abschnitts liegt meist deutlich über 10 Prozent, lässt sich aber durch höhere Abdeckung gut drücken, da die Fehler offenbar recht zufällig verteilt sind.

Wie auch beim MinION sorgt vor allem die erfreuliche Read-Länge für erste praktische Anwendungen, meist in Kombination mit den Verfahren der 2. Generation (siehe Roberts et al., Genome Biology 14: 405). Die etablierten Illumina-Geräte spucken recht zuverlässig große Datenmengen aus, aber eben in Form vieler kleiner Schnipsel. Die teils extrem langen Reads des PacBio dienen z. B. bei einem de novo Zusammenbau eines Genoms als Gerüst, um verwaiste Sequenz-Abschnitte miteinander zu verbinden, um Lücken zu schließen und Fehler zu bereinigen.

Epigenetische Markierungen lesen

Neben der reinen Sequenzbestimmung gibt es aber noch eine Eigenheit der neuen Technik, die spannende Anwendungen verspricht: Das Echtzeit-Prinzip bringt es mit sich, dass die PacBio-Kiste auch misst, wie schnell die DNA-Polymerase auf dem Strang vorankommt. Und diese Lesegeschwindigkeit hängt unter anderem davon ab, welche DNA-Modifikationen vorhanden sind. Man kann mit dem RS II also auch das epigenetische Profil eines DNA-Abschnitts lesen (siehe Flusberg et al., Nature Methods 7: 461-65)

Im Vergleich zum Sequenzieren durch Nanoporen, das auf einem völlig neuartigem Detektionsprinzip beruht, ist das PacBio-Verfahren vielleicht etwas weniger revolutionär. Ein PacBio RS II passt jedenfalls nicht in die Hosentasche wie der Winzling von Oxford Nanopore.

Wer aber am Ende die Nase vorn haben wird – oder ob beide Geräte sich ihre je eigene Nische erobern – muss sich noch zeigen.

 

Hans Zauner

Foto: Ein SMRT-chip (Pacific Biosciences)



Letzte Änderungen: 01.10.2015