Editorial

Special Einzelzell-Genomik und -Proteomik

Überraschende Einsichten in die Entwicklung von Zellen
von Karin Hollricher, Laborjournal 09/2018



Fotomontage: iStock / Evgenii_Bobrov (Zellen); Fotolia / warmworld (Sucher)

Mit neuen Technologien sequenzieren Wissenschaftler wie Entwicklungsbiologen die Transkriptome einzelner Zellen und identifizieren so neue Zell-Subtypen.

Zellen gelten als Grundbausteine des Lebens; deshalb möchte der Biologe ganz gerne wissen, was sich darin abspielt. Aber einzelne Zellen zu untersuchen, ist verdammt schwierig. Ganz zu schweigen von Geweben, die aus einer Vielzahl von Zelltypen in unterschiedlichen Differenzierungsstadien bestehen. Transkriptom- und Proteomanalysen von Zellpopulationen haben eine zu geringe Auflösung, sodass man schwach transkribierte Gene nicht detektiert. Außerdem lassen sich die Daten nicht auf einzelne Zellen zurückrechnen.

In den letzten fünf Jahren allerdings hat man hier entscheidende Fortschritte gemacht: Mit Single Cell RNA Sequencing, kurz scRNA-seq, gelingt es, den mRNA-Status der einzelnen Zellen heterogener Gewebe wie Darm, Lunge oder Knochenmark qualitativ und quantitativ zu beschreiben.

Das erste Transkriptom einer einzelnen Zelle – es war ein Blastomer einer Maus-Oocyte – beschrieb vor fast zehn Jahren Fuchou Tang, damals an der University of Cambridge (Nat. Methods 6: 377-82). Schon diese erste Studie dokumentierte überzeugend die höhere Sensitivität der scRNA-seq gegenüber der Bulk-RNA-Analyse. Die Forscher fanden in dieser Zelle auch sehr spärlich exprimierte Gene und neue Transkriptvarianten, die bei Versuchen mit Microarrays nicht identifiziert wurden.

scRNA-Seq für Dummies

Alle heute gängigen scRNA-seq-Protokolle folgen im Prinzip dem gleichen Ablauf: Zellen werden aus den Geweben vereinzelt und mit je einem winzigen Kügelchen, einem Bead, inkubiert. Diese Beads sind mit zahlreichen Oligonukleotiden beladen, die aus Primern für die cDNA-Synthese und individuellen Barcodes bestehen. Die cDNAs werden amplifiziert und schließlich sequenziert.

Um die Herkunft der Millionen Sequenzen eindeutig bestimmen zu können, enthält jede synthetisierte cDNA einer Zelle zwei Barcodes: Einen zellspezifischen Barcode, anhand dessen man alle cDNAs derselben Zelle zuordnen kann, und eine zweite Sequenz, die alle cDNAs kennzeichnet, welche von demselben mRNA-Molekül abstammen. Diese RNA-spezifischen Markierungen nennt man UMI (Unique Molecule Identifier). Der zweite Code ermöglicht es, aus der Anzahl der Sequence Reads die mRNAs in der betreffenden Zelle zu quantifizieren.

Die Methoden unterscheiden sich im Wesentlichen durch die für die cDNA-Synthese gewählten Primer, Oligonukleotide und Reaktionsgefäße. So arbeitet beispielsweise DropSeq mit Nanotröpfchen, die man in Mikrofluidik-Chips generiert (Cell 161: 1202-14; Cell 161: 1187-201). Microwell-Seq und Seq-Well hingegen vereinigen Beads und Zellen in winzigen Vertiefungen (Pico-Wells) auf einer halbdurchlässigen Membran oder anderen Substraten (Cell 172: 1091-107; Nat. Methods 14: 395-8).

Die wichtigsten technischen Verbesserungen sind eine deutliche Reduktion der Kosten und des Reaktionsvolumens – man sequenziert heute in Nanoliter-Volumen – sowie Automatisierung und Entwicklung der für die Datenanalyse notwendigen Software. Mit den heutigen Methoden kann man standardmäßig bereits zehntausende Zellen simultan analysieren. Mit mehr Aufwand lässt sich das Ergebnis um einen Faktor zehn steigern.

„Mit den neuen Protokollen für Large-Scale-Einzelzell-RNA-Sequenzierung hat man neue Erkenntnisse über die Heterogenität von Geweben gewonnen“, sagt Dominic Grün vom Max-Planck-Institut für Immunbiologie und Epigenetik in Freiburg. An seinem vorherigen Arbeitsplatz im niederländischen ­Utrecht untersuchte er mit seinen Kollegen von der Arbeitsgruppe von Alexander van Oudenaarden Darmgewebezellen von Mäusen und Darm-Organoiden. Die Forscher konnten anhand der Transkriptome nicht nur die Zellen eindeutig unterscheiden und identifizieren, sie entdeckten sogar sehr seltene Zellen (Nature 525: 251-5).

Die hohe Sensitivität der Methode zeigte sich auch bei anderen Studien. Neue Zelltypen beziehungsweise neue Subtypen wurden in der Lunge, dem Knochenmark, dem Gehirn und den Nieren von Mäusen und Menschen gefunden.

Mit nur einem Organ gaben sich Nikolaus Rajewsky, Robert Zinzen und Mitarbeiter am Max-Delbrück-Centrum in Berlin gar nicht erst ab. Sie nahmen sich gleich einen ganzen Organismus vor – auch wenn es nur ein sehr kleiner war. Sie analysierten die Transkriptome jeder einzelnen der 6.000 Zellen, aus denen ein Drosophila-melanogaster-Embryo im Stadium 6 besteht (Science 358: 194-9). Dabei fanden sie Transkriptionsfaktoren und lange nicht-codierende RNAs, die man bisher nicht mit diesem frühen Entwicklungsstadium in Verbindung gebracht hatte. Es mag überraschen, aber tatsächlich kann man über die Expression von 84 Genen, die fast alle für Transkriptionsfaktoren codieren, sämtliche 6.000 Zellen identifizieren. Aus den Daten entwickelten die Forscher einen virtuellen Embryo.

Rajewsky ist völlig begeistert: „Nun können wir die In-silico-Genexpression variieren und das Ergebnis modellieren – und anschließend im Experiment überprüfen, ob unser Modell richtig ist. Das ist fantastisch.“

Zellbiologen und Immunologen klassifizieren Zellen für gewöhnlich anhand ihrer Oberflächenproteine, die sich ziemlich einfach mit markierten Antikörpern kenntlich machen und damit auch isolieren lassen. Diese Epitop-basierte Identifizierung von Zellen haben Forscher mit der scRNA-Seq kombiniert und tauften sie CITE-seq (Cellular Indexing of Transcriptomes and Epitopes by Sequencing; Nat. Methods 14: 865-8). Die Verschmelzung der klassischen Zellbiologie-Technik mit moderner Einzelzell-Transkriptomik hat sich Marlon Stoeckius vom New York Genome Center ausgedacht. Der Clou dabei ist, nicht nur die cDNAs, sondern auch die Antikörper mit DNA-Barcodes zu markieren und sie darüber zu signieren. Das macht die FACS-Zytometrie überflüssig. „Eine super Methode“, sagt Rajewsky, der ehemalige Doktorvater von Stoeckius. „Wir haben sie ausprobiert, auch mit intrazellulären Proteinen. Funktioniert einwandfrei.“

Big-Data-Analyse bremst

Die moderne Einzelzell-Transkriptomik liefert gewaltige Datenmengen in kurzer Zeit. Deren Analyse ist derzeit der Bottleneck – ein neues Phänomen für Bioinformatiker. „Bei anderen Omik-Analysen waren es die Biologen, die ziemlich viel Zeit brauchten, um die Daten für die Auswertung zur Verfügung zu stellen“, sagt Fabian Theis, studierter Mathematiker, Physiker sowie Informatiker und „angelernter“ Biologe am Helmholtz-Zentrum München. „Bei Einzelzell-Transkriptomik kommen die Daten jetzt sehr schnell, und wir brauchen lange für die Auswertung. Vor noch fünf Jahren haben wir die Transkriptom-Daten von nur drei oder zehn Zellen untersucht. Heute bekommen wir Daten von zehntausend und mehr Zellen.“

Geschätzte 20.000 mRNA-Spezies mal (nur) 10.000 einzelne Zellen summieren sich schon auf 200 Millionen Daten. Die lassen sich nicht einfach zweidimensional durchackern, da kann man nicht jeden Datenpunkt mit einem zweiten vergleichen. Theis: „Dafür benötigen wir mehr Dimensionen, die wir mit unseren bisherigen Werkzeugen nicht darstellen können. Inzwischen müssen wir für fast jedes neue Experiment neue Anwendungen entwickeln.“

2018_09_01b
Was sich in einer einzelnen Zelle verbirgt, versuchen Forscher wie Nikolaus Rajewsky mit neuen Technologien zu ergründen – auf Genom-, Proteom und Transkriptom-Ebene. Foto: Privat

Wie man Millionen Transkriptom-Sequenzen untersucht, lässt sich nicht wirklich in einfachen Worten beschreiben. In aller Kürze vielleicht so: Nach einem vorbereitenden Prozessieren visualisiert man die Daten in Diagrammen als „Wolken“, wobei die x- und y-Achsen nicht jeweils ein Gen oder eine Zelle darstellen, sondern die Ergebnisse von statistischen Analysen über Nachbarschaften, also Ähnlichkeiten in den mRNA-Populationen. Auf diese Weise lassen sich Marker in Form der Expression bestimmter Gene herausfiltern und Cluster mit Zellen bilden, die eben diese Markergene exprimieren.

Theis prognostiziert dieser neuen Art der Zellbiologie eine große Zukunft, weil die Kosten für die Molekularbiologie eher niedrig sind. Und ihm macht die Arbeit viel Spaß. „Das ist total cool, denn wir bieten hier nicht einfach einen Service an, sondern entwickeln tatsächlich neue Lösungen.“

Fast grenzenlos

Aber natürlich hat jede Methode ihre Grenzen. Auch die scRNA-Seq, obwohl sie auf dem Papier nicht wirklich kompliziert aussieht. Trotzdem ist die Vereinzelung von Zellen je nach Gewebe eher schwierig. Eine einzelne Zelle mit einem Barcode-bestückten Bead zu vereinen, ist eine statistische Angelegenheit – und so landen auch mal zwei Beads bei einer Zelle oder zwei Zellen mit einem Kügelchen in einem Pico- oder Nano-Reaktionsvolumen.

Um die Fehler möglichst gering zu halten, müssen Zellen in einem drastischen Überschuss an Barcode-Kügelchen schwimmen. Je mehr Zellen man simultan analysieren möchte, desto mehr unterschiedliche – und deshalb längere – Barcodes benötigt man natürlich. Für deren Synthese gibt es derzeit zwei Wege: Entweder man stellt gleich 12er-Oligonukleotide her oder verknüpft mehrere kurze Barcodes zu längeren. Beides funktioniert, macht die Experimente aber nicht billiger.

Für dieses Problem wurden kürzlich Lösungen namens Sci-RNA-Seq und SPLiT-Seq entwickelt (Science 357: 661-7, Science 360: 176-82). Sie beruhen auf dem bereits bekannten Prinzip der kombinatorischen Barcodes. Hier verzichtet man darauf, die Zellen zu vereinzeln. Vielmehr gibt der Experimentator mehrere Zellen – oder auch nur Zellkerne – in ein Reaktionsgefäß mit einem Bead, der mit Barcode-markierten Primern bestückt ist. Nach der Synthese des ersten cDNA-Strangs mischt er die Zellen aller Reaktionsgefäße und verteilt sie wieder zufällig in Minigruppen, um sie dort bei der Synthese des zweiten cDNA-Strangs mit einem zweiten Barcode auszustatten. Diese Prozedur kann man mehrmals wiederholen. Damit sollte jede Sequenz eindeutig ­signiert sein. Aus der Art und Reihenfolge der Codes lässt sich ablesen, woher die cDNA ursprünglich kam.

Junyue Cao und Mitarbeiter in Seattle zeigten, wie und dass die Methode funktioniert. Ihnen reichten zwei Barcodes, um die Genexpressionsprofile von 50.000 Zellen des Nematoden Caenorhabditis elegans im L2-Stadium zu beschreiben. Das entspricht einer 50-fachen zellulären Abdeckung, denn in diesem Entwicklungsstadium besteht der Wurm aus nur exakt 762 somatischen Zellen. Die Methode koste 3 bis 20 US-Cent pro Zelle, und sie hätten für das gesamte Experiment nur zwei Tage benötigt, schreiben die Forscher. Okay, ohne die Datenanalyse natürlich.

Die Forscher, die heute mit Einzelzell-Transkriptomen arbeiten, sind überzeugt, mit großen, integrierten Analysen der Genexpression einzelner Zellen die Entwicklungsbiologie entscheidend voranbringen zu können. Nur wie? Eine scRNA-Seq-Analyse ist immer nur ein Schnappschuss im Lebenszyklus einer Zelle. Wie soll man damit mehr über die Entwicklung eben dieser Zelle lernen können?

Dominic Grün vom Freiburger MPI für Immunbiologie und Epigenetik erklärt: „Um einen Entwicklungspfad zu beschreiben, müsste man die Zelle finden, aus der die untersuchte Zelle gerade hervorgegangen ist. Das gelingt, indem man diejenige Zelle findet, die ihr am ähnlichsten ist, denn die molekulare Nachbarschaft verrät die entwicklungsbiologische Verwandtschaft.“

Mit seinen Kollegen machte er sich auf die Suche nach adulten Stammzellen. Solche zu identifizieren, hat sich in der Vergangenheit als sehr mühselig herausgestellt. Jahr(zehnt)e waren nötig, um Signaturen für die Stammzellen des Blut-bildenden Systems sowie für diejenigen im Darm zu identifizieren. Viel schneller gelangte Grün mit scRNA-Seq-Analysen ans Ziel (Cell Stem Cell 19: 266-77). Die Forscher entwickelten dafür einen Algorithmus namens StemID und validierten ihn zunächst an zwei Populationen bekannter adulter Stammzellen.

„Anhand der Transkriptome identifizierten wir Zellen und ihre jeweils nächsten Nachbarn. Aus den Verbindungen leiteten wir die Differenzierungspfade ab“, sagt Grün. Dann richteten die Forscher ihr Augenmerk auf adulte Stammzellen der Bauchspeicheldrüse. „Wir wissen gar nicht, ob und wann sich eine Zelle entscheidet, unwiderruflich einen Differenzierungsweg einzuschlagen. Wir definierten daher Zellen als nicht differenziert, wenn möglichst viele Gene gleichmäßig stark exprimiert waren. Wir nannten das maximale Entropie. Im Gegensatz dazu stehen differenzierte Zellen, bei denen einige Gene sehr dominant sind. Beispielsweise in Beta-Zellen Gene für die Insulinproduktion, in Zellen des Darmepithels Defensin-Gene oder in T-Helferzellen Gene für bestimmte Zytokine. Diese Zellen bezeichnen wir als solche mit geringer Entropie. Mit diesem Konzept haben wir die Stammzellen identifiziert.“ Anhand der Vorgaben fanden sie im Ausführungsgang der Bauchspeicheldrüse (Ductus pancreaticus) bis dahin unbekannte Vorläuferzellen. Grün: „Unsere Idee bestätigte eine lange gehegte Vermutung.“

Entwicklungsbiologie 2.0...

Das Konzept, anhand der Nachbarschaft die Vergangenheit einer Zelle zu beschreiben, funktioniert nur, wenn sich während der Entwicklung das Transkriptom einer Zelle nicht plötzlich sehr deutlich, sondern eher kontinuierlich verändert. Was im Organismus wirklich passiert, bleibt ein Rätsel. Um diesem Problem aus dem Weg zu gehen, wählten ­Rajewsky, Theis und Co. einen für Entwicklungsstudien extrem geeigneten Organismus: den Plattwurm Schmidtea mediterranea. Plattwürmer (Planarien) zeichnen sich dadurch aus, dass sie unendlich leben, weil alternde und verletzte Zellen beständig aus Stammzellen ersetzt werden. Die Tiere sind quasi ewig jung und beherbergen nicht nur differenzierte Zellen, sondern alle Zellen in allen Entwicklungsstadien. Das Team beschrieb die Transkriptome aller Zellen und entdeckte dabei nicht nur neue Zelltypen, sondern rekonstruierte mithilfe eines eigens entwickelten Programms auch Entwicklungslinien – Lineage Trees (Science 360: eaaq1723).

Die Autoren validierten ihre Transkriptom-Daten mit einer völlig anderen Methode. Die Idee dafür war schon bekannt: Man kann nämlich anhand des Verhältnisses von unreifer, nicht gespleißter RNA zu maturierter mRNA in die Zukunft einer Zelle schauen. Wie das? Aus dem Verhältnis lässt sich ableiten, ob die Transkription des betreffenden Gens gerade zu- oder abnimmt. „Velocyto“ heißt diese Art der Analyse, die von Gioele La Manno vom Karolinska Institut in Schweden im August dieses Jahres vorgestellt wurde (Nature, 560, 494-8).

Mit Velocyto stellten Rajewsky und Kollegen erfreut fest, dass ihre scRNA-seq-Resultate mit denen der zellinternen RNA-Verhältnisse ganz gut übereinstimmten. Rajewsky sagt: „Die ziemlich homogene Population an Stammzellen der Planarien verändert sich nicht sprunghaft, sondern langsam zu Vorläuferzellen. Daraus differenzieren sich nach und nach reife Zellen. Damit können wir alle Entwicklungswege analysieren, welche die Biologie des Tieres liefert. Wir können untersuchen, wann und unter welchem Einfluss Zellen entscheiden, welchen Entwicklungsweg sie einschlagen. Wenn wir diese Entscheidungen verstehen, können wir die Zukunft einer Zelle vorhersagen. Das ist eine ganz neue Art, Entwicklungsbiologie zu machen!“

Man kann sich leichter dieser Begeisterung anschließen, wenn man sich beispielsweise die neuesten Studien zur Zebrafischentwicklung anschaut, die Forscher vom Broad Institute und der Harvard Medical School veröffentlichten (Science, DOI: 10.1126/science.aar3131; Science, DOI: 10.1126/science.aar4362; Science, DOI: 10.1126/science.aar5780). Sie kartierten die Genexpressionsdaten aller Zellen der Fische im jüngsten Entwicklungsstadium über mehrere Stunden hinweg. Damit gelang es ihnen zu beobachten, wie Gene an- und abgeschaltet werden, welche gemeinsam exprimiert werden und wie sich Zellen differenzieren. Der Erstautor einer der Studien, James Briggs, verglich mit seinen Kollegen die Entwicklung des Frosches Xenopus tropicalis mit der des Fisches. Sie schreiben: „Die Daten schaffen Klarheit über verschiedene spezifische Entwicklungsprozesse, darunter der Entwicklungsursprung der Neuralleiste der Vertebraten.“

Rajewsky ist sich sicher, dass Einzelzell-Transkriptomik die Forschung revolutionieren und in den nächsten zehn oder zwanzig Jahren prägen wird. Um die Technologie weiter voranzutreiben, auf medizinische Fragestellungen anzuwenden und neue Erkenntnisse zu Zellentwicklung und zur Entstehung von Krankheiten zu gewinnen, hat er mit über sechzig Kollegen in 18 Ländern den Forschungsantrag „LifeTime Initiative“ bei der EU eingereicht. LifeTime soll mehr sein als nur eine Bestandsaufnahme in Form eines Gewebe-Atlas. Die Forscher wollen vielmehr verstehen und vorhersagen, wie sich die molekulare Zusammensetzung von Zellen im Krankheitsverlauf verändert, und Wege finden, diese Veränderungen rückgängig zu machen oder gar zu verhindern. Das Projekt ist in der zweiten Entscheidungsrunde und Rajewsky ist vorsichtig optimistisch: „Natürlich hoffen wir sehr auf einen positiven Entscheid.“

... und jetzt Zelltheorie 2.0.

Vor 180 Jahren entwickelten Matthias Schleiden und Theodor Schwann die Zelltheorie, wonach sich Organismen aus Zellen zusammensetzen. Rudolf Virchow konstatierte 1855: Omnis cellula a cellula, jede Zelle entsteht aus einer Zelle. Das ist vielfach bewiesen worden. Ist die Zeit nun reif für einen Atlas, der die Entwicklung sämtlicher Zell(typ)en eines Menschen darstellt? „Auf jeden Fall“, meinen viele Wissenschaftler (eLife 6:e27041). Man habe die Werkzeuge dafür jetzt in der Hand. Darum: „...it’s time to begin“.

Last Changed: 09.09.2018