Editorial

Next-Generation-Proteomik: Proteinen auf den Fersen

Mario Rembold, Laborjournal 09/2022


(06.09.2022) Ohne Massenspektrometrie kann man sich die Proteomik kaum vorstellen – fast alles dreht sich hier um die Analyse von Peptid-Massenspektren und die Frage, welche Proteine sich hinter diesen verbergen. Die größten Herausforderungen sind dabei die Sensitivität der Methoden sowie die absolute Quantifizierung.

Nukleinsäuren kann man im Reagenzglas vermehren, bis sie ein ausreichend starkes Signal generieren – zum Beispiel durch Fluoreszenz. Zudem sind sie vergleichsweise einfach sequenzierbar, wobei man für moderne Hochdurchsatzverfahren Barcode-Sequenzen anhängen kann, um Myriaden von Proben parallel zu verarbeiten. Der zentrale Trick dahinter sind die komplementären Basen.

Für Proteine gibt es diesen Kopiermechanismus nicht. Auch ein „reverses Translatieren“ zurück zu einer Nukleinsäure ist nicht möglich. Wer an Proteinen forscht, muss mit dem vorliebnehmen, was in der Probe vorhanden ist. Der Nachweis von Proteinen mit spezifisch bindenden Antikörpern ist ein nützliches Tool. Mit ihm schränkt man sich jedoch auf eine Auswahl bereits bekannter Proteine ein. Die Idee der Omiken ist aber gerade der unvoreingenommene Blick in einen Organismus, ein Organ, ein Gewebe oder in die einzelne Zelle. Und dabei will man möglichst jedes einzelne Molekül erfassen: bei der Genomik jede DNA-Sequenz, in der Transkriptomik alle RNAs (dabei geht es längst nicht mehr allein um die mRNA) und bei der Proteomik jedes Protein – und immer mit möglichst hohem Durchsatz.

bild
Foto: Montana State University

Spiel mit Masse und Ladung

Das Arbeitspferd der Proteomiker ist der Massenspektrometer. In diesem wird das Probenmaterial ionisiert, sodass die Moleküle meist positiv geladen sind. Die Ionen fliegen danach durch ein Magnetfeld, das sie ablenkt oder ihre Flugzeit beeinflusst. Bei gleicher Ladung hängt die Ablenkung allein von der Masse ab und das Material landet auf dem Detektor auf unterschiedlichen Positionen. Für jede gemessene Masse entsteht in der Auswertung ein Peak, dessen Höhe mit der Menge korreliert. Gerade bei größeren und komplex gebauten Molekülen kann man sich aber nicht sicher sein, dass alle Ionen tatsächlich die identische Ladung tragen. Peaks verschiedener Massen können sich also auch überlagern, wenn ihre Ladungen unterschiedlich sind – das Spektrum zeigt also nicht zwangsläufig die einzelnen Massen an, sondern repräsentiert das Verhältnis zwischen Masse und Ladung (m/z). Über diesen Quotienten kann man auf die Summenformel schließen. Für kleinere Moleküle gelingt das ganz gut, auch wenn es für Isomere ein paar weitere Tricks braucht. Komplette Proteine hingegen lassen sich nicht einfach zu einem ionisierten Gas verdampfen, das im Massenspektrometer analysiert werden kann. Zu den ersten Schritten der meisten proteomischen Analysen gehört daher ein Verdau, in der Regel mit Trypsin. Bei diesem entstehen Fragmente mit einem positiv ionisierbaren Ende. Proteine werden so zu kleinen Peptiden, die sich leichter messen lassen. Vor der Massenspektrometrie werden sie chromatografisch getrennt, zum Beispiel in einer High-Performance-Flüssigchromatografie (HPLC).

Je nach Fragestellung und Probenmaterial kann man vor der Chromatografie gezielt bestimmte Proteine anreichern oder andere Substanzen entfernen. Die Probenvorbereitung verringert bei jeder massenspektrometrischen Messung die Anzahl möglicher Moleküle mit ähnlichen Massen in der Probe und verbessert hierdurch die Aussagekraft der Ergebnisse. Bei der Tandem-Massenspektrometrie (MS/MS oder auch MS2) mit zwei hintereinander geschalteten massenspektrometrischen Messungen spaltet man die Fragmente nach der ersten Messung durch Kollision mit Gasmolekülen erneut in kleinere Stücke und misst sie anschließend ein zweites Mal. Auf diese Weise kann man zwischen verschiedenen Peptiden mit identischen Massen differenzieren.

Um die Massenspektren einzelner Peptide den korrekten Proteinen zuordnen zu können, verwendet man Analysetools, die auf bereits bekannte Fingerprints von Proteinen zurückgreifen oder mehr oder weniger eigenständig Voraussagen treffen (siehe hierzu auch den Artikel zur Datenanalyse in der Proteomik auf Seite 42 - Link). Die Tools erkennen häufig nicht nur die reine Aminosäuresequenz, sondern auch posttranslationale Modifikationen.

Jedes Molekül zählt

Um auch seltene Proteine oder Proteinisoformen detektieren zu können, sollte möglichst wenig Protein der Ausgangsprobe verloren gehen – gerade wenn man nur wenige Zellen untersucht, zählt jedes Molekül. Filtern, Zentrifugieren und Verdauen in Tubes von Hand führt jedoch zu mehr oder weniger großen Verlusten. 2018 stellten Forscher vom US-amerikanischen Pacific Northwest National Laboratory in Richland den NanoPOTS-Chip vor, mit dem sich auch Nanoliter-Volumina in einzelnen Tropfen verarbeiten lassen. Das Akronym steht für Nanodroplet Processing in One Pot for Trace Samples (Nat. Commun. 9: 882). Auf dem Chip befinden sich Nanowells, die für Volumina von weniger als 200 Nanoliter geeignet sind. In jedem Well ist eine hydrophil beschichtete Erhebung, auf der sich die Proteine konzentrieren, während die umgebende Oberfläche hydrophobe Eigenschaften aufweist. Der Chip lässt sich direkt bei der Probennahme in den Workflow einbinden, bis hin zur chromatografischen Auftrennung. Zwischen 10 und 140 Säugerzellen reichten der Gruppe aus, um mit dem Chip 1.500 bis 3.000 Proteine per Massenspektrometrie nachzuweisen.

Eine weitere Herausforderung in der Proteomik ist das Quantifizieren von Proteinen. Selbst kurze Peptidketten können vergleichsweise komplex sein und werden je nach posttranslationalen Modifikationen auch unterschiedlich ionisiert. „Die Konzentration eines Proteins ist nicht mit der eines anderen vergleichbar“, erklärt Andrej Shevchenko hierzu. Shevchenko leitet eine Arbeitsgruppe am Max-Planck-Institut für molekulare Zellbiologie und Genetik in Dresden. Sein Team untersucht mit der Massenspektrometrie nicht nur Proteine, sondern interessiert sich vor allem für das Lipidom. Das Quantifizieren von Lipiden sei verglichen mit Proteinen einfacher, denn im Massenspektrometer wird nicht die lange Fettsäurekette ionisiert, sondern nur die sogenannte Head Group, also der hydrophile Kopf des Lipids. „Fettsäuren können unterschiedlich sein, aber die Ionisierung hängt von der Head Group ab“, so Shevchenko. Demnach muss man lediglich die Eigenschaften dieser Kopfgruppen kennen und kann dann anhand der Spektren auf die Länge der Fettsäureketten schließen. „Ich komme also mit wenigen Standards für jede Lipidklasse aus“, resümiert Shevchenko.

Anders bei Proteinen. „Jedes Peptid ist einzigartig, die Ionisierungen sind unterschiedlich und sie fliegen unterschiedlich durch das Massenspektrometer“, benennt er die Eigenheiten dieser Biomoleküle. „Für jedes Protein, das ich quantifiziere, muss ich mehrere Peptide von jedem einzelnen Protein in einem Standard darstellen“, fährt Shevchenko fort. „Will ich eine absolute Quantifizierung von 1.000 Proteinen, dann muss ich 3.000 bis 5.000 Peptide als Standard darstellen. Das ist eine große Herausforderung.“

Für die meisten Fragestellungen der Proteomik greifen Forscher daher auf relative Quantifizierungen zurück und untersuchen dazu unterschiedliche Stadien einer Zelle, oder verschiedene Zelltypen beziehungsweise Gewebe. Hierdurch können sie sehen, ob sich die Profile unterscheiden und können ausgewählte Proteine direkt gegeneinander vergleichen. Allerdings sind keine Rückschlüsse auf molare Mengen und Stöchiometrien zwischen verschiedenen Proteinen möglich.

Um den Aufbau von Proteinkomplexen zu verstehen, ist aber genau diese Information relevant. Shevchenko nennt noch ein weiteres Argument für die absolute Quantifizierung von Proteinen: „Wenn wir die Proteomik klinisch anwenden wollen, brauchen wir absolute Referenzwerte, um die Analysen zwischen den verschiedenen Laboren vergleichbar zu machen.“ Nur dann könne die Proteomik auch einen Platz in der Diagnostik und für Therapie-Entscheidungen einnehmen. „Wenn Ihr Arzt in Ihrem Blut Cholesterol bestimmt hat, dann nennt er Ihnen auch keine relativen Werte“, argumentiert Shevchenko.

Schwierige Quantifizierung

Für die exakte quantitative Bestimmung kommt man bislang nicht um einen größeren Aufwand herum. Denn für jedes einzelne Protein muss eine Referenz hinterlegt sein. Shevchenkos Team arbeitet mit künstlichen chimären Proteinen, die aus Peptiden verschiedener ausgewählter Proteine zusammengesetzt sind und im Experiment als Referenz mitlaufen. 2017 stellte seine Gruppe das Protokoll MS Western vor, bei dem Proteine aus Proben per SDS-PAGE in einem Gel aufgetrennt werden – allerdings als Vorbereitung für die Massenspektrometrie und ohne dabei Antikörper einzusetzen (Mol. Cell. Proteomics 17(2): 384-96). Die mit stabilen Isotopen markierten chimären Proteine sind zwischen 35 und 264 Kilodalton groß und decken 300 Peptide von 58 ausgewählten Proteinen ab. „Die Eigenschaften der Peptide des künstlichen Proteins sind repräsentativ für fast jedes Protein mit diesem Peptid“, erklärt der dredner Forscher.

2020 hatten Shevchenko und Kollegen MS Western eingesetzt, um Proteine im Drosophila‑Auge absolut zu quantifizieren (Proteomics 20(23): e1900049). Mit einem einzigen chimären 264-Kilodalton-Proteinstandard bildeten sie 197 Peptide aus 43 Proteinen ab. Dabei verglichen sie Proteinmengen im Auge verschiedener Fliegen-Mutanten und berichteten über eine Sensitivität in der Größenordnung von weniger als einem Femtomol.

Proteomik-Lineal

Matthias Manns Arbeitsgruppe am Max-Planck-Institut für Biochemie in Martinsried (siehe auch das Interview zur räumlichen Proteomik auf Seite 44 - Link) entwickelte ein Verfahren, das erlaubt, die absolute Proteinmenge anhand des Verhältnisses einer massenspektrometrischen Signatur des einzelnen Proteins zur gesamten Proteinmenge abzuschätzen. Um daraus auf die Kopienzahl pro Zelle zu schließen, analysierten seine Mitarbeiter das Histon-Signal im Spektrum, das proportional zur DNA-Menge im Ausgangsmaterial ist. Für menschliche Zellen ist die DNA-Menge pro Zellkern bekannt und in der Regel auch konstant. Diesen sogenannten Proteomic Ruler hatte die Gruppe bereits 2014 vorgestellt (Mol. Cell. Proteomics 13(12): 3497-506).

Bislang taucht die absolute Proteinquantifizierung nur in wenigen Proteomik-Artikeln auf. „Ich vermute aber, dass sie in zehn Jahren Standard sein wird und dann werden über 90 Prozent der Artikel mit absoluter Proteinquantifikation einhergehen“, ist sich Shevchenko sicher. „Dann können wir in verschiedenen Projekten zwischen kranken und gesunden Menschen vergleichen. Ich denke, wir werden dann in der Lage sein, vielleicht 1.000 Proteine im Blut zu analysieren und haben dafür dann auch 1.000 Referenzwerte.“

Man mag sich fragen, warum man Proteine so genau untersucht, wenn doch auch die Transkriptomik einen guten Hinweis darauf liefert, welche Gene abgelesen und letztlich zu Proteinen translatiert werden. Tatsächlich ergänzen sich im Idealfall all diese Omiken. Klar ist aber auch: mRNAs haben verschiedene Halbwertszeiten und auch deren Translation kann je nach zellulärem Kontext unterschiedlich reguliert sein. Hinzu kommen posttranslationale Modifikationen, etwa Phosphorylierungen. Diese nachträglichen Anpassungen sind selbst im Massenspektrometer nicht immer leicht aufzuspüren, weil sie oft nur einen Bruchteil an der Gesamtmenge des jeweiligen Proteins ausmachen – für das Verständnis der Regulation, etwa von Signalkaskaden, sind sie aber äußerst wichtig.

Nachweis mit Nanoporen

In ihrem Review aus dem Jahr 2020 schätzen Winston und Gregory Timp, dass zu jedem der 20.000 bekannten proteincodierenden Gene des Menschen im Schnitt rund 100 Isoformen existieren, wenn man Alternatives Splicing, Polymorphismen einzelner Aminosäuren sowie posttranslationale Modifikationen einbezieht (Sci. Adv. 6(2): eaax8978). Um auch kleinste Proteinmengen zu entdecken und ähnliche Fingerprints im Spektrum unterscheiden zu können, sind deshalb möglichst sensitive Methoden unabdingbar. Ideal wäre es, wenn man einzelne Protein-Moleküle analysieren könnte.

Spannend sind hier Entwicklungen rund um Nanoporen-Technologien, zu denen die beiden Autoren im oben genannten Review ebenfalls einen Ausblick geben. Für die DNA- und RNA-Sequenzierung mit Nanoporen existieren bereits kommerzielle Plattformen. Das Prinzip: In einer Membran ist ein Kanalprotein integriert, durch das die einzelnen DNA-Moleküle von einer Seite der Membran auf die andere gelangen. Während der Passage verändert sich der Durchfluss geladener Teilchen durch den Kanal, wodurch sich die Spannung zwischen den beiden Seiten der Membran kurz verändert. Die Spannungsänderungen sind charakteristisch für jede Base, die durch die Pore gleitet, und werden in eine Nukleinsäuresequenz übertragen.

Um ein Protein mit Nanoporen zu sequenzieren, müsste man es entfalten und Aminosäure für Aminosäure durch die Pore lotsen. Man kann aber auch Rückschlüsse auf Modifikationen oder Aminosäure-Variationen ziehen, indem man komplette, gefaltete Proteine durch eine Nanopore zwingt. Dabei zeigt der Spannungsverlauf fünf charakteristische Signaturen für Form, Volumen, Ladung, Diffusionskoeffizient und Dipol-Moment. Die Technik trägt daher den Namen 5D-Fingerprinting.

Auch jenseits der Massenspektrometrie warten also neue Methoden darauf, ihren Platz in der Proteomik zu finden.