Editorial

Mausgemachte Datenflut – und wie man sie beherrscht

Ein Labor-Informations- und Managementsystem (LIMS) wird erklärt

Larissa Tetsch


Hochdurchsatzverfahren liefern der biomedizinischen Forschung Unmengen komplexer Daten. Um diese in den Griff zu kriegen, sind Labor-Informations- und Managementsysteme (LIMS) unabdingbar. Die Forscher der Deutschen Mausklinik am Helmholtz Zentrum München verlassen sich dazu auf ihr maßgeschneidertes System MausDB. Laborjournal hat sie besucht.

172
Illustr.: macrovector / iStockphoto

Bei dem Wort „Massen“ denke ich als Rheinländerin natürlich als erstes an Karneval – oder Fasching, wie man im Süden sagt. Spätestens ab 11:11 Uhr geht an Weiberfastnacht nichts mehr zwischen Mainz und Düsseldorf. Alles wuselt kreuz und quer, Sektkorken knallen und selbst aus den Uni-Laboren schallt Schunkelmusik. Auf dem Rathausplatz sammeln sich die Menschenmassen, bis kein Durchkommen mehr ist. Es scheint undenkbar, diesem Menschengedränge Herr zu werden; und wer unter Agoraphobie leidet, bleibt besser zu Hause.

Um Massen geht es in diesem Artikel auch. Aber nicht um Menschenmassen, sondern um Datenmassen – besser bekannt unter dem Schlagwort „Big Data“. Vielleicht denken Sie dabei zuerst an staatliche Überwachungssysteme, an Facebook oder Google? Aber auch in der modernen biomedizinischen Forschung fallen Unmengen an Daten an. Und wo große Datenmengen anfallen, braucht man Verfahren und Systeme, die diese erfassen, analysieren, ordnen, speichern und wieder bereitstellen. Mehr und mehr bedienen sich Labors daher spezieller Labor-Informationssysteme.

Ein Beispiel liefert die Deutsche Mausklinik, eine weltweit einzigartige Einrichtung, in der jedes Jahr eine Vielzahl von Mäusen miteinander verpaart und anschließend phänotypisiert wird. Zum Glück befindet diese sich am Helmholtz Zentrum München, weitab von den Faschingshochburgen entlang des Rheins. Und so erklärten sich Martin Hrabĕ de Angelis, Direktor der Mausklinik, und Holger Maier, IT-Chef der Einrichtung, auch mitten in der Faschingszeit bereit, sich mit mir zu treffen, um mir „MausDB“, das LIMS der Mausklinik, vorzustellen.

An der Pforte des Deutschen Forschungszentrums für Gesundheit und Umwelt, so der volle Name des Münchner Helmholtz Zentrums, holt mich dessen Pressereferent ab. Er führt mich über das weitläufige Gelände mit seinem Mix an Gebäuden aus unterschiedlichen Bauepochen bis zum Institut für Experimentelle Genetik, welches die Mausklinik beherbergt. Schnell kommen wir auf das sensible Thema Tierversuche, und ich merke, dass meine Gesprächspartner sehr behutsam damit umgehen. Tierschutz wird sehr ernst genommen, und es ist ein erklärtes Anliegen der Mausklinik, Tierversuche zu reduzieren, wie mir Hrabĕ de Angelis später erklärt.

LIMS hilft Tierversuche zu reduzieren

Nun geleitet er uns jedoch erst einmal in einen durch eine Glaswand vom Gang getrennten Besprechungsraum, der mit seiner technischen Ausstattung und der Bücherwand eine perfekte Synthese aus Modernität und Gemütlichkeit darstellt. Nach und nach gesellen sich IT-Chef Maier, die wissenschaftlich-administrative Leiterin Valérie Gailus-Durner und der wissenschaftlich-technische Leiter der Mausklinik Helmut Fuchs zu uns. Normalerweise treffen sich Klinikmanagement und IT-Spezialisten um diese Zeit zur wöchentlichen Projektbesprechung, verrät mir Gailus-Durner. Stattdessen sitzt die Führungsriege der Mausklinik nun mir gegenüber und erzählt über die Mausklinik – und vor allem über MausDB, das speziell auf die Bedürfnisse der Einrichtung zugeschnittene Labor-Informationssystem.

172

Viele Mäuse bedeuten viele Daten. Foto: Stuart Wilson

Die Gründung der Mausklinik im Jahre 2001 durch Hrabĕ de Angelis, der dem Institut für Experimentelle Genetik (IEG) vorsteht, fällt nicht zufällig in eine Zeit, in der sich durch die enorme Steigerung der Empfindlichkeit und Genauigkeit moderner biomedizinischer Analysemethoden sowie insbesondere durch die Entwicklung von Hochdurchsatzverfahren plötzlich große Datenmengen erheben ließen. Das IEG hat sich seitdem der systemischen Analyse von Erbkrankheiten des Menschen am Mausmodell verschrieben – vor allem Stoffwechselkrankheiten wie beispielsweise Diabetes mellitus, Adipositas und Osteoporose.

Die Mitarbeiter der Mausklinik charakterisieren systematisch und umfassend die entsprechenden Mausmodelle, die entweder von der eigenen oder kooperierenden Forschergruppen stammen, indem sie diese auf veränderte Merkmale hin untersuchen. Auch Einflüsse von Umweltfaktoren, die neben Gendefekten bei vielen Erbkrankheiten eine Rolle spielen, beziehen sie in die Analyse ein.

Gesamtschau von Gendefekten

Die ersten genetisch veränderten Mäuse trugen durch chemische Mutagenese zufällig erworbene Punktmutationen, die meist die Inaktivierung eines einzelnen Gens verursachten, wie es bei vielen Erbkrankheiten beobachtet wird. „Diese Mauslinien sind noch immer weltweit gefragt“, betont Hrabĕ de Angelis. Heute dagegen werden in aller Regel bestimmte Gene mit verschiedenen Methoden gezielt derart verändert, dass sie die aus dem Menschen bekannten Krankheits-verursachenden Defekte nachbilden. Aus manipulierten embryonalen Stammzellen erzeugen die Forscher der Mausklinik hierbei genau so viele Mäuse, wie sie für statistisch abgesicherte Experimente benötigen. Diese prüfen sie selbst, aber auch Spezialisten von kooperierenden Einrichtungen, in den Laboren vor Ort im wahrsten Sinne des Wortes auf Herz und Nieren.

Dabei legen die Forscher Wert darauf, möglichst nicht-invasive, bildgebende Untersuchungsmethoden zu nutzen. Einerseits belastet das die Versuchstiere weniger, andererseits wird verhindert, dass die Verfahren Ergebnisse späterer Tests verfälschen; denn jede Maus durchläuft in immer gleicher Reihenfolge alle Stationen eines Screenings, bei dem 520 Parameter erfasst werden.

Alle Untersuchungen finden im Grunde wie in einer normalen Klinik statt, nur dass an die Größe der Tiere angepasste Geräte verwendet werden. Hierzu gehören unter anderem die Erstellung eines Blut­bilds samt immunologischer Parameter, neurologische Verhaltenstests, eine Untersuchung der Augen, die Messung der Knochendichte, ein Herzultraschall zur Analyse von Herz-Kreislauferkrankungen, verschiedene Stoffwechseltests und eine Transkriptom-Analyse. Am Ende werden in der Pathologie noch einmal alle Organe genau untersucht. Statt eines Flickwerks von Datensätzen, das entsteht, wenn verschiedene Forschergruppen jeweils eine eng begrenzte Fragestellung untersuchen, erhalten die Forscher der Mausklinik folglich nahezu eine Gesamtschau eines Gendefekts.

„Wir haben hier unter einem Dach viele verschiedene Labore mit Spezialisten für die einzelnen Organsysteme“, fasst Hrabĕ de Angelis zusammen. „Die genetisch veränderten Tiere werden so umfassend charakterisiert und können nachher für verschiedene Projekte eingesetzt werden. Auf diese Weise müssen die Tiere nur einmal erzeugt werden und stehen der gesamten Wissenschaftlergemeinschaft zur Verfügung.“ Dazu werden die Mutanten in dem ans IEG angeschlossene Europäische Mutanten-Maus-Archiv (EMMA) entweder als Spermien oder Embryonen in Flüssigstickstoff gelagert und können dort bei Bedarf angefordert werden.

Maßgeschneidertes System

„Insgesamt haben wir es mit einem unwahrscheinlich hohen Datenvolumen und einer großen Datenkomplexität zu tun. Wer mit solchen Daten arbeiten möchte, also Large Scale Biology betreiben möchte, kommt an einem LIMS nicht vorbei“, leitet Hrabĕ de Angelis über. Dabei gibt es verschiedene Herausforderungen, denen das LIMS der Mausklinik gerecht werden sollte. So muss es beispielsweise sicherstellen, dass die richtigen Tiere zur richtigen Zeit – und nur dann – gezüchtet werden. Anschließend muss das System mit der Unmenge an Daten, die die Phänotypisierung generiert, umgehen können – sowohl mit reinen Messdaten, als auch mit vielen Bilddaten. Diese werden gespeichert, auf falsch positive und negative Ergebnisse überprüft und anschließend allen Nutzern zugänglich gemacht. „Wir haben hier ein System, das dies von A bis Z managen kann“, so Hrabĕ de Angelis.

Eine weitere Forderung an das LIMS ist, dass die Daten integrationsfähig sein sollen – also mit Daten aus anderen Systemen zusammengeführt werden können. „Wir waren weltweit die Ersten, die ein derartiges LIMS für die Phänotypisierung gestartet haben, doch inzwischen gibt es auch ein europäisches und ein internationales Projekt, die zum Teil mit anderen Datenbanken arbeiten, mit denen unsere kompatibel sein muss“, erklärt der Direktor die Problematik. So gehört die Mausklinik dem International Mouse Phenotyping Consortium (IMPC) an, das sich zum Ziel gesetzt hat, den ersten umfassenden Funktionskatalog des Säugetiergenoms zu erstellen. Das Projekt wurde 2015 von den Forschungsministern der G7-Staaten als ein Wissenschaftsprojekt von globaler Bedeutung ausgelobt, und ist laut Hrabĕ de Angelis von der Größenordnung in etwa vergleichbar mit dem Human Genome Project, das von 1990 bis 2003 das gesamte menschliche Genom entschlüsselte.

Zusätzlich sollen die in MausDB hinterlegten Informationen mit Daten von anderen Kleinsäugern und tierischen Modellsys­temen, sowie letztlich auch mit Humandaten abgleichbar sein. Schließlich hatten sich die Mausforscher noch ein benutzerfreundliches System mit einer grafischen Benutzeroberfläche gewünscht, wie sie beispielsweise von Windows bekannt ist, um den Anwendern mit sehr unterschiedlichem Ausbildungshintergrund den Zugang zu erleichtern. Die Entwicklung von MausDB war deshalb ein schrittweiser Prozess, bei dem immer wieder Feedbackrunden mit Wissenschaftlern, Technischen Assistenten, Tierpflegern, dem Management der Klinik und bei Bedarf auch anderen Anwendern stattfanden.

Frei verfügbares Modul

Die erste Version von MausDB ging 2006 als reines Maus-Management-Modul in Betrieb. Als Vorbild diente ein System aus der Humanmedizin, das an die Bedürfnisse der Mausforschung angepasst wurde. „Mäuse haben natürlich keine Krankenversicherungsnummer“, erklärt Maier, der MausDB maßgeblich entwickelt hat. „Andererseits enthält die Krankenakte von Menschen in der Regel keinen Stammbaum. Bei unseren Mäusen werden die Vorfahren dagegen über Generationen hinweg dokumentiert.“ Mit dem hauptsächlich in Perl programmierten Modul lassen sich Verpaarungen überwachen, Arbeitsabläufe der Phänotypisierung erstellen, Daten aufnehmen und speichern. Inzwischen wird dieses Maus-Management-Tool von allen anderen Mäuse-haltenden Einrichtungen auf dem Campus verwendet.

„So können wir in Sekunden den aktuellen Stand der Arbeiten abfragen“, fügt Hrabĕ de Angelis hinzu, bevor der IT-Experte fortfährt: „MausDB war natürlich ein Umstellungsprozess für die Anwender, die bislang mit Excel und Papier gearbeitet hatten. Inzwischen bekommen wir aber sehr positives Feedback, dass das System selbst bei kleinen Mäusezuchten hilfreich ist. Man hat einfach einen besseren Überblick über die Haltung und die bereits durchgeführten Experimente.“

Auch wenn es für die Verwendung in einer Mausklinik entwickelt wurde, funktioniert das System übrigens auch bei anderen Tieren, die sich verpaaren lassen. Das Maus-Management-Modul ist ein webbasiertes, Open-Source-System und kann auf der Internetseite der Mausklinik heruntergeladen werden. So nutzen zurzeit außer den Instituten auf dem Campus des Helmholtz Zentrums München weltweit 17 andere Einrichtungen das Labor-Informationssystem der Deutschen Mausklinik.

Anforderungen ändern sich

Mit der Zeit jedoch änderten sich die Anforderungen an das System, weswegen Maier und Co. MausDB 2011 um ein in Java programmiertes Modul erweiterten, in dem die Prozessplanung, die Datenanalyse und das Berichtswesen angesiedelt sind. Letzteres läuft auf verschiedenen Ebenen ab, sodass neben wissenschaftlichen Berichten auch solche erstellt werden können, die der Finanzabteilung eine Abrechnung ermöglichen oder aus denen Behörden aktuelle Zahlen zu den Tieren entnehmen können. Dabei ist das System kompatibel mit den Regularien der Europäischen Union – das heißt, es erstellt Projektberichte, die alle Anforderungen erfüllen, die die EU hinsichtlich wissenschaftlicher Tierversuche stellt. Der modulare Aufbau aus dem ursprünglichen Maus-Management-System, MausDB classic, und dem neuen Modul MausDB 2.0 macht das System flexibler und weniger anfällig für Störungen, etwa durch Veränderungen einzelner Prozesse.

„Pro Woche werden in der Mausklinik etwa tausend Tests durchgeführt. Diese logistische Herausforderung muss gestemmt werden“, unterstreicht Holger Maier die Leistungsfähigkeit des Systems. „Im Moment haben wir genau 141 Mauslinien im Haus – und damit etwa so viele Projekte, die parallel laufen.“ Hrabĕ de Angelis fügt hinzu: „Seit der Gründung der Mausklinik im Jahre 2001 sind Millionen von Datenpunkten angefallen.“

Tierversuche reduzieren

An dieser Stelle kommt er noch einmal auf das schwierige Thema „Tierversuche“ zurück: „Unser MausDB ist unverzichtbar, um unnötige Tierversuche zu vermeiden. Wir sind Partner von Infrafrontier, in dem sich europäische und kanadische Mauskliniken zusammengeschlossen haben und das vom Bundesforschungsministerium als Roadmap-Projekt priorisiert wurde. Ein Ziel von Infrafrontier ist, die sogenannte 3R-Strategie des Tierschutzes – Replacement (Ersetzen), Reduction (Verringern) und Refinement (Verbessern) – um die drei weiteren „Rs“ aus Reliability (Verlässlichkeit), Responsibility (Verantwortung) und Reproducibility (Reproduzierbarkeit) zu ergänzen. Systemische Analysen, wie wir sie machen, können nicht in der Petrischale durchgeführt werden. Wo Tierversuche nötig sind, möchten wir aber ihre Reproduzierbarkeit erhöhen“, erläutert er den Ansatz der Mausklinik. „Im Moment gibt es ja eine große Diskussion über die Reproduzierbarkeit von wissenschaftlichen Experimenten. Weil wir die Experimente unter standardisierten und statistisch abgesicherten Bedingungen durchführen, können sich auch andere Forschergruppen auf unsere Daten verlassen. Auch das reduziert die Zahl der Tierversuche.“

Einen Grund für die mangelnde Reproduzierbarkeit wissenschaftlicher Experimente sieht Hrabĕ de Angelis in der fehlenden Angabe von Metadaten. Das sind alle Daten, die einen Einfluss auf die Messergebnisse haben können, wie die Art des Messgeräts, der Experimentator, die Jahres- und Tageszeit,… – kurzum alles, was sich unter „Wie, Wer, Wann und Wo“ zusammenfassen lässt. Oft sind dabei die Metadaten sogar umfangreicher als die gemessenen Daten selbst, wie mir Maier später in der Datenbank zeigt. „Diese Metadaten sind uns sehr wichtig“, betont Hrabĕ de Angelis. „Oft fehlen sie bei wissenschaftlichen Veröffentlichungen, wir aber hinterlegen sie gemeinsam mit den Daten, so dass sie für jedermann zugänglich sind. Damit lassen sich Ausreißer und abweichende Test­ergebnisse oft leichter erklären.“

MausDB in Aktion

Dies ist das Stichwort für den IT-Experten, eine Demoversion von MausDB auf eine Leinwand vor der Bücherwand zu projizieren. Jeder der rund hundert Wissenschaftler, Techniker, Tierpfleger und Projektleiter, die mit MausDB arbeiten, loggt sich mit einem eigenen Passwort ein und erhält daraufhin Zugriff auf für ihn relevante Daten. Jede Änderung der Daten wird dabei genau dokumentiert und lässt sich bis zum jeweiligen Nutzer zurückverfolgen. An der Weiche zwischen MausDB classic und MausDB 2.0 entscheiden wir uns für das Maus-Management-System, in dem es zwei wesentliche Organisationsebenen gibt: die einzelne Maus, erkennbar an ihrer Identifikationsnummer (Maus-ID) – oder das jeweilige Projekt. In sogenannten Orderlisten sind die Arbeitsaufträge angelegt, die festlegen, was genau mit welchen Mäusen getan werden soll. Jede Orderliste besitzt eine eigene ID-Kennung, einen Status und eine Qualitätskontrolle. Die Planung der Versuche reicht manchmal Monate in die Zukunft, so zum Beispiel bei Projekten, in denen Alterungsprozesse der Mäuse untersucht werden.

172
Leiten die Mausklinik (v.l.n.r.): Valérie Gailus-Durner, Holger Maier, Martin Hrabĕ de Angelis und Helmut Fuchs. Foto: Larissa Tetsch

Nach den Experimenten wird überprüft, ob alle Daten vorhanden sind und sich in einem vernünftigen Rahmen bewegen. „Zum Beispiel kann eine Maus nicht 500 Gramm wiegen“, verdeutlicht Maier. In den Arbeitslisten werden die Mäuse, jeweils eingeteilt in eine Kontroll- und eine Testgruppe, nach Männchen und Weibchen farbkodiert und mit ihrer Maus-ID sowie weiteren Informationen wie dem Alter in Tagen, dem genetischen Hintergrund und der genetischen Veränderung, dem Stellplatz des Käfigs, und so weiter… aufgelistet. Jedes Experiment wird mit der gleichen Anzahl an weiblichen und männlichen Tieren durchgeführt, um Ergebnisse zu erhalten, die für beide Geschlechter gültig sind. Obwohl bekannt ist, dass das Geschlecht einen messbaren Einfluss auf verschiedene Parameter hat, ist dies in der vorklinischen Forschung noch längst nicht Standard.

Mäuse im Einkaufskorb

Zusätzlich lässt sich für jede Maus ein Stammbaum erstellen. An einem willkürlich herausgesuchten Beispiel demonstriert uns Maier, wie er die Vorfahren der Maus bis zum Ursprung im Jahr 2006 zurückverfolgt. Mit Hilfe von MausDB kann man so jederzeit sehen, wie voll das „Maushaus“ zu einem bestimmten Zeitpunkt ist, von wem die Käfige belegt werden, wo Verpaarungen stattfinden und auch, wer wann mit wem zusammen gehalten wurde, so dass beispielsweise Infektionswege schnell aufgedeckt werden könnten (was seit dem Bestehen der Mausklinik aber glücklicherweise noch nie nötig war). An jedem Käfig klebt eine Käfigkarte im Postkartenformat mit den relevanten Daten der Tiere, und jede Maus ist durch eine Ohrmarke eindeutig identifizierbar.

Möchte man nun mit bestimmten Mäusen arbeiten, legt man sie in einen virtuellen Einkaufskorb wie im Online-Shop und wählt anschließend Aktionen wie beispielsweise eine Genotypisierung oder eine Verpaarung. Nach erfolgreich ausgeführter Aktion lassen sich die Ergebnisse der Aktion – etwa ein Wurf, der aus einer Verpaarung hervorgegangen ist, oder Messdaten – in eine Maske eintragen, wobei gleichzeitig für jeden Arbeitsauftrag auch die spezifischen Metadaten erfasst werden. Sterben Tiere durch Krankheit oder im Verlauf eines Experiments, wird dies unter der behördlich geforderten Angabe des Schweregrads der Belastung dokumentiert, sodass am Ende über jedes einzelne Tier Rechenschaft abgelegt werden kann.

Die Daten können über eine Suchmaske nach Belieben hinsichtlich Maus-ID, Phänotyp, Mäuse-Stamm, Art des Tests oder anderer Parameter durchsucht werden. Maier wählt exemplarisch einen Glukose-Toleranztest aus, wie er zur Feststellung von Diabetes auch beim Menschen durchgeführt wird. Die statistische Auswertung des Tests erfolgt über ein Skript in der Programmiersprache R, die auf strukturierte Messdaten angewiesen ist – genau wie sie MausDB liefert. In kürzester Zeit können so Daten von tausenden von Untersuchungen in Graphen umgewandelt werden, die dann gespeichert werden und den Wissenschaftlern für die Befundstellung sowie Berichterstattung zur Verfügung stehen.

Während die Analyse der Rohdaten noch im Maus-Management-Modul erfolgte, wechseln wir für die Befundstellung in das erweiterte Modul MausDB 2.0. „Die Bewertung der Daten nimmt uns das System natürlich nicht ab“, stellt Hrabĕ de Angelis fest. „Durch die Unterstützung des Systems bleibt aber mehr Zeit für die Wissenschaftler, Befunde zu erstellen und zu entscheiden, ob ein bestimmtes Ergebnis überhaupt eine Bedeutung hat.“ Am Ende kann quasi mit einem Knopfdruck ein über hundert Seiten starker Projektbericht erstellt werden, der auch experimentelle Details enthält und eine optimale Basis für Publikationen darstellt. Externe Wissenschaftler, die ihre Mäuse in der Mausklinik untersuchen lassen, erhalten ihn im Rahmen einer wissenschaftlichen Kollaboration. „An dieser Stelle kann auch eine Brücke zu den Daten des Menschen gebaut werden, was natürlich letztendlich unser Ziel ist“, stellt Hrabĕ de Angelis fest.

Abschließend demonstriert Maier noch, wie MausDB konkret die Arbeitsplanung erleichtert. In einer Kalenderansicht ist minutiös eingezeichnet, wer wann welches Experiment durchführt. Dazu verfolgt MausDB immer den Fortschritt eines Projekts, indem vordefinierte Schritte mit dem aktuellen Status verglichen werden. In einer anderen Einstellung ist jeder Testreihe eine Kapazität zugeordnet, die je nach Verfügbarkeit farbkodiert ist. Rot bedeutet, dass mehr Versuche geplant sind, als standardmäßig durchgeführt werden können. „Das muss noch kein Problem sein“, erklärt Maier. „Man muss sich dann aber zusammensetzen und neu planen.“

Mehr Zeit für Wissenschaft

„Alles hier ist sehr auf Teamarbeit angelegt“, stimmt Gailus-Durner zu. „Außerdem werden die Anwender regelmäßig geschult und über Neuerungen im System informiert.“ Mit zur Akzeptanz von MausDB beigetragen hat wohl, dass Verbesserungsvorschläge sehr ernst genommen werden. „Wir haben solche Eingaben im Rahmen einer ISO-9001-Zertifizierung institutionalisiert“, sagt die administrative Leiterin. „So kann das System kontinuierlich weiterentwickelt werden.“

Kein Wunder ist man an der Mausklinik und deren IT-Abteilung zuversichtlich, dass man mit der bewusst implementierten Anpassungsfähigkeit und Flexibilität von MausDB auch diejenigen Herausforderungen meistern wird, die ziemlich sicher in der nächsten Zukunft noch auf Labor-Informationssysteme zukommen werden.






Letzte Änderungen: 29.03.2017