Editorial

Das Tier als Messinstrument

Juliet Merz


(01.09.2020) Die Wissenschaft steckt in einer Reproduzierbarkeitskrise – besonders dort, wo Tiermodelle zum Einsatz kommen. Ein internationales Forscherteam fordert einen Paradigmenwechsel zu mehr Vielfalt bei Tierversuchen.

hg_20_09_02a
Foto: iStock/tiripero

Eine Kunststoffschale mit Gitterdeckel, Futterpellets und Wasser, Einstreu sowie Nistmaterial – Mäuse fristen in Laboren sowie Tierhäusern weltweit ein nahezu identisches Leben. Aber auch die Haltung anderer Modelltiere sowie die Versuche an ihnen laufen meist unter hochstandardisierten Laborbedingungen ab. Die Forschenden möchten damit präzisere Versuchsergebnisse erzielen und deren Reproduzierbarkeit gewährleisten. „Doch das ist ein Trugschluss“, ist sich Hanno Würbel von der Universität Bern sicher, der seit zwanzig Jahren die Auswirkungen der Standardisierung von Tierversuchen untersucht.

1999 hatten drei US-amerikanische Verhaltensgenetiker, darunter John Crabbe von der Oregon Health Sciences University in Portland, den Stein mit einer Publikation ins Rollen gebracht (Science 284: 1670-2). Sie hatten in drei unterschiedlichen Laboren die gleichen Verhaltenstests mit Mäusen durchgeführt und zwar unter höchst standardisierten Bedingungen, wie es normalerweise kein Labor der Welt machen würde – dazu gehörte beispielsweise, dass die Tiere am selben Tag an die drei Labore verschickt wurden, sie eine identische Käfigeinrichtung sowie Futter vom selben Hersteller bekamen.

Falsche Richtung

Doch trotz der vielen Gemeinsamkeiten fiel ein beträchtlicher Teil der Ergebnisse Labor-spezifisch aus. Die Autoren waren sich abschließend nicht sicher, ob eine Standardisierung von Verhaltenstests die zukünftige Reproduzierbarkeit der Ergebnisse über Labore hinweg deutlich verbessern würde. „Meine unmittelbare Reaktion war: ‚Nein, Standardisierung geht in die falsche Richtung’“, erinnert sich Würbel. Dass sich die Ergebnisse der Labore unterschieden, führte der Verhaltensforscher genau auf die Tatsache zurück, dass die Studienautoren zu stark standardisiert und damit die Labor-spezifischen Bedingungen ans Licht geholt hatten. „Es gibt viele Faktoren, die sich schlicht nicht über Labore hinweg standardisieren lassen. Je stärker die Versuchsbedingungen standardisiert werden, desto eher beeinflussen deshalb Labor-spezifische Effekte die Versuchsergebnisse.“ Nicht oder kaum standardisierbare Umweltbedingungen können beispielsweise das Tierpflegepersonal und die Experimentatoren sein oder die Geräusch- sowie Geruchskulisse.

„Standardisierung war anfangs darauf ausgelegt, sicherzustellen, dass Versuche richtig und vernünftig durchgeführt wurden. Wenn ich in einem Versuch meine Labormäuse mit einer Kontrollgruppe von Mäusen vergleiche, die ich von der Straße aufgesammelt habe, vergleiche ich quasi Äpfel mit Birnen“, beschreibt Würbel die Hintergründe. Je einheitlicher die Tiere sind, desto weniger Variation taucht in den Versuchsergebnissen auf. „Dieser Gedanke hat stark überhandgenommen und wurde so schließlich zu einer Art Dogma, möglichst alle Variablen zu kontrollieren und auf einen Wert einzustellen“, sagt Würbel. „Man hat das Tier zunehmend zu einem Messinstrument gemacht und dabei übersehen, dass man damit den Gültigkeitsbereich der Ergebnisse immer weiter einschränkt. Wenn ich ein Experiment an einer einzigen Maus-Klonlinie durchführe, zu einer gewissen Tageszeit, bei einer spezifischen Temperatur – dann sind die Ergebnisse erst einmal nur für eben diese Versuchsbedingungen gültig und nicht zwangsläufig für Mäuse allgemein.“

Obwohl in nahezu allen Wissenschaftsdisziplinen eine Reproduzierbarkeitskrise herrscht, ist die Situation bei präklinischen Studien an Tieren besonders prekär: Mehr als die Hälfte der hier publizierten Ergebnisse sind nicht reproduzierbar (Nature 505: 612-3). Würbel: „Mangelnde Reproduzierbarkeit verursacht nicht nur ökonomische Kosten und wissenschaftliche Unsicherheit. Sie ist auch ethisch bedenklich, wenn dadurch medizinischer Fortschritt behindert und Tiere in nicht aussagekräftigen Versuchen verwendet werden.“ Ein interdisziplinäres Team um Würbel hat deshalb Forschungsergebnisse der vergangenen Jahre ausgewertet und fordert einen Paradigmenwechsel: weg von zu viel Standardisierung, hin zu mehr geplanter biologischer Variation im Tierversuchsdesign (Nat. Rev. Neurosc. 21: 384-93).

Die Idee hinter dem als systematische Heterogenisierung bekannten Konzept ist nicht neu. Im Anschluss an die 1999 veröffentlichte Studie von Crabbe et al. hatte Würbel einen Leserbrief an Nature Genetics geschickt und dabei klar formuliert, dass die Standardisierung die Gültigkeit der Forschungsergebnisse schwächt (26: 263). Und auch vor drei Jahren hatte der Verhaltensforscher aus Bern seine Meinung in einem LJ-Forscher-Essay kundgetan (7-8/2017: 18-21 - Link). Neue Erkenntnisse aus der Wissenschaft stärken das Konzept der systematischen Heterogenisierung jedoch immer weiter. Dabei gibt es viele unterschiedliche Möglichkeiten, Variationen bei Tierversuchen einzubringen, entweder bei den Tieren selbst, ihrer Umwelt oder dem Versuchsablauf. So können Forschende auf Tiere mit etwa unterschiedlichem Genotyp, Alter oder Geschlecht zurückgreifen oder die Haltungsform der Tiere variieren – beispielsweise die Temperatur, bei der sie aufwachsen, oder ihr Futter.

Der Goldstandard?

Eine weitere Form der Heterogenisierung ist das Aufsplitten eines Experiments in mehrere kleine Teilexperimente (Batch Heterogenization). Die Tiere werden dabei nicht mehr alle auf einmal getestet, sondern aufgeteilt an unterschiedlichen Tagen, möglicherweise auch zu unterschiedlichen Uhrzeiten. Die Anzahl der Tiere bleibt gleich. Diese Methode soll die höchste Form der Heterogenisierung nachahmen: die Multilaborstudie, also die Durchführung eines Versuchs in mehreren Laboren. „Im Vergleich zu den Variationen, die man innerhalb eines Labors einbringen kann, ist die Multilaborstudie bislang die ultimative Form der Heterogenisierung“, so Würbel. Wir erinnern uns: Crabbe et al. hatten 1999 genau das gezeigt. Im klinischen Bereich sind Multilaborstudien Standard.

hg_20_09_02b
Es gibt zahlreiche Möglichkeiten, mehr biologische Variation in das Design von Tierversuchen einzubauen. Damit Forschende daran nicht verzweifeln, fordert die Verhaltensbiologin Helene Richter konkrete Heterogenisierungsstrategien. Foto: Pexels/Wilson da Vitorino; bearbeitet von JM

Helene Richter, die vor gut zehn Jahren in der Arbeitsgruppe von Würbel promoviert hat und jetzt Professorin für Verhaltenbiologie und Tierschutz an der Universität Münster ist, stimmt der Forderung ihrer Kollegen zu, hat aber einen bedeutenden Einwand: „Multilaborstudien sind sehr aufwendig und nicht überall praktikabel.“ Ein Grund dafür ist, dass es abseits der biomedizinischen Forschung an Mäusen und Ratten eine Vielzahl anderer Modellorganismen gibt, die nicht sehr verbreitet sind (LJ gab in der Ausgabe 12/19: 10-3 einen Einblick - Link).

Dieses Problem kennt Holger Schielzeth vom Institut für Ökologie und Evolution der Friedrich-Schiller-Universität in Jena, der an der Publikation von Würbel et al. mitgearbeitet hat und an der Sibirischen Keulenschrecke (Gomphocerus sibiricus) forscht: „An Heuschrecken allgemein arbeiten nicht viele Wissenschaftler, insofern ist es recht selten, dass man den gleichen Versuch in mehreren Laboren durchführen könnte.“ Außerdem ist in den Augen von Schielzeth gerade die Vielzahl an unterschiedlichen Modellorganismen besonders wichtig, weil sie die Diversität in der Natur widerspiegelt – was Multilaborstudien aber noch mal erschwert.

Würbel ergänzt einen Punkt: „Bei Multilaborstudien hat man zwar eine größere Aussagekraft, aber man weiß nie so genau, was man jetzt variiert hat.“ Deshalb unterstütze er vor allem das Konzept der systematischen Heterogenisierung innerhalb eines Labors – auch wenn die bislang von den Forschenden untersuchten Heterogenisierungsmaßnahmen noch nicht die gleiche Variation bringen wie Multilaborstudien. Einzig bei biomedizinischen Fragestellungen sieht Würbel derzeit keine Alternative, dort seien Multilaborstudien unabdingbar, weil diese schließlich den Test im Menschen standhalten müssen.

Würbel und die anderen Autoren der Publikation in Nature Reviews Neuroscience sind überzeugt, dass eine systematische Heterogenisierung noch einen weiteren positiven Effekt hätte: der Gesamtverbrauch an Versuchstieren würde sinken. Schielzeth: „Uns ist bewusst, dass sich durch dieses Experiment-Design die Anzahl der Versuchstiere während einer Erst-Studie erhöhen kann. Doch sind danach weitaus weniger Folgestudien erforderlich, um das Ergebnis zu verifizieren.“ Statt die Anzahl der Tiere pro Versuch zu minimieren, sollten Forschende lieber versuchen, den Erkenntnisgewinn pro Tier oder Experiment zu maximieren, ergänzt Würbel.

Zwischen sinnvoll und unnütz

Ein Patentrezept zur Heterogenisierung können der Verhaltensforscher und seine Kollegen allerdings nicht geben – und das wollen sie auch gar nicht. „Wir plädieren dafür, dass man ausgehend von der Forschungsfrage überlegt: Was wären denn sinnvolle Variablen, die man heterogenisieren könnte?’“, stellt Würbel klar. Denn das hängt natürlich sehr stark von der Forschungsfrage und dem Tiermodell ab. Wissenschaftler müssten sich diese Frage aber dennoch bei jedem Versuchsdesign mit Tieren stellen, steht für Würbel fest, und das Bewusstsein dessen sei besonders durch Aus- und Weiterbildungen zu schärfen. „Wir möchten keine fixen Rezepte in die Welt setzen. Es geht vielmehr darum, sich bewusst zu machen, dass man es in der biologischen Forschung mit Lebewesen zu tun hat, die charakterisiert sind durch biologische Variation. Wenn man diese Variation nicht in die Forschung einbezieht, dann forscht man an der Biologie vorbei.“

Trotz eines allgemeinen Verständnisses des Problems sind Forschende, die ihre Versuche heterogenisieren möchten, mit mehreren Unbekannten konfrontiert.Richter sieht das ähnlich und fordert konkretere Lösungsvorschläge, welche jede Wissenschaftlerin und jeder Wissenschaftler im eigenen Labor umsetzen kann. „Bislang gibt es Studien, welche den positiven Aspekt der systematischen Heterogenisierung auf die Reproduzierbarkeit zwar bestätigen, aber noch kein konkretes Bild liefern, welche zu variierenden Faktoren das beste Ergebnis liefern“, so Richter. „Wir wünschen uns deshalb eine Heterogenisierungsstrategie, die auf empirischen Studien basiert, die Standardisierung und Heterogenisierung gegenüberstellt – Hinweise darauf haben wir schon in Simulationsstudien, aber empirische Studien fehlen eben weitestgehend.“

Richter und ihre Kollegen testen nun, welche Heterogenisierungsstrategien nötig sind, um mit Multilaborstudien mithalten zu können. „Entweder könnte man mehr Faktoren variieren oder das Level der Faktoren erweitern“, so die Verhaltensforscherin. „Wenn man beispielsweise an das Alter der Versuchstiere denkt, könnten Forschende nicht nur acht und zwölf Wochen alte Mäuse für ein Experiment einsetzen, sondern meinetwegen 8, 12, 16 und 20 Wochen alte Tiere. Oder man sucht strategisch nach Faktoren, die mehrere Unterfaktoren zusammenfassen.“ Als Beispiel gibt Richter den Faktor Zeit: „Stellen Sie sich ein fiktives Versuchsdesign vor, bei dem Sie den Versuch nicht zu einem bestimmten Zeitpunkt durchführen, sondern ihn aufsplitten, dass er in mehreren Wochen stattfindet – Stichwort Batch Heterogenization. Hier haben Sie möglicherweise viele andere Unterfaktoren gekoppelt, wie etwa Hintergrundgeräusche, Temperatur, Jahreszeit und so weiter.“ Vielleicht gibt es aber auch noch andere Heterogenisierungsstrategien, welche die Wissenschaft noch gar nicht auf dem Schirm hat, gibt Richter zu bedenken.

Nachwuchs aufklären...

Um das Konzept umfassend zu verankern, muss es aber nicht nur bei den Experimentatoren ankommen, sondern auch bei Forschungsförderern, Bewilligungsbehörden und Herausgebern von Fachzeitschriften. Würbel und Co. schlagen deshalb vor, dass Leitlinien für Forschungsberichte wie etwa die ARRIVE-Richtlinien oder die Nature Research’s Reporting Summary so anzupassen, dass diese Experimentatoren auffordern, systematische Heterogenisierung im Versuchsdesign zu beachten, Maßnahmen zur Heterogenisierung anzugeben und die Ergebnisse im Bezug darauf zu diskutieren. Die US-amerikanischen National Institutes of Health und die Organisation for Economic Co-operation and Development empfehlen bereits, dass Studien in der präklinischen biomedizinischen Forschung beide Geschlechter umfassen sollen. Die Europäische Arzneimittel-Agentur hingegen verlangt, dass Tier-Toxizitätstests in mindestens zwei verschiedenen Arten durchgeführt werden müssen, bevor chemische Verbindungen im Menschen getestet werden.

Die Debatte rund um das Thema trägt Früchte. Richter: „Vor zehn Jahren war die Ablehnung gegenüber dem Konzept der Heterogenisierung noch recht groß. Gerade weil damals auch die Reproduzierbarkeitskrise noch nicht so anerkannt war. Das hat sich jetzt aber stark geändert, und Wissenschaftlerinnen und Wissenschaftler suchen aktiv nach Ursachen für die Krise und wie man sie bewältigen kann.“ Das Konzept der systematischen Heterogenisierung ist mittlerweile sogar schon in ein Standard-Lehrwerk für Verhaltensbiologie eingezogen. Im Auftrag der Autoren von „Methoden der Verhaltensbiologie“ verfasste Richter ein Kapitel über die Reproduzierbarkeit von Verhaltensdaten.

Würbel sieht die Verantwortung in der Lehre und Ausbildung der Nachwuchswissenschaftler. „Gerade die älteren Forscherinnen und Forscher lassen sich nur schwer umstimmen“, empfindet er. „Die zunehmende Offenheit gegenüber der systematischen Heterogenisierung hat wohl mehr damit zu tun, dass die junge Generation Wissenschaftler mit Themen wie Reproduzierbarkeit oder Tierschutz aufwächst und deshalb ein besseres Verständnis dafür hat.“ Richter sieht das ähnlich: „Das Dogma der Standardisierung hat in meinen Augen viel mit Labortradition zu tun – gerade bei Tierversuchen.“

... und Kritiker überzeugen

Ist es also nur eine Frage der Zeit, bis sich die systematische Heterogenisierung zum neuen Standard entwickelt? „Nur, wenn weitere empirische Studien das sehr überzeugende Konzept belegen“, ist sich Richter sicher. „Kritiker möchten die Verbesserungen doch gerne schwarz auf weiß sehen.“ Alle anderen Wissenschaftler sicherlich auch.



Letzte Änderungen: 01.09.2020