Editorial

Wissenschaft in Corona-Zeiten – Hindernis oder Hilfe?

Von Gerd Antes, Freiburg


(07.07.2020) Finden die medizinischen Wissenschaften in der Coronakrise das richtige Maß zwischen Risiken, Irrwegen und Hetze einerseits und den Prinzipien von Good Scientific Practice (GSP) andererseits? Bisher sieht es nicht wirklich danach aus.

Durch ein neues Virus befindet sich die Welt seit einem halben Jahr in einer Lage, die Bundeskanzlerin Angela Merkel für Deutschland als die größte Herausforderung seit dem Zweiten Weltkrieg charakterisiert. Das Auftreten und die Verbreitung des Coronavirus SARS-CoV-2 kam zu unterschiedlichen Zeitpunkten ins Bewusstsein von Regierungen, Behörden, Gesundheitsversorgung sowie Wissenschaft der Länder und führte zu einem weiten Spektrum von Gegenmaßnahmen, die mit unterschiedlicher Intensität durchgesetzt oder auch nur als Empfehlungen formuliert wurden. Die völlige oder weitgehende Einstellung des öffentlichen Lebens und der wirtschaftlichen Aktivitäten, also die weitgehende Lahmlegung unserer gesellschaftlichen Strukturen, waren die Konsequenzen. Das Ziel war vorrangig der Schutz der vulnerablen Gruppen, also älterer und chronisch oder akut Kranker, die aufgrund ihrer Konstitution oder Kondition besonders gefährdet sind. Neben diesem Individualschutz war das Ziel auf Systemebene, die Infektionen so zu kontrollieren, dass die Gesundheitsversorgung nicht an seine Kapazitätsgrenzen komme oder sogar zusammenbreche.

Der dafür geprägte Begriff Flattening the Curve symbolisierte das Ziel, die Anzahl der Neuinfektionen einzudämmen und hinauszuzögern – und somit deren Verlaufskurve zeitlich zu strecken. Dieses Plätten der Infektionskurve wurde durch entsprechende Grafiken und Diskussionen in Talkshows und Medien schnell populär und vermittelte frühzeitig das Gefühl, dass der viralen Bedrohung mit profunder wissenschaftlicher Expertise begegnet würde.

e_20_03a
Foto: Pixabay/José Miguel Guardeño; Montage: LJ

Dieser Eindruck täuschte jedoch. Die Bevölkerung wurde durch ein mediales Gewitter von morgens bis abends mit der Bedrohung konfrontiert, und somit der Eindruck vermittelt, dass der Lockdown bewusste und gezielte Maßnahmen beinhalte – vom Schließen von nicht-systemrelevanten Einrichtungen und Geschäften sowie Schulen und Kitas bis hin zum Reise- und Veranstaltungsverbot und Grenzschließungen. Genau dies war jedoch nicht der Fall! Es war vielmehr ein panikartiges Dichtmachen mit plausiblen Mitteln wie Abstandhalten und Minimierung von persönlichen Kontakten, um damit mögliche Übertragungswege zu unterbrechen.

Wie wenig fundiert das Vorgehen tatsächlich war, ließ sich leicht beobachten. Zunächst herrschte etwa völlige Verwirrung bezüglich der Einschätzung unterstützender Maßnahmen wie zum Beispiel Gesichtsmasken oder Händewaschen. Sowohl international durch die Weltgesundheitsorganisation (WHO) wie auch national vom Robert-Koch-Institut (RKI) wurde der Schutz durch Gesichtsmasken widersprüchlich und später mit kompletter Richtungsänderung eingeschätzt sowie äußerst unglücklich kommuniziert.

Das lässt sich einmal mit der enormen Geschwindigkeit der Lageentwicklung sowie dem Mangel an Wissen aufgrund der Neuartigkeit des „Problems“ begründen. Noch Anfang April verkündete das RKI, es gäbe keine Evidenz für den Nutzen von Gesichtsmasken. Zum anderen war jedoch nicht zu übersehen, dass die wissenschaftliche Begründung stark politisiert wurde. So war – unterschwellig oder auch offen – auch der massive Maskenmangel insbesondere für das medizinische Personal und die Gesundheitsberufe ein Grund für die fehlende Empfehlung für das Maskentragen. Und natürlich wurde die daraus resultierende verwirrende Kommunikation durch das RKI von den Medien deutlich wahrgenommen und thematisiert.

Ähnlich sah es bei der wissenschaftlichen Einschätzung der Übertragungswege und deren Verteilung zwischen Oberflächen- und Tröpfchen-/Aerosol-Übertragung aus, wobei hier die Desinfektionsmittel der Engpass waren.

Dieser Mangel an Wissen und an den entsprechenden Materialien für den Einsatz gegen das Virus zeigt, dass die Entscheidungen nicht aufgrund von Nutzen und möglichen Schäden durch die Maßnahmen erfolgten, sondern pragmatisch dem folgten, was gemeinhin als gesunder Menschenverstand gilt. Die Rolle der Wissenschaft in der Phase der Schließungen muss man nüchtern als „nicht vorhanden“ einstufen, auch wenn Talkshows einen anderen Eindruck vermittelten. Die politischen und von Verwaltungen getragenen Entscheidungen waren weitgehend wissenschaftsfrei.

Aufgrund des im Nationenvergleich glimpflichen Verlaufs kann man dennoch feststellen, dass in Deutschland vieles oder vielleicht sogar das meiste richtig gemacht wurde. Die relativ niedrigen Todeszahlen und der Verlauf waren jedoch weniger die Folge von rationalen, differenziert eingesetzten Maßnahmen, sondern ganz einfach bisher nicht verstandenes Glück.

Die Situation hat sich zwischen der teilweisen Schließung unserer Gesellschaft und den jetzigen Öffnungsschritten grundsätzlich verändert. Um zu verstehen, welches Potenzial die wissenschaftliche Bewertung der Maßnahmen haben kann und wo unter den gegenwärtigen Spezialbedingungen die Grenzen sind, ist ein Blick auf das etablierte Vorgehen bei der empirischen Wissensgenerierung unerlässlich:

Der totale Lockdown wie auch seine einzelnen Bestandteile sind Maßnahmen, die aus der Perspektive der wissenschaftlichen Methodik als Interventionen bezeichnet werden – grundsätzlich ähnlich wie der Arzneimitteleinsatz, Medizinprodukte, Änderungen von organisatorischen Strukturen oder auch Eingriffe in natürliche Abläufe mit ökologischen Zielen wie etwa der Klimaschutz. Untersucht werden solche Interventionen durch kontrollierte Studien, in denen die interessierende mit einer bereits etablierten Intervention verglichen wird. In der Arzneimittelforschung ist das auch einem breiteren Publikum geläufig, dort dient als Kontrolle ein bereits eingeführtes Arzneimittel oder auch ein Placebo [1].

Dieses Prinzip gilt jedoch für die Untersuchung jeglicher Situation, in die vorsätzlich eingegriffen wird. Man spricht hier von experimentellen Studien. Ist das nicht möglich, wie bei der Untersuchung von Schadstoffen wie beispielsweise Asbest, kann die Schädigung nur verfolgt werden, was durch Beobachtungsstudien geschieht. Zu den meisten Fragestellungen gibt es zumindest einige solcher Studien, oft sogar sehr viele. Diese werden systematisch global gesucht und einer Qualitätsbewertung unterzogen – und diejenigen Studien mit ausreichender Qualität werden in einer sogenannten systematischen Übersichtsarbeit (Systematic Review) zusammengefasst und zur Nutzung zur Verfügung gestellt.

Die großen Nutzergruppen in der Medizin sind die Gesundheitsprofessionen, welche die so synthetisierten Studienergebnisse in klinischen Leitlinien zusammenfügen, damit sie für Entscheidungen rund um den Patienten dienen können. Dazu kommen die Patienten selbst, die laienverständliche Informationen für informierte Entscheidungen erhalten wollen, und weiterhin die Entscheider über die Erstattungsfähigkeit durch Krankenversicherungen.

Letzteres wird als Technikfolgenabschätzung (TA=Technology Assessment) und speziell für die Medizin als HTA bezeichnet (H für Health). Die Methodik dafür wurde 1976 in den USA durch das Office of Technology Assessment eingeführt und seitdem kontinuierlich weiterentwickelt.

Die Grundlagen für die systematischen Reviews der geeigneten Studien wurden für die Gesundheitsversorgung wesentlich durch die Cochrane Collaboration geprägt, für das Feld der Sozial- und Erziehungswissenschaften durch die Campbell Collaboration. Beide bieten ihre systematischen Analysen in umfassenden elektronischen Übersichtsarbeiten an. Das beschriebene Vorgehen und diese sowie viele weitere Organisationen bilden die Architektur, die unter dem Titel Evidenz-basierte Gesundheitsversorgung (EBHC) über die letzten Jahrzehnte in allen Bereichen der Gesundheitsforschung und -versorgung etabliert worden ist.

Das primäre Ziel dieses Vorgehens ist, Nutzen gegen Risiko abzuwägen. Für HTA kommen als dritte Dimension die Kosten hinzu. Damit hätten diese Verfahren eigentlich auch für die Bewertung des Lockdowns und seiner Komponenten dienen können. Mehr noch, sie drängen sich förmlich auf. Trotzdem ist davon bis vor kurzem nicht einmal in Ansätzen etwas zu sehen gewesen.

Neben der fehlenden wissenschaftlichen Orientierung gibt es drei Gründe, warum eine solche Bewertung für den Lockdown nicht realisierbar war:

  1. Die Geschwindigkeit, mit der die Schließungen erfolgten.
  2. Es gab praktisch keine oder kaum hochwertige Studien, die Nutzen und Risiken beispielsweise von Kita-Schließungen untersucht haben.
  3. Keine Realisierbarkeit, Schließungen unter Studienbedingungen durchzuführen, da die Verzögerung der Schließungen angesichts der wahrgenommenen Bedrohung zu einem stark erhöhten Risiko geführt hätte – zumindest in der subjektiven Risikowahrnehmung der Entscheidungsträger.

Im Mai 2020 hatte sich die Situation grundsätzlich geändert, was aber nicht zu einem verbesserten Zusammenspiel von politischen Entscheidungen und wissenschaftlichen Bewertungen führte. Dass die oben beschriebenen Verfahren der Wissensgenerierung indes nicht völlig in Vergessenheit geraten sind, jedoch einfach Zeit brauchen, zeigt eine systematische Übersichtsarbeit zur Wirksamkeit von Masken und Abstandhalten [2].

Die Ende April eingeleitete Phase der Öffnungen wurde dann im Mai enorm beschleunigt und führte zur gleichzeitigen Öffnung von Einrichtungen jeglicher Art – ohne jegliche Begleitforschung, um ein Maß für die Wirksamkeit der einzelnen Maßnahmen und für die damit angerichteten Schäden zu erhalten. Im Vergleich zur völligen Schließung war nun vor allem ein Faktor grundsätzlich verändert: Die gesundheitliche Bedrohung war nun vor allem durch die ökonomische, sowohl individuell wie auch auf Systemebene, ersetzt worden. Die Atemlosigkeit blieb also die gleiche, wenn auch aus anderen Gründen. Hinzu kam der Verlust von Einigkeit und Solidarität, die in der Schließung bestanden, nun aber wieder durch Partikularinteressen und Lobbyismus ersetzt wurden. Diese Entwicklung ließ keine ernsthaften Überlegungen nach wissenschaftlicher Begleitung zu, Deutschland kehrte unkontrolliert zurück in den Aktivmodus, auch wenn es anders klang.

Angeblich hört zwar die Politik auf die Wissenschaft, und diese berät umgekehrt die Politik – dies aber nur scheinbar. Tatsächlich sind beide in einem Maße mit sich selbst beschäftigt, dass eine produktive Zusammenarbeit nicht zustande kommt. Bei Entscheidungen von Politikern mag chronisch mangelndes Vertrauen in die Wissenschaft ein dominanter Faktor sein, dazu kommt jedoch der nicht wegdiskutierbare enorme Druck aus den oben beschriebenen Gründen. Im Verlauf der Pandemie kamen immer mehr Erkenntnisse über die ungeheuren Auswirkungen des Lockdowns hinzu, die den Druck massiv erhöhten.

Ein wenig genannter Grund – geeignet als Entschuldigung für die Politik – ist jedoch vor allem die schlechte Vorstellung, die die Wissenschaft bietet. Der gegenwärtige Stresstest für die gesamte Gesellschaft verschont auch die Wissenschaft nicht und macht ihr schwer zu schaffen. In etlichen Artikeln lesen wir begeisterte Äußerungen, dass die Ausbreitung des Virus beispiellose Forschungsaktivitäten ausgelöst hat. Das ist zwar richtig, doch schon bei der Feststellung des Ausmaßes stößt man auf größte Schwierigkeiten.

Sucht man etwa einen quantitativen Eindruck von den Forschungsaktivitäten zum Coronavirus beziehungsweise COVID-19, so landet man bei Plattformen, auf denen damit zusammenhängende Studien und Publikationen gelistet werden. So zum Beispiel die Plattform der australischen National COVID-19 Clinical Evidence Taskforce. Unter dem Motto Caring for people with COVID-19 werden dort vor allem Behandlungsempfehlungen für COVID-19-Patienten angeboten [3]. Nach den oben beschriebenen Verfahren der Evidenzbasierung werden nun klinische Leitlinien auf der Basis der verfügbaren Studien verfasst [1]. Durch die Flut der Publikationen müssen diese Empfehlungen durch Aufnahme neuer Artikel und Studien-Reports permanent aktualisiert werden, wofür sich die Bezeichnung Living Guidelines etabliert hat.

Das Communique der Australier vom 18. Juni weist für COVID-19 insgesamt 9.126 publizierte oder registrierte Studien für prognostische, diagnostische und therapeutische sowie Präventionsfragestellungen aus, darunter 21 randomisierte klinische Studien. Die Plattform zeigt gerade 1.506 registrierte klinische Studien, mit einer Zunahme von 91 alleine in der Vorwoche. Noch eindrucksvoller sind 1.327 registrierte systematische Übersichtsarbeiten, mit zusätzlichen 98 in der Woche davor.

Vergleicht man diese Zahlen mit denen auf KSR Evidence (Kleijnen Systematic Reviews Ltd.), so findet man dort 612 Systematic Reviews [4]. Beide Institutionen sind angesehen und haben hohe Qualitätsansprüche. Bei weiteren Plattformen sieht es ähnlich aus.

Diese in kürzester Zeit entstandenen Aktivitäten sind beeindruckend umfangreich, gleichzeitig ist es selbst für Spezialisten schwierig oder unmöglich, sich einen sicheren Überblick zu verschaffen. Am dramatischsten ist jedoch, dass alle Teile dieser Forschungslawine unkoordiniert und ohne Blick auf laufende oder geplante Studien initiiert wurden. Damit bietet sich ein Bild, das einem Modellprojekt für Verschwendung gleicht: Viele Resultate werden ohne Abstimmung mehrfach produziert, während andere Fragen nicht beantwortet werden [5]. Wie viele genau, weiß niemand.

Die COVID-19-Forschung konnte also direkt auf die Überholspur (Fast-Track) wechseln und dort bleiben – durch absolute Priorisierung im Wettbewerb mit anderen Forschungszielen. Für diese Geschwindigkeit könnten wir jedoch am Ende einen hohen Preis zahlen – nämlich denjenigen mangelnder Qualität. Es ist unvermeidlich, dass bei einem solchen, innerhalb von Wochen entstandenen Volumen die gerade in der medizinischen Forschung extrem wichtige Qualität aller Arbeitsschritte nicht mehr im Vordergrund stehen kann, sondern vielmehr weniger ernst genommen wird und gegebenenfalls Kompromisse akzeptiert werden, die mit Blick auf die Gesundheit und das Leben von Patienten zweifelhaft erscheinen [6].

Solche systematischen Untersuchungen von Studienqualität sind grundsätzlich Sache der Meta-Forschung. Nicht überraschend ist in der Pandemie-Situation jedoch kein Raum für solche akademischen Übungen, sodass gegenwärtig keine belastbaren Aussagen getroffen werden können. Persönliche Kommunikation und kleinere Untersuchungen stützen allerdings die Befürchtungen, dass der Qualitätsverzicht im Studiengeschehen schwerwiegend ist und ernsthaftere Konsequenzen haben könnte als erwartet.

Bestätigt wird die Erosion der Qualität durch die Erfahrungen der letzten Wochen mit den Medikamenten Ibuprofen, Remdesivir, Hydroxychloroquin und Dexamethason. Das Routinemedikament Ibuprofen wurde durch einen Brief an eine Zeitschrift in den Verdacht gebracht, sich negativ auf die Therapie von COVID-19-Patienten auszuwirken [6]. Dies wurde von der WHO und dem französischen Gesundheitsminister aufgenommen und führte zu einer offiziellen Empfehlung zum Verzicht auf Ibuprofen, die kurze Zeit später zurückgenommen werden musste.

Für Remdesivir war eine Studie mit 61 Patienten ohne Kontrollgruppe (!) ausreichend, um die vermeintlich positiven Ergebnisse (leichterer Krankheitsverlauf) in der Spitzenzeitschrift New England Journal of Medicine (NEJM) zu veröffentlichen, obwohl der Hersteller Gilead Sciences die Studie finanziert hatte sowie an der Durchführung und am Manuskript beteiligt war.

Besonders beeindruckend war der Weg des Malariamittels Hydroxychloroquin. US-Präsident Trump lobte es über Wochen als Mittel zur COVID-19-Prophylaxe, ohne jeden wissenschaftlichen Beleg. Die amerikanische Zulassungsbehörde erlaubte die Anwendung des Mittels durch eine sogenannte Emergency Use Authorization (EUA, 28. März 2020), um diese Mitte Juni durch eine Warnung vor dem Mittel zu widerrufen.

Von dort wechselte die öffentliche Aufmerksamkeit unmittelbar zu Dexamethason, für das eine beeindruckend schnell und offensichtlich mit hohen Qualitätsstandards durchgeführte große Studie die Erwartungen nährt, hier tatsächlich eine positive Wirkung auf den Krankheitsverlauf entdeckt zu haben. Gleichzeitig herrscht auch hier wieder eine Euphorie, die zur Vorsicht mahnt. Wie tragfähig der Ansatz ist, wird die Zukunft zeigen.

Bei alledem ist jedoch die rigorose Berücksichtigung der Prinzipien der Arzneimittelbewertung zwingend notwendig. Der Spitzenplatz bei der Verletzung dieser Regeln gebührt dem unsäglichen Geschehen um Hydroxychloroquin. Nach den Verwirrungen während der letzten drei Monate gipfelte dieses kürzlich in einem Super-Gau: dem Zurückziehen (Retraction) einer Studie aus The Lancet, die erhebliche Zweifel an der Datenbasis für die Analyse auf sich zog.

Diese praktischen Beispiele zeigen, dass der Zeitfaktor in der verzweifelten Suche nach geeigneten Medikamenten auch die Wissenschaft mit voller Wucht erfasst hat. Doch das gilt nicht nur für diese Beispiele, sondern genauso für die wissenschaftlich begründeten Prozesse.

Wissenschaft braucht Zeit, was vor den Corona-Zeiten zu unerträglich langen und zu Recht vielfach beklagten Entwicklungsphasen führte. Die geradezu explosionsartige Beschleunigung durch COVID-19 hat jedoch zu ganz anderen eindrücklichen Bildern geführt. So wird die Situation damit verglichen, dass ein Marathonlauf auf eine 400-Meter-Strecke reduziert wird. Wenn man sich das noch mit dem Massenstart eines Volkslaufs vorstellt, trifft es die Realität gut.

Wissenschaft und Forschung stehen unter der permanenten Forderung, schneller und effektiver zu arbeiten. Übertreibung wie die gegenwärtige führt dann jedoch zu „fast but wrong is just wrong“. Wo das richtige Maß zwischen Risiken, Irrwegen und Hetze einerseits und einer an den Prinzipien von Good Scientific Practice (GSP) orientierten Wissenschaft andererseits liegt, ist eine der fundamentalen Wissenschaftsfragen. Gegenwärtig liegt die Priorität offensichtlich bei der Schnelligkeit, mit erheblichen negativen Auswirkungen [7].

Ein offensichtlicher „Täter“ in dieser Fehlentwicklung sind sogenannte Preprint-Server (zum Beispiel medRxiv in der Medizin). Ursprünglich in der Mathematik und Physik in Mode gekommen, dienten sie der Kritik und Diskussion und damit dem Austausch neuer Forschungsergebnisse vor der abschließenden Runde durch Peer Review und Publikation.

In den abgeschlossenen wissenschaftsinternen Sphären hat das funktioniert und erwarb sich uneingeschränkte Unterstützung, vor allem vor dem Hintergrund der seit Jahrzehnten bekannten Schwächen des Peer Review und der klassischen Zeitschriften. Diese Situation hat sich in Corona-Zeiten grundsätzlich geändert. Jetzt sind die Preprint-Plattformen eine entscheidende Brücke, Wissenschaft öffentlich zu machen und sie damit in das Spannungsfeld zwischen dem großen Interesse der Öffentlichkeit, den Medien und der Politik zu bringen. Der Schutzraum war damit nicht mehr vorhanden und der Zugang frei für alle Formen von negativen Entwicklungen, wie wir sie aus der Kommunikation in den sozialen Medien kennen.

Die ursprüngliche Absicht, Inhalte der solidarischen Kritik zu präsentieren, damit einen „kleinen Review“ zu erhalten und mit nachgearbeiteten Verbesserungen in den Peer Review zu gehen, ist vollständig auf den Kopf gestellt worden. Jetzt steht eine unbegrenzte Anzahl von selbsternannten „Experten“ bereit, um mit entsprechendem medialen Echo über diese Arbeiten zu diskutieren.

Zudem haben sich auch in Wissenschaftlerkreisen gewisse Verhaltensweisen merklich geändert: Es gibt einen deutlichen Hang zur Lagerbildung, wo Glauben statt Wissen die Zugehörigkeit bestimmt. Auch unter den Wissenschaftlern selbst sind die Sitten verroht. Öffentliche Aufforderungen, einen Artikel zurückzuziehen, sind nicht die Ausnahme, sondern teilweise mit aggressiven Formulierungen sogar öfter zu beobachten. Auch hier wird der Boden dafür in der Wissenschaft selbst gelegt: Die Präsentation von Ergebnissen auf Pressekonferenzen mit Politikern, bevor auch nur ein halbwegs akzeptabler Report geschrieben wurde, erweist sich als klarer Bärendienst. Ebenso die öffentliche Interpretation der eigenen Daten, was daraus an Maßnahmen für den Lockdown folgen sollte. Diese Vermischung von Rollen führt zu Irritationen, Missverständnissen und schädlicher Wahrnehmung in der Öffentlichkeit – und damit zur Schädigung der Wissenschaft.

Es bleibt nur zu hoffen, dass durch die weitere Beruhigung der Lage der Rückweg zu der Orientierung gelingt, die einzig und allein richtungsweisend sein kann: Qualität, in jeder Dimension, von der Planung über die Durchführung der Wissensgenerierung bis hin zur Publikation und Implementierung. Das sollte nicht nur der Wissenschaft dienen, sondern auch der optimale Weg sein, um die Pandemie unter Kontrolle zu halten.

Referenzen

[1] Chalmers I., Doug Altman’s prescience in recognising the need to reduce biases before tackling imprecision in systematic reviews. Journal of the Royal Society of Medicine 113(3):119-22.
[2] Derek K. C. et al., Physical distancing, face masks, and eye protection to prevent person-to-person transmission of SARS-CoV-2 and COVID-19: a systematic review and meta-analysis. The Lancet S0140-6736(20)31142-9
[3] National COVID-19 Clinical Evidence Tastforce, Caring for people with COVID-19. Fortlaufende Aktualisierung. https://covid19evidence.net.au
[4] KSR Evidence. Kleijnen Systematic Reviews Ltd., www.ksrevidence.com
[5] Glasziou P., A deluge of poor quality research is sabotaging an effective evidence based response. BMJ 2020;369:m1847.
[6] Mogensen J F. (28 April 2020), Science Has an Ugly, Complicated Dark Side. And the Coronavirus Is Bringing It Out. Mother Jones, 28. April 2020.
[7] Lenzer J. & Brownlee S., Pandemic Science Out of Control. Issues, 28. April 2020.



Zum Autor

Gerd Antes war als Mathematiker und Biometriker von 1997 bis 2018 Direktor des Deutschen Cochrane Zentrums und gilt als ein Wegbereiter der evidenzbasierten Medizin in Deutschland.


Letzte Änderungen: 07.07.2020