Editorial

Boost your Score! – Freiwillige Selbstinszenierung im Wettbewerb der Wissenschaftler

Ulrich Dirnagl


Narr

(08.04.2021) Wie oft beschweren wir Forscher uns darüber, dass unser Denken und Urteilen sich immer mehr an Impact-Faktoren und anderen Zahlenmetriken ausrichtet – und dass dadurch die Bewertung nach Inhalt und professionellen Standards verdrängt wird. Dabei sind wir selber schuld. Wir machen das Spiel doch freiwillig mit ...

Haben Sie einen Fitness-Tracker? Sind Sie auf Twitter oder Facebook und zählen ihre Likes und Follower? Kennen Sie Ihren ResearchGate-Score? Achten Sie bei Restaurantbesuchen auf Gault-Millau-Hauben und Michelin-Sterne? Dann sind Sie in guter Gesellschaft, denn Sie betreiben auf verschiedenen Ebenen Reputations-Management mit quantitativen Indikatoren. Genau wie die Universitäten und Forschungsförderer. Nur dass Sie das privat und ganz freiwillig machen!

Kürzlich hat sich der Wissenschaftsnarr über zwei Folgen hinweg ausführlich darüber Gedanken gemacht, wie es dazu kam, dass wir in unserem heutigen Wissenschaftssystem Forschung kaum noch nach deren Originalität, Qualität und Einfluss beurteilen – und wie wir stattdessen vielmehr quantitative Indikatoren wie den Journal-Impact-Factor (JIF) oder die Höhe der Drittmitteleinwerbung bemühen, um darüber dann Fördermittel oder akademische Titel zu verteilen (LJ 12/2020 und 1-2/2021). Auch hatte er ein paar närrische Ideen, wie man das Rad wieder ein Stück in Richtung einer inhaltlichen Bewertung von Forschungsleistungen zurückdrehen könnte. Bei diesen Betrachtungen blieb aber bislang unberücksichtigt, dass sich die Institutionen und Fördergeber in guter Gesellschaft befinden, wenn sie Wettbewerb und Konkurrenz mit einfachen, abstrakten Messgrößen anfeuern – nämlich unserer! Das macht ihnen die Sache natürlich leichter. Und gleichzeitig wird damit der Status quo derart stabilisiert, dass es umso schwieriger wird, ihn zu verändern.

Es soll hier also nicht um die institutionelle, sondern um die individuelle Seite von quantitativer Leistungsbewertung gehen.

Das wissenschaftliche Leistungsbewertungssystem spiegelt als spezialisierte Verlaufsform letztlich nur einen gesamtgesellschaftlichen Quantifizierungskult, der auch vor dem Privaten nicht haltgemacht hat. Denn nicht mehr nur im Beruf dienen Quantifizierungen der Herstellung eines Marktes, in dem über den Wettbewerb mit Zahlen Leistung gemessen und gesteigert wird.

Individuell geht es dabei um Status, um Reputation. Aus der Notwendigkeit, Artikel in renommierten Journalen zu publizieren (oder einfacher gesagt: in solchen mit hohem JIF), um sich im akademischen System zu halten oder gar aufzusteigen, entwickelt sich das Management des persönlichen wissenschaftlichen Status – nach dem Motto: „Der hat im letzten Jahr zwei Nature-Paper geschrieben!“ oder „Mein h-Index ist über 50“ und so weiter.

Objektive wie auch subjektive Unsicherheit in der Konkurrenz der Wissenschaftler untereinander erhöhen dabei nur den Wunsch nach Informationen, die den jeweiligen Status quantifizieren. Daraus hat sich eine Fetischisierung der Selbst- und Außendarstellung entwickelt, die unter anderem in der Hege und Pflege des Lebenslaufs (nur kein Journal vergessen, für das man schon mal ge-reviewed hat!), einer eigenen professionellen Webseite oder eines Twitter-Accounts ausgelebt wird. Das Motto lautet hier vielmehr „Looking Good“, und nicht mehr „Being Good“.

Ordentliche Graduiertenprogramme bieten ihren Studenten mittlerweile Seminare in der Kunst dieser professionellen Selbstdarstellung und Selbstoptimierung an. Wir trainieren den Nachwuchs folglich sogar im Statuswettbewerb – und prämieren Statusstreber. Und der Nachwuchs lehnt sich keineswegs mehrheitlich dagegen auf, sondern wünscht sich weitere Vertiefung.

All dies ist natürlich schon deshalb kaum verwunderlich, da sich Reputations-Management über quantitative Indikatoren auch im Privatleben mittlerweile voll durchgesetzt hat. Gerade die Wissenschaft ist von solchen Quantifizierungsauswüchsen jedoch auch deshalb besonders betroffen, da wir Wissenschaftler möglicherweise über ein gesteigertes Anerkennungsbedürfnis samt überdurchschnittlicher Geltungssucht verfügen. Titel, Top-Publikationen, Auszeichnungen, immer der Erste sein, …: Wir Wissenschaftler sind geborene Konkurrenzler.

Außerdem sind Wissenschaftler für die Quantifizierungslogik des Wettbewerbes schon aufgrund ihrer speziellen Natur besonders empfänglich. Was messbar ist und in Zahlen ausgedrückt werden kann – das ist transparent, nachvollziehbar, evidenzbasiert, rational, neutral, präzise, einfach, unmittelbar und objektiv vergleichbar. Vermessung gehört zum Grundrepertoire der wissenschaftlichen Methode. So gesehen ist das Zählen beim JIF und h-Index, aber eben auch bei Gault-Millau-Hauben oder Twitter-Followern gar nicht mal so weit weg von der wissenschaftlichen Praxis.

Aber ist das nicht harmlos? Ja vielleicht sogar nützlich, da die Wissenschaftler sich auf diese Weise stetig selbst und untereinander anstacheln – und daraufhin forscherische Großtaten vollbringen? Ich fürchte: Nein! Weil jede Quantifizierung durch Abstraktion vereinfacht. Eine Qualität („Was?“) wird in eine Quantität („Wie viel?“) transformiert. Unvergleichbares wird plötzlich vergleichbar, sogar die sprichwörtlichen Äpfel mit den Birnen! Es gilt nun ein gemeinsamer Maßstab für unterschiedliche Dinge. Herr Dr. Maier und Frau Dr. Müller können sich jetzt direkt vergleichen. Über den kumulativen JIF oder den h-Index, über ResearchGate oder den Altmetric Score.

Gerade die letzten beiden sind wunderbare, aber auch traurige Beispiele für den Kern des Problems. Impact wird als „Aufmerksamkeit“ verstanden. Folglich stehen hier nicht originelle Hypothesen, neue Erkenntnisse oder gar wissenschaftlicher oder gesellschaftlicher Nutzen im Zentrum, sondern schlichte Sichtbarkeit und Popularität. ResearchGate fordert seine Nutzer etwa auf: „Boost Your Score“. Dabei legt ResearchGate gar nicht offen, wie der Score berechnet wird. Ob er reproduzierbar ist, oder was er eigentlich aussagen soll. Das macht aber eigentlich nichts, denn schließlich produziert er eine Zahl – und über diese kann man sich vergleichen und miteinander konkurrieren. Die Folge: Unser Denken und Urteilen richtet sich dadurch mehr und mehr an solcher Indikatorik aus – und verdrängt dabei professionelle Standards und Inhalte.

Wer die Hyperkompetition im System – das „Publish or Perish“ – kritisiert und die Institutionen zum Umsteuern auffordert, muss sich deshalb auch an die eigene Nase fassen. Wir beteiligen uns freiwillig und mit großem Eifer an einer Vielzahl von – teilweise privaten – Spielarten der Konkurrenz, die mittels karger, vom Gegenstand getrennter Zahlen ausgetragen werden.

Dazu passt, dass wir uns vor allem dann so richtig aufregen, wenn wir mit den eigenen Zahlen – unserem Ranking also – nicht zufrieden sind. Denn korreliert die Zufriedenheit mit einem Indikator und seiner Berechnung etwa nicht in den meisten Fällen sehr gut mit der eigenen Platzierung? Schneidet man nicht gut ab, dann ist der Indikator mutmaßlich ungeeignet. Und in diesen Momenten hört man dann selbst von bisher nicht als kritisch aufgefallenen Kollegen so manchen wahren Satz zu JIF oder Drittmittelzahlen. Oder man mäkelt am Algorithmus herum – und wünscht sich eine Formel, bei deren Anwendung man besser dasteht.

Wir haben die quantitative und abstrakte Status-Logik, die uns von den Institutionen aufgedrückt wird, längst verinnerlicht, sie zu einer wichtigen Zielgröße unseres Selbstwertgefühls gemacht. Wir haben die Indikatoren und Maßstäbe freiwillig übernommen; und weil die Institutionen und die Kollegen ihnen großen Wert beimessen, tun wir selbst dies mit umso größerer Überzeugung: Conform and perform!

Steffen Mau, der in seinem lesenswerten Buch „Das metrische Wir – Über die Quantifizierung des Sozialen“ diese Umtriebe aus sozialwissenschaftlicher Perspektive ausführlich analysiert, weist am Anfang seines Traktates darauf hin, dass im Deutschen schon das Verb „vermessen“ eine Vorahnung auf Schlimmes enthält: „Vermessen“ meint ja nicht nur den Vergleich mit einem Maßstab, sondern bedeutet auch „falsch messen“ sowie „überheblich“ beziehungsweise „anmaßend“. Der falsche Maßstab, der Reflex auf die Reputation und letztlich das Setzen von falschen Anreizen – alles das nimmt die deutsche Sprache da schon vorweg!

Weiterführende Literatur und Links finden sich wie immer unter: http://dirnagl.com/lj