Editorial

Kann denn Abschreiben Sünde sein?

(16.04.2024) Närrische Gedanken zur Wiederverwendung von Standardformulierungen sowie eigenem und KI-generiertem Text beim wissenschaftlichen Publizieren.
editorial_bild

Wieder mal ist wissenschaftliches Fehlverhalten groß in den Schlagzeilen. Man denke an die Plagiatsvorwürfe inklusive Rücktritt von Claudine Gay, der Präsidentin der Harvard University. Oder an die aktuellen Vorwürfe der Datenmanipulation gegen Simone Fulda, gefolgt von deren Rücktritt als Präsidentin der Uni Kiel (siehe LJ 3/2024: 16-19). Oder an ganze Institutionen mit massivem Imageschaden wegen offensichtlich gefälschter oder geschönter Daten, wie etwa das Dana Farber Cancer Research Institute in Boston, dem selbst ernannten Olymp der Krebsforschung – erst kürzlich musste es Dutzende von Studien zurückziehen. Und so geht es dahin. Allesamt Belege für etwas, das der Narr vor einem Jahr an dieser Stelle behauptet hatte (LJ 1-2/2023: 22-24): Dass nämlich Wissenschaftsbetrug gar nicht so selten ist, wie wir Wissenschaftler uns das immer schönreden.

Doch wenn die Spitze des Eisbergs schon so groß ist, welche Ausmaße muss erst das Eis darunter haben?

Editorial

Verstöße gegen die gute wissenschaftliche Praxis werden gerne unter dem Akronym FFP subsummiert: Falsifikation, Fabrikation und Plagiarismus. Insbesondere für das nichtwissenschaftliche Publikum nimmt der Plagiarismus hierbei eine herausragende Stellung ein. Im Gegensatz zu irgendwelchem Gel-Geschnipsel ist einfacher zu verstehen, worum es geht – und warum das eigentlich nicht in Ordnung ist. Zudem liest man in der Presse immer wieder davon, weil reihenweise Persönlichkeiten des öffentlichen Lebens des Plagiarismus bezichtigt werden – und in der Konsequenz oft einen Karriereknick erleiden. Schavan, Giffey, zu Guttenberg, Koch-Mehrin, ... – die Liste ließe sich allein für Deutschland lange fortsetzen.

Die Fakultäten haben inzwischen darauf reagiert und unterwerfen eingereichte Qualifizierungsarbeiten routinemäßig erst einmal einem automatisierten Plagiarismus-Screen. Die Ergebnisse sind zwar oftmals für Betreuer, Doktoranden und Habilitanden kaum verwertbar, da die Screens meist massenhaft triviale und standardisierte Formulierungen mit herausfischen, sodass sie am Ende Hunderte von potenziell plagiierten Stellen anzeigen. Aber die Institutionen demonstrieren, dass sie sich ihrer Verantwortung bewusst sind und proaktiv handeln.

Doch wie ist das eigentlich überhaupt mit dem Plagiarismus? Schlagen wir da womöglich auf einen toten Hund ein? Ist Plagiarismus in derselben Kategorie mit Fälschung und Manipulation von Daten gut aufgehoben? Was gilt prinzipiell als Plagiarismus? Kann man sich überhaupt selbst plagiieren, auch wenn man es dürfte? Der Narr, allseits bekannt und (un)beliebt für provokante Thesen und Behauptungen, erlaubt sich an dieser Stelle einmal einen kritischen Blick auf unseren Umgang mit diesem Phänomen – sowohl in der Wissenschaft als auch in der Öffentlichkeit.

Zunächst einmal: „Plagiat“ und „Plagiarismus“ sind keine juristischen Termini. Es gibt sehr wohl ein Urheberrecht, aber da kommen sie nicht vor. In der Wissenschaft sind Plagiate trotzdem nicht gern gesehen, denn dort können sie gegen Prüfungsordnungen, Arbeitsverträge oder Universitätsrecht verstoßen. Zwischen rechtswidrigen Übernahmen fremder geistiger Leistungen und der legitimen Übernahme freier oder frei gewordener Ideen gibt es eine Grauzone, wo ein Plagiat zwar als legal, nicht aber als legitim gilt.

Die letzten beiden Sätze habe ich übrigens aus Wikipedia kopiert, und wenn ich Ihnen das jetzt nicht gesagt hätte, wäre es ein Plagiat gewesen. Ich hätte es aber auch so formulieren können: „In der wissenschaftlichen Gemeinschaft kann Plagiieren gegen Prüfungsregeln, Arbeitsvereinbarungen oder Rechtsvorschriften von Hochschulen verstoßen. Allerdings existiert eine unscharfe Grenze zwischen der unrechtmäßigen Aneignung von geistigem Eigentum anderer sowie der zulässigen Übernahme von Ideen, die frei oder gemeinfrei sind. In diesem Bereich kann ein Plagiat zwar rechtlich zulässig, jedoch ethisch nicht vertretbar sein.“ Derselbe Inhalt, aber umformuliert von ChatGPT. Die erste Formulierung wäre bei der Überprüfung als Plagiat moniert worden, diejenige von ChatGPT wäre dagegen ohne Beanstandung durchgegangen.

Dies zeigt zwei Dinge: Plagiieren mit Copy/Paste inklusive ein paar Wörtern vertauschen ist old school. Wird es so auch bald nicht mehr geben, außer der Plagiator lebt unter einem Stein. Und zweitens: Der Plagiatsvorwurf zielt in fast allen Fällen auf die Formulierung ab, nicht auf deren Inhalt. Wer es nicht glaubt, den bitte ich, sich die Plagiatsvorwürfe des letzten Jahres – beispielsweise gegen von der Leyen, Baerbock oder Wedel – etwas genauer anzuschauen. Nie ging es um Inhaltliches, nie wurde die Aneignung eines besonders originellen oder neuen Gedankens angemahnt – oder gar die Übernahme von Ideen oder Hypothesen der plagiierten Autoren. Vielmehr standen fast ausnahmslos absolut triviale und nahezu inhaltsleere Statements am Pranger. Was hingegen einiges über den Zustand der jeweils plagiierten Wissenschaft sagt.

Damit entlarven sich die meisten Plagiarismusvorwürfe vor allem als Kampagnen gegen Personen – und gelten nicht der Sorge um die Integrität der Wissenschaft. Mittlerweile lebt davon ja auch ein ganzer Berufsstand: Professionelle „Plagiarismusjäger“ werden dafür bezahlt, sich gezielt unliebsamen Personals oder Widersachern zu entledigen. Mit Whistleblowing oder wissenschaftlicher Ethik hat das rein gar nichts mehr zu tun.

Betrachtet man nun die Biowissenschaften, wird das Thema Plagiarismus sogar noch komplexer. Sehen wir einmal von Übersichtsarbeiten ab, mit denen man sowieso nicht promovieren oder sich habilitieren können sollte, so geht es hier bei einer wissenschaftlichen Arbeit um eine originelle Hypothese oder Fragestellung sowie in der Folge um deren kompetente Überprüfung. Allerdings finden sich im Methodenteil von abertausenden Artikeln die Sätze: „The protein concentration was quantified by Bradford method. After extraction, the samples were diluted (dilution factor 10) before reading against the calibration curve. After gel electrophoresis with a load of 3 g of protein ...” Und ich selbst weiß gar nicht mehr, wie viele meiner eigenen Artikel mit der Formulierung beginnen: „Stroke is the second leading cause of death worldwide and the most frequent cause of long-term disability in adults in developed countries.” Sollte man so etwas umformulieren? Oder gar ChatGPT darum bitten, das zu tun?

Nicht falsch verstehen: Dies ist kein Plädoyer für hemmungsloses Plagiieren! Ordentliches Zitieren gehört zum Einmaleins der guten wissenschaftlichen Praxis (GWP). Aber man muss doch die Kirche im Dorf lassen. Meine GWP-Kurse werden mittlerweile überschattet von Diskussionen und Befürchtungen der Studenten bezüglich der Frage: „Ist das jetzt schon ein Plagiat?“ Außerdem vernebelt die Plagiatsdiskussion oft die Auseinandersetzung um den Inhalt der mutmaßlich plagiierten Aussagen, auch wenn da meist gar keiner ist.

Allerdings verstellt ein solcher Fokus auf Plagiarismus zunehmend den Blick auf die gravierenderen Verstöße der Datenmanipulation und -fabrikation. Letztlich sind diese im biomedizinischen Kontext viel relevanter – und vermutlich sogar häufiger. Nur entgehen sie (noch) dem Radar der automatisierten Detektion. Auch alle anderen als „fragwürdige wissenschaftliche Praktiken“ verharmloste und nicht sanktionierte Aktivitäten verdienen viel höhere Aufmerksamkeit als das dröge Wiederholen von Sätzen anderer – beispielsweise das allgegenwärtige Rosinenpicken beim Auswählen der Daten, die letztlich in das Paper eingehen (oder umgekehrt ausgeschlossen werden), oder das Post-hoc-Durchführen multipler Tests.

Weiterhin sollten wir uns unbedingt klarmachen, dass generative, auf einem Large Language Model (LLM) beruhende KI rein von ihrem Wesen her eine probabilistische Plagiarismus-Maschine ist. Sie frisst Texte und erzeugt daraus eine begriffslose interne Repräsentation in Form einer multidimensionalen Matrix. Sie errechnet Wahrscheinlichkeitsverteilungen für Gruppen von Zeichen („Tokens“), die anzeigen, wie wahrscheinlich es ist, dass jedes mögliche Token in seinem Wortschatz als Nächstes kommt. Aus solchen Wahrscheinlichkeitsverteilungen erzeugt sie dann den Ausgabetext. Das kann die Übersetzung in eine andere Sprache sein. Oder ein Text, der sich aus der stochastischen Nähe der Wörter errechnet, die wir dem LLM in unserer Anfrage („Prompt“) vorgelegt haben.

Mittlerweile sind die Modelle schon recht gut trainiert – und haben von meist unterbezahlten Menschen in Ländern des globalen Südens Manieren beigebracht bekommen. Zum Training fraßen sich die Modelle aber auch durch eine Unmenge wissenschaftlicher Texte, wodurch sie lernten, uns die Quellen zu nennen, aus der sich die Myriaden ihrer Matrixwerte speisen. Deswegen können sie uns nun auch ein Literaturverzeichnis liefern, wodurch sie uns wiederum potenziell den Zugriff auf die geballte wissenschaftliche Erkenntnis der Menschheit erlauben – zumindest soweit sie in Text gefasst und durch Training im Modell repräsentiert wurde. Das jedoch führt zu einer komplexen Form von Plagiarismus! Und dieser plagiiert selbstverständlich auch all den Forschungsmüll, das mittlerweile Widerlegte, das Zweifelhafte sowie die Halluzinationen der KI. Letztere werden, da wiederum als Trainingsmaterial für die KI benutzt, die Modelle vermutlich bald zum Kollaps bringen.

Bis es so weit ist, kann uns KI jedoch noch einiges beim Paperschreiben abnehmen, was wenig mit Wissenschaft zu tun hat. Am Anfang einer Literatursuche, in der wir uns noch nicht wirklich in die Inhalte vertiefen, geht es uns zunächst übrigens auch nicht anders als der KI: Wir verwenden krude Heuristiken der Selektion und Aufmerksamkeit wie beispielsweise die Reputation des Journals, das Publikationsdatum, die Affiliation der Autoren und so weiter. Und dies kann man dem Modell natürlich auch beibringen, denn dafür muss man nicht kapieren, worum es inhaltlich geht.

Was bleibt also? Ein erster, schneller Überblick über das, was da draußen in den Tiefen der Literatur so existiert? Das Rumfeilen an toll klingenden Formulierungen, noch dazu in einer Fremdsprache? Das Umformulieren von Text aus Angst, er könnte als (Selbst-)Plagiarismus aufstoßen? All das muss doch nicht sein. Die eingesparte Zeit könnte man vielmehr in ein ordentliches Studium der Originalliteratur wie auch in die ausführliche und nachvollziehbare Beschreibung der Methoden und Resultate investieren. Angebote wie Scienceos.ai (Motto: „Get scientific answers by asking millions of research papers“), perplexity.ai (Motto: „Where knowledge begins“) und andere ähnliche sind hierbei erst der Anfang. Wir sollten sie produktiv nutzen und uns mit der Qualitätskontrolle von deren Outputs auseinandersetzen.

Disclaimer wie „Dieser Text wurde unter Verwendung einer KI erstellt“ hingegen sind albern und in ihrer Allgemeinheit auch gar nicht aussagekräftig. Glücklicherweise ist auch von einem Verbot der Nutzung von KI zur Erstellung wissenschaftlicher Arbeiten kaum noch zu hören, weil es gar nicht durchsetzbar und auch von den Entwicklungen des letzten Jahres überholt wäre. Und was die guten, alten Textduplikationen betrifft, schließe ich mich dem Linguisten John McWhorter von der Columbia-Universität an. Er schlägt vor – und dabei meint er natürlich nicht den Ideenklau! –, den Plagiarismus aus der Schmuddelecke herauszuholen und die Wiederverwendung eigener Texte sowie die Nutzung von Standardformulierungen als „Cutting and Pasting“ zu kennzeichnen.

Übrigens: Dieser Text wurde unter Verwendung einer KI erstellt.

Ulrich Dirnagl

Zitate und weiterführende Links wie immer unter: http://dirnagl.com/lj.


Weitere Einsichten unseres Wissenschaftsnarren


- Keine DEALs mit unseren Papern!

Das DEAL-Konsortium der deutschen Wissenschaftsorganisationen hat einen Open-Access-Vertrag mit dem Verlagsriesen Elsevier abgeschlossen. Doch der bringt nur nicht viel, sondern zementiert noch den unguten Status quo des wissenschaftlichen Publikationswesens.

- Es irrt der Mensch, solang er strebt

Aus Fehlern lernt man, heißt es. Wieso gibt es dann in der biomedizinischen Grundlagenforschung keine nennenswerte Fehlerkultur?

- Von Mäusen, Makaken und Menschen

Richtig übel wird es, wenn sich mangelnde Qualität in präklinischen Studien bis zu verheerenden Ergebnissen in Tests am Menschen hochschaukelt – findet unser Narr. Und referiert einen aktuellen Fall.




Letzte Änderungen: 16.04.2024