Info

Digitalisierung in der Forschung und Urheberrecht: Der Fall AlphaFold

Von Claudia Otto, Frankfurt/Main


(15.07.2022) Die patentrechtlichen Fragen, die das Proteinstrukturvorhersage-Programm AlphaFold aufwirft, sind noch nicht geklärt. Mehr Klarheit herrscht hingegen darüber, inwieweit KI-Systeme wie AlphaFold nach deutschem beziehungsweise europäischem Recht schutzfähig sind und welche Rechte an den vorhergesagten Strukturen bestehen.

Künstliche Intelligenz (KI) revolutioniert gegenwärtig viele Disziplinen der Biowissenschaften. So soll kürzlich das Proteinfaltungsproblem von dem KI-System AlphaFold gelöst worden sein. AlphaFold dient dazu, die Strukturen noch nicht vollständig erforschter Proteine zu berechnen und vorherzusagen. Entwickelt wurde die Software von der DeepMind Technologies Limited (DeepMind), einer Tochter von Alphabet Inc. Der Quellcode sowie die für das gewünschte Funktionieren erforderlichen Modellparameter von AlphaFold sind auf GitHub zufinden.

Die bislang mittels AlphaFold erstellten Proteinstrukturvorhersagen sind in der AlphaFold Protein Structure Database (AlphaFold DB) für jedermann zum Abruf veröffentlicht worden. An dieser mitgewirkt hat das European Bioinformatics Institute (EBI) als Teil des European Molecular Biology Laboratory (EMBL) in Heidelberg.

bild

Info

AlphaFolds Kern besteht aus neuronalen Netzwerkstrukturen. Diese werden mit Verfahren trainiert, die auf vorhandenem Wissen zu evolutionären, physikalischen und geometrischen Einschränkungen von Proteinstrukturen basieren. Das Programm baut hierbei auf der Arbeit zahlreicher Forscher aus der ganzen Welt auf. Konkret greift es auf vorhandene Proteinstruktur-Daten zurück, etwa in der Protein Data Bank (PDB). Die Genauigkeit der Strukturvorhersage ist mit den Ergebnissen aus teuren und zeitaufwendigen Laborexperimenten vergleichbar.

Beim Wissenschaftswettbewerb CASP14 erreichten die mittels AlphaFold erstellten Proteinstrukturvorhersagen bei etwa zwei Dritteln der vorgegebenen 100 Aminosäuresequenzen 90 von 100 Punkten. Über dem Schwellenwert von 90 Punkten gelten verbleibende Unterschiede zu Ergebnissen aus experimentellen Strukturbestimmungen und alternativen Konformationen niedrigerer Energie als klein.

AlphaFold spürt in den zahlreichen vorhandenen Proteinstrukturdaten Zusammenhänge auf, die aufgrund der schieren Masse für Strukturbiologen nicht zu erkennen sind. Die konkrete Natur dieser Zusammenhänge bleibt aber in der Regel im Dunkeln. Auch kann AlphaFold keine Fehlfaltungen oder Protein­strukturveränderungen im sich dynamisch verändernden Proteom vorhersagen. Man kann also resümieren: AlphaFold hat das Proteinfaltungsproblem nicht gelöst, aber den Weg zur Lösung beschleunigt.

Im Zusammenhang mit der Nutzung von AlphaFold und ähnlicher Forschungssoftware können rechtliche Fragen auftreten. Die wichtigsten sollen im Folgenden beantwortet werden.

Was ist der Unterschied zwischen Copyright und Urheberrecht?

DeepMind macht an der auf GitHub veröffentlichten AlphaFold-Dokumentation sowie den Daten in der AlphaFold DB ein Copyright geltend. Dem deutschen und kontinentaleuropäischen Recht ist das angloamerikanische Copyright unbekannt. An seiner Bezeichnung „copy-right“ ablesbar ist jedoch, dass es um die Rechte zur Kopie, also Nutzungsrechte am fraglichen Werk geht, die von Rechtsinhabenden eingeräumt werden. Insofern besteht Ähnlichkeit zu „unserem“ Urheberrecht. Das Copyright zielt jedoch auf den Schutz der Interessen an der wirtschaftlichen Verwertung ab, das Urheberrecht hingegen bezweckt den Schutz der Interessen des Urhebers.

Während eine juristische Person Inhaberin eines Copyrights sein kann, kann nach § 7 Urheberrechtsgesetz (UrhG) Urheber nur eine natürliche Person sein, die zu einer geistigen Schöpfung im Sinne des § 2 Abs. 2 UrhG fähig ist. Einer juristischen Person kann der Urheber jedoch ein Nutzungsrecht einräumen.

Ein Copyright-Vermerk in Verbindung mit genannten natürlichen Personen wie hier auf GitHub erleichtert den Beweis der Urheberschaft nach § 10 Abs. 1 UrhG. Hiernach gilt: Wer auf den Vervielfältigungsstücken eines erschienenen Werkes oder auf dem Original eines Werkes der bildenden Künste in der üblichen Weise als Urheber bezeichnet ist, wird bis zum Beweis des Gegenteils als Urheber des Werkes angesehen; dies gilt auch für eine Bezeichnung, die als Deckname oder Künstlerzeichen des Urhebers bekannt ist.

Das Urheberrecht ist dem Copyright gegenüber untrennbar mit dem zur geistigen Schöpfung fähigen Urheber verbunden. Es kann unter Lebenden nicht übertragen werden, vgl. § 29 Abs. 1 UrhG.

Kann an einem Computerprogramm ein Urheberrecht bestehen?

Ja. Ein KI-System wie AlphaFold ist vor allem Software. Diese umfasst alle „weichen“ Komponenten eines Computers wie Computerprogramme und Daten(banken).

Computerprogramme können zum einen in ihrer Gesamtheit urheberrechtlich geschützt sein. Sie sind gemäß § 69a Abs. 1 UrhG Programme in jeder Gestalt, einschließlich des Entwurfsmaterials.

Computerprogramme, oder genauer gesagt, ihre Komponenten, können zum anderen als Sprachwerke geschützt sein (vgl. § 2 Abs. 1 Nr. 1 UrhG), wenn sie individuelle Werke in dem Sinne darstellen, dass sie das Ergebnis der eigenen geistigen Schöpfung ihres Urhebers sind (§ 69a Abs. 3 S. 1 UrhG). Ein solches Sprachwerk stellt der Quellcode dar. Urheberrechtlich nicht geschützt sind jedoch die ihm zugrunde liegenden Ideen und mathematischen Konzepte (vgl. § 69a Abs. 2 S. 2 UrhG). Gemäß Art. 2 des Urheberrechtsvertrags der Weltorganisation für geistiges Eigentum (WIPO) erstreckt sich der Urheberrechtsschutz nur auf Ausdrucksformen und nicht auf Gedanken, Verfahren, Methoden oder mathematische Konzepte als solche.

Das bedeutet aber nicht, dass Gedanken, Verfahren, Methoden und ein mathematische Konzepte erläuternder Beitrag, wie der zu AlphaFold in Nature (596: 583-9) erschienene, ungeschützt sind. Vielmehr stellt dieser Text ein eigenes Ergebnis geistiger Schöpfung dar und ist als Sprachwerk im Sinne des § 2 Abs. 1 Nr. 1 UrhG geschützt.

Wie kann ich frei verfügbare Forschungssoftware verwenden?

Die erlaubte Nutzung ergibt sich stets aus der zur Software gehörenden Lizenz. Hierin wurden die Bedingungen der Nutzung durch den Urheber beziehungsweise Copyright-Inhaber festgelegt.

Forschungssoftware können Rechteinhabende unter verschiedenen Lizenzen für freie Inhalte bereit stellen. Eine Lizenzübersicht mitsamt Erläuterungen kann auf der Website des Instituts für Rechtsfragen der Freien und Open Source Software abgerufen werden (www.ifrOSS.org).

Der AlphaFold-Quellcode wird zum Beispiel unter der Apache Licence (2.0) bereitgestellt. Dabei handelt es sich um eine Lizenz ohne sogenannte Copyleft-Effekte. Das bedeutet, dass es keine Einschränkungen für Modifikationen, Weiterentwicklung und Neukombination gibt. Der Lizenznehmer kann veränderte Versionen der Software unter beliebigen Lizenzbedingungen weiterverbreiten und kann sie auch in proprietäre Software überführen.

Können Urheberrechte an (Trainings-)Daten bestehen?

Nein. Der urheberrechtliche Schutz erstreckt sich nach § 2 Abs. 2 UrhG nur auf geistig-schöpferische Ausdrucksformen, das heißt nicht auf ihren Informationsinhalt, wie etwa wissenschaftliche Erkenntnisse, Trainings- oder Messwerte. Darüber hinaus ist die allgemeine Freiheit von Daten und damit von Inhalten, Fakten und Informationen notwendige Voraussetzung für eine freie Wissenschaft und Forschung. Urheberechtlicher Schutz an Forschungsmaterialien kann daher zum Beispiel nur an der konkreten sprachlichen (§ 2 Abs. 1 Nr. 1 UrhG), lichtbildlichen (§ 2 Abs. 1 Nr. 5 UrhG) und wissenschaftlichen Darstellung, etwa in Zeichnungen, Skizzen, Tabellen und plastischen Darstellungen (vgl. § 2 Abs. 1 Nr. 7 UrhG) bestehen.

Wo an reinen Informationen keine Urheberrechte Dritter bestehen können, existieren keine urheberrechtlichen Einschränkungen bei der Nutzung. Davon unberührt bleibt jedoch das berechtigte Interesse an der Nennung der entdeckenden Person(en). Dieses wird etwa durch die Prinzipien der „guten wissenschaftlichen Praxis“, Promotionsordnungen oder auch ungeschriebene soziale Normen gewahrt. Den entdeckenden Personen steht aber kein Recht zur Schaffung eines Informationsmonopols zu, das die Grundlage einer freien Wissenschaft und Forschung beschneidet.

Können Urheberrechte an Datenbanken bestehen?

Ja. Das ist der Fall bei sogenannten Datenbankwerken (§ 4 Abs. 2 UrhG). Ein Datenbankwerk im Sinne des Urheberrechtsgesetzes ist ein Sammelwerk, dessen Elemente systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind. Die Auswahl oder Anordnung der Daten oder sonstigen Elementen bedarf auch hier einer persönlichen geistigen Schöpfung gemäß § 2 Abs. 2 UrhG, so explizit § 4 Abs. 1 i.V.m. Abs. 2 UrhG. Schutzgegenstand ist auch hier nicht der Inhalt, sondern nur die Struktur, in der die persönliche geistige Schöpfung zum Ausdruck kommt.

bild

Im Hinblick auf Datenbanken ohne schöpferische Prägung, aus denen Informationen beispielsweise zur Nutzung von AlphaFold bezogen werden, kommt zudem ein verwandtes Schutzrecht, das sogenannte Leistungsschutzrecht der Datenbankhersteller, in Betracht. Eine solche einfache Datenbank ist gemäß § 87a Abs. 1 S. 1 UrhG eine Sammlung von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet und einzeln mithilfe elektronischer Mittel oder auf andere Weise zugänglich sind und deren Beschaffung, Überprüfung oder Darstellung eine nach Art oder Umfang wesentliche Investition erfordert. „Wesentlich“ bedeutet: Die Investition darf nicht unbedeutenden Umfangs sein. Datenbankhersteller ist gemäß § 87a Abs. 2 UrhG derjenige, der diese Investition vorgenommen hat. Nur der Datenbankhersteller hat nach § 87b Abs. 1 UrhG das ausschließliche Recht, die Datenbank insgesamt oder einen nach Art oder Umfang wesentlichen Teil der Datenbank zu vervielfältigen, zu verbreiten und öffentlich wiederzugeben. Das bedeutet wiederum, der Datenbankhersteller ist vor der Vervielfältigung, Verbreitung und öffentlichen Wiedergabe der Datenbank als Gesamtheit oder eines wesentlichen Teils durch Dritte geschützt.

Das Datenbankherstellerrecht schützt erkennbar nicht die einzelnen Daten oder die Investition in ihre Erzeugung. Die Entnahme und Nutzung einzelner Daten, soweit sie nicht in Gesamtheit einen nach Art oder Umfang wesentlichen Teil ausmachen, ist daher ohne Rechteeinräumung zulässig. § 87c Abs. 1 Nr. 2 und 5 UrhG gestatten zudem die Vervielfältigung eines nach Art und Umfang wesentlichen Teils der Datenbank für Zwecke der wissenschaftlichen Forschung gemäß § 60c ­UrhG und für sogenanntes Text- und Data-Mining für Zwecke der wissenschaftlichen Forschung gemäß § 60d UrhG.

Habe ich Rechte an den von mir mittels AlphaFold erstellten Proteinstrukturvorhersagen?

Nach dem aktuellen Kenntnisstand: Nein. An der Darstellung einer Proteinstruktur(-vorhersage) kann grundsätzlich ein Urheberrecht bestehen: Eine Darstellung wissenschaftlicher oder technischer Art im Sinne des § 2 Abs. 1 Nr. 7 UrhG muss dann, mit dem Ausdrucksmittel der grafischen oder plastischen Darstellung, der Vermittlung von belehrenden oder unterrichtenden Informationen über den dargestellten Gegenstand dienen. Dabei muss eine individuelle, sich vom alltäglichen Schaffen im betroffenen Bereich abhebende Geistes­tätigkeit erkennbar sein, mag auch das Maß der geistigen Leistung und individuellen Prägung gering sein.

In einer mithilfe von AlphaFold generierten, grafisch ausgedrückten dreidimensionalen Proteinstrukturvorhersage liegt zunächst eine Darstellung wissenschaftlicher Art, denn sie dient der Vermittlung von unterrichtenden Informationen über den dargestellten Gegenstand: die mögliche Faltung des Proteins. Dass die Proteinstrukturvorhersage wie jede wissenschaftliche These einer wissenschaftlichen Validierung durch menschliche Fachleute bedarf, ändert hieran nichts. Eine individuelle, sich vom alltäglichen Schaffen in der Bioinformatik oder theoretischen Chemie abhebende Geistestätigkeit liegt in der grafischen Darstellung mittels AlphaFold allerdings nicht. Vielmehr folgt die Darstellung der errechneten Proteinstrukturdaten wissenschaftlichen Standards – hier der Darstellung in einem zwei- oder dreidimensionalen Koordinatensystem. Auch in der farblichen Kenntlichmachung der Konfidenz von Teilstrukturen ist keine individuelle Geistestätigkeit zu erkennen; sie dient nicht dem individuellen Ausdruck, sondern der Vermittlung von Informationen über die Genauigkeit der Proteinstrukturvorhersage.

Auch im Hinblick auf die Begleitinformationen zu einer Proteinstrukturvorhersage ist die Frage nach einem Recht an ihnen abschlägig zu beurteilen: Daten als solche und damit Inhalte, Fakten und Informationen sind als notwendige Voraussetzung für Wissenschaft und Forschung frei. Sie sind als Schaffensgrundlage gemeinfrei.



Zur Autorin

bild
Claudia Otto ist Rechtsanwältin und gründete 2016 die auf neue Technologien und Biotechnologie spezialisierte Kanzlei COT Legal. Seit 2017 ist Otto Herausgeberin der Zeitschrift Recht innovativ (Ri).