Info

AlphaFold
und Urheberrecht

(23.08.2022) Inwieweit ist AlphaFold nach deutschem bzw. europäischem Recht schutzfähig und welche Rechte bestehen an den vorhergesagten Strukturen?
editorial_bild

Künstliche Intelligenz (KI) revolutioniert gegenwärtig viele Disziplinen der Biowissen­schaften. So soll kürzlich das Protein­faltungs­problem von dem KI-System AlphaFold gelöst worden sein. AlphaFold dient dazu, die Strukturen noch nicht vollständig erforschter Proteine zu berechnen und vorherzusagen. Entwickelt wurde die Software von der DeepMind Technologies Limited (DeepMind), einer Tochter von Alphabet Inc. Der Quellcode sowie die für das gewünschte Funktionieren erforderlichen Modell­parameter von AlphaFold sind auf GitHub zufinden.

Die bislang mittels AlphaFold erstellten Protein­struktur­vorhersagen sind in der AlphaFold Protein Structure Database (AlphaFold DB) für jedermann zum Abruf veröffentlicht worden. An dieser mitgewirkt hat das European Bioinformatics Institute (EBI) als Teil des European Molecular Biology Laboratory (EMBL) in Heidelberg.

Info

AlphaFolds Kern besteht aus neuronalen Netzwerk­strukturen. Diese werden mit Verfahren trainiert, die auf vorhandenem Wissen zu evolutionären, physikalischen und geometrischen Einschränkungen von Protein­strukturen basieren. Das Programm baut hierbei auf der Arbeit zahlreicher Forscher aus der ganzen Welt auf. Konkret greift es auf vorhandene Protein­struktur-Daten zurück, etwa in der Protein Data Bank (PDB). Die Genauigkeit der Struktur­vorhersage ist mit den Ergebnissen aus teuren und zeitaufwendigen Labor­experimenten vergleichbar.

Beim Wissenschafts­wettbewerb CASP14 erreichten die mittels AlphaFold erstellten Protein­struktur­vorhersagen bei etwa zwei Dritteln der vorgegebenen 100 Aminosäure­sequenzen 90 von 100 Punkten. Über dem Schwellenwert von 90 Punkten gelten verbleibende Unterschiede zu Ergebnissen aus experimentellen Struktur­bestimmungen und alternativen Konformationen niedrigerer Energie als klein.

AlphaFold spürt in den zahlreichen vorhandenen Protein­struktur­daten Zusammenhänge auf, die aufgrund der schieren Masse für Strukturbiologen nicht zu erkennen sind. Die konkrete Natur dieser Zusammen­hänge bleibt aber in der Regel im Dunkeln. Auch kann AlphaFold keine Fehlfaltungen oder Protein­strukturverän­derungen im sich dynamisch verändernden Proteom vorhersagen. Man kann also resümieren: AlphaFold hat das Protein­faltungs­problem nicht gelöst, aber den Weg zur Lösung beschleunigt.

Im Zusammenhang mit der Nutzung von AlphaFold und ähnlicher Forschungs­software können rechtliche Fragen auftreten. Die wichtigsten sollen im Folgenden beantwortet werden.

Was ist der Unterschied zwischen Copyright und Urheberrecht?

DeepMind macht an der auf GitHub veröffentlichten AlphaFold-Dokumentation sowie den Daten in der AlphaFold DB ein Copyright geltend. Dem deutschen und kontinental­europäischen Recht ist das angloameri­kanische Copyright unbekannt. An seiner Bezeichnung „copy-right“ ablesbar ist jedoch, dass es um die Rechte zur Kopie, also Nutzungs­rechte am fraglichen Werk geht, die von Rechts­inhabenden eingeräumt werden. Insofern besteht Ähnlichkeit zu „unserem“ Urheberrecht. Das Copyright zielt jedoch auf den Schutz der Interessen an der wirtschaftlichen Verwertung ab, das Urheberrecht hingegen bezweckt den Schutz der Interessen des Urhebers.

Während eine juristische Person Inhaberin eines Copyrights sein kann, kann nach § 7 Urheber­rechtsgesetz (UrhG) Urheber nur eine natürliche Person sein, die zu einer geistigen Schöpfung im Sinne des § 2 Abs. 2 UrhG fähig ist. Einer juristischen Person kann der Urheber jedoch ein Nutzungsrecht einräumen.

Ein Copyright-Vermerk in Verbindung mit genannten natürlichen Personen wie hier auf GitHub erleichtert den Beweis der Urheberschaft nach § 10 Abs. 1 UrhG. Hiernach gilt: Wer auf den Vervielfältigungs­stücken eines erschienenen Werkes oder auf dem Original eines Werkes der bildenden Künste in der üblichen Weise als Urheber bezeichnet ist, wird bis zum Beweis des Gegenteils als Urheber des Werkes angesehen; dies gilt auch für eine Bezeichnung, die als Deckname oder Künstlerzeichen des Urhebers bekannt ist.

Das Urheberrecht ist dem Copyright gegenüber untrennbar mit dem zur geistigen Schöpfung fähigen Urheber verbunden. Es kann unter Lebenden nicht übertragen werden, vgl. § 29 Abs. 1 UrhG.

Kann an einem Computer­programm ein Urheberrecht bestehen?

Ja. Ein KI-System wie AlphaFold ist vor allem Software. Diese umfasst alle „weichen“ Komponenten eines Computers wie Computer­programme und Daten(banken).

Computer­programme können zum einen in ihrer Gesamtheit urheber­rechtlich geschützt sein. Sie sind gemäß § 69a Abs. 1 UrhG Programme in jeder Gestalt, einschließlich des Entwurfs­materials.

Computer­programme, oder genauer gesagt, ihre Komponenten, können zum anderen als Sprachwerke geschützt sein (vgl. § 2 Abs. 1 Nr. 1 UrhG), wenn sie individuelle Werke in dem Sinne darstellen, dass sie das Ergebnis der eigenen geistigen Schöpfung ihres Urhebers sind (§ 69a Abs. 3 S. 1 UrhG). Ein solches Sprachwerk stellt der Quellcode dar. Urheber­rechtlich nicht geschützt sind jedoch die ihm zugrunde liegenden Ideen und mathematischen Konzepte (vgl. § 69a Abs. 2 S. 2 UrhG). Gemäß Art. 2 des Urheber­rechtsvertrags der Weltorganisation für geistiges Eigentum (WIPO) erstreckt sich der Urheber­rechtsschutz nur auf Ausdrucks­formen und nicht auf Gedanken, Verfahren, Methoden oder mathematische Konzepte als solche.

Das bedeutet aber nicht, dass Gedanken, Verfahren, Methoden und ein mathematische Konzepte erläuternder Beitrag, wie der zu AlphaFold in Nature erschienene, ungeschützt sind. Vielmehr stellt dieser Text ein eigenes Ergebnis geistiger Schöpfung dar und ist als Sprachwerk im Sinne des § 2 Abs. 1 Nr. 1 UrhG geschützt.

Wie kann ich frei verfügbare Forschungs­software verwenden?

Die erlaubte Nutzung ergibt sich stets aus der zur Software gehörenden Lizenz. Hierin wurden die Bedingungen der Nutzung durch den Urheber beziehungsweise Copyright-Inhaber festgelegt.

Forschungs­software können Rechteinhabende unter verschiedenen Lizenzen für freie Inhalte bereit stellen. Eine Lizenzübersicht mitsamt Erläuterungen kann auf der Website des Instituts für Rechtsfragen der Freien und Open Source Software abgerufen werden (www.ifrOSS.org).

Der AlphaFold-Quellcode wird zum Beispiel unter der Apache Licence (2.0) bereitgestellt. Dabei handelt es sich um eine Lizenz ohne sogenannte Copyleft-Effekte. Das bedeutet, dass es keine Einschränkungen für Modifikationen, Weiter­entwicklung und Neukombi­nation gibt. Der Lizenz­nehmer kann veränderte Versionen der Software unter beliebigen Lizenz­bedingungen weiterverbreiten und kann sie auch in proprietäre Software überführen.

Können Urheberrechte an (Trainings-)Daten bestehen?

Nein. Der urheber­rechtliche Schutz erstreckt sich nach § 2 Abs. 2 UrhG nur auf geistig-schöpferische Ausdrucks­formen, das heißt nicht auf ihren Informations­inhalt, wie etwa wissen­schaftliche Erkenntnisse, Trainings- oder Messwerte. Darüber hinaus ist die allgemeine Freiheit von Daten und damit von Inhalten, Fakten und Informationen notwendige Voraussetzung für eine freie Wissenschaft und Forschung. Urheber­rechtlicher Schutz an Forschungs­materialien kann daher zum Beispiel nur an der konkreten sprachlichen (§ 2 Abs. 1 Nr. 1 UrhG), lichtbildlichen (§ 2 Abs. 1 Nr. 5 UrhG) und wissen­schaftlichen Darstellung, etwa in Zeichnungen, Skizzen, Tabellen und plastischen Darstellungen (vgl. § 2 Abs. 1 Nr. 7 UrhG) bestehen.

Wo an reinen Informationen keine Urheberrechte Dritter bestehen können, existieren keine urheber­rechtlichen Einschränkungen bei der Nutzung. Davon unberührt bleibt jedoch das berechtigte Interesse an der Nennung der entdeckenden Person(en). Dieses wird etwa durch die Prinzipien der „guten wissenschaftlichen Praxis“, Promotions­ordnungen oder auch ungeschriebene soziale Normen gewahrt. Den entdeckenden Personen steht aber kein Recht zur Schaffung eines Informations­monopols zu, das die Grundlage einer freien Wissenschaft und Forschung beschneidet.

Können Urheberrechte an Datenbanken bestehen?

Ja. Das ist der Fall bei sogenannten Datenbank­werken (§ 4 Abs. 2 UrhG). Ein Datenbankwerk im Sinne des Urheber­rechtsgesetzes ist ein Sammelwerk, dessen Elemente systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind. Die Auswahl oder Anordnung der Daten oder sonstigen Elementen bedarf auch hier einer persönlichen geistigen Schöpfung gemäß § 2 Abs. 2 UrhG, so explizit § 4 Abs. 1 i.V.m. Abs. 2 UrhG. Schutz­gegenstand ist auch hier nicht der Inhalt, sondern nur die Struktur, in der die persönliche geistige Schöpfung zum Ausdruck kommt.

Im Hinblick auf Datenbanken ohne schöpferische Prägung, aus denen Informationen beispielsweise zur Nutzung von AlphaFold bezogen werden, kommt zudem ein verwandtes Schutzrecht, das sogenannte Leistungs­schutzrecht der Datenbank­hersteller, in Betracht. Eine solche einfache Datenbank ist gemäß § 87a Abs. 1 S. 1 UrhG eine Sammlung von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet und einzeln mithilfe elektronischer Mittel oder auf andere Weise zugänglich sind und deren Beschaffung, Überprüfung oder Darstellung eine nach Art oder Umfang wesentliche Investition erfordert. „Wesentlich“ bedeutet: Die Investition darf nicht unbedeutenden Umfangs sein. Datenbank­hersteller ist gemäß § 87a Abs. 2 UrhG derjenige, der diese Investition vorgenommen hat. Nur der Datenbank­hersteller hat nach § 87b Abs. 1 UrhG das ausschließliche Recht, die Datenbank insgesamt oder einen nach Art oder Umfang wesentlichen Teil der Datenbank zu vervielfältigen, zu verbreiten und öffentlich wiederzugeben. Das bedeutet wiederum, der Datenbank­hersteller ist vor der Verviel­fältigung, Verbreitung und öffentlichen Wiedergabe der Datenbank als Gesamtheit oder eines wesentlichen Teils durch Dritte geschützt.

Das Datenbank­herstellerrecht schützt erkennbar nicht die einzelnen Daten oder die Investition in ihre Erzeugung. Die Entnahme und Nutzung einzelner Daten, soweit sie nicht in Gesamtheit einen nach Art oder Umfang wesentlichen Teil ausmachen, ist daher ohne Rechte­einräumung zulässig. § 87c Abs. 1 Nr. 2 und 5 UrhG gestatten zudem die Vervielfältigung eines nach Art und Umfang wesentlichen Teils der Datenbank für Zwecke der wissen­schaftlichen Forschung gemäß § 60c UrhG und für sogenanntes Text- und Data-Mining für Zwecke der wissen­schaftlichen Forschung gemäß § 60d UrhG.

Habe ich Rechte an den von mir mittels AlphaFold erstellten Protein­struktur­vorhersagen?

Nach dem aktuellen Kenntnisstand: Nein. An der Darstellung einer Protein­struktur(-vorhersage) kann grundsätzlich ein Urheberrecht bestehen: Eine Darstellung wissenschaftlicher oder technischer Art im Sinne des § 2 Abs. 1 Nr. 7 UrhG muss dann, mit dem Ausdrucks­mittel der grafischen oder plastischen Darstellung, der Vermittlung von belehrenden oder unterrichtenden Informationen über den dargestellten Gegenstand dienen. Dabei muss eine individuelle, sich vom alltäglichen Schaffen im betroffenen Bereich abhebende Geistestätigkeit erkennbar sein, mag auch das Maß der geistigen Leistung und individuellen Prägung gering sein.

In einer mithilfe von AlphaFold generierten, grafisch ausgedrückten dreidimen­sionalen Protein­struktur­vorhersage liegt zunächst eine Darstellung wissenschaftlicher Art, denn sie dient der Vermittlung von unterrichtenden Informationen über den dargestellten Gegenstand: die mögliche Faltung des Proteins. Dass die Protein­struktur­vorhersage wie jede wissenschaftliche These einer wissenschaftlichen Validierung durch menschliche Fachleute bedarf, ändert hieran nichts. Eine individuelle, sich vom alltäglichen Schaffen in der Bioinformatik oder theoretischen Chemie abhebende Geistes­tätigkeit liegt in der grafischen Darstellung mittels AlphaFold allerdings nicht. Vielmehr folgt die Darstellung der errechneten Protein­strukturdaten wissenschaftlichen Standards – hier der Darstellung in einem zwei- oder dreidimensionalen Koordinaten­system. Auch in der farblichen Kenntlich­machung der Konfidenz von Teilstrukturen ist keine individuelle Geistes­tätigkeit zu erkennen; sie dient nicht dem individuellen Ausdruck, sondern der Vermittlung von Informationen über die Genauigkeit der Protein­struktur­vorhersage.

Auch im Hinblick auf die Begleit­informationen zu einer Protein­struktur­vorhersage ist die Frage nach einem Recht an ihnen abschlägig zu beurteilen: Daten als solche und damit Inhalte, Fakten und Informationen sind als notwendige Voraussetzung für Wissenschaft und Forschung frei. Sie sind als Schaffens­grundlage gemeinfrei.

Zur Autorin
Claudia Otto ist Rechtsanwältin und gründete 2016 die auf neue Technologien und Biotechnologie spezialisierte Kanzlei COT Legal. Seit 2017 ist Otto Herausgeberin der Zeitschrift Recht innovativ (Ri).

Dieser Essay erschien zuerst in Laborjournal 7-8/2022.


Weitere Essays aus dem Laborjournal-Sommerheft


- Corona-Krise? Welche Krise? – Zum Umgang mit einer Pandemie (Essay von Steffen M. Diebold, Jungingen)

Ein Blick zurück auf Fehleinschätzungen und Versäumnisse. Und auf die Crux, die sich aus dem beliebigen Nebeneinander von Forschung und Aberglaube sowie Wissenschaft und Esoterik offenbart.

- Zwischen Wunsch und Wirklichkeit: Innovationsförderung durch Kooperationen von Hochschulen und Industrie (Essay von Monika Lessl, Leverkusen)

Kooperationen zwischen Hochschulen und Industrie bieten hohes Innovationspotenzial, um die anstehenden globalen und fundamentalen Transformationsprozesse zu gestalten. Dazu braucht es hierzulande aber nicht nur strukturelle Änderungen, sondern vor allem mehr Offenheit und Vertrauen zwischen den Akteuren. Einige Vorschläge.

- #IchBinHanna – Warum prekäre Arbeit der Wissenschaft nachhaltig schadet (Essay von Amrei Bahr und Kristin Eichhorn, Stuttgart, sowie Sebastian Kubon, Hamburg)

Im Juni 2021 ging der von den Autorinnen und dem Autor dieses Beitrags initiierte Hashtag #IchBinHanna auf Twitter viral. Plötzlich gaben zahlreiche befristet angestellte Wissenschaftlerinnen und Wissenschaftler dem Prekariat im deutschen Hochschulwesen öffentlich ein Gesicht, viele davon unter Klarnamen.

 

 



Letzte Änderungen: 22.08.2022