Editorial

So einzigartig
wie ein Fingerabdruck

(17.07.2023) Oft wird gesagt, der Datenschutz verhindert die Nutzung von medizinischen Daten. Mit besseren Anonymisierungsverfahren wäre beides möglich.
editorial_bild

Die Verfügbarkeit medizinischer Daten ist wesentlich für die medizinische und pharmazeutische Forschung, sowohl an Forschungs­instituten als auch in der Industrie. Auch für das Trainieren von Anwendungen, die auf künstlicher Intelligenz beruhen, sind große Datenmengen nötig. Datenschützer warnen jedoch vor dem Risiko der unbefugten Nutzung solcher Daten. So seien personen­bezogene medizinische Daten in ihrer Kombination einzigartig wie ein Fingerabdruck, sagt der Verein Patientenrechte und Datenschutz e. V. in einem kürzlich veröffentlichten Appell zum EU-Vorschlag eines „Europäischen Gesundheits­datenraums“.

Die Datenschützer weisen darauf hin, dass man durch Zusammenführung von Daten aus verschiedenen Quellen die betreffende Person aktuell aus fast jedem „anonymisierten“ Datensatz identifizieren könne. Zudem nehmen die Möglichkeiten zur umfassenden medizinischen Datensammlung zu – beispielsweise über Register, die elektronische Patientenakte, digitale Gesundheits­anwendungen, Apps, Smartwatches und weitere Medizinprodukte. „Überdies kann ‚Pseudonymisierung‘ rückgängig gemacht werden.“ Um missbräuchlicher Datennutzung entgegen­zutreten, schlägt der Verein unter anderem vor, Sekundärnutzung streng auf gemeinnützige Forschung zu beschränken und eine Daten-Weitergabe unter empfindliche Strafen zu stellen.

So wie es etwa das Land Mecklenburg-Vorpommern mit einer Änderung des Landeskrankenhausgesetzes vorhat. Vor Ort erhobene Gesundheitsdaten dürfen demnach nur zu Forschungszwecken verwendet werden (deutschlandweit), eine Veräußerung an Dritte ist ausgeschlossen. Auch der Landesdatenschutzbeauftragte ist zufrieden: „Nur wenn Patientinnen und Patienten begründet darauf vertrauen können, dass ihre personenbezogenen Daten im Einklang mit den datenschutzrechtlichen und technischen Vorgaben verarbeitet werden, wächst ihre Bereitschaft, Forschung zu unterstützen.“

Editorial

Risiken der Re-Identifizierung aus EEG-Daten

Oder man verbessert die Anonymisierung medizinischer Daten gleich generell. Dem hat sich das BMBF-geförderte „Forschungsnetzwerk Anonymisierung für eine sichere Datennutzung“ verschrieben und unterstützt dabei mehrere Kompetenz­cluster und Forschungsprojekte, die den technischen Datenschutz verbessern wollen.

Im Projekt NEMO etwa geht es um Anony­misierungs­verfahren von Elektro­enzephalo­gramm (EEG)-Daten aus Schlaf­überwachungs­systemen. Federführend für das bis Dezember 2025 mit zwei Millionen Euro geförderte Projekt ist das Fraunhofer-Institut für Digitale Medien­technologie (IDMT) in Oldenburg. „Aktuelle Publikationen deuten darauf hin, dass personen­beziehbare Merkmale aus einem EEG extrahiert werden können [...]. Zugleich lassen sich aus den Daten relevante Informationen zum Gesundheits­zustand ableiten und zukünftig möglicherweise auch Marker zur Früherkennung von Krankheiten. Auch im Consumer-Bereich finden sich mittlerweile Geräte, die EEG-Daten erheben“, erläutert Insa Wolf, Gruppenleiterin Mobile Neuro­technologien am Fraunhofer-IDMT, in einer aktuellen Pressemitteilung. Gemeinsam mit den Kollegen des Ilmenauer IDMT-Standorts möchte Wolf im Projekt NEMO konkrete Risiko­szenarien zur Re-Identifizierung aufdecken und anschließend neue Algorithmen für die Anonymisierung von EEG-Daten entwickeln. „Wenn wir erfolgreich sind, können die Ergebnisse auch für vergleichbare Biosignal­daten und andere Gebiete der Gesundheits­forschung äußerst hilfreich sein“, ergänzt Patrick Aichroth vom Fraunhofer-IDMT in Ilmenau.

Mehr Privatsphäre

Ganz allgemein um Verfahren und Methoden zur Anonymisierung von medizinischen Anwendungen geht es im Projekt AnoMed unter Leitung von Esfandiar Mohammadi vom Institut für IT-Sicherheit der Universität zu Lübeck. Das bis November 2025 mit zehn Millionen Euro geförderte Projekt will eine Plattform mit medizinischen Referenz­aufgaben für Referenz­datensätze zur Verfügung stellen, für die die internationale Forschungs­gemeinschaft Privatsphäre-bewahrende Daten­verarbeitungs­prozesse entwickeln kann.

Denn derzeit verfügbare Anony­misierungs­lösungen wie k-Anonymität sind für die meisten medizinischen Anwendungen nicht nutzbar, da sie nicht genug vor Angreifern mit starkem Hintergrundwissen, zum Beispiel über eine spezielle Studie, schützen. „Ein Fokus unserer Forschung ist die Entwicklung von Privatsphäre-bewahrenden maschinellen Lernverfahren. Ein von uns entwickeltes Clustering-Verfahren, zum Beispiel, gruppiert bei einem tabellarischen Datensatz Datenpunkte – also Zeilen – mit ähnlichen Kombinationen an Tabellen­einträgen. Das Verfahren ist beweisbar Privatsphäre-erhaltend und damit auch auf schützenswerte Daten verantwortungs­bewusst anwendbar, und es soll bald für die Erstellung künstlicher Daten genutzt werden“, berichtet IT-Experte Mohammadi. „Komplementär erarbeiten wir zusammen mit der Forschungs­abteilung des Unabhängigen Landeszentrums für Datenschutz Schleswig Holstein gerade interdisziplinär, inwiefern das Nutzen von Privatsphäre-bewahrenden Daten­verarbeitungs­prozessen der Erfüllung von rechtlichen Datenschutz­auflagen dienen kann.“

Toolbox für die Anonymisierung

Das Charité Lab for AI in Medicine arbeitet als Partner im Projekt ANONY-MED unterdessen an einem „einheitlichen Werkzeugkasten mit Methoden für die Anonymisierung von unterschiedlichen medizinischen Daten“. Verbundkoordinator des bis Dezember 2025 mit 1,5 Millionen Euro geförderten Projekts ist das Fraunhofer-Institut für Angewandte und Integrierte Sicherheit (AISEC) am Standort Berlin.

Die Wissenschaftler verwenden zum einen künstliche Daten­erzeugung mit generativen Modellen, womit man auf künstlicher Intelligenz basierende Modelle zur Diagnostik trainieren kann. Zum anderen werden die generierten Daten einer datenschutz­konformen Analyse mithilfe von sogenannter homomorpher Verschlüsselung unterzogen. Auf diese Weise lassen sich mit Daten Berechnungen ausführen, ohne dass sie vorher entschlüsselt werden müssen. Getestet werden soll der kombinierte Ansatz an Anwendungs­fällen aus der Radiologie, Kardiologie und der Schlaganfall­therapie. „Darüber hinaus können die entwickelten Methoden perspektivisch auch in anderen Anwendungs­gebieten eingesetzt werden, um sensible Datenbestände rechtskonform zu nutzen.“

Bettina Dupont

Bild: Pixabay/Mikes-Photography


Weitere Artikel zum Thema Forschungsdaten


- Durchs Portal zum Datenschatz

Über das neue Forschungsdatenportal für Gesundheit erhalten Wissenschaftler ab 2023 Zugang zu Routinedaten von Unikliniken und Bioproben.

- Datensätze sind Datenschätze!

„Die Daten sind da, doch niemand kann sie nutzen“. In Zukunft soll das Zusammenspiel zwischen Forschung und Gesundheitswesen besser klappen.

- Eine europäische Wolke fürs Datenteilen

Seit 2015 schwebt sie über uns. Nun befindet sich die European Open Science Cloud „in der Anfangsphase ihrer Umsetzung“, berichtet Dale Robertson.

 



Letzte Änderungen: 17.07.2023