KI-AIM: KI-basierte Anonymisierung in der Medizin

Innerhalb des Projekts „KI-basierte Anonymisierung in der Medizin“ (KI-AIM) entwickelt das Team eine Anonymisierungsplattform zum Bereitstellen großer Mengen realitätsnaher Daten. Diese Daten weisen keinen Personenbezug auf und können deshalb datenschutzrechtlich einfacher genutzt werden. So soll der Zugang zu Daten für die Erforschung und kommerzielle Entwicklung von datenbasierten medizinischen Lösungen erleichtert werden. Wichtige Forschungsschwerpunkte, mit denen sich das Projekt befasst, sind Verfahren zur flexiblen Kombination von Anonymisierungsmethoden für sensible Patientendaten und von Synthetisierungsmethoden zur Genese von Datensätzen. Die mögliche Übertragbarkeit auf verschiedene medizinische Fachbereiche steht ebenso im Fokus der Entwickelnden. Zusätzlich schätzen die Forschenden Risiken für die Privatheit anhand innovativer Modelle ab und bewerten die Realitätsnähe der Ausgabedaten für anonymisierte sowie synthetisierte Daten.

Innovationen und Perspektiven

Im Rahmen von „KI-AIM“ werden innovative Methoden zur Anonymisierung personenbezogener Daten entwickelt und unter Berücksichtigung von Restrisiken anhand eines konkreten Anwendungsfalls aus der Onkologie evaluiert. Die Verfügbarkeit von nachweisbar anonymen Daten wird es sowohl erleichtern, Forschung im Bereich der KI zu betreiben als auch KI-basierte kommerzielle Produkte für medizinische Einrichtungen zu entwickeln. Dadurch werden perspektivisch weitere Innovationen im Bereich der KI-Anwendungen möglich. Durch das Bereitstellen der entwickelten Plattform als Open-Source-Software sowie den Aufbau einer Nutzerinnen- und Nutzergemeinschaft besteht die Möglichkeit, mittel- bis langfristig durch die bessere Verfügbarkeit von Daten einen Standortvorteil für Deutschland und Europa zu schaffen.

Verbundkoordinator: Westfälische Wilhelms-Universität Münster (Pressemitteilung)

MEDINYM: KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen

Das Projekt „KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen“ (Medinym) untersucht die Möglichkeit der Weiterverwertung sensibler Daten durch das Entfernen der empfindlichen Informationen mittels Anonymisierung. Im Projekt werden zwei medizinische Anwendungsfälle, textbasierte Daten aus der elektronischen Patientenakte sowie Sprachdaten aus diagnostischen Ärztin-Patient-Gesprächen, exemplarisch umgesetzt. Dazu werden im Projekt offene Technologien zur Anonymisierung untersucht, weiterentwickelt und auf reale Daten angewandt. Außerdem untersuchen die Forschenden, wie die Aussagekraft solch anonymisierter Daten für die weitere Nutzung erhalten werden kann. Zusätzlich sollen Methoden betrachtet werden, die einen Missbrauch der Technologie außerhalb des beabsichtigten Anwendungsfalls verhindern oder erschweren.

Innovationen und Perspektiven

Durch die informationserhaltende Anonymisierung soll es möglich werden, klinische Daten weiterzuverarbeiten, da eine De-Anonymisierung nicht mehr möglich ist. Diese Datensätze können dann dazu dienen, KI-Modelle auf klinischen Daten datenschutzkonform zu trainieren oder auf andere Kohorten ausgedehnt werden. Damit wäre eine kumulative Sammlung entsprechender Datenmengen auch für kleine und mittelständische Unternehmen möglich. Denn so könnten sensible Daten über mehrere Anwendungszwecke hinweg zusammengefasst und für KI-Trainingsroutinen verwendet werden; eine entsprechende Anonymisierung stets vorausgesetzt. Die angestrebte Anonymisierung soll zudem die Bereitschaft von Patientinnen und Patienten steigern, in die Teilnahme an Studien, Datenanalysen sowie allgemeinen Spenden von Gesundheitsdaten einzuwilligen. Schlussendlich erlaubt die informationserhaltende Anonymisierung die Integration der Technologie in gängige Entwicklungsmethoden und Diagnostiksysteme und stärkt damit den Wissenschafts- und Wirtschaftsstandort Deutschland in den Bereichen Diagnostik, Behandlung und damit allgemein der Gesundheitsversorgung.

Verbundkoordinator: Otto-von-Guericke-Universität Magdeburg (weitere Informationen)

NEMO: Nicht-Identifizierbarkeit von Daten aus Elektroenzephalografie für Open Science

Das Projekt „Nicht-Identifizierbarkeit von Elektroenzephalogrammen (EEG) und vergleichbaren Sensorsignalen aus medizinischer Versorgung für Open Science (NEMO)“ zielt darauf ab, neuartige Anonymisierungserfahren zu entwickeln, welche die Re-Identifizierungsrisiken bei der Auswertung der EEG-Daten reduzieren. Die EEG-Daten werden bei klinischen Untersuchungen, aber auch über Geräte erhoben, die Patientinnen und Patienten zur Schlafüberwachung auf dem freien Markt kaufen können. Der große Datenpool bietet aufgrund seiner Informationsdichte ein erhebliches Nutzungspotenzial für Forschung und Wirtschaft, birgt aber gleichzeitig ein großes Sicherheitsrisiko, wenn personenbezogene Daten relativ ungeschützt zur Verfügung gestellt werden. Die im Projekt anvisierten Verfahren zur Anonymisierung von EEG-Daten sollen vor diesem Hintergrund flexibel einsetzbar sein. Es gilt Datenschutzanforderungen für unterschiedliche Anwendungsfälle mit jeweils passenden messbaren Privacy-Metriken zu versehen. Ein Demonstrator führt diese Entwicklungsgegenstände zusammen und schafft somit die Grundlage für eine anwendungsfallbezogene, iterative Datenanalyse. 

Innovationen und Perspektiven

Das Projekt NEMO liefert einen relevanten Erkenntnisgewinn bezüglich konkreter Risikoszenarien sowie zur Entwicklung und Erprobung von Anonymisierungsverfahren in dem sensiblen Feld der Gesundheitsdatenerhebung. Darüber hinaus legt das Projekt den Grundstein für solide Datenschutzkonzepte und Anonymisierungsverfahren. So kann eine erprobte technische Infrastruktur geschaffen werden, die eine umfassende Nutzung der Daten in unterschiedlichen Anwendungsfällen ermöglicht und dabei den Datenschutz wahrt. Die anvisierten technologischen Lösungen bieten ein hohes Alleinstellungsmerkmal bezüglich des Datenschutzes auf dem Gesundheitsmarkt. Es besteht die realistische Möglichkeit, die Verfahren mit überschaubarem Aufwand für andere zeitabhängige Sensordaten anzupassen, was eine Vielzahl weiterer Anwendungs- und Verwertungsmöglichkeiten eröffnet.

Verbundkoordinator: Fraunhofer IDMT, Oldenburg (weitere Informationen)

 

PATH: Plattform für den Austausch von Gesundheits- und Wellness-Daten

Im Projekt „Personal Mastery Health & Wellness Data“ (PATH) verfolgen die Forschenden das Ziel, eine datenschutzkonforme Plattform zu schaffen, um persönliche Gesundheitsdaten aus Patientenakten mit Daten aus häuslichen Gesundheitssystemen zu verknüpfen. Ein Teilaspekt ist der einfache und nutzungsfreundliche Zugang zu Gesundheitsdaten in einer grafischen Übersicht, welche die notwendige Transparenz für eine effektive Kontrolle durch Nutzende schafft. Dies ermöglicht Bürgerinnen und Bürgern, über die Weitergabe ihrer Daten individuell zu entscheiden und spezifische Einwilligungen auf Grundlage leicht verständlicher und zugänglicher Plattformschnittstellen zu erteilen. Die Forschenden entwickeln Open-Source-Module für die Einholung von Einwilligungen, deren Verwaltung und die Überwachung des Gebrauchs der Daten in der Forschung. Als Demonstrationsmodell soll der dabei entstehende „Data Hub“ in realistischen Fallstudien mit Diabetes- und Psychiatriepatientinnen und -patienten getestet, validiert und anschließend bewertet werden. 

Innovationen und Perspektiven

Das Projekt PATH nutzt die Chancen der Digitalisierung, um das volle Potenzial medizinischer Daten in den Dienst der Gesundheit zu stellen. Durch den „Daten-Hub“ werden zum ersten Mal die individuell generierten medizinischen Daten und die traditionell papierbasierten Krankenhauskarten in eine datenschutzkonforme Plattform integriert. Die Plattform ermöglicht es medizinische Daten datenschutzkonform zu teilen. Die erhobenen Daten können der Marktüberwachung dienen, um die Sicherheit, Leistung und den klinischen Nutzen von vermarkteten Medizinprodukten nachzuweisen. Perspektivisch erschließt das Vorhaben weitere Potenziale für Forschung und Entwicklung von Produkten und Dienstleistungen für die Medizin durch die Bereitstellung von anonymisierten Daten.

Verbundkoordinator: Technische Universität Dresden (Pressemitteilung)