Assoziierte Projekte
Zwei weitere BMFTR-geförderte Forschungsprojekte sind dem AVATAR-Transfer Konsortium zugeordnet.
Das Projekt „KI-AIM2“ baut auf erfolgreiche Vorarbeiten und eine entwickelte Plattform (Cinnamon) zur Depersonalisierung von medizinischen Daten auf und erweitert diese an entscheidenden Stellen. Die Plattform soll um eine Komponente zur Freitextanonymisierung und -synthetisierung erweitert werden, welche 80% der gespeicherten medizinischen Informationen ausmachen. Die Interoperabilität soll erforscht werden, so dass die Plattform in bestehende Gesundheitsinformationssysteme integriert werden kann und (teil-)automatisierte Anonymisierungspipelines in der Praxis umgesetzt werden können. Darüber hinaus werden innovative Modelle zur integrierten Quantifizierung der Privatsphärerisiken und der Realitätsnähe der Ausgabedaten für anonymisierte und synthetisierte Datensätze entwickelt.
Das Projekt soll durch innovative und praxistaugliche Anonymisierungsmethoden den Zugang zu medizinischen Daten für Forschungszwecke vereinfachen. Die entwickelte Plattform soll dazu als Open Source Software veröffentlicht und eine große Community von Nutzern etabliert werden. Die höhere Verfügbarkeit nachweisbar anonymer medizinischer Daten soll dazu beitragen, dass KI-Modelle für unterschiedliche medizinische Einsatzzwecke entwickelt werden können. So sind auf dieser Basis völlig neue Anwendungen im Bereich der vernetzten Analyse von Gesundheitsdaten sowie der personalisierten Medizin denkbar.
Die Gewährleistung von Anonymitätsgarantien ist für die Umsetzung neuer, datenbasierter Anwendungen von entscheidender Bedeutung. Klassische Verfahren der Anonymisierung und Pseudonymisierung wie die sogenannte k-Anonymisierung oder Differential Privacy werden zwar in der Praxis bereits eingesetzt, erweisen sich jedoch für reale Anwendungsfälle als ungeeignet. Gründe hierfür sind unter anderem, dass in realen Anwendungen statt einfache numerische Datentypen komplexere Datenarten eine immer größere Rolle spielen, wie Reihen von Lokationsdaten oder hierarchische Datenstrukturen, die physische oder logische Gegebenheiten abbilden. Zudem können durch bisherige Verfahren auch die für Unternehmensumgebungen relevante Kommunikations- und Architekturmodelle nicht unterstützt werden, sodass sie in etablierten Software-Stacks nicht integriert werden können. Insbesondere gilt dieser Umstand für Modelle des sogenannten Stream-Processing, bei dem große Datenmengen kontinuierlich eine Verarbeitungskette durchlaufen, ohne dauerhaft gespeichert zu werden. Ebenso fehlen etablierte Metriken und Verfahren zur Abschätzung und Austarierung von Verarbeitungsaufwand und Informationsverlusten, mit denen unterschiedliche Anonymisierungsverfahren einhergehen.
Ziel des Projekts „Gewährleistung von Anonymitätsgarantien in Enterprise-Streaminganwendungen (GANGES)“ ist es, die genannten Hemmnisse abzubauen, indem praxisorientierte Anonymisierungsverfahren entwickelt werden, die sich an realen Bedarfen mit Anonymitätsgarantien orientieren. Hierzu werden anhand konkreter Anwendungsfälle aus der Energie- und Gebäudewirtschaft sowie von existierenden Basisverfahren neue Verfahren zur Stream-Anonymisierung entwickelt. Dabei werden besonders in der Praxis genutzte, komplexe Datenarten berücksichtigt, die eine besondere Anonymisierungsherausforderung darstellen. Die entwickelten Verfahren werden aufwandsarm in etablierte Open-Source Streaming-Frameworks integriert. Weiterhin werden neue Ansätze zur Bemessung und experimentellen Bestimmung von Aufwänden und nach Anonymisierung verbleibenden Nutzwerts der Daten entwickelt. Darauf basierend werden die Verfahren und Integrationstechnologien entwicklungsbegleitend evaluiert und angepasst.