27. Juli 2021

Wegbereiter für maschinelles Lernen mit medizinischen Daten

CASUS und Forschungskonsortium PIONEER kooperieren im Kampf gegen Prostatakrebs

Das Zentrum für datenintensive Systemforschung (CASUS) am Helmholtz-Zentrum Dresden-Rossendorf (HZDR) engagiert sich bei PIONEER, einem 12,8 Millionen Euro umfassenden Forschungsprojekt des öffentlich-privaten Gemeinschaftsunternehmen Innovative Medicines Initiative 2. Für PIONEER ist das HZDR das 36. Mitglied. Das europäische Konsortium will die Potenziale von Big Data und Big-Data-Analytik erschließen, um eine optimale Prostatakrebsbehandlung zu erreichen. Über den Kontinent verteilt, enthalten Datenbanken klinischer Studien, öffentlicher Register und elektronischer Gesundheitsakten die Daten von Tausenden von Prostatakrebspatienten. PIONEER erfasst und anonymisiert diese unterschiedlichen Datensätze und führt sie zusammen. Das CASUS wird eine neue zentralisierte Daten- und Analyseplattform für PIONEER bereitstellen. Die Cloud-basierte Plattform soll der akademischen und der industriellen Forschung den Zugriff auf Daten sowie Maschinenlern-Analysen ermöglichen. PIONEER betreibt neben dem zentralen auch ein föderiertes Modell der Datenfreigabe. Für das föderierte Modell wird das CASUS ein Verbundnetzwerk zur Datenanalyse aufbauen. Die Verwendung beider Datenfreigabemodelle ermöglicht es PIONEER, einerseits den Datenschutz zu gewährleisten und andererseits die Datennutzung zu verbessern.


Prof. James N’Dow, wissenschaftlicher Leiter von PIONEER und Außerordentlicher Generalsekretär der European Association of Urology, begrüßt den neuen Partner HZDR im Konsortium: „Die CASUS-Expertise am HZDR im Bereich der Verarbeitung großer Datenmengen wird für eine sichere, skalierbare und nachhaltige Infrastruktur für die Big-Data-Plattform von PIONEER sorgen. Wir freuen uns, diese nächste Phase von PIONEER gemeinsam mit dem CASUS in Angriff zu nehmen.” Das CASUS wird nicht nur die Cloud-Infrastruktur für diese Plattform bereitstellen, sondern auch die föderierte Datenanalyse für alle Konsortiumsmitglieder einrichten und betreuen.

Für Dr. Michael Bussmann, Gründungsbeauftragter des Görlitzer Forschungszentrums, ist dieser letzte Aspekt von zentraler Bedeutung: „Durch die Entwicklung fortschrittlicher Algorithmen des maschinellen Lernens erwarten wir, zu besseren Vorhersagemodellen von Behandlungsergebnissen und Krankheitsverläufen zu kommen. Der Fokus liegt dabei auf etablierten sowie neuen klinischen und biologischen Indikatoren, den sogenannten Biomarkern. Wir werden versuchen herauszufinden, ob und wie die Erfassung solcher Biomarker die Vorhersagen im Verlaufe der gesamten Behandlung eines Prostatakrebspatienten verbessert.”


Sicherung des Datenzugriffs und des Datenschutzes

Im Gesundheitswesen sammeln zahlreiche Interessengruppen medizinische Daten. Datengestütztes maschinelles Lernen gilt als ein leistungsfähiges Werkzeug zur Analyse dieser Daten. Dazu müssen jedoch alle Daten in einem einheitlichen Format zur Verfügung stehen und der Datenschutz adäquat berücksichtigt werden.

PIONEER arbeitet mit zwei Datenzugriffsmodellen – einem zentralen und einem föderierten Modell. Im zentralen Modell wird eine Kopie der Daten an PIONEER übertragen, konvertiert und in einer zentralen Datenbank für Forschungszwecke gespeichert. Im föderierten Modell standardisieren die Dateninhaber ihre eigenen Datensätze, richten Analysewerkzeuge innerhalb ihrer eigenen Datenumgebung ein und versorgen PIONEER mit den akkumulierten Ergebnissen der angeforderten Analyseaufgaben. In diesem Datenzugriffsmodell verlassen die Daten somit nicht ihren Ursprungsort. Daten aus einer Vielzahl von Quellen werden gewissermaßen temporär „verknüpft”, um spezifische Abfragen aus der Ferne zu bedienen. PIONEER bringt also die Analyse zu den Daten. Innerhalb des Projekts wird das CASUS für Koordination und Management beider Datennutzungsmodelle verantwortlich sein.

Eine Identifizierung der Person, auf die sich die medizinischen Daten beziehen, ist bei PIONEER praktisch unmöglich. Die innerhalb der Big-Data-Plattform von PIONEER gespeicherten Daten werden nicht als personenbezogene Daten eingestuft, sodass deren Verwendung mit allen auf EU-Ebene geltenden Datenschutzgesetzen vereinbar ist. Diese Daten fallen nicht in den Anwendungsbereich der EU-Datenschutzgrundverordnung, behalten aber ihre klinische Relevanz.


Offene Fragen der Prostatakrebsforschung

Grundsätzlich verfolgt PIONEER das Ziel, Wissenslücken in der Prostatakrebsforschung zu identifizieren und zu schließen. Zu den bisher ermittelten offenen Fragen hoher Dringlichkeit gehören: Durch welche relevanten tumor- und patientenspezifischen Variablen wird die Prognose jener Prostatakrebspatienten beeinflusst, die für eine engmaschige klinische Überwachung in Betracht kommen? Wie ist der normale Krankheitsverlauf jener Patienten, die sich einer konservativen Behandlung – also beobachtendem Abwarten – unterziehen, und welchen Einfluss haben Begleiterkrankungen und die Lebenserwartung auf die langfristigen Ergebnisse?

Durch Datenauswertung verschiedener Patientengruppen unterschiedlicher Krankheitsstadien und aus verschiedenen europäischen Ländern soll PIONEER evidenzbasierte Antworten auf diese Fragen vorlegen, um eine bessere gemeinsame Entscheidungsfindung von Ärzteschaft sowie zu behandelnden Personen zu ermöglichen. Das endgültige Ziel ist es, nicht nur die Behandlung von Prostatakrebs zu verbessern, sondern ebenfalls die Effizienz des Gesundheitswesens und die Qualität von sozialer als auch gesundheitlicher Versorgung zu steigern.

Derzeit besteht die PIONEER-Plattform, sowohl zentral als auch föderiert, aus einem Verbund von 29 Datensätzen von Konsortiumsmitgliedern, der Industrie und angegliederten Datenquellen. Davon wurden elf Datensätze auf das europäische Common Data Model (CDM) der Observational Medical Outcomes Partnership (OMOP) abgestimmt, für weitere acht Datensätze ist die Abstimmung bereits angelaufen oder steht kurz bevor. Nach ihrer Fertigstellung wird die Big-Data-Plattform von PIONEER Daten von insgesamt 1,8 Millionen Prostatakrebspatienten umfassen.

Durch die Verknüpfung von Forschung an komplexen Systemen mit den topaktuellen digitalen Methoden aus der Daten- und Computerwissenschaft strebt das CASUS einen Spitzenplatz in der europäischen Forschungslandschaft an. Die CASUS-Einbindung wurde von PIONEER-Mitglied Prof. Manfred Wirth initiiert, Senior-Professor an der Technischen Universität Dresden und früherer Direktor der Klinik und Poliklinik für Urologie am Universitätsklinikum Carl Gustav Carus in Dresden (Deutschland). Um das föderierte Datenzugriffsmodell beispielsweise auch bei der Analyse von Lungen- und Brustkrebsdaten zu etablieren, will sich das CASUS in naher Zukunft mit weiteren Forschungskonsortien zusammentun.
-> Zur News des HZDR.


Foto ©HZDR/Oliver Killig: Einer der leistungsstärksten Rechner Sachsens steht im Helmholtz-Zentrum Dresden-Rossendorf.

Das könnte Sie auch interessieren

14. Nov 2019

Multi-Material-Design für die Großserie erneut ausgezeichnet

Leichtbau-Forscher kombinieren Organobleche und Faserverbund-Hohlprofile im Spritzgießprozess. Hierfür gewinnen sie den Materialica-Award. Bei der internationalen Fachmesse für Mobilität 4.0 "eMove-360°…

WEITERLESEN

06. Sep 2019

TU Dresden, Institut für Massivbau (IMB)

Das IMB forscht an Beton in all seinen Facetten. Gemeinsam mit der Industrie überführt es die Foschungsergebnisse in reale Bauprojekte.…

WEITERLESEN

31. Aug 2018

Verbindungsfestig­keit in Hybridstrukturen

Das Institut für Leichtbau und Kunststofftechnik (ILK) der TU Dresden startete gemeinsam mit dem Kunststoff-Zentrum SKZ im Juni 2018 ein…

WEITERLESEN