Umsetzung

GCAM entwickelt eine Plattform, auf deren Grundlage aus medizinischen Daten neue Erkenntnisse zu Therapieentscheidungen gewonnen werden können. Zur Anwendung kommen hierbei neben klassischen Analysemethoden auch Modellierungsmethoden und maschinelles Lernen.

Teil der Plattform ist ein logisches, strukturiertes Datenmodell, das die Struktur der zugrundeliegenden Datenhaltungssysteme abbildet (virtuelles Data Warehouse). Hierbei ist sichergestellt, dass keinerlei personenbezogen Daten außerhalb der Institute hinterlegt werden. Es werden ausschließlich die bestehenden identifizierten Systeme der teilnehmenden Institute an eine virtuelle (semantische) Schicht angeschlossen und miteinander in Beziehung gesetzt. Ausgehend von dieser semantischen Schicht werden die gewonnen Daten Validierungen unterzogen, mit welchen die Konsistenz überprüft wird. Anschließend werden die Daten anonymisiert auf einen Server-Cluster zur eigentlichen Analyse mittels Big Data-Algorithmen übertragen.

Nach erfolgter Übertragung der anonymisierten Daten zu GCAM werden unterschiedliche Analysealgorithmen auf dem so gewonnenen Datenbestand angewendet und die Ergebnisse gegeneinander verglichen. Die hier gewonnenen Erkenntnisse werden in Zusammenarbeit mit medizinischem Fachpersonal qualitativ beurteilt und bewertet.

Technologisch hat sich das GCAM auf moderne Technologien festgelegt. Im Datenmanagement sowie in der Analyse kommen ausschließlich Softwarekomponenten aus dem Hadoop Open Source Umfeld zum Einsatz. Das GCAM baut die Grundlage für das Datenmanagement selbständig vor Ort auf, d. h. die gesamte Hardware steht direkt im GCAM.