Metadata-Matching mit MDRCupid
Noemi Deppenwiese (Universität zu Lübeck, IT Center for Clinical Research (ITCR)) 22. Januar 2019, 14:00
Die gemeinsame Verwendung und Analyse von Daten im medizinischen Bereich wird oft durch deren Heterogenität erschwert. Werden die gleichen Fakten auf unterschiedliche Weise zum Ausdruck gebracht, ist der Austausch von Daten mit hohem Arbeitsaufwand verbunden. Um diesen Aufwand zu verringern, können schematische Eigenschaften der Instanzdaten mithilfe von Metadaten beschrieben werden. Wenn Abbildungen von korrespondierenden Metadatenelementen aus verschiedenen Systemen vorliegen, kann diese Information zum Übersetzen der Instanzdaten verwendet werden, analog zu Übersetzungen von Wörtern aus verschiedenen Sprachen in einem Wörterbuch. Die entwickelte MDRCupid-Toolbox unterstützt diesen Prozess, indem sie verschiedene Verfahren zum semi-automatischen Erkennen von korrespondierenden Metadaten-Elementen bereitstellt. Die Kombination und Gewichtung der Verfahren kann beliebig festgelegt werden. Dennoch stellt die Toolbox eine datengetriebene Optimierung bereit, die basierend auf einem einen Trainingsdatensatz die beste Konfiguration bestimmen kann. MDRCupid enthält zusätzlich einen Webservice, der über eine GUI oder API genutzt werden kann. Matching-Ergebnisse können als HL7 FHIR ConceptMap exportiert werden.