Kollaboratives Metadatenmanagement und Ontologie-Übersetzung von RDF nach i2b2
Raphael Majeed, Mark Stöhr
Zentrum für Lungenforschung der Universität Gießen
30. Mai 2017 ab 12:30
Die IT-Strategie des Deutschen Zentrums für Lungenforschung (DZL) sieht vor, die Inhalte der vorhandenen Register und Forschungsdatenbanken zentral zur Verfügung zu stellen. Während die unterschiedlichen Datenformate IT-technisch bewältigt werden können, ist die Harmonisierung der Parameter/Metadaten eine interdisziplinäre Herausforderung. Dezentrales Wissen von Ärzten, Dokumentaren und Informatikern erfordern ein dezentrales kollaboratives Metadatenmanagement.
Eine Anforderungsanalyse ergab, dass existierende Lösungen wie z.B. MDR, (Web-)Protégé oder Ontobrowser für unseren Zweck unzureichend geeignet waren. Daher wurde zur Verwaltung der Metadaten-Ontologie ein auf Standards basierendes Metadaten Repository entwickelt. Mitwirkende können parallel Änderungen vornehmen, welche nach einer Validierung bezüglich Konsistenz und Gültigkeit in das zentrale Datawarehouse des DZL (Informatics for Integrating Biology & the Bedside / i2b2) übertragen werden. Dort wird der gesamte Funktionsumfang der Metadaten-Repräsentation unterstützt (z.B. Datentypen, Enums, Modifiers).
Der Vorteil der hier vorgestellten Lösung liegt vor allem in der Einhaltung von Standards, der Nutzung etablierter Softwarelösungen und dem modularen Aufbau. Neben der Verwendung von Git, Apache Jena Fuseki und den Technologien RDF, SKOS und SPARQL war nur minimale zusätzliche Programmierung erforderlich. Der Einsatz von Standard-Technologien ermöglicht beispielsweise die Bearbeitung der Ontologie in existierenden RDF-Editoren oder die Anknüpfung von Visualisierungssoftware an die SPARQL-Schnittstelle.