Bottom-up Knowledge Graph-based Data Management
In dieser Arbeit wird ein neuartiger Ansatz, der Bottom-up Knowledge Graph, vorgestellt, der das semantische Datenmanagement in Unternehmen verbessert, indem er die Probleme des traditionellen Ontologie-Engineerings für die Verwaltung von (semi-)strukturierten Datenquellen überwindet. Darüber hinaus wird eine semantische Datenplattform (ESKAPE) entwickelt, die die Vorteile des entwickelten Ansatzes zeigt.
Wir haben André Pomp zu seiner Dissertation befragt:
In welchem Kontext ist deine Dissertation entstanden? Welche Projekte oder anderen Faktoren haben deine Dissertation besonders beeinflusst?
Die Dissertation beinhaltet Forschungsergebnisse, die ich im Laufe mehrerer Jahre in verschiedenen Forschungsprojekten generiert habe. Die Idee zur Dissertation entstand zunächst in einem Projekt, welches wir in enger Kooperation mit einem amerikanischen Unternehmen durchgeführt haben. Hierbei wurde eine Smart City Plattform entwickelt, welche zukünftig alle Daten einer Smart City verwalten sollte. In diesem Kontext identifizierte ich, dass der klassische Ansatz des semantischen Datenmanagements in einem so dynamischen Umfeld wie einer Smart City nicht angewendet werden kann. Nach Projektende zeigte sich, dass auch in Unternehmenskontexten die gleichen Herausforderungen im Datenmanagementbereich existieren, so dass ich eine weitere Plattform (ESKAPE) entwickelte, welche Unternehmen die Möglichkeit bot statische und dynamische Daten einfach zu sammeln, zu finden und zu nutzen. PE, Diese Plattform wurde anschließend von mir im Exzellenzcluster „Internet of Production“ an der RWTH Aachen University eingesetzt und getestet. Parallel dazu hatte ich ebenfalls die Möglichkeit, Erfahrungen in weiteren F&E-Projekten mit Unternehmen aus der produzierenden Industrie zu sammeln sowie meine Arbeit in realen Anwendungsfällen in diesen Projekten zu validieren.
Welchen Beitrag leistet deine Arbeit zum Forschungsfeld?
Beim semantischen Datenmanagement geht man klassischerweise davon aus, dass Konzeptualisierungen wie Ontologien bereits im Vorfeld existieren, so dass alle Datensätze damit korrekt beschrieben werden können. In heutigen dynamischen Umgebungen wie Smart Cities und Unternehmen ist dies jedoch nicht der Fall. Der in dieser Arbeit vorgestellte Ansatz der einfachen Konstruktion eines Wissensgraphen in Kombination mit der einfachen Konstruktion semantischer Modelle durch Domänenexperten leistet einen wichtigen Beitrag zum semantischen Datenmanagement. Anstatt Ontologien top-down zu erstellen und zu pflegen, lernt ein BUKG die individuellen Konzeptualisierungen von Datenlieferanten und -konsumenten und integriert sie kontinuierlich in seine gemeinsame Konzeptualisierung. Auf diese Weise wird das nahtlose Sammeln, Integrieren, Entdecken, Verstehen und Zugreifen auf heterogene Datenquellen auf der Grundlage des neuartigen Bottom-up-Wissensgraphen unterstützt.
Wie geht es nun für dich und das Thema weiter?
Das Thema semantischen Datenmanagement mit den Teilbereichen Erstellung von Wissensgraphen und Erstellung von semantischen Modellen ist nach wie vor ein zentrales Thema am TMDT und wird in verschiedenen Projekten und Anwendungen untersucht (z.B. beim Aufbau von Datenräumen oder bei der Verbesserung von AutoML-Ansätzen). Durch die Kombination von Wissensgraphen und Large Language Models ergeben sich darüber hinaus gerade neue Anwendungsgebiete, die wir aktuell erschließen. Ich freue mich, als Leiter der Forschungsgruppe „Semantic Systems Engineering“ diese und weitere Themen am TMDT weiter verfolgen zu können.