Semi-automated Refinement of Semantic Models
Die Dissertation von Dr.-Ing. Alexander Paulus beschäftigt sich mit Annotation von Datensätzen unter Anwendung von semantischen Technologien. Darin beschreibt er einen neuen Ansatz mit einer Fokussierung auf den Menschen im Annotationsprozess und stellt dazu Unterstützungsysteme vor, welche auf maschinellen Lernverfahren basieren.
Wir haben Alexander zu seiner Dissertation befragt:
In welchem Kontext ist deine Dissertation entstanden? Welche Projekte oder anderen Faktoren haben deine Dissertation besonders beeinflusst?
Meine Dissertation ist das Ergebnis meiner Forschung an der RWTH Aachen und der Bergischen Universität Wuppertal. Meine Kollegen und ich haben schon früh erkannt, dass die Verwendung von semantischen Technologien zur Beschreibung von Daten maßgeblich von der Nutzbarkeit der zur Verfügung stehenden Applikationen abhängt. Gerade für den Datenaustausch in neuen Ansätzen wie Dataspaces ist die semantische Beschreibung von Daten ein essentieller Bestandteil um die Auffindbarkeit und einheitliche Interpretation von Datensätzen zu verbessern. Aufgrund der Komplexität der gestellten Aufgabe, also der Erstellung von semantischen Modellen für verschiedene Datensätze, sind viele Nutzer aus dem industriellen Umfeld mit der manuellen Erstellung eines solchen Modells überfordert.
Im Forschungsprojekt ESKAPE haben wir daher einen ersten Prototyp für eine neue, auf die essentiellen Funktionalitäten beschränkte Plattform zur semantischen Datenannotation entwickelt. Diese wurde dann im Projekt bergisch.smart_mobility an der BUW weiterentwickelt und nach Projektende als eigenständiges Tool mit dem Namen „PLASMA“ veröffentlicht.
Welchen Beitrag leistet deine Arbeit zum Forschungsfeld?
Im Rahmen meiner Forschung habe ich mich neben der stetigen Verbesserung von PLASMA mit der Entwicklung von Assistenzsystemen beschäftigt. Diese haben das Ziel, den menschlichen Modellierer in seiner Arbeit zu unterstützen. Neben den bereits existierenden vollautomatischen Ansätzen beschreiben meine Arbeit und die dazugehörigen Publikationen auch einen neuen Ansatz, den den Modellierer aktiv in den Prozess einbezieht. Zur Unterstützung soll dabei durch ML-generierte Empfehlungen der Workload für den Modellierer reduziert werden. Gleichzeitig fördern wir die Anreicherung von semantischen Modellen durch nur dem Modellierer bekannte, aber essentielle Informationen, wie beispielsweise Referenzwerte oder Messungenauigkeiten, durch Hinweise in der Modellierungsoberfläche von PLASMA.
Wie geht es nun für dich und das Thema weiter?
Die Nutzung von semantischen Technologien schreitet immer weiter voran. Immer mehr Menschen werden in Zukunft Daten bereitstellen müssen, beispielsweise für digitale Produktpässe. Wenn diese Daten dann im Rahmen von Dataspaces semantisch annotiert ausgetauscht werden sollen, kommen auch Mitarbeiter in KMU um die Erstellung von semantischen Modellen nicht herum. Meine Forschung soll auch in Zukunft einen Beitrag zur Nutzbarkeit von Daten liefern. PLASMA und die dazugehörigen Empfehlungssysteme werden dazu in laufenden Projekten verbessert und in mehr existierende Systeme eingebaut.