Bachelor-/Masterarbeit:
In der heutigen digitalen Welt gibt es eine Vielzahl von Ansätzen wie das Internet of Things (IoT), Datentreuhänder und Datenräume, um Daten auszutauschen und zu verwalten. Alle Ansätze verbindet, dass komplexe Datenökosysteme entstehen. Bisher werden solche Datenökosysteme jedoch häufig ad hoc umgesetzt, ohne dass die zugrunde liegenden Abläufe und Interaktionen explizit und formal beschrieben werden, was die automatisierte Orchestrierung, Analyse, Interoperabilität und Wiederverwendung erschwert. Dem wirkt die derzeit entwickelte Data Ecosystem Description Language (DEDL) entgegen, welche basierend auf Konzepten aus dem Semantic Web eine formelle Beschreibung von Akteuren, Rollen, Schnittstellen und Prozessen in Datenökosystemen ermöglicht und so die Grundlage zur technischen Orchestrierung und Simulation schafft.
Diese Arbeit zielt darauf ab, ein Framework zu konzipieren, das auf Basis einer vorhandenen DEDL-Beschreibung der Prozesse eines Datenökosystems ausführbare Workflows erzeugt, diese in einer geeigneten Workflow- oder Orchestrierungsumgebung ausführt und so ein virtuelles Testbed für Prozesse in Datenökosystemen bereitstellt. Hierzu sollen die in DEDL beschriebenen Abläufe, etwa Datenanfragen, Datenbereitstellungen und Verarbeitungs- oder Transformationsschritte, automatisch in Workflows überführt und in geeigneten Werkzeugen orchestriert werden, zum Beispiel in Node-RED, Kestra, Apache Airflow, Argo Workflows oder Camunda. Das konzipierte Framework soll anschließend prototypisch umgesetzt werden. Aufbauend darauf sollen Ausdrucksfähigkeit, Effizienz und Benutzerfreundlichkeit evaluiert sowie die Eignung des Frameworks durch die Durchführung exemplarischer Simulationsszenarien gezeigt werden.
Teil der prototypischen Umsetzung soll eine webbasierte grafische Benutzeroberfläche auf Basis von Python Flask und Angular oder Vue sein, über die DEDL-Modelle ausgewählt, Prozesskonfigurationen angepasst, Workflows gestartet und deren Ausführungsstatus beobachtet werden können. Das Framework soll modular aufgebaut sein, sodass insbesondere die Abbildung von DEDL auf Workflows, die verwendete Workflow-Engine und die grafische Benutzeroberfläche flexibel austauschbar sind.
Die Arbeitspakete umfassen:
- Untersuchung des aktuellen Stands der Technik im Bereich modellbasierter Beschreibung von Prozessen in Datenökosystemen, semantischer Technologien (DEDL, JSON-LD), Workflow- und Orchestrierungstechnologien sowie Simulation verteilter Systeme
- Analyse und Bewertung geeigneter Werkzeuge zur prozessbasierten Orchestrierung und Simulation von Datenökosystemen (z.B. Node-RED, Kestra, Apache Airflow, Argo Workflows, Camunda)
- Entwicklung eines modularen Frameworks basierend auf DEDL, einer Workflow- und/oder Orchestrierungsengine und einer grafischen Benutzeroberfläche zur automatischen Ableitung und Ausführung von Workflows aus DEDL-basierten Prozessbeschreibungen
- Prototypische Implementierung des entwickelten Frameworks mittels Python Flask sowie Angular oder Vue, einschließlich Integration einer geeigneten Workflow- und/oder Orchestrierungsengine
- Modellierung und Umsetzung mehrerer exemplarischer Prozesse in DEDL sowie Durchführung von Simulationsszenarien zur Demonstration der prozessbasierten Orchestrierung und Simulation von Datenökosystemen
- Evaluation des Prototyps hinsichtlich Ausdrucksfähigkeit der Prozessabbildung, Effizienz der Ausführung, Benutzerfreundlichkeit der Oberfläche sowie Eignung als virtuelles Testbed für Prozesse in Datenökosystemen
Betreuer: Klöpper
