BA/MA: Entwicklung eines modellbasierten Frameworks zur Instanziierung und Visualisierung technischer Komponenten von Datenökosystemen

Bachelor-/Masterarbeit:

In der heutigen digitalen Welt gibt es eine Vielzahl von Ansätzen wie das Internet of Things (IoT), Datentreuhänder und Datenräume, um Daten auszutauschen und zu verwalten. Alle Ansätze verbindet, dass komplexe Datenökosysteme entstehen. Bisher werden solche Datenökosysteme häufig ad hoc umgesetzt, ohne, dass ihre Architektur und Datenflüsse explizit und formal beschrieben werden, was die automatisierte Instanziierung, Analyse, Interoperabilität und Wiederverwendung erschwert. Dem wirkt die derzeit entwickelte Data Ecosystem Description Language (DEDL) entgegen, welche basierend auf Konzepten aus dem Semantic Web eine formelle Beschreibung von Datenökosystemen ermöglicht und so die Grundlage zur technischen Instanziierung und Visualisierung schafft.

Diese Arbeit zielt darauf ab, ein Framework zu konzipieren, das auf Basis einer vorhandenen DEDL-Beschreibung, zum Beispiel serialisiert als JSON for Linked Data (JSON-LD), die benötigten technischen Komponenten identifiziert, geeignete Containerkonfigurationen erzeugt, in einer geeigneten Umgebung (z.B. basierend auf Docker oder Kubernetes) startet und das resultierende Datenökosystem in einer Weboberfläche strukturell und bezüglich seiner Datenflüsse visualisiert. Das konzipierte Framework soll anschließend prototypisch umgesetzt werden. Aufbauend darauf sollen Effizienz und Benutzerfreundlichkeit evaluiert sowie die Eignung des Frameworks durch eine Validierung der generierten Systemarchitekturen gezeigt werden.

Teil der prototypischen Umsetzung soll eine webbasierte grafische Benutzeroberfläche auf Basis von Python Flask und Angular oder Vue sein, über die DEDL Modelle ausgewählt, Konfigurationen angepasst, die Instanziierung gestartet und die entstehenden Datenökosysteme interaktiv dargestellt werden können. Für die Visualisierung sollen insbesondere Frontend- und Graphbibliotheken wie React Flow oder Vue Flow als Node-Editoren sowie D3.js oder ELKjs für flexible Graphvisualisierungen und automatische Layouts betrachtet werden.

Das Framework soll modular aufgebaut sein, sodass insbesondere die Abbildung von DEDL auf technische Komponenten und die verwendeten Visualisierungskomponenten flexibel austauschbar sind. Zur Demonstration und Bewertung des Ansatzes sollen mindestens ein zentralisiertes und ein föderiertes Datenökosystem als Beispiele modelliert, instanziiert und visualisiert werden.

Die Arbeitspakete umfassen:

  • Untersuchung des aktuellen Stands der Technik im Bereich modellbasierter Systemarchitekturen für Datenökosysteme, semantischer Technologien (DEDL, JSON-LD), Containertechnologien sowie Visualisierung von Datenflüssen in verteilten Systemen
  • Analyse und Bewertung geeigneter Werkzeuge zur Instanziierung (z.B. Docker, Kubernetes) und Visualisierung (z.B. React Flow, Vue Flow, D3.js, ELKjs) von Datenökosystemen
  • Entwicklung eines modularen Frameworks basierend auf DEDL, Container-Orchestrierung und einer grafischen Benutzeroberfläche zur automatischen Instanziierung von Datenökosystemen und zur Visualisierung von Architektur und Datenflüssen
  • Prototypische Implementierung des entwickelten Frameworks mittels Python Flask sowie Angular oder Vue, einschließlich Integration einer geeigneten Container-Orchestrierung und Visualisierungsbibliothek
  • Modellierung und Instanziierung mindestens eines zentralisierten und eines föderierten Datenökosystems als Beispielszenarien zur Demonstration der Instanziierung und Visualisierung
  • Evaluation des Prototyps hinsichtlich Effizienz der automatischen Instanziierung, Benutzerfreundlichkeit der Oberfläche sowie Verständlichkeit und Nachvollziehbarkeit der Visualisierung von Architektur und Datenflüssen

Betreuer: Klöpper