Efficient Database for Synthetic Datasets for training and validating AI

Bachelor/Master Thesis: Efficient Database for Synthetic Datasets for training and validating AI

Data plays a key role in a lot of modern technologies, particularly deep learning based systems. The more diverse and large the data-sets are, the better can one estimate the reliability these systems. Typically, these data-sets are collected through existing real world-information, either past databases are pruned and annotated to be suitable inputs for an algorithm, or exhaustive experiments are conducted to collect said data. In either case, a lot of manual effort and resources are required to collect, classify and label the data.

Simulations offer a solution to this tedious process and can generate the data synthetically. This data must not replace real-world data, but simply serve to make it richer. For computer-vision problems, one can use realistically modelled physical systems, e.g. robots, vehicles, traffic, and generate annotated and labelled sensor data (e.g. camera output or 3D point-clouds). It has been well established, that even not-so-realistic simulations can prove very advantageous in diversifying existing real data sets and in transfer learning approaches (learning from one domain and applying in another).

Docking in a satellite on the ISS requires high resolution optical scans

To harness the true power of physically realistic simulations, one needs thousands of simulations (100,000 simulations in one our use-cases). The output data can potentially include high-resolution sensor output, annotations, metadata, and simulation attributes necessary for later analysis and possibly re-simulation. All of this must be stored in an efficient database: that provides fast writing, efficient storage, and fast fetching of information.

The goal of this thesis is to develop an efficient approach to store said simulation data. The activities involved are as follows:

  • Identify KPIs for comparing storage mechanisms for simulation data targeted for deep learning based systems
  • Compare various technologies that can offer a solution based on the identified KPIs
  • Integrate a database-framework with the multi-domain simulation framework VEROSIM
  • (Optional) Adapt and integrate the database with VEROSIM within the RWTH Compute Cluster
  • (Optional) Conduct research on commercial clouds e.g. Amazon Web Services, Google Cloud Platform and integration possibilities regarding the developed storage-framework

This thesis can be carried out in English or German.

Key Words: Databases, Parallel Simulation, AI-Data

Supervisor: Maqbool

Weitere Arbeiten

S3I_LoRa_Icon

Entwicklung und Umsetzung eines Konzepts der Authentifikation und Autorisierung im Ressourcen-beschränkten IoT

Bachelor-/Masterarbeit Mit der stetig zunehmenden Anzahl an die vernetzten Geräte,...
ifc2

Proaktiver Digitaler Zwilling des Walds

Ein proaktiver Digitaler Zwilling des Walds als Dreh- und Angelpunkt.
ifc2

Datenmodellierung von Wald und Holz 4.0-Dingen

Die Modellierung der "Dinge" ist ein wichtiger Aspekt in Wald...
S3I-Logo

Smart system communication between Digital Twins based on GAIA-X

In this thesis, the GAIA-X approach of "federated services" shall...
lbrInsertion

KI-basierte Simulation dynamischer Systeme

Masterarbeit: Realisierung und Bewertung von KI-basierte und KI-gestützten Verfahren zur Simulation...
msedge_SMRi2X6LlV

Entwicklung und Implementierung einer Anbindung für eine visuelle Programmierumgebung an eine 3D Simulation

Simulationen finden immer häufiger Anwendung in industriellen Entwicklungsprozessen. Da hierfür...
Grafik2

Analyse der Schnittstellen zur Integration agentenbasierter Simulation in traditionelle Methoden der Montageplanung

Klein- und mittelständische Unternehmen im produzierenden Gewerbe sind zumeist auf...
Grafik1

Evaluation der Modellierung und Anwendung agentenbasierter Simulation in der Montage

Klein- und mittelständische Unternehmen im produzierenden Gewerbe sind zumeist auf...
v2i

Integrating Network Simulation into a Multi-Domain Simulation Framework

Bachelor-/Masterarbeit: Integrating Network Simulation in a Multi-Domain Simulation Framework The...
v2i

Integration of Wireless Communication Simulation into a 3D Simulation Framework

Master Thesis: Integration of Wireless Communication Simulation in a 3D...
iSAT1_Specification1b

Automatisierte Generierung von Simulationsszenarien auf Basis formaler Modellspezifikationen

Vergleich und Bewertung von Qualitätskennzahlen aus verschiedenen Anwendungsbereichen
ifc2

Methoden zur automatisierten Verifikation und Validierung numerischer Simulationsmodelle

Methoden zur automatisierten Verifikation und Validierung numerischer Simulationsmodelle
ifc2

Vergleich und Bewertung von Qualitätskennzahlen aus verschiedenen Anwendungsbereichen

Vergleich und Bewertung von Qualitätskennzahlen aus verschiedenen Anwendungsbereichen
ifc2

Synchronisation von parallel simulierten Experimentierbaren Digitalen Zwillingen in Virtuellen Testbeds

Entwicklung eines räumlichen Partitionierungsschemas zur parallelen Simulation.
robotsOnTable

Evaluation von diskriminativen und generativen Modellen zur Bewegungsgenerierung in der kooperativen Manipulation

Die kooperative Manipulation verfolgt das Ziel, Robotersysteme dazu zu befähigen...
900px-Astronaut-EVA

Entwicklung eines aktiven Lageregelungssystems für einen 3U CubeSat mit Reaktionsrädern und Magnettorquern

Der finanzielle und technische Aufwand einer kommerziellen oder wissenschaftlichen Raumfahrtmission...
UnfelledTrees_2

Platzierung von Haltepunkten in einem Wegenetz

Automatisch generierte Wegenetze spielen eine wichtige Rolle bei der Simulation...
Schnittvolumen_2

Berechnung und Auflösung von Kontakten zwischen beliebigen Polyedern

Moderne "Game Engines" haben hinsichtlich der eingesetzten Methoden sowie der...
hololens

Simulationsgestützte AR-Applikationen mit der Microsoft HoloLens

Moderne "Game Engines" haben hinsichtlich der eingesetzten Methoden sowie der...

Entwurf und Realisierung eines Datenmanagement Systems für eine spezialgefertigte Anwendung eines bestehenden Simulationssystems.

Entwurf und Realisierung eines Datenmanagement Systems für eine spezialgefertigte Anwendung...
incidentRadiantPowerThumbnail

Simulations-basierte Bestimmung der auf erdnahen Satelliten eingehenden Albedo- und Infrarot-Strahlungsleistung

Simulations-basierte Bestimmung der auf erdnahen Satelliten eingehenden Albedo- und Infrarot-Strahlungsleistung.
U-3-4-Holzerntekostenrechnung-640x480

Game Engines in der Simulationstechnik

Moderne "Game Engines" haben hinsichtlich der eingesetzten Methoden sowie der...

Simulation kommunizierender Systeme

Die Nutzung von Simulationen im Engineering beginnt typischerweise mit der...
W-6-3-DesktopVirtuellesTestbed-640x480

3D-Simulationstechnik in Web-Architekturen

Die Nutzung von Simulationen ist aktuell im Wesentlichen Desktop-Applikationen vorbehalten....
ramdb

In-Memory Datenbankmanagementsysteme in der 3D-Simulation

In-Memory Datenbankmanagementsysteme für die verteilte Verwaltung und Bereitstellung von Modellen...
ifc2

STEP (ISO 10303) als Austauschformat für die 3D-Simulation

Für die 3D-Simulation stellt das STEP-Format ein wichtiges Mittel zum...
FESTO

Soft Robotics Simulation

Modellbildung und Simulation weicher Körper innerhalb einer vohandenen Starrkörper-VR-Simulation
BMW1600Gt

Modellbildung: Reifen

Integration eines geeigneten, erweiterbaren Reifenmodells in ein bestehendes Mehrkörpersimulations-Frameworks zur...

Objektrelationales Mapping in der 3D-Simulation

Nutzung von Techniken zur Abbildung von objekt-orientierten Strukturen auf relationale...