NerKI - Semantischer Data Mesh für die Industrie 5.0: Integration von Domänenwissen und KI
Zusammenfassung
- Projektstart: 01.01.2026
- Projektende: 31.12.2028
- Laufzeit: 3 Jahre
- Projektträger: Bayerisches Staatsministerium für Wirtschaft, Landesentwicklung und Energie (StmWi)
Projektbeschreibung
Moderne Anlagen werden immer umfangreicher und komplexer, ermöglichen immer spezifischere Einstellungen und stellen Bediener vor große Herausforderungen. Diese müssen nämlich neben der Maschine oft einen noch viel größeren Kontext beachten (Produktionslinie, vor- und nachgelagerte Maschinen), um Teile nach den immer weiter steigenden Anforderungen fertigen zu können und sich von der Konkurrenz abzusetzen. Darüber hinaus steigen auch die Kommunikationsfähigkeiten der Maschinen stetig an; diese ermöglichen bereits jetzt vorausschauende Wartung, erweiterte Fehleranalysen und Performance-Insights.
Wissen über diese Abläufe, die Bedeutung bestimmter Signale und Handlungsdirektiven ist allerdings weiterhin stark heterogen und steckt an verschiedensten Stellen – meist in Handbüchern, Schnittstellenbeschreibungen und den Köpfen erfahrener Fachleute. Dieses Wissen für moderne Techniken wie KI nutzbar zu machen, ohne es dabei zu verfälschen oder zu vereinfachen, ist das zentrale Ziel des Projekts „Semantischer Data Mesh".
Was konkret entwickelt wird
Im ersten Schritt entsteht eine Pipeline, die maschinenbezogene Dokumente – Bedienungsanleitungen, Schnittstellenbeschreibungen, OPC-UA-Modelle – automatisiert analysiert und strukturierte Wissenseinheiten vorschlägt. Diese sogenannten Triplets beschreiben Beziehungen zwischen technischen Konzepten in der Form Subjekt → Prädikat → Objekt, etwa: „Laserachse steuert Vorschubgeschwindigkeit". Für die Extraktion wird ein neuer prädikatenbasierter Ansatz verfolgt. Dies unterscheidet sich von den in der Literatur vorherrschenden „Arc-based"-Methoden, bei denen Triplets durch manuelle Annotation vergeben werden – der gewählte Ansatz wird untersucht, weil er eine bessere Fehleranalyse bei falschen Aussagen der Pipeline verspricht.
Entscheidend ist die kontinuierliche Einbindung von Domänenexpertinnen und -experten: Diese können die Ergebnisse direkt am Text überprüfen. Die automatisch vorgeschlagenen Triplets werden bewertet, korrigiert oder verworfen. Jede Korrektur fließt als Trainingsbeispiel zurück in die Modelle – ein aktiver Lernkreislauf, der die Extraktionsqualität mit wachsendem Annotationsbestand kontinuierlich verbessert.
Validierung und industrieller Kontext
Die Tragfähigkeit des Ansatzes wird anhand einer Laserschneidanlage überprüft, die als reale Testumgebung dient. Ein Vorteil dieser Wahl liegt in der eingebetteten Prozesskette: Vor- und nachgelagerte Anlagen sowie der übergeordnete Ablauf lassen sich leicht in den Graphen einbeziehen, was die Frage nach dem Mehrwert kontextueller Einbettung direkt adressierbar macht.
Die konzeptionelle Grundlage des Projekts baut auf Vorarbeiten zur semantischen Beschreibung von Prozessdaten im Digitalen Zwilling auf – insbesondere auf Erfahrungen mit JSON-LD-basierter Datenkommunikation, die im Rahmen des gemeinsam mit Intel veröffentlichten Process Data Twin entstanden sind. Das Projekt denkt diesen Ansatz weiter: Statt semantische Strukturen manuell und mit tiefem ontologischem Vorwissen aufzubauen, sollen Unternehmen in die Lage versetzt werden, diese Grundlage (halb-)automatisiert aus vorhandener Dokumentation zu erzeugen.
Was das für Industriepartner bedeutet
Die entwickelten Werkzeuge adressieren ein verbreitetes praktisches Problem: Anlagenbetreiber verfügen über umfangreiches Erfahrungswissen und technische Dokumentation, die für KI-gestützte Anwendungen bislang kaum erschlossen ist. Der im Projekt entwickelte Ansatz zielt darauf ab, diesen Aufwand erheblich zu reduzieren – und die entstehende Wissensbasis dauerhaft mit dem Digitalen Zwilling einer Anlage zu verknüpfen.
Ansprechpartner
- Telefon: +49 (0)821 598 69315
E-Mail: marcus1.albrecht@uni-auni-a.de ()
- Telefon: +49 (0)821 598 69318
E-Mail: robin.huwa@uni-auni-a.de ()