Master Data Hub (MDH) für DB Regio Bus

Im Rahmen des Master Data Hub für DB Regio Bus sollten Stammdaten optimiert und auf einer zentralen Plattform konsolidiert werden. Dazu mussten rund 1 Million Netzpunkte von 14.000 Linien in eine Plattform integriert und an 10 Systeme angebunden werden.

Master Data Hub (MDH) für DB Regio Bus

Im Rahmen des Master Data Hub für DB Regio Bus sollten Stammdaten optimiert und auf einer zentralen Plattform konsolidiert werden. Dazu mussten rund 1 Million Netzpunkte von 14.000 Linien in eine Plattform integriert und an 10 Systeme angebunden werden.

1.200
Nutzer
über 10
angebundene Systeme
80
Importprozesse
1 Mio.
Netzpunkte

Stammdaten effizient verwalten und bereitstellen

Das Ergebnis ist eine zentrale Plattform auf Basis von Pimcore, die als Single Source of Truth für alle relevanten Stammdaten von DB Regio Bus dient. In 80 Import-Prozessen wurden eine Million Netzpunkte an einheitliche Standards angepasst und das neue System integriert. Die Konsolidierung hat nicht nur die Effizienz gesteigert, sondern auch zu einer höheren Datenqualität und nahtlosen Integration der Bus-Systeme beigetragen. Die Implementierung erfüllt die Anforderungen an eine effektive, sichere und skalierbare Stammdatenverwaltung.

Heterogene Datenhaltung in den unterschiedlichsten Datenformaten

Heterogene Datenhaltung in den unterschiedlichsten Datenformaten

Der Anstoss für das Projekt war das Ziel, einen Data-Lake einzuführen, um eine Datenkonsolidierung zu erreichen. Die Herausforderung der DB Regio Bus bestand in der Komplexität und Vielfalt der Daten im öffentlichen Personennahverkehr. Diese umfassen diverse Datentypen wie Netzpunkte, Netzpunktmengen (zum Beispiel Haltestellen, Masten und Depots), Körperschaften, Tarife, Tarifsysteme, Konzessionen (einschließlich Vergabeverfahren, Vertragsdaten und Ausschreibungsdaten) und Linien. Die Schwierigkeit lag in der Heterogenität und dem Fehlen einheitlicher Prozesse zur Dateneingabe, Modifikation und Bereitstellung. Die Daten wurden in verschiedenen Systemen erfasst, wobei diverse Identifikationssysteme genutzt wurden. Dies führte zu Herausforderungen bei der Konsolidierung und Integration der Daten. Ziel des Projekts war es, die unterschiedlichen Datenklassen zentral pflegen und bereitstellen zu können.

Eine zentrale Masterdaten-Plattform

Eine zentrale Masterdaten-Plattform

Die optimale Stammdaten-Konsolidierung auf einer einzigen Daten-Plattform für viele DB Regio Bus-Daten als zentraler Datenlieferant erforderte eine sorgfältige Planung und Implementierung. Erst wurde eine Bedarfsanalyse durchgeführt, um alle kritischen Stammdaten und alle Datenquellen außerhalb der DB Regio Bus zu identifizieren. Es wurden Standards für die Struktur und Formatierung der Daten entwickelt, um eine einheitliche Darstellung und eine nahtlose Integration und Nutzung der Daten sicherzustellen. Zur Qualitätskontrolle und Bereinigungen der Daten wurden regelmäßige Maßnahmen implementiert. Pimcore wurde als zentrale Plattform etabliert, um die Daten zu konsolidieren und dient über standardisierte APIs als einzige Datenquelle für andere Systeme. Zum Schutz der Daten wurde ein eigenes User-Management eingeführt, um den Zugriff der Daten für Personen und Systeme zu beschränken. Für die ca. 1.200 Nutzer wurde eine umfassende Dokumentation erstellt und Schulungen durchgeführt.