Das Video ansehen
In unserer fortlaufenden Data Vault-Freitagsserie geht unser geschätzter CEO Michael Olschimke auf eine spannende Frage ein, die von einem engagierten Mitglied unseres Publikums gestellt wurde.
Nehmen wir an, das DWH wird aus vielen Quellsystemen gespeist, und eines davon (ein kleineres System mit dem Namen "XYZ") exportiert Kundendaten, die durch PERSONAL_ID identifiziert werden (kein anderer Identifikator verfügbar). Wir haben bereits HUB_CUSTOMER auf der Grundlage eines anderen Kundenidentifikators, und das Attribut PERSONAL_ID ist in SAT_CUSTOMER_PD gespeichert. Es gibt jedoch eine wichtige Sache in Bezug auf die Kundendaten: Es gibt Fälle, in denen mehrere Zeilen in HUB_CUSTOMER die gleiche PERSONAL_ID in besagtem Satellit haben (was bedeutet, dass einige der Kunden mehrfach in unseren Kernsystemen registriert wurden)."
In dieser aufschlussreichen Folge geht Michael auf das komplizierte Szenario der Integration von Kundendaten aus verschiedenen Quellen ein und betont die Herausforderungen, die sich aus dem Fehlen einer eindeutigen Kennung und dem Vorhandensein von doppelten Einträgen ergeben. Er stellt einen strategischen Ansatz vor, um dieses differenzierte Problem im Rahmen von Data Vault anzugehen, und gibt praktische Einblicke und Empfehlungen, um eine kohärente und genaue Darstellung von Kundeninformationen zu erreichen.
Diese Diskussion ist von unschätzbarem Wert für Datenexperten, die sich mit der Komplexität der Konsolidierung verschiedener Kundendatensätze mit unterschiedlichen Kennzeichnungsstrukturen auseinandersetzen.
Über den Vortragenden

Michael Olschimke
Michael hat mehr als 15 Jahre Erfahrung in der Informationstechnologie. In den letzten acht Jahren hat er sich auf Business Intelligence Themen wie OLAP, Dimensional Modelling und Data Mining spezialisiert. Fordern Sie ihn mit Ihren Fragen heraus!