Zum Hauptinhalt springen
Suche
0
Scalefree - Blog - Data Vault - Über Information Marts in Data Vault 2.0 - Teil 1

In der Data Vault 2.0 Architekturinformation marts werden zur Übermittlung von Informationen an die Endnutzer verwendet.

Vom Konzept her entspricht ein information mart der gleichen Definition wie ein data mart im alten data warehousing. Im alten data warehousing wird ein data mart jedoch dazu verwendet, nützliche Informationen und keine Rohdaten zu liefern. Aus diesem Grund wurde das data mart umbenannt in Data Vault 2.0 um dem Anwendungsfall besser gerecht zu werden.

 

Einführung in Information Marts

Aber die Definition von Information Marts hat mehr Facetten. In dem Buch "Building a Scalable Data Warehouse with Data Vault 2.0" stellen wir drei Arten von Marts vor:

  • Informationssammlungen: zur Bereitstellung von Informationen für Geschäftsanwender, in der Regel über Dashboards und Berichte.
  • Metrics Mart: in Verbindung mit einem Metrics Vault verwendet, der Folgendes erfasst EDW ignorieren Protokolldaten in einem Data Vault-Modell. Der Metrics Mart wird aus dem Metrics Vault abgeleitet, um die Metriken zur Analyse von Leistungsengpässen oder des Ressourcenverbrauchs von Power Usern und Data Scientists in Managed Self-Service BI Lösungen.
  • Fehler Mart: speichert diejenigen Datensätze, die beim Laden der Daten in das Unternehmen data warehouse typischerweise eine harte Regel nicht erfüllen.

Information Marts für Beratung

Neben diesen "klassischen" Information Marts setzen wir in unserer Beratungspraxis weitere ein:

  • Schnittstelle Mart: Dies ist mehr oder weniger ein information mart, allerdings werden die Informationen nicht an einen Menschen geliefert, z. B. über ein Dashboard oder einen Bericht. Stattdessen werden sie an eine nachfolgende Anwendung oder als Rückschreibung an das Quellsystem geliefert (z. B. bei Verwendung des Unternehmens data warehouse zur Datenbereinigung).
  • Quality Mart: Der Quality Mart ist wiederum ein information mart, aber anstatt schlechte Daten zu bereinigen, wird er dazu verwendet, schlechte Daten zu melden. Im Wesentlichen wird die Geschäftslogik, die zur Bereinigung schlechter Daten verwendet wird, auf den Kopf gestellt: Nur schlechte Daten (manchmal auch hässliche Daten) werden an den Endbenutzer, den Datenverwalter, geliefert. Dies geschieht häufig in Verbindung mit Datenbereinigungs-Frontends, in denen der Datenverwalter entweder Quelldaten korrigieren oder die Ausnahmen kommentieren und kennzeichnen kann.
  • Quelle Mart: wieder eine information mart, aber diesmal nicht mit einem der gängigen Schemata, wie Sternschemata, Schneeflockenschemata oder vollständig denormalisierten Schemata. Stattdessen verwendet das information mart das Datenmodell der Quellanwendung, ähnlich wie ein ODS-Schema (Operational Data Store). Der Source Mart ist jedoch keine Kopie der Daten, sondern ein virtualisiertes Modell über dem Data Vault-Modell, das die ursprünglichen Strukturen widerspiegelt. Es eignet sich hervorragend für Ad-hoc-Berichte und ist für viele Datenwissenschaftler und Power-User von großem Wert.

Damit ist unsere Liste der Information Marts abgeschlossen. Wir haben sie erfolgreich in Projekten für unsere Kunden eingesetzt, um die tatsächliche Anwendung der Information Marts in deren Unternehmen besser zu vermitteln.

Eine Antwort hinterlassen

Menü schließen