

{"id":8238,"date":"2018-02-05T11:01:49","date_gmt":"2018-02-05T10:01:49","guid":{"rendered":"http:\/\/blog.scalefree.com\/?p=8238"},"modified":"2026-04-16T11:54:31","modified_gmt":"2026-04-16T09:54:31","slug":"hybride-architektur-in-data-vault-2-0","status":"publish","type":"post","link":"https:\/\/www.scalefree.com\/de\/blog\/architecture\/hybrid-architecture-in-data-vault-2-0\/","title":{"rendered":"Hybride Architektur in Data Vault 2.0"},"content":{"rendered":"<div id=\"fws_69f19d2f0f5c7\"  data-column-margin=\"default\" data-midnight=\"dark\"  class=\"wpb_row vc_row-fluid vc_row\"  style=\"padding-top: 0px; padding-bottom: 0px; \"><div class=\"row-bg-wrap\" data-bg-animation=\"none\" data-bg-animation-delay=\"\" data-bg-overlay=\"false\"><div class=\"inner-wrap row-bg-layer\" ><div class=\"row-bg viewport-desktop\"  style=\"\"><\/div><\/div><\/div><div class=\"row_col_wrap_12 col span_12 dark left\">\n\t<div  class=\"vc_col-sm-12 wpb_column column_container vc_column_container col no-extra-padding inherit_tablet inherit_phone\"  data-padding-pos=\"all\" data-has-bg-color=\"false\" data-bg-color=\"\" data-bg-opacity=\"1\" data-animation=\"\" data-delay=\"0\" >\n\t\t<div class=\"vc_column-inner\" >\n\t\t\t<div class=\"wpb_wrapper\">\n\t\t\t\t\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<h2>Hybride Architektur in Data Vault 2.0<\/h2>\n<p>Gesch\u00e4ftsanwender erwarten von ihren Data Warehouse-Systemen, dass sie immer mehr Daten laden und aufbereiten, was die Vielfalt, das Volumen und die Geschwindigkeit der Daten betrifft. Auch die Belastung typischer Data Warehouse-Umgebungen nimmt immer mehr zu, insbesondere wenn die urspr\u00fcngliche Version des Warehouses von den ersten Anwendern erfolgreich angenommen wurde. Skalierbarkeit hat also mehrere Dimensionen. Letzten Monat sprachen wir \u00fcber\u00a0<a href=\"http:\/\/blog.scalefree.com\/2017\/12\/04\/visual-data-vault-by-example-satellites-modeling-in-the-health-care-industry\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"http:\/\/blog.scalefree.com\/2017\/12\/04\/visual-data-vault-by-example-satellites-modeling-in-the-health-care-industry\/\">Satellites<\/a>, die eine wichtige Rolle bei der Skalierbarkeit spielen. Nun wird erl\u00e4utert, wie mit einer hybriden Architektur strukturierte und unstrukturierte Daten kombiniert werden k\u00f6nnen.<\/p>\n\t<\/div>\n<\/div>\n\n\n\n<div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 30px;\" class=\"divider\"><\/div><\/div>\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<div class=\"content-list-wrapper\"><p class=\"content-heading\">In diesem Artikel:<\/p><ul class=\"content-list\"><li><a href=\"#logical-data-vault-2-0-architecture\">Logische Data Vault 2.0-Architektur<\/a><li><a href=\"#hybrid-architecture\">Hybride Architektur<\/a><li><a href=\"#conclusion\">Fazit<\/a><\/ul><\/div>\n\t<\/div>\n<\/div>\n\n\n\n<div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 30px;\" class=\"divider\"><\/div><\/div>\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<h2><span style=\"font-weight: 400;\">Logische Data Vault 2.0-Architektur<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Wie in Abbildung 1 dargestellt, wird der <a href=\"https:\/\/www.scalefree.com\/data-vault-2-0\/#architecture\">Data Vault 2.0 Architektur<\/a> basiert auf drei Schichten: dem Staging-Bereich, in dem die Rohdaten aus den Quellsystemen gesammelt werden, der <a href=\"https:\/\/www.scalefree.com\/consultingterprise-data-warehouse\/\">Enterprise Data Warehouses<\/a> modelliert als <a href=\"https:\/\/www.scalefree.com\/data-vault-2-0\/#modeling\">Data Vault 2.0<\/a>&amp;nbspund die Informationsbereitstellungsschicht mit <a href=\"https:\/\/www.scalefree.com\/scalefree-newsletter\/about-information-marts-in-data-vault-2-0\/\">Information Marts<\/a> als Sternschemata und andere Strukturen. Die Architektur unterst\u00fctzt sowohl das Batch-Laden von Quellsystemen als auch das die Echtzeitbeladung aus dem Enterprise Service Bus (ESB) oder einer anderen serviceorientierten Architektur (SOA).<\/span><\/p>\n<p>Das folgende Diagramm zeigt die grundlegendste logische Architektur eines <a href=\"https:\/\/www.scalefree.com\/data-vault-2-0\/\">Data Vault 2.0<\/a> :<\/p>\n\t<\/div>\n<\/div>\n\n\n\n<div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 25px;\" class=\"divider\"><\/div><\/div><div class=\"img-with-aniamtion-wrap center\" data-max-width=\"100%\" data-max-width-mobile=\"default\" data-shadow=\"none\" data-animation=\"none\" >\n      <div class=\"inner\">\n        <div class=\"hover-wrap\"> \n          <div class=\"hover-wrap-inner\">\n            <img loading=\"lazy\" decoding=\"async\" class=\"img-with-animation Architecture skip-lazy nectar-lazy\" data-delay=\"0\" height=\"705\" width=\"1506\" data-animation=\"none\" data-nectar-img-src=\"https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture.png\" src=\"data:image\/svg+xml;charset=utf-8,%3Csvg%20xmlns%3D'http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg'%20viewBox%3D'0%200%201506%20705'%2F%3E\" alt=\"Data Vault 2.0 Architektur\" data-nectar-img-srcset=\"https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture.png 1506w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-300x140.png 300w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-1024x479.png 1024w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-768x360.png 768w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-320x150.png 320w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-640x300.png 640w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-360x169.png 360w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-720x337.png 720w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-1080x506.png 1080w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-800x375.png 800w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-1280x599.png 1280w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure1_Architecture-600x281.png 600w\" sizes=\"auto, (max-width: 1506px) 100vw, 1506px\" \/>\n          <\/div>\n        <\/div>\n      <\/div>\n    <\/div><div style=\"text-align: center;font-family:Droid Serif;font-weight:400;font-style:normal\" class=\"vc_custom_heading vc_do_custom_heading\" >Abbildung 1: Logische Data Vault 2.0-Architektur<\/div><div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 25px;\" class=\"divider\"><\/div><\/div>\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<p><span style=\"font-weight: 400;\">In diesem Fall werden die strukturierten Daten aus den Quellsystemen zun\u00e4chst in den Staging-Bereich geladen, um die operationale und Leistungsbelastung der operativen Quellsysteme zu verringern. Anschlie\u00dfend werden sie unver\u00e4ndert in den Raw Data Vault geladen, der die Enterprise Data Warehouse-Schicht darstellt. Nachdem die Daten in dieses Data Vault-Modell (mit Hubs, Links und Satelliten) geladen wurden, werden die Gesch\u00e4ftsregeln im Business Vault auf die Daten im Raw Data Vault angewendet. Sobald die Gesch\u00e4ftslogik angewendet wurde, werden sowohl Raw Data Vault als auch Business Vault zusammengef\u00fchrt und in das Gesch\u00e4ftsmodell f\u00fcr die Informationsbereitstellung in den Information Marts umstrukturiert. Der Gesch\u00e4ftsanwender verwendet Dashboard-Anwendungen (oder Reporting-Anwendungen) f\u00fcr den Zugriff auf die Informationen in den Information Marts. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die Architektur erm\u00f6glicht die Implementierung der Gesch\u00e4ftsregeln im Business Vault mit einer Mischung aus verschiedenen Technologien, wie z. B. SQL-basierter Virtualisierung (in der Regel mit SQL-Views) und externen Tools, wie z. B. Business Rule Management Systems (BRMS).<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Es ist jedoch auch m\u00f6glich, unstrukturierte NoSQL-Datenbanksysteme \u00fcber eine hybride Architektur zu integrieren. Aufgrund der Plattformunabh\u00e4ngigkeit von Data Vault 2.0 kann NoSQL f\u00fcr jede Data Warehouse-Schicht verwendet werden, einschlie\u00dflich des Staging-Bereiches, der Enterprise Data Warehouse-Schicht und der Informationsbereitstellung. Daher k\u00f6nnte die NoSQL-Datenbank als Staging Area verwendet werden und Daten in die relationale Data Vault-Schicht laden. Sie k\u00f6nnte aber auch in beide Richtungen mit der Data Vault-Schicht \u00fcber einen <a href=\"https:\/\/www.scalefree.com\/architecture\/hash-keys-in-the-data-vault\/\">gehashten Business Key<\/a>\u00a0integriert werden. In diesem Fall w\u00fcrde es sich um eine L\u00f6sung mit hybrider Architektur handeln und die Information Marts w\u00fcrden Daten aus beiden Umgebungen nutzen.<\/span><\/p>\n\t<\/div>\n<\/div>\n\n\n\n<div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 25px;\" class=\"divider\"><\/div><\/div>\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<h2><span style=\"font-weight: 400;\">Hybride Architektur<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Die Standardarchitektur f\u00fcr <a href=\"https:\/\/www.scalefree.com\/data-vault-2-0\/\">Data Vault 2.0<\/a> in Abbildung 1 konzentriert sich auf strukturierte Daten. Da es sich bei immer mehr Unternehmensdaten um semi- oder unstrukturierte Daten handelt, ist die empfohlene Best Practice f\u00fcr ein neues Unternehmens-Data Warehouse die Verwendung einer hybriden Architektur auf der Grundlage eines Hadoop-Clusters, wie in der n\u00e4chsten Abbildung dargestellt:<\/span><\/p>\n\t<\/div>\n<\/div>\n\n\n\n<div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 25px;\" class=\"divider\"><\/div><\/div><div class=\"img-with-aniamtion-wrap center\" data-max-width=\"100%\" data-max-width-mobile=\"default\" data-shadow=\"none\" data-animation=\"none\" >\n      <div class=\"inner\">\n        <div class=\"hover-wrap\"> \n          <div class=\"hover-wrap-inner\">\n            <img loading=\"lazy\" decoding=\"async\" class=\"img-with-animation Hybrid_architecture skip-lazy nectar-lazy\" data-delay=\"0\" height=\"991\" width=\"1600\" data-animation=\"none\" data-nectar-img-src=\"https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture.png\" src=\"data:image\/svg+xml;charset=utf-8,%3Csvg%20xmlns%3D'http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg'%20viewBox%3D'0%200%201600%20991'%2F%3E\" alt=\"Hybride Data Vault 2.0-Architektur\" data-nectar-img-srcset=\"https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture.png 1600w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-300x186.png 300w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-1024x634.png 1024w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-768x476.png 768w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-1536x951.png 1536w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-320x198.png 320w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-640x396.png 640w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-360x223.png 360w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-720x446.png 720w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-1080x669.png 1080w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-800x496.png 800w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-1280x793.png 1280w, https:\/\/www.scalefree.com\/wp-content\/uploads\/2018\/02\/Figure2_Hybrid_Architecture-600x372.png 600w\" sizes=\"auto, (max-width: 1600px) 100vw, 1600px\" \/>\n          <\/div>\n        <\/div>\n      <\/div>\n    <\/div><div style=\"text-align: center;font-family:Droid Serif;font-weight:400;font-style:normal\" class=\"vc_custom_heading vc_do_custom_heading\" >Abbildung 2: Hybride Data Vault 2.0-Architektur<\/div><div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 25px;\" class=\"divider\"><\/div><\/div>\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<p><span style=\"font-weight: 400;\">Bei dieser hybriden Modifikation der Architektur wird der relationale Staging-Bereich durch einen Hadoop Distributed File System (HDFS)-basierten Staging-Bereich ersetzt, der alle unstrukturierten und strukturierten Daten erfasst. W\u00e4hrend die Erfassung strukturierter Daten im HDFS auf den ersten Blick als Overhead erscheint, reduziert diese Strategie tats\u00e4chlich die Belastung des Quellsystems, indem sie sicherstellt, dass die Quelldaten immer extrahiert werden, unabh\u00e4ngig von \u00c4nderungen in der Datenstruktur. Die Daten werden dann mit Apache Drill, Hive External oder \u00e4hnlichen Technologien extrahiert. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Es ist auch m\u00f6glich, den Raw Data Vault und den Business Vault (die strukturierten Daten im Data Vault-Modell) intern auf <a href=\"https:\/\/www.scalefree.com\/scalefree-newsletter\/data-vault-2-0-with-hadoop-and-hive-spark\/\">Apache Hive&nbsp;<\/a> zu speichern.<\/span><\/p>\n\t<\/div>\n<\/div>\n\n\n\n<div class=\"divider-wrap\" data-alignment=\"default\"><div style=\"height: 25px;\" class=\"divider\"><\/div><\/div>\n<div class=\"wpb_text_column wpb_content_element\" >\n\t<div class=\"wpb_wrapper\">\n\t\t<h2>Fazit<\/h2>\n<p>Durch die Integration einer hybriden Architektur in Data Vault 2.0 k\u00f6nnen Unternehmen sowohl strukturierte als auch unstrukturierte Daten effektiv verwalten, indem sie Plattformen wie Hadoop nutzen. Dieser Ansatz verbessert die Skalierbarkeit und Flexibilit\u00e4t und erm\u00f6glicht eine effiziente Datenverarbeitung und -speicherung. Durch das Ersetzen traditioneller relationaler Staging-Bereiche durch HDFS-basierte Systeme k\u00f6nnen Unternehmen die Belastung der Quellsysteme reduzieren und eine nahtlose Datenextraktion sicherstellen.<\/p>\n\t<\/div>\n<\/div>\n\n\n\n\n\t\t\t<\/div> \n\t\t<\/div>\n\t<\/div> \n<\/div><\/div>","protected":false},"excerpt":{"rendered":"Hybrid Architecture in Data Vault 2.0 Business users expect their data warehouse systems to load and prepare more and more data, regarding the variety, volume, and velocity of data. Also,...","protected":false},"author":2,"featured_media":29697,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[100],"tags":[986,1335,1342,588,586,1339,480,1334,1337,1346,1345,1330,1331,1347,395,436,1208,328,396,1333,1343,1344,1336,1340,485,487,1338,1341,529,350],"class_list":{"0":"post-8238","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-architecture","8":"tag-apache-drill","9":"tag-batch-loading","10":"tag-business-rule-management-systems","11":"tag-business-rules","12":"tag-business-vault","13":"tag-dashboard-applications","14":"tag-data-warehouse","15":"tag-enterprise-data-warehouse-layer","16":"tag-enterprise-service-bus","17":"tag-hadoop-cluster","18":"tag-hashed-business-key","19":"tag-hdfs","20":"tag-hive-external","21":"tag-hive-internal","22":"tag-hubs","23":"tag-hybrid-architecture","24":"tag-information-delivery-layer","25":"tag-information-marts","26":"tag-links","27":"tag-logical-data-vault-2-0-architecture","28":"tag-nosql-database-systems","29":"tag-platform-independence","30":"tag-real-time-loading","31":"tag-reporting-applications","32":"tag-satellites","33":"tag-scalability","34":"tag-service-oriented-architecture","35":"tag-sql-based-virtualization","36":"tag-staging-area","37":"tag-star-schemas"},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/posts\/8238","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/comments?post=8238"}],"version-history":[{"count":0,"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/posts\/8238\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/media\/29697"}],"wp:attachment":[{"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/media?parent=8238"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/categories?post=8238"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.scalefree.com\/de\/wp-json\/wp\/v2\/tags?post=8238"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}