Show TOC Anfang des Inhaltsbereichs

Hintergrunddokumentation Die Architektur eines Data Warehouses  Dokument im Navigationsbaum lokalisieren

Es gibt eine Vielzahl von unterschiedlichen Data-Warehouse-Definitionen. Doch alle favorisieren eine Schichtenarchitektur des Data Warehouses.

Data Warehousing hat sich zu einer fortgeschrittenen und komplexen Technologie entwickelt. Vor einiger Zeit ging man noch davon aus, dass die Ablage der Daten in einem zur Auswertung optimierten Sternschema genügt. Dieser Ansatz wird jedoch den Anforderungen nach Konsistenz und Flexibilität auf die Dauer nicht gerecht. Inzwischen werden Data Warehouses daher in einer Schichtenarchitektur aufgebaut. Die verschiedenen Schichten halten die Daten in unterschiedlicher Granularität. Wir unterscheiden folgende Schichten:

      Peristent Staging Area

      Data Warehouse

      Architected Data Marts

      Operational Data Store

Diese Grafik wird im zugehörigen Text erklärt

Persistent Staging Area

Nach der Extraktion aus den Quellsystemen gelangen die Daten in die Eingangsschicht des Data Warehouses, die Persistent Staging Area (PSA). In dieser Schicht werden die Daten unverändert zum Quellsystem abgelegt. Der Weg der Daten von hier aus in die nächste Schicht dient qualitätssichernden Maßnahmen und den für eine einheitliche, integrierte Datensicht notwendigen Transformationen und Bereinigungen.

Data Warehouse

Das Ergebnis dieser ersten Transformationen und Bereinigungen wird in der nächsten Schicht, dem Data Warehouse, abgelegt. Diese Data-Warehouse-Schicht offeriert integrierte, granulare, historische, stabile Daten, die noch nicht für einen konkreten Anwendungszweck verändert wurden, d.h. sie sind applikationsneutral. Sie bietet damit die Grundlage, um konsistente Auswertungsstrukturen aufzubauen und flexibel auf neue Anforderungen zu reagieren.

Architected Data Marts

Aus der Data-Warehouse-Schicht werden die meist multidimensionalen Auswertungsstrukturen beliefert, die auch als Architected Data Marts bezeichnet werden. Diese Schicht entspricht den Anforderungen der Auswertung. Dabei ist Data Mart nicht notwendig mit summiert bzw. aggregiert gleichzusetzen; auch hier findet man hoch granulare Strukturen, die sich aber allein an den Anforderungen der Auswertung orientieren, wohingegen die granularen Daten der Data-Warehouse-Schicht applikationsneutral sind, um die Wiederverwendbarkeit zu garantieren.

Der Begriff "Architected“ bedeutet, dass es sich bei den Data Marts nicht im Insellösungen handelt, sondern um Lösungen, die auf einem durchgängig konsistenten Datenmodell basieren. Dies bedeuted, dass Stammdaten in Form von Shared oder Conformed Dimensions wiederverwendet werden.

Operational Data Store

Neben der strategischen Datenanalyse unterstützt ein Data Warehouse durch den Operational Data Store auch die operative Datenanalyse. Die Daten können in einer Operational-Data-Store-Schicht fortwährend oder in kurzen Zeitabständen fortgeschrieben und für die operative Analyse gelesen werden. Optional können die Daten von der Operational-Data-Store-Schicht zu einem definierten Zeitpunkt in die Data-Warehouse-Schicht weitergeleitet werden. Dabei gibt es einen Unterschied in der Granularität der abgelegten Daten: Während die Operational-Data-Store-Schicht alle Änderungen einer Bestellung enthält, ist in der Data-Warehouse-Schicht z.B. nur der Tagesabschlussstatus gespeichert.

Die Schichtenarchitektur des Data Warehouses ist ein konzeptioneller Ansatz. In der Praxis sind die Grenzen dieser Schichten oft fließend; einzelne Datenspeicher können dabei auch in zwei verschiedenen Schichten eine Rolle spielen. Die technische Implementierung ist stets organisationsspezifisch.

 

Ende des Inhaltsbereichs