Data Warehouse

Aus Operations-Research-Wiki
Wechseln zu: Navigation, Suche

Datenmanagement in Unternehmen

Datenmanagement ist von großer Bedeutung für Unternehmen, da Entscheidungen Kenntnis aktueller und historischer Daten verlangen (Bsp.: Umsätze, Artikel und Teile, Arbeitsplätze, Verbrauchs- und Zahlungsvorgänge sowie Verhaltensweisen von Kunden und Lieferanten). In der Datenverarbeitung wird im Allgemeinen zwischen operativen Systemen und Planungs- und Kontrollsystemen (z.B. Data-Warehouse-Systeme) unterschieden.

Die zentrale Aufgabe operativer Systeme ist es, Vorgängen bzw. Transaktionen, die geringe Datenmengen erzeugen (z.B. Buchungen), schnell zu verarbeiten. Da die zugrunde liegenden Systeme laufend aktualisiert werden (neue Sätze werden eingefügt, alte aktualisiert, korrigiert und gelöscht), spricht man auch von OLTP-Systemen (On-Line-Transactional-Processing). Solche OLTP-Systeme haben jedoch den Nachteil, dass die Datensätze immerwieder überschrieben werden. Vergangenheitsdaten stehen somit im Hinblick auf Entscheidungsunterstützung für Analysen nicht mehr zur Verfügung. Die Aufbereitung der gespeicherten Daten wird in vielen Fällen dadurch erschwert, dass in den Bereichen eines Unternehmens, z. B. Produktion und Materialwirtschaft, unterschiedliche operative Systeme und damit mehrere Datenbanken existieren, welche meist über Jahre gewachsen sind und spezifische betriebliche Anforderungen abdecken. OLTP-Systeme können somit viele Anforderungen, z. B. an eine schnelle, flexible, multidimensionale Betrachtung von Daten nur unzureichend erfüllen.

Diese Probleme in Bezug auf eine Entscheidungsunterstützung stellen den Ansatzpunkt für das Data-Warehouse-Konzept dar.

Data-Warehouse Konzept

Mit einem Data Warehouse wird das Ziel verfolgt, Daten aus verschiedenen OLTP-Systemen zu sammeln und als im Zeitablauf unveränderliche Größen für Analysen bereitzustellen. Moderne Data-Warehouse-Lösungen stellen Werkzeuge sowohl für die Extraktion der Daten aus den OLTP-Systemen als auch für die Analyse der in einem Data- Warehouse enthaltenen Daten zur Verfügung. Eine Besonderheit eines Data Warehouse ist die so genannte mehrdimensionale Datenhaltung auf Basis des OLAP-Konzeptes (On-Line-Analytical-Processing). Kernstück ist hierbei die Abbildung von Daten in Datenwürfeln, die sich aus

  • Kennzahlen und
  • Merkmalen zusammensetzen.

Während Kennzahlen, wie Umsatz oder Gewinn, betriebswirtschaftliche Zusammenhänge quantifizieren, dienen Merkmale dazu, diese nach unterschiedlichen Gesichtspunkten, z. B. einem Zeitraum, auszuwerten.

Star-Schema

Eine Möglichkeit, im Data-Warehouse oder in OLAP-Anwendungen Stammdaten miteinander zu verknüpfen, stellt das Star-Schema (oder auch: Sternschema) dar.

Diese Bezeichnung rührt daher, dass die Tabellen sternförmig angeordnet sind. Im Zentrum steht eine Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren. Die Faktentabelle verfügt über einen aus den Primärschlüsseln der beteiligten Dimensionstabellen zusammengesetzten Fremdschlüssel, sowie über informationstragende Kennzahlen (z.B. Umsätze, Gewinne, Zeiträume etc.). In den Dimensionstabellen sind die jeweiligen Stammdaten und deren Merkmalsausprägungen gespeichert.

Ziel des Sternschemas ist nicht die Normalisierung, sondern die abfragefreundliche Gestaltung des Data-Warehouses. Zwischen Faktentabelle und Dimensionstabellen besteht eine 1:n-Beziehung, wobei die Faktentabellen die m:n-Beziehungen zwischen den einzelnen Dimensionstabellen implizit in einer einzigen Tabelle integriert und somit zahlereiche Redundanzen enthält.

Diese Datenstruktur ermöglicht eine bessere Verarbeitungsgeschwindigkeit, wirkt sich aber negativ auf die Datenintegrität und den Bedarf an Speicherplatz aus.