Don't you want to read? Try listening to the article in audio mode 🎧
In einer Zeit, in der Unternehmensentscheidungen immer stärker datengetrieben sind, werden Informationsquellen, die dazu genutzt werden können, Strategien und Geschäftsabläufe zur Maximierung von Produktivität und ROI (Return on investment) zu entwickeln, immer wichtiger. Die Data Warehouses kommen diesem Bedürfnis entgegen und bieten eine Grundlage, auf der man durch die Anwendung der Business Intelligence effizienter arbeiten kann. Analysieren wir also diese Art von Systemen und versuchen wir zu verstehen, warum sie auch dann von Vorteil sind, wenn man große Datenmengen verwalten muss.

Data Warehouse: Was ist das

Im Bereich des Data Management sind Data Warehouses Systeme zur Unterstützung der Business Intelligence, sie führen gründliche Analyseprozeduren durch und helfen so, Entscheidungsprozesse datenbasiert anzugehen. Die in ihnen enthaltenen Informationen können aus verschiedenen Quellen stammen. Häufig beinhalten Data Warehouses deshalb: historische Daten, Daten, die sich aus den Unternehmensaktivitäten ableiten (oder operative Daten), Daten aus externen Quellen, Daten, die aus den Funktionen der Applikationen stammen, Logdateien und andere mehr. Sie sind alle in einer zentralisierten Sammlung konzentriert. Diese Systeme sind jedoch nicht zur Datenverarbeitung entwickelt worden, deswegen darf man sie nicht mit den Datenbanken verwechseln. Ihr Zweck ist es, Antworten auf Fragen, auf eine Query, zu bieten. Aus diesem Grund bezieht man sich, wenn man von Data Warehouse spricht, auch auf Datenbanken, die nur zum Lesen zugänglich sind. Betrachtet man ihre Zusammensetzung, so treten sie nicht als monolithische Strukturen auf und beinhalten einige Elemente, die für ihr Funktionieren notwendig sind, wie zum Beispiel:
  • ein RDBMS (Relational Database Management System), das die Prozesse zur Speicherung und Abfrage der Daten verwaltet;
  • ein ELT Tool (Extract, Load, Transform), das die Daten zur Vorbereitung der Analyse extrahiert, lädt und umwandelt;
  • Instrumente zum Data Mining, die die Extrahierung der Daten ermöglichen und vereinfachen;
  • Applikationen zur Datenanalyse;
  • Tools zur Erstellung der Reports;
  • Plattformen zur Darstellung der Daten.
Mit den Fortschritten im Bereich der Künstlichen Intelligenz und der wachsenden Verfügbarkeit von Big Data, sind auch Trainingsalgorithmen für Machine-Learning-Modelle zu Analysezwecken besonders wichtig geworden, sowie Instrumente, die grafische Darstellungen der erzeugten Daten basierend auf verschiedenen Analysekriterien bereitstellen können. William H. Inmon, Vater des Data Warehouse und einer der bedeutendsten Experten im Bereich Data Warehouse Design, vertritt die Ansicht, dass diese Systeme gleichzeitig folgende Eigenschaften aufweisen müssen:
  • object oriented, d.h. sie müssen die Möglichkeit geben, Daten themenspezifisch zu analysieren;
  • nicht volatil, also die Stabilität und Nicht-Modifizierbarkeit der Daten garantieren;
  • integriert, d.h. so konzipiert sein, dass sie trotz der verschiedenen verwalteten Datenarten und deren vielfältiger Ursprünge Schlüssigkeit erzeugen;
  • mit der Zeit variabel, um die im Laufe der Zeit erfolgten Aktualisierungen der Daten aufzeigen zu können.
Es ist also offensichtlich, wie nützlich ein Data Warehouse sowohl zur Aufbewahrung von Daten als auch zu ihrer Erschließung sein kann.

Beispiele für die Struktur eines Data Warehouse

Es existiert keine einheitliche Bauweise für ein Data Warehouse, sondern verschiedene Varianten. Diese werden auf der Grundlage der Bedürfnisse des Unternehmens oder der anderen Organisationen entwickelt, die diese Systeme zur Datensammlung und -analyse nutzen wollen. Trotzdem ist es möglich, einige häufig verwendete Strukturen zu beschreiben:

Sandbox

Hierbei handelt es sich um eine Struktur, die auf der Erstellung persönlicher Arbeitsbereiche beruht, die einen hohen Grad an Datenschutz und -sicherheit gewährleistet. Dank dieser persönlichen Arbeitsbereiche können die archivierten Informationen schneller durchforscht werden, denn es besteht weiterhin die Verpflichtung, mit den Protokollen des Data Warehouse konform zu sein und seine formellen Regeln zu beachten.

Einfache Bauweise

Im Unterschied zur Sandbox sieht diese Bauweise nur ein einziges zentrales Repository vor, in dem alle Daten zusammenfließen, unabhängig von ihrer Art (Rohdaten, Metadaten, Zusammenfassungen…) und ihrer Quelle. Allen Nutzern und Nutzerinnen wird Zugang garantiert und sie können die Daten unter anderem zum Data Mining verwenden, zur Analyse und zur Erstellung von Reports.

Einfache Bauweise mit Bereich zur temporären Verwaltung 

In diesem Fall werden die Daten erst dann durch ein Data Warehouse archiviert, nachdem sie ausgewählt und verarbeitet worden sind, wobei nicht relevante Informationen gestrichen werden. Hieraus ergibt sich die Notwendigkeit, einen Bereich zur temporären Verwaltung zu erstellen, in dem die Daten vor ihrer Eingabe ins System bearbeitet werden. Als Alternative ist es jedoch auch möglich, die Informationen während der Programmierphase zu reinigen und zu verarbeiten.

Hub and spoke 

Diese Struktur ist durch die Anwesenheit eines Data Mart gekennzeichnet, d.h. einer strukturierten Datenbank, die eine Teilmenge von Daten zu einem bestimmten Thema enthält. Im Allgemeinen wird ein Data Mart von einem Teil des Data Warehouse verkörpert und für spezielle Bedürfnisse verwendet, wie z.B. für die Verwaltung der Daten einer einzelnen Unternehmensabteilung (Marketing, Verkauf, Verwaltung…). Der Data Mart befindet sich auf einer Stufe zwischen dem Repository und den AnwenderInnen, folglich kommen in ihm die Daten erst zusammen, wenn sie zur Nutzung bereit sind. Natürlich können einem einzelnen System mehrere Data Marts zugeordnet werden.

Wie wird ein Data Warehouse gespeist? 

Woher stammen die Daten, die durch ein Data Warehouse archiviert werden? Im Großen und Ganzen lassen sich die verwendeten Quellen in interne und externe unterscheiden. In einem strukturierten Unternehmen fungieren beispielsweise Datenbanken als interne Datenquellen, aber auch die zur Verwaltung der Inhalte verwendeten CMS (Content Management System), das ERP (Enterprise Resource Planning), auf das man sich für die Unternehmensfunktionen und Businessprozesse bezieht sowie das CRM (Customer Relationship Management) zur Handhabung der KundInnenbeziehungen erfüllen diese Funktion. Auf die gleiche Weise können auch E-Mails als interne Daten angesehen werden und jede andere Datei auch, die während des Betriebsablaufs einer Organisation erstellt wird. Dienste im Outsourcing sind hingegen externe Datenquellen, dazu gehören in-Cloud Dienste, aber auch Plattformen Dritter wie soziale Netzwerke und die Websites der Lieferanten. In diese Kategorie fallen auch all jene externen Applikationen, mit denen das Unternehmen interagiert. Man denke beispielsweise an Finanzdienstleister, die ihre CMR durch Webdienste an jene des Kreditinstituts binden, mit dem sie arbeiten.

Business Intelligence und Data Warehouse

Data Warehouses können eine wichtige Rolle bei der Unterstützung der Business Intelligence einnehmen, denn sie helfen dabei, rationale und auf Daten basierende Entscheidungen zu treffen. Sie stellen nämlich eine Quelle historischer und operativer Informationen dar, mit denen - wenn sie zur Analyse herangezogen werden - sich Trends erkennen lassen sowie Veränderungen des Marktes antizipiert und Strategien, Budgets und Investitionen aufgrund genauerer Bewertungen und Prognosen angepasst werden können. Um die von Data Warehouses zur Verfügung gestellten Daten aufs beste zu nutzen, muss man über analytische Fähigkeiten verfügen, auch durch die Teilnahme eines spezifischen Fortbildungskurses wie dem Business Data Analysis Master von Talent Garden. Dieser Master ist speziell dafür entwickelt worden, tiefer gehende Kenntnisse zur Funktionsweise von datengetriebenen Unternehmen und Geschäftsfeldern zu erlangen. Er wendet sich an Sales Manager und Managerinnen, Marketingverantwortliche, Product ManagerInnen und AnalystInnen mit mindestens 3 Jahren Berufserfahrung. Vorgesehen sind vier Wochenenden mit live Onlinelektionen sowie zwei Wochenenden mit Präsenzunterricht auf dem Campus Calabiana von Talent Garden in Mailand. Dabei lernt man alle Aspekte der Datennutzung zur Erstellung von Unternehmensstrategien kennen.

Abschließend

Data Warehouses sind Systeme, die Daten aus verschiedenen Quellen bereitstellen, damit EntscheidungsträgerInnen über nützliche Informationen verfügen. Es existieren verschiedene Bauweisen für Data Warehouses; den Tätigen in den jeweiligen Bereichen kommt deshalb die Aufgabe zu, jene auszuwählen und zu verwalten, die für ihre Organisation und zur Unterstützung der Business Intelligence am geeignetsten sind.
Artikel aktualisiert am: 09 August 2023
Talent Garden
Geschrieben von
Talent Garden, Digital Skills Academy

Lesen Sie weiter

Marketing Automation: So verändert sich die Automatisierung des Marketing

Die Kosten für die Neukundengewinnung steigen aufgrund des immer stärker werdenden Wettbewerbs immer höher. Deshalb ...

Was ist Data Scraping und wie wird es im Bereich der Datenanalyse angewendet

Data Scraping ist die Bezeichnung für ein Feld, das unterschiedliche Bereiche umfasst. Dazu gehören die Optimierung der ...

Alternative Suchmaschinen: Welche es gibt und warum man sie ausprobieren sollte

Wenn man von Suchmaschinen spricht, denkt jeder fast automatisch an Google. Die (fast) unangefochtene Favorisierung bei ...

Datenvisualisierung: die Tools, die Sie unbedingt kennen müssen

Die korrekte Darstellung der Daten, die so entwickelt wurden, dass sie verständlich und durchdacht sind, je nachdem, ...