Non ti va di leggere? Prova ad ascoltare l'articolo in modalità audio 🎧
In un periodo in cui le decisioni delle aziende sono sempre più Data Driven, e quindi guidate dai dati, diventa fondamentale disporre di una o più fonti di informazioni utilizzabili per implementare strategie e processi di business in grado di massimizzare produttività e ROI (Return on investment). I Data Warehouse vengono incontro a questa necessità fornendo una base su cui operare con maggiore efficacia tramite strumenti di Business Intelligence. Analizziamo quindi questo particolare tipo di sistemi e cerchiamo di capire perché risultano vantaggiosi anche quando si devono gestire grandi quantità di dati.

Data Warehouse: cos’è

Nell’ambito del Data Management i Data Warehouse sono dei sistemi a supporto della Business Intelligence che permettono di effettuare procedure di analisi approfondite e di affrontare i processi di Decision Making basandosi sui dati. Le informazioni contenute in essi possono provenire da diverse sorgenti, spesso quindi i Data Warehouse presentano dati storici, dati derivanti dall’attività aziendale (o dati operativi), dati prelevati da fonti esterne, dati generati dal funzionamento delle applicazioni, file di registro e non solo, tutti concentrati in una collection centralizzata. In ogni caso tali sistemi non sono stati concepiti per l’elaborazione, non vanno quindi confusi con i database, ma per offrire risposte a delle interrogazioni, o query. Per questo motivo quando si parla di Data Warehouse ci si riferisce anche a delle banche dati accessibili in sola lettura. Dal punto di vista della composizione essi non si presentano come delle strutture monolitiche e includono alcuni elementi necessari al loro funzionamento, come per esempio:
  • un RDBMS (Relational Database Management System) con il quale gestire i processi di memorizzazione e interrogazione dei dati;
  • tool ELT (Extract, Load, Transform) con cui estrarre, caricare e trasformare i dati in preparazione delle analisi;
  • strumenti per il Data Mining che permettano e facilitino l’estrazione dei dati;
  • applicazioni per la Data Analysis;
  • tool per la produzione della reportistica;
  • piattaforme per la presentazione dei dati.
Con il progredire delle tecnologie di Intelligenza Artificiale, e la crescente disponibilità di Big Data, hanno acquisito particolare importanza anche gli algoritmi per il training di modelli di Machine Learning destinati all’analisi, così come gli strumenti in grado di fornire diverse rappresentazioni grafiche dei dati generate in base a criteri di analisi differenti. William H. Inmon, considerato il padre del Data Warehouse nonché uno dei massimi esperti mondiali in tema di Data Warehouse Design, sostiene che questi sistemi debbano essere nel contempo:
  • object oriented, cioè permettere di analizzare i dati in base ad argomenti specifici;
  • non volatili, quindi in grado di garantire la stabilità e la non modificabilità dei dati;
  • integrati, cioè pensati in modo da generare coerenza nonostante i diversi tipi di dati gestiti e le loro molteplici sorgenti;
  • variabili nel tempo, consentendo di individuare gli aggiornamenti che hanno coinvolto i dati durante la loro storia.
Appare quindi chiaro quanto i Data Warehouse possano essere utili sia per conservare i dati che per valorizzarli.

Esempi architettura di un Data Warehouse

Non esiste un’unica architettura per i Data Warehouse ma diverse varianti sviluppate in base alle necessità dell’azienda o di qualsiasi altra realtà desideri sfruttare questi particolari sistemi per la raccolta e l’analisi dei dati. È comunque possibile descrivere alcune architetture comunemente utilizzate:

Sandbox

Si tratta di un’architettura basata sulla creazione di aree private che garantiscono un elevato livello di protezione e sicurezza dei dati. Grazie ad esse le informazioni archiviate possono essere esplorate con maggiore velocità perché non viene a mancare l’obbligo di sottostare a vincoli di conformità con i protocolli del Data Warehouse o con le sue regole formali.

Architettura semplice 

A differenza di quanto accade con la Sandbox essa prevede un unico repository centrale nel quale confluiscono tutti i dati, indipendentemente dal loro tipo (dati grezzi, metadati, riepiloghi..) e dalla loro fonte. L’accesso è inoltre garantito a tutti gli utenti che, tra i vari scopi, possono utilizzare i dati per Data Mining, analisi e creazione dei report.

Architettura semplice con area di gestione temporanea 

In questo caso i dati vengono archiviati tramite Data Warehouse soltanto dopo essere stati selezionati, eliminando le informazioni non rilevanti, e pre-elaborati. Da qui l’esigenza di definire un’area di gestione temporanea per la preparazione dei dati prima del loro inserimento nel sistema, in alternativa a quest’ultima è comunque possibile ripulire ed elaborare le informazioni in fase di programmazione.

Hub e spoke 

Un’architettura caratterizzata dalla presenza di un Data Mart, cioè un database strutturato contenente un sottoinsieme di dati riguardanti un determinato argomento. In genere un Data Mart è rappresentato dalla sezione di un Data Warehouse e viene utilizzato per esigenze specifiche, come per esempio la necessità di gestire i dati di una singola divisione aziendale (marketing, vendite, amministrazione..). Il Data Mart si pone come livello intermedio tra il repository e gli utilizzatori, quindi i dati confluiscono in esso solo quando pronti per essere utilizzati. Chiaramente ad un singolo sistema possono essere associati più Data Mart.

Come viene alimentato un Data Warehouse?

Da dove provengono i dati che vengono archiviati tramite i Data Warehouse? In linea di massima è possibile distinguere le fonti utilizzate tra sorgenti interne ed esterne. Prendendo come esempio la realtà di un’azienda strutturata, le sorgenti interne di dati sono per esempio le banche dati, i CMS (Content Management System) utilizzati per la gestione dei contenuti, gli ERP (Enterprise Resource Planning) a cui si fa riferimento per le funzioni aziendali e i processi di business, così come i CRM (Customer Relationship Management) per la gestione dei rapporti con la clientela. Nello stesso modo possono essere considerati dati interni anche i messaggi di posta elettronica e qualsiasi tipo di file venga prodotto durante l’operatività di un’organizzazione. Sono considerate invece sorgenti esterne di dati i servizi in outsourcing, come per esempio quelli erogati tramite le infrastrutture in Cloud, ma anche piattaforme di terze parti come i social network e i siti Web dei fornitori. Nella stessa categoria è possibile ricomprendere tutte le applicazioni esterne con cui l’azienda deve interagire per il proprio lavoro, si pensi ad esempio alle agenzie in attività finanziaria che tramite i Web services collegano i propri CMR a quelli dell’istituto di credito con cui operano.

Business Intelligence e Data Warehouse

I Data Warehouse possono avere un ruolo importante a supporto della Business Intelligence perché aiutano a prendere decisioni razionali basate sui dati, essi rappresentano infatti una fonte di informazioni storiche e operative che quando utilizzate per l’analisi permettono di individuare tendenze, anticipare i cambiamenti del mercato e adattare strategie, budget e investimenti sulla base di valutazione e previsioni accurate. Per valorizzare i dati resi disponibili dai Data Warehouse è necessario sviluppare capacità analitiche, anche affrontando un corso di formazione specifico come il Business Data Analysis Master di Talent Garden. Il master è stato concepito appositamente per acquisire competenze approfondite sul funzionamento dei business Data Driven. Dedicato a Sales Manager, Responsabili Marketing, Product Manager e Analisti con almeno 3 anni di esperienza lavorativa, si articola in quattro weekend di learning live session online e due weekend di lezioni in presenza nel Campus di Talent Garden Calabiana a Milano, degli appuntamenti durante i quali scoprire tutti gli aspetti dell’utilizzo dei dati nella definizione delle strategie aziendali

Conclusioni

I Data Warehouse sono sistemi che consentono di allocare dati tramite fonti differenti in modo da disporre di informazioni utili per il Decision Making. Esistono diverse strutture di Data Warehouse, ai professionisti del settore spetta quindi il compito di selezionare e gestire quelle più adatte alla propria organizzazione e al supporto per la Business Intelligence.
Articolo aggiornato il: 22 agosto 2023
Talent Garden
Scritto da
Talent Garden, Digital Skills Academy

Continua a leggere

Cosa fa un Data Engineer, come diventarlo e quanto guadagna

Per definire la figura professionale del Data Engineer è utile fare riferimento ai Big Data, cioè alla quantità di ...

Cos’è il Data Scraping e le sue applicazioni per l’Analisi Dati

Il Data Scraping è un argomento particolarmente vasto che riguarda diversi contesti, dall’ottimizzazione dei contenuti ...

Big Data: cosa sono, come utilizzarli ed esempi applicativi

Sapevi che i Big Data costituiscono un'enorme ricchezza per le aziende? La loro analisi, in relazione con altri set di ...

Marketing data analytics: tecniche e visualizzazioni efficaci

I marketer di tutti i tipi, di aziende di tutte le dimensioni, si affidano al marketing data analytics per guidare il ...