Extract, transform, load: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Embolo (discussione | contributi)
Nessun oggetto della modifica
Embolo (discussione | contributi)
Nessun oggetto della modifica
Riga 2:
Il termine '''ETL''' ('''E'''xtract, '''T'''ransform, '''L'''oad) si riferisce al processo di caricamento dei dati in un [[Data warehouse]].
 
I dati vengono estratti da sistemi sorgenti quali database transazionali ([[OLTP]]), comuni files di testo o da altri sistemi informatici (ad esempio, sistemi [[ERP]] o [[CRM]]).
 
Subiscono quindi un processo di trasformazione, che consiste ad esempio nel:
Riga 10:
* Eseguire join tra dati recuperati da differenti tabelle
* Raggruppare i dati
Tale trasformazione ha lo scopo di consolidare i dati (cioè rendere omogenei dati provenienti da sorgenti diverse) e di fare in modo che i dati siano più aderenti alla logica di business del data warehouse.
business del data warehouse.
 
Vengono infine memorizzati nelle tabelle del data warehouse (LOAD).
Riga 17 ⟶ 16:
Le informazioni vengono aggregate in modo da non avere un dettaglio eccessivo, ma mantenendo comunque una granularità che consenta di effettuare analisi precise sui dati.
 
Consolidare significa invece raccogliere informazioni su un singolo cliente.
 
[[de:ETL-Prozess]]