Extract, transform, load: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Folto82 (discussione | contributi)
fix +F
 
(5 versioni intermedie di 4 utenti non mostrate)
Riga 1:
{{F|informatica|luglio 2025}}
In [[informatica]] '''Extract, Transform, Load''' ('''ETL''') è un'espressione in [[lingua inglese]] che si riferisce al processo di estrazione, trasformazione e caricamento dei dati in un sistema di sintesi ([[data warehouse]], [[data mart]].., [[big data]], ecc.).
 
==Descrizione==
 
== Descrizione ==
I dati vengono estratti da sistemi sorgenti quali database transazionali ([[OLTP]]), comuni file di testo o da altri sistemi informatici (ad esempio, sistemi [[Enterprise Resource Planning|ERP]] o [[Customer relationship management|CRM]]).
 
Subiscono quindi un processo di trasformazione, che consiste ad esempio nel:
* Selezionare solo quelli che sono di interesse per il sistema
* [[Normalizzazione (informatica)|Normalizzare]] i dati (per esempio eliminando i duplicati)
* Tradurre dati codificati
* Derivare nuovi dati calcolati
* Eseguire accoppiamenti (''join'') tra dati recuperati da differenti [[modelloTabella relazionale(basi di dati)|tabelle]]
* Raggruppare i dati
Tale trasformazione ha lo scopo di consolidare i dati (cioè rendere omogenei dati provenienti da sorgenti diverse) e di fare in modo che siano più aderenti alla logica di business del sistema di analisi per cui viene sviluppato.
Riga 30:
Avere questo approccio significa rendere indipendenti, ma integrati, i vari sottosistemi aziendali (fornitori, magazzino, clienti, contabilità generale, [[controllo di gestione]]) creando e gestendo l'univocità del dato e rendendo più semplice il controllo accentrato o la sostituzione di uno dei sistemi oggetto dell'integrazione.
 
Va notato come spesso per ETL si intende lo strumento con il quale è possibile sviluppare questa particolare architettura di alimentazione che di per sé potrebbe essere sviluppata anche con strumenti standard. Gli ETL tuttavia, essendo strumenti "dedicati", forniscono risultati tangibili in termini di documentazione e di velocità di sviluppo, per contro necessitano di un gruppo di lavoro specializzato in questo "linguaggio" e quindi, in caso di turn''[[Ricambio overdel personale|turnover]]'' o licenziamento, la necessità di gestire anticipatamente la presenza in azienda di opportuni back-up con i relativi costi.
 
== Voci correlate ==
* [[Data integration]]
* [[Data cleaning]]
 
{{portale|informatica}}