Extract, transform, load: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
fix +F |
|||
(63 versioni intermedie di 48 utenti non mostrate) | |||
Riga 1:
{{F|informatica|luglio 2025}}
In [[informatica]] '''Extract,
== Descrizione ==
I dati vengono estratti da sistemi sorgenti quali database transazionali ([[OLTP]]), comuni
Subiscono quindi un processo di trasformazione, che consiste ad esempio nel:
* Selezionare solo quelli che sono di interesse per il sistema
* [[Normalizzazione (informatica)|Normalizzare]] i dati (per esempio eliminando i duplicati)
* Tradurre dati codificati
* Derivare nuovi dati calcolati
* Eseguire accoppiamenti (''join'') tra dati recuperati da differenti [[Tabella (basi di dati)|tabelle]]
* Raggruppare i dati
Tale trasformazione ha lo scopo di consolidare i dati (cioè rendere omogenei dati provenienti da sorgenti diverse) e di fare in modo che siano più aderenti alla logica di business del sistema di analisi per cui viene sviluppato.
Riga 13 ⟶ 16:
Vengono infine memorizzati nelle tabelle del sistema di sintesi (load).
Occorre prestare particolare attenzione alla granularità delle informazioni da memorizzare nella
==
Occorre sottolineare come l'implementazione di estrattori necessiti di un'analisi di dettaglio dei sistemi di alimentazione. L'obiettivo che si deve porre un'azienda è che questo processo sia unico per tutti i sistemi di sintesi. Assolutamente da evitare è la stratificazione nel
Per capire meglio cosa può succedere è sufficiente pensare di dover determinare il numero dei clienti di un'azienda a una certa data. È necessario decidere, a fronte di un nominativo presente nell'anagrafica clienti, dopo quanto tempo di inattività non
Può
Lo sfruttamento di [[metadati]] (es. dizionario dati) potrà contribuire a generare l'integrazione non solo tecnica, ma anche culturale all'interno dell'azienda.
Avere questo approccio significa rendere indipendenti, ma integrati, i vari sottosistemi aziendali (fornitori, magazzino, clienti, contabilità generale, [[controllo di gestione]]) creando e gestendo l'univocità del dato e rendendo più semplice il controllo accentrato o la
Va notato come spesso per ETL si intende lo strumento con il quale è possibile sviluppare questa particolare architettura di alimentazione che di per
==
* [[Data integration]]
* [[Data cleaning]]
{{portale|informatica}}
[[Categoria:
|