Data mining: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica |
|||
Riga 6:
Il concetto di ''data mining'' è simile, ma con una sostanziale differenza: la statistica permette di elaborare informazioni generali riguardo ad una [[campione (statistica)|popolazione]] (es. percentuali di [[disoccupazione]], [[natalità|nascite]]), mentre il ''data mining ''viene utilizzato per cercare correlazioni tra più variabili relativamente ai singoli individui; ad esempio conoscendo il comportamento medio dei clienti di una compagnia telefonica cerco di prevedere quanto spenderà il cliente medio nell'immediato futuro.
In sostanza il data mining è "''l'analisi, da un punto di vista matematico, eseguita su [[database]] di grandi dimensioni''", preceduta tipicamente da altre fasi di preparazione/trasformazione/filtraggio dei dati come il [[data cleaning]]. Il termine ''data mining'' è diventato popolare nei tardi [[anni '90]] come versione abbreviata della definizione appena esposta; oggi il ''data mining'' ha una duplice valenza:
* estrazione, con tecniche analitiche all'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;
|