Data mining: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Folto82 (discussione | contributi)
Folto82 (discussione | contributi)
Riga 4:
La [[statistica]] può essere definita altrimenti come "''estrazione di [[informazione]] utile da insiemi di dati''".
 
Il concetto di ''data mining'' è simile, ma con una sostanziale differenza: la statistica permette di elaborare informazioni generali riguardo ad una [[campione (statistica)|popolazione]] (es. percentuali di [[disoccupazione]], [[natalità|nascite]]), mentre il ''data mining ''viene utilizzato per cercare correlazioni tra più variabili relativamente ai singoli individui; ad esempio conoscendo il comportamento medio dei clienti di una compagnia telefonica cerco di prevedere quanto spenderà il cliente medio nell'immediato futuro.
 
In sostanza il data mining è "''l'analisi, da un punto di vista matematico, eseguita su [[database]] di grandi dimensioni''", preceduta tipicamente da altre fasi di preparazione dei dati come il [[data cleaning]]. Il termine ''data mining'' è diventato popolare nei tardi [[anni '90]] come versione abbreviata della definizione appena esposta.; Oggioggi il ''data mining'' (letteralmente: ''estrazione di dati''<ref>Il termine inglese ''mining'' si può tradurre con "scavo", "estrazione", come per le miniere.</ref>) ha una duplice valenza:
 
* estrazione, con tecniche analitiche all'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;