Data mining: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Sviluppi recenti: spelling errato della parola visualization
Descrizione: rivedo frasi iniziali
Riga 2:
 
== Descrizione ==
LaPer caratterizzare il ''data mining'' può essere utile considerare la [[statistica]], la quale può essere definita altrimenti come ''estrazione di [[informazione]] utile da insiemi di dati''.
 
Il concetto di ''data mining'' è simileanalogo, ma con una sostanziale differenza sostanziale: la statistica permette di elaborare informazioni generali riguardo ad una [[campione (statistica)|popolazione]] (es. percentuali di [[disoccupazione]], [[natalità|nascite]]), mentre il ''data mining ''viene utilizzato per cercare correlazioni tra più variabili relativamente ai singoli individui; ad esempio conoscendo il comportamento medio dei clienti di una compagnia telefonica cerco di prevedere quanto spenderà il cliente medio nell'immediato futuro.
 
In sostanza il data mining è ''l'analisi, da un punto di vista matematico, eseguita su [[banche dati]] di grandi dimensioni'', preceduta tipicamente da altre fasi di preparazione/trasformazione/filtraggio dei dati come il [[data cleaning]]. Il termine ''data mining'' è diventato popolare nei tardi anni novanta come versione abbreviata della definizione appena esposta; oggi il ''data mining'' ha una duplice valenza:
Riga 11:
* esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati al fine di scoprire ''[[riconoscimento di pattern|pattern]]'' (schemi o regolarità) significativi.
 
In entrambi i casi i concetti di informazione e di significato sono legati strettamente al dominio applicativo in cui si esegue data mining, in altre parole un dato può essere interessante o trascurabile a seconda del tipo di applicazione in cui si vuole operareopera.
 
Questo tipo di attività è cruciale in molti ambiti della [[ricerca scientifica]], ma anche in altri settori (per esempio in quello delle [[ricerca di mercato|ricerche di mercato]]). Nel mondo professionale è utilizzata per risolvere problematiche diverse tra loro, che vanno dalla gestione delle relazioni con i clienti ([[Customer relationship management|CRM]]), all'individuazione di comportamenti fraudolenti, fino all'ottimizzazione di [[sito web|siti web]].<ref>{{Cita web|titolo=Daniele Medri: Big Data & Business: An on-going revolution|url=http://www.statisticsviews.com/details/feature/5393251/Big-Data--Business-An-on-going-revolution.html|editore=[[Statistics Views]]|data=21 ottobre 2013}}</ref>
Riga 50:
Che cosa "è" ''data mining''?
* fare una ricerca in [[web|rete]] su una parola chiave e classificare i documenti trovati secondo un criterio [[Semantica|semantico]] (per esempio "corriere": nome di giornale, professione, ecc.);
* scoprire chiquali sono i clienti che hanno maggiore propensione di acquisto su certi prodotti o campagne pubblicitarie.
 
Che cosa "non è" ''data mining''?