Data mining: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 21:
* le grandi accumulazioni di dati in formato elettronico,
* il data storage poco costoso, e
* i nuovi metodi e tecniche di analisi (machineapprendimento learningautomatico, riconoscimento di pattern).
 
Le tecniche di data mining sono fondate su specifici [[algoritmo|algoritmi]]. I pattern identificati possono essere, nella ricerca scientifica, il punto di partenza per ipotizzare e quindi verificare nuove relazioni di tipo causale fra fenomeni; in generale, possono servire in senso [[statistica|statistico]] per formulare previsioni su nuovi insiemi di dati.
 
Un concetto correlato al "data mining" è quello di [[machineapprendimento learningautomatico]] (''apprendimento automatico''); infatti, l'identificazione di pattern può paragonarsi all'apprendimento, da parte del sistema di data mining, di una relazione causale precedentemente ignota, cosa che trova applicazione in ambiti come quello degli [[algoritmo euristico|algoritmi euristici]] e della [[intelligenza artificiale]]. Tuttavia, occorre notare che il processo di data mining è sempre sottoposto al rischio di "rivelare" relazioni causali ''inesistenti''.
 
Una tecnica molto diffusa per il data mining è l'''apprendimento mediante classificazione''. Questo schema di apprendimento parte da un insieme ben definito di esempi di classificazione per casi noti, dai quali ci si aspetta di dedurre un modo per classificare esempi non noti. Tale approccio viene anche detto ''con supervisione'' (''supervised''), nel senso che lo schema di apprendimento opera sotto la supervisione fornita implicitamente dagli esempi di classificazione per i casi noti; tali esempi, per questo motivo, vengono anche detti ''training examples'', ovvero ''esempi per l’addestramento''. La conoscenza acquisita per apprendimento mediante classificazione può essere rappresentata con [[albero di decisione|alberi di decisione]].