Training e test set: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m fix spazio
Botcrux (discussione | contributi)
m Bot: Aggiungo template {{interprogetto}} (FAQ)
 
(3 versioni intermedie di 2 utenti non mostrate)
Riga 1:
Nell'[[apprendimento automatico]]<ref>T. Mitchell, ''Machine Learning''. McGraw-Hill, 1997.</ref> un '''training set''' (oin italiano '''insieme di addestramento''' o '''insieme di stima''') è un insieme di dati''esempi'' che(spesso rappresentati come [[Vettore (matematica)|vettori]] di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico. Tali esempi vengono utilizzati per addestrare un sistemamodello predittivo [[apprendimento supervisionato|supervisionato]] (cometipicamente unaun [[reteClassificatore neurale(matematica)|classificatore]] o un [[Classificatore (matematica)|classificatoreregressore]] probabilistico) capace di determinare il valore-obiettivo per nuovi esempi. IlUn sistemamodello addestrato vienepuò quindiessere messovalutato allasu provaun nuovo insieme di esempi, sulil '''''test set'''.<ref>T.'' Mitchell,(in italiano ''Machine'insieme Learningdi verifica''. McGraw-Hill'), 1997.</ref>. Questi ultimi sononon utilizzati in diversefase areedi dell'[[informatica]] quali [[intelligenza artificiale]], [[apprendimento automatico]], [[programmazioneaddestramento. genetica]], [[sistema intelligente|sistemi intelligenti]] e nell'area della [[statistica]].
 
È comune dividere il ''training set'' in una parte dedicata all'addestramento dell'algoritmo, detta propriamente ''training set'' e una parte dedicata alla verifica della bontà dell'addestramento, detta '''''validation set''''' (in italiano '''insieme di validazione''').
Il training set spesso consiste di un [[Vettore (matematica)|vettore]] di input a cui è associata una risposta o una determinata classificazione. Una volta eseguito, l'[[algoritmo]] apprende, in base alla risposta o alla classificazione, quali caratteristiche discriminano gli elementi appartenenti alle differenti categorie.
 
==Motivazione==
L'apprendimento di un [[Classificatore (matematica)|classificatore]]modello [[apprendimento supervisionato|supervisionato]] è(e.g. un classificatore, un regressore) tipicamenteviene effettuato asulla partirebase dadi un [[insieme di addestramento]]. (trainingI set).modelli Moltisupervisionati, approcciche allamirano supervisionea cercanocercare relazioni empiriche tra i datiesempi dell'insieme di addestramento, chepossono tendonodar avita generare ilal fenomeno del cosiddetto ''[[sovradattamento]]'' (overfitting)a tale insieme. Ciò significa che tendonoessi apotrebbero identificare relazioni che valgono nell'insieme di addestramento chema non valgono in generale, per l'intera popolazione. PerPertanto, per verificare se le relazioni empiriche apprese dalpossano classificatoreavere sonouna realmentevalidità generaligenerale, siil valutamodello ilappreso classificatoreva valutato su un test set, tipicamente disgiunto dall'insieme di addestramento.
 
== Note ==
Riga 11:
==Voci correlate==
* [[Convalida incrociata]]
* [[Classificatore (matematica)]]
 
== Altri progetti ==
{{interprogetto}}
 
{{Apprendimento automatico}}