Training e test set: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Robykiwi (discussione | contributi)
Botcrux (discussione | contributi)
m Bot: Aggiungo template {{interprogetto}} (FAQ)
 
(21 versioni intermedie di 13 utenti non mostrate)
Riga 1:
Nell'[[apprendimento automatico]]<ref>T. Mitchell, ''Machine Learning''. McGraw-Hill, 1997.</ref> un '''training set''' (in italiano '''insieme di addestramento''' o '''insieme di stima''') è un insieme di ''esempi'' (spesso rappresentati come [[Vettore (matematica)|vettori]] di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico. Tali esempi vengono utilizzati per addestrare un modello predittivo [[apprendimento supervisionato|supervisionato]] (tipicamente un [[Classificatore (matematica)|classificatore]] o un [[regressore]]) capace di determinare il valore-obiettivo per nuovi esempi. Un modello addestrato può essere valutato su un nuovo insieme di esempi, il '''''test set''''' (in italiano '''insieme di verifica'''), non utilizzati in fase di addestramento.
{{cancellazione|arg=informatica}}
 
È comune dividere il ''training set'' in una parte dedicata all'addestramento dell'algoritmo, detta propriamente ''training set'' e una parte dedicata alla verifica della bontà dell'addestramento, detta '''''validation set''''' (in italiano '''insieme di validazione''').
 
In [[apprendimento automatico]] l'insieme di esempi utilizzati per valutare le prestazioni di un [[sistema]] prende il nome di '''test set'''. I test set sono utilizzati in diverse aree dell'[[informatica]] quali [[intelligenza artificiale]], [[apprendimento automatico]], [[programmazione genetica]], [[sistemi intelligenti]] e nell'area della [[statistica]].
 
==Motivazione==
L'apprendimento di un [[classificatore]]modello [[apprendimento supervisionato|supervisionato]] è(e.g. un classificatore, un regressore) tipicamenteviene effettuato asulla partirebase dadi un [[insieme di addestramento]]. (trainingI set).modelli Moltisupervisionati, approcciche allamirano supervisionea cercanocercare relazioni empiriche tra i datiesempi dell'insieme di addestramento, chepossono tendonodar avita generare ilal fenomeno del cosiddetto ''[[sovradattamento]]'' (overfitting)a tale insieme. Ciò significa che tendonoessi apotrebbero identificare relazioni che valgono nell'insieme di addestramento chema non valgono in generale, per l'intera popolazione. PerPertanto, per verificare se le relazioni empiriche apprese dalpossano classificatoreavere sonouna realmentevalidità generaligenerale, siil usamodello appuntoappreso va valutato su un test set, tipicamente disgiunto dall'insieme di addestramento.
 
== Note ==
L'apprendimento di un [[classificatore]] [[apprendimento supervisionato|supervisionato]] è tipicamente effettuato a partire da un [[insieme di addestramento]] (training set). Molti approcci alla supervisione cercano relazioni empiriche tra i dati dell'insieme di addestramento che tendono a generare il fenomeno del cosiddetto [[sovradattamento]] (overfitting). Ciò significa che tendono a identificare relazioni nell'insieme di addestramento che non valgono in generale. Per verificare se le relazioni empiriche apprese dal classificatore sono realmente generali, si usa appunto un test set, tipicamente disgiunto dall'insieme di addestramento.
<references/>
 
==Voci correlate==
* [[TrainingConvalida setincrociata]]
* [[Classificatore (matematica)]]
 
== Altri progetti ==
{{interprogetto}}
 
{{Apprendimento automatico}}
{{portale|informatica|statistica|matematica}}
 
 
[[Categoria:Intelligenza artificiale]]
[[Categoria:Apprendimento automatico]]
[[Categoria:Analisi dei dati]]
 
[[en:Test set]]