Training e test set: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Botcrux (discussione | contributi)
m Bot: Aggiungo template {{interprogetto}} (FAQ)
 
(25 versioni intermedie di 13 utenti non mostrate)
Riga 1:
Nell'[[apprendimento automatico]]<ref>T. Mitchell, ''Machine Learning''. McGraw-Hill, 1997.</ref> un '''training set''' (in italiano '''insieme di addestramento''' o '''insieme di stima''') è un insieme di ''esempi'' (spesso rappresentati come [[Vettore (matematica)|vettori]] di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico. Tali esempi vengono utilizzati per addestrare un modello predittivo [[apprendimento supervisionato|supervisionato]] (tipicamente un [[Classificatore (matematica)|classificatore]] o un [[regressore]]) capace di determinare il valore-obiettivo per nuovi esempi. Un modello addestrato può essere valutato su un nuovo insieme di esempi, il '''''test set''''' (in italiano '''insieme di verifica'''), non utilizzati in fase di addestramento.
{{a|Men che minima|informatica|marzo 2009}}
 
È comune dividere il ''training set'' in una parte dedicata all'addestramento dell'algoritmo, detta propriamente ''training set'' e una parte dedicata alla verifica della bontà dell'addestramento, detta '''''validation set''''' (in italiano '''insieme di validazione''').
In [[apprendimento automatico]] l'insieme di esempi utilizzati per valutare le prestazioni di un [[sistema]] prende il nome di '''test set'''.
 
==Motivazione==
L'apprendimento di un modello [[apprendimento supervisionato|supervisionato]] (e.g. un classificatore, un regressore) viene effettuato sulla base di un insieme di addestramento. I modelli supervisionati, che mirano a cercare relazioni empiriche tra esempi dell'insieme di addestramento, possono dar vita al fenomeno del ''[[sovradattamento]]'' a tale insieme. Ciò significa che essi potrebbero identificare relazioni che valgono nell'insieme di addestramento ma non in generale, per l'intera popolazione. Pertanto, per verificare se le relazioni empiriche apprese possano avere una validità generale, il modello appreso va valutato su un test set disgiunto dall'insieme di addestramento.
 
== Note ==
<references/>
 
==Voci correlate==
* [[TrainingConvalida setincrociata]]
* [[Classificatore (matematica)]]
 
== Altri progetti ==
[[Categoria:Intelligenza artificiale]]
{{interprogetto}}
[[Categoria:Analisi dati]]
 
{{Apprendimento automatico}}
[[en:Test set]]
{{portale|informatica|statistica|matematica}}
 
 
[[Categoria:Intelligenza artificiale]]
[[Categoria:Apprendimento automatico]]
[[Categoria:Analisi dei dati]]