Nell'[[apprendimento automatico]]<ref>T. Mitchell, ''Machine Learning''. McGraw-Hill, 1997.</ref> un '''training set''' (o insieme di addestramento) è un insieme di ''esempi'' (spesso rappresentati come [[Vettore (matematica)|vettori]] di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, i.e. una classe, o un valore numerico. Tali esempi vengono utilizzati per addestrare un modello predittivo [[apprendimento supervisionato|supervisionato]] (tipicamente un [[Classificatore (matematica)|classificatore]] o un [[regressore]]) capace di determinare il valore-obiettivo per nuovi esempi. Un modello addestrato può essere valutato su un nuovo insieme di esempi, il '''test set''', non utilizzati in fase di addestramento.
Nell'[[apprendimento automatico]] un '''training set''' (o insieme di addestramento) è un insieme di dati che vengono utilizzati per addestrare un sistema [[apprendimento supervisionato|supervisionato]] (come una [[rete neurale]] o un [[Classificatore (matematica)|classificatore]] probabilistico). Il sistema addestrato viene quindi messo alla prova sul '''test set'''.<ref>T. Mitchell, ''Machine Learning''. McGraw-Hill, 1997.</ref> Questi ultimi sono utilizzati in diverse aree dell'[[informatica]] quali [[intelligenza artificiale]], [[apprendimento automatico]], [[programmazione genetica]], [[sistema intelligente|sistemi intelligenti]] e nell'area della [[statistica]].
Il training set spesso consiste di un [[Vettore (matematica)|vettore]] di input a cui è associata una risposta o una determinata classificazione. Una volta eseguito, l'[[algoritmo]] apprende, in base alla risposta o alla classificazione, quali caratteristiche discriminano gli elementi appartenenti alle differenti categorie.
==Motivazione==
L'apprendimento di un [[Classificatore (matematica)|classificatore]]modello [[apprendimento supervisionato|supervisionato]] è(e.g. un classificatore, un regressore) tipicamenteviene effettuato asulla partirebase dadi un insieme di addestramento. (trainingI set).modelli Moltisupervisionati, approcciche allamirano supervisionea cercanocercare relazioni empiriche tra i datiesempi dell'insieme di addestramento, chepossono tendonodar avita generare ilal fenomeno del cosiddetto sovradattamento (''[[overfittingsovradattamento]])'' a tale insieme. Ciò significa che tendonoessi apotrebbero identificare relazioni che valgono nell'insieme di addestramento chema non valgono in generale, per l'intera popolazione. PerPertanto, per verificare se le relazioni empiriche apprese dalpossano classificatoreavere sonouna realmentevalidità generaligenerale, siil valutamodello ilappreso classificatoreva valutato su un test set, tipicamente disgiunto dall'insieme di addestramento.
== Note ==
|