Training e test set: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m fix spazio
fix wl
Riga 1:
Nell'[[apprendimento automatico]] un '''training set''' (o insieme di addestramento) è un insieme di dati che vengono utilizzati per addestrare un sistema [[apprendimento supervisionato|supervisionato]] (come una [[rete neurale]] o un [[Classificatore (matematica)|classificatore]] probabilistico). Il sistema addestrato viene quindi messo alla prova sul '''test set'''.<ref>T. Mitchell, ''Machine Learning''. McGraw-Hill, 1997.</ref>. Questi ultimi sono utilizzati in diverse aree dell'[[informatica]] quali [[intelligenza artificiale]], [[apprendimento automatico]], [[programmazione genetica]], [[sistema intelligente|sistemi intelligenti]] e nell'area della [[statistica]].
 
Il training set spesso consiste di un [[Vettore (matematica)|vettore]] di input a cui è associata una risposta o una determinata classificazione. Una volta eseguito, l'[[algoritmo]] apprende, in base alla risposta o alla classificazione, quali caratteristiche discriminano gli elementi appartenenti alle differenti categorie.
 
==Motivazione==
L'apprendimento di un [[Classificatore (matematica)|classificatore]] [[apprendimento supervisionato|supervisionato]] è tipicamente effettuato a partire da un [[insieme di addestramento]] (training set). Molti approcci alla supervisione cercano relazioni empiriche tra i dati dell'insieme di addestramento che tendono a generare il fenomeno del cosiddetto [[sovradattamento]] ([[overfitting]]). Ciò significa che tendono a identificare relazioni nell'insieme di addestramento che non valgono in generale. Per verificare se le relazioni empiriche apprese dal classificatore sono realmente generali, si valuta il classificatore su un test set, tipicamente disgiunto dall'insieme di addestramento.
 
== Note ==
Riga 11:
==Voci correlate==
* [[Convalida incrociata]]
* [[Classificatore (matematica)]]
 
{{Apprendimento automatico}}