Overfitting: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente

Contenuto cancellato Contenuto aggiunto

VisualeWikitesto

Versione delle 21:36, 25 ott 2018 modifica 62.211.26.241 (discussione) Nessun oggetto della modifica Etichette: Modifica da mobile Modifica da web per mobile ← Differenza precedente		Versione attuale delle 21:59, 11 giu 2024 modifica annulla 5.88.96.16 (discussione) fix
(13 versioni intermedie di 12 utenti non mostrate)
Riga 1: {{F\|~~Informatica~~statistica\|novembre 2016}} {{S\|statistica}} [[File:Overfitted Data.png\|thumb\|upright=1.4\|Una serie di dati all'incirca lineare (ma affetta da rumore), approssimabile sia da una [[funzione lineare]] sia da una [[interpolazione polinomiale]]. Nonostante quella polinomiale si adatti in modo perfetto ai dati, ci si aspetta che la versione lineare debba rappresentare una migliore generalizzazione: quindi, in un'estrapolazione al di fuori dei dati conosciuti la funzione lineare fornirebbe migliori [[Previsione\|predizioni]].]] [[File:Overfitting svg.svg\|thumb\|upright=1.4\|La curva blu mostra l'andamento dell'errore nel classificare i dati di ''training'', mentre la curva rossa mostra l'errore nel classificare i dati di ''test'' o ''validazione''. Una situazione in cui il secondo aumenta mentre il primo diminuisce è indice della possibile presenza di un caso di ''overfitting''.]]▼ In [[statistica]] e in [[informatica]], si parla di '''''overfitting''''' ~~(in~~o ~~[[lingua~~'''sovradattamento''' ~~italiana\|italiano]]:~~(oppure '''~~eccessivo~~ adattamento eccessivo''') quando un [[modello statistico]] molto complesso si adatta ai dati osservati (il [[Campionamento statistico\|campione]]) perché ha un numero eccessivo di parametri rispetto al numero di osservazioni.▼ ▲[[File:Overfitting svg.svg\|thumb\|upright=1.4\|La curva blu mostra l'andamento dell'errore nel classificare i dati di ''training'', mentre la curva rossa mostra l'errore nel classificare i dati di ''test'' o ''validazione''. Una situazione in cui il secondo aumenta mentre il primo diminuisce è indice della possibile presenza di un caso di overfitting.]] Un modello assurdo e sbagliato può adattarsi perfettamente se è abbastanza complesso rispetto alla quantità di dati disponibili. ▼ ▲In [[statistica]] e in [[informatica]], si parla di '''''overfitting''''' (in [[lingua italiana\|italiano]]: '''eccessivo adattamento''') quando un [[modello statistico]] molto complesso si adatta ai dati osservati (il [[Campionamento statistico\|campione]]) perché ha un numero eccessivo di parametri rispetto al numero di osservazioni. ~~Spesso si~~Si sostiene che l{{'}}''overfitting'' sia una violazione del principio del [[~~Rasoio~~rasoio di Occam]]~~. <Questa è una stronzata, toglietela>~~.▼ ▲Un modello assurdo e sbagliato può adattarsi perfettamente se è abbastanza complesso rispetto alla quantità di dati disponibili. ▲Spesso si sostiene che l'''overfitting'' sia una violazione del principio del [[Rasoio di Occam]]. <Questa è una stronzata, toglietela>. == Apprendimento automatico e ''data mining'' == Il concetto di ''overfitting'' è molto importante anche nell'[[apprendimento automatico]] e nel [[data mining]]. Di solito un [[algoritmo]] di apprendimento viene ''allenato'' usando un certo insieme di ~~esempi~~dati ~~(il~~conosciuti, detto ''[[training set]]'' ~~appunto), ad esempio situazioni tipo di cui è già noto il risultato che interessa prevedere (''output'')~~. SiUn ~~assume~~buon ~~che l'~~algoritmo di apprendimento ~~(il~~impara ~~''learner'')~~la ~~raggiungerà~~distribuzione ~~uno~~dei ~~stato in cui sarà in grado~~dati di ~~predire~~questo ~~gli~~insieme ~~output~~ma ~~per tutti gli altri esempi che ancora non ha visionato, cioè si assume che il modello di apprendimento sarà~~è in grado di ~~''generalizzare''<!--~~adattarsi ~~[[inductive~~bene ~~bias]]~~anche daa ~~tradurre~~dati ~~(limite strutturale? limite induttivo?) o lasciare in inglese? Vedi però [[bias~~nuovi (~~distorsione)]] -->. Tuttavia, soprattutto nei casi~~ in ~~cui l'apprendimento è stato effettuato troppo a lungo o dove c'era uno scarso numero di esempi di allenamento~~gergo, ilsi ~~modello potrebbe adattarsi a caratteristiche~~dice che ~~sono specifiche solo del training set, ma che non hanno riscontro nel resto dei casi; perciò, in presenza di~~ l'~~'overfitting'',~~algoritmo ~~le prestazioni (cioè la capacità di adattarsi/prevedere~~generalizza) ~~sui dati di allenamento aumenteranno, mentre le prestazioni sui dati non visionati saranno peggiori~~. Tuttavia, soprattutto nei casi in cui l'apprendimento è stato effettuato troppo a lungo o dove c'era uno scarso numero di esempi di allenamento, il modello potrebbe adattarsi a caratteristiche che sono specifiche solo del ''training set'', ma che non hanno riscontro nella distribuzione tipica del resto dei casi. Perciò il modello impara le peculiarità del training set e non riesce ad adattarsi a dati nuovi. Si ha quindi ''overfitting'' quando il miglioramento delle prestazioni del modello (cioè la capacità di adattarsi/prevedere) sui dati di allenamento non implica un miglioramento delle prestazioni sui dati nuovi. == Contromisure == Sia nella statistica sia ~~nel '~~nell'[[~~machine~~apprendimento ~~learning~~automatico]]'', per prevenire ed evitare l~~<nowiki>~~{{'~~</nowiki>~~}}''overfitting'' è necessario mettere in atto particolari accorgimenti tecnici, come la [[~~cross-validation~~convalida incrociata]] e l'[[Arresto anticipato (statistica)\|arresto anticipato]], che indicano quando un ulteriore allenamento non porterebbe a una migliore generalizzazione. ▼ Nel [[treatment learning]] si evita l~~<nowiki>'</nowiki>'~~'overfitting'' utilizzando il valore di supporto migliore e minimale.▼ ▲Sia nella statistica sia nel ''[[machine learning]]'', per prevenire ed evitare l<nowiki>'</nowiki>''overfitting'' è necessario mettere in atto particolari accorgimenti tecnici, come la [[cross-validation]] e l'[[Arresto anticipato (statistica)\|arresto anticipato]], che indicano quando un ulteriore allenamento non porterebbe a una migliore generalizzazione. == Altri progetti == ▲Nel [[treatment learning]] si evita l<nowiki>'</nowiki>''overfitting'' utilizzando il valore di supporto migliore e minimale. {{interprogetto}} {{Portale\|matematica\|informatica\|statistica}} [[Categoria:~~Computer~~Visione ~~vision~~artificiale]] [[Categoria:Elaborazione digitale delle immagini]] [[Categoria:Teoria dell'informazione]]