Algoritmo ID3: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Aggiungi 1 libro per la Wikipedia:Verificabilità (20220710)) #IABot (v2.0.8.8) (GreenC bot
SparaPanini (discussione | contributi)
Funzionalità collegamenti suggeriti: 2 collegamenti inseriti.
 
(Una versione intermedia di un altro utente non mostrate)
Riga 1:
{{F|matematica|luglio 2017}}
'''ID3''' (''Iterative Dichotomiser 3'') è un [[algoritmo greedy]] per l'induzione di [[albero di decisione|alberi di decisione]].
 
== L'algoritmo ==
Riga 20:
 
=== Pseudocodice ===
Viene qui riportato lo pseudocodice<ref>{{Cita libro|autore=Tom M- Mitchell|titolo=Machine Learning|anno=1997|url=https://archive.org/details/machinelearning0000mitc|dataoriginale=1 marzo 1997|editore=McGraw-Hill Science|lingua=inglese|ISBN=0070428077}}</ref> dell'algoritmo ID3 per [[Funzione booleana|funzioni booleane]].
<pre>
Esempi:= istanze di addestramento.
Riga 51:
 
=== Proprietà e limiti ===
ID3 restituisce un solo albero di decisione, consistente con il [[dataset]] passato in input. Non è garantito che tale soluzione sia l'unica né che sia quella ottima, in quanto ID3 può convergere anche a minimi locali: per ovviare a questo problema si può fare uso della tecnica di [[backtracking]], che tuttavia non compare nella formulazione originale dell'algoritmo.
 
Per prevenire, invece, il problema dell'[[overfitting]], si dovrebbe arrestare l'algoritmo prima che tutti gli attributi siano processati, preferendo come soluzioni alberi di decisione più piccoli. Un approccio alternativo, utilizzato nell'algoritmo C4.5 (il successore di ID3), è la tecnica del post-pruning: l'algoritmo non viene arrestato durante l'esecuzione, permettendo quindi anche l'overfitting, e solo al suo termine vengono applicate le regole di pruning (potatura) per migliorare la capacità di generalizzazione.
Riga 59:
== Note ==
<references />
 
== Bibliografia ==
* {{cita pubblicazione|lingua=en|cognome=Quinlan|nome=John Ross|titolo=Semi-autonomous acquisition of pattern-based knowledge|anno=1980|url=https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=280e86067cad22814681434b559d7b1621fd5bd3|accesso=12 maggio 2023}}
 
== Voci correlate ==
* [[ClusteringAlbero di decisione]]
* [[Data cleaning]]
* [[Data warehouse]]
* [[Geodata warehouse]]
* [[Algoritmo]]
* [[Base di conoscenza]]
* [[Bonifica (informatica)]]
* [[Business intelligence]]
* [[Process mining]]
* [[Elaborazione dati]]
* [[Infografica]]
* [[Information retrieval]]
* [[Intelligenza competitiva]]
* [[Overfitting]]
 
{{Portale|matematica|statistica}}