Nell'apprendimento automatico di alberi di decisione, il criterio del twoing è una misura utilizzata nell'algoritmo CART [1] per selezionare in ogni nodo la migliore partizione degli oggetti contenuti. Il criterio di divisione in (partizione con esito del test positivo, risp. negativo), definito in base alla variabile predittiva o feature , è calcolato come segue

dove è la frazione di oggetti della i-esima classe nell'insieme . L'algoritmo CART seleziona le feature che massimizzano la regola di partizionamento del twoing sopra indicata.

Le principali differenze tra i due criteri di partizionamento possono essere riassunte come segue:[2]

  • Il twoing fornisce una suddivisione binaria per ogni nodo, mentre l'entropia può fornire partizioni multiple a seconda delle variabili. Per questo motivo, la complessità in termini di altezza dell'albero prodotto quando si utilizza il twoing nel processo di costruzione dell'albero di decisione è maggiore rispetto all'utilizzo dell'entropia.
  • Con il twoing si gestiscono sia valori categorici sia numerici, mentre con l'entropia si gestiscono solo valori categorici.

Alcune altre differenze fra l'utilizzo del twoing o dell'entropia come criteri di divisione sono: [3]

  • che il primo è in grado di gestire i valori anomali, mentre l'entropia è sensibile ai valori anomali
  • Inoltre, il twoing gestisce i dati mancanti meglio della misura di entropia.
  1. ^ Classification and regression trees, collana The Wadsworth statistics/probability series, Wadsworth & Brooks/Cole, 1984, ISBN 978-0-534-98053-5.
  2. ^ Samuel Aning e Małgorzata Przybyła-Kasperek, Comparative Study of Twoing and Entropy Criterion for Decision Tree Classification of Dispersed Data, in Procedia Computer Science, vol. 207, 2022, pp. 2434–2443, DOI:10.1016/j.procs.2022.09.301.
  3. ^ Sonia Singh, Likwan Tan e Manoj Giri, Comparative Study Id3, Cart And C4.5 Decision Tree Algorithm: A Survey, in International Journal of Advanced Information Science and Technology, DOI:10.15693/IJAIST/2014.V3I7.47-52.

Voci correlate

modifica