Training e test set

Nell'apprendimento automatico, l'insieme di esempi utilizzati per valutare le prestazioni di un sistema prende il nome di test set^[1] . I test set sono utilizzati in diverse aree dell'informatica quali intelligenza artificiale, apprendimento automatico, programmazione genetica, sistemi intelligenti e nell'area della statistica.

Motivazione

L'apprendimento di un classificatore supervisionato è tipicamente effettuato a partire da un insieme di addestramento (training set). Molti approcci alla supervisione cercano relazioni empiriche tra i dati dell'insieme di addestramento che tendono a generare il fenomeno del cosiddetto sovradattamento (overfitting). Ciò significa che tendono a identificare relazioni nell'insieme di addestramento che non valgono in generale. Per verificare se le relazioni empiriche apprese dal classificatore sono realmente generali, si valuta il classificatore su un test set, tipicamente disgiunto dall'insieme di addestramento.

Voci correlate

Bibliografia

^ T. Mitchell, Machine Learning. McGraw-Hill, 1997.

[1] T. Mitchell, Machine Learning. McGraw-Hill, 1997.

[1]