Text categorization: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
+interwiki
A
Riga 1:
{{A|in pratica non dice nulla a parte accennare il generico funzionamento dell'apprendimento supervisionato (valevole non solo per i testi)|informatica|gennaio 2010}}
{{S|informatica}}
{{W|informatica|ottobre 2007}}
{{F|argomento=informatica|data=novembre 2007}}
 
La '''Text Categorization'''('''TC'''), in ambito informatico, è l'attività, nota anche come ''text classification'', che si occupa di classificare testi in linguaggio naturale assegnando '''automaticamente''' collezioni di documenti ad una o più classi appartenenti ad un insieme detto "'''set di classi'''" predefinito. Per realizzare ciò è necessario ''addestrare'' il sistema di TC tramite autoapprendimento ad esempi (istanze) da cui generare un modello generale per la classificazione noto come '''classificatore'''.