Text categorization: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Xqbot (discussione | contributi)
Nessun oggetto della modifica
Riga 1:
{{A|in pratica non dice nulla a parte accennare il generico funzionamento dell'apprendimento supervisionato (valevole non solo per i testi)|informatica|gennaio 2010}}
{{s|informatica}}
La '''Text Categorization''' o '''text classification''' (abbreviata come '''TC''') è, in ambito di [[intelligenza artificiale]], un'attività che si occupa di [[Classificazione|classificare]] testi in [[linguaggio naturale]] assegnando in maniera automatica collezioni di documenti ad una o più classi appartenenti ad un insieme detto "set di classi" predefinito.
 
LaPer '''Textrealizzare Categorization'''('''TC'''), in ambito informatico, è l'attività, nota anche come ''text classification'', checiò si occupautilizzano disolitamente classificaredegli testi in linguaggio naturale assegnando '''automaticamente''' collezioniapprocci di documenti[[apprendimento ad una o più classi appartenenti ad un insieme detto "'''setautomatico]] di classi'''"tipo predefinito.[[Apprendimento Persupervisionato|supervisionato]], realizzare ciòdove è necessario ''addestrare'' il sistema di TC tramite autoapprendimento ad esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione notoautomatica. Esistono tuttavia altri approcci, come '''classificatore'''quello [[Apprendimento non supervisionato|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori.
 
==Applicazioni==
Tipica applicazione per questa tecnica e' l'interpretazione di [[e-mail]], andando a segnalare possibili mail indesiderate ([[spam]]).
 
==Voci correlate==
*[[Apprendimento supervisionato]]
*[[Apprendimento non supervisionato]]
 
[[Categoria:Intelligenza artificiale]]
 
[[en:Document classification]]