Text categorization: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 1:
{{A|in pratica non dice nulla a parte accennare il generico funzionamento dell'apprendimento supervisionato (valevole non solo per i testi)|informatica|gennaio 2010}}
{{s|informatica}}
La '''Text Categorization''' o '''text classification''' (abbreviata come '''TC''') è, in ambito di [[intelligenza artificiale]], un'attività che si occupa di [[Classificazione|classificare]] [[Documento digitale|testi digitali]] in [[linguaggio naturale]] assegnando in maniera automatica collezioni di documenti ad una o più classi appartenenti ad un insieme detto "set di classi" predefinito.
Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato|supervisionato]], dove è necessario addestrare il sistema tramite autoapprendimento ad esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori.
|