Text categorization: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
CheckwBOT (discussione | contributi)
m Bot: inserimento portale (via JWB)
 
(21 versioni intermedie di 18 utenti non mostrate)
Riga 1:
{{S|applicazioni dell'informatica}}
La '''Text Categorization'''('''TC'''), in ambito informatico, è l'attività, nota anche come ''text classification'', che si occupa di classificare testi in linguaggio naturale assegnando '''automaticamente''' collezioni di documenti ad una o più classi appartenenti ad un insieme detto "'''set di classi'''" predefinito. Per reazlizzare ciò è necessario ''addestrare'' il sistema di TC tramite autoapprendimento ad esempi (istanze) da cui generare un modello generale per la classificazione noto come '''classificatore'''.
La '''classificazione del testo''' (in inglese ''text categorization'' o ''text classification'', abbreviata come TC) è, nell'[[intelligenza artificiale]], un'attività che si occupa di [[Classificazione|classificare]] [[Documento digitale|testi digitali]] espressi in una [[lingua naturale]] assegnando in maniera automatica collezioni di documenti a una o più classi appartenenti a un "insieme di classi" predefinito.
 
Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato|supervisionato]], dove è necessario addestrare il sistema tramite auto-apprendimento per esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori.
 
==Applicazioni==
Tipica applicazione per questa tecnica è l'interpretazione di [[e-mail]], con l'obiettivo di segnalare possibili e-mail indesiderate ([[spam]]).
 
==Voci correlate==
*[[Apprendimento supervisionato]]
*[[Apprendimento non supervisionato]]
 
{{Portale|neuroscienze}}
 
[[Categoria:Intelligenza artificiale]]