Text categorization: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
CheckwBOT (discussione | contributi)
m Bot: inserimento portale (via JWB)
 
(23 versioni intermedie di 19 utenti non mostrate)
Riga 1:
{{S|applicazioni dell'informatica}}
La '''Text Categorization'''('''TC'''), in ambito informatico, è l'attività, nota anche come ''text classification'', che si occupa di classificare testi in linguaggio naturale assegnando '''automaticamente''' collezioni di documenti ad una o più classi appartenenti ad un insieme detto '''set di classi''' predefinito. Per reazlizzare ciò è necessario ''addestrare'' il sistema di TC tramite autoapprendimento a esempi (istanze) da cui generare un modello generale per la classificazione noto come '''classificatore'''.
La '''classificazione del testo''' (in inglese ''text categorization'' o ''text classification'', abbreviata come TC) è, nell'[[intelligenza artificiale]], un'attività che si occupa di [[Classificazione|classificare]] [[Documento digitale|testi digitali]] espressi in una [[lingua naturale]] assegnando in maniera automatica collezioni di documenti a una o più classi appartenenti a un "insieme di classi" predefinito.
 
Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato|supervisionato]], dove è necessario addestrare il sistema tramite auto-apprendimento per esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori.
 
==Applicazioni==
Tipica applicazione per questa tecnica è l'interpretazione di [[e-mail]], con l'obiettivo di segnalare possibili e-mail indesiderate ([[spam]]).
 
==Voci correlate==
*[[Apprendimento supervisionato]]
*[[Apprendimento non supervisionato]]
 
{{Portale|neuroscienze}}
 
[[Categoria:Intelligenza artificiale]]