Versione delle 17:13, 25 nov 2013 modifica Pil56-bot (discussione \| contributi) Bot 1 270 088 modifiche smistamento lavoro sporco ← Differenza precedente		Versione delle 17:19, 8 set 2014 modifica annulla Soujak (discussione \| contributi) Utenti autoverificati 1 795 modifiche m Precisazione: lingua vs. linguaggio Differenza successiva →
Riga 1: {{S\|applicazioni dell'informatica}} La '''Text Categorization''' o '''text classification''' (abbreviata come '''TC''') è, in ambito di [[intelligenza artificiale]], un'attività che si occupa di [[Classificazione\|classificare]] [[Documento digitale\|testi digitali]] espressi in una [[~~linguaggio~~lingua naturale]] assegnando in maniera automatica collezioni di documenti ad una o più classi appartenenti ad un insieme detto "set di classi" predefinito. Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato\|supervisionato]], dove è necessario addestrare il sistema tramite autoapprendimento ad esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato\|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori.

Text categorization: differenze tra le versioni