Versione delle 17:19, 8 set 2014 modifica Soujak (discussione \| contributi) Utenti autoverificati 1 795 modifiche m Precisazione: lingua vs. linguaggio ← Differenza precedente		Versione delle 19:42, 1 mag 2020 modifica annulla 2001:861:3004:b580:cd18:51f5:e6cd:6c72 (discussione) Nessun oggetto della modifica Differenza successiva →
Riga 1: {{S\|applicazioni dell'informatica}} La '''~~Text~~classificazione ~~Categorization~~del testo''' (in inglese ''text categorisation'' o '''text classification''', (abbreviata come ~~'''~~TC~~'''~~) è, ~~in ambito di~~ nell'[[intelligenza artificiale]], un'attività che si occupa di [[Classificazione\|classificare]] [[Documento digitale\|testi digitali]] espressi in una [[lingua naturale]] assegnando in maniera automatica collezioni di documenti ada una o più classi appartenenti ada un "insieme ~~detto "set~~ di classi" predefinito. Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato\|supervisionato]], dove è necessario addestrare il sistema tramite ~~autoapprendimento~~auto-apprendimento adper esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato\|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori. ==Applicazioni== Tipica applicazione per questa tecnica è l'interpretazione di [[e-mail]], ~~andando~~con al'obiettivo di segnalare possibili e-mail indesiderate ([[spam]]). ==Voci correlate==

Text categorization: differenze tra le versioni