La '''Textclassificazione Categorizationdel testo''' (in inglese ''text categorisation'' o '''text classification''', (abbreviata come '''TC''') è, in ambito di nell'[[intelligenza artificiale]], un'attività che si occupa di [[Classificazione|classificare]] [[Documento digitale|testi digitali]] espressi in una [[lingua naturale]] assegnando in maniera automatica collezioni di documenti ada una o più classi appartenenti ada un "insieme detto "set di classi" predefinito.
Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato|supervisionato]], dove è necessario addestrare il sistema tramite autoapprendimentoauto-apprendimento adper esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori.
==Applicazioni==
Tipica applicazione per questa tecnica è l'interpretazione di [[e-mail]], andandocon al'obiettivo di segnalare possibili e-mail indesiderate ([[spam]]).