Text categorization: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente

Contenuto cancellato Contenuto aggiunto

VisualeWikitesto

Versione delle 00:41, 24 ott 2007 modifica 213.140.18.137 (discussione) Nessun oggetto della modifica ← Differenza precedente		Versione attuale delle 14:35, 25 lug 2024 modifica annulla CheckwBOT (discussione \| contributi) Bot 70 208 modifiche m Bot: inserimento portale (via JWB)
(21 versioni intermedie di 18 utenti non mostrate)
Riga 1: {{S\|applicazioni dell'informatica}} La '''Text Categorization'''('''TC'''), in ambito informatico, è l'attività, nota anche come ''text classification'', che si occupa di classificare testi in linguaggio naturale assegnando '''automaticamente''' collezioni di documenti ad una o più classi appartenenti ad un insieme detto "'''set di classi'''" predefinito. Per reazlizzare ciò è necessario ''addestrare'' il sistema di TC tramite autoapprendimento ad esempi (istanze) da cui generare un modello generale per la classificazione noto come '''classificatore'''. La '''classificazione del testo''' (in inglese ''text categorization'' o ''text classification'', abbreviata come TC) è, nell'[[intelligenza artificiale]], un'attività che si occupa di [[Classificazione\|classificare]] [[Documento digitale\|testi digitali]] espressi in una [[lingua naturale]] assegnando in maniera automatica collezioni di documenti a una o più classi appartenenti a un "insieme di classi" predefinito. Per realizzare ciò si utilizzano solitamente degli approcci di [[apprendimento automatico]] di tipo [[Apprendimento supervisionato\|supervisionato]], dove è necessario addestrare il sistema tramite auto-apprendimento per esempi (anche chiamate istanze) da cui generare un modello generale per la classificazione automatica. Esistono tuttavia altri approcci, come quello [[Apprendimento non supervisionato\|non supervisionato]] o semi-supervisionato, ma solitamente con risultati peggiori. ==Applicazioni== Tipica applicazione per questa tecnica è l'interpretazione di [[e-mail]], con l'obiettivo di segnalare possibili e-mail indesiderate ([[spam]]). ==Voci correlate== [[Apprendimento supervisionato]] [[Apprendimento non supervisionato]] {{Portale\|neuroscienze}} [[Categoria:Intelligenza artificiale]]