T-distributed stochastic neighbor embedding: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Atarubot (discussione | contributi)
template citazione; rinomina/fix nomi parametri; converto template cite xxx -> cita xxx; fix formato data
Sostituzione termine inglese con equivalente italiano
Riga 1:
{{titolo minuscolo}}
'''t-distributed stochastic neighbor embedding (t-SNE)''' è un algoritmo di [[riduzione della dimensionalità]] sviluppato da [[Geoffrey Hinton]] e Laurens van der Maaten, ampiamente utilizzato come strumento di [[machineapprendimento learningautomatico]] in molti ambiti di ricerca.<ref name="MaatenHinton"/><ref name="note1"/><ref name="note2"/><ref name="note3"/><ref name="note4"/><ref name="note5"/><ref name="note6"/> È una tecnica di [[riduzione della dimensionalità non lineare]] che si presta particolarmente all'embedding di dataset ad alta dimensionalità in uno spazio a due o tre dimensioni, nel quale possono essere visualizzati tramite un [[grafico di dispersione]]. L'algoritmo modella i punti in modo che oggetti vicini nello spazio originale risultino vicini nello spazio a dimensionalità ridotta, e oggetti lontani risultino lontani, cercando di preservare la struttura locale.
 
L'algoritmo si articola in due fasi principali. Nella prima fase viene costruita una [[distribuzione di probabilità]] che ad ogni coppia di punti nello spazio originale ad alta dimensionalità associa un valore di probabilità elevato se i due punti sono simili, basso se sono dissimili. Quindi viene definita una seconda distribuzione di probabilità analoga, nello spazio a dimensione ridotta. L'algoritmo quindi minimizza la [[divergenza di Kullback-Leibler]] delle le due distribuzioni tramite [[discesa del gradiente]], riorganizzando i punti nello spazio a dimensione ridotta.