Word embedding: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
-S (falso abbozzo), modifica motivazione C, +apprendimento automatico, +portale |
m Bot: numeri di pagina nei template citazione e modifiche minori |
||
(8 versioni intermedie di 5 utenti non mostrate) | |||
Riga 1:
{{C|Verificare se esistano equivalenti italiani, attestati in letteratura, di termini come "Word embedding", "Thought vector" e "t-distributed stochastic neighbor embedding".|informatica|settembre 2018}}
Il '''word embedding''' (tradotto letteralmente ''[[immersione (matematica)|immersione]] di parole'') anche conosciuto come rappresentazione distribuita delle parole<ref>[http://delivery.acm.org/10.1145/1860000/1858721/p384-turian.pdf?ip=217.77.82.234&id=1858721&acc=OPEN&key=4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E6D218144511F3437&CFID=737338914&CFTOKEN=22047528&__acm__=1489149625_322ca081b3a225a45600ec89749f2a72 Turian, Joseph, Lev Ratinov, and Yoshua Bengio. "Word representations: a simple and general method for semi-supervised learning." Proceedings of the 48th annual meeting of the association for computational linguistics. Association for Computational Linguistics, 2010.]</ref> permette di memorizzare le informazioni sia semantiche che sintattiche delle parole partendo da un [[corpus]] non annotato<ref>
==Definizione==
Riga 6:
==Metodi==
I metodi per generare questa mappatura comprendono le [[rete neurale artificiale|reti neurali]],<ref>{{cita web |url=
Molte delle nuove tecniche di word embedding sono realizzati con l'architettura delle reti neurali invece che con le più tradizionali tecniche ad [[N-gramma|n-grammi]] e di [[apprendimento supervisionato]].
I ''thought vector'' (letteralmente ''vettori di pensiero'') sono un'estensione delle ''word embedding'' per intere frasi o anche documenti. Alcuni ricercatori sperano che questi possano aumentare la qualità della [[traduzione automatica]].<ref>{{cita web|titolo=Skip-thought vectors|url=
== Applicazioni ==
Gli algoritmi più popolari proposti per l'apprendimento del word embedding sono [[Word2vec]], sviluppato da [[Tomas Mikolov]]<ref>{{Cita pubblicazione |nome=Thomas |cognome=Mikolov |anno=2013 |titolo=Efficient estimation of word representations in vector space |rivista=Proceedings of NIPS |lingua=en |accesso=4 settembre 2018 |url=http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf}}</ref>, e [[GloVe (machine learning)|GloVe]], sviluppato dalla Stanford University<ref>{{cita web|url=http://nlp.stanford.edu/projects/glove/|titolo=GloVe|lingua=en}}</ref>. Sono anche disponibili alcuni software e [[Libreria (software)|librerie software]], come [[Gensim]]<ref>{{Cita web |url=http://radimrehurek.com/gensim/ |titolo=Gensim |lingua=en |accesso=6 marzo 2017 |urlarchivio=https://web.archive.org/web/20170103021308/http://radimrehurek.com/gensim/ |dataarchivio=3 gennaio 2017 |urlmorto=sì }}</ref> e [[Deeplearning4j]]<ref>{{Cita web |url=https://deeplearning4j.org/ |titolo=Deeplearning4j |sito=deeplearning4j.org |lingua=en |accesso=4 settembre 2018
==Note==
Riga 26:
{{apprendimento automatico}}
{{portale|informatica}}
[[Categoria:Elaborazione del linguaggio naturale]]
|