AlexNet: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m smistamento lavoro sporco e fix vari |
Recupero di 2 fonte/i e segnalazione di 0 link interrotto/i.) #IABot (v2.0.9.5 |
||
(4 versioni intermedie di 4 utenti non mostrate) | |||
Riga 1:
'''AlexNet''' è un modello di [[rete neurale convoluzionale]] (CNN) [[apprendimento profondo|profonda]] progettata dai [[dottorato di ricerca|dottorandi]] [[Alex Krizhevsky]] e [[Ilya Sutskever]], sotto la supervisione di [[Geoffrey Hinton]].<ref name =":1">{{Cita web|url=https://qz.com/1034972/the-data-that-changed-the-direction-of-ai-research-and-possibly-the-world/|titolo=The data that transformed AI research—and possibly the world|nome=Dave|cognome=Gershgorn|sito=Quartz|data=26 luglio 2017 }}</ref><ref name=":0">{{Cita pubblicazione|cognome1=Krizhevsky|nome1=Alex|cognome2=Sutskever|nome2=Ilya|cognome3=Hinton|nome3=Geoffrey E.|data=24 maggio 2017|titolo=ImageNet classification with deep convolutional neural networks|url=https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf|rivista=Communications of the ACM|volume=60|numero=6|pp=
▲'''AlexNet''' è un modello di [[rete neurale convoluzionale]] (CNN) [[apprendimento profondo|profonda]] progettata dai [[dottorato di ricerca|dottorandi]] [[Alex Krizhevsky]] e [[Ilya Sutskever]], sotto la supervisione di [[Geoffrey Hinton]].<ref name =":1">{{Cita web|url=https://qz.com/1034972/the-data-that-changed-the-direction-of-ai-research-and-possibly-the-world/|titolo=The data that transformed AI research—and possibly the world|nome=Dave|cognome=Gershgorn|sito=Quartz|data=26 luglio 2017 }}</ref><ref name=":0">{{Cita pubblicazione|cognome1=Krizhevsky|nome1=Alex|cognome2=Sutskever|nome2=Ilya|cognome3=Hinton|nome3=Geoffrey E.|data=24 maggio 2017|titolo=ImageNet classification with deep convolutional neural networks|url=https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf|rivista=Communications of the ACM|volume=60|numero=6|pp=84–90|doi=10.1145/3065386|issn=0001-0782}}</ref>
AlexNet rappresentò un significativo avanzamento nel riconoscimento automatico delle immagini. Nella [[ImageNet|ImageNet Large Scale Visual Recognition Challenge]] del 2012<ref name =":2">{{Cita web|url=https://image-net.org/challenges/LSVRC/2012/results.html|titolo=ImageNet Large Scale Visual Recognition Competition 2012 (ILSVRC2012)|sito=image-net.org}}</ref> AlexNet ottenne un errore top-5 del 15.3%, oltre 10.8 punti percentuali in meno del secondo classificato. La profondità del modello risultò essenziale per la qualità dei risultati, e il problema dell'elevato costo computazionale venne aggirato eseguendo l'addestramento del modello su due [[GPU]] in parallelo.<ref name=":0" />
Riga 9 ⟶ 7:
== Architettura ==
AlexNet ha otto livelli: i primi cinque livelli sono convoluzionali, alcuni facendo uso di max-pooling, mentre gli ultimi tre livelli sono completamente connessi. Ad eccezione dell'ultimo livello, il resto della rete era diviso in due copie, eseguite separatamente in due GPU.<ref name=":0" /> La rete usa la funzione di attivazione [[Rettificatore (reti neurali)|ReLU]], che dimostrò migliori risultati rispetto a funzioni tradizionali come la [[funzione sigmoidea]] e la [[tangente iperbolica]].<ref name=":0" />
La struttura è la seguente:
Riga 24 ⟶ 22:
== Precursori ==
Un'implementazione di CNN accelerata tramite GPU, pubblicata da K. Chellapilla et al. nel 2006, mostrò tempi di esecuzione circa quattro volte più veloci rispetto ad esecuzione su CPU.<ref>{{Cita libro|autore1=Kumar Chellapilla |titolo=Tenth International Workshop on Frontiers in Handwriting Recognition |autore2=Sidd Puri |autore3=Patrice Simard |data=2006 |editore=Suvisoft |curatore1=Guy
Di fatto, entrambi i modelli erano varianti dell'architettura introdotta da [[Yann LeCun]] et al. nel 1989,<ref name="LeCun Boser Denker Henderson 1989 pp. 541–551">{{Cita pubblicazione |cognome=LeCun |nome=Y. |cognome2=Boser |nome2=B. |cognome3=Denker |nome3=J. S. |cognome4=Henderson |nome4=D. |cognome5=Howard |nome5=R. E. |cognome6=Hubbard |nome6=W. |cognome7=Jackel |nome7=L. D. |titolo=Backpropagation Applied to Handwritten Zip Code Recognition |rivista=Neural Computation |editore=MIT Press - Journals |volume=1 |numero=4 |anno=1989 |issn=0899-7667 |url=http://yann.lecun.com/exdb/publis/pdf/lecun-89e.pdf |doi=10.1162/neco.1989.1.4.541 |pp=
== Note ==
<references />
{{Portale|informatica|statistica}}
|