ImageNet: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m Bot: numeri di pagina nei template citazione |
|||
(47 versioni intermedie di 12 utenti non mostrate) | |||
Riga 1:
{{S|
'''ImageNet''' è un'ampia [[
|titolo = ImageNet Large Scale Visual Recognition Challenge▼
|anno = 2015▼
|lingua = en▼
== Il dataset ==
Il database è stato presentato per la prima volta nel 2009 in Florida, nell'ambito della [[Conference on Computer Vision and Pattern Recognition|CVPR]] (''Conference on Computer Vision and Pattern Recognition''), da un gruppo di ricercatori afferenti al dipartimento di informatica dell'[[Università di Princeton]].<ref name="den2009"/><ref name="Gershgorn">{{cita web |url=https://qz.com/1034972/the-data-that-changed-the-direction-of-ai-research-and-possibly-the-world/|titolo=The data that transformed AI research—and possibly the world|autore=Dave Gershgorn|data=26
{{Cita conferenza|nome =Jia|cognome = Deng|nome2 = Wei|cognome2 = Dong|nome3 = Richard|cognome3 = Socher|nome4 = Li-Jia|cognome4 = Li|nome5 = Kai|cognome5 = Li|nome6=Li|cognome6 = Fei-Fei|titolo = ImageNet: A large-scale hierarchical image database|data = 18 agosto 2009|conferenza = 2009 IEEE Conference on Computer Vision and Pattern Recognition|organizzazione = IEEE|editore = IEEE|città = Miami|pp = 248-255|doi=10.1109/CVPR.2009.5206848|url = https://ieeexplore.ieee.org/document/5206848|lingua = en}}
</ref><ref name="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la presenza o l'assenza di categorie di oggetti, ad esempio "''ci sono tigri in questa immagine''" oppure "''non ci sono tigri in questa immagine''". Nelle annotazioni a livello di singolo oggetto, viene indicata la [[bounding box]] intorno alla parte visibile dello stesso.
== Importanza nel campo dell'apprendimento profondo ==
Il 30 settembre 2012, nell'ambito dell'annuale competizione ILSVRC, utilizzando una [[rete neurale convoluzionale]] denominata AlexNet<ref name=":0">{{Cita pubblicazione|cognome=Krizhevsky|nome=Alex|cognome2=Sutskever|nome2=Ilya|cognome3=Hinton|nome3=Geoffrey E.|accesso=24 maggio 2017|titolo=ImageNet classification with deep convolutional neural networks|url=https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf|rivista=[[Communications of the ACM]]|volume=60|numero=6|mese=Giugno|anno=2017|pp=84-90|doi=10.1145/3065386|issn=0001-0782|lingua=en}}</ref>, è stato ottenuto un tasso di errore del 15,3%, con un distacco maggiore di 10,8 punti percentuali sul secondo classificato. Tale risultato è stato reso possibile dall'impiego di [[Graphics processing unit|GPU]] nella fase di addestramento della rete<ref name=":0" />: l'impiego di GPU si è rivelato un ingrediente essenziale nella rivoluzione dell'[[apprendimento profondo]] (in inglese ''deep learning''). Secondo il ''[[The Economist]]'', a seguito di tale evento è nato un improvviso interesse verso l'intelligenza artificiale, non solo all'interno delle comunità di ricerca, ma nell'intero settore della tecnologia.<ref name=economist/><ref>{{cita news|titolo=Machines 'beat humans' for a growing number of tasks|url=https://www.ft.com/content/4cc048f6-d5f4-11e7-a303-9060cb1e5f44|accesso=3 febbraio 2018|pubblicazione=[[Financial Times]]|data=30 novembre 2017|lingua=en}}</ref><ref>{{Cita web|url=https://qz.com/1307091/the-inside-story-of-how-ai-got-good-enough-to-dominate-silicon-valley/|titolo=The inside story of how AI got good enough to dominate Silicon Valley|nome=Dave|cognome=Gershgorn|sito=Quartz|accesso=10 Dicembre 2018|lingua=en|data=18 giugno 2018|urlarchivio=https://web.archive.org/web/20190524005049/https://qz.com/1307091/the-inside-story-of-how-ai-got-good-enough-to-dominate-silicon-valley/}}</ref>
In occasione del concorso promosso da ImageNet nel 2015, AlexNet è stata superata da una rete neurale convoluzionale molto profonda proposta da Microsoft, costituita da oltre 100 livelli.<ref name="microsoft2015">{{cita pubblicazione|cognome=He|nome=Kaiming|cognome2=Zhang|nome2=Xiangyu|cognome3=Ren|nome3=Shaoqing|cognome4=Sun|nome4=Jian|titolo=Deep Residual Learning for Image Recognition|rivista=2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)|lingua=en|anno=2016|pp=770-778|url=http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf|urlarchivio=https://web.archive.org/web/20180712172513/http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf}}</ref>
[[File:ImageNet_error_rate_history_(just_systems).svg|thumb|Andamento storico del tasso di errore nelle diverse edizioni dell'ILSVRC dal 2011 al 2016: nel grafico sono riportati i migliori risultati ottenuti ogni anno da diverse squadre (fino ad un massimo di 10 per anno)]]
La competizione '''ILSVRC''' è nata seguendo le orme della PASCAL VOC, altra competizione sul riconoscimento di oggetti indetta nel 2005, dove tuttavia veniva preso in considerazione un dataset costituito da appena 20.000 immagini su 20 classi di oggetti.<ref name="ILJVRC-2015" /> A partire dal 2010 la ricercatrice Fei-Fei Li, tra i principali esponenti del progetto ImageNet, propose al team di PASCAL VOC di avviare una collaborazione: i team di ricerca avrebbero valutato le prestazioni dei loro algoritmi su un determinato insieme di dati, gareggiando su chi avesse ottenuto i migliori risultati in diverse gare basate sul riconoscimento di oggetti.<ref name="Gershgorn"/>
Da questa collaborazione è scaturita la competizione annuale nota oggi come ''ImageNet Large Scale Visual Recognition Competition'' (ILSVRC). Nelle diverse edizioni dell'ILSVRC viene impiegato un sottoinsieme di ImageNet, con sole 1000 categorie di immagini, incluse 90 delle 120 [[razze canine]] classificate nel dataset completo.<ref name="ILJVRC-2015" /> A partire dal 2010 si è verificato un significativo progresso nei risultati. Se nel 2011 un buon tasso di errore nella classificazione era intorno al 25%, nell'edizione della competizione del 2012, una [[rete neurale convoluzionale]] chiamata [[AlexNet]] ottenne un tasso di errore del 15,3%; nei due anni successivi il tasso di errore è sceso a qualche punto percentuale.<ref>{{cita news|cognome=Robbins|nome=Martin|titolo=Does an AI need to make love to Rembrandt's girlfriend to make art?|url=https://www.theguardian.com/science/2016/may/06/does-an-ai-need-to-make-love-to-rembrandts-girlfriend-to-make-art|accesso=22 giugno 2016|pubblicazione=[[The Guardian]]|data=6 maggio 2016|lingua=en|urlarchivio=https://web.archive.org/web/20190411053004/https://www.theguardian.com/science/2016/may/06/does-an-ai-need-to-make-love-to-rembrandts-girlfriend-to-make-art}}</ref> Tali miglioramenti hanno contribuito a destare un forte interesse verso l'intelligenza artificiliale a livello industriale.<ref name="economist" /> Nel 2015 un team di ricercatori della [[Microsoft]] ha proposto una [[Rete neurale convoluzionale|CNN]] capace di ottenere un tasso di errore talmente basso da superare le capacità umane (entro i limiti dei compiti previsti per la ILSVRC), stimate intorno al 4%.<ref name="microsoft2015" /><ref>{{Google books
|id=9pSrDgAAQBAJ
|titolo=Information Technology and the U.S. Workforce: Where Are We and Where Do We Go from Here?
|pagina =44
|isbn=978-0-309-45402-5
|editore=National Academies Press
|autore=National Academies of Sciences, Engineering, and Medicine
}}</ref><ref>{{cita news|cognome=Markoff|nome=John|titolo=A Learning Advance in Artificial Intelligence Rivals Human Abilities|url=https://www.nytimes.com/2015/12/11/science/an-advance-in-artificial-intelligence-rivals-human-vision-abilities.html|accesso=22 giugno 2016|pubblicazione=[[The New York Times]]|data=10 dicembre 2015|lingua=en}}</ref> Tuttavia, come ha puntualizzato Olga Russakovsky, tra le organizzatrici della competizione, i software si limitano ad identificare gli oggetti contenuti in un'immagine tra poche migliaia di categorie, mentre un essere umano ha la capacità di riconoscere un oggetto tra un numero notevolmente maggiore di categorie e può, a differenza dei software, contestualizzare un'immagine.<ref>{{cita news|cognome=Aron|nome=Jacob|titolo=Forget the Turing test – there are better ways of judging AI|url=https://www.newscientist.com/article/dn28206-forget-the-turing-test-there-are-better-ways-of-judging-ai/|accesso=22 giugno 2016|pubblicazione=[[New Scientist]]|data=21 settembre 2015|lingua=en|urlarchivio=https://web.archive.org/web/20190411052401/https://www.newscientist.com/article/dn28206-forget-the-turing-test-there-are-better-ways-of-judging-ai/}}</ref>
== Note ==▼
<references />
== Voci correlate ==
* [[Apprendimento profondo]]
* [[Object recognition]]
* [[Visione artificiale]]
* [[WordNet]]
▲== Note ==
== Collegamenti esterni ==
* {{Collegamenti esterni}}
{{Portale|informatica}}
[[Categoria:Intelligenza artificiale]]
|