ImageNet: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Note: fix
FrescoBot (discussione | contributi)
m Bot: numeri di pagina nei template citazione
 
(2 versioni intermedie di 2 utenti non mostrate)
Riga 1:
{{S|Informaticabasi di dati}}
 
'''ImageNet''' è un'ampia [[base di dati]] di immagini, realizzata per l'utilizzo, in ambito di [[visione artificiale]], nel campo del [[Object recognition|riconoscimento di oggetti]]. Il dataset consiste in più di 14 milioni di immagini<ref>{{cita news|titolo=New computer vision challenge wants to teach robots to see in 3D|url=https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/|autore=Matt Reynolds|accesso=3 febbraio 2018||urlarchivio=https://web.archive.org/web/20181030033114/https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/|data=7 aprile 2017|pubblicazione=[[New Scientist]]|lingua=en}}</ref><ref name="nytimes 2012">{{cita news|autore=John Markoff|titolo=For Web Images, Creating New Technology to Seek and Find|url=https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html|accesso=3 febbraio 2018|pubblicazione=[[The New York Times]]|data=19 novembre 2012|urlarchivio=https://web.archive.org/web/20190216111547/https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html|lingua=en}}</ref> che sono state annotate manualmente con l'indicazione degli oggetti in esse rappresentati e della [[bounding box]] che li delimita.<ref>{{cita web|titolo=ImageNet Summary and Statistics|url=http://image-net.org/about-stats|editore=ImageNet|accesso=22 giugno 2016|urlarchivio=https://web.archive.org/web/20190320194841/http://image-net.org/about-stats|lingua=en}}</ref> Gli oggetti individuati sono stati classificati in più di 20.000 categorie<ref name="nytimes 2012"/>: alcune categorie di oggetti frequenti, come ad esempio "pallone" o "fragola", consistono di diverse centinaia di immagini.<ref name=economist>{{cita news|titolo=From not working to neural networking|url=https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not|accesso=3 febbraio 2018|pubblicazione=[[The Economist]]|data=25 giugno 2016|lingua=en|urlarchivio=https://web.archive.org/web/20161231203934/https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not}}</ref> La base di dati con le annotazioni relative ad immagini di terze parti è gratuitamente disponibile direttamente da ImageNet, anche se le immagini non sono parte del progetto (difatti viene fornito solo il [[URL|collegamento]] ad esse).<ref>{{cita web|titolo=ImageNet Overview|url=http://image-net.org/about-overview|sito=ImageNet|accesso=22 giugno 2016|lingua=en|urlarchivio=https://web.archive.org/web/20160704234358/http://image-net.org/about-overview}}</ref> A partire dal 2010, ogni anno viene indetta una competizione denominata ''ImageNet Large Scale Visual Recognition Challenge'' (ILSVRC): in tale occasione programmi software vengono fatti competere per classificare e rilevare correttamente oggetti e scene contenuti nelle immagini. Nell'ambito della competizione viene impiegata una lista ridotta di immagini con oggetti appartenenti a mille categorie non sovrapposte.<ref name=ILJVRC-2015>{{Cita pubblicazione|titolo = ImageNet Large Scale Visual Recognition Challenge|autore = Olga Russakovsky|autore2= Jia Deng|autore3= Hao Su|autore4= Jonathan Krause|autore5= Sanjeev Satheesh|autore6= Sean Ma|autore7= Zhiheng Huang|autore8= Andrej Karpathy|autore9= Aditya Khosla|autore10= Michael Bernstein|autore11= Alexander C. Berg|autore12=Li Fei-Fei|rivista = International Journal of Computer Vision|volume = 115|numero = 3|editore = [[Springer (azienda)|Springer]]|anno = 2015|mese = Dicembre|pp = 211-252|lingua = en|ISSN = 0920-5691|doi=10.1007/s11263-015-0816-y}}</ref>
|titolo = ImageNet Large Scale Visual Recognition Challenge
|autore = Olga Russakovsky
|autore2= Jia Deng
|autore3= Hao Su
|autore4= Jonathan Krause
|autore5= Sanjeev Satheesh
|autore6= Sean Ma
|autore7= Zhiheng Huang
|autore8= Andrej Karpathy
|autore9= Aditya Khosla
|autore10= Michael Bernstein
|autore11= Alexander C. Berg
|autore12=Li Fei-Fei
|rivista = International Journal of Computer Vision
|volume = 115
|numero = 3
|editore = [[Springer (azienda)|Springer]]
|anno = 2015
|mese = Dicembre
|pp = 211-252
|lingua = en
|ISSN = 0920-5691
|doi = 10.1007/s11263-015-0816-y
}}</ref>
 
== Il dataset ==
Il database è stato presentato per la prima volta nel 2009 in Florida, nell'ambito della [[Conference on Computer Vision and Pattern Recognition|CVPR]] (''Conference on Computer Vision and Pattern Recognition''), da un gruppo di ricercatori afferenti al dipartimento di informatica dell'[[Università di Princeton]].<ref name="den2009"/><ref name="Gershgorn">{{cita web |url=https://qz.com/1034972/the-data-that-changed-the-direction-of-ai-research-and-possibly-the-world/|titolo=The data that transformed AI research—and possibly the world|autore=Dave Gershgorn|data=26 luglio 2017|sito=Quartz|editore=Atlantic Media Co. |accesso=26 luglio 2017|lingua=en}}</ref> Tra i ricercatori coinvolti figura [[Fei-Fei Li]], docente di informatica all'[[Università di Stanford]].<ref>{{cita web|cognome=Fei-Fei|nome=Li|titolo=How we're teaching computers to understand pictures|url=https://www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures?language=en|accesso=16 dicembre 2018|lingua=en}}</ref> Nel progetto ImageNet il processo di annotazione è svolto in [[crowdsourcing]]<ref name="den2009">
{{Cita conferenza|nome =Jia|cognome = Deng|nome2 = Wei|cognome2 = Dong|nome3 = Richard|cognome3 = Socher|nome4 = Li-Jia|cognome4 = Li|nome5 = Kai|cognome5 = Li|nome6=Li|cognome6 = Fei-Fei|titolo = ImageNet: A large-scale hierarchical image database|data = 18 agosto 2009|conferenza = 2009 IEEE Conference on Computer Vision and Pattern Recognition|organizzazione = IEEE|editore = IEEE|città = Miami|pp = 248-255|doi=10.1109/CVPR.2009.5206848|url = https://ieeexplore.ieee.org/document/5206848|lingua = en}}
{{Cita conferenza
</ref><ref name="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la presenzopresenza o l'assenza di categorie di oggetti, ad esempio "''ci sono tigri in questa immagine''" oppure "''non ci sono tigri in questa immagine''". Nelle annotazioni a livello di singolo oggetto, viene indicata la [[bounding box]] intorno alla parte visibile dello stesso.
|nome =Jia
|cognome = Deng
|nome2 = Wei
|cognome2 = Dong
|nome3 = Richard
|cognome3 = Socher
|nome4 = Li-Jia
|cognome4 = Li
|nome5 = Kai
|cognome5 = Li
|nome6=Li
|cognome6 = Fei-Fei
|titolo = ImageNet: A large-scale hierarchical image database
|data = 18 agosto 2009
|conferenza = 2009 IEEE Conference on Computer Vision and Pattern Recognition
|organizzazione = IEEE
|editore = IEEE
|città = Miami
|pp = 248-255
|DOI = 10.1109/CVPR.2009.5206848
|url = https://ieeexplore.ieee.org/document/5206848
|lingua = en
}}
</ref><ref name="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la presenzo o l'assenza di categorie di oggetti, ad esempio "''ci sono tigri in questa immagine''" oppure "''non ci sono tigri in questa immagine''". Nelle annotazioni a livello di singolo oggetto, viene indicata la [[bounding box]] intorno alla parte visibile dello stesso.
 
== Importanza nel campo dell'apprendimento profondo ==
Il 30 settembre 2012, nell'ambito dell'annuale competizione ILSVRC, utilizzando una [[rete neurale convoluzionale]] denominata AlexNet<ref name=":0">{{Cita pubblicazione|cognome=Krizhevsky|nome=Alex|cognome2=Sutskever|nome2=Ilya|cognome3=Hinton|nome3=Geoffrey E.|accesso=24 maggio 2017|titolo=ImageNet classification with deep convolutional neural networks|url=https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf|rivista=[[Communications of the ACM]]|volume=60|numero=6|mese=Giugno|anno=2017|pp=84–9084-90|doi=10.1145/3065386|issn=0001-0782|lingua=en}}</ref>, è stato ottenuto un tasso di errore del 15,3%, con un distacco maggiore di 10,8 punti percentuali sul secondo classificato. Tale risultato è stato reso possibile dall'impiego di [[Graphics processing unit|GPU]] nella fase di addestramento della rete<ref name=":0" />: l'impiego di GPU si è rivelato un ingrediente essenziale nella rivoluzione dell'[[apprendimento profondo]] (in inglese ''deep learning''). Secondo il ''[[The Economist]]'', a seguito di tale evento è nato un improvviso interesse verso l'intelligenza artificiale, non solo all'interno delle comunità di ricerca, ma nell'intero settore della tecnologia.<ref name=economist/><ref>{{cita news|titolo=Machines 'beat humans' for a growing number of tasks|url=https://www.ft.com/content/4cc048f6-d5f4-11e7-a303-9060cb1e5f44|accesso=3 febbraio 2018|pubblicazione=[[Financial Times]]|data=30 novembre 2017|lingua=en}}</ref><ref>{{Cita web|url=https://qz.com/1307091/the-inside-story-of-how-ai-got-good-enough-to-dominate-silicon-valley/|titolo=The inside story of how AI got good enough to dominate Silicon Valley|nome=Dave|cognome=Gershgorn|sito=Quartz|accesso=10 Dicembre 2018|lingua=en|data=18 giugno 2018|urlarchivio=https://web.archive.org/web/20190524005049/https://qz.com/1307091/the-inside-story-of-how-ai-got-good-enough-to-dominate-silicon-valley/}}</ref>
In occasione del concorso promosso da ImageNet nel 2015, AlexNet è stata superata da una rete neurale convoluzionale molto profonda proposta da Microsoft, costituita da oltre 100 livelli.<ref name="microsoft2015">{{cita pubblicazione|cognome=He|nome=Kaiming|cognome2=Zhang|nome2=Xiangyu|cognome3=Ren|nome3=Shaoqing|cognome4=Sun|nome4=Jian|titolo=Deep Residual Learning for Image Recognition|rivista=2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)|lingua=en|anno=2016|pp=770-778|url=http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf|urlarchivio=https://web.archive.org/web/20180712172513/http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf}}</ref>