ImageNet: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
→Note: fix |
m Bot: numeri di pagina nei template citazione |
||
(2 versioni intermedie di 2 utenti non mostrate) | |||
Riga 1:
{{S|
'''ImageNet''' è un'ampia [[base di dati]] di immagini, realizzata per l'utilizzo, in ambito di [[visione artificiale]], nel campo del [[Object recognition|riconoscimento di oggetti]]. Il dataset consiste in più di 14 milioni di immagini<ref>{{cita news|titolo=New computer vision challenge wants to teach robots to see in 3D|url=https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/|autore=Matt Reynolds|accesso=3 febbraio 2018||urlarchivio=https://web.archive.org/web/20181030033114/https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/|data=7 aprile 2017|pubblicazione=[[New Scientist]]|lingua=en}}</ref><ref name="nytimes 2012">{{cita news|autore=John Markoff|titolo=For Web Images, Creating New Technology to Seek and Find|url=https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html|accesso=3 febbraio 2018|pubblicazione=[[The New York Times]]|data=19 novembre 2012|urlarchivio=https://web.archive.org/web/20190216111547/https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html|lingua=en}}</ref> che sono state annotate manualmente con l'indicazione degli oggetti in esse rappresentati e della [[bounding box]] che li delimita.<ref>{{cita web|titolo=ImageNet Summary and Statistics|url=http://image-net.org/about-stats|editore=ImageNet|accesso=22 giugno 2016|urlarchivio=https://web.archive.org/web/20190320194841/http://image-net.org/about-stats|lingua=en}}</ref> Gli oggetti individuati sono stati classificati in più di 20.000 categorie<ref name="nytimes 2012"/>: alcune categorie di oggetti frequenti, come ad esempio "pallone" o "fragola", consistono di diverse centinaia di immagini.<ref name=economist>{{cita news|titolo=From not working to neural networking|url=https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not|accesso=3 febbraio 2018|pubblicazione=[[The Economist]]|data=25 giugno 2016|lingua=en|urlarchivio=https://web.archive.org/web/20161231203934/https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not}}</ref> La base di dati con le annotazioni relative ad immagini di terze parti è gratuitamente disponibile direttamente da ImageNet, anche se le immagini non sono parte del progetto (difatti viene fornito solo il [[URL|collegamento]] ad esse).<ref>{{cita web|titolo=ImageNet Overview|url=http://image-net.org/about-overview|sito=ImageNet|accesso=22 giugno 2016|lingua=en|urlarchivio=https://web.archive.org/web/20160704234358/http://image-net.org/about-overview}}</ref> A partire dal 2010, ogni anno viene indetta una competizione denominata ''ImageNet Large Scale Visual Recognition Challenge'' (ILSVRC): in tale occasione programmi software vengono fatti competere per classificare e rilevare correttamente oggetti e scene contenuti nelle immagini. Nell'ambito della competizione viene impiegata una lista ridotta di immagini con oggetti appartenenti a mille categorie non sovrapposte.<ref name=ILJVRC-2015>{{Cita pubblicazione|titolo = ImageNet Large Scale Visual Recognition Challenge|autore = Olga Russakovsky|autore2= Jia Deng|autore3= Hao Su|autore4= Jonathan Krause|autore5= Sanjeev Satheesh|autore6= Sean Ma|autore7= Zhiheng Huang|autore8= Andrej Karpathy|autore9= Aditya Khosla|autore10= Michael Bernstein|autore11= Alexander C. Berg|autore12=Li Fei-Fei|rivista = International Journal of Computer Vision|volume = 115|numero = 3|editore = [[Springer (azienda)|Springer]]|anno = 2015|mese = Dicembre|pp = 211-252|lingua = en|ISSN = 0920-5691|doi=10.1007/s11263-015-0816-y}}</ref>
== Il dataset ==
Il database è stato presentato per la prima volta nel 2009 in Florida, nell'ambito della [[Conference on Computer Vision and Pattern Recognition|CVPR]] (''Conference on Computer Vision and Pattern Recognition''), da un gruppo di ricercatori afferenti al dipartimento di informatica dell'[[Università di Princeton]].<ref name="den2009"/><ref name="Gershgorn">{{cita web |url=https://qz.com/1034972/the-data-that-changed-the-direction-of-ai-research-and-possibly-the-world/|titolo=The data that transformed AI research—and possibly the world|autore=Dave Gershgorn|data=26 luglio 2017|sito=Quartz|editore=Atlantic Media Co. |accesso=26 luglio 2017|lingua=en}}</ref> Tra i ricercatori coinvolti figura [[Fei-Fei Li]], docente di informatica all'[[Università di Stanford]].<ref>{{cita web|cognome=Fei-Fei|nome=Li|titolo=How we're teaching computers to understand pictures|url=https://www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures?language=en|accesso=16 dicembre 2018|lingua=en}}</ref> Nel progetto ImageNet il processo di annotazione è svolto in [[crowdsourcing]]<ref name="den2009">
{{Cita conferenza|nome =Jia|cognome = Deng|nome2 = Wei|cognome2 = Dong|nome3 = Richard|cognome3 = Socher|nome4 = Li-Jia|cognome4 = Li|nome5 = Kai|cognome5 = Li|nome6=Li|cognome6 = Fei-Fei|titolo = ImageNet: A large-scale hierarchical image database|data = 18 agosto 2009|conferenza = 2009 IEEE Conference on Computer Vision and Pattern Recognition|organizzazione = IEEE|editore = IEEE|città = Miami|pp = 248-255|doi=10.1109/CVPR.2009.5206848|url = https://ieeexplore.ieee.org/document/5206848|lingua = en}}
</ref><ref name="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la
▲</ref><ref name="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la presenzo o l'assenza di categorie di oggetti, ad esempio "''ci sono tigri in questa immagine''" oppure "''non ci sono tigri in questa immagine''". Nelle annotazioni a livello di singolo oggetto, viene indicata la [[bounding box]] intorno alla parte visibile dello stesso.
== Importanza nel campo dell'apprendimento profondo ==
Il 30 settembre 2012, nell'ambito dell'annuale competizione ILSVRC, utilizzando una [[rete neurale convoluzionale]] denominata AlexNet<ref name=":0">{{Cita pubblicazione|cognome=Krizhevsky|nome=Alex|cognome2=Sutskever|nome2=Ilya|cognome3=Hinton|nome3=Geoffrey E.|accesso=24 maggio 2017|titolo=ImageNet classification with deep convolutional neural networks|url=https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf|rivista=[[Communications of the ACM]]|volume=60|numero=6|mese=Giugno|anno=2017|pp=
In occasione del concorso promosso da ImageNet nel 2015, AlexNet è stata superata da una rete neurale convoluzionale molto profonda proposta da Microsoft, costituita da oltre 100 livelli.<ref name="microsoft2015">{{cita pubblicazione|cognome=He|nome=Kaiming|cognome2=Zhang|nome2=Xiangyu|cognome3=Ren|nome3=Shaoqing|cognome4=Sun|nome4=Jian|titolo=Deep Residual Learning for Image Recognition|rivista=2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)|lingua=en|anno=2016|pp=770-778|url=http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf|urlarchivio=https://web.archive.org/web/20180712172513/http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf}}</ref>
|