ImageNet: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m Bot: sostituzione template:Sito ufficiale con Collegamenti esterni e modifiche minori |
m Bot: numeri di pagina nei template citazione |
||
(4 versioni intermedie di 4 utenti non mostrate) | |||
Riga 1:
{{S|
'''ImageNet''' è un'ampia [[base di dati]] di immagini, realizzata per l'utilizzo, in ambito di [[visione artificiale]], nel campo del [[Object recognition|riconoscimento di oggetti]]. Il dataset consiste in più di 14 milioni di immagini<ref>{{cita news|titolo=New computer vision challenge wants to teach robots to see in 3D|url=https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/|autore=Matt Reynolds|accesso=3 febbraio 2018||urlarchivio=https://web.archive.org/web/20181030033114/https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/|data=7 aprile 2017|pubblicazione=[[New Scientist]]|lingua=en}}</ref><ref name="nytimes 2012">{{cita news|autore=John Markoff|titolo=For Web Images, Creating New Technology to Seek and Find|url=https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html|accesso=3 febbraio 2018|pubblicazione=[[The New York Times]]|data=19 novembre 2012|urlarchivio=https://web.archive.org/web/20190216111547/https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html|lingua=en}}</ref> che sono state annotate manualmente con l'indicazione degli oggetti in esse rappresentati e della [[bounding box]] che li delimita.<ref>{{cita web|titolo=ImageNet Summary and Statistics|url=http://image-net.org/about-stats|editore=ImageNet|accesso=22 giugno 2016|urlarchivio=https://web.archive.org/web/20190320194841/http://image-net.org/about-stats|lingua=en}}</ref> Gli oggetti individuati sono stati classificati in più di 20.000 categorie<ref name="nytimes 2012"/>: alcune categorie di oggetti frequenti, come ad esempio "pallone" o "fragola", consistono di diverse centinaia di immagini.<ref name=economist>{{cita news|titolo=From not working to neural networking|url=https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not|accesso=3 febbraio 2018|pubblicazione=[[The Economist]]|data=25 giugno 2016|lingua=en|urlarchivio=https://web.archive.org/web/20161231203934/https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not}}</ref> La base di dati con le annotazioni relative ad immagini di terze parti è gratuitamente disponibile direttamente da ImageNet, anche se le immagini non sono parte del progetto (difatti viene fornito solo il [[URL|collegamento]] ad esse).<ref>{{cita web|titolo=ImageNet Overview|url=http://image-net.org/about-overview|sito=ImageNet|accesso=22 giugno 2016|lingua=en|urlarchivio=https://web.archive.org/web/20160704234358/http://image-net.org/about-overview}}</ref> A partire dal 2010, ogni anno viene indetta una competizione denominata ''ImageNet Large Scale Visual Recognition Challenge'' (ILSVRC): in tale occasione programmi software vengono fatti competere per classificare e rilevare correttamente oggetti e scene contenuti nelle immagini. Nell'ambito della competizione viene impiegata una lista ridotta di immagini con oggetti appartenenti a mille categorie non sovrapposte.<ref name=ILJVRC-2015>{{Cita pubblicazione|titolo = ImageNet Large Scale Visual Recognition Challenge|autore = Olga Russakovsky|autore2= Jia Deng|autore3= Hao Su|autore4= Jonathan Krause|autore5= Sanjeev Satheesh|autore6= Sean Ma|autore7= Zhiheng Huang|autore8= Andrej Karpathy|autore9= Aditya Khosla|autore10= Michael Bernstein|autore11= Alexander C. Berg|autore12=Li Fei-Fei|rivista = International Journal of Computer Vision|volume = 115|numero = 3|editore = [[Springer (azienda)|Springer]]|anno = 2015|mese = Dicembre|pp = 211-252|lingua = en|ISSN = 0920-5691|doi=10.1007/s11263-015-0816-y}}</ref>
== Il dataset ==
Il database è stato presentato per la prima volta nel 2009 in Florida, nell'ambito della [[Conference on Computer Vision and Pattern Recognition|CVPR]] (''Conference on Computer Vision and Pattern Recognition''), da un gruppo di ricercatori afferenti al dipartimento di informatica dell'[[Università di Princeton]].<ref name="den2009"/><ref name="Gershgorn">{{cita web |url=https://qz.com/1034972/the-data-that-changed-the-direction-of-ai-research-and-possibly-the-world/|titolo=The data that transformed AI research—and possibly the world|autore=Dave Gershgorn|data=26 luglio 2017|sito=Quartz|editore=Atlantic Media Co. |accesso=26 luglio 2017|lingua=en}}</ref> Tra i ricercatori coinvolti figura [[Fei-Fei Li]], docente di informatica all'[[Università di Stanford]].<ref>{{cita web|cognome=Fei-Fei|nome=Li|titolo=How we're teaching computers to understand pictures|url=https://www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures?language=en|accesso=16 dicembre 2018|lingua=en}}</ref> Nel progetto ImageNet il processo di annotazione è svolto in [[crowdsourcing]]<ref name="den2009">
{{Cita conferenza|nome =Jia|cognome = Deng|nome2 = Wei|cognome2 = Dong|nome3 = Richard|cognome3 = Socher|nome4 = Li-Jia|cognome4 = Li|nome5 = Kai|cognome5 = Li|nome6=Li|cognome6 = Fei-Fei|titolo = ImageNet: A large-scale hierarchical image database|data = 18 agosto 2009|conferenza = 2009 IEEE Conference on Computer Vision and Pattern Recognition|organizzazione = IEEE|editore = IEEE|città = Miami|pp = 248-255|doi=10.1109/CVPR.2009.5206848|url = https://ieeexplore.ieee.org/document/5206848|lingua = en}}
</ref><ref name="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la
▲</ref><ref ="lastampa">{{cita news|url=https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|nome=Claudio|cognome=Leonardi|titolo=ImageNet, la nuova via per trovare immagini sul web|urlarchivio=https://web.archive.org/web/20121129084900/https://www.lastampa.it/2012/11/23/tecnologia/imagenet-la-nuova-via-per-trovare-immagini-sul-web-gKvMeTojkHRP7fvbIZoFtI/pagina.html|data=23 novembre 2012|pubblicazione=[[La Stampa]]}}</ref>: in particolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio [[Amazon Mechanical Turk|Mechanical Turk]] di Amazon.<ref name="nytimes 2012"/> Nell'annotazione a livello di immagine viene richiesto di indicare la presenzo o l'assenza di categorie di oggetti, ad esempio "''ci sono tigri in questa immagine''" oppure "''non ci sono tigri in questa immagine''". Nelle annotazioni a livello di singolo oggetto, viene indicata la [[bounding box]] intorno alla parte visibile dello stesso.
== Importanza nel campo dell'apprendimento profondo ==
Il 30 settembre 2012, nell'ambito dell'annuale competizione ILSVRC, utilizzando una [[rete neurale convoluzionale]] denominata AlexNet<ref name=":0">{{Cita pubblicazione|cognome=Krizhevsky|nome=Alex|cognome2=Sutskever|nome2=Ilya|cognome3=Hinton|nome3=Geoffrey E.|accesso=24 maggio 2017|titolo=ImageNet classification with deep convolutional neural networks|url=https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf|rivista=[[Communications of the ACM]]|volume=60|numero=6|mese=Giugno|anno=2017|pp=
In occasione del concorso promosso da ImageNet nel 2015, AlexNet è stata superata da una rete neurale convoluzionale molto profonda proposta da Microsoft, costituita da oltre 100 livelli.<ref name="microsoft2015">{{cita pubblicazione|cognome=He|nome=Kaiming|cognome2=Zhang|nome2=Xiangyu|cognome3=Ren|nome3=Shaoqing|cognome4=Sun|nome4=Jian|titolo=Deep Residual Learning for Image Recognition|rivista=2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)|lingua=en|anno=2016|pp=770-778|url=http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf|urlarchivio=https://web.archive.org/web/20180712172513/http://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf}}</ref>
Line 72 ⟶ 25:
|anno=2017
}}</ref><ref>{{cita news|cognome=Markoff|nome=John|titolo=A Learning Advance in Artificial Intelligence Rivals Human Abilities|url=https://www.nytimes.com/2015/12/11/science/an-advance-in-artificial-intelligence-rivals-human-vision-abilities.html|accesso=22 giugno 2016|pubblicazione=[[The New York Times]]|data=10 dicembre 2015|lingua=en}}</ref> Tuttavia, come ha puntualizzato Olga Russakovsky, tra le organizzatrici della competizione, i software si limitano ad identificare gli oggetti contenuti in un'immagine tra poche migliaia di categorie, mentre un essere umano ha la capacità di riconoscere un oggetto tra un numero notevolmente maggiore di categorie e può, a differenza dei software, contestualizzare un'immagine.<ref>{{cita news|cognome=Aron|nome=Jacob|titolo=Forget the Turing test – there are better ways of judging AI|url=https://www.newscientist.com/article/dn28206-forget-the-turing-test-there-are-better-ways-of-judging-ai/|accesso=22 giugno 2016|pubblicazione=[[New Scientist]]|data=21 settembre 2015|lingua=en|urlarchivio=https://web.archive.org/web/20190411052401/https://www.newscientist.com/article/dn28206-forget-the-turing-test-there-are-better-ways-of-judging-ai/}}</ref>
== Note ==▼
<references />
== Voci correlate ==
Line 78 ⟶ 34:
* [[Visione artificiale]]
* [[WordNet]]
▲== Note ==
== Collegamenti esterni ==
Line 86 ⟶ 39:
{{Portale|informatica}}
[[Categoria:Intelligenza artificiale]]
|