ImageNet
ImageNet è un'ampia base di dati di immagini, realizzata per l'utilizzo, in ambito di visione artificiale, nel campo del riconoscimento di oggetti. Il dataset consiste in più di 14 milioni di immagini[1][2] che sono state annotate manualmente con l'indicazione degli oggetti in esse rappresentati e della bounding box che li delimita.[3] Gli oggetti individuati sono stati classificati in più di 20.000 categorie[2]: alcune categorie di oggetti frequenti, come ad esempio "pallone" o "fragola", consistono di diverse centinaia di immagini.[4] La base di dati con le annotazioni relative ad immagini di terze parti è gratuitamente disponibile direttamente da ImageNet, anche se le immagini non sono parte del progetto (difatti viene fornito solo il collegamento ad esse). [5] A partire dal 2010, ogni anno viene indetta una competizione denominata ImageNet Large Scale Visual Recognition Challenge (ILSVRC): in tale occasione programmi software vengono fatti competere per classificare e rilevare correttamente oggetti e scene contenuti nelle immagini. Nell'ambito della competizione viene impiegata una lista ridotta di immagini con oggetti appartenenti a mille categorie non sovrapposte.[6]
Il dataset
Il database è stato presentato per la prima volta nel 2009 in Florida, nell'ambito della CVPR (Conference on Computer Vision and Pattern Recognition), da un gruppo di ricercatori afferenti al dipartimento di informatica dell'Università di Princeton.[7] Tra i ricercatori coinvolti figura Fei-Fei Li, docente di informatica all'Università di Stanford.[8] Nel progetto ImageNet il processo di annotazione è svolto in crowdsourcing: in partciolare nel corso del 2012 ImageNet è stato il maggior utilizzatore a livello accademico del servizio Mechanical Turk di Amazon.[2] Nell'annotazione a livello di immagine viene richiesto di indicare la presenzo o l'assenza di categorie di oggetti, ad esempio "ci sono tigri in questa immagine" oppure "non ci sono tigri in questa immagine". Nelle annotazioni a livello di oggetti viene indicata la bounding box intorno alla parte visibile dell'oggetto.
Voci correlate
Note
- ^ (EN) New computer vision challenge wants to teach robots to see in 3D, in New Scientist, 7 aprile 2017. URL consultato il 3 febbraio 2018 (archiviato dall'url originale il 30 ottobre 2018).
- ^ a b c (EN) John Markoff, For Web Images, Creating New Technology to Seek and Find, in The New York Times, 19 novembre 2012. URL consultato il 3 febbraio 2018 (archiviato dall'url originale il 16 febbraio 2019).
- ^ (EN) ImageNet Summary and Statistics, su image-net.org, ImageNet. URL consultato il 22 giugno 2016 (archiviato dall'url originale il 20 marzo 2019).
- ^ (EN) From not working to neural networking, in The Economist, 25 giugno 2016. URL consultato il 3 febbraio 2018 (archiviato dall'url originale il 31 dicembre 2016).
- ^ (EN) ImageNet Overview, su ImageNet. URL consultato il 22 giugno 2016 (archiviato dall'url originale il 4 luglio 2016).
- ^ (EN) Olga Russakovsky, Jia Deng, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg e Li Fei-Fei, ImageNet Large Scale Visual Recognition Challenge, in International Journal of Computer Vision, vol. 115, n. 3, Springer, Dicembre 2015, pp. 211-252, DOI:10.1007/s11263-015-0816-y, ISSN 0920-5691 .
- ^ (EN) Dave Gershgorn, The data that transformed AI research—and possibly the world, su Quartz, Atlantic Media Co., 26 Luglio 2017. URL consultato il 26 Luglio 2017.
- ^ (EN) Fei-Fei Li, How we're teaching computers to understand pictures, su ted.com. URL consultato il 16 December 2018.
Collegamenti esterni
- (EN) Sito ufficiale, su image-net.org.