MNIST database: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
m top: sistemazione fonti, smistamento lavoro sporco e fix vari
 
(17 versioni intermedie di 9 utenti non mostrate)
Riga 1:
{{S|Informaticabasi di dati}}
IlLa '''MNISTbase databasedi dati MNIST''' (''Modifiedmodified [[National Institute of Standards and Technology]] database'') è un'ampiauna vasta [[base di dati]] di cifre scritte a mano che è comunemente impiegatoimpiegata come [[Training set|insieme di addestramento]] in vari sistemi per l'[[Elaborazione digitale delle immagini|elaborazione delle immagini]].<ref>{{cita web|url=http://www.vision-systems.com/articles/print/volume-9/issue-9/technology-trends/software/support-vector-machines-speed-pattern-recognition.html|titolo=Support vector machines speed pattern recognition - Vision Systems Design|sito=Vision Systems Design|lingua=en|accesso=2013-08-17 agosto 2013}}</ref><ref>{{cita web|url=http://cis.jhu.edu/~sachin/digit/digit.html|titolo=Handwritten digit database|autore=Sachin Gangaputra|lingua=en|accesso=2013-08-17 agosto 2013}}</ref>. La base di dati è anche impiegata come insieme di addestramento e di testing[[Test set|test]] nel campo dell'[[apprendimento automatico]].<ref>{{cita web|autore=Qiao Yu|titolo=THE MNIST DATABASE of handwritten digits|url=http://www.gavo.t.u-tokyo.ac.jp/~qiao/database.html|accesso=2013-08-18 agosto 2013|lingua=en|data=2007|urlarchivio=https://web.archive.org/web/20180211153301/http://www.gavo.t.u-tokyo.ac.jp/~qiao/database.html|urlmorto=sì}}</ref><ref>{{cita pubblicazione|autore=John C. Platt|titolo=Using analytic QP and sparseness to speed training of support vector machines|rivista=Advances in Neural Information Processing Systems|anno=1999|pp=557–563557-563|url=http://ar.newsmth.net/att/148aa490aed5b5/smo-nips.pdf|accesso=18 agosto 2013|lingua=en|urlarchivio=https://web.archive.org/web/20160304083810/http://ar.newsmth.net/att/148aa490aed5b5/smo-08-18nips.pdf|urlmorto=sì}}</ref>.
La base di dati è stata creata rimescolando le immagini presenti nel nell'[https://www.nist.gov/srd/upload/nistsd19.pdf datasetinsieme di dati del NIST].
[[File:MnistExamples.png|alt=MNIST sample images.|thumb|Un'immagine di esempio deldei datasetdati di test del MNIST.]]
La base di dati MNIST contiene {{formatnum:60000}} immagini di addestramento e {{formatnum:10000}} immagini di test<ref>{{cita pubblicazione|autore=Ernst Kussul|autore2=Tatiana Baidyk|titolo=Improved method of handwritten digit recognition tested on MNIST database|rivista=Image and Vision Computing|anno=2004|volume=22|numero=12|pp=971-981|doi=10.1016/j.imavis.2004.03.008}}</ref>; metà dell'insieme di addestramento e metà dell'insieme di test sono state prelevate dall'insieme di addestramento del NIST, mentre le altre metà sono state ottenute dall'insieme di test del NIST stesso<ref>{{cita pubblicazione|cognome=Zhang|nome=Bin|autore2=Sargur N. Srihari|titolo=Fast k -Nearest Neighbor Classification Using Cluster-Based Trees|rivista=IEEE Transactions on Pattern Analysis and Machine Intelligence|anno=2004|volume=26|numero=4|pp=525-528|url=http://mleg.cse.sc.edu/edu/csce822/uploads/Main.ReadingList/KNN_fastbyClustering.pdf|accesso=18 agosto 2013|doi=10.1109/TPAMI.2004.1265868|pmid=15382657}}</ref>.
Diversi lavori riportati su [[Pubblicazione scientifica|pubblicazioni scientifiche]] si sono focalizzati sull'obiettivo di ottenere un basso tasso di errore; in una pubblicazione, che documenta un lavoro basato sull'utilizzo di un sistema gerarchico di [[Rete neurale convoluzionale|reti neurali convoluzionali]], viene riportato un tasso di errore dello 0,23 %<ref name="Multideep">{{cita libro|cognome=Cires¸an|nome=Dan|autore2=Ueli Meier |autore3=Jürgen Schmidhuber |titolo=Multi-column deep neural networks for image classification|rivista=2012 IEEE Conference on Computer Vision and Pattern Recognition|anno=2012|pp=3642-3649|doi=10.1109/CVPR.2012.6248110|arxiv=1202.2745|isbn=978-1-4673-1228-8|url=http://repository.supsi.ch/5145/1/IDSIA-04-12.pdf}}</ref>. Gli autori dell'insieme di dati MNIST mantengono una lista di alcuni metodi che sono stati impiegati su di esso<ref name="LeCun">{{cita web|cognome=LeCun|nome=Yann|titolo=MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges|url=http://yann.lecun.com/exdb/mnist/|accesso=17 agosto 2013|autore2=Corinna Cortes |autore3=Christopher J.C. Burges }}</ref>: essi hanno utilizzato, nella loro pubblicazione originaria, una [[Macchine a vettori di supporto|SVM]], ottenendo un tasso di errore dello 0,8 %<ref name="Gradient">{{cita pubblicazione|cognome=LeCun|nome=Yann|autore2=Léon Bottou |autore3=Yoshua Bengio |autore4=Patrick Haffner |titolo=Gradient-Based Learning Applied to Document Recognition|rivista=Proceedings of the IEEE |anno=1998|volume=86|numero=11|pp=2278-2324|url=http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf|accesso=18 agosto 2013|doi=10.1109/5.726791}}</ref>.
 
== L'insieme dei dati ==
Il MNIST database contiene 60.000 immagini di addestramento e 10.000 immagini di testing.<ref>{{cita pubblicazione|autore=Ernst Kussul|autore2=Tatiana Baidyk|titolo=Improved method of handwritten digit recognition tested on MNIST database|rivista=Image and Vision Computing|anno=2004|volume=22|numero=12|pp=971–981|doi=10.1016/j.imavis.2004.03.008}}</ref>
Le immagini presenti nelnella MNISTbase databasedi dati sono la combinazione di due basi di dati nel NIST: lo ''Special Database 1'' e lo ''Special Database 3'', che sono costituiti rispettivamente da cifre scritte a mano da studenti delle [[High school|scuole superiori]] e da impiegati dell'[[Ufficio del censimento degli Stati Uniti d'America|ufficio censimento]]<ref name="LeCun" />.
 
== Note ==
Riga 14 ⟶ 16:
 
== Collegamenti esterni ==
* {{Collegamenti esterni}}
* [http://yann.lecun.com/exdb/mnist/ MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges] - Sito web ufficiale della base di dati
* [http://myselph.de/neuralNet.html Neural Net for Handwritten Digit Recognition in JavaScript] - Un'implementazione di rete neurale artificiale per la classificazione delle cifre scritte a mano basata sul MNIST database e realizzata in JavaScript
* [httphttps://github.com/mbornet-hl/rpn/tree/master/rpn_main/IMAGES/GROUPS/ Visualization of the MNIST database] - Alcune immagini del MNIST database presenti su Github
 
{{Portale|informatica}}
 
[[Categoria:Intelligenza artificiale]]