MNIST database: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 3:
La base di dati è stata creata rimescolando le immagini presenti nel [https://www.nist.gov/srd/upload/nistsd19.pdf dataset del NIST].
[[File:MnistExamples.png|alt=MNIST sample images.|thumb|Un'immagine di esempio del dataset di test del MNIST.]]
Il MNIST database contiene 60.000 immagini di addestramento e 10.000 immagini di testing.<ref>{{cita pubblicazione|autore=Ernst Kussul|autore2=Tatiana Baidyk|titolo=Improved method of handwritten digit recognition tested on MNIST database|rivista=Image and Vision Computing|anno=2004|volume=22|numero=12|pp=971–981|doi=10.1016/j.imavis.2004.03.008}}</ref> Metà dell'insieme di addestramento e metà dell'insieme di test sono stati prelevati dall'insieme di addestramento del NIST, mentre le altre metà sono state ottenute dal dataset di testing del NIST stesso.<ref>{{cita pubblicazione|last=Zhang|first=Bin|author2=Sargur N. Srihari|titolo=Fast k -Nearest Neighbor Classification Using Cluster-Based Trees|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|anno=2004|volume=26|issue=4|pp=525–528|url=http://mleg.cse.sc.edu/edu/csce822/uploads/Main.ReadingList/KNN_fastbyClustering.pdf|accessdate=18 Agosto 2013|doi=10.1109/TPAMI.2004.1265868|pmid=15382657}}</ref>
Diversi lavori riportati su [[Pubblicazione scientifica|pubblicazioni scientifiche]] si sono focalizzati sull'obiettivo di ottenere un basso tasso di errore. In una pubblicazione, che documenta un lavoro basato sull'utilizzo di un sistema gerarchico di [[Rete neurale convoluzionale|reti neurali convoluzionali]], viene riportato un tasso di errore dello 0,23%.<ref name="Multideep">{{cita libro|last=Cires¸an|first=Dan|author2=Ueli Meier |author3=Jürgen Schmidhuber |titolo=Multi-column deep neural networks for image classification|journal=2012 IEEE Conference on Computer Vision and Pattern Recognition|anno=2012|pp=3642–3649|doi=10.1109/CVPR.2012.6248110|arxiv=1202.2745|isbn=978-1-4673-1228-8|url=http://repository.supsi.ch/5145/1/IDSIA-04-12.pdf|citeseerx=10.1.1.300.3283}}</ref> Gli autori del dataset MNIST mantengono una lista di alcune metodologie che sono state impiegate su di esso.<ref name="LeCun">{{cita web|last=LeCun|first=Yann|titolo=MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges|url=http://yann.lecun.com/exdb/mnist/|accessdate=17 Agosto 2013|author2=Corinna Cortes |author3=Christopher J.C. Burges }}</ref> Gli autori stessi, nella loro pubblicazione originaria, hanno utilizzato una [[Macchine a vettori di supporto|SVM]] ottenendo un tasso di errore dello 0,8%.<ref name="Gradient">{{cita pubblicazione|last=LeCun|first=Yann|author2=Léon Bottou |author3=Yoshua Bengio |author4=Patrick Haffner |titolo=Gradient-Based Learning Applied to Document Recognition|rivista=Proceedings of the IEEE |year=1998|volume=86|issue=11|pp=2278–2324|url=http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf|accessdate=18 Agosto 2013|doi=10.1109/5.726791}}</ref>
 
Il MNIST database contiene 60.000 immagini di addestramento e 10.000 immagini di testing.<ref>{{cita pubblicazione|autore=Ernst Kussul|autore2=Tatiana Baidyk|titolo=Improved method of handwritten digit recognition tested on MNIST database|rivista=Image and Vision Computing|anno=2004|volume=22|numero=12|pp=971–981|doi=10.1016/j.imavis.2004.03.008}}</ref>
Le immagini presenti nel MNIST database sono la combinazione di due basi di dati nel NIST: lo ''Special Database 1'' e lo ''Special Database 3'', che sono costituiti rispettivamente da cifre scritte a mano da studenti delle scuole superiori e da impiegati dell'[[Ufficio del censimento degli Stati Uniti d'America|ufficio censimento]].