MNIST database
Il MNIST database (Modified National Institute of Standards and Technology database) è una vasta base di dati di cifre scritte a mano che è comunemente impiegata come insieme di addestramento in vari sistemi per l'elaborazione delle immagini.[1][2] La base di dati è anche impiegata come insieme di addestramento e di testing nel campo dell'apprendimento automatico.[3][4] La base di dati è stata creata rimescolando le immagini presenti nel dataset del NIST.

Il MNIST database contiene 60.000 immagini di addestramento e 10.000 immagini di testing.[5] Metà dell'insieme di addestramento e metà dell'insieme di test sono stati prelevati dall'insieme di addestramento del NIST, mentre le altre metà sono state ottenute dal dataset di testing del NIST stesso.[6] Diversi lavori riportati su pubblicazioni scientifiche si sono focalizzati sull'obiettivo di ottenere un basso tasso di errore. In una pubblicazione, che documenta un lavoro basato sull'utilizzo di un sistema gerarchico di reti neurali convoluzionali, viene riportato un tasso di errore dello 0,23%.[7] Gli autori del dataset MNIST mantengono una lista di alcune metodologie che sono state impiegate su di esso.[8] Gli autori stessi, nella loro pubblicazione originaria, hanno utilizzato una SVM ottenendo un tasso di errore dello 0,8%.[9]
Il dataset
Le immagini presenti nel MNIST database sono la combinazione di due basi di dati nel NIST: lo Special Database 1 e lo Special Database 3, che sono costituiti rispettivamente da cifre scritte a mano da studenti delle scuole superiori e da impiegati dell'ufficio censimento.[8]
Note
- ^ (EN) Support vector machines speed pattern recognition - Vision Systems Design, su Vision Systems Design. URL consultato il 17 agosto 2013.
- ^ (EN) Sachin Gangaputra, Handwritten digit database, su cis.jhu.edu. URL consultato il 17 agosto 2013.
- ^ (EN) Qiao Yu, THE MNIST DATABASE of handwritten digits, su gavo.t.u-tokyo.ac.jp, 2007. URL consultato il 18 agosto 2013.
- ^ John C. Platt, Using analytic QP and sparseness to speed training of support vector machines (PDF), in Advances in Neural Information Processing Systems, 1999, pp. 557–563. URL consultato il 18 agosto 2013.
- ^ Ernst Kussul e Tatiana Baidyk, Improved method of handwritten digit recognition tested on MNIST database, in Image and Vision Computing, vol. 22, n. 12, 2004, pp. 971–981, DOI:10.1016/j.imavis.2004.03.008.
- ^ Bin Zhang e Sargur N. Srihari, Fast k -Nearest Neighbor Classification Using Cluster-Based Trees (PDF), in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, n. 4, 2004, pp. 525–528, DOI:10.1109/TPAMI.2004.1265868, PMID 15382657. URL consultato il 18 agosto 2013.
- ^ Dan Cires¸an, Ueli Meier e Jürgen Schmidhuber, Multi-column deep neural networks for image classification (PDF), in 2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012, pp. 3642–3649, DOI:10.1109/CVPR.2012.6248110, ISBN 978-1-4673-1228-8, arXiv:1202.2745.
- ^ a b Yann LeCun, Corinna Cortes e Christopher J.C. Burges, MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges, su yann.lecun.com. URL consultato il 17 agosto 2013.
- ^ Yann LeCun, Léon Bottou, Yoshua Bengio e Patrick Haffner, Gradient-Based Learning Applied to Document Recognition (PDF), in Proceedings of the IEEE, vol. 86, n. 11, 1998, pp. 2278–2324, DOI:10.1109/5.726791. URL consultato il 18 agosto 2013.
Voci correlate
Collegamenti esterni
- MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges - Sito web ufficiale della base di dati
- Neural Net for Handwritten Digit Recognition in JavaScript - Un'implementazione di rete neurale artificiale per la classificazione delle cifre scritte a mano basata sul MNIST database e realizzata in JavaScript
- Visualization of the MNIST database - Alcune immagini del MNIST database presenti su Github