MNIST database
La base di dati MNIST (modified National Institute of Standards and Technology database) è una vasta base di dati di cifre scritte a mano che è comunemente impiegata come insieme di addestramento in vari sistemi per l'elaborazione delle immagini[1][2]. La base di dati è anche impiegata come insieme di addestramento e di test nel campo dell'apprendimento automatico[3][4]. La base di dati è stata creata rimescolando le immagini presenti nell'insieme di dati del NIST.

La base di dati MNIST contiene 60 000 immagini di addestramento e 10 000 immagini di test[5]; metà dell'insieme di addestramento e metà dell'insieme di test sono state prelevate dall'insieme di addestramento del NIST, mentre le altre metà sono state ottenute dall'insieme di test del NIST stesso[6]. Diversi lavori riportati su pubblicazioni scientifiche si sono focalizzati sull'obiettivo di ottenere un basso tasso di errore; in una pubblicazione, che documenta un lavoro basato sull'utilizzo di un sistema gerarchico di reti neurali convoluzionali, viene riportato un tasso di errore dello 0,23 %[7]. Gli autori dell'insieme di dati MNIST mantengono una lista di alcuni metodi che sono stati impiegati su di esso[8]: essi hanno utilizzato, nella loro pubblicazione originaria, una SVM, ottenendo un tasso di errore dello 0,8 %[9].
L'insieme dei dati
modificaLe immagini presenti nella base di dati sono la combinazione di due basi di dati nel NIST: lo Special Database 1 e lo Special Database 3, che sono costituiti rispettivamente da cifre scritte a mano da studenti delle scuole superiori e da impiegati dell'ufficio censimento[8].
Note
modifica- ^ (EN) Support vector machines speed pattern recognition - Vision Systems Design, su Vision Systems Design. URL consultato il 17 agosto 2013.
- ^ (EN) Sachin Gangaputra, Handwritten digit database, su cis.jhu.edu. URL consultato il 17 agosto 2013.
- ^ (EN) Qiao Yu, THE MNIST DATABASE of handwritten digits, su gavo.t.u-tokyo.ac.jp, 2007. URL consultato il 18 agosto 2013 (archiviato dall'url originale l'11 febbraio 2018).
- ^ (EN) John C. Platt, Using analytic QP and sparseness to speed training of support vector machines (PDF), in Advances in Neural Information Processing Systems, 1999, pp. 557-563. URL consultato il 18 agosto 2013 (archiviato dall'url originale il 4 marzo 2016).
- ^ Ernst Kussul e Tatiana Baidyk, Improved method of handwritten digit recognition tested on MNIST database, in Image and Vision Computing, vol. 22, n. 12, 2004, pp. 971-981, DOI:10.1016/j.imavis.2004.03.008.
- ^ Bin Zhang e Sargur N. Srihari, Fast k -Nearest Neighbor Classification Using Cluster-Based Trees (PDF), in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, n. 4, 2004, pp. 525-528, DOI:10.1109/TPAMI.2004.1265868, PMID 15382657. URL consultato il 18 agosto 2013.
- ^ Dan Cires¸an, Ueli Meier e Jürgen Schmidhuber, Multi-column deep neural networks for image classification (PDF), in 2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012, pp. 3642-3649, DOI:10.1109/CVPR.2012.6248110, ISBN 978-1-4673-1228-8, arXiv:1202.2745.
- ^ a b Yann LeCun, Corinna Cortes e Christopher J.C. Burges, MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges, su yann.lecun.com. URL consultato il 17 agosto 2013.
- ^ Yann LeCun, Léon Bottou, Yoshua Bengio e Patrick Haffner, Gradient-Based Learning Applied to Document Recognition (PDF), in Proceedings of the IEEE, vol. 86, n. 11, 1998, pp. 2278-2324, DOI:10.1109/5.726791. URL consultato il 18 agosto 2013.
Voci correlate
modificaCollegamenti esterni
modifica- Sito ufficiale, su yann.lecun.com.
- Neural Net for Handwritten Digit Recognition in JavaScript - Un'implementazione di rete neurale artificiale per la classificazione delle cifre scritte a mano basata sul MNIST database e realizzata in JavaScript
- Visualization of the MNIST database - Alcune immagini del MNIST database presenti su Github