MNIST database

base di dati di cifre scritte a mano
Versione del 28 apr 2019 alle 10:25 di Atarubot (discussione | contributi) (template cita "xxxx"; fix formato data; rinomina/fix nomi parametri)

Il MNIST database (Modified National Institute of Standards and Technology database) è una vasta base di dati di cifre scritte a mano che è comunemente impiegata come insieme di addestramento in vari sistemi per l'elaborazione delle immagini.[1][2] La base di dati è anche impiegata come insieme di addestramento e di testing nel campo dell'apprendimento automatico.[3][4] La base di dati è stata creata rimescolando le immagini presenti nel dataset del NIST.

MNIST sample images.
Un'immagine di esempio del dataset di test del MNIST.

Il MNIST database contiene 60.000 immagini di addestramento e 10.000 immagini di testing.[5] Metà dell'insieme di addestramento e metà dell'insieme di test sono stati prelevati dall'insieme di addestramento del NIST, mentre le altre metà sono state ottenute dal dataset di testing del NIST stesso.[6] Diversi lavori riportati su pubblicazioni scientifiche si sono focalizzati sull'obiettivo di ottenere un basso tasso di errore. In una pubblicazione, che documenta un lavoro basato sull'utilizzo di un sistema gerarchico di reti neurali convoluzionali, viene riportato un tasso di errore dello 0,23%.[7] Gli autori del dataset MNIST mantengono una lista di alcune metodologie che sono state impiegate su di esso.[8] Gli autori stessi, nella loro pubblicazione originaria, hanno utilizzato una SVM ottenendo un tasso di errore dello 0,8%.[9]

Il dataset

Le immagini presenti nel MNIST database sono la combinazione di due basi di dati nel NIST: lo Special Database 1 e lo Special Database 3, che sono costituiti rispettivamente da cifre scritte a mano da studenti delle scuole superiori e da impiegati dell'ufficio censimento.[8]

Note

  1. ^ (EN) Support vector machines speed pattern recognition - Vision Systems Design, su Vision Systems Design. URL consultato il 17 agosto 2013.
  2. ^ (EN) Sachin Gangaputra, Handwritten digit database, su cis.jhu.edu. URL consultato il 17 agosto 2013.
  3. ^ (EN) Qiao Yu, THE MNIST DATABASE of handwritten digits, su gavo.t.u-tokyo.ac.jp, 2007. URL consultato il 18 agosto 2013.
  4. ^ John C. Platt, Using analytic QP and sparseness to speed training of support vector machines (PDF), in Advances in Neural Information Processing Systems, 1999, pp. 557–563. URL consultato il 18 agosto 2013.
  5. ^ Ernst Kussul e Tatiana Baidyk, Improved method of handwritten digit recognition tested on MNIST database, in Image and Vision Computing, vol. 22, n. 12, 2004, pp. 971–981, DOI:10.1016/j.imavis.2004.03.008.
  6. ^ Bin Zhang e Sargur N. Srihari, Fast k -Nearest Neighbor Classification Using Cluster-Based Trees (PDF), in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, n. 4, 2004, pp. 525–528, DOI:10.1109/TPAMI.2004.1265868, PMID 15382657. URL consultato il 18 agosto 2013.
  7. ^ Dan Cires¸an, Ueli Meier e Jürgen Schmidhuber, Multi-column deep neural networks for image classification (PDF), in 2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012, pp. 3642–3649, DOI:10.1109/CVPR.2012.6248110, ISBN 978-1-4673-1228-8, arXiv:1202.2745.
  8. ^ a b Yann LeCun, Corinna Cortes e Christopher J.C. Burges, MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges, su yann.lecun.com. URL consultato il 17 agosto 2013.
  9. ^ Yann LeCun, Léon Bottou, Yoshua Bengio e Patrick Haffner, Gradient-Based Learning Applied to Document Recognition (PDF), in Proceedings of the IEEE, vol. 86, n. 11, 1998, pp. 2278–2324, DOI:10.1109/5.726791. URL consultato il 18 agosto 2013.

Voci correlate

Collegamenti esterni

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica