Self-Monitoring, Analysis and Reporting Technology

Template:Nota disambigua2 Self-Monitoring, Analysis, and Reporting Technology, o S.M.A.R.T., è un sistema di monitoraggio per dischi rigidi, per rilevare e fornire diversi indicatori di affidabilità, nella speranza di anticipare i malfunzionamenti.

Funzionamento

Essenzialmente, i malfunzionamenti dei dischi rigidi sono di due tipi:

  • Quelli prevedibili, in cui i malfunzionamenti, specialmente dovuti all'usura o all'invecchiamento, si manifestano gradualmente. Un sistema di monitoraggio può individuarli, come la spia della temperatura nella strumentazione di un'automobile può mettere in guardia il guidatore — prima che accadano seri danni — che il motore sta cominciando a surriscaldarsi.
  • Quelli imprevedibili, dove i malfunzionamenti accadono improvvisamente e senza preavviso, come nel caso di un componente elettronico che si brucia.

Il monitoraggio di un disco rigido può predire circa il 60% dei possibili malfunzionamenti. S.M.A.R.T. ha lo scopo di avvisare l'utente o l'amministratore di sistema che il disco rigido sta per guastarsi, in modo che questi abbia il tempo di copiare i dati su un altro dispositivo di archiviazione.

Compaq è stata la prima azienda a supportare S.M.A.R.T., ma oggi la maggior parte dei principali produttori di dischi rigidi e schede madri lo supportano almeno in parte. Molte schede madri avvisano l'utente quando il disco rigido sta per guastarsi. Tuttavia, S.M.A.R.T. attualmente non è implementato correttamente su molte piattaforme, a causa dell'assenza di standard per l'interscambio di dati S.M.A.R.T.

Da un punto di vista legale, il termine "S.M.A.R.T." si riferisce soltanto all'interscambio di dati tra i sensori elettro-meccanici del disco rigido e il computer, cosicché alcuni produttori includono sensori per una sola grandezza fisica e dichiarano il prodotto compatibile S.M.A.R.T. Per esempio, alcuni produttori dichiarano di supportare S.M.A.R.T., ma non includono un sensore di temperatura. Nel caso di dispositivi elettronici, l'affidabilità di norma è inversamente proporzionale alla temperatura, pertanto questo fattore è cruciale per predire eventuali malfunzionamenti.

Durante periodi di uso intenso (come nel caso di operazioni di deframmentazione oppure di funzionamento come server web), la temperatura può superare le specifiche fornite dal produttore. I danni provocati da temperatura eccessiva sono cumulativi nel tempo. Un sensore di temperatura S.M.A.R.T. può informare l'utente prima che il disco sia danneggiato dal calore eccessivo, ma molti produttori non includono un sensore di temperatura nel corredo S.M.A.R.T. Perciò, il termine S.M.A.R.T. è uno standard praticamente privo di significato, perché molti produttori dichiarano di supportarlo, ma si rifiutano di rivelare quali caratteristiche fisiche sono monitorate. Ciò crea confusione ed impedisce all'utente di confrontare correttamente i diversi prodotti.

Alcuni controller sono in grado di duplicare le operazioni di scrittura su di un backup secondario. Questa tecnologia è nota come RAID. Però molti software S.M.A.R.T. non funzionano se RAID è in funzione. È probabile che l'industria informatica supporterà correttamente S.M.A.R.T. soltanto quando un significativo numero di utenti chiederanno compatibilità, standardizzazione, e un'apertura trasparente a questa tecnologia da parte dei produttori di dischi rigidi.

Attributi

Ogni produttore definisce un insieme di attributi S.M.A.R.T. e imposta i valori di soglia che non dovrebbero essere superati durante un normale funzionamento. La scala di valori che un attributo può assumere varia da 1 a 253 (1 indica il funzionamento peggiore e 253 quello migliore). A seconda del produttore, gli attributi con valore di circa 100 o 200 saranno scelti come valori "normali". I produttori potrebbero non concordare sulle definizioni degli attributi e sulle unità di misura.

Legenda
 
Un alto valore "raw" è meglio
 
Un basso valore "raw" è peggio
Critico
Potenziale indicatore di un imminente guasto elettromeccanico
ID Hex Nome attributo Meglio se Descrizione
01 01 Read Error Rate
 
Indica il numero delle volte in cui è capitato un errore di lettura hardware avvenuto leggendo un dato dalla superficie del disco. Un valore diverso da zero indica un problema della superficie del disco o delle testine di lettura/scrittura. Da notare che gli hard-disk Seagate spesso riportano un valore raw, che non indica problemi e può riportare alti valori anche su dischi appena comprati.
02 02 Throughput Performance
 
Generale velocità di banda del disco. Se il valore di questo attributo cala c'è un'alta probabilità che il disco abbia un problema.
03 03 Spin-Up Time
 
Tempo medio che impiega il rotore ad accendersi (da zero RPM alla piena funzionalità [millisecondi]).
04 04 Start/Stop Count Numero dei cicli di start/stop compiuti dal disco.
05 05 Reallocated Sectors Count
 
Numero di settori riallocati. Quando il disco trova un errore di lettura/scrittura/verifica, marca il settore come "riallocato" e trasferisce i dati in una speciale area riservata (spare area). Questo processo è anche conosciuto come "rimappatura" e i settori "riallocati" sono chiamati "remaps". Questo è il motivo del fatto che, nei moderni hard-disk, i settori danneggiati non possono essere trovati testando la superficie infatti tutti i settori danneggiti sono nascosti in settori riallocati. Tuttavia più settori vengono riallocati, più la velocità di lettura/scrittura diminuirà. Una diminuzione di questo attributo indica settori danneggiati

Bibliografia

Collegamenti esterni

Software

Molti software (specifici per sistema operativo) possono rilevare lo stato S.M.A.R.T. dei dischi rigidi della macchina host. Questi software possono anche distinguere il graduale deterioramento (il normale comportamento) da cambiamenti improvvisi (che indicano problemi più seri).