Preservazione digitale: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Voci correlate: HathiTrust e Open Content Alliance
Collegamenti esterni: timetravel.mementoweb.org/
 
(24 versioni intermedie di 14 utenti non mostrate)
Riga 1:
La '''conservazionepreservazione digitale''' è il complesso di attività volte a garantire la durata nel [[tempo]] e la conservazione delle informazioni in formato digitale. La conservazionepreservazione digitale è definita come tale solo quando è a lungo termine e sicura da eventuali errori di conservazione per eventuali recuperi delle stesse informazioni per tutto il periodo in cui l'informazione è conservata.
 
==Descrizione==
La conservazionepreservazione digitale può essere vista come l'insieme dei processi e delle attività che assicurano un accesso continuo alle informazioni digitali, nonché a tutti tipi di registrazioni ed eredità scientifico-culturali in formato digitale. Sono incluse sia le informazioni che sono state [[Digitalizzazione|digitalizzate]] (cioè che avevano un'origine analogica), sia quelle nate sotto forma digitale e senza una controparte analogica. Nel linguaggio delle immagini digitali e delle risorse elettroniche, la conservazione non risulta più essere soltanto il prodotto di un programma ma un processo in continua evoluzione. In questo ambito l'informazione digitale è conservata affinché sia assicurata una sua longevità nel tempo. La conservazione a lungo termine di informazioni digitali è accompagnata dall'inserimento di [[metadati]] di conservazione]].
 
Le eredità culturali della [[società (sociologia)|società]] umana possono essere conservate sotto diverse forme materiali come la [[Roccia|pietra]], la [[pergamena]], il [[bambù]], la [[carta]], eccetera. In questa era una grande quantità di informazioni esiste in forma digitale come i siti di news, i blog, i siti di social networking, i siti di conservazione di immagini e siti che cambiano il loro contenuto nel tempo. Secondo dati riportati da [[Brewster Kahle]], fondatore nel 1996 di [[Internet Archive]], nell'articolo ''Preserving the Internet'' pubblicato su [[Scientific American]] nel 1998, la durata media di una [[Uniform Resource Locator|URL]] era di 44 giorni.<ref>Brewster Kahle [https://web.archive.org/web/19980627072808/http://www.sciam.com/0397issue/0397kahle.html/ ''Preserving the Internet''. «Scientific American», 276 (1997), n. 3, p. 72-74.] Verificato il 5 febbraio 2011</ref>
 
La caratteristica unica di un'informazione in forma digitale fa sì che il suo contenuto possa essere facilmente aggiornato ma allo stesso tempo comporta molte difficoltà nella sua conservazione nel tempo.
 
Il termine dell'inglese informatico ''storage'' (letteralmente "immagazzinamento") in italiano si traduce con ''archiviazione'' o ''conservazione/preservazione'', a seconda del contesto.
 
== Deterioramento fisico ==
Il primo problema affrontato nella conservazione di dati digitali risiedeè sullegato al fatto che i [[Supporto di memorizzazione|mediasupporti]], nei quali sono conservate le informazioni, sono più vulnerabili al deterioramento e a [[Disastro|catastrofi]] naturali. La [[carta]] si deteriora in termini di [[brillantezza]] e di coloritura, ma questo stesso deterioramento diviene visibile dopo almeno 10dieci decenni; e quando il deterioramento avviene realmente, esso viene solo molte decadi dopo. È anche possibile recuperare tutte le informazioni senza alcuna perdita anche dopo che il deterioramento ha mostrato i suoi effetti. I dati registrati in forma digitale si deteriorano in molto meno tempo, una volta che il deterioramento è cominciato in molti casi i dati sono irrimediabilmente persi. Questa caratteristica dei dati digitali lascia molto poco tempo tra la decisione di una conservazione degli stessi dati e la messa in atto della conservazione.
 
===Obsolescenza digitale===
Riga 15 ⟶ 17:
Un altro problema, forse anche più serio ed importante, è il problema dell'accesso a lungo termine. La [[tecnologia]] digitale si sta sviluppando in modo molto veloce e il modo di recuperare informazioni digitali può risultare obsoleto in pochi anni. Quando un software o una tecnologia per la decodifica di un'informazione digitale viene abbandonata oppure l'hardware sul quale l'informazione è conservata non è più disponibile, le informazioni registrate possono essere facilmente perdute semplicemente perché non sono più raggiungibili. Questo processo è conosciuto anche come [[obsolescenza digitale]].
 
Questo problema è dovuto alla mancanza di [[standard (informatica)|standard]], protocolli e metodi di conservazionepreservazione digitale stabiliti<ref>Levy, D. M. & Marshall, C. C. (1995), ''Going digital: a look at assumptions underlying digital libraries'', in "Communications of the ACM", 58, No. 4: pp. 77-84.</ref>: ad esempio, in passato sono state conservate copie di dati su nastri e gli standard per questa tecnologia sono cambiati enormemente negli ultimi anni, pertanto non c'è alcuna garanzia che gli stessi siano leggibili anche in futuro<ref>Flugstad, Myron (2007), ''Website Archiving: the Long-Term Preservation of Local Born Digital Resources'', Arkansas Libraries vol. 64 n. 3 (autunno 2007) pp. 5-7.</ref>.
 
== Strategie ==
Vi sono diverse strategie per la conservazione di dati digitali nel tempo.
 
=== Refreshing ===
 
Il ''refreshing'' (aggiornare, ricaricare)<ref>{{cita web|url=https://www.wordreference.com/enit/refreshing|titolo=Word Reference: "ristororefreshing")|accesso=3 gennaio 2019}}</ref> è il trasferimento di dati tra due supporti digitali dello stesso tipo; in questo modo non ci sono cambi o alterazioni della rappresentazione binaria dei dati<ref name=":0">Cornell University Library. (2005) [http://dpworkshop.org/dpm-ita/index.html Politiche di gestione della conservazione delle collezioni digitali: Strategie a breve termine per contrastare problemi a lungo termine] {{webarchive|url=https://web.archive.org/web/20140114071306/http://dpworkshop.org/dpm-ita/index.html |data=14 gennaio 2014 }}</ref>. PerUn esempio, è il trasferimento di dati del [[censimento]] di una popolazione da un [[compact disc]] ad un altro. Questa strategia deve essere combinata con quella della migrazione (vedi ''infra'') quando il software o l'hardware richiesto per leggere i dati non è più disponibile o non è adatto a leggere il formati dei dati stessi. La strategia del ''refreshing'' può diventare necessaria nei casi di deterioramento fisico del supporto.
 
=== Migrazione ===
La migrazione è il trasferimento dei dati su un nuovo sistema, o anche su supporti digitali diversi. Questa strategia può comportare la conversione delle risorse da un formato a un altro (per esempio la conversione di un documento Word ad uno [[Portable Document Format|PDF]] o [[OpenDocument]]), da un sistema operativo ad un altro (ad esempio da [[Solaris (sistema operativo)|Solaris]] a [[Linux]]) o da un [[linguaggio di programmazione]] ad un altro (ad esempio dal [[C (linguaggio)|linguaggio C]] a [[Java (linguaggio di programmazione)|Java]]) in modo che la risorsa resti pienamente accessibile e funzionale. I dati che hanno subito il processo di migrazione corrono il rischio di perdere alcuni tipi di funzionalità che i nuovi formati sono incapaci di lavorare o leggere, oppure può succedere che il convertitore, o il programma, utilizzato per la conversione sia incapace di interpretare tutte le particolarità del formato originale.<br />
La [[National Archives and Records Administration]] e la [[Lockheed Martin]] stanno sviluppando un sistema di migrazione dei dati che conserverà intatto qualsiasi tipo di documento, creato con qualsiasi applicazione, su qualsiasi piattaforma o con qualsiasi tipo di medium digitale. Con questo tipo di sistema i file sono trasformati in formati flessibili, come l'[[XML]]; essi saranno perciò accessibili facilmente da nuove tecnologie in futuro. La Lockheed Martin ritiene che sarà impossibile sviluppare un sistema di [[emulazione]] per gli archivi del National Archives and Records Administration perché il volume dei dati ed il costo sarebbero eccessivi.
 
Riga 45 ⟶ 47:
La sostenibilità digitale comprende una serie di questioni e di problematiche riguardanti la longevità delle informazioni digitali.<ref>Bradley, K. (Summer 2007). Defining digital sustainability. Library Trends v. 56 no 1 p. 148-163.</ref> A differenza delle strategie e delle soluzioni tradizionali, sia a breve termine che a lungo termine, la sostenibilità digitale implica un metodo di conservazione più attivo e continuo. Si concentra meno sulla soluzione e sulla tecnologia e maggiormente sulla costruzione di una struttura e di un approccio che sia flessibile, con una particolare attenzione ad interoperabilità, mantenimento regolare nel tempo e sviluppo costante.<ref>[http://www.tasi.ac.uk/advice/managing/sust.html Sustainability of Digital Resources. (2008). ''TASI: Technical Advisory Service for Images.''] {{webarchive|url=https://web.archive.org/web/20080304023605/http://www.tasi.ac.uk/advice/managing/sust.html |data=4 marzo 2008 }}</ref> La sostenibilità digitale incorpora metodi applicati nell'oggi che facilitano l'accesso e la disponibilità del materiale digitale nel futuro più o meno lontano.
 
== Standard di conservazionepreservazione digitale ==
{{Vedi anche|Open Archival Information System}}
Per standardizzare la pratica della conservazionepreservazione digitale e fornire un insieme di raccomandazioni per l'attuazione del programma di conservazione, è stato sviluppato un modello di riferimento per un sistema aperto di informazioni sull'archiviazione (Open Archival Information System, OAIS). Il modello di riferimento (ISO 14721:2003) include le seguenti direttive che un archivio OAIS dovrebbe sempre rispettare:
* Negoziare e scambiare informazioni appropriate con i produttori dei dati digitali;
Riga 58 ⟶ 60:
L'OAIS si occupa di tutti gli aspetti tecnici del ciclo di vita di un oggetto digitale: dall'immissione in un archivio allo stoccaggio nella infrastruttura di conservazione, dalla gestione dei dati, all'accessibilità e alla distribuzione. Il modello si occupa anche dei problemi riguardanti i metadati e raccomanda che siano cinque i tipi di metadati da associare a un oggetto digitale: il riferimento (identificazione) dell'oggetto, la provenienza (tra cui una cronologia della conservazione), il contesto, la fissità (indicatori di autenticità), e la rappresentazione (formattazione, struttura dei file, e cosa "conferisce significato al bitstream dell'oggetto".<ref name=":0" />
 
Prima della proposta di Gladney degli Oggetti digitali certificati (TDO) è stato il Research Library Group (RLG) a sviluppare gli "attributi e le responsabilità" che denotano la prassi di un "Deposito digitale certificato" (''Trusted Digital Repository'' o TDR). I sette attributi di un TDR sono: "la conformità con il modello di riferimento per un Archival Open Information System (OAIS), la responsabilità amministrativa, la sostenibilità organizzativa, la sostenibilità finanziaria e tecnologica e l'adeguatezza procedurale, la sicurezza del sistema, la responsabilità di procedura". Tra le responsabilità del RLG vi sono anche le raccomandazioni per lo sviluppo di un sistema collaborativo di ''[[repository]]'' digitale, e la condivisione di ricerche e informazioni sulla conservazionepreservazione digitale anche sugli aspetti che riguardano i diritti di [[proprietà intellettuale]]<ref>Research Libraries Group. (2002). [http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf/ Trusted Digital Repositories: Attributes and Responsibilities] {{webarchive|url=https://web.archive.org/web/20080220153831/http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf/ |data=20 febbraio 2008 }}</ref>.
 
== Standard di conservazione dell'audio digitale ==
 
Nel gennaio [[2004]] il Consiglio sulle risorse bibliografiche e informative (''Council on Library and Information Resources'' o CLIR) ha organizzato una riunione di esperti di suono per discutere sulle migliori pratiche di conservazione di [[audio digitale]]; la riunione produsse un rapporto consegnato nel marzo [[2006]]. Questo rapporto indaga sulle procedure per la riformattazione del suono da [[analogico]] a digitale e riassume le discussioni e le raccomandazioni per le migliori pratiche di conservazionepreservazione digitale. Gli esperti distribuirono una serie di 15 raccomandazioni per migliorare la pratica di trasferimento del segnale audio analogico al digitale per l'archiviazione:
 
* Sviluppare competenze di base nel campo dell'ingegneria della conservazione audio. I partecipanti hanno preso atto, con preoccupazione, che il numero di esperti qualificati per il trasferimento e l'archiviazione digitale di vecchie registrazioni audio si sta restringendo e ha sottolineato la necessità di trovare un modo per garantire che le conoscenze tecniche degli esperti possano essere condivise con le generazioni successive;
Riga 81 ⟶ 83:
Linee guida aggiornate sulle tecniche per la creazione e la conservazione di materiale audio digitale sono state pubblicate anche dalla International Association of Sound and Audiovisual Archives (IASA).<ref>[http://www.iasa-web.org/tc04/audio-preservation IASA (2009). Guidelines on the Production and Preservation of Digital Audio Objects] {{webarchive|url=https://web.archive.org/web/20150508171039/http://www.iasa-web.org/tc04/audio-preservation |data=8 maggio 2015 }}</ref>
 
== Esempi di iniziative di conservazionepreservazione digitale ==
* '''[[Xena (software)|Xena]]''' è un software libero per l'archiviazione basato su [[Piattaforma Java|Java]] che può essere installato su qualsiasi PC. Converte documenti proprietari, elementi grafici e file audio in formati aperti e normalizza gli altri file binari in [[ASCII]] con un [[wrapper]] file XML;
* '''ArchivalWare''' (realizzato dalla PTF Inc.) è una {{chiarire|soluzione di biblioteca digitale}} creata appositamente per accogliere, diffondere, conservare e consentire l'individuazione di risorse digitali. Il prodotto crea file [[PDF]] per la conservazionepreservazione digitale a lungo termine e include il supporto per metadati XMP, che consente ai metadati l'incorporamento permanente nell'oggetto digitale stesso;
* '''[[DSpace]]''' è un [[software]] [[open source]] che accetta dati digitali in diversi formati (testo, video, audio), li distribuisce attraverso il web, li indicizza (per un facile reperimento), e li conserva nel tempo;
* La '''[[British Library]]''' è responsabile di diversi programmi nel settore della conservazionepreservazione digitale. L'Archivio nazionale del Regno Unito ha anche aperto la strada a varie iniziative nel campo della conservazionepreservazione digitale;
* '''PADI''' è un archivio completo d'informazioni sul tema della conservazionepreservazione digitale della [[National Library of Australia]];
* '''SimpleDL''' è in grado di memorizzare più formati, inclusi testi, immagini, video, audio e dati. SimpleDL utilizza Amazon S3 per fornire il 99,999999999% di durabilità dei dati digitali conservati nel proprio archivio.
 
=== Iniziative di conservazionepreservazione digitale su larga scala ===
Molte biblioteche e molti archivi hanno iniziato o stanno per avviare "Iniziative di conservazionepreservazione digitale di grandi dimensioni" (''Large-Scale digital preservation initiatives'' o LSDI). I protagonisti sono istituzioni culturali, società commerciali come [[Google]] e [[Microsoft]], e gruppi non profit, tra cui la [[Open Content Alliance]] (OCA), il [[Million Book Project]] (MBP), e [[HathiTrust]]. La motivazione principale di questi gruppi è quella di espandere l'accesso alle risorse accademiche, in una visione soprattutto a lungo termine.
 
Circa trenta istituzioni culturali, tra cui i dodici membri del Comitato per la cooperazione istituzionale (''Committee on Institutional Cooperation'' o CIC), hanno firmato accordi di digitalizzazione sia con Google che con Microsoft. Molti di queste istituzioni culturali stanno partecipando alla Open Content Alliance (OCA) e al Million Book Project (MBP). Alcune biblioteche sono coinvolte in una sola iniziativa mentre altre hanno diversificato le loro strategie di digitalizzazione attraverso la partecipazione a molteplici iniziative. I principali motivi dichiarati per la partecipazione delle biblioteche a programmi LSDI sono accesso, conservazione, ricerca e sviluppo. Si spera che la conservazionepreservazione digitale faccia sì che il materiale in possesso delle biblioteche rimanga accessibile alle generazioni future. Le biblioteche prevedono in futuro di utilizzare copie digitalizzate come ''[[backup]]'' per le opere a rischio deperimento nel caso in cui queste escano fuori stampa, si deteriorino, si perdano o vengano danneggiate in maniera irreparabile.
 
== Note ==
Riga 100 ⟶ 102:
* [[Memoria digitale]]
* [[Dematerializzazione]]
* ''[[European Register of Microform and Digital Masters]]''
* [[HathiTrust]]
* [[Internet Archive]]
Riga 115 ⟶ 118:
== Collegamenti esterni ==
* {{cita web|http://www.dpconline.org/|DPC website|lingua=en}}
* {{cita web|1=http://www.mylivedocuments.net|2=My Live! Documents project|lingua=en|accesso=13 marzo 2019|urlarchivio=https://web.archive.org/web/20131126053504/http://www.mylivedocuments.net/|dataarchivio=26 novembre 2013|urlmorto=sì}}
* {{cita web|1=http://www.cic.uiuc.edu/index.shtml|2=CIC|lingua=en|accesso=14 settembre 2008|dataarchivio=18 maggio 2008|urlarchivio=https://web.archive.org/web/20080518083051/http://cic.uiuc.edu/index.shtml|urlmorto=sì}}
* {{cita web|1=http://www.library.cmu.edu/Libraries/MBP_FAQ.html|2=MBP|lingua=en|accesso=14 settembre 2008|urlarchivio=https://web.archive.org/web/20081207024208/http://www.library.cmu.edu/Libraries/MBP_FAQ.html|dataarchivio=7 dicembre 2008|urlmorto=sì}}
* {{cita web|1=http://www.opencontentalliance.org/|2=OCA|lingua=en|accesso=13 aprile 2013|urlarchivio=https://web.archive.org/web/20161113015241/http://www.opencontentalliance.org/|dataarchivio=13 novembre 2016|urlmorto=sì}}
* {{cita web|httphttps://www.archive.org/index.php|The Internet Archive|lingua=en}}
*{{cita web|url=https://archive.is/|titolo=Servizio di cattura e archiviazione di pagine Internet|lingua=en|sito = archive.is, .fo, .today}}
* {{cita web|http://dlib.org/dlib/july04/lavoie/07lavoie.html|"Thirteen Ways of Looking at...Digital Preservation"|lingua=en}}
* {{cita web|http://www.icpsr.umich.edu/dpm/dpm-eng/contents.html|Cornell University Library's ''Digital Preservation Tutorial''|lingua=en}}
* {{cita web | url = http://archive.wikiwix.com/ | titolo = Servizio di ''caching'' automatico dei collegamenti esterni | lingua = en, fr | urlarchivio = httphttps://archive.is/fK2B720181021130332/http://www.dzs.hr/Hrv/pxweb2003/database/Naselja%20i%20stanovnistvo%20Republike%20Hrvatske/4%20Stanovnistvo%20naselja/4%20Stanovnistvo%20naselja.asp# | sito = archive.wikiwix.com | accesso = 1 | dataarchivio = 1921 Ottobreottobre 2018 | urlmorto = no }} (Copyright, attivo su [[Wikipedia in inglese|en.]] e [[Wikipedia in francese|fr.wikipedia]])
* {{cita web|url=http://timetravel.mementoweb.org/|titolo=Aggregatore di vari servizi web di preservazione digitale|urlarchivio=https://archive.li/1cqe0|dataarchivio=15 febbraio 2025|urlmorto=no}} ([[Internet Archive]], [[Archive-It]], [[British Library]], [[archive.today]], [[GitHub]])
* {{cita web | nome = Leighton | cognome = W. Kille | url = https://journalistsresource.org/studies/society/internet/website-linking-best-practices-media-online-publishers | titolo = Il sempre più diffuso problema dei collegamenti interrotti, e le migliori pratiche per i produttori di contenuti del Web | sito = journalistsresource.org | lingua = en | accesso = 30 Ottobreottobre 2018 | urlarchivio = https://web.archive.org/web/20140919162322/https://journalistsresource.org/studies/society/internet/website-linking-best-practices-media-online-publishers | dataarchivio = 19 Settembresettembre 2014 | urlmorto = no}}
 
* {{Thesaurus BNCF}}
{{controllo di autorità}}
{{Portale|informatica|WebInternet}}
 
[[Categoria:Archivistica digitale| ]]
[[Categoria:Recupero dell'informazione]]