Dean Karnazes e Internet Archive: differenze tra le pagine

(Differenze fra le pagine)
Contenuto cancellato Contenuto aggiunto
Botcrux (discussione | contributi)
m Bot: rimuovo "cfr." (vedi discussione)
 
Nessun oggetto della modifica
 
Riga 1:
{{Organizzazione
{{Sportivo
|Nome = DeanInternet KarnazesArchive
|NomeCompletoNome ufficiale =
|ImmagineNome ufficiale2 =
|Logo = Internet Archive logo and wordmark.svg
|Sesso = F
|Abbreviazione =
|CodiceNazione = {{USA}}
|Tipo = [[Organizzazione non governativa|ONG]]
|Altezza =
|PesoAffiliazione =
|Fondazione = [[1996]]
|Disciplina = Ultramaratona
|Fondatore =
|Specialità = [[Ultratrail]]
|Scioglimento =
|Record =
|AnniNazionaleScopo =
|Naz sede = USA
|Nazionale=
|Sede = San Francisco
|PresenzeNazionale(goal) =
|VittorieLink sede =
|PalmaresAltre sedi =
|Area = [[Preservazione digitale]]
|Aggiornato =
|Carica =
|Naz presidente =
|Presidente = [[Brewster Kahle]]
|Lingua =
|Lingua2 =
|Bilancio =
|Anno bilancio =
|Impiegati =
|Anno impiegati =
|Volontari =
|Anno volontari =
|Motto =
}}
{{Sito web
 
|nome = Internet Archive
{{Bio
|didascalia = Il logo del sito
|Nome = Dean
|Cognomelucro = KarnazesNo
|tipo = [[Biblioteca digitale]]
|PostCognomeVirgola = nato '''Constantine Karnazes August'''
|Sessolingua = Men
|autore = [[Brewster Kahle]]
|LuogoNascita =
|registrazione = facoltativa
|GiornoMeseNascita = 23 agosto
|stato corrente = attivo
|AnnoNascita = 1962
|LuogoMorte =
|GiornoMeseMorte =
|AnnoMorte =
|Attività = atleta
|Attività2 =
|Nazionalità = statunitense
|Categorie = no
|PostNazionalità =  di [[ultramaratona]] e [[ultratrail]]
}}
[[File:Internet Archive headquarters exterior February 2008.jpg|thumb|Internet Archive ha avuto sede nel [[Presidio of San Francisco]], una ex base militare degli Stati Uniti a [[San Francisco]], dal [[1996]] al [[2009]]]]
[[File:christian science church122908 02.jpg|thumb|right|La nuova sede di Internet Archive dal novembre 2009, al 300 di Funston a [[San Francisco]], un'ex chiesa [[cristianesimo scientista|cristiana scientista]]]]
[[File:Wayback Machine logo 2010.svg|miniatura|Il logo di Wayback Machine, usato da novembre 2001]]
[[File:Internet Archive - Bibliotheca Alexandrina.jpg|thumb|''[[Mirror (informatica)|Mirror]]'' di Internet Archive alla [[Bibliotheca Alexandrina]], ([[Egitto]])]]
'''Internet Archive''' è una [[biblioteca digitale]] ''[[Organizzazione non a scopo di lucro|non profit]]'' che ha lo scopo dichiarato di consentire un "accesso universale alla conoscenza"<ref>{{en}}[https://archive.org/about/faqs.php#296 Internet Archive Frequently Asked Questions] {{webarchive|url=http://archive.wikiwix.com/cache/20130415120255/https://archive.org/about/faqs.php |data=15 aprile 2013 }}</ref><ref>{{en}}[https://archive.org/details/SDForumBK Internet Archive: Universal Access to all Knowledge]</ref>. Essa offre uno spazio digitale permanente per l'accesso a collezioni di materiale digitale che include, tra l'altro, siti web, audio, immagini in movimento (video) e libri. Internet Archive fu fondato da [[Brewster Kahle]] nel [[1996]] e fa parte della IIPC ([[International Internet Preservation Consortium]]).<ref>{{en}}[http://netpreserve.org/about/memberList.php Members] {{webarchive|url=https://web.archive.org/web/20100613021711/http://netpreserve.org/about/memberList.php |data=13 giugno 2010 }} (International Internet Preservation Consortium)</ref> In aggiunta alla sua funzione primaria di archiviazione, Internet Archive è un'organizzazione attivista che si batte per una [[Internet]] libera ed aperta ed è un'associazione ''non profit'' riconosciuta ufficialmente negli [[Stati Uniti d'America]].
 
Gli uffici amministrativi hanno sede a [[San Francisco]] mentre i ''[[data center]]'' sono collocati a San Francisco, a [[Redwood City]] e a [[Mountain View (California)|Mountain View]], in [[California]]. La più massiccia collezione digitale della biblioteca è l'archivio web, una sorta di raccolta di "fermi immagine" del World Wide Web catalogati secondo la data di acquisizione. Per assicurare la stabilità e la sicurezza dei dati archiviati, l'intera collezione ha un ''[[Mirror (informatica)|mirror]]'' nei server della [[Bibliotheca Alexandrina]] in [[Egitto]]. L'archivio permette al pubblico il caricamento e lo scaricamento di materiale digitale da e verso i suoi server a costo zero.
==Generalità==
[[File:Dean Karnazes at Napa Valley Marathon 2008.jpg|thumb|Dean Karnazes all'expo della Napa Valley Marathon, 2008]]
 
Esso inoltre permette l'accesso a uno dei più vasti progetti di archiviazione digitale di libri esistente, è parte dell'[[American Library Association]] ed è ufficialmente riconosciuto dallo stato della California come biblioteca pubblica.<ref>{{en}}[https://archive.org/iathreads/post-view.php?id=121377 "Internet Archive officially a library"] {{webarchive|url=http://archive.wikiwix.com/cache/20160901142208/https://archive.org/iathreads/post-view.php?id=121377 |data=1º settembre 2016 }}, 2 maggio 2007.</ref> La società conta 200 dipendenti, molti dei quali impegnati nello ''scanning'' di volumi cartacei presso i centri specializzati. L'ufficio principale di San Francisco conta trenta dipendenti. Internet Archive ha un ''budget'' annuale di circa 10 milioni di dollari derivanti in massima parte da una varietà di fonti: i profitti dei servizi riguardanti il ''[[crawler|web crawling]]'', collaborazioni varie, sovvenzioni, donazioni, e la Kahle-Austin Foundation.<ref>{{en}}[http://www.cabinetmagazine.org/issues/10/womack.php CabinetMagazine.org] {{webarchive|url=https://web.archive.org/web/20130319144336/http://cabinetmagazine.org/issues/10/womack.php |data=19 marzo 2013 }}</ref>
Considerato, nel 2005, dalla rivista ''[[TIME|Time's Magazine]]'' una delle 100 persone più influenti al mondo<ref>Vedi l<nowiki>'</nowiki>''[http://idaimakaya.com/?page_id=1044 intervista]'' di Idai Makaya, gennaio 2010. Confronta anche il [http://www.ultramarathonman.com/web/about/bio.shtml Sito personale].</ref>; dalla rivista ''[[Men's Fitness]]'' come uno degli sportivi più in forma; dalla rivista ''Sports Illustrated for Women'' lo sportivo più sexy<ref>''[http://www.sfgate.com/sports/article/Karnazes-runs-with-purpose-passion-precision-2740805.php Karnazes runs with purpose, passion, precision]''.</ref>, Dean Karnazes è soprattutto noto per aver compiuto imprese [[sport estremi|sportive estreme]] nel campo dell'ultratrail, su distanze cioè che generalmente superano i canonici 42,195 metri della [[Maratona (atletica leggera)|maratona]] e si svolgono in ambienti naturali e difficili, spesso molto impegnativi, in condizioni di auto o semi-sufficienza alimentare.
 
Secondo il sito web di Internet Archive "molte società danno importanza alla conservazione di manufatti riguardanti la loro eredità culturale. Senza questi manufatti la civiltà non ha [[memoria collettiva|memoria]] e non ha modo di imparare dai propri successi e dai propri fallimenti. La nostra cultura ora produce sempre più prodotti in forma digitale. La missione di Internet Archive è di aiutare a conservare questi manufatti e creare una biblioteca digitale su Internet per ricercatori, storici e studiosi".
Dean Karnazes, laureato in economia e impiegato in una società, ha pubblicato nel [[2005]] un libro autobiografico<ref>Dean Karnazes, ''Ultramarathon Man: Confessions of an All-Night Runner'', Tarcher/Penguin, 2006. ISBN 978-1-58542-278-4</ref> nel quale ripercorre le tappe fondamentali della sua vita come uomo e come atleta, narrando più in dettaglio gli eventi che lo hanno visto impegnato in alcune delle più ardue competizioni, quali la prestigiosa [[Western States Endurance Run]], competizione di circa 161 Km con un dislivello positivo complessivo di circa 5500 metri fra le cime della [[Sierra Nevada]] in [[California]]; la difficilissima [[Badwater Ultramarathon]]<ref>Sito ufficiale della [http://www.badwater.com/ Badwater Ultramarathon].</ref>, competizione di 217 Km che attraversa la [[Death Valley]] con temperature che possono superare i 50 °C; la prima [[Maratona (atletica leggera)|maratona]] al [[Polo Sud]] (3355 metri di quota); e altre ancora.<ref>[http://www.publishersweekly.com/978-1-58542-278-4 Ultramarathon Man], ''publishersweekly.com''.</ref> Il testo, in quell'anno, è stato uno fra i più venduti al mondo nel settore dello sport, raggiungendo la settima posizione.<ref>Vedi la [http://www.time.com/time/specials/2007/time100walkup/article/0,28804,1611030_1610841_1609861,00.html scheda] presentata al ''Time's Magazine'' nel 2007 per la canditatura di Dean Karnazes quale "persona fra le più influenti".</ref>
 
==Biografia Storia ==
Brewster Kahle fondò Internet Archive nel 1996, nello stesso periodo in cui fondò la società [[Alexa Internet]], compagnia impegnata in servizi di ''[[web crawling]]''. Internet Archive ha iniziato ad archiviare il [[World Wide Web]] dal 1996, ma la collezione non fu accessibile fino al [[2001]], quando fu sviluppata la Wayback Machine. Nel 1999, Internet Archive si espanse aggiungendo altre raccolte tra cui il [[Prelinger Archive]]. L'Internet Archive comprende attualmente, tra l'altro, testi, audio, immagini in movimento e software. Ospita una serie di altri progetti tra cui un archivio di immagini della [[NASA]], il servizio di indicizzazione [[Archive-It]] e [[Open Library]], un catalogo di volumi editabile tramite un software simile a un wiki.
{{quote|'''[<small>Perché corro?</small>]''' Prova a correre tu per 80 chilometri e troverai ''tu'' la risposta.|Karnazes 2006, p. 92}}
 
== Progetti ==
Nel suo primo libro, ''Ultramarathon Man'', Dean Karnazes narra che dopo aver praticato con passione [[corsa campestre]] negli anni del liceo, smise in seguito a un disappunto col suo nuovo allenatore di corsa su pista, e non corse più per quindici anni. In questo periodo completò gli studi laureandosi, cominciò a lavorare nel settore del marketing per una grossa compagnia farmaceutica e si sposò. Conduceva così una vita ordinaria della quale non era però soddisfatto. Il giorno del suo trentesimo compleanno accadde qualcosa che lo cambiò per sempre.<ref name=Karno>Karnazes 2006.</ref>
=== Wayback Machine ===
Wayback Machine è l'interfaccia web utilizzata da Internet Archive per l'estrapolazione dagli archivi dei dati riguardanti siti web. I siti archiviati rappresentano una sorta di "fermi immagine" raccolti al momento dell'acquisizione delle pagine tramite il software di indicizzazione di Internet Archive. Il nome "Wayback Machine" deriva dal termine "''WABAC Machine''" utilizzato in una delle storie della serie animata ''[[Rocky e Bullwinkle]]''.<ref>{{en}}
{{Cita news
|url = http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm
|titolo = ''A Library as Big as the World: Brewster Kahle has the technology to assemble the ultimate archive of human knowledge. What's stopping him? Restrictive copyright laws''
|accesso = 25 giugno 2007
|cognome = Green
|nome = Heather
|data = 28 febbraio 2002
|editore = [[Business Week]] Online
|urlmorto = no
|urlarchivio = https://web.archive.org/web/20020601134105/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm
|dataarchivio = 1º giugno 2002
}}</ref> Il servizio, grazie allo ''[[crawler|spider]]'' di [[Alexa Internet|Alexa]], memorizza nel tempo i cambiamenti e le evoluzioni dei diversi [[siti web]]. Per i siti minori non ha un frequente ''[[cache|caching]]'', ovvero le pagine vengono memorizzate solo raramente.
 
Si rivela un servizio utile nei seguenti casi:
Egli racconta che stava trascorrendo la serata festeggiando con alcuni amici in un night-club di [[San Francisco]], dove viveva, bevendo fino al punto di ritrovarsi ubriaco e depresso. Uscì dall'ingresso di servizio, tornò a casa, indossò un vecchio paio di scarpe da ginnastica, e in [[Boxer (biancheria intima)|boxer]] e maglietta intima cominciò a correre nella notte inoltrandosi verso la [[Silicon Valley]]. Fu così che si trovò a percorrere 48 chilometri.<ref name=Karno/>
*studio dell'evoluzione dei siti Web;
*recupero di pagine e siti andati persi;
*ricerca di prove una volta pubblicate e quindi cancellate.
 
Il servizio permette di accedere a versioni archiviate di pagine web del passato, una sorta di "archivio tridimensionale" secondo le parole di Internet Archive. Milioni di siti web con i rispettivi dati (immagini, testo, documenti collegati, ecc.) sono archiviati in un gigantesco ''database''. Non tutti i siti web sono disponibili a causa della scelta di molti proprietari di siti di escludere i loro siti dall'indicizzazione. Come per tutti i siti basati su dati provenienti da ''web crawler'', inoltre, mancano vaste aree del web per una serie di ragioni tecniche. Diverse problematiche legali riguardanti l'archiviazione e la copertura o meno di siti sono state infine riscontrate negli anni, sebbene queste non siano il risultato di azioni deliberate.<ref>{{en}} Thelwall, M. & Vaughan, L. (2004). ''A fair history of the Web? Examining country balance in the Internet Archive, Library & Information Science Research'', 26(2), 162-176.
In seguito Karnazes cominciò ad allenarsi, correndo prevalentemente di notte per conciliare i suoi impegni lavorativi e familiari, seguendo una tabella di 16 chilometri al giorno per sei giorni la settimana. Puntò alla Western States Endurance Run, gara cui partecipò, per la prima volta, nel 1994, dopo essersi qualificato completando una competizione di 80 chilometri in 8h27'. Dean Karnazes completò così la sua prima WS100<ref>Abbreviazione usuale della [[Western States Endurance Run]], che è corsa sulla distanza di 100 [[Miglio (unità di misura)|miglia terrestri]].</ref> giungendo quindicesimo su 379 concorrenti col tempo di 21h01'14<nowiki>''</nowiki>. L'anno successivo partecipò alla Badwater Ultramarathon ma non riuscì a completarla. Nel 1996 ritentò completando l'impresa. Dean Karnazes ha preso parte più volte a questa gara, una delle più estreme nel panorama delle ultratrail, riuscendo a vincerla nel [[2004]].<ref name=Karno/>
</ref>
 
L'uso del termine "Wayback Machine" nel contesto di Internet Archive è diventato così comune che "Wayback Machine" e "Internet Archive" sono divenuti quasi sinonimi nella [[cultura di massa]]; ad esempio, nella serie televisiva ''[[Law and Order: Criminal Intent]]'' (nell'episodio "Legacy", andato in onda per la prima volta il 3 agosto 2008, intitolato ''[[Episodi di Law & Order: Criminal Intent (settima stagione)#Amore virtuale|Amore virtuale]]'' nella controparte in italiano), uno dei protagonisti dell'episodio utilizza la "Wayback Machine" per scovare la copia archiviata di un sito web. Le "istantanee" dei siti archiviate durante i vari passaggi del ''crawler'' diventano accessibili pubblicamente di solito dopo 6-18 mesi.
Nel [[2002]], insieme ad altri cinque concorrenti, partecipò alla prima maratona in [[Antartide]], con arrivo al Polo Sud.<ref name=Karno/>
 
Esempi di siti web archiviati da Internet Archive e visualizzati attraverso la Wayback Machine:
Nel [[2006]] completò 50 maratone, una al giorno per 50 giorni, in 50 stati diversi degli [[USA]], correndo l'ultima il 5 novembre 2006, la [[maratona di New York]], in 3h00'30<nowiki>''</nowiki>.<ref>Dean Karnazes, ''50/50: Secrets I Learned Running 50 Marathons in 50 Days'', Grand Central Publishing, 2009.</ref>
* [https://web.archive.org/web/*/www.archive.org Internet Archive] ([https://web.archive.org/web/*/https://web.archive.org/web/*/https://archive.org/ archiviazione ricorsiva])
* {{cita web|https://web.archive.org/web/*/www.wikipedia.org|Wikipedia}}
* {{cita web|https://web.archive.org/web/*/www.google.com|Google}}
 
Internet Archive utilizza il protocollo [[Robots Exclusion Standard]] (attraverso il file [[robots.txt]]) per l'esclusione volontaria dei siti dal proprio database. Internet Archive rispetta le direttive del file robots.txt facendo in modo che i suoi bot non indicizzino le pagine. Per questo motivo, Internet Archive ha reso indisponibili un certo numero di siti web che sono del tutto inaccessibili attraverso la Wayback Machine. In caso di siti bloccati, viene archiviato il solo file [[robots.txt]].
Dean Karnazes è padre di due figli, e la sua famiglia, compresi i genitori, lo hanno sempre sostenuto e supportato nelle sue imprese. Il suo impegno nella corsa è anche finalizzato a motivare la gente al [[sport|movimento fisico]]. Ha partecipato, con questo intento, a varie trasmissioni e convegni.
 
L'Internet Archive applica le regole robots.txt con effetto retroattivo: se un sito blocca lo ''spider'' di Internet Archive attraverso il file robots.txt, allora diventano non disponibili tutte le pagine già archiviate dal dominio. Inoltre, lo stesso comportamento è riservato a tutti i siti web che ne fanno esplicita richiesta: per questo, ogni volta che il proprietario di un sito ne chiede l'esclusione dall'indice, si acconsente alla richiesta<ref>{{en}}[https://web.archive.org/collections/web/faqs.html#exclusions ''Some sites are not available because of Robots.txt or other exclusions''].</ref>, non essendo "Internet Archive [...] interessato a preservare o offrire l'accesso a siti Web o ad altri documenti su Internet di proprietà di persone che non vogliono i loro materiali nella nostra collezione".<ref>{{en}}[https://www.archive.org/about/faqs.php#2 ''How can I remove my site's pages from the Wayback Machine?''].</ref>
==Palmarès==
*2000
**Campione mondiale Outodoor [[International Association of Athletics Federations|IAAF]]<ref>Vedi ''[http://www.8264.net/html/outdoor-news/international-outdoor-industry/201003/29-8254.html Road ID Signs Ultra Marathon Man Dean Karnazes]'', ''8264.net''. Vedi anche il sito personale.</ref>
*2004
**Badwater Ultramarathon, I posto in 27h22'48''
**24 ore su pedana: 238 Km<ref>Vedi ''[http://www.chapmanlogic.com/treadathalon/ Treadathalon: 154 miles in 24 hours]'', ''chapmanlogic.com'', 30 aprile 2004.</ref>
*2005
**560&nbsp;km in 80h44' senza interruzioni<ref>Vedi ''[http://www.runnersworld.com/elite-runners/far-out Far Out]'', ''runnersworld.com'', 1 febbraio 2006.</ref>
*2006
**Vermont Trail 100 Mile Endurance Run, I posto
*2008
**4 Deserts Race Series, I posto
*2011
**Distanza di 4,800&nbsp;km: da Disneyland a New York City in 75 giorni
 
Ad esempio, l'indirizzo ''<nowiki>https://web.archive.org/*/https://www.ubuntu-it.org</nowiki>'', mostra le copie consultabili della pagina
==Libri pubblicati==
:''<nowiki>https://www.ubuntu-it.org</nowiki>'',
*Dean Karnazes, ''Ultramarathon Man: Confessions of an All-Night Runner'', Tarcher/Penguin, 2006. ISBN 978-1-58542-278-4
:suddivise in base alla data del salvataggio su Internet Archive.
*Dean Karnazes (con Matt Fitzgerald), ''50/50: Secrets I Learned Running 50 Marathons in 50 Days'', Grand Central Publishing, 2009. ISBN 978-0-446-58184-4
*Dean Karnazes, ''Run: 26.2 Stories of Blisters and Bliss'', Rodale, 2011. ISBN 978-1-60529-279-3
 
=== Open Library ===
==Note==
[[Open Library]], fra i cui fondatori si annovera anche l'attivista digitale [[Aaron Swartz]]<ref>{{cita web|https://openlibrary.org/about|Aaron Swartz Il progetto Open Library}}</ref> è una [[biblioteca digitale]] nata con lo scopo di raccogliere schede per ogni libro mai pubblicato e di catalogarle in un unico database; una sorta di versione ''open source'' di [[WorldCat]], nata in contrapposizione al progetto di digitalizzazione Google Books<ref>{{en}}{{Cita news |nome=Antone |cognome=Gonsalves |titolo=''Internet Archive Claims Progress Against Google Library Initiative'' |url=http://www.informationweek.com/story/showArticle.jhtml?articleID=196701339 |editore=InformationWeek |data=20 dicembre 2006 |accesso=5 gennaio 2007 |urlmorto=no |urlarchivio=https://web.archive.org/web/20071014174528/http://informationweek.com/story/showArticle.jhtml?articleID=196701339 |dataarchivio=14 ottobre 2007 }}</ref> (in italiano, [[Google Libri]]). Il progetto nasce nel 2007 e include alcuni milioni di schede catalografiche e libri digitalizzati nel pubblico dominio interamente accessibili e scaricabili.<ref>{{en}}{{Cita news |titolo=''The Open Library Makes Its Online Debut'' |url=http://chronicle.com/blogs/wiredcampus/the-open-library-makes-its-online-debut/3190 |editore=Chronicle of Higher Education, The Wired Campus |data=19 luglio 2007 |accesso=26 gennaio 2013 |urlarchivio=https://web.archive.org/web/20070930184259/http://chronicle.com/wiredcampus/index.php?id=2235%3F%3Datwc |dataarchivio=30 settembre 2007 |urlmorto=sì }}</ref>
Open Library è un progetto che si basa su software libero e ''open source'', il codice sorgente è interamente accessibile dal sito di riferimento.
A partire da giugno 2010 Open Library offre anche un servizio di prestito di ''[[ebook]]'' svolto in collaborazione col distributore di contenuti digitali statunitense OverDrive e con biblioteche americane
<ref>{{cita web|https://blog.openlibrary.org/tag/borrowing/|Small Moves: Open Library Integrates Digital Lending|26 gennaio 2013}}</ref>.
 
=== Archive-It ===
Sviluppato nel 2006, Archive-It è un servizio che permette a istituzioni ed entità individuali di costruire e preservare collezione di materiale digitale.<ref>{{en}}Stefanie Olsen, [https://www.cnet.com/news/8301-10784_3-6067173-7.html ''Preserving the Web one group at a time''], CNet News.com, 1º maggio 2006.</ref> Attraverso un'applicazione web, i sottoscrittori del servizio possono raccogliere, catalogare, indicizzare e, nel corso di 24 ore, accedere interamente all'archivio. Le collezioni sono ospitate su server di Internet Archive e accessibili al pubblico tramite ricerche ''full-text''. Tutto il materiale digitale è conservato in duplice copia (una primaria e una di ''back up''), viene periodicamente indicizzato nell'archivio generale di Internet Archive e una copia dei dati può essere mandata ai sottoscrittori su richiesta. Al 2009 Archive-It conta 125 istituzioni ''partner'' in 42 stati americani e in 11 nazioni per un totale di 1,5 miliardi di URL e 963 collezioni pubbliche. Le istituzioni che hanno sottoscritto il servizio Archive-It sono in larga parte biblioteche universitarie e di ''college'', archivi di stato, istituzioni federali, musei e organizzazioni culturali, tra cui la [[Electronic Literature Organization]], l'Archivio di Stato della [[Carolina del Nord]], il [[Texas State Library and Archives Commission]], la [[Stanford University]], la [[National Library of Australia]], il [[Research Libraries Group]] (RLG), e molti altri.
 
=== NASA Images ===
Il progetto [[NASA Images]] fu creato grazie ad uno [[Space Act Agreement]] tra Internet Archive e la [[NASA]] per rendere accessibili al pubblico gli archivi delle immagini, dei video e degli audio prodotti dall'agenzia nel corso degli anni attraverso un singolo archivio interamente indicizzato e fruibile tramite ricerche. Il sito web fu lanciato nel luglio del 2008 ed è arrivato a contenere oltre 100.000 files.
 
=== Collezioni di risorse multimediali ===
Oltre agli archivi web, Internet Archive mantiene grosse collezioni di risorse multimediali digitali riconosciute, da chi le ha caricate sul sito, nel pubblico dominio negli Stati Uniti o distribuiti con una licenza che ne rende possibile la redistribuzione libera, come ad esempio le licenze [[Creative Commons]]. Le risorse sono classificate a seconda del tipo di media (immagini in movimento, audio, testo) e in altre sotto-classificazioni secondo vari criteri.
 
==== Collezione di immagini in movimento ====
La collezione di immagini in movimento (''Moving Image Collection'') di Internet Archive comprende: cinegiornali; cartoni animati classici; propagande di guerra; il [[Prelinger Archive]], un archivio speciale che contiene materiale considerato "effimero" come film sponsorizzati da aziende e organizzazioni, film didattici e filmati amatoriali, pubblicità e altro materiale i cui diritti d'autore sono scaduti. Le collezioni di risorse digitali sono molte e variano per argomento e fonte di reperimento; la collezione di ''[[brickfilm]]'', ad esempio, contiene numerosi film girati in ''stop-motion'' con mattoncini Lego; un'altra collezione riguarda le elezioni presidenziali USA del 2004 e la relativa campagna elettorale. La collezione ''Independent News'' comprende una serie di raccolte tra cui quella del concorso del 2001 ''Internet Archive's World At War'', per il quale i concorrenti crearono cortometraggi per dimostrare l'importanza dell'accesso alle informazioni e alla storia. L'archivio riguardante l'attacco alle Torri gemelle dell'[[Attentati dell'11 settembre 2001|11 settembre 2001]] contiene materiale d'archivio prodotto dai principali ''network'' televisivi mondiali sull'evento e andato in onda in diretta quel giorno.
===== Film =====
Nelle collezioni di immagini in movimento sono presenti anche versioni originali di celebri film, tra cui:
{{colonne inizio}}
*''[[Il club dei trentanove]]''
*''[[La corazzata Potëmkin]]''
*''[[La nascita di una nazione]]''
*''[[Giglio infranto (film 1919)|Giglio infranto]]''
*''[[The Century of the Self]]''
*''[[Sciarada (film)|Sciarada]]''
*''[[Columbia Revolt]]''
*''[[Due ore ancora]]''
*''[[Nella morsa delle rotaie]]''
*''[[Il gabinetto del dottor Caligari]]''
*''[[Dating Do's and Don'ts]]''
*''[[Detour (film 1945)|Detour]]''
*''[[Duck and Cover]]''
*''[[Fuga da Sobibor]]''
*''[[Elisabetta d'Inghilterra (film)|Elisabetta d'Inghilterra]]''
*''[[Come vinsi la guerra]]''
*''[[Rapacità]]''
*''[[Hemp for Victory]]''
*''[[Intolerance]]''
*''[[Il monello]]''
{{colonne spezza}}
*''[[Viaggio nella Luna]]''
*''[[Lying Lips]]''
*''[[M - Il mostro di Düsseldorf]]''
*''[[L'uomo che sapeva troppo (film 1934)|L'uomo che sapeva troppo]]''
*''[[Manos: The Hands of Fate]]''
*''[[Manufacturing Consent: Noam Chomsky and the Media]]''
*''[[La notte dei morti viventi (film 1968)|La notte dei morti viventi]]''
*''[[Nosferatu il vampiro]]'' (non di pubblico dominio al di fuori degli Stati Uniti)
*''[[Plan 9 from Outer Space]]''
*''[[The Power of Nightmares]]'' (non di pubblico dominio)
*''[[Tie shan gong zhu]]''
*''[[Reefer Madness (film 1936)|Reefer Madness]]''
*''[[Sex Madness]]''
*''[[Lady Lou]]''
*''[[Il trionfo della volontà]]''
*Tutti e sette gli episodi di ''[[Why We Fight]]''
{{colonne fine}}
 
==== Collezione audio ====
La collezione audio comprende musica, audiolibri, notiziari, vecchie trasmissioni radio e una grande varietà di altri file audio. La collezione ''Live Music Archive'' comprende oltre 50.000 registrazioni di concerti di artisti indipendenti e artisti affermati ed ensemble musicali che adottano norme permissive sulla registrazione dei loro concerti, come i [[Grateful Dead]], e gli [[Smashing Pumpkins]].
 
==== Collezione di testi ====
[[File:Internet Archive book scanner 1.jpg|thumb|Scanner per libri di Internet Archive]]
La collezione comprende testi di libri digitalizzati da varie biblioteche di tutto il mondo così come molte collezioni speciali. Internet Archive dispone di 23 centri di scansione in cinque paesi, per una digitalizzazione di circa 1.000 libri al giorno, finanziata da biblioteche e fondazioni.<ref>{{en}}[https://archive.org/iathreads/post-view.php?id=194217 ''Books Scanning to be Publicly Funded''], annuncio di Brewster Khale, 23 maggio 2008.</ref> Nel novembre 2008, quando c'erano circa 1 milione di testi, l'intera collezione occupava circa 0,5 [[petabyte]], Incluse immagini raw, file PDF, OCR e dati grezzi.<ref>{{en}}[https://blog.openlibrary.org/2008/11/24/bulk-access-to-ocr-for-1-million-books/ "Bulk Access to OCR for 1 Million Books"] {{webarchive|url=https://web.archive.org/web/20081206124013/http://blog.openlibrary.org/2008/11/24/bulk-access-to-ocr-for-1-million-books/ |data=6 dicembre 2008 }}, via Open Library Blog, by raj, November 24, 2008.</ref>
 
Tra il 2006 e il 2008 [[Microsoft Corporation]] instaura un rapporto di collaborazione con Internet Archive attraverso il suo progetto [[Live Search Books]], con la scansione più di 300.000 libri che sono stati aggiunti alla raccolta, nonché con il sostegno finanziario e con le attrezzature di scansione. Il 23 maggio 2008 Microsoft annunciò che avrebbe posto fine al progetto Live Book Search e alla scansione di nuovi libri.<ref name=msdown>{{en}}[https://blogs.msdn.com/livesearch/archive/2008/05/23/book-search-winding-down.aspx "Book search winding down"] {{webarchive|url=https://web.archive.org/web/20080820220749/http://blogs.msdn.com/livesearch/archive/2008/05/23/book-search-winding-down.aspx |data=20 agosto 2008 }}, ''Live Search Blog. Official announcement from Microsoft.'' Last accessed May 23, 2008.</ref> Microsoft ha reso i libri digitalizzati disponibili senza restrizioni contrattuali e ha donato la sua attrezzatura di scansione al suo ex ''partner''.
 
Nell'ottobre del 2007 gli utenti di Internet Archive hanno iniziato il caricamento di libri di dominio pubblico da [[Google Libri]].<ref>{{en}}[https://archive.org/details/googlebooks Google Books at Internet Archive].</ref> Dal mese di gennaio 2010 sono stati raccolti 900.000 libri digitalizzati da [[Google]], che rappresentano oltre la metà dei libri del totale disponibile su archive.org. I libri sono identici alle copie trovate su Google, e sono disponibili per un uso illimitato e per il ''downloading'', come tutti i materiali Internet Archive.
 
Internet Archive è un membro della [[Open Book Alliance]], organizzazione che è stata tra le più critiche nei confronti dell'accordo tra l'associazione degli editori americani e Google per la digitalizzazione di libri.
 
== Note ==
<references/>
 
== Voci correlate ==
==Bibliografia==
* [[Progetto Gutenberg]]
*Dean Karnazes, ''Ultra Marathon Man'', traduzione di Fabrizia Fossati, Piemme, Casale Monferrato 2006.
*[[Archiviazione web]]
* [[Preservazione digitale]]
* [[PANDORA]]
* [[WebCite]]
* [[Web crawler]]
* [[Web 3.0]]
* [[HathiTrust]]
 
== Altri progetti ==
{{interprogetto|q}}
 
== Collegamenti esterni ==
* {{Collegamenti esterni}}
* {{en}} [http://www.ultramarathonman.com/ Sito ufficiale]
* {{Cita news|pubblicazione=[[Scientific American]]|autore=Brewster Kahle|titolo=Archiving the Internet|data=marzo 1997|url=https://www.archive.org/sciam_article.html|urlmorto=sì|urlarchivio=https://web.archive.org/web/19971011050140/http://www.archive.org/sciam_article.html|dataarchivio=11 ottobre 1997}}
* {{Cita news|pubblicazione=[[Corriere della Sera]]|autore=Leonard Berberi|titolo=L'arca della memoria|url=http://lettura.corriere.it/l%E2%80%99arca-della-memoria/|urlmorto=sì|urlarchivio=https://web.archive.org/web/20140722170604/http://lettura.corriere.it/l%E2%80%99arca-della-memoria/|dataarchivio=22 luglio 2014}}
* {{cita web|url= https://m.wikihow.com/Use-the-Internet-Archive%27s-Wayback-Machine|titolo= Guida alla consultazione delle risorse su Internet Archive|sito= [[Wikihow]]|lingua= en}}
 
;Altri Progetti e risorse
*{{cita web|url=https://archive.is/|titolo=Servizio di cattura e archiviazione di pagine Internet|lingua=en}}
*{{cita web|url=http://www.datacite.org/|titolo=Servizio di archiviazione e ricerca avanzata per le pubblicazioni scientifiche|lingua=en}}
*{{cita web|url=https://perma.cc/|titolo= Servizio della Harvard Library Innovation Lab|lingua=en}}
*{{cita web|url= https://www.webcitation.org/|titolo= Servizio di
archiviazione di materiale scientifico ed educativo|lingua=en}}
*{{cita web|url= http://www.mementoweb.org|titolo= NDIIPP statunitense e Content Negotiation|lingua=en}} (servizio di ricerca avanzata)
*{{cita web|url= http://www.pingzic.net/best-wayback-machine-alternatives-in-2016-to-check-history-of-websites/|lingua= en|accesso= 13 Maggio 2018|urlarchivio= http://www.pingzic.net/best-wayback-machine-alternatives-in-2016-to-check-history-of-websites/|titolo= 11 Best Wayback Machine Alternatives in 2017 to Check History of Websites|dataarchivio = 21 Settembre 2017|urlmorto= no}}
 
{{Controllo di autorità}}
{{Portale|atletica leggera|biografieinformatica}}
 
[[Categoria:UltramaratonetiBiblioteche statunitensidigitali]]
[[Categoria:Organizzazioni non governative]]
[[Categoria:Storia digitale]]
[[Categoria:Archivistica digitale]]