Internet Archive: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Storia: Fix +fonte
Etichette: Modifica da mobile Modifica da web per mobile Modifica da mobile avanzata
m Corretto il collegamento Mit con Massachusetts Institute of Technology (DisamAssist)
 
(28 versioni intermedie di 11 utenti non mostrate)
Riga 1:
{{In corso}}{{Organizzazione
|Nome = Internet Archive
|Nome ufficiale =
Riga 37:
|autore = [[Brewster Kahle]]
|registrazione = facoltativa
|stato corrente = temporaneamente offlineattivo
}}
[[File:Internet Archive headquarters exterior February 2008.jpg|thumb|Internet Archive ha avuto sede nel [[Presidio di San Francisco]], una ex base militare degli Stati Uniti a [[San Francisco]], dal [[1996]] al [[2009]]]]
Riga 52:
 
== Storia ==
L'idea dell'internet Archive nacque al [[Massachusetts Institute of Technology|MIT]] negli anni Ottanta. Kahle ne discusse con [[Marvin Minsky]], [[Richard Feynman]] e [[Stephen Wolfram]]. [[Danny Hills]] ideò un [[supercomputer]] che utilizzava il [[calcolo parallelo]], chiamato Connection Machine. Nel 1983 Kahle fu assunto nell'azienda di Hills, la Thinking Machines, che si proponeva di costruire computer in grado di ricercare ogni genere di informazione e di rispondere a domande in linguaggio naturale.<ref name="Civiltà dei dati" />
 
Brewster Kahle fondò Internet Archive nel 1996, nello stesso periodo in cui fondò la società [[Alexa Internet]], compagnia impegnata in servizi di ''[[web crawling]]''. Internet Archive ha cominciato ad archiviare il [[World Wide Web]] nel 1996, ma la collezione non fu accessibile fino al [[2001]], quando fu sviluppata la Wayback Machine. Nel 1999, Internet Archive si espanse aggiungendo altre raccolte tra cui il [[Prelinger Archive]]. L'Internet Archive comprende attualmente, tra l'altro, testi, audio, immagini in movimento e software. Ospita una serie di altri progetti tra cui un archivio di immagini della [[NASA]], il servizio di indicizzazione [[Archive-It]] e [[Open Library]], un catalogo di volumi editabile tramite un software simile a un wiki.
 
Riga 58 ⟶ 60:
Nel marzo 2023 un giudice statunitense di primo grado ha dato ragione a un gruppo di editori che aveva citato l'Internet Archive per violazione del diritto d'autore, sostenendo che la messa a disposizione del pubblico delle copie dei libri digitalizzati non rientrasse nel [[fair use]]. L'internet archive gestisce anche un servizio di Controlled Digital Library che prevede la messa in prestito di un numero di copie digitali di un titolo esattamente pari al numero delle copie possedute regolarmente pagate dalle biblioteche partner del progetto.<ref>{{cita web|url=https://www.ilsoftware.it/articoli.asp?tag=Cos-e-successo-a-Internet-Archive-la-scannerizzazione-dei-libri-non-e-ammessa-per-i-testi-protetti-dal-diritto-d-autore_25792|titolo=Cos'è successo a Internet Archive: la scannerizzazione dei libri non è ammessa per i testi protetti dal diritto d'autore}}</ref>
 
Il 9 ottobre 2024, il sito ha subìto un attacco di [[DDoS]] rendendo il sito web e i servizi annessi non disponibili.<ref>[{{Cita web|url=https://www.wired.it/article/internet-archive-cyberattacco/]|titolo=Che cosa sappiamo del cyberattacco a Internet Archive|autore=Marco Schiaffino|sito=Wired Italia|data=10 ottobre 2024|lingua=it|accesso=24 ottobre 2024}}</ref> Il team di Internet Archive ha dichiarato, che oltre all'attacco DDoS, c'éè stata anche una [[fuga di dati]], perpetrata da parte del gruppo di ''[[Hacktivism|gruppohacktivism]]'' SN_BlackMeta, che ha portato alla compromissione di 31 milioni di account registrati nel sito,<ref>{{Cita web|url=https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/|titolo=}}</ref>,Internet tuttaviaArchive èhacked, statodata confermatobreach dalloimpacts staff31 delmillion users|sito,=BleepingComputer|lingua=en|accesso=24 cheottobre esso2024}}</ref> etuttavia iil suoisito servizisarebbe tornerannotornato onlinein servizio entrodopo qualche giornosettimana.<ref>{{Cita web|url=https://www.theverge.com/2024/10/11/24268040/internet-archive-data-breach-outage-hacked|titolo=}}</ref>The AttacchiInternet diArchive questois tipostill avevanodown colpitobut [[GitHub]]will nelreturn 2018in e‘days, poinot ancheweeks’|autore=Emma [[Drupal]].Roth|sito=The Verge|data=11 ottobre 2024|lingua=en|accesso=24 ottobre 2024}}</ref><ref>{{Cita web|url=https://www.ilsole24ore.com/art/internet-archive-torna-online-cosa-e-successo-AGsuhPY|titolo=Internet Archive torna online. Cosa è successo?|autore=Marco Trabucchi|sito=Il Sole 24 ORE|data=14 ottobre 2024-10-14|lingua=it|accesso=16 ottobre 2024-10-16}}</ref>
 
Al 2024 l'Internet Archive è il sito più utilizzato da anni per la conservazione di pagine web nel lungo termine. Esso comprende 916 miliardi di pagine web, 44 milioni tra libri e testi e 15 milioni di registrazioni audio.<ref>{{Cita web|url=https://web.archive.org/|titolo=Wayback Machine|autore=|sito=archive.org|data=|lingua=en|accesso=2 gennaio 2025}}</ref>
 
== Progetti ==
Riga 99 ⟶ 103:
:''<nowiki>https://www.ubuntu-it.org</nowiki>'',
:suddivise in base alla data del salvataggio su Internet Archive.
 
Nell’ottobre 2025 il sistema ha raggiunto il traguardo della sua trilionesima pagina web indicizzata, pari a circa mille miliardi di scansioni online. Tale cifra include anche copie multiple delle stesse pagine o documenti, come testi o file PDF liberamente accessibili su Internet, archiviati più volte nel corso degli anni.<ref>{{Cita news|nome=Chris |cognome=Freeland|url=https://blog.archive.org/2025/07/01/wayback-machine-to-hit-once-in-a-generation-milestone-this-october-one-trillion-web-pages-archived/|titolo=Wayback Machine to Hit ‘Once-in-a-Generation Milestone’ this October: One Trillion Web Pages Archived|pubblicazione=Internet Archive Blogs|data= 1 luglio 2025 |accesso= 11 ottobre 2025 |urlarchivio=}}</ref>
 
=== Open Library ===
Open Library, fra i cui fondatori si annovera anche l'attivista digitale [[Aaron Swartz]],<ref>{{cita web | 1 = https://openlibrary.org/about | 2 = Aaron Swartz Il progetto Open Library | accesso = 2 maggio 2019 | urlarchivio = https://web.archive.org/web/20150627092210/https://openlibrary.org/about | dataarchivio = 27 giugno 2015 | urlmorto = no }}</ref> è una [[biblioteca digitale]] nata con lo scopo di raccogliere schede per ogni libro mai pubblicato e di catalogarle in un unico database; una sorta di versione ''open source'' di [[WorldCat]], nata in contrapposizione al progetto di digitalizzazione [[Google Libri]].<ref>{{en}}{{Cita news |nome=Antone |cognome=Gonsalves |titolo=''Internet Archive Claims Progress Against Google Library Initiative'' |url=http://www.informationweek.com/story/showArticle.jhtml?articleID=196701339 |editore=InformationWeek |data=20 dicembre 2006 |accesso=5 gennaio 2007 |urlmorto=no |urlarchivio=https://web.archive.org/web/20071014174528/http://informationweek.com/story/showArticle.jhtml?articleID=196701339 |dataarchivio=14 ottobre 2007 }}</ref>. Il progetto nasce nel 2007 e include alcuni milioni di schede catalografiche e libri digitalizzati nel pubblico dominio interamente accessibili e scaricabili.<ref>{{en}}{{Cita news |lingua=en |titolo=''The Open Library Makes Its Online Debut'' |url=http://chronicle.com/blogs/wiredcampus/the-open-library-makes-its-online-debut/3190 |editore=Chronicle of Higher Education, The Wired Campus |data=19 luglio 2007 |accesso=26 gennaio 2013 |urlarchivio=https://web.archive.org/web/20070930184259/http://chronicle.com/wiredcampus/index.php?id=2235%3F%3Datwc |dataarchivio=30 settembre 2007 |urlmorto=sì }}</ref>
Open Library è un progetto che si basa su software libero e ''open source'', il codice sorgente è interamente accessibile dal sito di riferimento.
A partire da giugno 2010 Open Library offre anche un servizio di prestito di ''[[ebook]]'' svolto in collaborazione col distributore di contenuti digitali statunitense OverDrive e con biblioteche americane.<ref>{{cita web|https://blog.openlibrary.org/tag/borrowing/|Small Moves: Open Library Integrates Digital Lending|26 gennaio 2013}}</ref>.
 
=== Archive-It ===
Riga 147 ⟶ 153:
*''[[Manufacturing Consent: Noam Chomsky and the Media]]''
*''[[La notte dei morti viventi (film 1968)|La notte dei morti viventi]]''
*''[[Nosferatu il vampiro]]'' (non di [[Film di pubblico dominio|pubblico dominio]] al di fuori degli Stati Uniti)
*''[[Plan 9 from Outer Space]]''
*''[[The Power of Nightmares]]'' (non di pubblico dominio)
Riga 172 ⟶ 178:
Nel 2016, anche seguito dello scandalo delle [[Elezioni presidenziali negli Stati Uniti d'America del 2016#La riapertura del caso sulle e-mail e gli ultimi giorni di campagna|elezioni presidenziali]], l'Internet Archive avviò una collaborazione con le versioni di Wikipedia in molteplici lingue, elaborando un [[Bot (informatica)|programma]] per la sostituzione automatica dei link non funzionanti nei template di citazione. In loro sostituzione, l'Internet Archive Bot<ref>Si può anche consultare la discussione [[w:en:Wikipedia:Bots/Noticeboard#IABot blue linking to Internet archive books|IABot blue linking to Internet archive books]] del 14 novembre 2019, presente nella [[Wikipedia in inglese|versione inglese di Wikipedia]]</ref> inserisce l'[[URL]] della copia digitale della fonte presente nell'Internet Archive, con un'anteprima di due pagine per [[contesto (linguistica)|contestualizzare]] la citazione.<ref name="wired2019">{{cita web | url = https://www.wired.com/story/internet-archive-wikipedia-more-reliable/# | titolo = The Internet Archive Is Making Wikipedia More Reliable | data = 11 marzo 2019 | urlarchivio = https://archive.is/20191124182836/https://www.wired.com/story/internet-archive-wikipedia-more-reliable/%23 | dataarchivio = 24 novembre 2019 | urlmorto = no | accesso = 24 novembre 2019 }}</ref>
 
Al 2024 è da anni il sito internet più utilizzato per la memorizzazione delle pagine web nel lungo termine. Esso comprende 835 miliardi di pagine web, 44 milioni tra libri e testi e 15 milioni di registrazioni audio.<ref name="Wired.it">{{cita web|url=https://www.wired.it/article/internet-archive-futuro-processi-copyright-brewster-kahle/|titolo=Il destino dell'Internet Archive è appeso a un filo|data=3 novembre 2024}}</ref> Nel settembre 2024 l'Internet Archive ha sottoscritto con [[Google]] un partenariato per rendere visibili su [[Google Search]] le vecchie versioni dei siti indicizzate dalla Wayback Machine.<ref name="Wired.it" />
 
==Sedi==
Nelle parole dello stesso Kahle, l'internet Archive acquistò come sede "una ex Chiesa cristiana scientista" la cui facciata richiamava il ruolo dell'organizzazione.<ref name="Civiltà dei dati">{="Civiltà dei dati">{{cita pubblicazione|rivista=Civiltà dei dati|editore=Fondazione [[Leonardo (azienda) |Leonardo]] |titolo=Brewster Kawle e i ricordi del web|autore=Giuliano Aluffi|pagine=32-34|numero=3|anno=2025|lingua=it}} Citazione finale: "L'internet Archive, ''Civiltà dei dati' ', tutti noi possiamo creare un' infrastruttura aperta per la prossima generazione" </ref>
 
A san Francisco è fisicamente presente solo il 5% dell'archivio completo. Copie sono custodite anche a [[Richmond]] in [[California]], [[Canada]], [[Amsterdam]] e [[Alessandria d'Egitto]] per il suo valore simbolico.<ref name="Civiltà dei dati" />
 
== Note ==
Riga 200 ⟶ 213:
*{{cita web|url=https://perma.cc/|titolo= Servizio della Harvard Library Innovation Lab|lingua=en}}
*{{cita web|url= https://www.webcitation.org/|titolo= Servizio di
archiviazione di materiale scientifico ed educativo|lingua= en|accesso= 2 maggio 2019|dataarchivio= 12 novembre 2017|urlarchivio= https://web.archive.org/web/20171112175235/https://www.webcitation.org/query?url=http%3A%2F%2Fwww.geocities.com%2FWARSAISANDIEGO%2Four_culture.htm&date=2009-10-25+11%3A44%3A57|urlmorto= sì}}
*{{cita web|url= http://www.mementoweb.org|titolo= NDIIPP statunitense e Content Negotiation|lingua=en}} (servizio di ricerca avanzata)
*{{cita web|url= http://www.pingzic.net/best-wayback-machine-alternatives-in-2016-to-check-history-of-websites/|lingua= en|accesso= 13 maggio 2018|urlarchivio= https://web.archive.org/web/20180513223825/http://www.pingzic.net/best-wayback-machine-alternatives-in-2016-to-check-history-of-websites/|titolo= 11 Best Wayback Machine Alternatives in 2017 to Check History of Websites|dataarchivio= 13 maggio 2018|urlmorto= sì}}
 
== Bibliografia ==
* {{Cita libro|autore=Duccio Dogheria|titolo=Internet Archive. Guida non ufficiale alla più innovativa biblioteca digitale del mondo. Nuova edizione|data=2024|url=https://archive.org/details/d.-dogheria-internet-archive.-guida-non-ufficiale-alla-piu-innovativa-biblioteca_202412|editore=Strade bianche di stampa alternativa|città=Pitigliano|lingua=it|}}
 
{{Controllo di autorità}}
 
{{Piattaforme di distribuzione digitale}}
 
{{Portale|informatica}}