Web sommerso: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Riga 1:
{{F|internet|settembre 2021}}[[File:Deepweb graphical representation.svg|miniatura|Rappresentazione grafica stilizzata del ''deep web'']]
Il '''web sommerso''' (o in [[lingua inglese|inglese]] ''deep web'', "web profondo") è l'insieme delle risorse informative del [[World Wide Web]] (www) non indicizzate dai normali [[motore di ricerca|motori di ricerca]].<ref Pername=":0">{{Cita spiegare la mole di dati presente nel ''web|url=https://www.techcompany360.it/tech-lab/deep -web'' -cose-come-entrare-e-cosa-si-rischia/|titolo=Deep utilizzaWeb la metafora dell'[[iceberg]]cos’è, dovecome laentrare parte al di sopra dell'acqua corrisponde a tutte le pagine del web indicizzate dai motori di ricerca: il cosiddetto web accessibile; mentre la parte sostanzialee dell'icebergcosa si trovarischia sommersa(guida e2019 corrisponde al web sommerso.COMPLETA)|sito=TechCompany360|data=2019-10-21|accesso=2021-09-20}}</ref>
 
== Caratteristiche ==
Secondo una ricerca sulle dimensioni della rete condotta nel 2000 da Bright Planet<ref>[http://www.brightplanet.com/ Pioneers in Harvesting the Deep Web]</ref>, un'organizzazione degli [[Stati Uniti d'America]], il Web è costituito da oltre 18 milioni di [[gigabyte|GB]] e 550 miliardi di documenti, mentre [[Google]] ne indicizza solo 2 miliardi, ossia meno dell'uno per cento. Questi dati rimangono approssimativi in quanto il direttore dell'''istituto di informatica e telematica CNR di Pisa'', Domenico Laforenza, ha ammesso che non esistono metriche e tecnologie per misurare l'effettiva ampiezza del Web sommerso.
Per spiegare la mole di dati presente nel ''deep web'' si utilizza la metafora dell'[[iceberg]], dove la parte al di sopra dell'acqua corrisponde a tutte le pagine del web indicizzate dai motori di ricerca: il cosiddetto web accessibile; mentre la parte sostanziale dell'iceberg si trova sommersa e corrisponde al web sommerso.
 
Secondo una ricerca sulle dimensioni della rete condotta nel 2000 da Bright Planet,<ref>[http{{Cita web|url=https://www.brightplanet.com/|titolo=BrightPlanet Pioneers inDeep HarvestingWeb theIntelligence Deepby Web]BrightPlanet|lingua=en-US|accesso=2021-09-20}}</ref>, un'organizzazione degli [[Stati Uniti d'America]], il Web è costituito da oltre 18 milioni di [[gigabyte|GB]] e 550 miliardi di documenti, mentre [[Google]] ne indicizza solo 2 miliardi, ossia meno dell'uno per cento. Questi dati rimangono approssimativi in quanto il direttore dell'''istituto di informatica e telematica CNR di Pisa'', Domenico Laforenza, ha ammesso che non esistono metriche e tecnologie per misurare l'effettiva ampiezza del Web sommerso.
== Differenza tra ''deep web'' e ''dark web'' ==
Il deep web è quella parte del World Wide Web non indicizzata dai comuni motori di ricerca. Di questa categoria fanno quindi parte nuovi siti non ancora indicizzati, [[pagina web|pagine web]] a contenuto dinamico, web software e siti privati aziendali. Il dark web è un sottoinsieme del deep web, solitamente irraggiungibile attraverso una normale connessione Internet senza far uso di software particolari perché giacente su reti sovrapposte ad Internet chiamate genericamente ''[[darknet]]''. Le darknet più comuni sono [[Tor (software)|Tor]], [[I2P]] e [[Freenet]]. L'accesso a queste reti avviene tramite software particolari che fanno da ponte tra Internet e la darknet. Uno dei più famosi è Tor che, oltre a fornire accesso all'omonima rete, garantisce l'anonimato all'utente, permettendogli di navigare anonimamente anche sul normale World Wide Web da uno dei nodi della rete Tor. In alcuni casi certi utenti approfittano dell'anonimato per commettere attività illecite, come la vendita di merce illegale: famoso è il caso di [[Silk Road]], un sito di commercio elettronico sulla rete Tor che effettuava attività criminali.
 
=== Composizione ===
I documenti che fanno parte del Web invisibile possono essere suddivisi nelle seguenti categorie:
 
* '''''contenuti dinamici''''': [[pagine web dinamiche]], ovvero pagine Web il cui contenuto viene generato sul momento dal ''[[server]]'', che possono essere richiamate solo compilando un ''form'' o a risposta di una particolare richiesta;
* '''''pagine non collegate''''': pagine Web che non sono collegate a nessun'altra pagina Web. Se l'accesso non è impedito da adeguate impostazioni di sicurezza, il motore indicizza la ''parent directory'' del sito, che contiene non solo le pagine visibili, ma tutto ciò che è caricato nel ''server'' ospitante;
* '''''pagine ad accesso ristretto''''': siti che richiedono una registrazione o comunque limitano l'accesso alle loro pagine impedendo che i motori di ricerca possano accedervi;
* '''''script''''': pagine che possono essere raggiunte solo attraverso ''link'' realizzati in [[JavaScript]] o in [[Adobe Flash|Flash]] e che quindi richiedono procedure particolari;
* '''''contenuti non di testo''''': file multimediali, archivi [[Usenet]], documenti scritti in linguaggio non [[HTML]], in particolare non collegati a ''tag'' testuali (tuttavia alcuni motori di ricerca come Google sono in grado di ricercare anche documenti di questo tipo);
* '''''contenuti banditi dai comuni motori di ricerca perché illegali''''': di questa categoria fanno parte siti pedo-pornografici o snuff, commercio e produzione illegale di droghe e armi, siti sottoposti a censure governative, siti di [[warez]] e [[malware]];
* '''''software''''': certi contenuti sono nascosti intenzionalmente al normale Internet, e sono accessibili solo con software speciali, come [[Tor (software)|Tor]], [[I2P]] o altri darknet software (ad esempio, Tor consente ai propri utenti di accedere anonimamente a siti che utilizzano il suffisso [[.onion]], nascondendo il loro indirizzo IP).
 
== Differenza tra ''deep web'' e ''dark web'' ==
Il deep web è quella parte del World Wide Web non indicizzata dai comuni motori di ricerca. Di questa categoria fanno quindi parte nuovi siti non ancora indicizzati, pagine web a contenuto dinamico, web software e siti privati aziendali.<ref name=":0" />
 
Il deep''dark web'' è quellaun partesottoinsieme del World''deep Wideweb'', Webe nonrappresenta indicizzatai daicontenuti comuniaccessibili motoripubblicamente dima ricerca.ospitati Di questa categoria fanno quindi parte nuoviin siti non ancora indicizzati, [[pagina web|pagine web]]il acui contenutoindirizzo dinamico,IP web software e siti privatiè aziendalinascosto.<ref Ilname=":0" dark/> webSolitamente èessi unsono sottoinsieme del deep web, solitamente irraggiungibileraggiungibili attraverso una normale connessione Internet senza far uso di software particolari perché giacentegiacenti su reti sovrapposte ad Internet, chiamate genericamente ''[[darknet]]''. Le darknet più comuni sono [[Tor (software)|Tor]], [[I2P]] e [[Freenet]]. L'accesso a queste reti avviene tramite software particolari che fanno da ponte tra Internet e la darknet.: Unouno dei più famosi è Tor che, oltre a fornire accesso all'omonima rete, garantisce l'anonimato all'utente, permettendogli di navigare anonimamente anche sul normale World Wide Web da uno dei nodi della rete Tor. In alcuni casi certi utenti approfittano dell'anonimato per commettere attività illecite, come la vendita di merce illegale: famoso è il caso di [[Silk Road]], un sito di commercio elettronico sulla rete Tor che effettuava attività criminali.
 
In alcuni casi certi utenti approfittano dell'anonimato per commettere attività illecite, come la vendita di merce illegale: famoso è il caso di [[Silk Road]], un sito di commercio elettronico sulla rete Tor che effettuava attività criminali.
 
== Note ==