Web sommerso: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Riga 13:
* '''''pagine non collegate''''': pagine Web che non sono collegate a nessun'altra pagina Web. Se l'accesso non è impedito da adeguate impostazioni di sicurezza, il motore indicizza la ''parent directory'' del sito, che contiene non solo le pagine visibili, ma tutto ciò che è caricato nel ''server'' ospitante;
* '''''pagine ad accesso ristretto''''': siti che richiedono una registrazione o comunque limitano l'accesso alle loro pagine impedendo che i motori di ricerca possano accedervi;
* '''''script''''': pagine che possono essere raggiunte solo attraverso ''link'' realizzati in [[JavaScript]] o in [[Adobe Flash|Flash]] e che quindi richiedono procedure particolari;
* '''''contenuti non di testo''''': file multimediali, archivi [[Usenet]], documenti scritti in linguaggio non [[HTML]], in particolare non collegati a ''tag'' testuali (tuttavia alcuni motori di ricerca come Google sono in grado di ricercare anche documenti di questo tipo);
* '''''contenuti banditi dai comuni motori di ricerca perché illegali''''': di questa categoria fanno parte siti pedo-pornografici o snuff, commercio e produzione illegale di droghe e armi, siti sottoposti a censure governative, siti di [[warez]] e [[malware]];
|