Web scraping: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
+precisione -ridondanza
Riga 4:
simulano la navigazione umana nel [[World Wide Web]] attraverso l'implementazione di basso livello dell'[[Hypertext Transfer Protocol]] (HTTP) o l'incorporamento di un vero e proprio [[browser]], come [[Internet Explorer]] o [[Mozilla Firefox]].<ref name=webopedia>{{cita web |url=http://www.webopedia.com/TERM/W/Web_Scraping.html |titolo=Web Scraping (su webopedia.com) |accesso=17 dicembre 2012 |lingua=en |deadurl=no |urlarchivio=http://www.webcitation.org/6CzH9u4z8 |dataarchivio=17 dicembre 2012}}</ref>
 
Il web scraping è strettamente correlato all'[[indicizzazione]] dei siti [[Internet]]; tale tecnica è attuata mediante l'uso di [[bot]] dalla maggior parte dei [[Motore di ricerca|motori di ricerca]]. D'altro canto, il web scraping si concentra di più sulla trasformazione di [[Dato|dati]] non strutturati presenti in Rete, di solito in formato [[HTML]], in informazioni[[Metadato|metadati]] che possono essere memorizzate e analizzate in locale in un [[database]] centrale o in un [[foglio elettronico]]. Il web harvesting è altresì affine alla [[web automation]], che consiste nella simulazione della navigazione umana in Rete attraverso l'uso di software per [[computer]].</br> Il web scraping si può usare per confrontare prezzi online, monitorare dati meteorologici, rilevare modifiche in un sito internet, nella [[ricerca scientifica]], per il [[mash-up (informatica)|web mashup]] e il [[data integration (informatica)|web data integration]].
 
==Tecniche==