Versione delle 00:09, 18 dic 2012 modifica Rrronny (discussione \| contributi) Utenti autoverificati 4 426 modifiche mNessun oggetto della modifica ← Differenza precedente		Versione delle 00:20, 18 dic 2012 modifica annulla Rrronny (discussione \| contributi) Utenti autoverificati 4 426 modifiche +precisione -ridondanza Differenza successiva →
Riga 4: simulano la navigazione umana nel [[World Wide Web]] attraverso l'implementazione di basso livello dell'[[Hypertext Transfer Protocol]] (HTTP) o l'incorporamento di un vero e proprio [[browser]], come [[Internet Explorer]] o [[Mozilla Firefox]].<ref name=webopedia>{{cita web \|url=http://www.webopedia.com/TERM/W/Web_Scraping.html \|titolo=Web Scraping (su webopedia.com) \|accesso=17 dicembre 2012 \|lingua=en \|deadurl=no \|urlarchivio=http://www.webcitation.org/6CzH9u4z8 \|dataarchivio=17 dicembre 2012}}</ref> Il web scraping è strettamente correlato all'[[indicizzazione]] dei siti [[Internet]]; tale tecnica è attuata mediante l'uso di [[bot]] dalla maggior parte dei [[Motore di ricerca\|motori di ricerca]]. D'altro canto, il web scraping si concentra di più sulla trasformazione di [[Dato\|dati]] non strutturati presenti in Rete, di solito in formato [[HTML]], in ~~informazioni~~[[Metadato\|metadati]] che possono essere memorizzate e analizzate in locale in un [[database~~]] centrale o in un [[foglio elettronico~~]]. Il web harvesting è altresì affine alla [[web automation]], che consiste nella simulazione della navigazione umana in Rete attraverso l'uso di software per [[computer]].</br> Il web scraping si può usare per confrontare prezzi online, monitorare dati meteorologici, rilevare modifiche in un sito internet, nella [[ricerca scientifica]], per il [[mash-up (informatica)\|web mashup]] e il [[data integration (informatica)\|web data integration]]. ==Tecniche==

Web scraping: differenze tra le versioni