Motore di ricerca: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
(26 versioni intermedie di 22 utenti non mostrate) | |||
Riga 1:
Nell'ambito delle tecnologie di [[Internet]], un '''motore di ricerca''' (
==Descrizione==
[[File:Google_2015_logo.svg|thumb|Logo [[Google]], il motore di ricerca più utilizzato al mondo]]
Concettualmente un motore di ricerca è un sistema molto simile ad un'[[applicazione web]] ovvero un sistema [[client]]-[[server]], attraverso la rete [[Internet]], dove il client è rappresentato dal [[web browser]] dell'utente che su richiesta dello stesso si connette ad un [[server]] il quale a sua volta esegue una [[query]] di ricerca, tramite opportuni [[algoritmo|algoritmi]] di ricerca, su dei [[database]] ([[database distribuiti]]). Nell'analisi dei risultati forniti in uscita un componente essenziale è il cosiddetto [[crawler]] o spider. Un buon motore di ricerca è quello che riesce a trovare il maggior numero di contenuti in linea con la tipologia di richiesta ordinandoli per importanza e rilevanza secondo la specifica di ricerca<ref>{{Cita web|url=https://redis.com/nosql/search-engine-databases/|titolo=What is a Search-Engine Database?|sito=Redis|lingua=en
=== Fasi operative ===
Il lavoro dei motori di ricerca si divide principalmente in tre fasi<ref>{{Cita web|url=https://www.webbes.it/come-funziona-un-motore-ricerca/|titolo=Come funziona un motore di ricerca? Alcune tendenze per il futuro.|sito=Alkimedia|data=2017-02-02
* ''analisi'' del campo d'azione (tramite l'uso di [[crawler]] appositi);
Riga 15:
Dopo l'analisi delle pagine, a seconda di criteri che variano da motore a motore, alcune di esse vengono inserite nel [[database]] e nell'indice del motore di ricerca.
La parte testuale archiviata durante la fase di analisi verrà in seguito analizzata per fornire le risposte alle ricerche degli utenti. Molti motori di ricerca sul web rendono anche disponibile una copia dei dati testuali di ogni pagina archiviata per quando la risorsa originale sia irraggiungibile: questa funzione è detta [[cache|copia cache]]<ref>{{Cita web|url=http://www.datacenter.org/research-tools/web-resources/search-engines-databases/|titolo=Search Engines & Databases {{!}} DataCenter|lingua=en
==== Risposta ====
Rispondere alle richieste degli utenti implica la necessità di elencare i siti in ordine di rilevanza rispetto alla richiesta ricevuta.
Per stabilire la rilevanza di un sito vengono cercati nel database quei documenti che contengono la [[Descrittore (informazione)|parola chiave]]<ref>{{Cita web|url=https://www.wordstream.com/seo-keyword|titolo=SEO Keywords: How to Find Keywords for Your Website {{!}} WordStream|accesso=2021-10-26}}</ref> inserita dall'utente, dopodiché ogni motore di ricerca sfrutta propri [[algoritmo|algoritmi]] per classificare le pagine, controllando, per esempio, quante volte le parole chiave vengono ripetute, quanti link riceve quel documento, in quali punti della pagina sono poste le parole chiave, quanti siti del database contengono link verso quella pagina, o quante volte un utente ha visitato quel sito dopo una ricerca<ref>{{Cita web|url=https://www.searchenginewatch.com/2005/09/14/answer-searching-answer-search-engines/|titolo=Answer Searching & Answer Search Engines|sito=Search Engine Watch|data=2005-09-14|lingua=en
==== Raffinamento della ricerca ====
Riga 37:
=== Posizionamento ===
{{vedi anche|Posizionamento (motori di ricerca)}}
Con il termine posizionamento s'intende l'acquisizione di visibilità tra i risultati dei motori di ricerca. Più specificamente, è l'operazione attraverso la quale il sito viene ottimizzato per comparire nei risultati in una posizione il più possibile favorevole e rilevante<ref>{{Cita web|url=https://www.italiaonline.it/risorse/ottimizzazione-seo-quali-sono-le-migliori-tecniche-517|titolo=SEO: cos'è e quali sono le tecniche di ottimizzazione più efficaci {{!}} Italiaonline|sito=Blog Italiaonline
===Ottimizzazione===
Riga 44:
=== Risultati sponsorizzati ===
I motori di ricerca forniscono anche risultati sponsorizzati, ovvero mostrano in maggiore evidenza nelle [[Search engine results page|SERP]] (''Search Engine Result Pages'', Pagine dei risultati dei motori di ricerca) [[Sito web|siti web]] di aziende che pagano per risultare tra i primi risultati quando si cercano termini (detti [[Descrittore (informazione)|parole chiave]]) che sono in relazione all'ambito di competenza dell'azienda stessa<ref>{{Cita web|url=https://www.studiosamo.it/glossario/serp/|titolo=Cos'è una SERP? Definizione, significato, esempi - Studio Samo
== Motori di ricerca più diffusi ==
[[File:Yahoo!_(2019).svg|thumb|Logo [[Yahoo]]]]
[[File:
[[File:Baidu_logo.svg|thumb|Logo [[Baidu]]]]
[[File:Ask.com Logo.svg|miniatura|Logo [[Ask.com]]]]
[[File:Ecosia-like_logo.svg|thumb|Logo [[Ecosia]]]]
I motori di ricerca con maggiore rilevanza internazionale nel 2020 sono<ref>{{Cita web|url=https://www.inspire.scot/blog/2016/11/11/top-12-best-search-engines-in-the-world238|titolo=Top 12 Best Search Engines in The World|accesso=2021-10-26}}</ref><ref>{{Cita web|url=https://www.reliablesoft.net/top-10-search-engines-in-the-world/|titolo=Top 10 Search Engines In The World (2021 Update)|sito=reliablesoft.net|data=2016-12-15|lingua=en
* [[Google]], oltre ad essere di gran lunga il più usato direttamente, è anche quello con il maggior numero di siti che ne utilizzano il [[database]], anche a causa del programma di sponsorizzazione "AdSense per la ricerca" che appartiene al più vasto programma AdSense.
* [[Microsoft]] [[Bing]], motore creato dalla [[Microsoft]] ed usato da Microsoft Network, meglio noto come [[MSN]].
Riga 60:
Altre menzioni importanti sono:
* [[Qwant]], motore di ricerca europeo (Francia) che mira ad offrire all'utente una maggiore privacy.
* [[Mojeek]], motore di ricerca europeo alternativo indipendente (Regno Unito), focalizzato sulla privacy e non basato su altri motori di ricerca.
* [[DuckDuckGo]], motore di ricerca rispettoso della privacy.
* [[Kagi (motore di ricerca)|Kagi]], motore di ricerca a pagamento, senza pubblicità, che evita il conflitto di interessi tipico dei motori finanziati attraverso ricavi pubblicitari. Offre migliore privacy e strumenti di ricerca progettati per gli utenti, non per gli inserzionisti.
* [[Ecosia]], motore di ricerca ecologico tedesco, produce meno [[anidride carbonica]] dei [[server]] concorrenti; l'80% dei proventi viene utilizzato per piantare alberi in giro per il mondo e diminuire il [[disboscamento]], ed è stato fondato in collaborazione con il [[WWF]].
*[https://www.startpage.com/ Startpage], uno dei pochi motori di ricerca al mondo a garantire la [[privacy]], poiché non conserva né registra gli [[Indirizzo IP|IP]] di chi effettua ricerche.
*[[Yahoo!]], ormai totalmente basato su tecnologia Bing.
*[[Ask.com]]
Tra questi ultimi gli unici che sono dotati in parte di un indice proprietario sono [[Qwant]] e in parte DuckDuckGo.
In seguito agli sviluppi dei [[large language model]] è opportuno menzionare anche il motore di ricerca [[Perplexity.ai]] basato su [[chatbot]] [[Elaborazione del linguaggio naturale|NLP]].
=== In Italia ===
Riga 73 ⟶ 77:
[[File:Yandex_logo.svg|thumb|logo Yandex]]
[[File:Logo_Virgilio_2016.svg|thumb|Logo [[Virgilio.it]]]]
[[File:Mojeek logo2020.png|thumb|Logo [[Mojeek]]]]
* Google è utilizzato anche da [[Libero (portale)|Libero]], Virgilio e [[Tiscali (azienda)|Tiscali]] (cosa immediatamente verificabile da chiunque). In Italia il divario fra l'utilizzo di Google e degli altri è talmente vasto che, pur essendo i dati ovviamente variabili, la percentuale delle ricerche effettuate su Google è pari ad un multiplo della somma di tutti gli altri motori di ricerca messi assieme.
* [[Istella| Istella Italia]]<ref>{{Cita web|url=https://www.corrierecomunicazioni.it/digital-economy/istella-l-anti-google-italiano-punta-sul-social/|titolo=Istella, l'anti-Google italiano punta sul social|sito=CorCom|data=2013-03-19|accesso=2021-10-26}}</ref> è un motore di ricerca sviluppato da [[Tiscali (azienda)|Tiscali]] ma, anche se raggiungibile, non risulta aggiornato dal 2016.
Riga 258 ⟶ 264:
|Inattivo
|-
| rowspan="
|Bing
|Attivo
Riga 269 ⟶ 275:
|Lancio
|
|Attivo
|-
|{{Bandiera|ENG}} [[Mojeek]]
|Lancio
|Proprietario
|Attivo
|-
Riga 394 ⟶ 405:
| {{Bandiera|USA}} Coozila! || Lancio
|
|Attivo
|-
|{{Bandiera|DEU}} [[Ecosia]]
Riga 483 ⟶ 494:
|Proprietario
|Inattivo, acquisito da [[Qwant]]<ref>{{Cita news|lingua=fr|url=https://www.lemondeinformatique.fr/actualites/lire-qwant-reprend-xilopix-createur-du-moteur-xaphir-70001.html|titolo=Qwant reprend Xilopix, créateur du moteur Xaphir - Le Monde Informatique|pubblicazione=LeMondeInformatique|accesso=15 gennaio 2018}}</ref>
|-
|2018
|{{Bandiera|USA}} [[Kagi (motore di ricerca)|Kagi]]
|Lancio
|Metamotore + Proprietario
|Attivo
|}
Riga 494 ⟶ 511:
Altri motori di ricerca attivi al marzo 2020, sono: Metager (per la privacy), Serch Encrypt, SearX,Gibiru, YaCy (decentralizzato), Yippi, Lukol e Boardreader.
== Prospettive di sviluppo ==
Le più recenti innovazioni nella produzione di algoritmi e di sistemi di [[Information Retrieval]] si basano sull'analisi semantica dei termini e sulla conseguente creazione di [[reti semantiche]]. La stessa [[Google]] ha adottato sistemi per la prevenzione dell'errore e la contestualizzazione dei risultati<ref>{{Cita web|url=https://faculty.ist.psu.edu/jjansen/academic/jansen_theoretical_constructs.pdf|titolo=faculty.ist.psu.edu}}</ref><ref>{{Cita web|url=https://www.digital-coach.it/seo/information-retrieval/|titolo=Information Retrieval: cos'è, modelli, come si applica alla SEO|sito=Digital-coach.it
È lecito prevedere che nel giro di alcuni anni i motori di ricerca baseranno le proprie tecnologie sia sull'analisi quantitativa dei contenuti (le parole in sé), sia soprattutto su quella qualitativa (il senso delle parole). I motori di ricerca saranno, ad esempio, in grado di distinguere il senso della parola "''pesca''" a seconda di quale sia il contesto in cui la parola è contenuta (capire se sia il frutto, la disciplina sportiva, o altro). Per muoversi in questa direzione Google ha acquisito Oingo (un tempo noto come "il motore dei concetti") e la tecnologia dell'azienda che lo creò, la Applied Semantics<ref>{{Cita web|url=https://digiday.com/media/today-in-history-google-buys-applied-semantics/|titolo=Today in History: Google Buys Applied Semantics|sito=Digiday|data=2013-04-23|lingua=en
=== Il web 2.0 e il futuro dei motori di ricerca ===
Riga 513 ⟶ 531:
I comuni browser contengono una lista predefinita di motori di ricerca (i maggiori) nell'impostazione relativa al motore di ricerca preferito (principale). Qualora un certo motore di ricerca non sia presente è sufficiente eseguire la seguente procedura:
* aprire il motore di ricerca voluto, eseguire una qualsiasi ricerca (ad esempio "ciao");
* copiare l'URL restituita e
* incollare la query nel campo delle impostazioni del browser per l'aggiunta manuale di motori di ricerca e dare il comando di inserimento;
* se lo si vuole, rendere predefinito il motore di ricerca appena inserito.
===Motori di ricerca semiautomatici===
Contrariamente ad alcune aspettative dei primi anni Duemila, i motori di ricerca hanno reso più importante l'attività umana di ricerca e selezione delle fonti più autorevoli.
Le [[biblioteca|biblioteche]] svolgono un'attività di supporto e consulenza in tal senso. Esistono progetti aperti e gratuiti, come Eurekoi, nei quali un utente può porre a una rete di bibliotecari esperti un quesito circa una risorsa per un argomento specifico.<ref>{{cita web|url=https://www.ilpost.it/2023/11/07/eurekoi-biblioteche-francesi/?amp=1|titolo=Il “motore di ricerca umano” composto da 600 bibliotecari francesi}}</ref>
===Deep Research===
Deep Research (letta. ricerca approfondita) Cos'è una funzionalità avanzata gratuita in Google [[Gemini]] e a pagamento in [[ChatGPT]], che, a fronte di alcuni minuti di elaborazione, consente di generare file di alcune pagine con relative fonti citate puntualmente nelle note.<ref>{{Cita pubblicazione|cognome=Google|data=2025-03-04|titolo=Gemini Deep Research Demo {{!}} Using AI to learn new topics in depth|accesso=2025-04-12|url=https://www.youtube.com/watch?app=desktop&si=gaC6FzLnC2Cfiqxx&v=buwMJxvW7wI&feature=youtu.be}}</ref><ref>{{Cita pubblicazione|cognome=IA per tutti|data=2025-02-03|titolo=Nuovo ChatGPT Deep Research è meglio di Google? Tutorial e test|accesso=2025-04-12|url=https://www.youtube.com/watch?app=desktop&si=D2FNbXSN5mtRtymA&v=JAV48qIhvjY&feature=youtu.be}}</ref>
== Note ==
Riga 549 ⟶ 575:
== Altri progetti ==
{{interprogetto|wikt=motore_di_ricerca|preposizione=sul}}
== Collegamenti esterni ==
|