Wikipedia:Bar/Discussioni/Un bot per sistemare i link rotti su itwiki
Un bot per sistemare i link rotti su itwiki |
20,5 KB · Atom | 29 giugno 2017, 11:28
- Veloce traduzione di Lucas, la versione in lingua originale del messaggio è reperibile qui: --Lucas ✉ 08:12, 8 mag 2017 (CEST)
Ciao a tutti gli utenti della Wikipedia in italiano. Sono Cyberpower678, un amministratore della Wikipedia in lingua inglese e un operatore di bot. Sono venuto qui per domandare se la comunità italiana apprezzerebbe l'utilizzo di m:InternetArchiveBot e le funzionalità a esso collegate. Prima di porre la domanda, descriverò qualche antefatto riguardo il bot e i possibili motivi per la sua implementazione su questa wiki.
Cos'è InternetArchiveBot?
InternetArchiveBot è un bot molto sofisticato progettato con l'unico scopo di combattere il costante problema dei link rotti. Il bot è in grado di navigare automaticamente attraverso le voci di Wikipedia, analizzare link formattati in diversi modi, e modificare appropriatamente il markup wiki per preservare la fonte utilizzata nella voce. Utilizza un algoritmo molto affidabile per determinare se il sito è "morto" oppure no. Oltre a tale algoritmo, utilizzato per analizzare le referenze e i siti web, il bot è altamente configurabile per adattarsi alle necessità della wiki locale (si veda più avanti).
Comunque, il bot non deve necessariamente essere totalmente automatizzato. IABot dispone di una sere di strumenti che i contributori possono utilizzare, e che possono essere visualizzati qui. Questi strumenti permettono di segnalare malfunzionamenti, aiutare a sviluppare l'affidabilità del bot per mezzo della segnalazione di problemi nel riconoscimento dei link, trovare archivi più adatti che il bot dovrebbe utilizzare e, soprattutto, fornisce strumenti che permettono di utilizzare il bot immediatamente su una singola pagina o una serie di pagine specifiche indicate dall'utente, nella coda di analisi.
Pertanto, se l'automatizzazione totale non è desiderata, tali strumenti possono sempre essere una buona via per permettere comunque agli utenti di combattere il problema dei link rotti.
Perché implementare InternetArchiveBot?
Il progetto IABot è iniziato quando in un sondaggio del 2015 sui desideri della comunità la proposta di introdurre un bot globale per riparare i link rotti si è collocata al primo posto. Perciò è stato creato questo ticket su Phabricator. Questo secondo ticket ha invece lo scopo di rilevare se su questa Wiki c'è il necessario consenso all'utilizzo, e il relativo processo di implementazione. A giungo 2017 il progetto raggiungerà il secondo anno di sviluppo.
A proposito di InternetArchiveBot
IABot utilizza algoritmi intelligenti per analizzare il testo wiki nel modo più prossimo a quello umano. Ciò significa che gestirà formattazioni differenti quando il link è contenuto all'interno di un tag <ref> rispetto a quando si trova fuori da esso. È in grado di rilevare template di citazione e gestirli differentemente.
Quando il link si trova all'interno di una referenza, IABot aggiunge il template che rimanda alla versione presente nell'archive.org (purché in questa Wiki lo si utilizzi), oppure un qualsiasi altro sistema equivalente di archivio dei siti esterni.
Quando il link si trova fuori dalle referenze, IABot può direttamente sostituire il link esterno con l'URL archiviato, per evitare di alterare la presentazione finale della voce. Può inoltre gestire i template di citazione.
IABot non modifica link quando inseriti all'interno di template che non conosce, o quando nascosti all'interno di tag <nowiki> o commenti HTML. IABot mantiene un grande database di metadati inerenti gli URL, che permette di svolgere efficientemente le attività.
Gli strumenti summenzionati possono inoltre accedere a tale database, nel quale gli utenti possono immediatamente sistemare ogni problema che riscontrassero, e IABot ne farà utilizzo immediato. In sostanza, il bot apprenderà sulla base delle segnalazioni degli utenti divenendo sempre più affidabile.
Il tasso di errore è molto basso: meno dello 0,01% delle modifiche è soggetto a errore.
Le diverse configurazioni di IABot
Come indicato sopra, IABot è altamente configurabile per rispondere alle necessità della Wikipedia locale. IABot è conforme alle eventuali indicazioni "nobot", e può offrire una pagina di attivazione in caso di malfunzionamenti. Visto che varie Wikipedia in lingue differenti hanno diverse culture e specifici metodi di lavoro, tale punto è stato preso in considerazione sin dallo sviluppo iniziale di IABot.
Quando IABot è in funzione, può essere istruito affinché svolga le necessarie sistemazioni nella voce principale e notifichi tali sistemazioni nella pagina di discussione correlata. In alternativa, i messaggi nelle pagine di discussione possono essere disabilitati, oppure il bot può essere istruito per lasciare solo messaggi di avviso ai contributori in merito all'indirizzo rotto trovato nella voce.
IABot può anche aggiungere in via preventiva link di archivio a tutti i link indistintamente, inclusi quelli non rotti, o semplicemente restringere la sua azione a quelli già indicati come rotti. L'azione di IABot può essere limitata ai soli link contenuti nei tag <ref> o all'intera voce.
Una completa descrizione di InternetArchiveBot, inclusiva di opzioni di configurazione può essere trovata qui: m:InternetArchiveBot.
La grande domanda
InternetArchiveBot, e/o i suoi strumenti sarebbero un'aggiunta gradita sulla Wikipedia in italiano? Non si dimentichi che se la completa autonomia del bot non è desiderata, gli strumenti descritti sopra servono a dare agli utenti il controllo sulle operazioni del bot stesso.
Di seguito alcuni esempi, che mostrano casi in progetti differenti per mostrare la compatibilità cross-wiki. -—CYBERPOWER (msg) 03:46, 8 mag 2017 (CEST)
Modifiche interamente automatiche
Modifiche del bot su istruzione manuale
Si noti che i campi oggetto riportano l'utente che ha richiesto l'azione per l'attribuzione.
Analisi della pagina con gli strumenti
Queste sono modifiche effettuate utilizzando lo strumento di analisi della singola pagina menzionato in precedenza. Lo strumento offre alcune opzioni che non sono disponibili quando il bot viene richiamato manualmente. Queste opzioni agiscono anche sovrascrivendo la configurazione di base utilizzata dal bot durante l'esecuzione automatica.
Logicamente, le opzioni possono essere impostate per le modifiche a una singola pagina, poiché la modifica viene effettuata direttamente dall'account utente che è quindi responsabile della modifica effettuata.
Tale distinzione dalle impostazioni di base è più complessa da gestire quando il bot viene eseguito su un elenco di pagine con opzioni differenti.
- Enwiki: Only alter dead sources and Add archives to all URLs
- Svwiki: [10]
Discussione
- Personalmente sono molto
Favorevole all'introduzione di un sistema simile, purché naturalmente ci sia qualcuno con un po' di tempo per occuparsi della fase di introduzione. :-) --Lucas ✉ 08:12, 8 mag 2017 (CEST)
- Sarebbe molto utile. Solo un appunto. Mi è capitato varie volte che una pagina web usata come fonte non fosse sparita, ma semplicemente spostata ad altro indirizzo (per ristrutturazione interna del sito con o senza cambio di dominio), in questi casi c'è modo di gestire la cosa?--151.42.106.17 (msg) 08:54, 8 mag 2017 (CEST)
- Ovviamente a favore.--Moroboshi scrivimi 09:49, 8 mag 2017 (CEST)
Favorevole --Lepido (msg) 09:59, 8 mag 2017 (CEST)
Favorevole visto il collaudo già effettuato altrove. OT: questa piaga dei link rotti potrebbe essere notevolmente ridotta inserendo da subito un collegamento ad una versione archiviata, nel momento della stesura di una voce, facendo quindi risparmiare risorse. --Umberto NURS (msg) 11:50, 8 mag 2017 (CEST)
Favorevole Era ora --Una giornata uggiosa '94 · E poi, di che parliamo? 12:51, 8 mag 2017 (CEST)
Favorevole e appoggio anche l'OT di Umberto NURS. ƒringio · ✉ 17:57, 8 mag 2017 (CEST)
Favorevole--NewDataB (msg) 18:31, 8 mag 2017 (CEST)
- Assolutamente
Favorevole, molto utile.--Daimona Eaytoy (Scrivimi!) 19:21, 8 mag 2017 (CEST)
Favorevole senza dubbi!!! --Epìdosis 20:50, 8 mag 2017 (CEST)
- Template:Fortemente favorevole. Uno strumento in più per combattere il diffuso fenomeno dei link non più funzionanti.--Celastro (msg) 22:25, 8 mag 2017 (CEST)
- non ho capito se si integra bene con i nostri template (ad esempio compilando almeno parametri come "urlarchivio" o evitando di sostituire l'intero url con un puntamento secco a Web Archive), nel caso
Favorevole. --valepert 23:20, 8 mag 2017 (CEST)
- Gli ho già chiesto su phabricator e dice che tiene conto anche di questi nel codice del bot. In settimana vedo di preparare uno schema di questi parametri per i template di citazione principali.--Moroboshi scrivimi 23:48, 8 mag 2017 (CEST)
- pollici in alto allora! :D --valepert 00:03, 9 mag 2017 (CEST)
- Gli ho già chiesto su phabricator e dice che tiene conto anche di questi nel codice del bot. In settimana vedo di preparare uno schema di questi parametri per i template di citazione principali.--Moroboshi scrivimi 23:48, 8 mag 2017 (CEST)
- Certamente
Favorevole, voglio però sottolineare l'osservazione già fatta dall'IP 151.42....: è capitato spesso anche a me di scoprire che un link morto era dovuto "solo" a un problema di ristrutturazione del sito, per cui la pagina non era stata rimossa ma solo spostata sotto un altro url. Se il bot riuscisse a scovare il nuovo url sostituendolo a quello morto prima di fare ricorso a Webarchive sarebbe fantastico, ma sono assai dubbioso riguardo la fattibilità. --Er Cicero 04:36, 9 mag 2017 (CEST)
- Questa la vedo dura, dura, dura, dura, ma si può anche chiedere al botolatore. :-) Sicuramente è estremamente interessante il fatto che il bot possa avvertire sia in pagina di discussione della pagina, sia nella pagina di discussione dell'utente che aveva inserito il link. Personalmente abiliterei entrambe le funzioni di default, perché aiutano a fare a mano proprio questo genere di controlli. Bisogna poi aggiungere qualche parametro agli attuali template, ed eventualmente qualche template nuovo, ma mi pare ne valga la pena. ;) --Lucas ✉ 06:21, 9 mag 2017 (CEST)
- Ho appena fatto un paio di test e sono abbastanza entusiasta. :-) Qui mi ha sistemato un link rotto sulla voce di Paolo Borsellino; qui mi ha sistemato un link rotto nella voce su Giovanni Falcone, in realtà il sito aveva cambiato dominio (passando da .com a .info, ma questa è una informazione che un bot dovrebbe andarsi a cercare su google se non c'è un Code 302 di redirect), ma mi ha salvato in ogni caso la fonte (e con un avvertimento nella talk avrei potuto farlo senza difficoltà). Molto soddisfatto, anche perché l'amico bot aveva lasciato in pagina di discussione un avviso poche settimane prima per altre modifiche. --Lucas ✉ 08:01, 9 mag 2017 (CEST)
- Questa la vedo dura, dura, dura, dura, ma si può anche chiedere al botolatore. :-) Sicuramente è estremamente interessante il fatto che il bot possa avvertire sia in pagina di discussione della pagina, sia nella pagina di discussione dell'utente che aveva inserito il link. Personalmente abiliterei entrambe le funzioni di default, perché aiutano a fare a mano proprio questo genere di controlli. Bisogna poi aggiungere qualche parametro agli attuali template, ed eventualmente qualche template nuovo, ma mi pare ne valga la pena. ;) --Lucas ✉ 06:21, 9 mag 2017 (CEST)
Favorevole: da anni lo seguo nella Wikipedia in inglese e piú fa meglio è (mw:Archived Pages). Preferisco le modifiche dirette alle voci, rispetto alle segnalazioni in pagina di discussione. Nemo 10:04, 9 mag 2017 (CEST)
- Concordo, senza dubbio, io intendevo di fare tutte le cose: modifiche dirette e segnalazioni sia in pagina di discussione delle voce (come avviene anche su en.wiki), sia nella pagina di discussione utente che l'ha inserito. Lo sto testando per bene su en.wiki. E' molto interessante e funziona molto bene. Direi da implementare senza dubbio. Vero ciò che dice Er Cicero, moltissimi contenuti con link rotto sarebbero reperibili a indirizzi leggermente diversi da cercare su google, comunque meglio un link alla pagina di archivio che un link rotto. Un essere umano può sempre cercare di nuovo il contenuto, se lo desidera. C'è anche qualche falso positivo (ne ho segnalati quattro o cinque su varie centinaia testati), ma la percentuale in effetti è bassa. Tool molto affidabile e utile. --Lucas ✉ 11:04, 9 mag 2017 (CEST)
- Potremmo decidere una serie di archivi che ci paiono adatti, oltre all'archive.org, e al webcitations, so che l'archive.is è stato spammato pesantemente su tutte le wiki, ma per certe cose è insostituibile. Li terrei in considerazione tutti. --Lucas ✉ 11:06, 9 mag 2017 (CEST)
- Concordo, senza dubbio, io intendevo di fare tutte le cose: modifiche dirette e segnalazioni sia in pagina di discussione delle voce (come avviene anche su en.wiki), sia nella pagina di discussione utente che l'ha inserito. Lo sto testando per bene su en.wiki. E' molto interessante e funziona molto bene. Direi da implementare senza dubbio. Vero ciò che dice Er Cicero, moltissimi contenuti con link rotto sarebbero reperibili a indirizzi leggermente diversi da cercare su google, comunque meglio un link alla pagina di archivio che un link rotto. Un essere umano può sempre cercare di nuovo il contenuto, se lo desidera. C'è anche qualche falso positivo (ne ho segnalati quattro o cinque su varie centinaia testati), ma la percentuale in effetti è bassa. Tool molto affidabile e utile. --Lucas ✉ 11:04, 9 mag 2017 (CEST)
Favorevole sono commosso, è venuto lui da noi a chiederci pure il permesso. Fatelo santo!--Sakretsu (炸裂) 15:09, 9 mag 2017 (CEST)
- non per smorzare gli entusiasmi ma il buon Cyberpower678 è stato pagato per lo sviluppo del bot. :-)) Comunque un po' di santità ci sta lo stesso vista l'utilità del tool. :-)) Io comunque metterei in preventivo che con un uso così massivo dell'archive.org anche la gente nostrana prima o poi lo scopra e si dovranno trovare soluzioni alternative (come il vituperato archive.is, vituperato perché lo sviluppatore l'ha spammato cross-wiki, ma in certe cose è insostituibile e lo uso da eoni). --Lucas ✉ 10:51, 10 mag 2017 (CEST)
Favorevole uno strumento molto utile --β16 - (talk) 10:02, 10 mag 2017 (CEST)
Favorevole --ZioNicco (msg) 13:49, 12 mag 2017 (CEST)
Hello cyberpower678, the Italian community actually agrees with the use of the bot. Do you have any plan/needs? --Lucas ✉ 04:16, 19 mag 2017 (CEST)
- There's plenty to do before. If you're following the tracking ticket I'll let you know what's needed, when I'm ready.—CYBERPOWER (msg) 14:43, 19 mag 2017 (CEST)
- @cyberpower678, allright it's fine. Yes, I'm following it with a couple of other users. We'll stay in contact through phab. Leave me/us/there a line when you need something. --Lucas ✉ 03:38, 20 mag 2017 (CEST)
Traduzione
InternetArchiveBot parte questa settimana in altre 9 lingue. Serve aiuto per tradurlo in italiano: translatewiki:Special:Translate/internetarchivebot. (Basta registrarsi nella pagina principale, per chi non l'avesse già fatto.) --Nemo 22:00, 6 giu 2017 (CEST)
Domanda tecnica
(EN) [@ Cyberpower678] We have a technical question. By now, for indicating a broken url in a citation template we are forced to use aside {{collegamento interrotto}}, often getting something like "Broken url, ANSA, 10 marzo 2017[collegamento interrotto]". Here we were talking about the possibility to insert sì
("sì" means "yes") as value for the parameter urlmorto
(i.e. deadurl
), in such a way to visualize "Broken url[collegamento interrotto], ANSA, 10 marzo 2017" when an archived version is not available. Would this conflict with your bot?
(IT) Attualmente, per indicare un url rotto in un template di citazione siamo costretti ad usare da parte {{collegamento interrotto}}, spesso ottenendo qualcosa come "Link rotto, ANSA, 10 marzo 2017[collegamento interrotto]". Qui stavamo discutendo della possibilità di inserire il valore sì
per il parametro urlmorto
, in modo da visualizzare "Link rotto[collegamento interrotto], ANSA, 10 marzo 2017" quando non è disponibile una versione archiviata. Ci sarebbe qualche conflitto con l'operato del bot? --Horcrux九十二 11:28, 29 giu 2017 (CEST)