Modulo:Webarchive/sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m uniformo
use require('strict') instead of require('Module:No globals')
 
(8 versioni intermedie di un altro utente non mostrate)
Riga 1:
--[[ ----------------------------------
Modulo Lua che implementa il template {{Webarchive}} e offrepermette alcunedi
decifrare la data negli URL di alcuni archivi anche ad altri moduli.
funzionalità ad altri moduli Lua per la gestione degli archivi.
]]
 
require('Module:No globalsstrict')
local getArgs = require('ModuleModulo:Arguments').getArgs
local cfg = mw.loadData('Modulo:Webarchive/Configurazione/sandbox')
 
local p = {}
Line 11 ⟶ 12:
local maxurls = 10 -- massimo numero di URL permessi
local encoded_date
 
local servizi = {
{ signature = 'archive.org', service = 'wayback', tailbracket = ' in %sInternet Archive%s', tracking = 'Categoria:Template Webarchive - collegamenti all\'Internet Archive' },
{ signature = 'web.archive.org', service = 'wayback', tailbracket = ' in %sInternet Archive%s', tracking = 'Categoria:Template Webarchive - collegamenti all\'Internet Archive' },
{ signature = 'webcitation.org', service = 'webcite', tailbracket = ' in %sWebCite%s', tracking = 'Categoria:Template Webarchive - collegamenti a WebCite' },
{ signature = 'archive.is', service = 'archiveis', tailbracket = ' in %sArchive.is%s', tracking = 'Categoria:Template Webarchive - collegamenti a archive.is' },
{ signature = 'archive.fo', service = 'archiveis', tailbracket = ' in %sArchive.is%s', tracking = 'Categoria:Template Webarchive - collegamenti a archive.is' },
{ signature = 'archive.today', service = 'archiveis', tailbracket = ' in %sArchive.is%s', tracking = 'Categoria:Template Webarchive - collegamenti a archive.is' },
{ signature = 'archive.li', service = 'archiveis', tailbracket = ' in %sArchive.is%s', tracking = 'Categoria:Template Webarchive - collegamenti a archive.is' },
{ signature = 'archive.ec', service = 'archiveis', tailbracket = ' in %sArchive.is%s', tracking = 'Categoria:Template Webarchive - collegamenti a archive.is' },
{ signature = 'collection.europarchive.org', tailbracket = ' nella %sNational Library of Ireland%s' },
{ signature = 'webarchive.org.uk', tailbracket = ' in %sUK Web Archive%s' },
{ signature = 'wayback.archive[-]it.org', tailbracket = ' in %sArchive-It%s' },
{ signature = 'archive.wikiwix.com', tail = ' in Wikiwix' },
{ signature = 'arquivo.pt', tail = ' nel Portuguese Web Archive' },
{ signature = 'webarchive.loc.gov', service = 'wayback', tailbracket = ' nella %sLibrary of Congress%s Web Archives' },
{ signature = 'loc.gov', tailbracket = ' nella %sLibrary of Congress%s' },
{ signature = 'webharvest.gov', tailbracket = ' nel %sNational Archives and Records Administration%s' },
{ signature = 'web.archive.bibalex.org', tail = ' nella [[Bibliotheca Alexandrina#Struttura e collezioni|Bibliotheca Alexandrina]]' },
{ signature = 'collectionscanada.gc.ca', tail = ' nel Canadian Government Web Archive' },
{ signature = 'haw.nsk', tail = ' nel Croatian Web Archive (HAW)' },
{ signature = 'veebiarhiiv.digar.ee', tail = ' nell\'Estonian Web Archive' },
{ signature = 'wayback.vefsafn.is', tailbracket = ' nella %sNational and University Library of Iceland%s]]' },
{ signature = 'webarchive.proni.gov', tailbracket = ' nel %sPublic Record Office of Northern Ireland%s' },
{ signature = 'uni[-]lj.si', tail = ' nello Slovenian Web Archive' },
{ signature = 'stanford.edu', tail = ' nello [[Stanford University Libraries|Stanford Web Archive]]' },
{ signature = 'webarchive.nationalarchives.gov.uk', tailbracket = ' in %sUK Government Web Archive%s' },
{ signature = 'publications.parliament.uk', tailbracket = ' in %sUK Parliament\'s Web Archive%s' },
{ signature = 'parliament.uk', tailbracket = ' in %sUK Parliament\'s Web Archive%s' },
{ signature = 'nlb.gov.sg', tail = ' in Web Archive Singapore' },
{ signature = 'eresources.nlb.gov.sg', tail = ' in Web Archive Singapore' },
{ signature = 'pandora.nla.gov.au', tailbracket = ' in %sPandora Archive%s' },
{ signature = 'perma.cc', tailbracket = ' in %sPerma.cc%s' },
{ signature = 'perma-archives.cc', tailbracket = ' in %sPerma.cc%s' },
{ signature = 'screenshots.com', tail = ' in Screenshots' },
{ signature = 'freezepage.com', tail = ' in Freezepage' },
{ signature = 'yorku.ca', tail = ' nella [[York University Libraries|York University Digital Library]]' },
{ signature = 'webcache.googleusercontent.com', tail = ' in Google Cache' },
{ signature = 'timetravel.mementoweb.org', tailbracket = ' nel %sMemento Project%s' },
{ signature = 'langzeitarchivierung.bib-bvb.de', tailbracket = ' nella %sBavarian State Library%s' },
{ signature = 'webrecorder.io', tail = ' in Webrecorder' }
}
 
local month_localized = { 'gennaio', 'febbraio', 'marzo', 'aprile', 'maggio', 'giugno',
'luglio', 'agosto', 'settembre', 'ottobre', 'novembre', 'dicembre'}
 
--[[--------------------------< inlineError >-----------------------
Line 129 ⟶ 85:
try_year = tonumber(split[1])
if try_year and try_year > 1900 and try_year < 2200 then -- iso
y, m, d = split[1], cfg.month_localized[tonumber(split[2])], split[3]
end
else
Line 157 ⟶ 113:
return nil
end
m = cfg.month_localized[m]
if d == 1 then d = '1º' end
return mw.ustring.format('%s %s %s', d, m, y)
Line 163 ⟶ 119:
 
--[[--------------------------< decodeWebciteDate >-----------------------
Ricava la data da un URLURI-path a Webcite (es. www.webcitation.org/67xHmVFWP)
]]
local function p.decodeWebciteDate(urlpath)
local path = mw.uri.new(url).path
local path_elements = mw.text.split(path, '/')
 
Line 177 ⟶ 132:
-- http://www.webcitation.org/getfile.php?fileid=1c46e791d68e89e12d0c2532cc3cf629b8bc8c8e
 
if path == '' or not path_elements[2] or path_elements[2] == '' then
return
elseif mw.ustring.find(path_elements[2], 'query') or
Line 193 ⟶ 148:
 
--[[--------------------------< snapDateToString >-----------------------
Ricava la data da un URLURI-path a Wayback (es. web.archive.org/web/20160901010101/http://example.com ).
Gestisce anche le non cifre come "re_", "-" e "*".
]]
local function p.decodeWaybackDate(urlpath)
local path = mw.uri.new(url).path
if path == '' then return end
local snapdate = string.gsub(path, '^/all/', '') -- rimuove la sequenza iniziale "/all/"
snapdate = string.gsub(snapdate, '^/w?e?b?/?', '') -- rimuove la sequenza iniziale "/web/" o "/"
Line 218 ⟶ 171:
 
--[[--------------------------< decodeArchiveisDate >-----------------------
Ricava la data dadall'URI-path di un URLlink esteso ad Archive.is (es. https://archive.is/2016.08.28-144552/http://example.com).
Gestisce "." e "-" nella data, rendendo 2016.08.28-144552 uguale a 20160828144552.
]]
local function p.decodeArchiveisDate(urlpath)
local path = mw.uri.new(url).path
local path_elements = mw.text.split(path, '/')
local snapdate = path_elements[2]
if path == '' or not path_elements[2] or path_elements[2] == '' then return end
snapdate = string.gsub(snapdate, '[%.%-]', '')
if not tonumber(snapdate) then encoded_date = false return end -- formato link breve
Line 243 ⟶ 195:
]]
local function serviceName(url_data, nolink, notail)
local tracking = 'Categoria:Template Webarchive - collegamenti ad altri archivi'
local bracketopen, bracketclose = nolink and '' or '[[', nolink and '' or ']]'
encoded_date = nil -- reset
for _,servizio in ipairs(cfg.servizi) do
if mw.ustring.find(string.gsub(url_data.host, 'www%.', ''), '^' ..== servizio.signature .. '$') then
url_data.service = servizio.service or 'altri'
if not notail and servizio.tailbracket then
Line 260 ⟶ 212:
end
if url_data.service == nil then
tracking = 'Categoria:Template Webarchive - collegamenti ad archivi sconosciuti'
url_data.tail = ' su ' .. url_data.host .. ' ' .. inlineRed('URL di servizio di archiviazione sconosciuto', 'warning')
end
track[tracking] = 1
Line 282 ⟶ 235:
 
--[[--------------------------< createRendering >-----------------------
Restituisce la resa dei dati in url_data[][]
]]
local function createRendering(url_data)
Line 311 ⟶ 264:
 
--[[--------------------------------------------------------------------
Entry point per chiamata diretta da un modulo.
Funzione di interfaccia principale per implementazione del
Riceve l'URL di un archivio e ne restituisce la data se riesce a decodificarla.
Template:Webarchive
]]
function p.decodeArchiveDate(url)
local pathuri = mw.uri.new(url).path
local host, path = mw.uri.new(url)host, uri.path
if not url or not host or path == '' then return end
host = string.gsub(host, 'www%.', '')
for _, servizio in ipairs(cfg.servizi) do
if host == servizio.signature then
if servizio.service == 'wayback' then
return decodeWaybackDate(path)
elseif servizio.service == 'webcite' then
return decodeWebciteDate(path)
elseif servizio.service == 'archiveis' then
return decodeArchiveisDate(path)
end
end
end
return
end
 
--[[--------------------------------------------------------------------
Funzione di interfaccia principale per implementazione del
Template:Webarchive
]]
function p.webarchive(frame)
Line 318 ⟶ 294:
local args = getArgs(frame, {
valueFunc = function(key, value)
if key == 'nolink'value then
if key == 'nolink' then
return true
elseif value then
else
value = mw.text.trim(value)
if value ~= '' then return value end
end
end
return nil
Line 347 ⟶ 325:
url_data[i] = {}
url_data[i].url = url
url_data[i].hosturi = mw.uri.new(url).host
if not url_data[i].host, thenurl_data[i].path return inlineError('url'= url_data[i].uri. nhost, 'URL non valido') endurl_data[i].uri.path
if not url_data[i].host or url_data[i].path == '' then
return inlineError('url' .. n, 'URL non valido') .. createTracking()
end
serviceName(url_data[i], args.nolink, i > 1 and true)
 
Line 356 ⟶ 337:
if date then
date = formatDate(date)
local udate = url_data[i].service == 'wayback' and p.decodeWaybackDate(url_data[i].urlpath) or
url_data[i].service == 'webcite' and p.decodeWebciteDate(url_data[i].urlpath) or
url_data[i].service == 'archiveis' and p.decodeArchiveisDate(url_data[i].urlpath)
if udate and udate ~= date then
date = date .. ' ' .. inlineRed('Data nell\'URL non combaciante: ' .. udate, 'warning')
elseif not udate and encoded_date == true then
date = date .. ' ' .. inlineRed('Data nell\'URL indecifrabile', 'error')
end
elseif url_data[i].service == 'wayback' then
date = p.decodeWaybackDate(url_data[i].urlpath)
elseif url_data[i].service == 'webcite' then
date = p.decodeWebciteDate(url_data[i].urlpath)
elseif url_data[i].service == 'archiveis' then
date = p.decodeArchiveisDate(url_data[i].urlpath)
else
date = inlineRed('Data mancante', 'warning')