Portable Document Format: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Iuarhduawdad
m Annullate le modifiche di 95.232.204.132 (discussione), riportata alla versione precedente di Rlynms
Etichetta: Rollback
Riga 1:
{{Nota disambigua||PDF (disambigua)|PDF}}
{{Nota disambigua||PDF (disambigua)|PDF}}
Caratteristiche
*Può contenere qualsiasi combinazione di testo, elementi multimediali come video o audio<ref name=":1" />, elementi ipertestuali come collegamenti e segnalibri, collegamenti e miniature di pagine.
*I file PDF non perdono la formattazione quando vengono inviati ad altri utenti, come nel caso dell'invio di documenti di testo (pagine disordinate, paragrafi ingombranti, ecc.).
 
*È uno dei formati più diffusi su Internet per lo scambio di documenti. Pertanto, è ampiamente utilizzato da aziende, governi e istituzioni educative.
 
* È una specifica aperta, per la quale sono stati adattati strumenti software commerciali come [[Microsoft Office]] e [[WordPerfect Office]] suite e altri creati in software gratuito che consentono di creare, visualizzare o modificare documenti in formato PDF, come [[Apache OpenOffice|Openoffice.org]], LibreOffice e Calligra Suite e il sistema di composizione del testo [[LaTeX]].
 
* Può essere crittografato per proteggere il suo contenuto e persino firmarlo digitalmente<ref name=":2" />.
 
* Un file PDF può essere creato da diverse applicazioni esportando il file, come Openoffice.org e Microsoft Office (a partire dal 2007, se aggiornato a SP2)<ref name=":0" />.
* Può essere generato da qualsiasi applicazione installando una "stampante virtuale" nel sistema operativo, in caso di utilizzo di applicazioni senza questa funzionalità integrata.
* È lo standard ISO (ISO 19005-1: 2005) per i file del contenitore di documenti elettronici in vista della loro conservazione a lungo termine<ref name=":0" />.
* I file PDF sono indipendenti dal dispositivo, quindi possono essere stampati su una stampante ad aghi, a getto d'inchiostro, laser o microfilm. Per l'ottimizzazione della stampa, durante la creazione del file PDF vengono impostate le opzioni appropriate.
* È [[multipiattaforma]], ovvero può essere presentato sui principali sistemi operativi ([[Linux|GNU]] / [[Linux]], [[MacOS]], [[Unix]], [[Microsoft Windows|Windows]] ), senza modificare l'aspetto o la struttura del documento originale.
 
== Gli standard ==
{{Formato file
| nome = Portable Document Format
Riga 38 ⟶ 22:
| sito =
}}
Il '''Portable Document Format''' (comunemente indicato con la sigla '''PDF''') è un [[formato di file]] basato su un [[linguaggio di descrizione di pagina]] sviluppato da [[Adobe (azienda)|Adobe]] negli [[anni 1990]] per rappresentare documenti di [[testo]] e [[immagine|immagini]] in modo indipendente dall'[[hardware]] e dal [[software]] utilizzati per generarli o per visualizzarli.
 
== Storia ==
Creato da Adobe nel 1993, ha avuto una serie di evoluzioni; nel 2005 venne creato il sottoformato [[PDF/A]] e nel gennaio [[2007]] Adobe ha intrapreso la strada della standardizzazione<ref>{{en}} [https://blogs.adobe.com/insidepdf/2007/12/iso_ballot_for_pdf_17_passed.html ISO Ballot for PDF 1.7 Passed!]</ref> per far diventare il PDF un formato standard [[Organizzazione Internazionale per le Standardizzazioni|ISO]]<ref>{{cita web|url=http://www.macitynet.it/macity/aA27034/index.shtml|titolo=Adobe vuole trasformare il PDF in uno standard ISO |data= |accesso=|}}</ref><ref>{{cita web|url=http://punto-informatico.it/pbox.asp?id=1868280|titolo=PDF cerca la benedizione di ISO |data= |accesso=|}}</ref>; a luglio 2008<ref>{{Cita web |url=http://www.iso.org/iso/news.htm?refid=Ref1141 |titolo=Copia archiviata |accesso=30 gennaio 2017 |urlarchivio=https://web.archive.org/web/20160303234754/http://www.iso.org/iso/news.htm?refid=Ref1141 |dataarchivio=3 marzo 2016 |urlmorto=sì }}</ref> è stata approvata la norma ISO 32000.
 
== Descrizione generale ==
Un file PDF può descrivere documenti che contengono testo e/o immagini in qualsiasi [[risoluzione (grafica)|risoluzione]]. È un formato aperto, nel senso che chiunque può creare applicazioni che leggono e scrivono file PDF senza pagare i diritti (''[[Royalty]]'') ad Adobe. Adobe ha un numero elevato di brevetti relativamente al formato PDF, ma le licenze associate non includono il pagamento di diritti per la creazione di programmi associati. Ogni documento PDF contiene una completa descrizione del document [[Bidimensionalità|bidimensionale]] (e, con la comparsa di Acrobat [[Tridimensionalità|3D]], documenti 3D incorporati) composta da proprietà (Titolo, Autore, ecc.), testo, stili di carattere (''font''), immagini e oggetti di [[grafica vettoriale]] 2D che compongono il documento.
 
Il documento PDF non dovrebbe includere informazioni specifiche per [[software]], [[hardware]] e [[sistema operativo]] usato. Ciò permetterebbe al documento di venire visualizzato e [[Rendering|renderizzato]] nella stessa esatta maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo. Anche questo fatto ha contribuito a farlo diventare un formato standard ''de facto'' molto diffuso per la condivisione immediata dei documenti. In realtà il PDF nella sua forma standard è un formato che non può essere considerato compatibile con un processo di conservazione digitale (l'archiviazione digitale dei documenti al fine di eliminare o ridurre l'uso della carta), in quanto non è in grado di garantire la riproducibilità a lungo termine e neanche la conservazione dell'aspetto visivo. Questo aspetto dipende da vari fattori come, ad esempio, il fatto che i file PDF standard non sono necessariamente auto-contenuti, ma possono presentare dipendenze dai font utilizzati o da oggetti esterni al file stesso<ref>{{Cita web|url=https://kbpdfstudio.qoppa.com/how-to-embed-fonts-in-a-pdf-document/|titolo=How to embed fonts in a PDF document – PDF Studio Knowledge Base|lingua=en-US|accesso=2021-02-02}}</ref>. Pertanto, se si cerca di visualizzare questi file su sistemi informatici diversi da quelli sui quali sono stati creati, non è garantita la loro riproduzione in maniera coerente, da cui consegue che il loro utilizzo a lungo termine non è pensabile se non associato ad uno standard preciso<ref name="iter.it">{{cita web |url=http://www.iter.it/iged_ol_0210.pdf |titolo=Copia archiviata |accesso=25 marzo 2010 |urlmorto=sì |urlarchivio=https://web.archive.org/web/20100601123945/http://www.iter.it/iged_ol_0210.pdf |dataarchivio=1º giugno 2010 }} iged.it online 02 2010 - pag. 11</ref>.
 
La stampa di documenti in formato .pdf può dare dei problemi se si usano dei caratteri locali (ad esempio le vocali italiane accentate) e se chi stampa ha il proprio PC impostato su una lingua diversa.
 
=== Formato file ===
Un file PDF contiene caratteri ASCII a 7 bit , ad eccezione di alcuni elementi che possono avere contenuto binario. Il file inizia con un'intestazione contenente un numero magico (come una stringa leggibile) e la versione del formato, ad esempio <code>%PDF-1.7</code>. Il formato è un sottoinsieme di un formato COS ("Carousel" Object Structure). Un file albero COS consiste principalmente di ''oggetti'' , di cui esistono otto tipi<ref>Adobe Systems, PDF Reference, p.&nbsp;51.</ref>:
 
* Valori booleani, che rappresentano ''vero'' o ''falso''
* Numeri
* Stringhe, racchiuse tra parentesi ( <code>(...)</code>). Le stringhe possono contenere caratteri a 8 bit.
* Nomi, che iniziano con una barra ( <code>/</code>)
* Matrici, raccolte ordinate di oggetti racchiusi tra parentesi quadre ( <code>[...]</code>)
* Dizionari, raccolte di oggetti indicizzati da nomi racchiusi tra doppie parentesi angolari ( <code><<...>></code>)
* Flussi, solitamente contenenti grandi quantità di dati binari opzionalmente compressi, preceduti da un dizionario e racchiusi tra le parole chiave <code>stream</code>e <code>endstream</code>.
* L'oggetto "null"
 
Inoltre, potrebbero essere presenti commenti, introdotti con il segno di percentuale ( <code>%</code>). I commenti possono contenere caratteri a 8 bit.
 
Gli oggetti possono essere ''diretti'' (incorporati in un altro oggetto) o ''indiretti'' . Gli oggetti indiretti sono numerati con un ''numero di oggetto'' e un ''numero di generazione'' e definiti tra le parole chiave <code>obj</code>e <code>endobj</code>se risiedono nella radice del documento. A partire dalla versione PDF 1.5, gli oggetti indiretti (ad eccezione di altri flussi) possono anche essere posizionati in flussi speciali noti come ''flussi di oggetti'' (contrassegnati <code>/Type /ObjStm</code>). Questa tecnica consente agli oggetti non flusso di applicare filtri di flusso standard, riduce le dimensioni dei file che hanno un numero elevato di piccoli oggetti indiretti ed è particolarmente utile per ''PDF con tag''. I flussi di oggetti non supportano la specifica di un oggetto ''numero di generazione'' (diverso da 0).
 
Una tabella indice, chiamata anche tabella dei riferimenti incrociati, si trova in genere vicino alla fine del file e fornisce l'offset di byte di ogni oggetto indiretto dall'inizio del file<ref>Adobe Systems, PDF Reference, pp. 39–40.</ref>. Questo design consente un accesso casuale efficiente agli oggetti nel file e consente anche di apportare piccole modifiche senza riscrivere l'intero file ( ''aggiornamento incrementale'' ). Prima della versione PDF 1.5, la tabella sarebbe sempre stata in uno speciale formato ASCII, sarebbe stata contrassegnata con la <code>xref</code>parola chiave e avrebbe seguito il corpo principale composto da oggetti indiretti. La versione 1.5 ha introdotto ''flussi di riferimento incrociato'' opzionali, che hanno la forma di un oggetto stream standard, eventualmente con filtri applicati. Tale flusso può essere utilizzato al posto della tabella dei riferimenti incrociati ASCII e contiene gli offset e altre informazioni in formato binario. Il formato è flessibile in quanto consente la specifica della larghezza intera (utilizzando <code>/W</code>array), in modo che, ad esempio, un documento di dimensioni non superiori a 64 KiB possa dedicare solo 2 byte per gli offset degli oggetti.
 
Alla fine di un file PDF c'è un piè di pagina contenente:
 
* La parola chiave <code>startxref</code> seguita da un offset all'inizio della tabella dei riferimenti incrociati (che inizia con la parola chiave <code>xref</code>) o l'oggetto flusso di riferimenti incrociati
* L'indicatore di fine-file <code>%%EOF</code> .
 
Se non viene utilizzato un flusso di riferimenti incrociati, il piè di pagina è preceduto dalla parola chiave <code>trailer</code>seguita da un dizionario contenente informazioni che altrimenti sarebbero contenute nel flusso di riferimenti incrociati del dizionario dell'oggetto :
 
* Un riferimento all'oggetto radice della struttura ad albero, noto anche come ''catalog'' ( <code>/Root</code>)
* Il conteggio degli oggetti indiretti nella tabella dei riferimenti incrociati ( <code>/Size</code>)
* Altre informazioni facoltative
 
Ci sono due layout per i file PDF: non lineare (non "ottimizzato") e lineare ("ottimizzato"). I file PDF non lineari possono essere più piccoli delle loro controparti lineari, sebbene l'accesso sia più lento perché parti dei dati necessari per assemblare le pagine del documento sono sparse in tutto il file PDF. I file PDF lineari (chiamati anche file PDF "ottimizzati" o "ottimizzati per il Web") sono costruiti in modo da consentirne la lettura in un plug-in del browser Web senza attendere il download dell'intero file, poiché vengono generati in modo lineare (come nell'ordine delle pagine)<ref name="pdf-ref">{{Cita web|url=https://www.adobe.com/devnet/pdf/pdf_reference.html|titolo=Adobe Developer Connection: PDF Reference and Adobe Extensions to the PDF Specification|editore=Adobe Systems|accesso=13 dicembre 2010}}</ref>. I file PDF possono essere ottimizzati utilizzando il software Adobe Acrobat o QPDF .
 
== Caratteristiche ==
 
*Può contenere qualsiasi combinazione di testo, elementi multimediali come video o audio<ref name=":1">{{Cita web|url=https://helpx.adobe.com/it/acrobat/using/rich-media.html|titolo=Aggiungere audio, video e oggetti interattivi ai file PDF in Adobe Acrobat|sito=helpx.adobe.com|accesso=2021-01-31}}</ref>, elementi ipertestuali come collegamenti e segnalibri, collegamenti e miniature di pagine.
*I file PDF non perdono la formattazione quando vengono inviati ad altri utenti, come nel caso dell'invio di documenti di testo (pagine disordinate, paragrafi ingombranti, ecc.).
 
Riga 47 ⟶ 74:
* È una specifica aperta, per la quale sono stati adattati strumenti software commerciali come [[Microsoft Office]] e [[WordPerfect Office]] suite e altri creati in software gratuito che consentono di creare, visualizzare o modificare documenti in formato PDF, come [[Apache OpenOffice|Openoffice.org]], LibreOffice e Calligra Suite e il sistema di composizione del testo [[LaTeX]].
 
* Può essere crittografato per proteggere il suo contenuto e persino firmarlo digitalmente<ref name=":2">{{Cita web|url=https://helpx.adobe.com/it/reader/using/sign-pdfs.html|titolo=Firmare i PDF in Adobe Acrobat Reader.|sito=helpx.adobe.com|accesso=2021-01-31}}</ref>.
 
* Un file PDF può essere creato da diverse applicazioni esportando il file, come Openoffice.org e Microsoft Office (a partire dal 2007, se aggiornato a SP2)<ref name=":0">{{Cita web|url=https://support.microsoft.com/en-us/help/953195|sito=support.microsoft.com|accesso=18 maggio 2020}}</ref>.
Riga 56 ⟶ 83:
 
== Gli standard ==
Il formato è stato effettivamente standardizzato in una serie di sottoformati, che sono:<ref name="iter.it">{{cita web|url=http://www.iter.it/iged_ol_0210.pdf|titolo=Copia archiviata|accesso=25 marzo 2010|urlarchivio=https://web.archive.org/web/20100601123945/http://www.iter.it/iged_ol_0210.pdf|dataarchivio=1º giugno 2010|urlmorto=sì}} iged.it online 02 2010 - pag. 11</ref>
 
* [[PDF/A]] (PDF/Archiving) per l'archiviazione a lungo termine;