Portable Document Format

formato di file

Template:Stub informatica


Il PDF (Portable Document Format) è un formato di file basato su un linguaggio di descrizione di pagina sviluppato da Adobe Systems per rappresentare documenti in modo indipendente dall'hardware e dal software utilizzati per generarli o per visualizzarli. Un file PDF può descrivere documenti che contengono testo e/o immagini a qualsiasi risoluzione. È uno standard aperto, nel senso che chiunque può creare applicazioni che leggono e scrivono file PDF senza pagare i diritti alla Adobe Systems. Adobe ha un numero elevato di brevetti relativamente al formato PDF, ma le licenze associate non includono il pagamento di diritti per la creazione di programmi associati.

Ogni documento PDF contiene una completa descrizione del documento bidimensionale (e, con la comparsa di Acrobat 3D, documenti 3D incorporati) composta da proprietà (Titolo, Autore, ...) testo, stili di carattere, immagini e oggetti di grafica vettoriale 2D che compongono il documento. PDF non include informazioni specifiche per software, hardware e sistema operativo usato. Ciò permette che il documento venga visualizzato, renderizzato e stampato nella stessa esatta maniera indipendentemente dalla piattaforma. Anche questo fatto ha contribuito a farlo diventare un formato standard de facto molto diffuso per la condivisione dei documenti.

Ogni file PDF incapsula una descrizione completa di un documento 2D (non tridimensionale, quindi), ovvero i testi, le font, le immagini ed eventualmente gli oggetti di grafica vettoriale, ma non include informazioni specifiche dell'hardware o del software usato per creare e leggere il documento. Questa ultima caratteristica assicura che il file PDF verrà riprodotto nella stessa maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo. Il PDF è da considerare anche come standard aperto in quanto chiunque può creare applicazioni che leggano o scrivano file PDF senza pagamento di royalties ad Adobe Systems.

Tecnologia

PostScript

  Lo stesso argomento in dettaglio: PostScript.

Il PDF eredita molte delle funzionalità del PostScript, un linguaggio di descrizione immagini anch'esso sviluppato dall'Adobe. Postscript permette di descrivere un'immagine come il risultato di un'esecuzione di un programma, che contiene istruzioni su come e dove disegnare linee, punti, lettere dell'alfabeto e altri elementi grafici. In questo modo, ogni apparecchio capace di eseguire il programma (ossia, che abbia un interprete Postscript), sarà in grado di riprodurre tale immagine al meglio delle sue capacità. Questo processo richiede grandi risorse da parte del terminale.

PDF è un formato invece che un linguaggio di programmazione, e per questo motivo non ha bisogno di essere interpretato. Per esempio, il controllo di flusso esercitato dai comandi come if e loop è stato rimosso, mentre comandi grafici come lineto rimangono.

Questo significa che il processo di creare trasformare un PDF nella sua immagine grafica è semplicemente dato dalla lettura delle descrizioni, invece che dall'esecuzione di un programma con l'interprete PostScript. Comunque, tutte le funzionalità del PostScript come i caratteri, layout e misure rimangono invariate.

Spesso il codice PDF è generato da un file sorgente PostScript. I comandi grafici che vengono generati dal codice PostScript vengono raccolti così come tutti i file, risorse grafiche e riferimenti di caratteri nel documento e, finalmente, tutto viene compresso in un singolo file.

Come linguaggio di documenti, il PDF ha molti vantaggi rispetto al PostScript:

  • Un file: Un documento PDF consta di un singolofile, mentre in PostScript un documento può necessitare di essere rappresentato da molti file (grafica ecc.) che probabilmente occupano più spazio.
  • Già interpretato: PDF ha un contenuto già interpretato, cosicché richiede meno costi computazionali e la sua apertura è più veloce, oltre al fatto che c'è una corrispondenza diretta tra i cambiamenti degli oggetti nella descrizione della pagina PDF e cambiamenti nel rendering risultante.
  • Object transparency: PDF (starting from version 1.4) supports true object transparency while PostScript does not. (necessita traduzione)
  • Sostituzione dei caratteri: Se viene visualizzato con Adobe Reader, una strategia di sostituzione dei caratteri assicura che il documento sia leggibile nonostante l'assenza sul sistema dell'utente dei font "corretti".

PDF garantisce che vengano visualizzati font sostitutivi affini a quello mancante. Mentre questo è possibile con PostScript, questi file non possono essere normalmente distribuiti per accordi di licenza dei font.

  • Pagine indipendenti: PostScript è un linguaggio di programmazione, così le istruzioni su una pagina possono influenzare la visualizzazione di pagine seguenti. E' pertanto neccessario interpretare tutte le pagine precedenti per determinare l'aspetto di ogni pagina data. In PDF, invee, ogni pagina del documento document non viene influenzata dalle altre.


Protezione e crittografia

All'interno del file PDF vengono tenute informazioni sulla sicurezza (documento stampabile o non stampabile, protetto da password, con selezione di testo bloccata o non bloccata, ...) e l'indicizzazione.

La protezione di un documento PDF presenta una chiave di crittografia attualmente fino a 128 bit (tempo fa era di 40 bit), e per il futuro non è escluso che possa aumentare in relazione all'aumento di potenza dei calcolatori in grado di elaborare chiavi di accesso random a più di 128 bit.

Confronto con altri formati

Rispetto ad un documento di Word presenta dimensioni molto più ridotte in quanto nel formato Pdf sono eliminati gli spazi tra le parole e a fine riga. Per questo motivo, ma anche per la sua grande portabilità, viene utilizzato spesso in Internet.

Software per PDF

Un programma freeware per esportare il contenuto del documento Pdf in vari formati (immagini, testo, ecc) è il programma Ghost. Purtroppo questo programma è più conosciuto per eludere le protezioni che per altro.

Su GNU/Linux è possibile visualizzare i file pdf tramite i programmi xpdf e gpdf.

Collegamenti esterni