Portable Document Format
Il PDF (Portable Document Format) è un formato di file basato su un linguaggio di descrizione di pagina sviluppato da Adobe Systems per rappresentare documenti in modo indipendente dall'hardware e dal software utilizzati per generarli o per visualizzarli. Un file PDF può descrivere documenti che contengono testo e/o immagini a qualsiasi risoluzione. È uno standard aperto, nel senso che chiunque può creare applicazioni che leggono e scrivono file PDF senza pagare i diritti alla Adobe Systems. Adobe ha un numero elevato di brevetti relativamente al formato PDF, ma le licenze associate non includono il pagamento di diritti per la creazione di programmi associati.
Ogni documento PDF contiene una completa descrizione del documento bidimensionale (e, con la comparsa di Acrobat 3D, documenti 3D incorporati) composta da proprietà (Titolo, Autore, ...) testo, stili di carattere, immagini e oggetti di grafica vettoriale 2D che compongono il documento. PDF non include informazioni specifiche per software, hardware e sistema operativo usato. Ciò permette che il documento venga visualizzato, renderizzato e stampato nella stessa esatta maniera indipendentemente dalla piattaforma. Anche questo fatto ha contribuito a farlo diventare un formato standard de facto molto diffuso per la condivisione dei documenti.
Ogni file PDF incapsula una descrizione completa di un documento 2D (non tridimensionale, quindi), ovvero i testi, le font, le immagini ed eventualmente gli oggetti di grafica vettoriale, ma non include informazioni specifiche dell'hardware o del software usato per creare e leggere il documento. Questa ultima caratteristica assicura che il file PDF verrà riprodotto nella stessa maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo. Il PDF è da considerare anche come standard aperto in quanto chiunque può creare applicazioni che leggano o scrivano file PDF senza pagamento di royalties ad Adobe Systems.
Tecnologia
PostScript
Il PDF eredita molte delle funzionalità del PostScript, un linguaggio di descrizione immagini anch'esso sviluppato dall'Adobe. Postscript permette di descrivere un'immagine come il risultato di un'esecuzione di un programma, che contiene istruzioni su come e dove disegnare linee, punti, lettere dell'alfabeto e altri elementi grafici. In questo modo, ogni apparecchio capace di eseguire il programma (ossia, che abbia un interprete Postscript), sarà in grado di riprodurre tale immagine al meglio delle sue capacità. Questo processo richiede grandi risorse da parte del terminale.
PDF is a file format instead of a programming language and for that reason it doesn't need to be interpreted. For instance, flow control commands like if
and loop
are removed, while graphics commands such as lineto
remain.
That means that the process of turning PDF back into a graphic is a matter of simply reading the description, rather than running a program in the PostScript interpreter. However, the entire PostScript world in terms of fonts, layout and measurement remains intact.
Often, the PostScript-like PDF code is generated from a source PostScript file. The graphics commands that are output by the PostScript code are collected and tokenized; any files, graphics or fonts the document references are also collected; and finally everything is compressed into a single file.
As a document format, PDF has several advantages over PostScript:
- Single file: A PDF document resides in a single file, whereas the same document in PostScript may span multiple files (graphics, etc.) and probably occupies more space.
- Already interpreted: PDF contains already-interpreted results of the PostScript source code, so it is less computation-intensive and faster to open, and there is a more direct correspondence between changes to items in the PDF page description and changes to the resulting appearance of the page.
- Object transparency: PDF (starting from version 1.4) supports true object transparency while PostScript does not.
- Font substitution: If displayed with Adobe Reader, a font-substitution strategy ensures the document will be readable even if the end-user does not have the "proper" fonts installed. PDF also allows font embedding to ensure that the "proper" fonts are displayed. While this is possible with PostScript, such files cannot normally be distributed freely because of font licensing agreements.
- Independent pages: PostScript is a programming language, so instructions with one page can affect the appearance of any following page. It is therefore necessary to interpret all the preceding pages in order to determine the appearance of any given page. Each page in a PDF document is unaffected by any others.
Protezione e crittografia
All'interno del file PDF vengono tenute informazioni sulla sicurezza(documento stampabile o non stampabile, protetto da password, con selezione di testo bloccata o non bloccata, ...) e l'indicizzazione.
La protezione di un documento pdf presenta una chiave di crittografia attualmente fino a 128bit (tempo fa era di 40bit), e per il futuro non è escluso che possa aumentare in relazione all'aumento di potenza dei calcolatori in grado di elaborare chiavi di accesso random a più di 128bit.
Confronto con altri formati
Rispetto ad un documento di Word presenta dimensioni molto più ridotte in quanto nel formato Pdf sono eliminati gli spazi tra le parole e a fine riga. Per questo motivo, ma anche per la sua grande portabilità, viene utilizzato spesso in Internet.
Software per PDF
Un programma freeware per esportare il contenuto del documento Pdf in vari formati (immagini, testo, ecc) è il programma Ghost. Purtroppo questo programma è più conosciuto per eludere le protezioni che per altro.
Su GNU/Linux è possibile visualizzare i file pdf tramite i programmi xpdf e gpdf.