Portable Document Format
Il Portable Document Format, comunemente abbreviato PDF, è un formato di file basato su un linguaggio di descrizione di pagina sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall'hardware e dal software utilizzati per generarli o per visualizzarli.
Un file PDF può descrivere documenti che contengono testo e/o immagini in qualsiasi risoluzione. È un formato aperto, nel senso che chiunque può creare applicazioni che leggono e scrivono file PDF senza pagare i diritti (Royalty) alla Adobe Systems. Adobe ha un numero elevato di brevetti relativamente al formato PDF ma le licenze associate non includono il pagamento di diritti per la creazione di programmi associati.
Ogni documento PDF contiene una completa descrizione del documento bidimensionale (e, con la comparsa di Acrobat 3D, documenti 3D incorporati) composta da proprietà (Titolo, Autore, ecc.) testo, stili di carattere (font), immagini e oggetti di grafica vettoriale 2D che compongono il documento.
Il documento PDF non include informazioni specifiche per software, hardware e sistema operativo usato. Ciò permette che il documento venga visualizzato e renderizzato nella stessa esatta maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo. Anche questo fatto ha contribuito a farlo diventare un formato standard de facto molto diffuso per la condivisione dei documenti.
La stampa di documenti in formato .pdf può dare dei problemi se si usano dei caratteri locali (ad esempio le vocali italiane accentate) e se chi stampa ha il proprio PC impostato su una lingua diversa. Nel gennaio 2007 Adobe ha intrapreso la strada della standardizzazione per far diventare il PDF un formato standard ISO[1][2], a dicembre è stato approvato lo standard ISO 32000.[3]
Tecnologia
PostScript
Il PDF eredita molte delle funzionalità del PostScript, un linguaggio di descrizione della pagina anch'esso sviluppato da Adobe. Postscript permette di descrivere una pagina come il risultato di un'esecuzione di un programma, che contiene istruzioni su come e dove disegnare linee, punti, lettere dell'alfabeto e altri elementi grafici. In questo modo, ogni apparecchio capace di eseguire il programma (ossia, che abbia un interprete Postscript), sarà in grado di riprodurre tale immagine al meglio delle sue capacità. Questo processo, tuttavia, richiede grandi risorse da parte del terminale.
PDF, invece, è un formato, non un linguaggio di programmazione, e per questo motivo non ha bisogno di essere interpretato (Per i dettagli vedi Linguaggio compilato e Linguaggio interpretato). Per esempio, il controllo di flusso esercitato dai comandi come if
e loop
è stato rimosso, mentre comandi grafici come lineto
rimangono.
Questo significa che il processo di creare o trasformare un PDF nella sua immagine grafica è semplicemente dato dalla lettura delle descrizioni, invece che dall'esecuzione di un programma con l'interprete PostScript. Tutte le funzionalità del PostScript come i caratteri, layout e misure rimangono invariate.
Spesso il codice PDF è generato da un file sorgente PostScript. I comandi grafici che vengono generati dal codice PostScript vengono raccolti così come tutti i file, risorse grafiche e riferimenti di caratteri nel documento e, finalmente, tutto viene compresso in un singolo file.
Come linguaggio di documenti, il PDF ha molti vantaggi rispetto al PostScript:
- Un singolo file: Un documento PDF consta di un singolo file, mentre in PostScript un documento può necessitare di essere rappresentato da molti file (grafica ecc.) che probabilmente occupano più spazio.
- Già interpretato: PDF ha un contenuto già interpretato, cosicché richiede meno costi computazionali e la sua apertura è più veloce, oltre al fatto che c'è una corrispondenza diretta tra i cambiamenti degli oggetti nella descrizione della pagina PDF e cambiamenti nel rendering risultante.
- Trasparenza degli oggetti: Il PDF (a partire dalla versione 1.4) supporta la trasparenza reale degli oggetti, caratteristica che invece non è supportata nel formato PostScript.
- Sostituzione dei caratteri: Se viene visualizzato con Adobe Reader, una strategia di sostituzione dei caratteri assicura che il documento sia leggibile nonostante l'assenza sul sistema dell'utente dei font "corretti".
PDF garantisce che vengano visualizzati font sostitutivi affini a quello mancante. Mentre questo è possibile con PostScript, questi file non possono essere normalmente distribuiti per accordi di licenza dei font.
- Pagine indipendenti: PostScript è un linguaggio di programmazione, così le istruzioni su una pagina possono influenzare la visualizzazione di pagine seguenti. È pertanto necessario interpretare tutte le pagine precedenti per determinare l'aspetto di ogni pagina data. In PDF, invece, ogni pagina del documento non viene influenzata dalle altre.
Protezione, crittografia e descrizione
All'interno del file PDF vengono tenute informazioni sulla sicurezza (documento stampabile o non stampabile, protetto da password, con selezione di testo bloccata o non bloccata, ecc.) e l'indicizzazione.
La protezione di un documento PDF presenta una chiave di crittografia attualmente fino a 128 bit (tempo fa era di 40 bit), e per il futuro non è escluso che possa aumentare in relazione all'aumento di potenza dei calcolatori in grado di elaborare chiavi di accesso random a più di 128 bit.
La protezione crittografica dei PDF è molto debole, ed esistono numerosi programmi che riescono a rompere la chiave in tempi strettissimi. La protezione password PDF è sconsigliata per salvaguardare l'informazione al suo interno.
È possibile incrementare le possibilità di indicizzazione e posizionamento di un file PDF attraverso alcuni interventi di ottimizzazione compilando correttamente i campi della descrizione.
Software per PDF
Nel sistema operativo Mac OS X sono integrate sia la lettura che la scrittura (da qualsiasi tipo di documento) di file PDF; su altri sistemi operativi sono necessari programmi appositi.
Un programma freeware per esportare il contenuto di un documento PDF in vari formati (immagini, testo, ecc.) è il programma Ghost.
Per visualizzare i file pdf esistono molti software disponibili:
- Software libero
- Xpdf - disponibile per GNU/Linux e Microsoft Windows
- Evince - disponibile per GNU/Linux
- KPDF - disponibile per GNU/Linux
- Okular - disponibile per GNU/Linux
- SumatraPDF - disponibile per Microsoft Windows
- Ghostscript
- Poppler (informatica)
- GNU PDF project
- Software proprietario
- Adobe Reader - Disponibile gratuitamente per sistemi Microsoft Windows, GNU/Linux e Mac OS X
- Foxit Reader - Gratuito e disponibile per Microsoft Windows e GNU/Linux
- List of PDF Software
Molte applicazioni e sistemi operativi consentono di salvare direttamente in PDF, o hanno una pseudo-stampante[4] che salva in PDF. In mancanza di questa funzione, per realizzare un documento PDF occorrono software come:
- Adobe Acrobat
- PDFCreator
- [[1]] - crea pdf multipagina , archivia ed invia tramite mail versione base freeware
- OpenOffice
- pdflatex o pdftex (vedi LaTeX e TeX)
- FreePDF
- CutePDF Writer - Crea file PDF a partire da qualsiasi file; freeware.
Per firmare digitalmente un documento PDF si può usare:
Note
- ^ Adobe vuole trasformare il PDF in uno standard ISO
- ^ PDF cerca la benedizione di ISO
- ^ (EN) ISO Ballot for PDF 1.7 Passed!
- ^ Pseudo stampate: quando il programma viene istallato nel computer, compare come una stampante. Selezionandolo in fase di stampa no si ottiene fisicamente una stampa ma un flie in formato PDF che può essere salvato come un qualsiasi altro file nella cartella che si sceglie.
Collegamenti esterni
- Cos'è il PDF
- Perché utilizzare PDF (dal sito Adobe)
- The Camelot Project
- PDF Specification
- Planet PDF
- PDF zone
- CVISION PdfCompressor
- PDF-Worker
- Online PDF DOC PPT Viewer
- Online viewer for PDF, PostScript and Word
- Istruzioni per stampare correttamente file .pdf italiani su computer stranieri
- Haru Free PDF Library
- Come puoi rimuovere le "restrizioni" da un file PDF
- (EN) File Extension PDF Uniblue Research Labs
- Strumenti per convertire online un documento in PDF