Tipi di PDF
I documenti PDF possono essere classificati in tre tipologie diverse in base al modo in cui è stato originato il file. Il modo in cui è stato creato il file stabilisce anche se è possibile accedere al contenuto del PDF (testo, immagini, tabelle) o se questo è invece "sigillato" in un'immagine della pagina.
“True PDF” (normali) o creati digitalmente
I PDF creati digitalmente, conosciuti anche come "true PDF", sono creati utilizzando software quali suti office o tramite la funzione di "stampa" all'interno di un'applicazione software (stampante virtuale) e sono costituiti da testo e immagini.
Sia i caratteri del testo che le meta-informazioni presentano una designazione elettronica del carattere, è possibile eseguire facilmente delle ricerche all'interno di questi PDF nonché selezionare, modificare o eliminare testo in modo simile a quello di altri formati modificabili quali Word.
Le immagini nei documenti creati digitalmente possono essere ridimensionate, spostate o eliminate.
PDF "di sola immagine" o scannerizzati
Quando si scannerizzano documenti cartacei su dispositivi MFP o scanner, oppure si converte una fotografia digitale, un jpg, un tiff o uno screenshot in un PDF, il contenuto viene "sigillato" in un'immagine simile a un foto.
Questi documenti PDF di sola immagine contengono unicamente le immagini scannerizzate/fotografate delle pagine senza un livello di testo sottostante. Pertanto i PDF di sola immagine non sono ricercabili e il relativo testo non può essere modificato né contrassegnato.
È possibile rendere ricercabile un PDF "di sola immagine" applicando la tecnologia OCR con la quale viene aggiunto un livello di testo, normalmente sotto l'immagine della pagina.
PDF ricercabili
I PDF ricercabili sono normalmente creati eseguendo l'OCR (riconoscimento ottico dei caratteri) su PDF scannerizzati o su altri documenti basati su immagini.
Durante il processo di riconoscimento del testo, i caratteri e la struttura del documento vengono analizzati e "letti".
Viene aggiunto un livello di testo al livello dell'immagine, solitamente posizionato al di sotto di essa.
Questi file PDF risultano quasi del tutto indistinguibili dai documenti originali e sono completamente ricercabili.
All'interno di essi il testo può essere selezionato, copiato e contrassegnato.
La tecnologia di riconoscimento del testo può essere applicata in modi diversi durante il processo di conversione del documento, ognuno dei quali prevede livelli diversi di coinvolgimento dell'utente. Il riconoscimento può avvenire secondo diverse modalità.
Standard PDF
Ciò che è importante capire dello standard PDF e delle sue diverse specifiche è che ogni versione successiva non elimina quelle precedenti.
Ogni versione successiva amplia le capacità di formato, ma questo non significa che tutte debbano essere utilizzate per la creazione di documenti PDF, o che i documenti creati secondo le specifiche precedenti siano diventati obsoleti con l'introduzione di PDF 2.0.
Infatti, ci sono ancora pochi documenti PDF 2.0 in circolazione, e ancor meno utilizzano tutte le caratteristiche più recenti del formato, mentre la maggior parte dei documenti, anche quelli creati attualmente, sono PDF 1.7 o versioni precedenti.
La ragione di ciò è semplice e corrisponde fondamentalmente alla filosofia e allo scopo del formato PDF: se una specifica precedente è sufficiente a rappresentare bene il contenuto di un documento, è meglio utilizzarla per fornire la massima compatibilità con i diversi software PDF.
PDF 2.0
Tuttavia, introdotto nel luglio 2017, PDF 2.0 rappresenta un passo significativo nell'evoluzione del formato. Si tratta di un importante aggiornamento e perfezionamento delle specifiche PDF, accumulate in tutti gli anni precedenti.
Sebbene sia stato aggiunto il supporto di una serie di nuove funzionalità, l'obiettivo principale della creazione di PDF 2.0, e il suo risultato principale, è stato quello di consolidare, chiarire e affinare la specifica.
È stata completamente rivista per renderla più facile da capire ed eliminare funzioni legacy, e ora fornisce indicazioni molto più chiare agli sviluppatori sulla creazione di software PDF, il che alla fine si tradurrà in una migliore esperienza utente con i documenti PDF.
Il suo sviluppo da parte di un gruppo indipendente di esperti del settore nell'ambito delle procedure ISO (International Organization for Standardization) ha inoltre reso più efficace l'aggiunta di innovazioni in futuro. PDF 2.0 definisce il potenziale del formato PDF per gli anni a venire, il cui potenziale deve ancora essere sviluppato, e vedremo sicuramente ulteriori progressi in futuro.
Ulteriori informazioni su ISO 32000-2 (PDF 2.0)ENG
PDF/UA
"UA" sta per "Universal Accessibility", e PDF/UA è una specifica che definisce come rendere un documento PDF leggibile da tecnologie assistive (software speciali o anche dispositivi), in modo che un computer possa leggere ad alta voce il contenuto di tale documento a chiunque faccia affidamento su queste tecnologie.
Poiché i documenti PDF sono diventati molto comuni nella nostra vita, e in particolari in settori come i servizi di pubblica utilità, le banche, l'occupazione, i servizi medici e molti altri tipi di servizi, l'istruzione e così via, garantire la parità e la loro facile accessibilità è davvero cruciale.
Un documento PDF/UA ha una struttura logica definita e descritta in modo chiaro e corretto.
Usando questa struttura descrittiva, la tecnologia assistiva saprà e sarà in grado di dire qual è l'intestazione del documento, in quale modo leggere i paragrafi e le colonne di testo del documento, quali sono gli elenchi, dove sono le immagini e cosa rappresentano, saltare la lettura di intestazioni e piè di pagina ripetitive con numerazione delle pagine, e così via.
PDF/A
PDF è stato creato come formato in grado di fornire l'interoperabilità tra diversi software, computer e piattaforme.
Il formato PDF/A estende questa idea nel tempo: assicura che i documenti PDF possano essere aperti in futuro.
PDF/A è un formato PDF per l'archiviazione, la conservazione a lungo termine e lo scambio di documenti elettronici. L'aspetto visivo dei documenti elettronici viene mantenuto nel tempo, indipendentemente dagli strumenti e dai sistemi utilizzati per la loro produzione, memorizzazione e riproduzione. I documenti di origine possono essere documenti cartacei, e-mail, documenti PDF "normali", pagine web e molti altri. PDF/A fornisce un'affidabile istantanea digitale di qualsiasi documento, che rimane ricercabile e completamente utilizzabile per:
Gestione dei documenti
Flussi di lavoro automatizzati
Gestione dei registri legali
Archiviazione della posta: documenti cartacei, fax, e-mail
Archiviazione di documenti, migrazione degli archivi (e-Government, Legal, ecc.)
Grazie alla sua capacità di fornire una rappresentazione stabile e uniforme dei documenti nel tempo e sulle piattaforme, PDF/A viene utilizzato anche come formato per la gestione dei documenti e per lo scambio continuo di documenti. È "carta digitale", tanto affidabile, immutata e permanente quanto i documenti cartacei, di cui siamo abituati a fidarci.
Varianti di PDF/A
1, 2 e 3 indicano le parti di conformità PDF/A, che sono, fondamentalmente, le fasi di evoluzione del formato. La prima è stata PDF/A-1, mentre PDF/A-3 è l'ultima.
Maggiore è il numero, più capacità sono consentite in un documento conforme a PDF/A.
b, u e a indicano i livelli di conformità, che definiscono esattamente per quali scopi è garantita la conformità. È interessante notare che la conformità aumenta esattamente in quest'ordine: da b che assicura il minimo ad a che richiede tutta la conformità possibile secondo la specifica PDF/A:
b (da "basic")
garantisce la conservazione dell'aspetto visivo di un documento durante la visualizzazione o la stampa;
u (da "unicode")
oltre a b, richiede la mappatura di tutti i caratteri in Unicode. In questo modo si garantisce che i testi possano essere visualizzati correttamente e che i documenti rimangano ricercabili. "u" è stato introdotto come livello separato solo a partire dal PDF/A-2;
a (da "accessible")
oltre a b, richiede la mappatura di tutti i caratteri in Unicode nonché informazioni sulla struttura del documento.
Ciò garantisce la conservazione e la corretta interpretazione del contenuto del documento e della struttura logica (ordine di lettura), se interpretato, ad esempio, da tecnologie assistive.
| PDF/A-1 | PDF/A-2 | PDF/A-3 |
Sulla base di: | PDF 1.4 | PDF 1.7 | PDF 1.7 |
Livelli di conformità: | b, a | b, u, a | b, u, a |
Essenza: | Imposta le restrizioni d'uso e i requisiti per font, colori, annotazioni e altri elementi affinché un documento PDF sia autonomo e in grado di riprodurre l'aspetto per lungo tempo. | ||
Allegati: | Non sono ammessi allegati. | Sono ammessi allegati PDF/A. | Consente allegati di qualsiasi formato di file (modelli CAD, audio, video, dati XML, fogli di calcolo Excel, documenti Word, ecc.)* Gli allegati devono essere collegati a parti specifiche del documento e devono essere specificati i rapporti tra questi e il documento. |
Protezione con password: | Non è consentita la protezione con password | ||
Specifiche d'uso: |
| Gli allegati PDF/A permettono di conservare set di documenti correlati, mantenendo conforme l'intero set PDF/A. | Allegati di vario tipo consentono l'archiviazione o lo scambio unificante anche per complessi set di documentazione che contengono informazioni in formati non convertibili in PDF. Altre applicazioni o sistemi possono lavorare direttamente con gli allegati nei propri formati.** |
* L'utilizzo di PDF/A-3 non garantisce che tali allegati resteranno utilizzabili in futuro – permette solo la loro presenza nel documento.
** Per esempio, una rappresentazione XML del contenuto di una fattura può essere allegata alla tradizionale rappresentazione visiva della fattura, il che consente di elaborare tale fattura in sistemi ERP sia manualmente, in base alla sua "immagine", sia automaticamente utilizzando i dati XML.
Come controllare la conformità PDF/A?
Diversi software PDF , indicano se un documento PDF è conforme a PDF/A per impedire all'utente di intraprendere azioni che lo invalidano, come :
l'aggiunta di password di protezione.
Nel caso in cui sia necessario un controllo approfondito della conformità PDF/A, sono disponibili strumenti online.
IL FORMATO PDF/A PDF/A è uno standard internazionale (ISO19005), sottoinsieme dello standard PDF, appositamente pensato per l'archiviazione nel lungo periodo di documenti elettronici.
Tale standard garantisce che il documento sia visualizzabile sempre allo stesso modo, anche a distanza di tempo e con programmi software diversi.
Un documento PDF/A non può contenere macro-istruzioni o riferimenti ad elementi od informazioni (come i font) non contenuti nel file stesso.
STRUMENTI PER LA CREAZIONE DEL FORMATO PDF/A
Sono disponibili diversi prodotti e tools per la creazione, elaborazione e verifica di documenti in formato PDF/A
In particolare si segnalano i seguenti strumenti:
La stampante virtuale PDFCreator (open source di libero utilizzo) o similare
Installando la stampante virtuale PDFCreator, si può creare un PDF da qualsiasi programma lanciando il documento su questa stampante virtuale.
LibreOffice, dalla voce menu "File" scegliere quindi l'opzione "Esporta nel formato Pdf….."
salvare il documento nel formato pdf desiderato.
onlyOffice ed altri....