Salta al contenuto

Introduzione

L’intelligenza artificiale rischia di mettere in discussione la sopravvivenza del formato PDF? La domanda è tornata d’attualità con la recente pubblicazione dell’articolo "The war against PDF is heating up" ("La guerra contro il PDF si sta surriscaldando") sul The Economist.

Lo spunto è il recente fermento che sta portando al lancio sul mercato di soluzioni alternative al PDF (il cui anno di introduzione risale al 1993), per agevolare il compito delle intelligenze artificiali generative. Queste ultime, infatti, non sono particolarmente a proprio agio nell’interpretazione corretta di dati e contenuti presentati nei documenti prodotti con questo formato.

In sintesi, la proverbiale rigidità dei file PDF — al tempo stesso limite e loro principale punto di forza — garantisce una visualizzazione coerente su qualsiasi dispositivo, ma rende complessa l'interpretazione e l’estrazione corretta e coerente delle informazioni. Ed è proprio questa caratteristica a entrare oggi in attrito con il modo in cui le intelligenze artificiali operano: analizzando, scomponendo e rielaborando grandi quantità di contenuti dalle risorse reperibili in rete. Secondo alcune voci riportate nell’articolo dell’Economist, questo scarto sarebbe anche una delle principali cause dei fenomeni di "allucinazione" e produzione di informazioni errate che ancora oggi ne condizionano l’operato.

A questi limiti si sommano le difficoltà di lettura dei PDF sugli smartphone e altri dispositivi mobili, oltre alla loro vulnerabilità alla diffusione di malware e altri tipi di virus. Proprio per questo insieme di fattori, un numero crescente di startup sta cercando di lanciare prodotti e soluzioni che, con ambizioni più o meno solide, ambiscono a "pensionare" il PDF.

Nell’articolo del The Economist si precisa però che tale scenario è tutt’altro che imminente, anche in considerazione della posizione di assoluto dominio ancora detenuta dal PDF. Forti di questo status, i vertici della PDF Association invitano a inquadrare la questione da un altro punto di vista, sostenendo la necessità di sviluppare strumenti di intelligenza artificiale più capaci di interpretare correttamente i PDF così come attualmente strutturati. Lo stesso assistente AI integrato in Acrobat, sostengono, va proprio in questa direzione. E la recente introduzione di nuove funzionalità in Gemini per facilitare l’uso del PDF da parte degli sviluppatori rappresenta un ulteriore segnale in tal senso.

"Insomma, il PDF è tutt’altro che finito — conclude l’articolo il The Economist — ma per preservare la sue centralità dovrà adattarsi a un nuovo ecosistema che porti a concepire e realizzare i documenti in maniera diversa: non solo oggetti da leggere, ma anche comprensibili per le macchine".

La questione ha un’importanza tutt’altro che marginale anche nel panorama della conservazione digitale, dove da tempo il formato PDF/A si è imposto come lo standard internazionale di riferimento, per la sua capacità di preservare tutti i contenuti informativi, compresi i metadati, rendendo i documenti indipendenti da risorse esterne come link o contenuti dinamici, e limitando al massimo l’influenza di elementi “instabili” come video e istruzioni JavaScript.

Se tale evidenza è innegabile, lo è altrettanto la constatazione che la crescente diffusione delle soluzioni di intelligenza artificiale anche in ambito archivistico pone questioni, e richiede adattamenti, non più rimandabili.

Leggi l’articolo del The Economist


Ultimo aggiornamento: 06-04-2026, 20:10