Introduzione
La Biblioteca Nazionale Svedese ha avviato una sperimentazione delle tecnologie di intelligenza artificiale finalizzata allo sviluppo di soluzioni che permettano di migliorare l’accesso e la valorizzazione del proprio patrimonio di collezioni. L’obiettivo è sviluppare metodi analisi ed elaborazione dei dati e delle informazioni che possano portare ad automatizzare le attività di classificazione, potenziare le funzionalità di ricerca e migliorare le tecniche OCR, per il riconoscimento ottico dei testi e di altre tipologie di contenuti presenti nelle scansioni di manoscritti e altre opere analogiche.
Per arrivare a questi risultati, la Biblioteca ha dato “in pasto” alle tecnologie di intelligenza artificiale gran parte del proprio patrimonio: oltre 18 milioni di fonti e documenti che vanno dai primi manoscritti risalenti all’epoca vichinga, a una vastissima mole di materiali prodotti in epoca contemporanea, tra cui collezioni di quotidiani e periodici, archivi di di trasmissioni televisive e radiofoniche e risorse provenienti da Internet e dagli altri ecosistemi digitali.
Tra le sperimentazioni in atto, un filone particolarmente importante è orientato all’utilizzo delle soluzioni di machine learning per analizzare e rielaborare le enormi quantità di testi contenuti nelle collezioni. Lo scopo è duplice: da un lato generare descrizioni automatiche degli stessi e dall’altro individuare modelli, ricorrenze e altre connessioni tra i documenti, che possano accrescere esponenzialmente le potenzialità di ricerca e studio sugli stessi. Altre soluzioni sono orientate alla trascrizione automatica in digitale dei contenuti audio e dei testi degli antichi manoscritti.
Tra i risultati attesi, i promotori del progetto auspicano si possa arrivare alla creazione di set “iper-specializzati” di dati, difficilmente ottenibili attraverso le tradizionali attività di ricerca e studio delle collezioni.
Facendo alcuni esempi, ciò a cui si tende è arrivare a realizzare interrogazioni che permettano di ricercare tutte le illustrazioni che raffigurano un particolare edificio, l’intero corpus di fonti e documenti che fanno riferimento a un personaggio storico, o testi scritti con un particolare stile o in una variante specifica di dialetto o variante storica dello svedese.
Ultimo aggiornamento: 29-06-2023, 12:41