L’acquisizione su larga scala dei contenuti “nativi digitali”: l’esperienza di StoryCorps
Chi un domani vorrà sintonizzarsi sul “tono di voce” dell’America del XXI secolo molto probabilmente si imbatterà nella preziosissima eredità lasciata dal progetto StoryCorps. Dell’iniziativa ci siamo già occupati un paio di volte in passato, e rimandiamo a quegli articoli (1 e 2) per chi voglia approfondire in materia. Qui ci limitiamo a ribadire che si tratta di un progetto di storia orale, con ogni probabilità il più vasto e importante al mondo, lanciato nel 2003, grazie al quale sono state registrate decine di migliaia di interviste riguardanti le esperienze di vita delle persone comuni: storie, affetti, vicissitudini e i bei momenti che hanno vissuto, a comporre un immenso mosaico dal quale emerge, in controluce, la più autentica e sfaccettata American way of life dei nostri decenni. Le interviste sono tutte in formato digitale, centinaia sono state trasmesse settimanalmente in un’apposita trasmissione della National Public Radio, e alcune sono state anche trascritte e raccolte in quattro volumi che hanno riscontrato un grande successo di pubblico. Tutte, indistintamente, vengono inoltre conservate in digitale, affinché possano essere tramandate anche alle future generazioni, presso l’American Folklife Center delle Library of Congress.
Fin qui, niente di nuovo rispetto a quanto già raccontato nelle “puntate precedenti”, ma dal momento della loro scrittura ad oggi, la grande novità è che il progetto è diventato a tutti gli effetti una operazione 2.0. Dal marzo 2015 infatti, StoryCorps ha esteso la sua presenza anche nel mondo mobile, con una app che chiunque può scaricare e utilizzare per effettuare interviste e nuove testimonianze vocali da aggiungere alla già ricchissima collezione di voci fin qui accumulate. In buona sostanza, se fino a pochi mesi fa erano sempre e comunque i promotori del progetto a programmare e realizzare le nuove interviste, con tutti gli inevitabili limiti derivanti dalla limitatezza delle risorse, ora la sua portata si amplia a dismisura. Bastano pochi secondi per scaricare la app, premere il tasto Rec, e contribuire alla scrittura di una storia collettiva, rigorosamente orale, da ogni angolo del mondo.
Complice la notevole popolarità del progetto, le conseguenze di questa novità non si sono fatte attendere. Alla fine del 2015 – anche a seguito di una iniziativa realizzata in occasione del Giorno del Ringraziamento, durante la quale i docenti e gli studenti delle scuole superiori hanno potuto scaricare un kit speciale per realizzare nuove interviste – circa 70.000 nuove testimonianze erano già state caricate on line grazie al nuovo sistema. Una crescita esponenziale, che ovviamente ha avuto ripercussioni importanti anche sulle attività di conservazione digitale in carico all’American Folklife Center. Tenendone conto, a dicembre il blog tematico The Signal della Library of Congress è tornato a occuparsi di StoryCorps, con una intervista ai due professionisti della biblioteca che, in collaborazione con lo staff del progetto, si sono occupati di pianificare e ottimizzare i processi per l’acquisizione e la successiva archiviazione delle decine di migliaia di nuove testimonianze raccolta via mobile. “Questa intervista – si legge in apertura dell’articolo – illustra tali processi e fornisce consigli per quanti vogliano realizzare iniziative analoghe, formulando anche riflessioni sul futuro delle attività di acquisizione su larga scala per scopi di conservazione nel lungo periodo”.
Rimandando all’approfondimento per i dettagli, segnaliamo qui che il trasferimento delle interviste della piattaforma della app alla Library of Congress è avvenuto grazie all’esistenza di una API (application programming interface) appositamente progettata per questo scopo. Grazie alla soluzione, grandissima parte del lavoro di acquisizione, verifica, copia e successiva preparazione dei materiali per l’archiviazione avviene in automatico, un presupposto ovviamente indispensabile per far fronte ai numeri strepitosi che caratterizzano l’operazione. Un altro aspetto interessante che emerge dall’intervista è che per assecondare le specifiche esigenze alla base delle attività di conservazione digitale, lo staff di StoryCorps ha dovuto attribuire ad ogni singola intervista una checksum, vale a dire una sequenza di bit che funziona come una vera e propria impronta digitale e garantisce l’assoluta integrità dei materiali caricati tramite la app. “In questo modo possiamo essere sicuri al 100% che non siano avvenuti errori durante il processo di trasmissione dei dati – si legge a riguardo – e grazie a ciò siamo in grado di stabilire una catena di custodia”.
Durante la definizione dei processi per l’acquisizione delle testimonianze, molta attenzione è stata dedicata anche ai metadati. “Grazie alla esplosione della fotografia digitale – dichiara una bibliotecaria – il concetto è entrato nel gergo comune e non è più limitato alla cerchia dei soli addetti ai lavori. Sempre più persone capiscono che le descrizioni dei dati possono essere importanti tanto quanto i dati che descrivono, ed è per questo che mi viene da incoraggiare i fornitori di contenuti a ragionare sempre di più su questo aspetto, specie per le loro ripercussioni sulle attività di conservazione. Durante la progettazione di questo nuovo processo ci siamo confrontati sulla possibilità di archiviare anche i commenti e i ‘like’ attribuiti alle interviste. I ‘like’ però sono talmente fluidi che fare la foto di una schermata in un preciso momento può essere molto arbitraria e per questo poco rilevante. I tag invece potrebbero essere dvvero utili per i ricercatori del futuro”. Ulteriori dettagli riguardano le modalità di storage e messa in sicurezza delle singole interviste. Per ognuna di esse si realizzano molteplici copie, salvate in diverse location: questo aiuta ad azzerare i rischi di perdita dei contenuti a causa di guasti o altri errori, mentre per quanto riguarda l’obsolescenza dei formati, i bibliotecari digitali dichiarano che, trattandosi di conservare file in formati molto popolari, comuni e longevi come il JPG e l’MP3, per ora non ci sono particolari preoccupazioni.
Infine, non manca una riflessione di carattere più generale sulla crescente importanza delle attività di acquisizione dei contenuti “nativi digitali” prodotti, pubblicati e condivisi su diretta iniziativa degli utenti Internet. “Al momento – spiega la bibliotecaria – i contenuti nativi digitali rappresentano una piccola parte delle nostre collezioni, ma sono destinati a crescere in maniera esponenziale. Possiamo creare strumenti ad hoc per rendere possibili simili processi di acquisizione. Abbiamo già un robusto programma di web archiving, focalizzato sul concetto che un sito web sia di per sé una specifica pubblicazione. Le collezioni native digitali differiscono dai siti perché sono basate sull’esistenza di oggetti (foto, tweet, libri, blog) pubblicati on line. Per queste tipologie di acquisizione possono verificarsi delle economie di scala enormi, e i risultati finali possono essere di estrema utilità per i ricercatori del futuro”.