Collezionare e archiviare i tweet, un caso studio
Il report “Collecting and archiving tweets: a DataPool case study” è stato scritto da Steve Hitchcock, della University of Southampton, ed è liberamente accessibile on line. Il documento presenta i risultati di un caso studio realizzato nell’ambito del più ampio progetto DataPool, finalizzato alla definizione di buone pratiche nel campo del data management. La domanda iniziale che ha ispirato il gruppo di ricerca è se può avere senso e valore provare a preservare nel tempo qualcosa di estremamente labile ed effimero come le centinaia di migliaia di messaggi condivisi in tempo reale, e incessantemente, su Twitter.
“L’informazione presentata ad un utente su Twitter – si legge nella presentazione del report – è definita comunemente come uno ‘stream’, ovvero un flusso costante di dati che scorre incessante sotto gli occhi di chi legge. Per fare riferimento alla totalità di dati che passano attraverso Twitter in ogni singolo momento, questo flusso viene spesso definito come un vero e proprio fiume in piena. Distraetevi un attimo, e li avrete perse. Ma queste informazioni hanno un valore monetario o di altro genere solo immediate? O esiste un ulteriore valore che potrebbe derivare dal collezionarle, conservarle e preservarle nel tempo?
Questo breve report (…) mostra i limiti imposti da Twitter e gli usi di determinati tipi di collezioni, descrive il modo in cui è evoluto un servizio per le collezioni in considerazione di questi limiti, e illustra le scelte pratiche che sono state prese per arrivare a definire uno specifico tipo di collezione archiviata”.
Sul blog del progetto DataPool si apprende anche che il gruppo di ricerca ha utilizzato una applicazione chiamata Tweepository per selezionare e presentare una serie di tweet, partendo da specifiche parole di ricerca e periodi di tempo definiti. Per lo svolgimento del caso studio, i ricercatori si sono concentrati in particolar modo sui tweet condivisi da alcuni utenti in occasione di conferenze o altri eventi pubblici. Nel post si specifica anche che il progetto si è concentrato finora sulle sole questioni relative alla selezione, alla collezione e alla conservazione dei tweet. Altri studi saranno successivamente dedicati alla domanda iniziale che ha ispirato l’avvio del progetto, ovvero se possa avere senso e valore archiviare dati e informazioni assolutamente volatili e legati al concetto di real time come quelli pubblicati e condivisi sui social media. “Archiviare i tweet è un primo step – si legge in proposito – provare a capire quanto vale l’informazione archiviata è a sua volta una nuova sfida”.