Online ARCH, strumento per la creazione e l’analisi computazionale delle collezioni digitali

La piattaforma frutto di una collaborazione tra Internet Archive e Archives Unleashed project. Ricercatori, giornalisti e professionisti della conservazione potranno usarla per ricavare set di dati e conoscenze da collezioni di web archiving di ingenti dimensioni

Da una collaborazione tra Internet Archive e Archives Unleashed project, è nato  ARCH (Archives Research Compute Hub), nuovo servizio online liberamente utilizzabile per costruire, rendere accessibili e analizzare collezioni digitali composte da ingenti quantità di dati, facendo ricorso a tecniche computazionali.

Lo strumento è pensato per indirizzare e facilitare le attività di ricerca computazionale all’interno di collezioni digitali delle più svariate tipologie, generando set di dati che possono essere resi accessibili ed analizzati, sempre attraverso soluzioni di calcolo automatico. La piattaforma è anche pensata per la libera pubblicazione e la conservazione di set di dato generati dagli utenti.

ARCH - si legge sul blog di Internet Archive - è ottimizzata per processare decine di migliaia di collezioni derivanti da attività di web archiving, coprendo un raggio estremamente ampio di temi, eventi e periodi temporali. La piattaforma si sta attivamente espandendo per includere collezioni che contemplino combinazioni di testi e immagini. 

ARCH permette inoltre di lavorare con ampie porzioni dell'archivio web globale frutto delle attività di  Wayback Machine, per oltre 50 Petabyte di dati che risalgono fino al 1996: un vero e proprio archivio su larghissima scala della storia e della comunicazione contemporanea”.

Tra gli utenti del nuovo servizio, i suoi creatori fanno riferimento ai professionisti del mondo della ricerca, agli educatori, ai giornalisti in cerca di determinati trend nell’ecosistema della comunicazione web, o ancora ai bibliotecari e archivisti impegnati nella definizione di competenze computazionali trasversali tra più discipline.

Ad oggi, la piattaforma è stata già testata, tra le altre cose, per effettuare analisi su come è stata gestita a livello comunicativo l’emergenza Covid, la disinformazione sulle tematiche sanitarie, i movimenti per i diritti delle donne latino-americane e la riconciliazione sociale in contesti post-bellici.

Approfondisci sul bog di Internet Archive

Azioni sul documento

ultima modifica 2023-06-29T11:51:22+01:00
Questa pagina ti è stata utile?

Valuta il sito

Non hai trovato quello che cerchi ?

Piè di pagina