Salta al contenuto

Introduzione

Internet Archive

Tra le "vittime" dell’intelligenza artificiale potrebbe rientrare anche l’Internet Archive. I siti di molte testate, e di altre piattaforme fornitrici di contenuti, hanno infatti cominciato a bloccare l’accesso al bot che permette di raccogliere le informazioni riversate nella Wayback Machine, l’archivio digitale che, risalendo fino al 1995, tiene traccia di come si sono evolute le pagine web. 

Punto Informatico spiega che nella grandissima maggioranza dei casi il motivo del blocco non deriva da preclusioni nei confronti di Internet Archive, la cui missione di salvaguardia della memoria digitale è ampiamente apprezzata e riconosciuta. L'obiettivo è evitare che i programmi di intelligenza artificiale, tramite le attività di scraping, possano accedere e rielaborare i contenuti delle testate attraverso la Wayback Machine, aggirando i blocchi oro direttamente rivolti sui siti degli editori.

Dall’articolo si apprende che uno dei primi servizi a bloccare il bot di Internet Archive, nell’agosto dello scorso anno, è stato il social network Reddit, seguito a ruota da svariati editori.

Denunciando la natura paradossale di una vicenda che rischia di compromettere in maniera seria l’operato di Internet Archive, alcune associazioni attive nel campo dei diritti digitali, capeggiate da Fight for the Future e dalla Electronic Frontier Foundation, hanno sottoscritto una lettera pubblica . Oltre 100 giornalisti hanno già sottoscritto l’appello, tuttora aperto all’adesione di altri professionisti dell’informazione. 

Nelle generazioni precedenti — si legge in chiusura dell’articolo — i giornalisti si rivolgevano agli archivi fisici di un giornale locale o di una biblioteca pubblica per accedere a reportage storici e seguire le tracce del presente nella storia. Con la chiusura di molti giornali e senza una chiara via per le biblioteche pubbliche locali per preservare i reportage esclusivamente digitali, il compito di salvaguardare la documentazione giornalistica ricade sempre più su Internet Archive. I giornalisti firmatari considerano Internet Archive un tesoro nazionale. La storia digitale potrebbe essere persa per sempre, in quanto non esiste nessun servizio pubblico come la Wayback Machine”.

A poche settimane dalla divulgazione della lettera, il direttore della Wayback Machine Mark Graham ha illustrato la posizione di Internet Archive prendendo parte a un episodio del podcast Future Knowledge dedicato al tema “Preserving the web in the age of AI”.

Graham ha parlato di "danno collaterale (per la Wayback Machine ndr.) derivante dalla disputa in atto tra le aziende AI e gli editori”, aggiungendo che, stando a quanto emerso da conversazioni con svariati  giornalisti, i siti di molte testate non riescono a conservare il loro intero patrimonio digitale, e considerano pertanto la Wayback Machine come “un’ancora di salvezza indispensabile”. 

Commentando la testimonianza, l’esperto di tech policy Mike Masnick ha affermato che il blocco della Wayback Machine potrebbe rivelarsi  un “errore madornale da parte delle testate giornalistiche, una reazione eccessiva a un problema che probabilmente non esiste". Sulla stessa lunghezza d’onda il giudizio del’terzo ospite del podcast, l’esperto di media Kendra Albert:i siti web, siano editori di notizie o meno, dovrebbero fare attenzione a non gettare via il bambino con l'acqua sporca".

Leggi la news su Punto Informatico

Ascolta e leggi la trascrizione integrale del podcast sul blog di Internet Archive


Ultimo aggiornamento: 07-05-2026, 09:58