webarchiving_331_285_cy.png

O Web archiving e a preservação de sites

Rangel Trindade

Conteúdos produzidos na web, uma vez vistos como patrimônio cultural, precisam ser coletados, catalogados e armazenados, fazendo parte da história. Isto se dá através do instituto do web archiving.

A natureza veloz e transitória da rede faz sites desaparecem ou serem atualizados frequentemente. Adquirir, preservar e tornar acessível o conhecimento e as informações da internet para as gerações futuras, particularmente em nosso país, através de conteúdos relevantes em seu aspecto cultural, é fundamental.

Em outras palavras, páginas da web que possuem conteúdo que merece ser resguardado do apagão da memória da internet, gerado pelas atualizações constantes ou retiradas de URLs do ar, devem ser arquivadas. Se nesta era tudo se converge para a rede, qual a garantia que os conteúdos produzidos originalmente em formato digital estarão disponíveis para as gerações futuras?

Habilitar a coleta de um rico conteúdo de Internet ao redor do mundo a ser preservado de uma forma que pode ser arquivado, seguro e acessível ao longo do tempo é uma experiência que vem sendo adotada por países como a França, por exemplo, através de sua Bibliothèque Nationale (BnF) digital, utilizando o auxílio do Consórcio Internacional de Preservação da Internet (IIPC na sigla em inglês), organização virtual, colaborativa e descentralizada, como a própria internet, e que foi fundada em 2003.

O fato do Brasil, e tampouco a América Latina, ainda não contarem com nenhuma instituição, legislação, diretriz ou esforço neste sentido, faz com que conteúdos vistos como patrimônio cultural (através do conteúdo de páginas de internet) não sejam coletados, catalogados e armazenados. E entende-se como relevantes ao Web Archiving todos os aspectos visualizados pelo usuário, mantendo-se a estética, diagramação, texto, cores, imagens e demais elementos. De forma privada, existem outras iniciativas, como o Internet Archive/2002.

Símbolos de relevância digital deste começo de século XXI, a memória das recentes manifestações populares brasileiras de junho de 2013, paradoxalmente, só está garantida nos formatos impressos, pois acredita-se não ter sido guardado o arcabouço de matérias produzidas e indexadas na rede. Outro exemplo, segundo Carlos Entini, são as campanhas eleitorais pretéritas, onde contar a história e analisar as eleições presidenciais a partir dos sites dos candidatos já não é possível, vez que já se foram quatro eleições presidenciais com a presença da internet e nada foi coletado e sistematizado.

Considerar o arquivamento da web como questão de Estado em relação a conteúdos com manifesto patrimônio cultural a ser tutelado é imprescindível, e os modelos internacionais de aplicação da medida devem servir de patamar ao Brasil implementar bibliotecas públicas digitais; estas, além de arquivarem escaneamentos de obras antes impressas sob o meio de livro que estavam ameaçadas de desaparecer, podem também conter sessão destinada a projetos de “arquivamento web”.

A missão de coletar, preservar e tornar acessível o conteúdo da internet para as futuras gerações, de conteúdo que possa ser relevante, culturalmente falando, “esbarra”, a priori, no direito autoral aplicado às novas Tecnologias de Informação e Comunicação (TICs), ao falarmos do arquivamento de conteúdo que é de criação de autores, bem como do alcance da disponibilização a ser aplicada.

Aqui novamente servimo-nos do exemplo francês: segundo Entini, utilizando a figura jurídica do depósito legal, na qual todo produtor de conteúdo cultural (livro, jornal, disco, cd, dvd, software etc) deve entregar uma cópia à Biblioteca Nacional Francesa, a internet francesa foi incluída na lei, no ano de 2006. Todo o domínio ‘.fr’ e tudo o que se produz sobre a França deve ser coletado e armazenado, e a BnF, depositária legal, é a responsável pela coleta e arquivamento do conteúdo web, e desde 2002 até hoje arquivou mais de 20 bilhões de URLs,, ocupando 370 Terabytes.

E em relação ao direito de autor, assim como no caso de outras mídias, para o modelo francês o depósito legal não significa a supressão de direitos, uma vez que, para se consultar o conteúdo web francês, é necessário ir à Bibliothèque Nationale. Ou seja, o fator “disponibilização” obedece a regra de consulta local.

A proteção autoral aplicada foi consolidada pela Convenção de Berna de 1878, norma internacional fundamental, que contém a chamada regra dos três passos (em inglês, three-step test), que prevê exceções ao direito de reprodução: em certo casos especiais (1°passo), que não conflitem com a exploração comercial da obra (2°), e não prejudiquem sem motivo os legítimos interesses do autor (3°).[1] É o caso da BnF, modelo a ser seguido.


[1]    WORLD INTELLECTUAL PROPERTY ORGANIZATION – WIPO, 1979, op. cit.