Quem vai arquivar a nossa internet?

Foto de um servidor de internet com a inscrição "Internet Archive"

"Uma vez postada na internet, já era". Um vídeo engraçado, uma foto vergonhosa... "Tentar tirá-la da internet é como tentar tirar xixi de dentro da piscina".

Você já parou pra pensar que pode não ser bem assim ? 

Atualmente, mais de 2,5 exabytes - ou 2,5 bilhões de gigabytes são gerados diariamente em todo o mundo. É muita foto de gatinho e prato de comida ! E com tanta informação sendo criada, as mais antigas em algum momento vão se perdendo. 

Já é difícil encontrar algum arquivo no seu computador, imagina no mundo todo ? Provedores e sites fecham... muita coisa vai se perdendo por aí. O GeoCities fechou, imagine quantas histórias foram por ralo abaixo ?
Claro que existe muita informação inútil rolando por aí, mas e quanto aos registros históricos ? A carta de Pero Vaz de Caminha, que registrou o nascimento do Brasil, está a disposição na internet, mas quem garante que as noticias de hoje serão preservadas para nossos netos e bisnetos ? Os registros das manifestações que ocorreram este ano, será que ainda estarão online daqui a vinte anos ?

E é por isso que estão aparecendo por ai os "arqueólogos da internet". A Revista Galileu postou uma reportagem sobre pesquisadores americanos que estão tentando descobrir por quantos anos uma noticia permanece online. Analisando twitts, blogs e outros sites, chegaram a conclusão que 11% das informações desaparecem em um ano, e 27% delas no segundo ano. Porém elas deixam rastros, e através de diversas ferramentas, conseguem reconstruir algumas histórias.

Com 20 anos de internet no Brasil, ainda não temos um órgão responsável por catalogar nossa rede mundial de computadores. Que registro temos dos sites dos últimos candidatos à presidência ? Poucos países resolveram essa questão. 

Esse papo começou entre eu e meu amigo André Luiz, que escreveu um post com sua visão sobre o assunto, e eu acabei trazendo a conversa para cá também. 

A máquina do tempo da internet

Muitas coisas se perdem nesse marzão da internet. Ainda bem que algumas a gente consegue re-encontrar : O Wayback Machine, projeto da organização sem fins lucrativos Internet Archive, desde 1996 coleta e arquiva mais de 347 bilhões de links, de 40 países. Em torno de 2,5 bilhões são sites ".br". A cada três meses, de 7 a 10 bilhões de páginas são acrescentadas ao acervo.

Você pode acessar o site http://archive.org/web/ e lá digitar o endereço de qualquer site. Por exemplo, você pode pesquisar pelo UOL e relembrar a mais antiga home page arquivada, direto de 1996 :

Imagem da primeira página inicial do UOL, na época chamado de Universo Online. Antigamente os links para as áreas do site ficavam espalhados em torno do logotipo do site, e nem exibia notícias na home-page.
Você sabia o significado de UOL ?
Tempos da internet discada, CD-Rom, 30 horas de internet, Bate-papo... aliás, será que o Bate-papo UOL ainda existe ? Vamos ver... caramba, ainda existe ! Que nostalgia !
"... entra na sala. Olá, quer tc ?"
Nossa internet mudou muito nesses últimos anos. No começo, apenas consumíamos conteúdo. Hoje, nós somos os geradores dele. Facebook está ai e não nos deixa mentir. Em 1998, essa era a chamada "Internet 2.0". Eu não sei qual será a próxima geração, só sei que eu quero surfar nela ! (Surfar na internet é um termo bem anos 2000...)

Quer guardar "pra sempre" um site, você mesmo ? o André deu a dica : um software para copiar todo o conteúdo de um site, para que você possa acessá-lo inclusive offline : gratuito e livre, é o HTTrack.

Existe muita história antes de Instagram, Facebook e Orkut. Qual foi o primeiro site que você visitou ? Conte nos comentários !
Tecnologia do Blogger.