No final de 2017 havia mais de 1,7 bilhão de websites e mais de 47 bilhões de páginas na internet, de acordo com as plataformas Internet Live Stats e a World Wide Web Size, respectivamente. Esta é a internet “indexada” e não inclui a “dark web” ou bancos de dados privados.
O tamanho da web é medido de duas maneiras:
O primeiro é o “conteúdo”, a capacidade de armazenamento. Ela foi estimada em 2014 em 1024 bytes, ou um milhão de exabytes (e cada exabyte equivale a 1 bilhão de gigabytes);
O segundo é o “tráfego”, medido em zettabytes. O tráfego global passou recentemente um zettabyte, ou aproximadamente o conteúdo de 250 bilhões de DVDs (cada um com cerca de 4,7 gigabytes).
Acrescente as formas crescentes de medir um ser humano em termos de dados – sequenciamento de DNA, árvores genealógicas online, codificação genética, contas bancárias, informações online de todos os tipos – ou a quantidade de dados científicos produzidos e lidos em todo o mundo.
A quantidade de informação no mundo é impressionante. A quantidade de armazenamento que a maioria das pessoas precisa para fotos e documentos cresceu muito nos últimos anos.
Como espécie, estamos produzindo informações a uma taxa massiva.
A “leitura” da massa de dados levou a novos modelos preditivos de interação social. Empresas e governos estão se esforçando para usar esses dados, já que as pessoas parecem cada vez mais legíveis e possivelmente controláveis através da manipulação de informações.
Como todas essas informações podem ser armazenadas?
Atualmente, temos bibliotecas físicas, arquivos físicos e estantes de livros. A própria internet é “armazenada” em servidores de disco rígido no mundo todo, usando enormes quantidades de energia para mantê-los.
A infraestrutura on-line é dispendiosa, tem fome de energia e é vulnerável, bem como sua longevidade é limitada. Veja por exemplo o filme Duro de Matar 4.0 (Live Free or Die Hard 4.0) que ilustra um pouco disso.
Bibliotecas do futuro
O futuro do armazenamento de informações pode parecer monótono, mas é uma questão crucial para qualquer pessoa interessada no modo como as sociedades se lembram.
Um bom exemplo é o histórico familiar, onde os arquivos públicos, como registros de censos e informações fiscais, são cada vez mais acessados on-line.
Milhões de pessoas no mundo usam sites como Ancestry e Findmypast para acessar essas informações públicas e criar suas árvores genealógicas usando software on-line.
Essa proliferação de informações levanta questões éticas sobre o acesso, armazenamento e gerenciamento dos dados e de como os registros públicos vem sendo utilizados por empresas privadas para obter lucro ou favorecimento político, como no exemplo mais recente do escândalo do Facebook.
Como bibliotecas e arquivos podem funcionar no futuro, como serão configuradas, o que será armazenado – e por quê. Aqueles que usufruem da informação tem uma participação na maneira de como isso tudo será feito.
Nós realmente precisamos armazenar todos os tweets já enviados? Fazer qualquer tipo de escolha sobre o que armazenar, o que coletar ou arquivar provoca uma discussão complexa.
Então o que fazer?
Há discussões sobre quais informações armazenar (incluindo biobancos de espécimes biológicos), como e onde armazenar (no Ártico, no espaço, etc).
A maioria dessas discussões está ocorrendo dentro das comunidades científicas; algumas empresas especializadas em tecnologia estão envolvidas.
Aqueles que passaram anos pensando em memória e arquivamento – historiadores e bibliotecários – frequentemente estão à margem da discussão.
Nanocristais e DNA
Várias organizações diferentes estão explorando formas físicas de armazenar informações da humanidade. O armazenamento em discos de níquel ou códigos de barras escritos a laser em vidro de têm sido sugeridos.
Altamente experimental, a nanotecnologia procura “escrever” informações no nível quase molecular. O armazenamento nanotecnológico seria “lido” por meio de microscopia sofisticada – como o “efeito” da mudança química e de processos bastante complicados – em nanocristais que convertem a radiação infravermelha em algo “visível”.
Alguns dos modelos de armazenamento mais extravagantes vão desde um cofre de memória flash de dados na Lua até empresas privadas que enviam conteúdo digital para Marte ou para satélites que orbitam a Terra.
A maior parte da busca tecnológica atualmente parece ser biológica
Vários cientistas começaram a explorar a possibilidade de usar DNA para armazenar informações, chamando esse armazenamento de Memória de Ácido Nucleico (MAN).
Isso envolveria a “tradução” dos dados para as letras AGCT, os ácidos nucleicos básicos do DNA. Seriam então criadas cadeias de DNA que poderiam ser “traduzidas” de volta para o “original” por serem sequenciadas.
Em um estudo publicado na revista Science, cientistas da Universidade de Columbia, em Nova York, demonstraram que é possível armazenar 215 petabytes de informação em apenas um grama de DNA.
Os dados foram comprimidos num arquivo de 2 megabytes, depois foi transformado numa sequência de código binário “0” e “1”. Um algoritmo foi utilizado para converter os “0” e “1” para as bases do DNA: AGCT.
Para recuperar os dados, foi utilizada uma tecnologia moderna de sequenciamento de DNA e um software que converteu o código genético de volta ao código binário. Também demonstraram que um número virtualmente ilimitado de cópias pode ser criado apenas multiplicando a amostra de DNA.
Informação “virtualmente eterna” e o controle dela
O DNA é durável e cada vez mais fácil de produzir e ler. Ele permanecerá por milhares de anos nas condições corretas de armazenamento. Além disso, ele não se tornará obsoleto e não ocupará muito espaço.
Grande parte dessa tecnologia está dando seus passos iniciais. Os desenvolvimentos em nanotecnologia e sequenciamento de DNA sugerem que estaremos observando os resultados aplicados de experimentação e desenvolvimento dentro de alguns anos.
Surgem questões mais amplas sobre a ética da coleta e em que medida esses processos se tornarão predominantes. Dados impressos e digitais tornaram-se formas comuns e até democráticas de transmitir e armazenar informações.