
Conforme informações do próprio site, conjuntos de dados disponíveis no data.gov, o maior repositório de dados abertos do governo dos EUA na internet, estão sendo excluídos. Desde a posse de Donald Trump como presidente, mais de 2.000 conjuntos de dados desapareceram da base de dados.
Pesquisadores das comunidades de arquivamento e coleta de dados notaram que, em 21 de janeiro, havia 307.854 conjuntos de dados no data.gov. Agora, conforme atualizado na quinta-feira, esse número caiu para 305.564. Muitas das exclusões ocorreram imediatamente após a posse de Trump, de acordo com registros salvos no Wayback Machine do Internet Archive. O pesquisador da Universidade de Harvard, Jack Cushman, está documentando os conjuntos de dados do Data.gov antes e depois da posse, com o objetivo de criar um arquivo completo dos dados.
Como o data.gov é um agregador que nem sempre hospeda os dados, isso não significa necessariamente que os dados foram completamente excluídos. Eles podem estar disponíveis em outros sites do governo federal ou podem ser re-hospedados em outro lugar. Pesquisas adicionais são necessárias para determinar o que aconteceu com cada conjunto de dados ou para verificar se ele aparece em outro site governamental. Por exemplo, a 404 Media encontrou conjuntos de dados na análise de Cushman que não estão mais acessíveis no data.gov, mas podem ser encontrados em sites de agências individuais.
Os conjuntos de dados que não estão mais acessíveis no portal são desproporcionalmente provenientes do Departamento de Energia, da Administração Nacional Oceânica e Atmosférica (NOAA), do Departamento do Interior, da NASA e da Agência de Proteção Ambiental. No entanto, identificar o que foi realmente excluído ou o que apenas se mudou ou está arquivado em outro lugar é uma tarefa manual e, portanto, é prematuro afirmar com certeza o que se perdeu.
"Alguns dos registros linkam para dados reais," comentou Cushman à 404 Media. "E alguns deles fazem link para uma página de entrada onde os dados estão hospedados. A questão é: quando os dados desaparecem, é o dado que está faltando ou é apenas o índice que se perdeu?"
Por exemplo, um conjunto de dados da NOAA intitulado "National Coral Reef Monitoring Program: Water Temperature Data from Subsurface Temperature Recorders (STRs) deployed at coral reef sites in the Hawaiian Archipelago from 2005 to 2019" não pode mais ser encontrado no data.gov, mas é acessível em um dos sites da NOAA. Em contraste, outro conjunto de dados da NOAA, "Stetson Flower Garden Banks Benthic_Covage Monitoring 1993-2018 - OBIS Event," parece ter sido excluído da internet.
A determinação do que foi excluído e por quê parece ser uma tarefa simples, mas na verdade é complexa, uma vez que muitos dos dados deletados provavelmente são resultados de mudanças rotineiras de administração, além de possíveis ações deliberadas para eliminar informações. Por exemplo, após a posse de Joe Biden, aproximadamente 1.000 conjuntos de dados foram mostrados como deletados na plataforma, segundo registros do Wayback Machine.
O data.gov, por sua natureza como um agregador, complica o processo de arquivamento, conforme explicado por Mark Phillips, pesquisador da Universidade do Texas do Norte. "É desafiador saber exatamente o que, onde e com que frequência as informações mudam," disse Phillips. A equipe de arquivo tem trabalhado para coletar grandes volumes de conteúdo da web, incluindo dados do data.gov.
Um relatório de 2019 do Environmental Data & Governance Institute (EDGI) revelou como a administração Trump prejudicou as infraestruturas da web para informações climáticas, não apenas excluindo conjuntos de dados, mas também tornando-os muito mais difíceis de encontrar.
James Jacobs, pesquisador das Bibliotecas de Stanford, comentou que o data.gov sempre foi visto como um "depósito de dados do governo" e que a falta de regulação específica sobre o uso da plataforma pelas agências contribui para a situação atual.
"É verdade que a administração Trump está excluindo dados e dificultando o acesso," afirmou Phillips. "Quando dependemos de um único lugar para coletar, hospedar e disponibilizar esses conjuntos de dados, sempre teremos problemas com dados desaparecendo."
Dessa forma, o contexto de exclusões em massa de conjuntos de dados, especialmente em áreas como pesquisa climática e informações sobre comunidades marginalizadas, é alarmante e requer uma investigação cuidadosa para entender a extensão da perda e as suas implicações.
Confira os últimos vídeos publicados no canal