Data Breach Alert by StockCake

4 bilhões de IDs em banco MongoDB exposto na web

O portal noticioso Cyber News, baseado em Vilnius, capital da Lituânia, informou ontem que seus pesquisadores, junto com o pesquisador ucraniano Bob Diachenko, localizaram na Internet um banco de dados no padrão MongoDB, contendo cerca de 4,3 bilhões de registros relacionados a credenciais de pessoas. O banco de dados ocupa cerca de 16TB de armazenamento. A equipe do Cybernews analisou o banco de dados não seguro, encontrando nove coleções, cada uma com um nome que provavelmente indica o tipo de informação contida nelas. As coleções são as seguintes:

  • intent (intenção) – 2,054,410,607 docs (604.76 GB)
  • profiles (perfis) – 1,135,462,992 docs (5.85 TB)
  • unique_profiles (perfis únicos) – 732,412,172 docs (5.63 TB)
  • people (gente) – 169,061,357 docs (3.95 TB)
  • sitemap (mapa do site) – 163,765,524 docs (20.22 GB)
  • companies (empresas) – 17,302,088 docs (72.9 GB)
  • company_sitemap (site map da empresa) – 17,301,617 docs (3.76 GB)
  • address_cache (cache de endereço) – 8,126,667 docs (26.78 GB)
  • intent_archive (arquivo de intenções) – 2,073,723 docs (620 MB)

Sgundo o portal, a instância era totalmente estruturada e provavelmente composta por dados profissionais e corporativos extraídos de fontes externas. O banco de dados expôs perfis altamente detalhados derivados do LinkedIn, informações de contato, relacionamentos corporativos e históricos de emprego.

Leia também
Megabanco de dados expõe 26 bilhões de registros na internet
Hackers do bem e do mal guerreiam pela Rússia e Ucrânia

Todos os registros dentro de cada coleção específica são únicos. No entanto, podem estar repetidos em outras coleções. Embora diferentes coleções contenham conjuntos de informações distintos, os pesquisadores confirmaram que pelo menos três delas — profiles , unique_profiles e people — continham informações de identificação pessoal. A estrutura do banco de dados é indicativa de extração de dados no estilo do LinkedIn , o que geralmente significa que a maior parte dos dados, como e-mails, números de telefone, cargos e redes sociais, está atualizada e precisa.

Os registros de data e hora de “atualização” do banco de dados indicam que as informações foram coletadas e/ou atualizadas em 2025. No entanto, em 2021, agentes maliciosos publicaram alegações de que haviam extraído centenas de milhões de registros do LinkedIn . O banco de dados MongoDB exposto pode conter registros extraídos no passado.

Os pesquisadores também observaram que o banco de dados possui esquemas uniformes para perfis, contatos e históricos profissionais. As coleções Sitemap e company_sitemap , que contêm 180 milhões de registros, vinculam URLs a IDs de perfil. A equipe acredita que o grande volume do banco de dados vazado indica fortemente a presença de pipelines automatizados de extração e enriquecimento de dados.