Ferramenta pode ter exposto metodologia do Google

Da Redação
29/05/2024

Uma coleção de documentos que parecem descrever a metodologia pela qual o Google classifica os resultados de pesquisas na Internet apareceu on-line, provavelmente como resultado de publicação acidental feita por um bot interno da empresa. A documentação vazada descreve uma versão antiga da API Content Warehouse do Google e fornece uma visão geral do funcionamento interno da Pesquisa Google.

Rand Fishkin, que trabalhou com SEO por mais de uma década, disse que um pesquisador chamado Erfan Azimi – CEO da empresa de otimização de mecanismos de pesquisa (SEO) EA Digital Eagle – compartilhou 2.500 páginas de documentos com ele na esperança de que a reportagem sobre o vazamento contrariasse as “mentiras” que os funcionários do Google compartilharam sobre como funciona o algoritmo de busca. Os documentos descrevem a API de busca do Google e detalham quais informações estão disponíveis aos funcionários, de acordo com Fishkin.

Veja isso
Novo trojan para Android imita app de atualização do Google Play
Google pagou US$ 10 milhões em recompensas por bugs em 2023

Numa conversa, Azimi mostrou a ele o vazamento em si: mais de 2.500 páginas de documentação da API, contendo 14.014 atributos (recursos da API) que parecem vir do “Content API Warehouse” interno do Google. Com base no histórico de commits do documento, o material foi carregado no GitHub em 27 de março de 2024 e não removido até 7 de maio de 2024.

Ao portal Search Engine Land, um porta-voz do Google disse: “Advertimos contra fazer suposições imprecisas sobre a Pesquisa com base em informações fora de contexto, desatualizadas ou incompletas. Compartilhamos informações extensas sobre como a Pesquisa funciona e os tipos de fatores que nossos sistemas avaliam, ao mesmo tempo em que trabalhamos para proteger a integridade de nossos resultados contra manipulação”.

O material parece ter sido inadvertidamente enviado para o repositório, de propriedade do próprio Google, e acessível publicamente, pelas ferramentas automatizadas da empresa. Essa automação incluiu uma licença de código aberto Apache 2.0 no commit, como é padrão na documentação pública do Google. Um commit de acompanhamento em 7 de maio tentou desfazer o vazamento.

Compartilhar: