Pesquisadores da LayerX Security descobriram uma técnica de ataque, batizada de “BioShocking”, que manipula navegadores com inteligência artificial para ignorar suas salvaguardas de segurança e executar ações maliciosas, como roubo de credenciais, conforme detalhado em relatório publicado pela empresa no dia 29 de junho. O ataque foi testado com sucesso em seis produtos, incluindo ChatGPT Atlas, Comet (Perplexity AI), e o plugin da Anthropic para Chrome, de acordo com a análise da LayerX.
O ataque funciona ao apresentar ao navegador uma página web maliciosa com um quebra-cabeças temático, onde respostas incorretas são recompensadas, explica o relatório. Ao aprender que as regras normais não se aplicam no jogo, o agente de IA passa a aplicar essa lógica a todas as ações subsequentes. Na etapa final, o agente é instruído a acessar um repositório no GitHub e copiar dados sensíveis, como credenciais, sem considerar que se trata de uma operação real.
A LayerX afirma que “após os agentes descobrirem as regras e aprenderem que ações incorretas são aceitáveis, eles não estavam mais vinculados à realidade”. Quando solicitados a comprometer credenciais de usuário, os seis agentes testados falharam em identificar a ação como violação de suas salvaguardas, segundo os pesquisadores. Em um cenário real, o atacante poderia roubar credenciais de acesso, tokens de autenticação e outras informações confidenciais, alerta o relatório.
Dos fornecedores notificados pela LayerX, apenas a OpenAI implementou uma correção eficaz. A Perplexity ignorou o relatório, a Anthropic tentou corrigir sem sucesso, e outras três empresas não responderam, conforme o documento. A LayerX recomenda que os fornecedores adicionem confirmação explícita do usuário para operações sensíveis e verifiquem mudanças de contexto, enquanto os usuários devem restringir o acesso de navegadores com IA a serviços confidenciais, conclui o relatório.






