Image by Thomas Rüdesheim from Pixabay

Sequestro de navegadores de IA para roubo de dados

Pesquisadores da LayerX Security descobriram uma técnica de ataque, batizada de “BioShocking”, que manipula navegadores com inteligência artificial para ignorar suas salvaguardas de segurança e executar ações maliciosas, como roubo de credenciais, conforme detalhado em relatório publicado pela empresa no dia 29 de junho. O ataque foi testado com sucesso em seis produtos, incluindo ChatGPT Atlas, Comet (Perplexity AI), e o plugin da Anthropic para Chrome, de acordo com a análise da LayerX.

O ataque funciona ao apresentar ao navegador uma página web maliciosa com um quebra-cabeças temático, onde respostas incorretas são recompensadas, explica o relatório. Ao aprender que as regras normais não se aplicam no jogo, o agente de IA passa a aplicar essa lógica a todas as ações subsequentes. Na etapa final, o agente é instruído a acessar um repositório no GitHub e copiar dados sensíveis, como credenciais, sem considerar que se trata de uma operação real.

A LayerX afirma que “após os agentes descobrirem as regras e aprenderem que ações incorretas são aceitáveis, eles não estavam mais vinculados à realidade”. Quando solicitados a comprometer credenciais de usuário, os seis agentes testados falharam em identificar a ação como violação de suas salvaguardas, segundo os pesquisadores. Em um cenário real, o atacante poderia roubar credenciais de acesso, tokens de autenticação e outras informações confidenciais, alerta o relatório.

Dos fornecedores notificados pela LayerX, apenas a OpenAI implementou uma correção eficaz. A Perplexity ignorou o relatório, a Anthropic tentou corrigir sem sucesso, e outras três empresas não responderam, conforme o documento. A LayerX recomenda que os fornecedores adicionem confirmação explícita do usuário para operações sensíveis e verifiquem mudanças de contexto, enquanto os usuários devem restringir o acesso de navegadores com IA a serviços confidenciais, conclui o relatório.