O DeepSeek continua a agitar o mercado global de inteligência artificial. Após o sucesso do modelo R1, que demonstrou que a China é capaz de competir com o Ocidente em IA de ponta, surgiram rumores sobre o próximo lançamento: o DeepSeek R2. Se confirmadas, as informações indicam que as grandes empresas globais podem ser surpreendidas novamente.
Leia também
Patch de urgência no SAP Netweaver Composer
Holanda alerta para ataques russos à Europa
O modelo R1 foi considerado um divisor de águas e chegou a impactar o mercado de tecnologia dos EUA, causando perdas significativas no valor de ações. O DeepSeek também mostrou que é possível criar sistemas avançados de IA sem os investimentos massivos realizados por gigantes como a OpenAI. Agora, fontes chinesas afirmam que o DeepSeek R2 está em desenvolvimento e trará avanços ainda mais ousados.
Entre as novidades, o R2 deve adotar uma arquitetura híbrida aprimorada de modelo de especialistas (MoE), com mecanismos mais eficientes de distribuição de tarefas e integração de camadas densas para lidar melhor com altas cargas. O número de parâmetros pode dobrar em relação ao R1, alcançando 1,2 trilhão, o que o posicionaria ao lado de modelos como GPT-4 Turbo e Gemini 2.0 Pro.
Outro destaque é o custo: estima-se que o processamento de tokens do DeepSeek R2 será 97,4% mais barato que o do GPT-4, cobrando apenas US$ 0,07 por milhão de tokens de entrada e US$ 0,27 por milhão de saída. Essa vantagem pode tornar o R2 uma opção extremamente competitiva para empresas que buscam soluções de IA.
Além disso, o DeepSeek R2 teria alcançado 82% de utilização dos clusters com chips Ascend 910B da Huawei, entregando 512 petaflops de potência em FP16, consolidando uma cadeia de desenvolvimento totalmente nacionalizada.
Embora essas informações ainda não sejam oficiais, se forem confirmadas, o DeepSeek R2 pode representar um novo marco, não apenas para a tecnologia chinesa, mas para toda a indústria de inteligência artificial.