A Alibaba apresentou um modelo de IA que, segundo a empresa, supera os principais sistemas ocidentais, como o GPT-4o da OpenAI e o Claude 3.5 Sonnet da Anthropic. Ele se chama Qwen 2.5 MaxCom, e com base em benchmarks como Arena-Hard e MMLU-Pro o modelo demonstrou desempenho superior em diversas tarefas, abrangendo texto, vídeo e imagens. Ele utiliza a arquitetura MoE (mistura de especialistas) e foi treinado em um conjunto de 20 trilhões de tokens, permitindo maior eficiência sem comprometer a velocidade de resposta. No entanto, ao contrário das versões anteriores, este modelo não será disponibilizado publicamente, sendo oferecido apenas via API a um custo superior ao do GPT-4o.
Leia também
Nvidia, Zoom e Zyxel corrigem falhas críticas
Hackers roubam US$ 85 Milhões da Phemex
O avanço da China na IA desafia a liderança dos EUA e levanta questões sobre os esforços ocidentais para conter o crescimento da tecnologia no país. O Alibaba já lançou modelos de código aberto com até 72 bilhões de parâmetros e está investindo em versões especializadas para cálculos matemáticos e programação. Recentemente, a empresa também apresentou três modelos de aprendizado de máquina de imagem que competem com o Gemini 2 do Google e o GPT-4o. Além disso, atualizou seus modelos Qwen 2.5 de 7 e 14 bilhões de parâmetros, expandindo a janela de contexto para um milhão de tokens, o que melhora significativamente a capacidade de processamento de grandes volumes de informações.
Apesar do sucesso, surgem preocupações sobre privacidade de dados e censura. Os servidores do Qwen Chat estão localizados na China e em Cingapura, levantando questões sobre o acesso do governo chinês aos dados dos usuários. Além disso, como outros modelos chineses, o Qwen evita temas sensíveis, como os eventos da Praça da Paz Celestial ou o status político de Taiwan. O crescimento da IA chinesa evidencia não apenas avanços tecnológicos, mas também desafios geopolíticos e éticos na corrida global pela liderança em inteligência artificial.