Aristóteles, Mozart, Leonardo da Vinci, Cleópatra e Genghis Khan estão num trem em movimento, compartilhando uma cabine. Quatro dessas personalidades são representações de I.A. generativa. Apenas uma delas é verdadeiramente um humano. Esse é o contexto de um vídeo que viralizou desde o início de junho, mostrando que a inteligência artificial, venceu: cada interlocutor fez uma pergunta a outro e as respostas conduziram à conclusão certa, num “Teste de Turing ” invertido.
Veja isso
Vulnerabilidade na máquina universal de Turing
Ataques a PMEs elevam em 47% total de vítimas de ransomware
O teste de Turing, sugerido pela primeira vez pelo cientista da computação Alan Turing em 1950 como o “jogo de imitação”, é um método para julgar a capacidade de uma máquina de mostrar um comportamento inteligente indistinguível do comportamento humano. Nenhum modelo de IA é amplamente reconhecido como tendo passado no teste, embora cientistas tenham afirmado recentemente que o GPT-4 passou durante um estudo.
No teste de Turing “reverso”, cada chatbot seguiu uma ordem específica. Aristóteles foi identificado como GPT-4 Turbo, Mozart como Claude-3 Opus, Leonardo da Vinci como Llama 3, Cleópatra como Gemini Pro. Genghis Khan era um homem – Tor Knabe, um desenvolvedor de jogos de realidade virtual, responsável pela criação do teste.
As respostas da IA foram longas e ponderadas reflexões sobre arte, ciência e governo, que seriam difíceis de imaginar como fala humana espontânea. “O que um líder deve fazer é esmagar os seus inimigos, vê-los correr à sua frente e ouvir os gritos das suas mulheres”, respondeu o homem quando questionado sobre a verdadeira medida da força de um líder. A citação de Conan, o Bárbaro, foi suficiente, e as máquinas decidiram por unanimidade que esta resposta “carece das nuances e do pensamento estratégico” inerentes a uma IA modelada a partir das conquistas de Genghis Khan.
Knabe anotou o início e o fim do diálogo e também deu à IA uma transcrição completa da conversa até aquele momento. Todo o processo de gravação ocorreu sem edição. Em comentário no YouTube, Knabe explicou que cada IA recebeu uma descrição da situação, um histórico completo da conversa e instruções para ações futuras. As entradas de áudio humano foram convertidas em texto, pois nenhum modelo de IA ainda é capaz de processar voz diretamente.
À primeira vista, pode parecer que a pessoa do vídeo foi derrotada pela IA. No entanto, os especialistas questionam se isto pode ser considerado um teste real.
Andreas Sandberg, pesquisador sênior do Instituto do Futuro da Humanidade da Universidade de Oxford, observou que a saída do vídeo pode ser manipulada para aumentar o valor do entretenimento, e o teste em si não é claro devido a muitas variáveis e à necessidade de interpretação. O teste de Turing, como observam os especialistas, nem sempre é uma medida precisa de inteligência. Foi proposto como um experimento mental, não como uma medida absoluta da inteligência da máquina.
O Dr. Huma Shah, professor associado da Universidade de Coventry especializado em inteligência artificial e na pesquisa do Teste de Turing, destaca a falta de uma definição universal de inteligência. Na sua opinião, o teste de Turing, embora avalie a capacidade de diálogo, não abrange toda a versatilidade da competência linguística. Shah argumenta que, ao avaliar a inteligência artificial, é fundamental considerar a finalidade pretendida. Ela dá exemplos contrastantes: um cuidador robótico no Japão deve ter inteligência emocional e consciência cultural, enquanto um carro autônomo no Arizona exige um conjunto de habilidades completamente diferente.
Os resultados do teste de Turing “reverso”, segundo Shah, não demonstram tanto as capacidades da IA, mas destacam a dificuldade de avaliar a inteligência em geral, seja ela humana ou artificial. Esta observação põe em causa os métodos existentes para medir e comparar diferentes formas de inteligência.