TESTES

Agentes de IA são rápidos, mas não autônomos 621i48

Pesquisa aponta que bots travam diante de pop-ups, dilemas sociais e tarefas que exigem bom senso. 1g173f

29 de abril de 2025 - 13:50
Foto: Depositphotos

Foto: Depositphotos

Pesquisadores da Universidade Carnegie Mellon (CMU), no estado da Pensilvânia, EUA, realizaram uma simulação criando uma empresa de software composta somente por funcionários bots, ou seja, agentes autônomos de inteligência artificial.

A empresa, chamada The Agent Company, contava com um agente contratado, um gerente de RH e um diretor de tecnologia, além de sites internos e um programa de bate-papo semelhante ao Slack.

Esse agente podia navegar na web, escrever códigos, organizar informações em planilhas e se comunicar com colegas de trabalho. Sua primeira função era designar pessoas para trabalhar em um desenvolvimento web.

Logo no início das atividades, o agente se deparou com um problema inesperado: um bloqueio de pop-ups — aquelas janelas que aparecem em sites e que basta clicar no “X” para continuar a navegação —, que continha informações relevantes.

O agente entrou, então, em contato com o gerente de RH da empresa solicitando auxílio. O gerente também ignorou o “X” e se ofereceu para contatar o departamento de TI. O TI nunca retornou e a tarefa ficou incompleta.

Outros testes também foram realizados com modelos de IA do Google, OpenAI, Anthropic e Meta. As tarefas consistiam em atividades que um funcionário do mundo real executaria, como nas áreas de finanças, istração e engenharia de software.

O agente de melhor desempenho foi o Claude 3.5 Sonnet, da Anthropic, com 25% das tarefas concluídas. O Gemini Flash 2.0, do Google, e o ChatGPT concluíram apenas 10% das tarefas.

Nos cenários avaliados, os agentes de IA começam bem, mas, à medida que as tarefas se tornavam mais complexas e exigiam não só habilidades técnicas, mas também sociais e de bom senso, os bots se perdiam.

Alguns dos obstáculos encontrados foram respostas simplistas em documentos, má interpretação de conversas com colegas, dificuldades para navegar com flexibilidade em ambientes mutáveis e problemas ao desempenhar funções quando sobrecarregados por ferramentas e instruções.

Em muitas situações, as tarefas eram concluídas prematuramente. Em outras, os agentes de IA tentavam enganar ou até mesmo hackear para atingir os objetivos. Em um caso, por exemplo, o agente não conseguia encontrar a pessoa certa para conversar no chat e decidiu criar um usuário com o mesmo nome.

Os maiores casos de sucesso foram em tarefas de desenvolvimento de software. A hipótese levantada pelos pesquisadores é que, nesses casos, há uma abundância de dados de treinamento disponíveis e publicados — algo diferente dos trabalhos istrativos, já que as empresas mantêm sigilo sobre essas informações.

Para os pesquisadores da CMU, assim como outros consultados pelo site Business Insider, o treinamento de agentes de IA com dados públicos, dados proprietários e em atividades cotidianas, acompanhados por funcionários humanos, é a chave para melhorar a eficácia.

Empresas como a Moody’s, empresa americana de serviços financeiros e de negócios, conhecida por sua agência de classificação de crédito, já realizam treinamentos de IA com dados internos.

A companhia conseguiu automatizar a análise de negócios por meio de sistemas de IA agêntica, que extraem insights de décadas de pesquisas, classificações, artigos e informações macroeconômicas.

Já a Johnson & Johnson ou a treinar pessoas para colaborar com agentes de IA e conseguiu reduzir em 50% o tempo de produção nos processos químicos responsáveis pela fabricação de novos medicamentos.

Cientistas da Johns Hopkins, instituição de ensino americana, importante por sua liderança em pesquisa, educação médica e atendimento de saúde de alta qualidade, criaram um laboratório de agentes para automatizar grande parte do processo de pesquisa — desde a revisão bibliográfica até a elaboração de relatórios —, porém com ideias e s humanos. 

Esses mesmos cientistas acreditam que, em um futuro próximo, essas IAs poderão realizar descobertas de forma autônoma.

Executivos e CEOs de grandes companhias e big techs, como Salesforce, Nvidia e OpenAI, acreditam que, em breve, grande parte do trabalho humano poderá ser substituído pela IA. 

Se depender dos resultados da pesquisa e das experiências de outras empresas, manter os humanos informados e treiná-los para usar a IA como ferramenta é, neste primeiro momento, o caminho mais viável e certo de acontecer.

Leia mais 6z23s

VIRALIZOU

Empresa substitui equipe por IA e se arrepende 25o5b

Há 133 dias
CORRIDA DA GEN AI

Nova rival chinesa do ChatGPT planeja IPO 2m1u5b

Há 35 dias
SERVIDORES

Robôs de genIA sobrecarregam a Wikipedia 4x382m

Há 45 dias
GEN AI

Claude chega ao Brasil 5b27g

FOMENTO

UFSC tem supercomputador 3e4i18

INTELIGÊNCIA ARTIFICIAL

UFG terá supercomputador com GPUs da Nvidia 5z2g4s

OPS

DeepSeek tem segurança fraquinha 6v4q3w

MUDANÇAS

O paradoxo da inteligência artificial 3o5u1h