Agentes de IA são rápidos 5y5e17 mas não autônomos

Tem algo errado neste post? Avise a redação!

Tamanho da fonte: -A +A

Foto: Depositphotos

Pesquisadores da Universidade Carnegie Mellon (CMU), no estado da Pensilvânia, EUA, realizaram uma simulação criando uma empresa de software composta somente por funcionários bots, ou seja, agentes autônomos de inteligência artificial.

A empresa, chamada The Agent Company, contava com um agente contratado, um gerente de RH e um diretor de tecnologia, além de sites internos e um programa de bate-papo semelhante ao Slack.

Esse agente podia navegar na web, escrever códigos, organizar informações em planilhas e se comunicar com colegas de trabalho. Sua primeira função era designar pessoas para trabalhar em um desenvolvimento web.

Logo no início das atividades, o agente se deparou com um problema inesperado: um bloqueio de pop-ups — aquelas janelas que aparecem em sites e que basta clicar no “X” para continuar a navegação —, que continha informações relevantes.

O agente entrou, então, em contato com o gerente de RH da empresa solicitando auxílio. O gerente também ignorou o “X” e se ofereceu para contatar o departamento de TI. O TI nunca retornou e a tarefa ficou incompleta.

Outros testes também foram realizados com modelos de IA do Google, OpenAI, Anthropic e Meta. As tarefas consistiam em atividades que um funcionário do mundo real executaria, como nas áreas de finanças, istração e engenharia de software.

O agente de melhor desempenho foi o Claude 3.5 Sonnet, da Anthropic, com 25% das tarefas concluídas. O Gemini Flash 2.0, do Google, e o ChatGPT concluíram apenas 10% das tarefas.

Nos cenários avaliados, os agentes de IA começam bem, mas, à medida que as tarefas se tornavam mais complexas e exigiam não só habilidades técnicas, mas também sociais e de bom senso, os bots se perdiam.

Alguns dos obstáculos encontrados foram respostas simplistas em documentos, má interpretação de conversas com colegas, dificuldades para navegar com flexibilidade em ambientes mutáveis e problemas ao desempenhar funções quando sobrecarregados por ferramentas e instruções.

Em muitas situações, as tarefas eram concluídas prematuramente. Em outras, os agentes de IA tentavam enganar ou até mesmo hackear para atingir os objetivos. Em um caso, por exemplo, o agente não conseguia encontrar a pessoa certa para conversar no chat e decidiu criar um usuário com o mesmo nome.

Os maiores casos de sucesso foram em tarefas de desenvolvimento de software. A hipótese levantada pelos pesquisadores é que, nesses casos, há uma abundância de dados de treinamento disponíveis e publicados — algo diferente dos trabalhos istrativos, já que as empresas mantêm sigilo sobre essas informações.

Para os pesquisadores da CMU, assim como outros consultados pelo site Business Insider, o treinamento de agentes de IA com dados públicos, dados proprietários e em atividades cotidianas, acompanhados por funcionários humanos, é a chave para melhorar a eficácia.

Empresas como a Moody’s, empresa americana de serviços financeiros e de negócios, conhecida por sua agência de classificação de crédito, já realizam treinamentos de IA com dados internos.

A companhia conseguiu automatizar a análise de negócios por meio de sistemas de IA agêntica, que extraem insights de décadas de pesquisas, classificações, artigos e informações macroeconômicas.

Já a Johnson & Johnson ou a treinar pessoas para colaborar com agentes de IA e conseguiu reduzir em 50% o tempo de produção nos processos químicos responsáveis pela fabricação de novos medicamentos.

Cientistas da Johns Hopkins, instituição de ensino americana, importante por sua liderança em pesquisa, educação médica e atendimento de saúde de alta qualidade, criaram um laboratório de agentes para automatizar grande parte do processo de pesquisa — desde a revisão bibliográfica até a elaboração de relatórios —, porém com ideias e s humanos.

Esses mesmos cientistas acreditam que, em um futuro próximo, essas IAs poderão realizar descobertas de forma autônoma.

Executivos e CEOs de grandes companhias e big techs, como Salesforce, Nvidia e OpenAI, acreditam que, em breve, grande parte do trabalho humano poderá ser substituído pela IA.

Se depender dos resultados da pesquisa e das experiências de outras empresas, manter os humanos informados e treiná-los para usar a IA como ferramenta é, neste primeiro momento, o caminho mais viável e certo de acontecer.

A Senior apresenta soluções completas e personalizadas de gestão com apoio de inteligência artificial generativa. Tome decisões mais ágeis e assertivas com base em dados relevantes e consistentes e tenha mais autonomia, automação e produtividade! É o diferencial para quem quer ser líder de mercado. Fale com a Senior e seja líder você também. É mais que tecnologia. É Senior.

Fagner Ramos 4c144o

Jornalista no Baguete Diário

Agentes de IA são rápidos, mas não autônomos 621i48

Fagner Ramos 4c144o

Relacionadas 332k71

Empresa substitui equipe por IA e se arrepende 25o5b

Nova rival chinesa do ChatGPT planeja IPO 2m1u5b

Robôs de genIA sobrecarregam a Wikipedia 4x382m

Claude chega ao Brasil 5b27g

Popular no momento 2z5f5k

Reforma Tributária: se você ainda não começou, já está atrasado! 256e4e

Rui Botelho: “não vamos mais prorrogar o e para o ECC” 1723j

Escala 6×1 está proibida no Paraná para TI 6j5l59

Hotvips fatura alto com cucks 5l3p2j

Problemas na Ligga Arena? 6n254j

Leia mais 6z23s

Empresa substitui equipe por IA e se arrepende 25o5b

Nova rival chinesa do ChatGPT planeja IPO 2m1u5b

Robôs de genIA sobrecarregam a Wikipedia 4x382m

Claude chega ao Brasil 5b27g

UFSC tem supercomputador 3e4i18

UFG terá supercomputador com GPUs da Nvidia 5z2g4s

DeepSeek tem segurança fraquinha 6v4q3w

O paradoxo da inteligência artificial 3o5u1h

Agentes de IA são rápidos, mas não autônomos 621i48

Fagner Ramos 4c144o

Relacionadas 332k71

Empresa substitui equipe por IA e se arrepende 25o5b

Nova rival chinesa do ChatGPT planeja IPO 2m1u5b

Robôs de genIA sobrecarregam a Wikipedia 4x382m

Claude chega ao Brasil 5b27g

Newsletter 3a4o2y

Popular no momento 2z5f5k

Reforma Tributária: se você ainda não começou, já está atrasado! 256e4e

Rui Botelho: “não vamos mais prorrogar o e para o ECC” 1723j

Escala 6×1 está proibida no Paraná para TI 6j5l59

Hotvips fatura alto com cucks 5l3p2j

Problemas na Ligga Arena? 6n254j

Leia mais 6z23s

Empresa substitui equipe por IA e se arrepende 25o5b

Nova rival chinesa do ChatGPT planeja IPO 2m1u5b

Robôs de genIA sobrecarregam a Wikipedia 4x382m

Claude chega ao Brasil 5b27g

UFSC tem supercomputador 3e4i18

UFG terá supercomputador com GPUs da Nvidia 5z2g4s

DeepSeek tem segurança fraquinha 6v4q3w

O paradoxo da inteligência artificial 3o5u1h