Como os ‘agentes de IA’ que vagam pela Internet poderão um dia substituir os trabalhadores

O amplamente utilizado chatbot ChatGPT foi projetado para gerar texto digital, desde poesia a trabalhos de conclusão de curso e programas de computador. Mas quando uma equipe de pesquisadores de inteligência artificial da empresa de chips de computador Nvidia colocou as mãos na tecnologia subjacente do chatbot, eles perceberam que ele poderia fazer muito mais.

Em poucas semanas, eles o ensinaram a jogar Minecraft, um dos videogames mais populares do mundo. Dentro do universo digital do Minecraft, ele aprendeu a nadar, colher plantas, caçar porcos, garimpar ouro e construir casas.

“Ele pode entrar no mundo do Minecraft e explorar por si mesmo e coletar materiais por si só e ficar cada vez melhor em todos os tipos de habilidades”, disse um cientista pesquisador sênior da Nvidia, Linxi Fan, conhecido como Jim.

O projeto foi um sinal precoce de que os principais pesquisadores de inteligência artificial do mundo estão transformando os chatbots em um novo tipo de sistema autônomo chamado agente de IA. Esses agentes podem fazer mais do que conversar. Eles podem usar aplicativos de software, sites e outras ferramentas on-line, incluindo planilhas, calendários on-line, sites de viagens e muito mais.

Com o tempo, dizem muitos investigadores, os agentes de IA poderão tornar-se muito mais sofisticados e substituir os trabalhadores de escritório, automatizando quase todos os trabalhos de colarinho branco.

“Esta é uma enorme oportunidade comercial, potencialmente de trilhões de dólares”, disse Jeff Clune, professor de ciência da computação na Universidade da Colúmbia Britânica que trabalhou anteriormente nesse tipo de tecnologia como pesquisador na OpenAI, a start-up de São Francisco que construiu Bate-papoGPT. “Isso tem uma enorme vantagem – e enormes consequências – para a sociedade.”

O agente da Nvidia joga um jogo. Agentes semelhantes podem agendar reuniões, editar arquivos, analisar dados e construir gráficos de barras multicoloridos. A ideia é que esses sistemas automatizados atuem eventualmente como assistentes pessoais capazes de realizar uma ampla gama de tarefas na Internet.

Os agentes de hoje são limitados e não conseguem organizar exatamente a sua vida. O ChatGPT pode pesquisar voos para Nova York no site de viagens Expedia, mas você ainda precisa fazer a reserva por conta própria.

Esta tecnologia, à medida que os investigadores a melhorem, poderá tornar os trabalhadores de escritório e os consumidores mais eficientes. Também poderia mudar a natureza dos videogames, proporcionando uma nova onda de bots com os quais os jogadores podem jogar e conversar.

GPT-4, a tecnologia que sustenta o ChatGPT, é o que os pesquisadores chamam de modelo de linguagem grande. É um sistema de IA que aprende habilidades analisando grandes quantidades de dados.

Nos últimos meses, a tecnologia impressionou centenas de milhões de pessoas com a forma como gera e-mails, escreve discursos e riffs sobre quase todos os assuntos. Mas sua habilidade mais importante pode ser o talento para escrever programas de computador.

Ele pode gerar instantaneamente um programa que desenha um unicórnio ou joga neve digital na tela do seu laptop. Os desenvolvedores de software profissionais podem solicitar códigos que possam ser incorporados em programas maiores, incluindo tudo, desde aplicativos de mídia social até mecanismos de pesquisa. Mas isso é apenas parte do que esta tecnologia pode fazer. Ele também pode gerar código de computador que acessa outros aplicativos de software e sites.

Foi assim que o Dr. Fan e outros pesquisadores da Nvidia ensinaram o GPT-4 a jogar Minecraft. “A palavra mais importante aqui é código”, disse Fan. “O código pode realizar ações.”

As pessoas usam aplicativos de software e sites tocando em botões, menus e outros widgets gráficos. Os agentes de IA usam aplicativos e sites acessando suas interfaces de programação de aplicativos, ou APIs – o código de software subjacente que lhes permite se comunicar com outros serviços online.

Se você pedir a um agente para enviar um vídeo para a internet, por exemplo, ele poderá gerar um código que chama uma API oferecida pelo YouTube. “Uma API é apenas um texto usado para se comunicar com uma máquina”, disse Silen Naihin, pesquisador que ajuda a administrar um projeto de agente independente de IA, o AutoGPT.

Em teoria, um chatbot pode escrever código para acessar qualquer API na internet. Mas os chatbots de hoje ainda não são suficientemente competentes para realizar mais do que simples tarefas. E mesmo que estivessem, deixá-los navegar livremente pela Internet seria um enorme risco de segurança. Portanto, as empresas estão começando pequenas.

Poucos meses depois de a OpenAI ter revelado o ChatGPT, lançou discretamente uma forma de o chatbot fazer mais do que gerar texto. Depois de instalar vários plug-ins – software que amplia o que o bot pode fazer – você pode pedir que ele pesquise voos disponíveis em sites de viagens como o Expedia, pegue um mapa de sua cidade natal no Google Earth ou até mesmo transforme uma planilha detalhando seus gastos anuais em um gráfico de barras multicolorido.

Equipado com um plug-in chamado interpretador de código, o ChatGPT podia não apenas escrever código, mas também executá-lo. Isso permitiu que a tecnologia executasse instantaneamente tarefas que não conseguia no passado, incluindo edição de planilhas e transformação de imagens estáticas em vídeos. Google, Microsoft e outras empresas estão explorando tecnologias semelhantes.

“Esses são projetos em que prevemos essencialmente IAs trabalhando com outras IAs em seu nome”, disse Ashley Llorens, vice-presidente da Microsoft.

Projetos independentes como o AutoGPT estão tentando levar esse tipo de coisa vários passos adiante. A ideia é dar ao sistema objetivos como “criar uma empresa” ou “ganhar algum dinheiro”. Em seguida, procurará maneiras de atingir esse objetivo, fazendo perguntas e conectando-se a outros serviços de Internet.

Hoje, isso não funciona muito bem. Sistemas como o AutoGPT tendem a ficar presos em loops intermináveis. Mas pesquisadores como o Dr. Fan estão constantemente refinando esse tipo de tecnologia em um esforço para torná-la mais útil e confiável.

Outros pesquisadores estão construindo um novo tipo de agente de IA projetado para usar ferramentas de software. No verão de 2022, o Dr. Clune estava entre uma equipe de pesquisadores da OpenAI que construiu um agente que poderia usar software de computador tanto quanto uma pessoa faria — clique do mouse por clique do mouse, pressionamento de tecla por pressionamento de tecla.

Clune e seus colegas alimentaram o sistema com horas de vídeos online que mostravam pessoas jogando Minecraft. Ao analisar a maneira como as pessoas usavam o mouse e o teclado para navegar pelo universo digital do Minecraft, o sistema aprendeu a jogar sozinho.

Outras empresas, incluindo uma start-up chamada Adept, estão a construir agentes semelhantes que usam sites como Wikipedia, Redfin e Craigslist e aplicativos de escritório populares de empresas como Salesforce.

Clune argumenta que esse tipo de agente acabará por permitir que a inteligência artificial use uma gama muito mais ampla de aplicativos de software e sites. Ele disse que todos teriam acesso a um assistente digital que poderia fazer quase tudo na internet. Isso poderia tornar a vida mais fácil – mas também poderia substituir inúmeros empregos.

“Se a IA pode fazer tudo o que podemos fazer, ela não substitui apenas as tarefas chatas”, disse ele. “Ele substitui todas as tarefas.”

Source link

Como os ‘agentes de IA’ que vagam pela Internet poderão um dia substituir os trabalhadores

Um mecanismo de pesquisa “verde” vê perigo – e oportunidade – na revolução da IA ​​generativa

Robert Sapolsky não acredita em livre arbítrio. (Mas sinta-se à vontade para discordar.)

Related Articles

Deixe um comentário Cancelar resposta

Um mecanismo de pesquisa “verde” vê perigo – e oportunidade – na revolução da IA generativa