Home Tecnologia Os robôs aprendem, os chatbots visualizam: como 2024 será o ‘salto em frente’ da IA

Os robôs aprendem, os chatbots visualizam: como 2024 será o ‘salto em frente’ da IA

Por Humberto Marchezini


Numa evento em São Francisco em novembro, Sam Altman, presidente-executivo da empresa de inteligência artificial OpenAI, foi questionado sobre quais surpresas o campo traria em 2024.

Chatbots online como o ChatGPT da OpenAI darão “um salto em frente que ninguém esperava”, respondeu imediatamente Altman.

Sentado ao lado dele, James Manyika, executivo do Google, assentiu e disse: “Mais um para isso”.

A indústria de IA este ano será definida por uma característica principal: uma melhoria notavelmente rápida da tecnologia à medida que os avanços se complementam, permitindo que a IA gere novos tipos de mídia, imite o raciocínio humano de novas maneiras e se infiltre no mundo físico. através de uma nova geração de robôs.

Nos próximos meses, geradores de imagens alimentados por IA, como DALL-E e Midjourney, fornecerão vídeos e imagens estáticas instantaneamente. E eles se fundirão gradualmente com chatbots como o ChatGPT.

Isso significa que os chatbots irão se expandir muito além do texto digital, lidando com fotos, vídeos, diagramas, gráficos e outras mídias. Eles exibirão um comportamento que mais se assemelha ao raciocínio humano, enfrentando tarefas cada vez mais complexas em áreas como matemática e ciências. À medida que a tecnologia avança para os robôs, também ajudará a resolver problemas que vão além do mundo digital.

Muitos destes desenvolvimentos já começaram a surgir nos principais laboratórios de investigação e em produtos tecnológicos. Mas em 2024, o poder destes produtos crescerá significativamente e serão utilizados por muito mais pessoas.

“O rápido progresso da IA ​​continuará”, disse David Luan, executivo-chefe da Adept, uma start-up de IA. “É inevitável.”

A OpenAI, a Google e outras empresas tecnológicas estão a desenvolver a IA muito mais rapidamente do que outras tecnologias devido à forma como os sistemas subjacentes são construídos.

A maioria dos aplicativos de software é criada por engenheiros, uma linha de código de computador por vez, o que normalmente é um processo lento e tedioso. As empresas estão a melhorar a IA mais rapidamente porque a tecnologia depende de redes neurais, sistemas matemáticos que podem aprender competências através da análise de dados digitais. Ao identificar padrões em dados como artigos da Wikipédia, livros e textos digitais extraídos da Internet, uma rede neural pode aprender a gerar texto por conta própria.

Este ano, as empresas de tecnologia planejam alimentar os sistemas de IA com mais dados – incluindo imagens, sons e mais texto – do que as pessoas conseguem imaginar. À medida que estes sistemas aprendem as relações entre estes vários tipos de dados, aprenderão a resolver problemas cada vez mais complexos, preparando-os para a vida no mundo físico.

(O New York Times processou a OpenAI e a Microsoft no mês passado por violação de direitos autorais de conteúdo de notícias relacionado a sistemas de IA.)

Nada disso significa que a IA será capaz de se igualar ao cérebro humano tão cedo. Embora as empresas e empreendedores de IA pretendam criar o que chamam de “inteligência artificial geral” – uma máquina que pode fazer tudo o que o cérebro humano pode fazer – esta continua a ser uma tarefa difícil. Apesar de todos os seus rápidos ganhos, a IA permanece nos estágios iniciais.

Aqui está um guia sobre como a IA deve mudar este ano, começando com os avanços no prazo mais próximo, que levarão a um maior progresso em suas habilidades.

Até agora, os aplicativos alimentados por IA geravam principalmente texto e imagens estáticas em resposta a solicitações. O DALL-E, por exemplo, pode criar imagens fotorrealistas em segundos, a partir de solicitações como “um rinoceronte mergulhando na ponte Golden Gate”.

Mas este ano, empresas como a OpenAI, Google, Meta e a Runway, com sede em Nova Iorque, deverão implementar geradores de imagens que também permitam às pessoas gerar vídeos. Essas empresas já construíram protótipos de ferramentas que podem criar vídeos instantaneamente a partir de pequenos textos.

É provável que as empresas de tecnologia incorporem os poderes dos geradores de imagem e vídeo em chatbots, tornando-os mais poderosos.

Chatbots e geradores de imagens, originalmente desenvolvidos como ferramentas separadas, estão gradualmente se fundindo. Quando a OpenAI lançou uma nova versão do ChatGPT no ano passado, o chatbot podia gerar imagens e também texto.

As empresas de IA estão construindo sistemas “multimodais”, o que significa que a IA pode lidar com vários tipos de mídia. Esses sistemas aprendem habilidades analisando fotos, textos e potencialmente outros tipos de mídia, incluindo diagramas, gráficos, sons e vídeos, para que possam então produzir seus próprios textos, imagens e sons.

Isso não é tudo. Como os sistemas também estão aprendendo as relações entre os diferentes tipos de mídia, eles serão capazes de compreender um tipo de mídia e responder com outro. Em outras palavras, alguém pode alimentar uma imagem no chatbot e ele responderá com texto.

“A tecnologia ficará mais inteligente e útil”, disse Ahmad Al-Dahle, que lidera o grupo de IA generativa da Meta. “Isso fará mais coisas.”

Os chatbots multimodais erram, assim como os chatbots somente de texto cometem erros. As empresas de tecnologia estão trabalhando para reduzir erros enquanto se esforçam para construir chatbots que possam raciocinar como um ser humano.

Quando Altman fala sobre o avanço da IA, ele está se referindo a chatbots que são melhores em “raciocinar” para que possam assumir tarefas mais complexas, como resolver problemas matemáticos complicados e gerar programas de computador detalhados.

O objetivo é construir sistemas que possam resolver um problema de forma cuidadosa e lógica por meio de uma série de etapas distintas, cada uma baseada na próxima. É assim que os humanos raciocinam, pelo menos em alguns casos.

Os principais cientistas discordam sobre se os chatbots podem realmente raciocinar assim. Alguns argumentam que estes sistemas apenas parecem raciocinar à medida que repetem o comportamento visto nos dados da Internet. Mas a OpenAI e outros estão construindo sistemas que podem responder de forma mais confiável a questões complexas que envolvem assuntos como matemática, programação de computadores, física e outras ciências.

“À medida que os sistemas se tornam mais confiáveis, eles se tornarão mais populares”, disse Nick Frosst, ex-pesquisador do Google que ajuda a liderar a Cohere, uma start-up de IA.

Se os chatbots forem melhores no raciocínio, eles poderão se transformar em “agentes de IA”.

À medida que as empresas ensinam aos sistemas de IA como resolver problemas complexos, passo a passo, elas também podem melhorar a capacidade dos chatbots de usar aplicativos de software e sites em seu nome.

Os pesquisadores estão essencialmente transformando os chatbots em um novo tipo de sistema autônomo chamado agente de IA. Isso significa que os chatbots podem usar aplicativos de software, sites e outras ferramentas online, incluindo planilhas, calendários online e sites de viagens. As pessoas poderiam então transferir o tedioso trabalho de escritório para chatbots. Mas esses agentes também poderiam eliminar totalmente os empregos.

Os chatbots já operam como agentes de pequenas formas. Eles podem agendar reuniões, editar arquivos, analisar dados e construir gráficos de barras. Mas essas ferramentas nem sempre funcionam tão bem quanto deveriam. Os agentes quebram totalmente quando aplicados a tarefas mais complexas.

Este ano, as empresas de IA deverão revelar agentes mais confiáveis. “Você deveria ser capaz de delegar qualquer trabalho tedioso do dia a dia no computador a um agente”, disse Luan.

Isso pode incluir acompanhar as despesas em um aplicativo como QuickBooks ou registrar dias de férias em um aplicativo como o Workday. No longo prazo, estender-se-á além do software e dos serviços de Internet e entrará no mundo da robótica.

No passado, os robôs eram programados para realizar a mesma tarefa repetidamente, como pegar caixas sempre do mesmo tamanho e formato. Mas, utilizando o mesmo tipo de tecnologia que sustenta os chatbots, os investigadores estão a dar aos robôs o poder de realizar tarefas mais complexas – incluindo aquelas que nunca tinham visto antes.

Tal como os chatbots podem aprender a prever a próxima palavra numa frase através da análise de grandes quantidades de texto digital, um robô pode aprender a prever o que acontecerá no mundo físico através da análise de inúmeros vídeos de objetos a serem cutucados, levantados e movidos.

“Essas tecnologias podem absorver enormes quantidades de dados. E à medida que absorvem dados, podem aprender como funciona o mundo, como funciona a física, como interagimos com os objetos”, disse Peter Chen, antigo investigador da OpenAI que dirige a Covariant, uma start-up de robótica.

Este ano, a IA irá sobrecarregar robôs que operam nos bastidores, como braços mecânicos que dobram camisas em uma lavanderia ou separam pilhas de coisas dentro de um depósito. Titãs da tecnologia como Elon Musk também estão trabalhando para mudar robôs humanóides nas casas das pessoas.





Source link

Related Articles

Deixe um comentário