Home Tecnologia ChatGPT agora pode responder com palavras faladas

ChatGPT agora pode responder com palavras faladas

Por Humberto Marchezini


ChatGPT aprendeu a falar.

OpenAI, startup de inteligência artificial de São Francisco, lançou na segunda-feira uma versão de seu popular chatbot que pode interagir com pessoas usando palavras faladas. Tal como acontece com Alexa da Amazon, Siri da Apple e outros assistentes digitais, os usuários podem falar com o ChatGPT e ele responderá.

Pela primeira vez, o ChatGPT também pode responder a imagens. As pessoas podem, por exemplo, fazer upload de uma foto do interior de sua geladeira, e o chatbot pode fornecer uma lista de pratos que podem cozinhar com os ingredientes que possuem.

“Queremos tornar o ChatGPT mais fácil de usar – e mais útil”, disse Peter Deng, vice-presidente de produtos empresariais e de consumo da OpenAI.

A OpenAI acelerou o lançamento de suas ferramentas de IA nas últimas semanas. Este mês, lançou uma versão de seu gerador de imagens DALL-E e incorporou a ferramenta no ChatGPT.

O ChatGPT atraiu centenas de milhões de usuários após seu lançamento em novembro, e diversas outras empresas logo lançaram serviços semelhantes. Com a nova versão do bot, a OpenAI está indo além dos chatbots rivais como o Google Bard, ao mesmo tempo que compete com tecnologias mais antigas como Alexa e Siri.

Alexa e Siri há muito oferecem maneiras de interagir com smartphones, laptops e outros dispositivos por meio de palavras faladas. Mas chatbots como ChatGPT e Google Bard têm habilidades linguísticas mais poderosas e são capazes de escrever instantaneamente e-mails, poesias e trabalhos de conclusão de curso, além de riffs sobre quase todos os tópicos que aparecem em seu caminho.

OpenAI combinou essencialmente os dois métodos de comunicação.

A empresa vê a conversa como uma forma mais natural de interagir com seu chatbot. Argumenta que as vozes sintéticas do ChatGPT – as pessoas podem escolher entre cinco opções diferentes, incluindo vozes masculinas e femininas – são mais convincentes do que outras usadas com assistentes digitais populares.

Nas próximas duas semanas, disse a empresa, a nova versão do chatbot começaria a ser implementada para todos os assinantes do ChatGPT Plus, um serviço que custa US$ 20 por mês. Mas o bot só pode responder com voz quando usado em iPhones, iPads e dispositivos Android.

As vozes sintéticas do bot são mais naturais do que muitas outras no mercado, embora ainda possam soar robóticas. Como outros assistentes digitais, pode ter dificuldades com homônimos. Quando o The New York Times perguntou ao novo ChatGPT como se escreve “ginásio”, ele disse: “JIM”.

Mas uma das vantagens de um chatbot como o ChatGPT é que ele pode se corrigir sozinho. Ao ser informado “Não, o outro tipo de academia”, o bot respondeu: “Ah, entendo a que você está se referindo agora. O lugar onde as pessoas se exercitam e se exercitam se chama GYM.”

Embora a interface de voz do ChatGPT seja uma reminiscência dos assistentes anteriores, a tecnologia subjacente é fundamentalmente diferente. O ChatGPT é impulsionado principalmente por um grande modelo de linguagem, ou LLM, que aprendeu a gerar linguagem dinamicamente, analisando grandes quantidades de texto extraído da Internet.

Assistentes digitais mais antigos, como Alexa e Siri, agiam como centros de comando e controle que podiam executar um determinado número de tarefas ou dar respostas a uma lista finita de perguntas programadas em seus bancos de dados, como “Alexa, acenda as luzes” ou “Qual é o clima em Cupertino?” Adicionar novos comandos aos assistentes mais antigos pode levar semanas. O ChatGPT pode responder com autoridade a praticamente qualquer pergunta feita em segundos – embora nem sempre seja correto.

À medida que a OpenAI está transformando o ChatGPT em algo mais parecido com Alexa ou Siri, empresas como Amazon e Apple estão transformando seus assistentes digitais em algo mais parecido com o ChatGPT.

Na semana passada, a Amazon apresentou uma prévia de um sistema atualizado para Alexa que visa uma conversa mais fluida sobre “qualquer assunto”. Ele é parcialmente impulsionado por um novo LLM e tem outras atualizações de ritmo e entonação para torná-lo mais natural, disse a empresa.

A Apple, que não divulgou publicamente seus planos sobre como irá competir com o ChatGPT, vem testando um protótipo de seu grande modelo de linguagem para produtos futuros, segundo duas pessoas informadas sobre o projeto.

Quando usado pela web, bem como em dispositivos iPhone, iPad e Android, o novo ChatGPT também pode responder a imagens. Dada uma fotografia, gráfico ou diagrama, pode fornecer uma descrição detalhada da imagem e responder a perguntas sobre o seu conteúdo. Esta pode ser uma ferramenta útil para pessoas com deficiência visual.

A OpenAI demonstrou pela primeira vez a ferramenta de imagem na primavera, mas a empresa disse que ela não seria compartilhada com o público até que os pesquisadores entendessem melhor como a tecnologia poderia ser mal utilizada. Entre outras preocupações, eles temiam que a ferramenta pudesse se tornar um serviço de reconhecimento facial usado para identificar rapidamente pessoas em fotos.

Microsoft introduzido este tipo de ferramenta de busca visual, baseada na tecnologia da OpenAI, em seu chatbot do Bing durante o verão.

Sandhini Agarwal, pesquisadora da OpenAI focada em segurança e política, disse que a nova versão do bot agora recusaria esforços para identificar rostos. Mas foi projetado para fornecer descrições extremamente detalhadas de outras fotos. Dada uma imagem do Telescópio Espacial Hubble, por exemplo, ele pode responder com parágrafos detalhando o conteúdo da foto.

O bot também pode ser uma ferramenta para estudantes. Dada a imagem de um problema de matemática do ensino médio que inclui palavras, números e diagramas, o bot pode ler instantaneamente o problema e resolvê-lo. Pode ser uma forma eficaz de aprender – ou trapacear.



Source link

Related Articles

Deixe um comentário