Home Tecnologia Google atualiza Bard Chatbot com IA ‘Gemini’ enquanto persegue ChatGPT

Google atualiza Bard Chatbot com IA ‘Gemini’ enquanto persegue ChatGPT

Por Humberto Marchezini


Por mais de um ano, o Google correu para construir uma tecnologia que pudesse se equiparar ao ChatGPT, o chatbot revelador oferecido pela startup de inteligência artificial OpenAI de São Francisco.

Na quarta-feira, a gigante da tecnologia deu mais um passo na corrida em curso, lançando uma nova versão do seu próprio chatbot, o Google Bard. Disponível para falantes de inglês em mais de 170 territórios e países, incluindo os Estados Unidos, a partir de agora, o bot atualizado é sustentado por uma nova tecnologia de IA chamada Gemini, que a empresa vem desenvolvendo desde o início do ano.

“Este é o início da era Gemini”, disse Sundar Pichai, presidente-executivo do Google, em entrevista. “É a concretização da visão que tivemos quando criamos o Google DeepMind”, o laboratório de IA da empresa. Ele disse que o Google lançará três versões diferentes da tecnologia em uma ampla gama de produtos e serviços nos próximos meses.

Pichai e Demis Hassabis, que supervisiona o Google DeepMind, disseram que o Gemini era mais poderoso do que as tecnologias anteriores de chatbot do Google e que poderia gerar respostas mais precisas e chegar mais perto de imitar o raciocínio humano em algumas situações.

“Estamos superfelizes com o desempenho do Gemini”, disse o Dr. Hassabis.

Quando a OpenAI impressionou o mundo com o chatbot ChatGPT de IA no final do ano passado, o Google foi pego de surpresa. A gigante da tecnologia passou anos desenvolvendo tecnologia semelhante, mas, como outros gigantes da tecnologia – principalmente a Meta – estava relutante em lançar uma tecnologia que pudesse gerar informações tendenciosas, falsas ou de outra forma tóxicas.

Em março, o Google lançou seu próprio chatbot, Bard, com críticas medianas. Um mês depois, a empresa anunciou que combinou seus dois laboratórios de IA – Google Brain e DeepMind – reunindo mais de 2.000 pesquisadores e engenheiros. E em maio, em sua principal conferência Google I/O, anunciou que o novo laboratório Google DeepMind havia começado a desenvolver o Gemini.

Depois de fundar o laboratório Brain em 2011, o Google adquiriu a DeepMind em 2014, pagando US$ 650 milhões pela start-up de IA de Londres. A DeepMind operou de forma amplamente independente do laboratório Brain e do resto do Google por uma década e até tentou sair da empresa em 2017. Mas enquanto o Google lutava para alcançar o OpenAI, o Sr. um neurocientista que foi cofundador da DeepMind.

O Google divulgou resultados de testes de benchmark afirmando que a versão mais poderosa do Gemini superou a tecnologia mais recente da OpenAI, GPT-4, em várias áreas importantes. É melhor na geração de código de computador do que as tecnologias anteriores do Google, disse Pichai, e pode resumir com mais precisão artigos de notícias e outros documentos de texto.

O Gemini também foi projetado para analisar imagens e sons, mas essas habilidades não serão implementadas no chatbot do Bard até uma data posterior.

O Google construiu três versões do Gemini com três conjuntos diferentes de habilidades. O maior, o Ultra, foi projetado para lidar com tarefas complexas e será lançado no próximo ano. Pro, a oferta intermediária, será implementada em vários serviços do Google, a partir de quarta-feira, com o chatbot Bard. Nano, a versão menor, irá potencializar alguns recursos do smartphone Pixel 8 Pro, como resumir gravações de áudio e oferecer sugestões de respostas de texto no WhatsApp a partir de quarta-feira.

Gemini é o que os cientistas chamam de modelo de linguagem grande, ou LLM, um sistema matemático complexo que pode aprender habilidades analisando grandes quantidades de dados, incluindo livros digitais, artigos da Wikipédia e quadros de avisos online. Ao identificar padrões em todo esse texto, um LLM aprende a gerar texto por conta própria. Isso significa que ele pode escrever trabalhos de conclusão de curso, gerar código de computador e até mesmo manter uma conversa.

Com o Gemini, o Google também treinou a tecnologia em imagens e sons digitais. É o que os investigadores chamam de sistema “multimodal”, o que significa que pode analisar e responder tanto a imagens como a sons. Se você apresentar um problema de matemática que inclua linhas, formas e outras imagens, por exemplo, ele poderá responder de maneira muito parecida com a que um estudante do ensino médio faria.

Essa parte da tecnologia, no entanto, não estará disponível aos consumidores até o próximo ano. O Google também reconheceu que, assim como sistemas semelhantes, o Gemini está sujeito a erros. Pode interpretar os fatos de maneira errada ou até mesmo “alucinar” – inventar coisas.

O Google Cloud, que oferece serviços de IA e computação para outras empresas, está ansioso para fornecer Gemini aos clientes enquanto compete por acordos com a OpenAI e a Microsoft. Depois que a OpenAI forçou brevemente a saída de Sam Altman, seu presidente-executivo, no mês passado, deixando a empresa no limbo, o Google Cloud criou um plano de migração na tentativa de roubar os clientes de seu rival.

Os clientes poderiam pagar ao Google o mesmo preço que sua taxa OpenAI atual e obter créditos na nuvem ou descontos.

O Google disse que os clientes da nuvem teriam acesso ao Gemini Pro – a oferta intermediária – em 13 de dezembro. Pichai disse que algumas pessoas de fora estavam testando o Gemini Ultra – a versão mais poderosa da tecnologia.

Embora o Google tenha passado o ano passado correndo para retomar a liderança em IA da OpenAI, Pichai disse que havia espaço suficiente no mercado para todos os fornecedores de IA.

“Está muito longe de ser um jogo de soma zero”, disse Pichai. “Estamos entusiasmados com o que estamos lançando. Também percebemos que ainda estamos no começo porque podemos ver o progresso que estamos fazendo no acompanhamento.”



Source link

Related Articles

Deixe um comentário