Home Economia Gemini do Google é o verdadeiro começo do boom da IA ​​generativa

Gemini do Google é o verdadeiro começo do boom da IA ​​generativa

Por Humberto Marchezini


A história da inteligência artificial foi pontuada por períodos do chamado “inverno da IA”, quando a tecnologia parecia ter chegado a um beco sem saída e o financiamento secou. Cada um deles foi acompanhado por proclamações de que tornar as máquinas verdadeiramente inteligentes é muito difícil para os humanos descobrirem.

O lançamento do Gemini pelo Google, considerado um tipo fundamentalmente novo de modelo de IA e o mais poderoso da empresa até o momento, sugere que um novo inverno de IA não chegará tão cedo. Na verdade, embora os 12 meses desde o lançamento do ChatGPT tenham sido um ano marcante para a IA, há boas razões para pensar que o atual boom da IA ​​está apenas começando.

A OpenAI não tinha grandes expectativas quando lançou a “visualização de pesquisa discreta” chamada ChatGPT em novembro de 2022. Foi simplesmente um teste de uma nova interface para seus grandes modelos de linguagem (LLMs) de geração de texto. Mas a capacidade do chatbot de fazer uma ampla gama de coisas, desde sintetizar ensaios e poesia até responder a problemas de codificação, impressionou e enervou muitas pessoas e incendiou a indústria tecnológica. Quando a OpenAI adicionou seu novo GPT-4 LLM ao ChatGPT, alguns especialistas ficaram tão assustados que imploraram à empresa que diminuísse o ritmo.

Já eram escassas as evidências de que alguém atendesse ao chamado de alarme. É inconcebível agora que o Google tenha aumentado a aposta – e talvez também mudado as regras do jogo – ao anunciar o Gemini.

O Google já havia respondido diretamente ao ChatGPT na forma de Bard no início deste ano, finalmente lançando a tecnologia LLM chatbot que havia desenvolvido antes do OpenAI, mas optou por manter a privacidade. Com Gemini, afirma ter aberto uma nova era que vai além dos LLMs ancorados principalmente em texto – potencialmente preparando o terreno para uma nova rodada de produtos de IA significativamente diferentes daqueles habilitados pelo ChatGPT.

O Google chama o Gemini de modelo “nativamente multimodal”, o que significa que ele pode aprender com dados além de apenas texto, obtendo também insights de áudio, vídeo e imagens. ChatGPT mostra como os modelos de IA podem aprender muito sobre o mundo se fornecerem texto suficiente. E alguns pesquisadores de IA argumentaram que simplesmente tornando os modelos de linguagem maiores aumentariam suas capacidades a ponto de rivalizar com as dos humanos.

Mas há um limite para o que você pode aprender sobre a realidade física por meio do filtro de texto que os humanos escreveram sobre ela e das limitações difíceis de erradicar de LLMs como o GPT-4 – como informações alucinantes, raciocínio deficiente e sua estranha segurança. falhas – parecem sugerir que a expansão da tecnologia existente tem os seus limites.

Antes do anúncio do Gemini de ontem, a WIRED conversou com Demis Hassabis, o executivo que liderou o desenvolvimento do Gemini e cujas realizações anteriores incluem liderar a equipe que desenvolveu o bot sobre-humano Go-playing AlphaGo. Ele foi previsivelmente efusivo em relação ao Gemini, alegando que ele introduz novos recursos que eventualmente farão com que os produtos do Google se destaquem. Mas Hassabis também disse que para fornecer sistemas de IA que possam compreender o mundo de uma forma que os chatbots de hoje não conseguem, os LLMs precisarão ser combinados com outras técnicas de IA.

Hassabis está em uma competição agressiva com a OpenAI, mas os rivais parecem concordar que são necessárias novas abordagens radicais. Um projeto misterioso em andamento na OpenAI, chamado Q*, sugere que a empresa também está explorando ideias que envolvem fazer mais do que apenas ampliar sistemas como o GPT-4.

Isso se enquadra nas observações feitas em abril pelo CEO da OpenAI, Sam Altman, do MIT, quando deixou claro que, apesar do sucesso do ChatGPT, o campo da IA ​​precisa de uma grande ideia nova para fazer progressos significativos. “Acho que estamos no fim da era em que teremos esses modelos gigantes, gigantes”, disse Altman. “Vamos torná-los melhores de outras maneiras.”

O Google pode ter acabado de demonstrar uma abordagem que pode ir além do ChatGPT. Mas talvez a mensagem mais notável do lançamento do Gemini seja que o Google está determinado a avançar em direção a algo mais significativo do que os chatbots de hoje – assim como o OpenAI parece estar também.



Source link

Related Articles

Deixe um comentário