A turbulência em A OpenAI nos últimos cinco dias cativou a indústria de tecnologia e manteve empreendedores, jornalistas e qualquer pessoa que ainda tenha uma conta X colada em seus cronogramas para as últimas atualizações de emojis e missivas em minúsculas. Enquanto isso, algumas das empresas de IA mais proeminentes – incluindo a OpenAI – continuaram a fazer aquilo pelo qual o Vale do Silício é conhecido: lançar novos produtos.
A inesperada demissão de Sam Altman, CEO da OpenAI, foi seguida por uma avalanche de novos recursos de IA dos concorrentes, incluindo Anthropic e Stable Diffusion. Na tarde de terça-feira, em meio à turbulência, a OpenAI lançou o ChatGPT com recursos de voz gratuitamente para todos os usuários. A OpenAI pré-lançou isso no final de setembro, mas apenas para usuários pagos. Agora a atualização está mais difundida.
Embora a OpenAI tenha dominado a conversa no Vale do Silício ao longo de 2023 com seus produtos de captura do zeitgeist, como Dall-E 3 e ChatGPT alimentado por GPT-4, o caos infligido pela decisão do conselho de minar Altman e acelerar novos CEOs pode ter criado uma janela de oportunidade para outras empresas de IA. (Apesar do fato de Altman eventualmente ter retornado para continuar liderando o OpenAI.) E embora essas atualizações de produto demorassem meses para serem feitas, o momento não poderia ter sido melhor para os concorrentes do OpenAI. Muitos clientes corporativos das ferramentas da OpenAI, assustados com a saída de Altman, considerou fazer uma mudança para a Anthropic ou outro fornecedor enquanto ele estava fora.
“Parece que toda semana há algo novo sendo lançado ou anunciado por um dos principais players. Então, meu palpite é que os lançamentos do Stable Video Diffusion e do Claude 2.1 provavelmente foram apenas uma coincidência”, diz Dharmesh Shah, CTO e cofundador da HubSpot bem como um acionista da OpenAI.
Claude diz a verdade
Após a saída repentina de Altman, enquanto o destino da liderança da OpenAI permanecia em mudança, a Anthropic anunciou uma versão mais poderosa de seu Claude chatbot e Stability AI lançaram um gerador de texto para vídeo chamado Difusão de vídeo estável.
O modelo mais recente da Anthropic, Claude 2.1, recebeu duas atualizações importantes. Uma delas é a capacidade de enviar mais dados de uma vez para o chatbot e menos mentiras. O limite de tokens para Claude agora está definido em 200.000 tokens, que é aproximadamente o comprimento de um livro de 500 páginas. (Desculpe, fãs de Leo Tolstoy, vocês terão que esperar até futuras atualizações para analisar todos Guerra e Paz em um único prompt.) Para comparar, o limite de taxa para o modelo GPT-4 Turbo, anunciado pela Altman antes do disparo, é limitado a 128.000.
E a Anthropic afirma que é mais provável que o novo Claude admita quando não tem certeza de uma resposta, em vez de mentir com a maior confiança. “Testamos a honestidade de Claude 2.1 selecionando um grande conjunto de questões complexas e factuais que investigam fraquezas conhecidas nos modelos atuais”, diz a postagem no blog da empresa. A falta de veracidade, muitas vezes descrita como alucinaçõescontinua a ser um grande problema para os chatbots.
Pivô para vídeo de IA
Embora você possa acessar o Claude 2.1 hoje, o novo Stable Video Diffusion da Stability AI está aberto apenas aos pesquisadores por enquanto, antes que o público em geral possa experimentá-lo. Em contraste com as ferramentas de IA lançadas pela OpenAI, a Stability AI concentra-se no lançamento de software de código aberto. A nova ferramenta de IA da empresa é semelhante ao Runway, outro modelo de texto para vídeo.
Quando você insere um prompt em um modelo de texto para vídeo, a IA emite animações semelhantes a GIF que podem variar de estranhamente bonitas a absolutamente perturbadoras. Além dos recursos de texto para vídeo, o Stable Video Diffusion pode transformar suas imagens estáticas em vídeos adicionando movimento.
Fale, ChatGPT
Embora este não seja tecnicamente um recurso novo do OpenAI, o empresa lançou ChatGPT com recursos de voz para todos no curto período enquanto Altman estava fora do cargo de CEO. Anteriormente, o recurso era restrito apenas a usuários que pagavam pelo serviço de assinatura de US$ 20 por mês da OpenAI, ChatGPT Plus.
Ainda não está dando o Spike Jonze Dela, mas os desenvolvedores de software da OpenAI deram mais um grande passo em direção ao seu objetivo de “multimodalidade”, dando ao chatbot a capacidade de manter uma conversa com você. A ideia é que um chatbot pode ser ainda mais poderoso se puder aceitar entradas e fornecer saídas em vários meios, como voz, texto e imagens. Quem sabe quando aprenderá a cheirar.
À medida que o ano termina, o ritmo acelerado da inovação em IA não mostra sinais de desaceleração. Logo após a notícia de que Altman retornaria como CEO da OpenAI, a Inflection AI, outro concorrente, anunciou um modelo atualizado para seu chatbot Pi. Se você esperava uma pausa nas notícias sobre IA, não prenda a respiração.