Home Economia OpenAI anuncia um novo modelo de IA, com o codinome Strawberry, que resolve problemas difíceis passo a passo

OpenAI anuncia um novo modelo de IA, com o codinome Strawberry, que resolve problemas difíceis passo a passo

Por Humberto Marchezini


IA aberta fez o último grande avanço em inteligência artificial ao aumentar o tamanho de seus modelos para proporções estonteantes, quando introduziu o GPT-4 no ano passado. A empresa anunciou hoje um novo avanço que sinaliza uma mudança na abordagem — um modelo que pode “raciocinar” logicamente por meio de muitos problemas difíceis e é significativamente mais inteligente do que a IA existente sem uma grande expansão.

O novo modelo, chamado OpenAI o1, pode resolver problemas que confundem modelos de IA existentes, incluindo o modelo mais poderoso existente do OpenAI, o GPT-4o. Em vez de evocar uma resposta em uma etapa, como um modelo de linguagem grande normalmente faz, ele raciocina sobre o problema, efetivamente pensando em voz alta como uma pessoa faria, antes de chegar ao resultado certo.

“É isso que consideramos o novo paradigma nesses modelos”, Mira Murati, diretora de tecnologia da OpenAI, conta à WIRED. “Ele é muito melhor em lidar com tarefas de raciocínio muito complexas.”

O novo modelo recebeu o codinome Strawberry na OpenAI e não é um sucessor do GPT-4o, mas sim um complemento a ele, diz a empresa.

Murati diz que a OpenAI está atualmente construindo seu próximo modelo mestre, GPT-5, que será consideravelmente maior do que seu antecessor. Mas enquanto a empresa ainda acredita que a escala ajudará a extrair novas habilidades da IA, o GPT-5 provavelmente também incluirá a tecnologia de raciocínio introduzida hoje. “Existem dois paradigmas”, diz Murati. “O paradigma de escala e este novo paradigma. Esperamos que os juntemos.”

Os LLMs geralmente conjuram suas respostas a partir de enormes redes neurais alimentadas por vastas quantidades de dados de treinamento. Eles podem exibir habilidades linguísticas e lógicas notáveis, mas tradicionalmente lutam com problemas surpreendentemente simples, como questões matemáticas rudimentares que envolvem raciocínio.

Murati diz que o OpenAI o1 usa aprendizado por reforço, que envolve dar a um modelo feedback positivo quando ele acerta as respostas e feedback negativo quando não acerta, para melhorar seu processo de raciocínio. “O modelo aguça seu pensamento e ajusta as estratégias que ele usa para chegar à resposta”, ela diz. O aprendizado por reforço permitiu que os computadores jogassem com habilidade sobre-humana e fizessem tarefas úteis como projetar chips de computador. A técnica também é um ingrediente-chave para transformar um LLM em um chatbot útil e bem-comportado.

Mark Chen, vice-presidente de pesquisa da OpenAI, demonstrou o novo modelo para a WIRED, usando-o para resolver vários problemas que seu modelo anterior, GPT-4o, não consegue. Isso incluía uma questão de química avançada e o seguinte quebra-cabeça matemático alucinante: “Uma princesa tem a mesma idade que o príncipe terá quando a princesa tiver o dobro da idade do príncipe quando a idade da princesa era metade da soma de suas idades atuais. Qual é a idade do príncipe e da princesa?” (A resposta correta é que o príncipe tem 30 anos e a princesa tem 40).

“O (novo) modelo está aprendendo a pensar por si mesmo, em vez de tentar imitar a maneira como os humanos pensariam”, como faz um LLM convencional, diz Chen.

A OpenAI diz que seu novo modelo tem desempenho significativamente melhor em vários conjuntos de problemas, incluindo aqueles focados em codificação, matemática, física, biologia e química. No American Invitational Mathematics Examination (AIME), um teste para estudantes de matemática, o GPT-4o resolveu em média 12% dos problemas, enquanto o o1 acertou 83%, de acordo com a empresa.



Source link

Related Articles

Deixe um comentário