Home Economia Meta lança Llama 3.2 — e dá voz à sua IA

Meta lança Llama 3.2 — e dá voz à sua IA

Por Humberto Marchezini


Alimentando os novos recursos do Meta AI está uma versão atualizada do Llama, o principal modelo de linguagem grande do Meta. O modelo gratuito anunciado hoje também pode ter um amplo impacto, dado o quão amplamente a família Llama já foi adotada por desenvolvedores e startups.

Em contraste com os modelos da OpenAI, o Llama pode ser baixado e executado localmente sem custos — embora haja algumas restrições ao uso comercial em larga escala. O Llama também pode ser mais facilmente ajustado, ou modificado com treinamento adicional, para tarefas específicas.

Patrick Wendell, cofundador e vice-presidente de engenharia da Databricks, uma empresa que hospeda modelos de IA, incluindo o Llama, diz que muitas empresas são atraídas por modelos abertos porque eles permitem que elas protejam melhor seus próprios dados.

Grandes modelos de linguagem estão se tornando cada vez mais “multimodais”, o que significa que são treinados para lidar com áudio e imagens como entrada, bem como texto. Isso estende as habilidades de um modelo e permite que os desenvolvedores criem novos tipos de aplicativos de IA sobre ele, incluindo os chamados agentes de IA capazes de realizar tarefas úteis em computadores em seu nome. O Llama 3.2 deve tornar mais fácil para os desenvolvedores criarem agentes de IA que podem, digamos, navegar na web, talvez caçar ofertas em um tipo específico de produto quando recebem uma breve descrição.

“Os modelos multimodais são muito importantes porque os dados que as pessoas e as empresas usam não são apenas texto, eles podem vir em muitos formatos diferentes, incluindo imagens e áudio ou formatos mais especializados, como sequências de proteínas ou livros-razão financeiros”, diz Phillip Isolaum professor do MIT. “Nos últimos anos, passamos de modelos de linguagem fortes para agora termos modelos que também funcionam bem em imagens e vozes. A cada ano, vemos mais modalidades de dados se tornarem acessíveis a esses sistemas.”

“Com o Llama 3.1, a Meta mostrou que os modelos abertos poderiam finalmente fechar a lacuna com suas contrapartes proprietárias”, diz Nathan Benaich, fundador e sócio geral da Air Street Capital e autor de um influente relatório anual sobre IA. Benaich acrescenta que modelos multimodais tendem a superar modelos maiores somente de texto. “Estou animado para ver como o 3.2 se molda”, ele diz.

Mais cedo hoje, o Allen Institute for AI (Ai2), um instituto de pesquisa em Seattle, lançou um modelo multimodal avançado de código aberto chamado Molmo. O Molmo foi lançado sob uma licença menos restritiva do que o Llama, e o Ai2 também está divulgando detalhes de seus dados de treinamento, que podem ajudar pesquisadores e desenvolvedores a experimentar e modificar o modelo.

A Meta disse hoje que lançaria vários tamanhos do Llama 3.2 com capacidades correspondentes. Além de duas instanciações mais poderosas com 11 bilhões e 90 bilhões de parâmetros — uma medida da complexidade de um modelo, bem como seu tamanho — a Meta está lançando versões de parâmetros menos capazes, de 1 bilhão e 3 bilhões, projetadas para funcionar bem em dispositivos portáteis. A Meta diz que essas versões foram otimizadas para chips móveis baseados em ARM da Qualcomm e MediaTek.

A reformulação da IA ​​da Meta acontece em um momento inebriante, com gigantes da tecnologia correndo para oferecer a IA mais avançada. A decisão da empresa de lançar seus modelos mais valorizados gratuitamente pode dar a ela uma vantagem no fornecimento da base para muitas ferramentas e serviços de IA — especialmente à medida que as empresas começam a explorar o potencial dos agentes de IA.



Source link

Related Articles

Deixe um comentário