Home Tecnologia Apple lança nova família de modelos de linguagem eficientes de código aberto à medida que o trabalho de IA avança – 9to5Mac

Apple lança nova família de modelos de linguagem eficientes de código aberto à medida que o trabalho de IA avança – 9to5Mac

Por Humberto Marchezini


Antes da estreia do iOS 18 na WWDC em junho, a Apple lançou uma família de modelos de linguagem grande de código aberto. Chamado OpenELM, a Apple os descreve como: uma família de Abrir-fonte Eeficiente eulinguagem Mmodelos.

Em seus testes, a Apple afirma que o OpenELM oferece desempenho semelhante a outros modelos de linguagem aberta, mas com menos dados de treinamento.

A Apple explica:

Para isso, lançamos o OpenELM, um modelo de linguagem aberta de última geração. OpenELM usa uma estratégia de escalonamento em camadas para alocar parâmetros com eficiência dentro de cada camada do modelo do transformador, levando a maior precisão. Por exemplo, com um orçamento de parâmetros de aproximadamente um bilhão de parâmetros, o OpenELM apresenta uma melhoria de 2,36% na precisão em comparação com o OLMo, ao mesmo tempo que requer 2x menos tokens de pré-treinamento.

Divergindo das práticas anteriores que fornecem apenas pesos de modelo e código de inferência e pré-treinamento em conjuntos de dados privados, nosso lançamento inclui a estrutura completa para treinamento e avaliação do modelo de linguagem em conjuntos de dados disponíveis publicamente, incluindo logs de treinamento, vários pontos de verificação e pré- configurações de treinamento. Também lançamos código para converter modelos para a biblioteca MLX para inferência e ajuste fino em dispositivos Apple. Esta versão abrangente visa capacitar e fortalecer a comunidade de pesquisa aberta, abrindo caminho para futuros empreendimentos de pesquisa aberta.

Você pode encontrar mais detalhes nos links abaixo:

O iOS 18 incluirá uma coleção de novos recursos de inteligência artificial, e o lançamento do OpenELM de hoje é apenas a última peça do trabalho de bastidores da Apple em preparação.

Bloomberg relatou na semana passada que os recursos de IA do iOS 18 serão alimentados por um modelo de linguagem grande inteiramente no dispositivo, que oferecerá benefícios de privacidade e velocidade.

Siga a oportunidade: Tópicos, Twitter, Instagrame Mastodonte.

FTC: Usamos links de afiliados automotivos para geração de renda. Mais.





Source link

Related Articles

Deixe um comentário