O Apple Intelligence chegou em versão beta esta semana e agora a empresa tem publicou uma visão geral aprofundada de como alguns de seus recursos de IA foram criados. Uma informação importante? Dois dos modelos de base da Apple foram criados usando chips feitos pelo Google.
O primeiro olhar aprofundado sobre o desenvolvimento da Apple Intelligence
A Apple tende a evitar compartilhar muitos detalhes sobre suas práticas internas de desenvolvimento de produtos. No entanto, com recursos de IA e ML, a empresa há muito tempo publicou sua pesquisa para todos verem.
O última publicação é intitulado ‘Apple Intelligence Foundation Language Models’ e é um dos primeiros artigos desde a introdução do Apple Intelligence pela WWDC.
O documento é escrito por pesquisadores e para pesquisadores, então não é o mais fácil de analisar. No entanto, um detalhe de destaque envolve os chips usados para treinar dois dos modelos de linguagem da Apple Intelligence.
Neste relatório, detalharemos como dois desses modelos — AFM-on-device (AFM significa Apple Foundation Model), um modelo de linguagem de 3 bilhões de parâmetros, e AFM-server, um modelo de linguagem maior baseado em servidor — foram construídos e adaptados para executar tarefas especializadas de forma eficiente, precisa e responsável. Esses dois modelos de base são parte de uma família maior de modelos generativos criados pela Apple para dar suporte a usuários e desenvolvedores; isso inclui um modelo de codificação (com base em um modelo de linguagem AFM) para construir inteligência no Xcode, bem como um modelo de difusão para ajudar os usuários a se expressarem visualmente, por exemplo, no aplicativo Mensagens.
Usando chips do Google para treinar modelos da Apple
Os dois modelos mencionados, AFM-on-device e AFM-server, não foram treinados usando os chips Apple Silicon internos da Apple.
Em vez disso, a Apple recorreu aos chips Tensor do Google — como os encontrados em telefones Pixel — para treinar seus modelos. E, de acordo com o artigo, foram necessários muitos chips Tensor para fazer o trabalho.
- O AFM-on-device exigiu 2.048 chips TPUv5p em seu treinamento
- O modelo maior de servidor AFM exigiu 8.192 chips TPUv4
É interessante que a Apple tenha optado pelos chips Tensor do Google em vez dos chips Nvidia nos quais outras empresas tendem a confiar.
O artigo não entra em detalhes sobre isso, mas talvez publicações futuras o façam.
O que devemos fazer com essa notícia? Sem mais detalhes da Apple, é difícil saber o que pensar.
Sabendo da preferência da Apple em fazer o máximo de trabalho interno possível, é bem possível que a empresa já tenha abandonado o Google Tensor para treinamento de modelos e esteja usando uma versão avançada do Apple Silicon.
De qualquer forma, o que isso significa é que o iPhone está ficando muito mais inteligente com o Apple Intelligence, em parte graças ao Google.