As pessoas reclamam da Siri há anos, argumentando que ela ficou para trás em relação a Alexa e Google Assistant. Com evidências claras de que 2024 verá melhorias dramáticas nos recursos de IA da Apple, o iOS 18 Siri finalmente mudará as coisas?
Espero sinceramente que a resposta seja sim e penso que há três pistas que fornecem alguma razão para otimismo…
A longa espera da Apple para melhorar o Siri
Maçã não se apressou em usar a IA generativa, por três razões.
Primeiro, a empresa tem uma abordagem bem estabelecida para novas tecnologias. Prefere deixar que outras empresas sofram os problemas mais avançados e só entra no mercado quando a empresa sente que pode oferecer uma experiência que supere a concorrência.
Em segundo lugar, a Apple tem um forte foco na privacidade, com o objetivo de fazer o máximo de processamento possível no dispositivo, em vez de enviar dados pessoais para um servidor para serem processados. Já vimos a empresa dar um pequeno passo em direção a esse objetivo, com o lançamento do Siri off-line nos modelos mais recentes do Apple Watch em setembro.
Terceiro, a Apple é uma empresa conservadora com C minúsculo, optando por evitar controvérsias sempre que possível. A IA generativa impressionou as pessoas com a aparente inteligência das suas respostas, mas também fez algumas coisas espetacularmente estúpidas – desde oferecer uma frase de saudação nazi como sugestão de resposta a uma aparente tentativa de fraude.
Também argumentei que uma interface falada aumenta os riscos.
Mas este é o ano
Por mais que eu ache que a Apple está esperando por bons motivos, as coisas agora chegaram a um ponto em que simplesmente não é viável esperar mais, e agora há muitas evidências de que 2024 é o ano em que a Apple embarca no trem generativo da IA.
Bloomberg relatou que a Apple se referiu ao iOS 18 como uma das maiores atualizações do iOS que já fez, e que a IA é o foco disso.
O Tempos Financeiros ficou um pouco mais específico, indicando que o Siri seria este ano alimentado por um modelo de IA generativo no estilo ChatGPT.
9to5Mac encontrou evidências em um iOS 17.4 beta de que a Apple está trabalhando em uma nova versão do Siri alimentada por tecnologia de IA generativa.
Até o CEO Tim Cook, que normalmente é calado quando se trata dos planos futuros da Apple, disse que a empresa está “animada em compartilhar os detalhes de nosso trabalho contínuo neste espaço (IA) ainda este ano”.
Então, o que podemos esperar?
Pista 1: O objetivo original da equipe Siri
Um dos maiores pontos fracos do Siri é que ele não foi capaz de interagir de forma significativa com outros aplicativos. Ele pode controlar dispositivos domésticos inteligentes, é claro, e existem atalhos da Siri, mas, em geral, se o que você deseja fazer requer um aplicativo de terceiros, a Siri não pode ajudar. Daí a infame resposta “Aqui está o que encontrei na web”.
Mas é exatamente isso que é necessário para transformar o Siri em um verdadeiramente assistente útil e inteligente. Para que ele realmente comece a realizar algumas das tarefas atualmente realizadas por PAs humanos.
Na verdade, era isso que a equipe original por trás da Siri queria alcançar. Antes da aquisição da Apple, a versão de terceiros do aplicativo tinha integrações com 42 serviços diferentes. Foi a Apple quem eliminou esse recurso, provavelmente para que o Siri fosse capaz de fazer menos coisas de maneira mais confiável.
Então a Apple seguiu o seu caminho, com uma capacidade Siri bastante reduzida, e a equipe original criou um novo assistente inteligente – Viv – proporcionando-lhe integração profunda com aplicativos de terceiros para realizar tarefas complexas.
Aqui está um exemplo do que Viv foi capaz de fazer em 2016:
“Traga-me uma pizza no Pizz’a Chicago, perto do meu escritório”, disse um dos engenheiros em seu smartphone. Foi o primeiro teste real do Viv, a tecnologia de inteligência artificial que a equipe vinha construindo silenciosamente há mais de um ano. Todo mundo estava um pouco nervoso. Então, uma mensagem de Viv apareceu: “Você gostaria de coberturas com isso?”
Os engenheiros, oito ao todo, começaram a intervir: “Pepperoni”. “Meio queijo.” “Salada César.” Encorajados pelo resultado, eles apimentaram Viv com mais comandos: Adicione mais coberturas. Remova as coberturas. Mude o tamanho médio para grande.
Cerca de 40 minutos depois – e depois de alguns soluços quando Viv confundiu o endereço do escritório – um motorista da Pizza Chicago apareceu com quatro pizzas feitas sob encomenda.
Pista 2: a capacidade da IA generativa de divinar a intenção
Desde então, é claro, temos IA generativa.
Embora a maioria das pessoas tenha ficado impressionada com o saída – que, em seus melhores exemplos, parece mais algo escrito por uma pessoa do que por uma máquina – para mim o mais impressionante é como tecnologias como o ChatGPT lidam com o entrada. O que é realmente bom é adivinhar nossa intenção.
Se a Siri conseguir descobrir o que estamos tentando alcançar, e ele pode interagir com aplicativos e serviços de terceiros, como Uber, Booking.com, companhias aéreas e assim por diante, então abrimos a possibilidade de usar vários aplicativos para realizar tarefas complexas.
Pista 3: pesquisa da própria Apple sobre interação com aplicativos
Recebemos a pista final no início desta semana.
Um artigo de pesquisa da Apple descreve como a empresa vem desenvolvendo o Ferret-UI, um sistema generativo de IA projetado especificamente para dar sentido às telas dos aplicativos. O artigo é um tanto vago sobre as possíveis aplicações disso – provavelmente deliberadamente – mas a possibilidade mais interessante seria alimentar um Siri muito mais avançado (…)
Um usuário poderia dar à Siri uma instrução como “Verifique os voos de JFK para Boston amanhã e reserve um assento em um voo que me levará lá às 10h com uma tarifa total abaixo de US$ 200”. A Siri então interagiria com o aplicativo da companhia aérea para realizar a tarefa.
O que isso pode significar para o iOS 18 Siri?
Se juntarmos tudo isso, teremos um Siri totalmente novo que usa recursos generativos de IA para dar sentido às nossas solicitações; interfaces com serviços populares existentes; e pode interagir com outros aplicativos em nosso iPhone.
Isso deve permitir que o Siri responda a coisas como esta:
“Estou participando da WWDC 2024 – sugira alguns voos e hotéis.”
A IA generativa faz a análise necessária. Ele sabe que precisa consultar a WWDC para ver onde ela é realizada e em que datas. Ele usa nossa localização inicial conhecida para ver de onde precisamos viajar.
Ele usa os aplicativos que tenho no meu iPhone para determinar quais companhias aéreas eu uso e quais grupos de hotéis eu prefiro. Para os mais populares, ele usa integrações Siri criadas pela Apple com esses serviços.
Onde a Apple não criou uma integração com o Siri, ela interage com outros aplicativos conforme necessário para cumprir nossa intenção.
Não estou sugerindo que possamos ir tão longe quanto confiar na Siri para reservar tudo! Acho que será necessário passar-nos as suas sugestões para que possamos escolher. Mas uma vez que o tenhamos feito, então deveria ser possível dizer “Vá em frente e reserve o Mosser e os voos americanos com partida às 15h do dia 9 e retorno às 11h do dia 15”.
Sonho irrealizável ou expectativa realista?
Já se passou quase uma década desde que escrevi uma solicitação de recurso solicitando que o Siri pudesse interagir com aplicativos de terceiros. Na verdade ainda não aconteceu; poderia finalmente estar acontecendo agora?
É uma meta ambiciosa, com certeza. Mas a equipe original da Siri já demonstrou o quanto era possível antes mesmo da IA generativa. Com os avanços que foram feitos desde então, gostaria de acreditar que o que descrevi acima é viável.
Qual é a sua opinião? Você acha que esta é uma expectativa razoável para uma versão totalmente nova do Siri alimentada por IA generativa no iOS 18? Por favor, participe de nossa enquete e compartilhe sua opinião nos comentários.
FTC: Usamos links de afiliados automotivos para geração de renda. Mais.