Quando a Amazon lançou Com a assistente virtual Alexa há nove anos, sua capacidade de decodificar comandos de voz para definir um cronômetro ou tocar uma música parecia quase mágica. Hoje, o nível de competências linguísticas impressionantes é muito maior, graças ao ChatGPT da OpenAI. A Amazon está reiniciando seu assistente de voz que aproveita a tecnologia por trás da nova onda de chatbots que podem iniciar conversas extremamente realistas.
A Amazon anunciou a atualização para Alexa em um evento realizado em sua segunda sede em Arlington, Virgínia. O assistente responderá a perguntas muito mais complexas e se envolverá em conversas mais fluidas e abertas, eliminando a necessidade dos usuários dizerem “Alexa…” a cada passo.
Em algumas semanas, os usuários que disserem “Alexa, vamos bater um papo” terão acesso ao novo e mais capaz assistente de voz. A Amazon chama isso de “prévia” porque os novos recursos continuam sendo um trabalho em andamento.
Demonstrações apresentadas no palco na quarta-feira mostraram Alexa exibindo uma personalidade mais simulada com sua entonação e esforços de humor. Dispositivos equipados com câmeras, como o Echo Show, tentarão detectar quando uma pessoa espera que Alexa continue a conversa e quando a conversa terminar.
A nova Alexa também modulará sua própria voz para criar um vaivém de aparência mais natural. “Se eu perguntar a Alexa como estão os Red Sox e eles acabarem de perder, isso responderá com um tom empático”, diz Rohit Prasad, que lidera o desenvolvimento de IA na Amazon e mora em Cambridge, Massachusetts.
Prasad diz que atualizar as habilidades linguísticas de Alexa exigiu engenharia extensiva, porque os grandes modelos de linguagem que alimentam serviços como o ChatGPT podem inventar fatos, deixar escapar bobagens e ser totalmente inadequados. “Especialmente dadas certas limitações dos modelos de linguagem, este é um grande salto”, diz Prasad.
Justine Cassell, professor da Universidade Carnegie Mellon que estuda a forma como os humanos interagem com agentes de IA, diz que será fascinante ver como as pessoas respondem a um chatbot habilitado por voz, capaz de respostas mais ricas. “Os objetivos são ótimos e estou animada para ver o que eles farão”, diz ela.
No entanto, Cassell diz que algumas das coisas que a Amazon promete, como responder à linguagem corporal, continuam extremamente desafiadoras. “Não existe gramática para a linguagem corporal, como existe para a linguagem falada e escrita”, diz ela. Se Alexa interpretar mal a postura ou os movimentos de alguém e responder incorretamente, as coisas podem ficar estranhas.
Cassell diz que mesmo que Alexa ganhe mais fluência semelhante ao ChatGPT, é improvável que seus esforços para imitar a personalidade e os sentimentos humanos por meio de características como a entonação correspondam às capacidades humanas por algum tempo. Espere que a nova Alexa às vezes se sinta afetada em suas respostas.
A Amazon diz que os usuários poderão se inscrever para obter acesso a um teste adicional de sua nova tecnologia, onde os novos recursos do Alexa poderão ser usados para controlar outros dispositivos, incluindo alguns não fabricados pela Amazon. Com o tempo, a empresa planeja adicionar novos recursos ao Alexa, incluindo potencialmente a capacidade de discutir e recomendar produtos do vasto estoque de produtos da empresa.