Depois de testar os novos recursos da Siri e explorar as novas Ferramentas de Escrita, o próximo passo para mim no quesito Inteligência da Apple foi o novo recurso de transcrição e resumo de chamadas.
Esse era um recurso que eu estava ansioso para testar, principalmente porque poderia transformar completamente a experiência de entrevistar alguém por telefone…
Gravando uma chamada
Você pode ver o fluxo da IU na imagem principal acima. Quando você faz ou recebe uma chamada, há um novo botão no canto superior esquerdo da tela. Toque nele e um alerta será exibido informando que todas as partes serão informadas de que a chamada está sendo gravada.
Após uma contagem regressiva de três segundos, um anúncio de voz é feito:
Esta chamada será gravada
Este é um requisito legal em alguns estados dos EUA e em muitos países ao redor do mundo.
Quando a gravação começa, um banner aparece, convidando você a fazer anotações sobre a chamada. Depois disso, o banner desaparece e você fica apenas com uma forma de onda e um botão para encerrar a gravação.
O processo de gravação realmente não poderia ser mais fácil.
Acredito que a intenção aqui é que a gravação de chamadas de áudio seja um recurso de todo o sistema, o que significa que funcionará também em aplicativos de terceiros, mas ainda não é o caso.
Transcrição
Quando a chamada for concluída, e independentemente de você aceitar ou não a opção de fazer anotações, uma nova nota será aberta com a gravação de áudio incorporada a ela.
Você pode então transcrever isso, o que para uma ligação de cinco minutos levou apenas alguns segundos.
Você também pode reproduzir a gravação e obter destaque sincronizado com o tempo no estilo Apple Music da transcrição. Ou você pode fazer o contrário: toque em qualquer parte da transcrição e ela reproduzirá essa parte da gravação.
Como você já deve ter percebido pelo exemplo acima, o desempenho atual da transcrição é… uh… não é bom.
O “Sim” de Greg foi transformado em “Claro, direto”, e minha pergunta “Qual é sua política normal sobre betas?” foi de alguma forma criativamente reinterpretada como “Qual é sua batida normal na Palestina?”
As coisas não melhoraram nada a partir daí. Houve muitas substituições muito estranhas, e as quebras de linha foram bastante aleatórias. Por exemplo:
Greg Gladwell
Pensando, suponho, porqueGreg Gladwell
Isso éGreg Gladwell
Uma das coisas mais legais por um tempo e sem dúvida será muito, muito útilGreg Gladwell
Acusado da vida atual (uma mutilação de “na vida cotidiana”)Greg Gladwell
Você vai saber que só será capaz de resumir as coisas e ligar ou enviar e-mails em vez de entrar
Neste ponto, ele perdeu apenas metade da frase.
Algo que você também pode ver acima é uma formatação aleatória, como aquele espaço antes da vírgula.
Esta é a primeira versão beta de um recurso beta, e devo dizer que parece!
Resumos
Assim que a transcrição estiver completa, você também pode tocar nela para receber um resumo. Aqui está o que ela produziu para nossa conversa sobre o Apple Intelligence beta:
Deixando de lado a parte do “Palestine beat”, não é terrível, apenas muito, muito genérico. Não tenho certeza de quão útil seria para a maioria das pessoas ter um resumo tão geral, embora eu ache que se você for um advogado ou outra pessoa com centenas ou milhares de transcrições, então talvez indexá-las o ajudaria a encontrar a certa.
Acima de tudo, estou animado com o futuro
Essa é uma maneira muito conveniente de gravar chamadas, então a usarei nas raras ocasiões em que preciso fazer isso, mas os recursos atuais de transcrição não estão realmente a ponto de serem úteis.
Mas estou muito animado com o potencial disso quando funcionar bem. Por exemplo, escrevi há um tempo sobre como uma transcrição do MacWhisper salvou o dia quando eu tinha uma trilha de áudio inutilizável para um vídeo, mas não tinha percebido isso inicialmente – o que fez com que distante mais difícil de sincronizar com minha gravação de backup.
Executar o arquivo de áudio pelo MacWhisper significou que, apenas 90 segundos depois, eu tinha uma transcrição completa e com carimbo de data/hora. Eu poderia então procurar uma frase usada na edição e pular imediatamente para essa parte do arquivo de áudio para substituí-la pelo original. Alguns toques no nível do quadro fizeram com que o vídeo e o áudio fossem sincronizados corretamente. O processo todo levou apenas alguns minutos.
Eu consigo me ver usando um iPhone como um dispositivo adicional de gravação de áudio durante entrevistas, tornando muito fácil encontrar citações e ouvi-las novamente.
Especialmente para entrevistas por telefone, a conveniência de ter imediatamente uma transcrição sincronizada com o horário será fantástica.
Então… ainda não é utilizável, mas dado o desempenho de outras ferramentas de transcrição disponíveis, suspeito que não demorará muito para que seja.