Home Tecnologia A transcrição e o resumo das chamadas são um trabalho em andamento, mas têm um enorme potencial

A transcrição e o resumo das chamadas são um trabalho em andamento, mas têm um enorme potencial

Por Humberto Marchezini


Depois de testar os novos recursos da Siri e explorar as novas Ferramentas de Escrita, o próximo passo para mim no quesito Inteligência da Apple foi o novo recurso de transcrição e resumo de chamadas.

Esse era um recurso que eu estava ansioso para testar, principalmente porque poderia transformar completamente a experiência de entrevistar alguém por telefone…

Gravando uma chamada

Você pode ver o fluxo da IU na imagem principal acima. Quando você faz ou recebe uma chamada, há um novo botão no canto superior esquerdo da tela. Toque nele e um alerta será exibido informando que todas as partes serão informadas de que a chamada está sendo gravada.

Após uma contagem regressiva de três segundos, um anúncio de voz é feito:

Esta chamada será gravada

Este é um requisito legal em alguns estados dos EUA e em muitos países ao redor do mundo.

Quando a gravação começa, um banner aparece, convidando você a fazer anotações sobre a chamada. Depois disso, o banner desaparece e você fica apenas com uma forma de onda e um botão para encerrar a gravação.

O processo de gravação realmente não poderia ser mais fácil.

Acredito que a intenção aqui é que a gravação de chamadas de áudio seja um recurso de todo o sistema, o que significa que funcionará também em aplicativos de terceiros, mas ainda não é o caso.

Transcrição

Quando a chamada for concluída, e independentemente de você aceitar ou não a opção de fazer anotações, uma nova nota será aberta com a gravação de áudio incorporada a ela.

Você pode então transcrever isso, o que para uma ligação de cinco minutos levou apenas alguns segundos.

Você também pode reproduzir a gravação e obter destaque sincronizado com o tempo no estilo Apple Music da transcrição. Ou você pode fazer o contrário: toque em qualquer parte da transcrição e ela reproduzirá essa parte da gravação.

Como você já deve ter percebido pelo exemplo acima, o desempenho atual da transcrição é… uh… não é bom.

O “Sim” de Greg foi transformado em “Claro, direto”, e minha pergunta “Qual é sua política normal sobre betas?” foi de alguma forma criativamente reinterpretada como “Qual é sua batida normal na Palestina?”

As coisas não melhoraram nada a partir daí. Houve muitas substituições muito estranhas, e as quebras de linha foram bastante aleatórias. Por exemplo:

Greg Gladwell
Pensando, suponho, porque

Greg Gladwell
Isso é

Greg Gladwell
Uma das coisas mais legais por um tempo e sem dúvida será muito, muito útil

Greg Gladwell
Acusado da vida atual (uma mutilação de “na vida cotidiana”)

Greg Gladwell

Você vai saber que só será capaz de resumir as coisas e ligar ou enviar e-mails em vez de entrar

Neste ponto, ele perdeu apenas metade da frase.

Algo que você também pode ver acima é uma formatação aleatória, como aquele espaço antes da vírgula.

Esta é a primeira versão beta de um recurso beta, e devo dizer que parece!

Resumos

Assim que a transcrição estiver completa, você também pode tocar nela para receber um resumo. Aqui está o que ela produziu para nossa conversa sobre o Apple Intelligence beta:

Deixando de lado a parte do “Palestine beat”, não é terrível, apenas muito, muito genérico. Não tenho certeza de quão útil seria para a maioria das pessoas ter um resumo tão geral, embora eu ache que se você for um advogado ou outra pessoa com centenas ou milhares de transcrições, então talvez indexá-las o ajudaria a encontrar a certa.

Acima de tudo, estou animado com o futuro

Essa é uma maneira muito conveniente de gravar chamadas, então a usarei nas raras ocasiões em que preciso fazer isso, mas os recursos atuais de transcrição não estão realmente a ponto de serem úteis.

Mas estou muito animado com o potencial disso quando funcionar bem. Por exemplo, escrevi há um tempo sobre como uma transcrição do MacWhisper salvou o dia quando eu tinha uma trilha de áudio inutilizável para um vídeo, mas não tinha percebido isso inicialmente – o que fez com que distante mais difícil de sincronizar com minha gravação de backup.

Executar o arquivo de áudio pelo MacWhisper significou que, apenas 90 segundos depois, eu tinha uma transcrição completa e com carimbo de data/hora. Eu poderia então procurar uma frase usada na edição e pular imediatamente para essa parte do arquivo de áudio para substituí-la pelo original. Alguns toques no nível do quadro fizeram com que o vídeo e o áudio fossem sincronizados corretamente. O processo todo levou apenas alguns minutos.

Eu consigo me ver usando um iPhone como um dispositivo adicional de gravação de áudio durante entrevistas, tornando muito fácil encontrar citações e ouvi-las novamente.

Especialmente para entrevistas por telefone, a conveniência de ter imediatamente uma transcrição sincronizada com o horário será fantástica.

Então… ainda não é utilizável, mas dado o desempenho de outras ferramentas de transcrição disponíveis, suspeito que não demorará muito para que seja.

FTC: Usamos links de afiliados automáticos para geração de renda. Mais.



Source link

Related Articles

Deixe um comentário