Apple Está Trazer a Transcrição de AI para Memos de Voz, e Eu Não Posso Esperar

Durante as apresentações de produtos, eu costumo usar o aplicativo Voice Memos do iPhone para fazer entrevistas. Como você pode imaginar, transcrever uma gravação de 20 minutos pode ser tedioso. Felizmente, soubemos que uma atualização com inteligência artificial está chegando aos aplicativos Voice Memos e Notes do iPhone, que em breve poderá transcrever e resumir memos de voz no seu telefone.

De acordo com o AppleInsider, em breve será possível acessar o aplicativo Notes, que também passará por mudanças, e ver sua gravação de voz totalmente transcrita. A funcionalidade de resumo por AI também irá resumir suas memos de voz com notas, o que será muito útil para gravar palestras, reuniões e discussões em painéis.

Essa novidade fará parte do iOS 18 e será lançada no final de 2024. Após o lançamento do iOS, logo veremos essa funcionalidade no macOS 15 e no iPadOS 18.

A área no aplicativo Voice Memos do iPhone que mostra um gráfico do áudio gravado será substituída por uma tela que exibe a transcrição ao vivo. O aplicativo Notes terá um novo botão de balão de fala que pode ser tocado para exibir a transcrição gravada.

Estou curioso para ver o desempenho dessa funcionalidade. No final das contas, é tudo inteligência artificial, e não é perfeita. Não tenho certeza se a transcrição funcionará igualmente bem para pessoas com sotaques regionais diferentes. Também é necessário considerar coisas como volume de fala e acústica do ambiente. Estou esperançoso de que eles irão expandir essa funcionalidade para incluir outros idiomas no futuro.

Isso também me faz pensar em uma das minhas críticas ao novo Rabbit R1: o dispositivo seria praticamente inútil assim que os smartphones oferecessem a mesma funcionalidade (o que acontecerá mais cedo do que pensamos). O dispositivo da Teenage Engineering promete uma funcionalidade de resumo por gravação de voz no caminho. No entanto, considerando que a Apple já está implementando isso em nossos telefones, não usaríamos um dispositivo dedicado para isso.