Durante as apresentações do produto, costumo usar o recurso Memos de Voz do iPhone para entrevistas. Como você pode imaginar, transcrever uma gravação de 20 minutos pode ser tedioso. Felizmente, foi revelado que uma atualização com inteligência artificial está chegando aos aplicativos Voice Memos e Notes do iPhone, que em breve poderão transcrever e resumir os memorandos de voz em seu telefone.
De acordo com as informações, em breve será possível acessar seu aplicativo Notes, que também está sendo reformulado, e ver seu memorando de voz gravado com texto totalmente transcrito. O recurso de sumarização por inteligência artificial também farcará um resumo dos seus memorandos de voz com notas, o que seria extremamente útil para gravar palestras, reuniões e discussões de painéis.
O recurso está programado para fazer parte do iOS 18 e será lançado no final de 2024. Após o lançamento do iOS, em breve veremos o recurso no macOS 15 e no iPadOS 18.
A área no aplicativo Voice Memos do iPhone que mostra um gráfico do áudio gravado será substituída por uma tela exibindo a transcrição ao vivo. No aplicativo Notes, haverá um novo botão de balão de fala que pode ser tocado para exibir a transcrição gravada.
Estou curioso para ver o desempenho desse recurso. No final do dia, tudo se resume a inteligência artificial, que não é perfeita. Não tenho certeza se a transcrição funcionará igualmente bem para pessoas com diferentes sotaques regionais. Também é preciso levar em conta coisas como volume de fala e acústica do ambiente. Estou esperando que eles ampliem o recurso para incluir outros idiomas no futuro.
Isso também me faz pensar em uma das minhas críticas ao novo Rabbit R1: o dispositivo seria praticamente inútil assim que os telefones se tornassem inteligentes o suficiente para oferecer a mesma funcionalidade (o que acontecerá mais cedo do que pensamos). O gadget da Teenage Engineering promete um recurso de sumarização de gravação de voz no caminho. Ainda assim, considerando que a Apple já está implementando isso em nossos telefones, não usaríamos um dispositivo dedicado para isso.