Como usar o Audacity para transcrever áudios usando inteligência artificial gratuitamente

Transcrever áudios é uma atividade que exige tempo e é essencial para pesquisadores, jornalistas e podcasters. Com os avanços da inteligência artificial, surgem ferramentas que conseguem transformar discursos em textos, como é o caso do Audacity – um software popular e gratuito para gravação e edição de áudios.

Recentemente, o Audacity recebeu diversas ferramentas de IA desenvolvidas pela Intel, como parte do pacote de plugins OpenVINO. Uma dessas ferramentas é a tecnologia Whisper, criada pela OpenIA, que possibilita a transcrição e tradução de áudios de forma descomplicada.

O Whisper é integrado diretamente no Audacity, sem custos adicionais, e suporta mais de 50 idiomas, incluindo o português, inglês, espanhol, francês, alemão, japonês, chinês e russo. No entanto, a tradução apenas funciona de outros idiomas para o inglês, ainda não disponível o inverso.

É importante destacar que, atualmente, o Audacity oferece transcrições baseadas em um modelo de IA mais simples do Whisper, o que pode resultar em menos precisão nos resultados.

Mesmo com essa ressalva, a transcrição automática pode ajudar a economizar tempo e acelerar o processo. Abaixo, o Giz Brasil apresenta o passo a passo de como transcrever áudios com IA pelo Audacity.

Como transcrever áudios com IA pelo Audacity:

Instalação do OpenVINO:

– Baixe e instale o Audacity no computador Windows. A ferramenta de transcrição funciona a partir da versão 3.4.2 do programa;
– Acesse o GitHub do projeto OpenVINO;
– Baixe os arquivos “OpenVINO-Module-3.4.2-R1.zip” e “openvino-models.zip”;
– Extraia os arquivos do “OpenVINO-Module-3.4.2-R1.zip” e do “openvino-models.zip” na pasta de instalação do Audacity;
– Execute o Audacity;
– Vá em Editar > Preferências > Módulos e ative o “mod-openvino”;
– Reinicie o Audacity para ativar os módulos do plugin.

Execução do OpenVINO:

– Importe o áudio desejado para o Audacity;
– Selecione o áudio na linha do tempo e vá em Analisar > OpenVINO Whisper Transcription;
– Escolha “GPU” em “OpenVINO Inference Device” e “transcribe” em “Modo”;
– Selecione o idioma e clique em “Aplicar” para aguardar a transcrição.

Ao final da transcrição, o texto será exibido abaixo do áudio na linha do tempo, sincronizado com os tempos do arquivo. É possível exportar o conteúdo para aplicativos de edição como Word, ou transformá-lo em legendas.