Transcrever áudios é uma atividade que exige tempo e é essencial para pesquisadores, jornalistas e podcasters. Com os avanços da inteligência artificial, surgem ferramentas que conseguem transformar discursos em textos, como é o caso do Audacity – um software popular e gratuito para gravação e edição de áudios.
Recentemente, o Audacity recebeu diversas ferramentas de IA desenvolvidas pela Intel, como parte do pacote de plugins OpenVINO. Uma dessas ferramentas é a tecnologia Whisper, criada pela OpenIA, que possibilita a transcrição e tradução de áudios de forma descomplicada.
O Whisper é integrado diretamente no Audacity, sem custos adicionais, e suporta mais de 50 idiomas, incluindo o português, inglês, espanhol, francês, alemão, japonês, chinês e russo. No entanto, a tradução apenas funciona de outros idiomas para o inglês, ainda não disponível o inverso.
É importante destacar que, atualmente, o Audacity oferece transcrições baseadas em um modelo de IA mais simples do Whisper, o que pode resultar em menos precisão nos resultados.
Mesmo com essa ressalva, a transcrição automática pode ajudar a economizar tempo e acelerar o processo. Abaixo, o Giz Brasil apresenta o passo a passo de como transcrever áudios com IA pelo Audacity.
Como transcrever áudios com IA pelo Audacity:
Instalação do OpenVINO:
– Baixe e instale o Audacity no computador Windows. A ferramenta de transcrição funciona a partir da versão 3.4.2 do programa;
– Acesse o GitHub do projeto OpenVINO;
– Baixe os arquivos “OpenVINO-Module-3.4.2-R1.zip” e “openvino-models.zip”;
– Extraia os arquivos do “OpenVINO-Module-3.4.2-R1.zip” e do “openvino-models.zip” na pasta de instalação do Audacity;
– Execute o Audacity;
– Vá em Editar > Preferências > Módulos e ative o “mod-openvino”;
– Reinicie o Audacity para ativar os módulos do plugin.
Execução do OpenVINO:
– Importe o áudio desejado para o Audacity;
– Selecione o áudio na linha do tempo e vá em Analisar > OpenVINO Whisper Transcription;
– Escolha “GPU” em “OpenVINO Inference Device” e “transcribe” em “Modo”;
– Selecione o idioma e clique em “Aplicar” para aguardar a transcrição.
Ao final da transcrição, o texto será exibido abaixo do áudio na linha do tempo, sincronizado com os tempos do arquivo. É possível exportar o conteúdo para aplicativos de edição como Word, ou transformá-lo em legendas.