OpenAI Reportedly Transcrição 1 Milhão Horas de Vídeos do YouTube para Treinar GPT-4

OpenAI teria transcrito mais de um milhão de horas de vídeos do YouTube para treinar GPT-4, de acordo com um relatório. Isso aconteceu depois do CEO do YouTube, Neal Mohan, afirmar que transcrever vídeos do YouTube para treinar IA seria uma clara violação das políticas da plataforma em entrevista à Bloomberg.

Mohan declarou que quando um criador realiza upload de seu trabalho na plataforma, ele tem certas expectativas, sendo uma delas que os termos de serviço sejam cumpridos. O relatório do The New York Times alega que membros da equipe da OpenAI, incluindo o presidente Greg Brockman, ajudaram na coleta dos vídeos do YouTube. A OpenAI teria usado seu software de transcrição Whisper para coletar mais dados e treinar o GPT-4, o modelo mais recente e avançado por trás do ChatGPT.

Tanto a OpenAI quanto o Google não responderam imediatamente aos pedidos de comentário do Gizmodo. Essas alegações do The New York Times podem ter grandes implicações na batalha contínua entre a OpenAI e o Google no desenvolvimento de IA generativa. O Google provavelmente não ficará em silêncio se a OpenAI estiver utilizando seu conteúdo para melhorar o ChatGPT. No entanto, a empresa ainda não fez nenhuma acusação nesse sentido.

O relatório do The New York Times poderia levantar questões inéditas sobre leis de direitos autorais no mundo da IA. A maioria das reclamações de direitos autorais relacionadas à IA foram feitas por pequenos editores, mas o Google poderia adicionar peso real a essa luta se decidir participar. Isso também poderia ser uma forma para o Google desacelerar a OpenAI, que atualmente está liderando a corrida da IA.