O New York Times está atualmente processando a OpenAI por violação de direitos autorais e alega que a influente startup de tecnologia usou seu material jornalístico para treinar seu chatbot, ChatGPT, sem pagar as taxas de licenciamento apropriadas. Mas a empresa de Sam Altman está se defendendo dessas acusações com algumas acusações próprias. Esta semana, a OpenAI alegou que o jornal havia “hackeado” seus produtos.
Em uma petição legal tornada pública nesta semana, a OpenAI afirmou que seus produtos foram abusados por “alguém” que foi pago pelo New York Times para fazê-lo. Em suas próprias palavras, a empresa alegou:
“As alegações na reclamação do Times não estão de acordo com seus rigorosos padrões jornalísticos. A verdade, que virá à tona no decorrer deste caso, é que o Times pagou alguém para hackear os produtos da OpenAI. Eles fizeram dezenas de milhares de tentativas para gerar os resultados altamente anômalos que compõem o Anexo J da Reclamação. Eles só foram capazes de fazer isso direcionando e explorando um bug (que a OpenAI se comprometeu a corrigir) ao usar prompts enganosos que violam flagrantemente os termos de uso da OpenAI. E mesmo assim, eles tiveram que alimentar a ferramenta com partes dos próprios artigos que procuravam elicitar passagens textuais literais, praticamente todas as quais já aparecem em múltiplos sites públicos.”
Não está totalmente claro sobre o que a OpenAI está falando. Se tivesse que adivinhar, parece que o New York Times contratou um empreiteiro para ver se poderiam fazer o ChatGPT reproduzir suas reportagens. No entanto, não está claro se esse é o caso. O Gizmodo entrou em contato com a OpenAI para obter esclarecimentos e atualizaremos esta história quando recebermos uma resposta.
Quando contatado para comentar, o New York Times forneceu uma declaração por meio de Ian Crosby, sócio da Susan Godfrey e principal advogado do jornal. A declaração diz, em parte:
“Construir novos produtos não é desculpa para violar a lei de direitos autorais, e é exatamente isso que a OpenAI fez em uma escala sem precedentes.
“Neste registro, a OpenAI não contesta – nem pode – que copiou milhões das obras do Times para construir e alimentar seus produtos comerciais sem nossa permissão.
“O que a OpenAI erroneamente caracteriza como ‘hackeamento’ é simplesmente usar os produtos da OpenAI para procurar evidências de que eles roubaram e reproduziram as obras protegidas por direitos autorais do Times. E é exatamente isso que encontramos. Na verdade, a escala da cópia da OpenAI é muito maior do que os mais de 100 exemplos apresentados na reclamação.
“Não deve ser surpresa para a OpenAI que a cópia ilegal e a desinformação sejam recursos centrais de seus produtos e não o resultado de um comportamento marginal.
“A OpenAI, que foi sigilosa e deliberadamente escondeu como seus produtos operam, agora afirma que é tarde demais para entrar com uma ação por violação ou responsabilizá-los. Discordamos. É digno de nota que a OpenAI não contesta que copiou obras do Times sem permissão dentro do prazo de prescrição para treinar seus modelos mais recentes e atuais.”
A OpenAI construiu seu negócio raspando grandes porções da internet. Artistas, autores, jornalistas e cineastas tiveram seus trabalhos sugados pelos raspadores da web da empresa; esse trabalho então foi usado para treinar os algoritmos geradores de conteúdo de alta octanagem da empresa. Muitos criativos decidiram processar a empresa.
No entanto, muitas dessas ações legais até agora fracassaram. O processo do Times foi considerado um dos ataques legais mais promissores ao modelo de negócios da indústria de IA, que alguns críticos se referiram como “roubo”. A OpenAI tem tentado continuamente fazer com que o processo do jornal seja arquivado.