WordPress e Tumblr Planejam Vender Conteúdo de Usuários para Empresas de AI

A empresa-mãe da WordPress e Tumblr, a Automattic, está em negociações para vender conteúdo de suas plataformas para empresas de inteligência artificial, como a MidJourney e a OpenAI, para fins de treinamento, de acordo com um novo relatório da 404 Media. Enquanto os detalhes do acordo ainda são incertos, a Automattic está tentando tranquilizar os usuários de que eles podem optar por não participar a qualquer momento.

Segundo a 404 Media, há conflitos dentro da Automattic, pois alguns conteúdos que estavam sendo coletados pelas empresas de IA incluíam conteúdo privado não destinado a ser salvo pela empresa. Para complicar ainda mais, conteúdos publicitários que nem sequer são de propriedade da Automattic, incluindo propagandas de uma antiga campanha da Apple Music, também teriam entrado no conjunto de dados de treinamento.

Os planos da Automattic têm sido tão controversos internamente que um gerente de produto chegou a remover suas próprias fotos do Tumblr para garantir que elas não sejam usadas para treinar IA, segundo a 404.

A IA generativa se tornou um grande negócio desde que a OpenAI lançou o ChatGPT no final de 2022 e logo depois surgiram criadores de imagens acionados por texto de várias empresas. A tecnologia funciona sendo “treinada” em enormes quantidades de dados, o que permite gerar vídeos, imagens ou texto que parecem originais. No entanto, importantes editoras têm reclamado, com algumas até entrando com ações judiciais, alegando que grande parte dos dados usados para treinar esses sistemas foi pirateada ou não constitui “uso justo” sob regimes de direitos autorais existentes.

A Automattic planeja introduzir uma nova configuração já nesta quarta-feira que permitirá aos usuários optarem por não permitir que seus dados sejam usados para treinar sistemas de IA, de acordo com a 404 Media, mas não está claro se a configuração será ativada ou desativada por padrão para a maioria dos usuários. O concorrente do WordPress, Squarespace, introduziu uma configuração semelhante para optar por não permitir que seus dados sejam usados para treinar IA no ano passado.

Em resposta a perguntas por e-mail na terça-feira, a Automattic direcionou o Gizmodo para uma nova postagem que mais ou menos confirmou o relatório da 404 Media, enquanto tentava vender a mudança aos consumidores como uma oportunidade de “dar mais controle sobre o conteúdo que você criou”.

“IA está transformando rapidamente quase todos os aspectos do nosso mundo, incluindo a forma como criamos e consumimos conteúdo. Na Automattic, sempre acreditamos em uma web livre e aberta e na escolha individual. Como outras empresas de tecnologia, estamos acompanhando de perto esses avanços, inclusive como trabalhar com empresas de IA de uma forma que respeite as preferências de nossos usuários”, diz a postagem do blog.

Mas a declaração longa soa incrivelmente defensiva, observando que “não existe uma lei que exija que os crawlers sigam essas preferências” e sugere que a empresa está simplesmente seguindo as melhores práticas do setor para dar aos usuários a opção de decidir se desejam que seu conteúdo seja usado para treinamento de IA.

“Nossas parcerias respeitarão todas as configurações de exclusão. Também planejamos ir além e atualizar regularmente os parceiros sobre pessoas que desejarem ser excluídas e pedir que seu conteúdo seja removido de fontes passadas e futuros treinamentos.”