A Automattic, empresa-mãe de sites como WordPress e Tumblr, está em negociações para vender conteúdo de suas plataformas para empresas de IA como MidJourney e OpenAI para fins de treinamento, de acordo com um novo relatório da 404 Media. E enquanto os detalhes do acordo ainda são obscuros, a Automattic está tentando tranquilizar os usuários de que podem optar por sair a qualquer momento.
A 404 relata que há um conflito dentro da Automattic, já que parte do conteúdo que estava sendo coletado pelas empresas de IA incluía conteúdo privado não destinado a ser salvo pela empresa. Para complicar ainda mais, conteúdo publicitário que nem mesmo é de propriedade da Automattic, incluindo anúncios de uma antiga campanha da Apple Music, também teria chegado ao conjunto de dados de treinamento.
Os planos na Automattic têm sido tão controversos internamente que um gerente de produto até começou a retirar suas próprias fotos do Tumblr para garantir que elas não sejam usadas para treinar IA, de acordo com a 404.
A IA generativa se tornou um grande negócio desde que a OpenAI lançou o ChatGPT no final de 2022 e em seguida surgiram criadores de imagens a partir de texto de uma série de empresas. A tecnologia funciona sendo “treinada” em enormes quantidades de dados, o que permite gerar vídeos, imagens ou textos que parecem originais. Mas grandes editoras têm reclamado, com algumas até entrando com processos judiciais, alegando que grande parte dos dados usados para treinar esses sistemas foi pirateada ou não constitui “uso justo” sob regimes de direitos autorais existentes.
A Automattic planeja introduzir uma nova configuração já na quarta-feira que permitirá aos usuários optar por não permitir que seus dados sejam usados para treinar sistemas de IA, segundo a 404 Media, mas não está claro se a configuração estará ativada ou desativada por padrão para a maioria dos usuários. O concorrente do WordPress, Squarespace, introduziu uma configuração semelhante para não permitir que seus dados sejam usados para treinar IA no ano passado.
Em resposta a perguntas por e-mail na terça-feira, a Automattic direcionou o Gizmodo para uma nova postagem que mais ou menos confirmou o relatório da 404 Media, enquanto tentava vender a mudança para os consumidores como uma oportunidade de “dar a você mais controle sobre o conteúdo que você criou”.
“IA está transformando rapidamente quase todos os aspectos do nosso mundo, incluindo a maneira como criamos e consumimos conteúdo. Na Automattic, sempre acreditamos em uma web livre e aberta e em escolha individual. Assim como outras empresas de tecnologia, estamos acompanhando de perto esses avanços, incluindo como trabalhar com empresas de IA de uma maneira que respeite as preferências dos nossos usuários”, diz a postagem no blog.
Mas a declaração extensa soa incrivelmente defensiva, observando que “não existe lei que exija que rastreadores sigam essas preferências” e sugerindo que a empresa está apenas seguindo as melhores práticas da indústria para dar aos usuários a opção de decidir se desejam que seu conteúdo seja utilizado para treinar IA.
“Nossas parcerias respeitarão todas as configurações de exclusão. Também planejamos ir além e atualizar regularmente qualquer parceiro sobre pessoas que optaram recentemente pela exclusão e solicitar que seu conteúdo seja removido de fontes passadas e futuros treinamentos.”