De acordo com a Reuters na quinta-feira, o Reddit supostamente assinou um acordo de US$ 60 milhões com o Google para permitir que suas comunidades online sejam analisadas para dados de treinamento de AI. O Google vai vasculhar milhões de postagens no Reddit e treinar um grande modelo de linguagem nos tópicos do Reddit. O acordo de conteúdo foi originalmente divulgado pela Bloomberg, mas não identificou a “grande empresa de AI” recebendo os dados.
O Reddit está supostamente considerando abrir capital com uma avaliação de US$ 5 bilhões, apesar de ter arrecadado apenas US$ 800 milhões em receita no ano passado. O Reddit não é lucrativo, mas possui uma avaliação alta porque suas comunidades online oferecem um terreno de treinamento perfeito para modelos de AI. No entanto, licenciar os pensamentos e ideias de sua base de usuários nem sempre é bem recebido. Os subfóruns mais populares ficaram fora do ar em protesto no ano passado após os usuários discordarem da empresa cobrando pelo acesso à sua interface de programação de aplicativos (API), anunciada pela primeira vez em abril de 2023.
O acordo relatado do Reddit com o Google é exatamente o que a plataforma vinha procurando. As gigantes da tecnologia estão famintas por dados, o que transformou organizações de notícias tradicionais, fóruns comunitários e até a Universidade de Michigan em meras fazendas de conteúdo. Esses acordos, apesar de causarem desconforto aos usuários, oferecem ao Reddit um caminho para a lucratividade.
“O corpus de dados do Reddit é realmente valioso”, disse o CEO do Reddit, Steve Huffman, ao The New York Times em abril. “Mas não precisamos oferecer todo esse valor para algumas das maiores empresas do mundo de graça.”
No entanto, quando o Reddit começou a cobrar pelo acesso à API, não cobrou apenas grandes empresas, mas também começou a cobrar pequenos pesquisadores independentes. Essa mudança tornou mais difícil para os moderadores do Reddit gerenciarem suas comunidades, e alguns argumentaram que isso piorou a experiência para os 800 milhões de usuários mensais ativos do Reddit.
“Ac acreditamos que a longevidade e o sucesso desta plataforma dependem da preservação do rico ecossistema que se desenvolveu em torno dela”, afirmaram os moderadores do Reddit em uma carta coletiva de junho passado. “A possível perda desses serviços devido à mudança de preço impactaria significativamente nossa capacidade de moderar eficientemente, prejudicando assim a experiência dos usuários em nossas comunidades.”
O Reddit não respondeu imediatamente ao pedido de comentário do Gizmodo.
Em dezembro, a Apple estava explorando acordos de US$ 50 milhões com o The New York Times, Condé Nast e outras editoras de notícias. A Shutterstock também está licenciando seu conteúdo feito por humanos para a OpenAI para treinamento em seus modelos. Twitter, Instagram e YouTube também se tornaram cada vez mais valiosos nos últimos anos, pois são agora vistos como verdadeiras minas de ouro de conteúdo.
A plataforma também introduziu anúncios nos últimos anos e tornou impossível para os usuários optarem por não ver conteúdo de anunciantes em 2023. Conforme o Reddit se torna uma empresa pública, há uma crescente preocupação dos usuários de que a gestão possa prejudicar o próspero fórum comunitário que construiu.
Há também uma preocupação maior sobre como as empresas de AI estão licenciando dados. Plataformas de conteúdo estão assinando acordos de licenciamento milionários com empresas de AI, mas as pessoas reais que criaram esse conteúdo não estão recebendo nada. Enquanto isso, a AI ameaça substituir os criadores de conteúdo nas indústrias editorial, de design gráfico e cinematográfica.