Google irá extrair partes de inteligência artificial de comunidades do Reddit em acordo de $60 milhões: Relatório.

Segundo informações, o Reddit assinou um acordo de $60 milhões com o Google para permitir que suas comunidades online sejam analisadas para dados de treinamento de IA. O Google irá vasculhar milhões de postagens no Reddit e treinar um modelo de linguagem grande nos tópicos do Reddit. O acordo de conteúdo foi inicialmente relatado pela Bloomberg, mas não identificou a “grande empresa de IA” que está recebendo os dados.

O Reddit está supostamente considerando abrir seu capital com uma avaliação de $5 bilhões, apesar de ter gerado apenas $800 milhões em receita no ano passado. O Reddit não é lucrativo, mas tem uma avaliação alta porque suas comunidades online oferecem um terreno de treinamento ideal para modelos de IA. No entanto, licenciar os pensamentos e ideias de sua base de usuários nem sempre é bem aceito. Os subreddits mais populares entraram em protesto no ano passado depois que os usuários se incomodaram com a cobrança de acesso à API da empresa, anunciada em abril de 2023.

O acordo reportado do Reddit com o Google é exatamente o que a plataforma estava procurando. As grandes empresas de tecnologia estão sedentas por dados, o que transformou organizações de notícias tradicionais, fóruns comunitários e até mesmo a Universidade de Michigan em meras fazendas de conteúdo. Esses acordos, embora perturbadores para os usuários, oferecem ao Reddit um caminho para a rentabilidade.

“O corpus de dados do Reddit é realmente valioso”, disse o CEO do Reddit, Steve Huffman, ao The New York Times em abril. “Mas não precisamos dar todo esse valor para algumas das maiores empresas do mundo de graça.”

No entanto, quando o Reddit começou a cobrar pelo acesso à API, não cobrou apenas grandes empresas, mas também começou a cobrar pequenos pesquisadores independentes. Essa mudança tornou mais difícil para os moderadores do Reddit gerenciarem suas comunidades, e alguns argumentaram que isso prejudicou a experiência para os 800 milhões de usuários ativos mensais do Reddit.

O Reddit não respondeu imediatamente ao pedido de comentário do Gizmodo.

A Apple estava explorando acordos de IA de $50 milhões com The New York Times, Condé Nast e outros publishers de notícias em dezembro. O Shutterstock também está licenciando seu conteúdo feito por humanos para a OpenAI para treinar seus modelos. O Twitter, Instagram e YouTube também se tornaram cada vez mais valiosos nos últimos anos, agora vistos como minas de ouro de conteúdo.

A plataforma também introduziu anúncios nos últimos anos e tornou impossível para os usuários optarem por não ver o conteúdo do anunciante em 2023. À medida que o Reddit se torna uma empresa pública, há uma crescente preocupação dos usuários de que a administração prejudicará o próspero fórum da comunidade que construiu.

Há também uma preocupação maior sobre como as empresas de IA estão licenciando dados. As plataformas de conteúdo estão assinando acordos de licenciamento de milhões de dólares com empresas de IA, mas as pessoas reais que criaram esse conteúdo não estão ganhando nada. Enquanto isso, a IA ameaça substituir os criadores de conteúdo nas indústrias editoriais, de design gráfico e cinematográfica.