Poe, uma plataforma de chatbot de inteligência artificial de propriedade do site de perguntas e respostas Quora e apoiada por um investimento de $75 milhões da Andreessen Horowitz, está fornecendo aos usuários arquivos HTML de artigos publicados por veículos jornalísticos com paywall.
Ao solicitar ao bot Assistente do serviço o URL desta história da WIRED sobre o serviço de busca alimentado por IA Perplexity plagiando uma de nossas histórias, por exemplo, é gerado um resumo detalhado de 235 palavras e um arquivo de 1 MB contendo uma captura HTML de todo o artigo, que os usuários podem baixar diretamente dos servidores do Poe através do chatbot.
A WIRED também foi capaz de recuperar artigos de sites com paywall, incluindo The New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector e 404 Media em formato de download simplesmente inserindo URLs na interface do bot Assistente. Isso parece ser apenas o mais recente exemplo da abordagem leviana da indústria de IA à lei de propriedade intelectual, que está minando rapidamente os modelos de negócios existentes em campos como o jornalismo e a música.
“Este é um problema significativo de direitos autorais”, escreveu James Grimmelmann, professor de direito digital e da informação na Universidade Cornell, em um e-mail. “Porque eles fizeram uma cópia em seu próprio servidor, isso é uma violação de direitos autorais prima facie.” (Quora contesta isso, comparando Poe a um serviço de armazenamento na nuvem.)
Quando solicitado a resumir o conteúdo de um site de teste controlado pelo meu colega Dhruv Mehrotra, o bot não retornou um resumo, mas sim um arquivo HTML. De acordo com os logs do servidor do site, imediatamente após o bot Assistente ser solicitado a resumir o site, um servidor se identificando como “Quora Bot” visitou o site. Ele não tentou visitar a página robots.txt do site, sugerindo que Poe e Quora ignoram o Protocolo de Exclusão de Robôs, um padrão web amplamente aceito, embora não legalmente vinculante.
Um executivo de mídia proeminente, ao qual a WIRED concedeu anonimato para discutir francamente um assunto legalmente sensível que sua empresa está investigando ativamente, diz que sua publicação também observou servidores se identificando como bots da Quora acessando seu site imediatamente após dar prompts ao chatbot de Poe sobre artigos específicos; esses prompts, ele diz, renderam grande parte ou todo o texto desses artigos.
“Poe é uma plataforma que permite aos usuários fazer perguntas e ter diálogos com uma variedade de chatbots alimentados por IA fornecidos por terceiros”, escreveu a porta-voz da Quora, Autumn Besselman, em um e-mail. “Não temos nem treinamos nossos próprios modelos de IA. Poe possui um recurso que permite ao usuário mostrar o conteúdo de um URL a um bot, mas o bot só verá o conteúdo que é servido pelo domínio. Ficaríamos felizes em nos conectar com sua equipe técnica para ajudá-los a garantir que seu conteúdo com paywall não seja servido às pessoas usando Poe.”
“Os anexos de arquivo no Poe são criados sob a direção dos usuários e funcionam de forma semelhante aos serviços de armazenamento na nuvem, serviços de ‘leitura posterior’ e produtos ‘web clipper’, que acreditamos estarem todos de acordo com a lei de direitos autorais”, escreveu Besselman em resposta a um e-mail com perguntas de acompanhamento. A Andreessen Horowitz não respondeu a um pedido de comentário.