O Poe, uma plataforma de chatbot de IA de propriedade do site de perguntas e respostas Quora e apoiado por um investimento de $75 milhões da Andreessen Horowitz, está fornecendo aos usuários arquivos HTML para download de artigos publicados por veículos jornalísticos com paywall.
Ao solicitar ao bot Assistente do serviço o URL desta história da WIRED sobre o serviço de busca alimentado por IA Perplexity que plagiou uma de nossas histórias, por exemplo, ele fornece um resumo detalhado de 235 palavras e um arquivo de 1 MB contendo uma captura HTML do artigo completo, que os usuários podem baixar diretamente dos servidores do Poe através do chatbot.
A WIRED também conseguiu recuperar artigos de sites com paywall como The New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector e 404 Media em formato de download simplesmente inserindo URLs na interface do bot Assistente. Isso parece ser apenas o mais recente exemplo da abordagem despreocupada da indústria de IA com relação à lei de propriedade intelectual, que está minando rapidamente os modelos de negócios existentes em áreas como o jornalismo e música.
“Isso é um grande problema de direitos autorais”, escreveu James Grimmelmann, professor de direito digital e da informação na Universidade de Cornell, em um e-mail. “Porque eles fizeram uma cópia em seu próprio servidor, isso é prima facie uma violação de direitos autorais.” (Quora contesta isso, comparando o Poe a um serviço de armazenamento na nuvem).
Quando solicitado a resumir o conteúdo de um site de teste controlado pelo meu colega Dhruv Mehrotra, o bot não retorna um resumo, mas retorna um arquivo HTML. De acordo com os logs do servidor do site, imediatamente após o bot Assistente ser solicitado a resumir o site, um servidor se identificando como “Quora Bot” visitou o site. Ele não tentou visitar a página robots.txt do site, o que sugere que Poe e Quora ignoram o Protocolo de Exclusão de Robôs, um padrão da web amplamente aceito, embora não legalmente obrigatório.
Um executivo de mídia proeminente, a quem a WIRED concedeu anonimato para discutir francamente um assunto legalmente sensível que sua empresa está investigando ativamente, diz que sua publicação também observou servidores se identificando como bots do Quora acessando seu site imediatamente após dar prompts ao chatbot do Poe sobre artigos específicos; esses prompts, diz ele, resultaram em grande parte ou todo o texto desses artigos.
“O Poe é uma plataforma que permite aos usuários fazer perguntas e ter diálogos com vários bots alimentados por IA fornecidos por terceiros”, escreveu a porta-voz do Quora, Autumn Besselman, em um e-mail. “Nós não temos ou treinamos nossos próprios modelos de IA. O Poe tem um recurso que permite a um usuário mostrar o conteúdo de um URL para um bot, mas o bot só verá o conteúdo que é fornecido pelo domínio. Teremos o prazer de nos conectar com sua equipe técnica para ajudá-los a garantir que seu conteúdo com paywall não seja servido às pessoas que usam o Poe.”
“Os anexos de arquivo no Poe são criados por orientação dos usuários e operam de forma semelhante aos serviços de armazenamento em nuvem, serviços de ‘salvar para ler depois’ e produtos de ‘clipe de web’, que acreditamos serem todos consistentes com a lei de direitos autorais”, escreveu Besselman em resposta a um e-mail com perguntas de acompanhamento. Andreessen Horowitz não respondeu a um pedido de comentário.