Poe, uma plataforma de chatbot de IA de propriedade do site de perguntas e respostas Quora e apoiada por um investimento de US$ 75 milhões da Andreessen Horowitz, está fornecendo aos usuários arquivos HTML para download de artigos publicados por veículos jornalísticos com paywall.
Ao acionar o bot de Assistente do serviço com a URL desta matéria da WIRED sobre o serviço de busca alimentado por IA Perplexity plagiando uma de nossas histórias, por exemplo, resulta em um resumo detalhado de 235 palavras e um arquivo de 1 MB contendo uma captura HTML do artigo inteiro, que os usuários podem baixar dos servidores do Poe diretamente do chatbot.
A WIRED também conseguiu recuperar artigos de sites com paywall, incluindo The New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector e 404 Media, em formato de download simplesmente inserindo URLs na interface do bot do Assistente. Isso parece ser apenas o mais recente exemplo da abordagem leviana da indústria de IA à lei de propriedade intelectual, que está minando rapidamente os modelos de negócios existentes em áreas como o jornalismo e a música.
“Este é um problema de direitos autorais significativo”, escreveu James Grimmelmann, professor de direito digital e de informação na Universidade de Cornell, em um e-mail. “Porque eles fizeram uma cópia em seu próprio servidor, isso é uma violação de direitos autorais primafacie.” (Quora contesta isso, comparando Poe a um serviço de armazenamento na nuvem.)
Ao ser solicitado para resumir o conteúdo de um site de teste controlado pelo meu colega Dhruv Mehrotra, o bot não retornou um resumo, mas retornou um arquivo HTML. De acordo com os logs do servidor do site, imediatamente após o bot do Assistente ser solicitado a resumir o site, um servidor se identificando como “Bot do Quora” visitou o site. Ele não tentou visitar a página robots.txt do site, sugerindo que Poe e o Quora ignoram o Protocolo de Exclusão de Robôs, um padrão da web amplamente aceito, embora não legalmente vinculativo.
Um executivo de mídia proeminente, a quem a WIRED concedeu anonimato para discutir francamente um assunto legalmente sensível que sua empresa está investigando ativamente, diz que sua publicação também observou servidores se identificando como bots do Quora acessando seu site imediatamente após dar prompts ao chatbot do Poe sobre artigos específicos; esses prompts, ele diz, renderam grande parte ou a totalidade do texto desses artigos.
“Poe é uma plataforma que permite aos usuários fazer perguntas e ter um diálogo de ida e volta com uma variedade de bots alimentados por IA fornecidos por terceiros”, escreveu a porta-voz do Quora, Autumn Besselman, em um e-mail. “Não temos ou treinamos nossos próprios modelos de AI. Poe tem um recurso que permite a um usuário mostrar o conteúdo de uma URL a um bot, mas o bot só verá o conteúdo que é fornecido pelo domínio. Ficaríamos felizes em conectar com sua equipe técnica para ajudá-los a garantir que seu conteúdo com paywall não seja servido para pessoas usando Poe.”
“Os anexos de arquivo no Poe são criados a pedido dos usuários e operam de forma semelhante aos serviços de armazenamento na nuvem, serviços de ‘leia depois’ e produtos de ‘clipe da web’, que acreditamos estarem em conformidade com a lei de direitos autorais”, escreveu Besselman em resposta a um e-mail pedindo perguntas de acompanhamento. A Andreessen Horowitz não respondeu a um pedido de comentário.