Uma plataforma de chatbot de IA chamada Poe, de propriedade do site de perguntas e respostas Quora e apoiada por um investimento de $75 milhões da Andreessen Horowitz, está fornecendo aos usuários arquivos HTML para download de artigos publicados por veículos jornalísticos com paywall.
Ao informar o bot do serviço com o URL desta história da WIRED sobre o serviço de busca alimentado por IA Perplexity plagiando uma de suas histórias, por exemplo, os usuários recebem um resumo detalhado de 235 palavras e um arquivo de 1 MB contendo uma captura HTML de todo o artigo, que pode ser baixado diretamente dos servidores do Poe através do chatbot.
A WIRED também conseguiu recuperar artigos de sites com paywall, incluindo The New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector e 404 Media em um formato que pode ser baixado simplesmente inserindo URLs na interface do bot do Assistente. Isso parece ser apenas o mais recente exemplo da abordagem despreocupada da indústria de IA com a lei de propriedade intelectual, que está minando rapidamente os modelos de negócios existentes em áreas como jornalismo e música.
“Esta é uma questão de direitos autorais significativa,” escreveu James Grimmelmann, professor de direito digital e da informação da Universidade de Cornell, em um e-mail. “Porque eles fizeram uma cópia em seu próprio servidor, isso é, à primeira vista, uma violação de direitos autorais.” (Quora discorda disso, comparando o Poe a um serviço de armazenamento em nuvem).
Ao ser solicitado a resumir o conteúdo de um site de teste controlado por um colega chamado Dhruv Mehrotra, o bot não retornou um resumo, mas sim um arquivo HTML. De acordo com os logs do servidor do site, imediatamente após o bot do Assistente ser solicitado a resumir o site, um servidor se identificando como “Quora Bot” visitou o site. Não houve tentativa de acessar a página robots.txt do site, sugerindo que o Poe e o Quora ignoram o Protocolo de Exclusão de Robôs, um padrão web amplamente aceito, embora não legalmente vinculativo.
Um executivo de mídia proeminente, a quem a WIRED concedeu anonimato para discutir francamente um assunto legalmente sensível que sua empresa está investigando ativamente, diz que sua publicação também observou servidores se identificando como bots do Quora acessando seu site imediatamente após dar prompts ao chatbot do Poe sobre artigos específicos; esses prompts, segundo ele, resultaram em grande parte ou todo o texto desses artigos.
“O Poe é uma plataforma que permite aos usuários fazer perguntas e ter diálogos com uma variedade de bots alimentados por IA fornecidos por terceiros,” escreveu a porta-voz do Quora, Autumn Besselman, em um e-mail. “Não temos nem treinamos nossos próprios modelos de IA. O Poe tem um recurso que permite a um usuário mostrar o conteúdo de uma URL a um bot, mas o bot só verá o conteúdo que é servido pelo domínio. Ficaríamos felizes em nos conectar com sua equipe técnica para ajudá-los a garantir que seu conteúdo com paywall não seja servido às pessoas que utilizam o Poe.”
“Os anexos de arquivos no Poe são criados sob orientação dos usuários e operam de maneira semelhante a serviços de armazenamento em nuvem, serviços de ‘leia mais tarde’ e produtos de ‘recorte da web’, que acreditamos estarem em conformidade com a lei de direitos autorais,” escreveu Besselman em resposta a um e-mail com perguntas adicionais. A Andreessen Horowitz não respondeu a um pedido de comentários.