Como Evitar as Armadilhas Comuns ao Comprar um Carro Usado

Poe, uma plataforma de chatbot de IA de propriedade do site de perguntas e respostas Quora e apoiada por um investimento de $75 milhões da Andreessen Horowitz, está fornecendo aos usuários arquivos HTML para download de artigos publicados por veículos jornalísticos com paywall.

Ao solicitar ao bot Assistente o URL desta história da WIRED sobre o serviço de busca alimentado por IA Perplexity plagiando uma de nossas histórias, por exemplo, você receberá um resumo detalhado de 235 palavras e um arquivo de 1 MB contendo uma captura HTML do artigo inteiro, o qual os usuários podem baixar diretamente dos servidores do Poe através do chatbot.

A WIRED também foi capaz de recuperar artigos de sites com paywall como The New York Times, Bloomberg Businessweek, The Atlantic, Forbes, Defector e 404 Media em um formato de download simplesmente inserindo URLs na interface do bot Assistente. Isso parece ser apenas o mais recente exemplo da abordagem descuidada da indústria de IA em relação à lei de propriedade intelectual, que está minando rapidamente os modelos de negócios existentes em áreas como jornalismo e música.

“Este é um problema de direitos autorais significativo”, escreveu James Grimmelmann, professor de Direito Digital e da Informação da Universidade de Cornell, em um e-mail. “Porque eles fizeram uma cópia em seu próprio servidor, isso é uma violação de direitos autorais prima facie”. (Quora contesta isso, comparando Poe a um serviço de armazenamento na nuvem).

Quando solicitado a resumir o conteúdo de um site de teste controlado pelo meu colega Dhruv Mehrotra, o bot não retornou um resumo, mas sim um arquivo HTML. De acordo com os logs do servidor do site, imediatamente após o bot Assistente ser solicitado a resumir o site, um servidor se identificando como “Quora Bot” visitou o site. Não tentou visitar a página robots.txt do site, sugerindo que Poe e Quora ignoram o Protocolo de Exclusão de Robôs, um padrão da web amplamente aceito, embora não legalmente vinculativo.

Um executivo de mídia proeminente, ao qual a WIRED concedeu anonimato para discutir francamente uma questão legalmente sensível que sua empresa está investigando ativamente, afirma que sua publicação também observou servidores se identificando como bots do Quora acessando seu site imediatamente após dar instruções ao chatbot do Poe sobre artigos específicos; essas instruções, diz ele, resultaram na maior parte ou em todo o texto desses artigos.

“O Poe é uma plataforma que permite aos usuários fazer perguntas e ter diálogos com vários bots alimentados por IA fornecidos por terceiros”, escreveu a porta-voz do Quora, Autumn Besselman, em um e-mail. “Não possuímos nem treinamos nossos próprios modelos de IA. O Poe possui um recurso que permite ao usuário mostrar o conteúdo de um URL para um bot, mas o bot só verá o conteúdo que é servido pelo domínio. Teremos o prazer de entrar em contato com sua equipe técnica para ajudá-los a garantir que seu conteúdo com paywall não seja servido para pessoas que usam o Poe”.

“Os anexos de arquivo no Poe são criados sob a direção dos usuários e funcionam de maneira semelhante aos serviços de armazenamento na nuvem, serviços de ‘leia mais tarde’ e produtos de ‘clipe da web’, os quais consideramos consistentes com a lei de direitos autorais”, Besselman escreveu em resposta a um e-mail com perguntas adicionais. Andreessen Horowitz não respondeu a um pedido de comentário.