Perplexity deseja mudar a forma como usamos a internet, mas a startup de busca de IA apoiada por Jeff Bezos pode estar quebrando suas regras para fazer isso. A empresa aparentemente está ignorando um padrão da web amplamente aceito, o Protocolo de Exclusão de Robôs, para raspar partes da web que os operadores não desejam que os bots acessem, de acordo com um relatório do desenvolvedor Robb Knight nesta semana que foi confirmado pela Wired.
O serviço da Perplexity resume artigos na web, alegando fornecer “respostas confiáveis” sem a necessidade de clicar em links diferentes. Para fazer isso, a Wired e o Knight descobriram que a Perplexity ignora código (arquivos robots.txt) deliberadamente escritos para bloquear rastreadores da web. Os dois relatórios descobriram que a Perplexity usa um endereço IP não listado para contornar esses arquivos robots.txt e raspar os sites de qualquer maneira. A Wired afirma que seu site bloqueou o rastreador web da Perplexity no início de 2024, mas o mecanismo de busca de IA ainda é capaz de resumir seus artigos detalhadamente.
Apesar disso, a Perplexity afirma respeitar o Protocolo de Exclusão de Robôs na documentação em seu site. O CEO da Perplexity, Aravind Srinivas, disse à Wired que os repórteres tinham “um profundo e fundamental mal-entendido sobre como a Perplexity e a Internet funcionam”, mas não contestaram diretamente os resultados. A Gizmodo entrou em contato com a Perplexity para pedir uma resposta mais detalhada e irá atualizar o artigo se obtiver uma resposta.
Separadamente, a Perplexity está enfrentando ameaças legais por quebrar outras regras da internet: violação de direitos autorais. A Forbes reportadamente ameaçou entrar com ação legal contra a Perplexity nesta semana, depois de acusar a startup de IA de plagiar relatórios da Forbes sem a devida atribuição. A Forbes havia feito relatórios originais sobre a iniciativa de drones de IA do ex-CEO do Google, Eric Schmidt, e a Perplexity criou artigos, podcasts e vídeos gerados por IA utilizando texto e imagens da Forbes. O editor-executivo da Forbes criticou a Perplexity recentemente.
O produto da Perplexity, embora útil, redireciona o tráfego na internet. O Google também indexa páginas da web e oferece resumos de IA, mas direciona o tráfego diretamente para as páginas da web de onde vêm as informações. A Perplexity efetivamente está escrevendo artigos detalhados de IA, fazendo com que os usuários não cliquem nos sites, o que quebra o modelo de negócios da mídia digital.
A OpenAI estabeleceu parcerias com empresas de mídia para lidar com isso, pagando antecipadamente para licenciar o conteúdo, e a Perplexity estaria trabalhando em parcerias de conteúdo semelhantes, mas em vez de pagar uma taxa fixa pelo conteúdo como a OpenAI, a Perplexity pretendia compartilhar a receita. Mas essas parcerias ainda não existem, então, por enquanto, a Perplexity parece estar pulando paywalls e raspando sites para obter todas as informações necessárias para alimentar suas respostas de IA.