Perplexidade Está Supostamente Permitindo Que Seu IA Quebre Uma Regra Básica da Internet

Perplexity deseja mudar a forma como utilizamos a internet, mas a startup de pesquisa de IA apoiada por Jeff Bezos pode estar quebrando suas regras para fazer isso. A empresa parece estar ignorando um padrão web amplamente aceito, o Protocolo de Exclusão de Robôs, para coletar partes da web que os operadores não desejam que sejam acessadas por bots, de acordo com um relatório do desenvolvedor Robb Knight nesta semana que foi confirmado pela Wired.

O serviço da Perplexity resume artigos na web, afirmando entregar “respostas confiáveis” sem a necessidade de clicar em diferentes links. Para fazer isso, a Wired e Knight descobriram que a Perplexity ignora o código (arquivos robots.txt) deliberadamente escritos para bloquear rastreadores da web. As duas reportagens descobriram que a Perplexity usa um endereço IP não listado para contornar esses arquivos robots.txt e coletar informações dos sites de qualquer maneira. A Wired afirma que seu website bloqueou o rastreador da web da Perplexity no início de 2024, mas o mecanismo de busca de IA ainda é capaz de resumir seus artigos em detalhes.

Apesar disso, a Perplexity afirma respeitar o Protocolo de Exclusão de Robôs na documentação em seu site. O CEO da Perplexity, Aravind Srinivas, disse à Wired que os repórteres tinham “um profundo e fundamental mal entendido sobre como a Perplexity e a Internet funcionam”, mas não contestou diretamente as descobertas. O Gizmodo entrou em contato com a Perplexity para pedir uma resposta mais detalhada e atualizará o artigo se recebermos uma resposta.

Separadamente, a Perplexity está enfrentando ameaças legais por quebrar outras regras da internet: violação de direitos autorais. A Forbes teria ameaçado ação legal contra a Perplexity esta semana, após acusar a startup de IA de plagiar relatórios da Forbes sem a devida atribuição. A Forbes havia feito reportagens originais sobre o antigo CEO do Google Eric Schmidt e aventureiro com drones de AI, e a Perplexity criou artigos, podcasts e vídeos gerados por AI usando o texto e as imagens da Forbes. O editor-executivo da Forbes criticou a Perplexity anteriormente no mês.

O produto da Perplexity, embora útil, desvia o tráfego na internet. O Google também indexa páginas da web e oferece breves resumos de AI, mas direciona o tráfego diretamente para as páginas da web de onde vêm as informações. A Perplexity efetivamente está escrevendo artigos detalhados de AI, tornando desnecessário que os usuários cliquem nos sites, o que quebra o modelo de negócios de mídia digital.

OpenAI estabeleceu parcerias com empresas de mídia para lidar com isso, pagando antecipadamente para licenciar conteúdo, e a Perplexity estaria trabalhando em parcerias semelhantes, mas em vez de pagar uma taxa fixa pelo conteúdo como a OpenAI, a Perplexity tinha como objetivo compartilhar receita. Mas essas parcerias ainda não existem, então por enquanto, a Perplexity parece estar driblando os paywalls e coletando informações dos sites para alimentar suas respostas de AI.