O Poder das Palavras: Como Se Comunicar de Forma Eficaz

Nesta História

À medida que a ByteDance desenvolve modelos de inteligência artificial para competir na China, o bot que ela usa para extrair dados e treinar esses modelos está aumentando sua atividade.

A proprietária do TikTok lançou seu próprio web scraper, Bytespider, em abril, e agora está extraindo dados várias vezes mais rápido do que os bots de outras empresas, segundo um relatório da Fortune, citando pesquisas da Kasada, uma empresa de gerenciamento de bots, e Dark Visitors, um monitor de scraper bots. Empresas que desenvolvem modelos de IA, como Google e Meta, usam bots de extração para coletar dados e melhorar os grandes modelos de linguagem (LLMs) e modelos multimodais que alimentam os serviços de IA das empresas.

Bytespider está extraindo dados da web cerca de 25 vezes mais rápido do que o web scraper da OpenAI, o GPTbot, disse Sam Crowther, CEO da Kasada, à Fortune. Comparado com o ClaudeBot da Anthropic, o Bytespider é 3.000 vezes mais rápido.

Assim como os bots da OpenAI e da Anthropic, o Bytespider ignora as instruções do robots.txt, uma linha de código não vinculativa que informa aos web scrapers quais dados eles podem ou não acessar em um site, segundo a Fortune. De acordo com os dados da Kasada, o Bytespider teve picos de atividade de extração nas últimas seis semanas.

“É como se eles estivessem tentando desesperadamente encostar”, disse Crowther à Fortune.

A ByteDance não respondeu imediatamente a um pedido de comentário.

A empresa sediada na China lançou seu chatbot alimentado por IA, Doubao, em agosto passado, e tem provado ser um concorrente difícil para o concorrente doméstico Baidu’s Ernie Bot. Em maio, a ByteDance lançou uma série de Doubao LLMs para empresas, que custam menos do que os modelos dos concorrentes chineses da empresa.

Agora, a ByteDance planeja construir um novo modelo de IA usando chips da Huawei, informou a Reuters, citando três pessoas não identificadas familiarizadas com o assunto. No entanto, um porta-voz da ByteDance disse anteriormente ao Quartz que a empresa não está desenvolvendo um novo modelo de IA.

A empresa também projetou dois chips de IA com a Taiwan Semiconductor Manufacturing Company que a ByteDance planeja produzir em massa até 2026, informou The Information, citando pessoas não identificadas familiarizadas com o assunto. Ao produzir seus próprios chips, a empresa poderia se tornar menos dependente das caras unidades de processamento gráfico da Nvidia, que estão sujeitas a controles de exportação dos EUA, disseram pessoas à The Information.