Nesta História
À medida que a ByteDance desenvolve modelos de inteligência artificial para competir na China, o bot que ela usa para coletar dados e treinar esses modelos está supostamente aumentando sua atividade.
O proprietário do TikTok lançou seu próprio web scraper, Bytespider, em abril, e agora está coletando dados várias vezes mais rápido do que os bots de outras empresas, relatou a Fortune, citando pesquisas da Kasada, uma empresa de gerenciamento de bots, e Dark Visitors, um monitor de scraper bots. Empresas que desenvolvem modelos de IA, como Google (GOOGL) e Meta (META), usam scraper bots para reunir dados e aprimorar os grandes modelos de linguagem (LLMs) e modelos multimodais que alimentam os serviços de IA das empresas.
O Bytespider está coletando dados da web cerca de 25 vezes mais rápido do que o web scraper da OpenAI, o GPTbot, disse Sam Crowther, CEO da Kasada, à Fortune. Em comparação com o ClaudeBot da Anthropic, o Bytespider é 3.000 vezes mais rápido.
Assim como os bots da OpenAI e da Anthropic, o Bytespider ignora as instruções do robots.txt, uma linha de código não legalmente vinculativa que informa aos web scrapers quais dados podem ou não acessar em um site, relatou a Fortune. De acordo com os dados da Kasada, o Bytespider teve picos de atividade de coleta nos últimos seis semanas.
“É como se estivessem tentando desesperadamente se equiparar”, disse Crowther à Fortune.
A ByteDance não respondeu imediatamente a um pedido de comentário.
A empresa sediada na China lançou seu chatbot alimentado por IA, Doubao, em agosto passado, e tem se mostrado um concorrente difícil para o rival local Baidu, o Ernie Bot. Em maio, a ByteDance lançou uma série de Doubao LLMs para empresas, que são mais baratos do que os modelos de empresas chinesas da companhia.
Agora, a ByteDance está planejando construir um novo modelo de IA usando chips da Huawei, relatou a Reuters, citando três pessoas não identificadas familiarizadas com o assunto. No entanto, um porta-voz da ByteDance disse anteriormente ao Quartz que a empresa não está desenvolvendo um novo modelo de IA.
A empresa também projetou dois chips de IA com a Taiwan Semiconductor Manufacturing Company (TSM) que a ByteDance pretende produzir em massa até 2026, informou o The Information, citando pessoas não identificadas familiarizadas com o assunto. Ao produzir seus próprios chips, a empresa pode se tornar menos dependente das caras unidades de processamento gráfico (GPUs) da Nvidia, que estão sujeitas a controles de exportação dos EUA, disseram as pessoas ao The Information.