Como teste da ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma bolsa de criptomoedas, identificando 52 cadeias de transações suspeitas que acabaram entrando nessa bolsa. A bolsa, descobriu-se, já havia sinalizado 14 das contas que haviam recebido aqueles fundos por atividade ilícita suspeita, incluindo oito marcadas como associadas a lavagem de dinheiro ou fraude, com base em parte nas informações de conheça seu cliente que havia solicitado aos proprietários das contas. Apesar de não ter acesso a esses dados de conheça seu cliente ou qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores havia coincidido com as conclusões dos próprios investigadores da bolsa.
Identificar corretamente 14 das 52 contas de clientes como suspeitas pode não parecer uma taxa de sucesso alta, mas os pesquisadores apontam que apenas 0,1% das contas da bolsa são sinalizadas como possíveis lavagem de dinheiro no geral. Eles argumentam que sua ferramenta automatizada essencialmente reduziu a busca por contas suspeitas para mais de uma em quatro. “Ir de ‘um em mil coisas que olhamos são ilícitas’ para 14 em 52 é uma mudança louca,” diz Mark Weber, um dos coautores do artigo e um pesquisador do Media Lab do MIT. “E agora os investigadores vão realmente olhar para o restante para ver, espera, será que perdemos alguma coisa?”
A Elliptic diz que já vem utilizando o modelo de IA de forma privada em seu próprio trabalho. Como mais evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que analisar a origem dos fundos de algumas cadeias de transações suspeitas identificadas pelo modelo ajudou-os a descobrir endereços Bitcoin controlados por um mercado na dark web russo, um “mixer” de criptomoedas projetado para obscurecer o rastro de bitcoins na blockchain, e um esquema Ponzi baseado no Panamá. (A Elliptic se recusou a identificar quaisquer desses supostos criminosos ou serviços pelo nome, dizendo à WIRED que não identifica alvos de investigações em andamento.)
Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site comunitário de aprendizado de máquina e ciência de dados da Google, Kaggle. “A Elliptic poderia ter mantido isso para si mesma,” diz Weber do MIT. “Em vez disso, houve muito um ethos de código aberto aqui de contribuir algo para a comunidade que permitirá a todos, até mesmo seus concorrentes, serem melhores em antibranqueamento de capitais.” A Elliptic destaca que os dados liberados são anonimizados e não contêm quaisquer identificadores dos donos dos endereços Bitcoin ou até mesmo os próprios endereços, apenas os dados estruturais dos “subgráficos” de transações marcados com suas classificações de suspeita de lavagem de dinheiro.
Essa enorme quantidade de dados certamente inspirará e permitirá muito mais pesquisa focada em IA sobre lavagem de dinheiro de bitcoin, diz Stefan Savage, professor de ciência da computação na Universidade da Califórnia San Diego, que atuou como consultor do autor principal de um artigo seminal de rastreamento de bitcoin publicado em 2013. Ele argumenta, no entanto, que a ferramenta atual não parece provável que revolucione os esforços de antibranqueamento de capitais em cripto em sua forma atual, tanto quanto servir como uma prova de conceito. “Um analista, eu acho, terá dificuldade com uma ferramenta que está meio certa às vezes,” Savage diz. “Eu vejo isso como um avanço que diz, ‘Ei, tem algo aqui. Mais pessoas deveriam trabalhar nisso.’”