Em um teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma exchange de criptomoedas, identificando 52 sequências de transações suspeitas que, no final, fluíram para essa exchange. A exchange, que não foi nomeada no artigo, já havia sinalizado 14 das contas que receberam esses fundos por atividades ilícitas suspeitas, incluindo oito marcadas como associadas à lavagem de dinheiro ou fraude, com base, em parte, nas informações de identificação de clientes exigidas pelos proprietários das contas. Apesar de não ter acesso a esses dados de identificação de clientes ou a qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores coincidiu com as conclusões dos próprios investigadores da exchange.
Identificar corretamente 14 das 52 contas de clientes como suspeitas pode não parecer uma taxa de sucesso alta, mas os pesquisadores ressaltam que apenas 0,1% das contas da exchange são sinalizadas como potenciais lavagem de dinheiro no geral. Eles argumentam que sua ferramenta automatizada essencialmente reduziu a busca por contas suspeitas para mais de um quarto. “Ir de ‘um em mil coisas que olhamos vão ser ilícitas’ para 14 de 52 é uma mudança absurda,” diz Mark Weber, um dos coautores do artigo e membro do MIT Media Lab. “E agora os investigadores vão realmente analisar o restante dessas contas para ver, espera, será que perdemos algo?”
A Elliptic diz que já está utilizando o modelo de IA em seu próprio trabalho de forma privada. Como evidência adicional de que o modelo de IA está produzindo resultados úteis, os pesquisadores afirmam que analisar a origem dos fundos de algumas transações suspeitas identificadas pelo modelo os ajudou a descobrir endereços Bitcoin controlados pelo mercado dark-web russo, um “misturador” de criptomoedas projetado para obscurecer o rastro de bitcoins na blockchain, e um esquema Ponzi baseado no Panamá. (A Elliptic se recusou a identificar quaisquer desses supostos criminosos ou serviços pelo nome, dizendo à WIRED que não identifica os alvos de investigações em andamento).
Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquina e ciência de dados Kaggle, de propriedade do Google. “A Elliptic poderia ter guardado isso para eles mesmos,” diz Weber do MIT. “Ao invés disso, houve muito um ethos de código aberto aqui de contribuir com algo para a comunidade que permitirá a todos, inclusive seus concorrentes, serem melhores em anti-lavagem de dinheiro.” A Elliptic observa que os dados que liberaram são anonimizados e não contêm nenhum identificador dos proprietários dos endereços Bitcoin ou mesmo dos endereços em si, apenas os dados estruturais dos “subgrafos” de transações marcadas com suas classificações de suspeita de lavagem de dinheiro.
Essa enorme coleção de dados, sem dúvida, inspirará e permitirá muito mais pesquisa focada em IA sobre lavagem de dinheiro de bitcoins, diz Stefan Savage, professor de ciência da computação na Universidade da Califórnia em San Diego, que atuou como conselheiro do autor principal de um artigo seminal de rastreamento de bitcoins publicado em 2013. Ele argumenta, no entanto, que a ferramenta atual não parece provável de revolucionar os esforços de anti-lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como uma prova de conceito. “Um analista, eu acho, vai ter dificuldade com uma ferramenta que está quase correta às vezes,” diz Savage. “Vejo isso como um avanço que diz, ‘Ei, há algo aqui. Mais pessoas devem trabalhar nisso.'”