Como teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma exchange de criptomoedas – que o artigo não nomeia – identificando 52 cadeias de transações suspeitas que eventualmente fluíram para essa exchange. A exchange, constatou-se, já havia sinalizado 14 das contas que haviam recebido esses fundos por atividade ilícita suspeita, incluindo oito marcadas como associadas à lavagem de dinheiro ou fraude, com base em parte nas informações know-your-customer solicitadas aos proprietários das contas. Apesar de não ter acesso a esses dados know-your-customer ou a qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores havia confirmado as conclusões dos próprios investigadores da exchange.
Identificar corretamente 14 de 52 contas de clientes como suspeitas pode não parecer uma alta taxa de sucesso, mas os pesquisadores destacam que apenas 0,1% das contas da exchange são sinalizadas como potencial lavagem de dinheiro no geral. Sua ferramenta automatizada, argumentam, basicamente reduziu a busca por contas suspeitas para mais de um em quatro. “Passar de ‘um em mil coisas que olhamos vão ser ilícitas’ para 14 de 52 é uma mudança louca”, diz Mark Weber, um dos coautores do artigo e fellow do MIT Media Lab. “E agora os investigadores vão realmente analisar o restante para ver, espera, será que perdemos algo?”
A Elliptic afirma que já está usando o modelo de IA privadamente em seu próprio trabalho. Como mais evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que analisar a origem dos fundos para algumas cadeias de transações suspeitas identificadas pelo modelo os ajudou a descobrir endereços de Bitcoin controlados por um mercado da dark web russo, um “misturador” de criptomoedas projetado para obfuscar o rastro de bitcoins na blockchain, e um esquema de Ponzi baseado no Panamá. (A Elliptic se recusou a identificar quaisquer desses supostos criminosos ou serviços pelo nome, dizendo à WIRED que não identifica os alvos de investigações em curso.)
Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores, no entanto, seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquina e ciência de dados de propriedade do Google, Kaggle. “A Elliptic poderia ter mantido isso para si”, diz Weber do MIT. “Em vez disso, houve muito um ethos de código aberto aqui de contribuir algo para a comunidade que permitirá a todo mundo, inclusive seus concorrentes, ser melhor em anti-lavagem de dinheiro.” A Elliptic destaca que os dados que divulgou são anonimizados e não contêm quaisquer identificadores dos proprietários dos endereços de Bitcoin ou mesmo dos próprios endereços, apenas os dados estruturais dos “subgráficos” de transações marcadas com suas classificações de suspeita de lavagem de dinheiro.
Essa enorme quantidade de dados sem dúvida irá inspirar e permitir muito mais pesquisa focada em IA sobre lavagem de dinheiro de bitcoin, diz Stefan Savage, professor de ciência da computação da Universidade da Califórnia em San Diego, que serviu como conselheiro do autor principal de um artigo seminal de rastreamento de bitcoin publicado em 2013. Ele argumenta, no entanto, que a ferramenta atual não parece susceptível de revolucionar os esforços anti-lavagem de dinheiro em cripto em sua forma atual, mas sim servir como uma prova de conceito. “Um analista, eu acho, terá dificuldade com uma ferramenta que está meio certa às vezes”, diz Savage. “Vejo isso como um avanço que diz, ‘Ei, há uma coisa aqui. Mais pessoas deveriam trabalhar nisso.'”