Como teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma exchange de criptomoedas – que o artigo não nomeia – identificando 52 cadeias de transações suspeitas que, eventualmente, fluíram para aquela exchange. A exchange, por sua vez, já havia marcado 14 das contas que haviam recebido esses fundos por atividades ilícitas suspeitas, incluindo oito marcadas como associadas à lavagem de dinheiro ou fraudes, com base em parte nas informações de conheça seu cliente solicitadas pelos donos das contas. Apesar de não ter acesso a esses dados de conheça seu cliente ou a informações sobre a origem dos fundos, o modelo de IA dos pesquisadores apresentou conclusões correspondentes às dos próprios investigadores da exchange.
Identificar corretamente 14 das 52 contas de clientes como suspeitas pode não parecer uma taxa de sucesso alta, mas os pesquisadores apontam que apenas 0,1% das contas da exchange são marcadas como possíveis lavagem de dinheiro no geral. Eles argumentam que sua ferramenta automatizada basicamente reduziu a busca por contas suspeitas para mais de um em quatro. “Passar de ‘um em mil coisas que olhamos vão ser ilícitas’ para 14 de 52 é uma mudança impressionante,” diz Mark Weber, um dos coautores do artigo e fellow no Media Lab do MIT. “E agora os investigadores vão realmente olhar para o restante para ver, espera, será que perdemos alguma coisa?”
A Elliptic afirma que já está usando o modelo de IA em seu próprio trabalho de forma privada. Como mais evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores mencionam que a análise da origem dos fundos de algumas cadeias de transações suspeitas identificadas pelo modelo os ajudou a descobrir endereços de Bitcoin controlados por um mercado dark-web russo, um “mixer” de criptomoedas projetado para obscurecer a trilha de bitcoins na blockchain, e um esquema Ponzi com base no Panamá. (A Elliptic se recusou a identificar quaisquer desses criminosos ou serviços pelo nome, dizendo à WIRED que não identifica os alvos de investigações em andamento).
Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de machine learning e ciência de dados Kaggle, pertencente ao Google. “A Elliptic poderia ter mantido isso para si mesma,” diz Weber do MIT. “Em vez disso, houve muito um ethos de código aberto aqui, contribuindo algo para a comunidade que permitirá a todos, mesmo seus concorrentes, serem melhores em prevenção à lavagem de dinheiro.” A Elliptic observa que os dados que lançou são anonimizados e não contêm identificadores dos donos dos endereços de Bitcoin nem dos próprios endereços, apenas os dados estruturais dos “subgrafos” de transações marcados com suas avaliações de suspeita de lavagem de dinheiro.
Essa enorme quantidade de dados, sem dúvida, inspirará e permitirá muito mais pesquisas focadas em IA na lavagem de dinheiro em Bitcoin, diz Stefan Savage, professor de ciência da computação na Universidade da Califórnia em San Diego, que atuou como consultor do autor principal de um artigo seminal de rastreamento de bitcoins publicado em 2013. No entanto, ele argumenta que a ferramenta atual não parece provável de revolucionar os esforços de prevenção à lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como uma prova de conceito. “Um analista, eu acredito, terá dificuldade com uma ferramenta que está meio certa às vezes,” diz Savage. “Eu vejo isso como um avanço que diz, ‘Hey, há algo aqui. Mais pessoas deveriam trabalhar nisso.'”