Como teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma exchange de criptomoedas – que o artigo não menciona – identificando 52 cadeias de transações suspeitas que, eventualmente, fluíram para essa exchange. Verificou-se que a exchange já havia sinalizado 14 das contas que haviam recebido esses fundos por atividade ilícita suspeita, incluindo oito marcadas como associadas a lavagem de dinheiro ou fraude, com base em parte nas informações de conhecimento do cliente solicitadas aos proprietários das contas. Apesar de não ter acesso a esses dados de conhecimento do cliente ou a informações sobre a origem dos fundos, o modelo de IA dos pesquisadores havia coincidido com as conclusões dos próprios investigadores da exchange.
Identificar corretamente 14 de 52 dessas contas de clientes como suspeitas pode não soar como uma taxa de sucesso alta, mas os pesquisadores apontam que apenas 0,1% das contas da exchange são sinalizadas como potencial lavagem de dinheiro no geral. Eles argumentam que sua ferramenta automatizada, essencialmente, reduziu a busca por contas suspeitas para mais de um quarto. “Ir de ‘uma em cada mil coisas que olhamos serão ilícitas’ para 14 de 52 é uma mudança louca”, diz Mark Weber, um dos coautores do artigo e membro do Media Lab do MIT. “E agora os investigadores vão realmente analisar o restante para ver, esperar, será que perdemos algo?”
A Elliptic diz que já vem usando o modelo de IA de forma privada em seu trabalho. Como mais evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que ao analisar a fonte de fundos para algumas cadeias de transações suspeitas identificadas pelo modelo, eles descobriram endereços de Bitcoin controlados por um mercado da dark web russo, um “mixer” de criptomoedas projetado para obscurecer a trilha de bitcoins na blockchain e um esquema Ponzi baseado no Panamá. (A Elliptic se recusou a identificar qualquer um desses supostos criminosos ou serviços por nome, dizendo à WIRED que não identifica os alvos de investigações em andamento.)
Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquina e ciência de dados de propriedade da Google, o Kaggle. “A Elliptic poderia ter guardado isso para si mesma”, diz Weber do MIT. “Em vez disso, houve muito um ethos de código aberto aqui de contribuir com algo para a comunidade que permitirá a todos, mesmo seus concorrentes, serem melhores na prevenção à lavagem de dinheiro.” A Elliptic observa que os dados que liberou são anonimizados e não contêm nenhum identificador dos proprietários de endereços de Bitcoin ou até mesmo os próprios endereços, apenas os dados estruturais dos “subgráficos” de transações que marcou com suas classificações de suspeita de lavagem de dinheiro.
Essa enorme quantidade de dados sem dúvida vai inspirar e possibilitar muito mais pesquisas focadas em IA para lavagem de dinheiro de bitcoin, diz Stefan Savage, professor de ciência da computação da Universidade da Califórnia San Diego que atuou como conselheiro do autor principal de um artigo seminal de rastreamento de bitcoin publicado em 2013. Ele argumenta, no entanto, que a ferramenta atual não parece provável que revolucione os esforços de prevenção à lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como uma prova de conceito. “Um analista, eu acho, vai ter dificuldade com uma ferramenta que está certa às vezes”, diz Savage. “Vejo isso como um avanço que diz: ‘Ei, há algo aqui. Mais pessoas deveriam trabalhar nisso'”.