Um Vasto Novo Conjunto de Dados Poderia Potencializar a Busca por Lavagem de Dinheiro em Criptomoedas através de IA

Como um teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma bolsa de criptomoedas – que o artigo não nomeia – identificando 52 cadeias de transações suspeitas que, no final, fluíram para essa bolsa. A bolsa, como se viu, já havia sinalizado 14 das contas que haviam recebido esses fundos por atividades ilícitas suspeitas, incluindo oito marcadas como associadas a lavagem de dinheiro ou fraude, com base em parte nas informações de conhecimento do cliente solicitadas pelos proprietários das contas. Apesar de não ter acesso a esses dados do conhecimento do cliente ou qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores coincidiu com as conclusões dos próprios investigadores da bolsa.

Identificar corretamente 14 de 52 dessas contas de clientes como suspeitas pode não parecer uma alta taxa de sucesso, mas os pesquisadores apontam que apenas 0,1% das contas da bolsa são sinalizadas como possíveis lavagem de dinheiro como um todo. Eles argumentam que sua ferramenta automatizada essencialmente reduziu a busca por contas suspeitas para mais de um em quatro. “Passar de ‘um em mil coisas que olhamos serão ilícitas’ para 14 de 52 é uma mudança louca”, diz Mark Weber, um dos coautores do artigo e bolsista do Media Lab do MIT. “E agora os investigadores vão realmente investigar o restante para ver se perdemos algo?”

A Elliptic diz que já vem usando o modelo de IA em seu próprio trabalho de forma privada. Como evidência adicional de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que analisar a origem dos fundos de algumas cadeias de transações suspeitas identificadas pelo modelo os ajudou a descobrir endereços Bitcoin controlados por um mercado ilegal russo da dark web, um “misturador” de criptomoedas projetado para obscurecer o rastro de bitcoins na blockchain, e um esquema Ponzi baseado no Panamá. (A Elliptic se recusou a identificar quaisquer desses criminosos ou serviços pelo nome, dizendo à WIRED que não identifica alvos de investigações em andamento.)

Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores, no entanto, seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquina e ciência de dados de propriedade do Google, Kaggle. “A Elliptic poderia ter mantido isso para si mesma”, diz Weber do MIT. “Em vez disso, houve muito um ethos de código aberto aqui de contribuir algo para a comunidade que permitirá a todos, até mesmo seus concorrentes, serem melhores em anti-lavagem de dinheiro”. A Elliptic observa que os dados que liberou são anonimizados e não contêm quaisquer identificadores dos proprietários de endereços Bitcoin ou mesmo dos próprios endereços, apenas os dados estruturais dos “subgrafos” de transações que ela classificou com suas avaliações de suspeita de lavagem de dinheiro.

Esse enorme tesouro de dados sem dúvida inspirará e permitirá muito mais pesquisas focadas em IA sobre a lavagem de dinheiro de bitcoins, diz Stefan Savage, professor de ciência da computação da Universidade da Califórnia em San Diego, que atuou como consultor do autor principal de um artigo seminal de rastreamento de bitcoins publicado em 2013. Ele argumenta, no entanto, que a ferramenta atual não parece provável que revolucione os esforços anti-lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como uma prova de conceito. “Um analista, eu acredito, terá dificuldade com uma ferramenta que está certa às vezes”, diz Savage. “Eu vejo isso como um avanço que diz ‘Ei, há algo aqui. Mais pessoas deveriam trabalhar nisso'”.