Um Novo Conjunto De Dados Poderia Impulsionar A Caça Da AI Por Lavagem De Dinheiro Em Criptomoedas

Como teste da sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma exchange de criptomoedas – que o artigo não menciona – identificando 52 cadeias suspeitas de transações que acabaram todas fluindo para essa exchange. A exchange, descobriu-se, já havia sinalizado 14 das contas que haviam recebido esses fundos por atividades ilícitas suspeitas, incluindo oito que havia marcado como associadas a lavagem de dinheiro ou fraude, com base em parte nas informações de conhecimento do cliente que havia solicitado aos proprietários das contas. Apesar de não ter acesso a esses dados de conhecimento do cliente ou qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores havia correspondido às conclusões dos próprios investigadores da exchange.

Identificar corretamente 14 de 52 dessas contas de clientes como suspeitas pode não parecer uma taxa de sucesso alta, mas os pesquisadores observam que apenas 0,1% das contas da exchange são sinalizadas como possíveis lavagem de dinheiro no geral. Eles argumentam que sua ferramenta automatizada havia essencialmente reduzido a busca por contas suspeitas para mais de um em quatro. “Ir de ‘um em mil coisas que olhamos serão ilícitas’ para 14 de 52 é uma mudança louca”, diz Mark Weber, um dos coautores do artigo e pesquisador do MIT Media Lab. “E agora os investigadores vão realmente investigar o restante para ver, espera, será que perdemos alguma coisa?”

A Elliptic diz que já vem usando o modelo de IA em seu próprio trabalho privado. Como mais uma evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que analisar a origem dos fundos para algumas cadeias de transações suspeitas identificadas pelo modelo os ajudou a descobrir endereços de Bitcoin controlados por um mercado dark web russo, um “misturador” de criptomoedas projetado para obscurecer o rastro de bitcoins na blockchain, e um esquema Ponzi baseado no Panamá. (A Elliptic se recusou a identificar quaisquer desses criminosos ou serviços por nome, dizendo à WIRED que não identifica os alvos de investigações em andamento.)

Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores, no entanto, seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquina e ciência de dados Elliptic, de propriedade do Google. “A Elliptic poderia ter mantido isso para si”, diz Weber, do MIT. “Em vez disso, houve muito um ethos de código aberto aqui de contribuir algo para a comunidade que permitirá que todos, até mesmo seus concorrentes, sejam melhores na prevenção à lavagem de dinheiro.” A Elliptic observa que os dados que liberou são anonimizados e não contêm identificadores dos proprietários dos endereços de Bitcoin ou mesmo dos próprios endereços, apenas os dados estruturais dos “subgrafos” de transações que ele marcou com suas classificações de suspeita de lavagem de dinheiro.

Essa enorme coleção de dados sem dúvida inspirará e possibilitará muito mais pesquisas centradas em IA sobre lavagem de dinheiro de bitcoins, diz Stefan Savage, professor de ciência da computação na Universidade da Califórnia San Diego, que atuou como conselheiro do autor principal de um artigo seminal sobre rastreamento de bitcoins publicado em 2013. Ele argumenta, no entanto, que a ferramenta atual não parece provável de revolucionar os esforços anti-lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como prova de conceito. “Um analista, acredito, terá dificuldade com uma ferramenta que está certa às vezes”, diz Savage. “Vejo isso como um avanço que diz: ‘Ei, há algo aqui. Mais pessoas deveriam trabalhar nisso.'”