Um Vasto Novo Conjunto De Dados Poderia Impulsionar a Caça da IA Por Lavagem De Dinheiro Em Criptomoedas

Como teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma exchange de criptomoedas – que o artigo não menciona – identificando 52 cadeias de transações suspeitas que, no final, fluíram para essa exchange. A exchange, na verdade, já havia sinalizado 14 das contas que haviam recebido esses fundos por atividade ilícita suspeita, incluindo oito marcadas como associadas à lavagem de dinheiro ou fraude, com base em parte nas informações de análise do cliente solicitadas pelos proprietários de contas. Apesar de não ter acesso a esses dados de análise do cliente ou a qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores coincidiu com as conclusões dos próprios investigadores da exchange.

Identificar corretamente 14 de 52 contas de clientes como suspeitas pode não parecer uma taxa de sucesso alta, mas os pesquisadores apontam que apenas 0,1% das contas da exchange são sinalizadas como potencial lavagem de dinheiro no geral. Eles argumentam que sua ferramenta automatizada reduziu efetivamente a busca por contas suspeitas para mais de um em quatro. “Passar de ‘uma entre mil coisas que analisamos vão ser ilícitas’ para 14 de 52 é uma mudança louca”, diz Mark Weber, um dos coautores do artigo e colaborador do MIT Media Lab. “E agora os investigadores vão olhar para o restante daqueles para ver, espera, será que perdemos algo?”

A Elliptic diz que já está usando o modelo de IA em seu próprio trabalho de forma privada. Como mais evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que ao analisar a origem dos fundos de algumas cadeias de transações suspeitas identificadas pelo modelo, descobriram endereços Bitcoin controlados por um mercado da dark web russo, um “misturador” de criptomoedas projetado para obscurecer o rastro de bitcoins na blockchain, e um esquema Ponzi baseado no Panamá.

Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores, seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquina e ciência de dados Kaggle, adquirido pelo Google. “A Elliptic poderia ter mantido isso para si mesma”, diz Weber, do MIT. “Em vez disso, houve muito uma ética de código aberto aqui, contribuindo algo para a comunidade que permitirá a todos, até mesmo seus concorrentes, serem melhores na prevenção à lavagem de dinheiro.” A Elliptic observa que os dados liberados são anonimizados e não contêm quaisquer identificadores dos proprietários de endereços Bitcoin ou até mesmo os próprios endereços, apenas os dados estruturais dos “subgráficos” de transações marcadas com suas classificações de suspeita de lavagem de dinheiro.

Essa enorme quantidade de dados, sem dúvida, inspirará e permitirá muito mais pesquisas centradas em IA sobre lavagem de dinheiro com Bitcoin, diz Stefan Savage, professor de ciência da computação na Universidade da Califórnia San Diego, que atuou como consultor do autor principal de um artigo seminal sobre rastreamento de bitcoins publicado em 2013. No entanto, ele argumenta que a ferramenta atual não parece provável de revolucionar os esforços de prevenção à lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como prova de conceito. “Um analista, acredito, terá dificuldade com uma ferramenta que está correta às vezes”, diz Savage. “Eu vejo isso como um avanço que diz: ‘Ei, há algo aqui. Mais pessoas deveriam trabalhar nisso’.”