Após a OpenAI surpreender o mundo com o gerador de vídeos Sora, pesquisadores do DeepMind, subsidiária do Google focada em inteligência artificial, apresentaram o “Genie AI”. Este é capaz de criar ambientes virtuais jogáveis a partir de imagens e prompts de texto.
O modelo foi treinado por mais de 200.000 horas com plataformas 2D disponíveis gratuitamente na internet, o que o torna capaz de interpretar conteúdos visuais e criar espaços completamente interativos, capazes de gerar pixels conforme a progressão de cenário do “jogador”.
“Estou muito animado para revelar o que a equipe Open Endedness do Google DeepMind tem feito. Apresentamos Genie, um ‘modelo mundial fundamental’ treinado exclusivamente a partir de vídeos da Internet que pode gerar uma variedade infinita de ambientes 2D controláveis por ação, a partir de prompts de imagem”, diz um comunicado.
O Genie ainda não possui a mesma qualidade de imagem ou produz resultados realistas como Sora, mas tem impressionado bastante alguns especialistas em IA. Ele já é considerado um avanço importante rumo à inteligência artificial geral, uma das metas dos pesquisadores da área.
Além de gerar ambientes jogáveis, o Genie do Google pode ser utilizado para outras aplicações, como auxiliar robôs a navegar de forma mais eficiente em cenários complexos. O que mais chama a atenção é a capacidade de compreender e replicar com alto grau de fidelidade as interações dos jogadores em diferentes tipos de jogos.
Outro ponto interessante é o sistema de aprendizagem não supervisionado do Genie. Durante o treinamento, o modelo não utiliza dados rotulados, mas é capaz de absorver o conteúdo e identificar padrões de relacionamento por conta própria.
Assim como o gerador de vídeos Sora, a inteligência artificial desenvolvida pelo DeepMind está gerando preocupações em relação à possível extinção de empregos, especialmente no setor de desenvolvimento de jogos eletrônicos.