A Figure AI e a OpenAI uniram esforços para aprimorar o robô humanoide Figure-01, tornando-o mais inteligente e interativo. Em uma demonstração recente, o robô foi capaz de conversar diretamente com um humano, seguir comandos e até descrever detalhes do que estava vendo, por meio da tecnologia de reconhecimento visual.
No vídeo disponível no canal oficial da Figure, é possível ver o Figure-01 atuando como um chatbot com corpo, cabeça, braços e pernas. Assim como o ChatGPT, o robô recebe instruções, analisa o ambiente ao seu redor e responde de forma apropriada.
Questionado sobre o que estava vendo, o robô respondeu com precisão, identificando uma maçã vermelha em um prato, um escorredor com copos e pratos, e o humano de pé com a mão apoiada na mesa. Em seguida, o humano pede algo para comer e o Figure-01 entrega a maçã. Posteriormente, o homem coloca lixo na mesa e pede para o robô limpar, explicando o motivo de ter oferecido a fruta.
O robô rapidamente começa a recolher o lixo em uma cesta e explica que ofereceu a maçã por ser o único item comestível na mesa. Quando questionado sobre onde colocar o prato, o Figure-01 decide que deve ser colocado no escorredor, incluindo o copo ao lado.
Por fim, ao ser perguntado sobre seu desempenho nas tarefas, o Figure-01 considera ter feito um bom trabalho, mencionando que a maçã encontrou seu novo dono, o lixo sumiu e a mesa está organizada.
O robô Figure-01 demonstra o potencial dos modelos de linguagem da OpenAI ao executar tarefas simples enquanto interage naturalmente com um humano. Sua capacidade de identificar e responder ao ambiente à sua frente em tempo real destaca o avanço dos modelos de linguagem, como o ChatGPT. Isso é possível graças a um novo modelo de linguagem visual, o VLM, que confere habilidades quase humanas à máquina.
O desenvolvimento do modelo de linguagem visual é resultado da parceria entre Figure e OpenAI, combinando influências de outros projetos importantes de empresas especializadas em robótica. A evolução constante dos robôs, como o Figure-01 aprendendo a fazer café sozinho apenas observando um humano, nos faz vislumbrar um futuro mais próximo da ficção científica, como o descrito no livro “Eu, Robô” de Isaac Asimov.