Uma versão deste artigo originalmente apareceu no boletim informativo de fim de semana exclusivo para membros do Quartz. Os membros do Quartz têm acesso a boletins informativos exclusivos e muito mais. Inscreva-se aqui.
Em um vídeo de demonstração do Google DeepMind, um braço robótico dobra delicadamente origamis, embala lanches em sacos Ziploc e manipula objetos com grande precisão. Quando um item escorrega de sua garra, o robô rapidamente se reajusta e continua sua tarefa. Esses não são movimentos bruscos e predefinidos, mas algo mais fluido e adaptável – o resultado de um novo modelo de IA chamado Gemini Robotics que a empresa revelou no início deste mês.
Embora a demonstração se concentre em braços robóticos em vez de robôs humanoides completos, a tecnologia subjacente é a mesma que alimentará a próxima geração de máquinas em forma humana. O Google diz que seu modelo Gemini Robotics foi projetado para “se adaptar facilmente a diferentes tipos de robôs” e já está sendo testado com o robô humanoide Apollo da Apptronik.
“Para que a IA seja útil e auxilie as pessoas no mundo físico, elas têm que demonstrar um raciocínio ‘encarnado’ – a capacidade humana de compreender e reagir ao mundo ao nosso redor”, disse Carolina Parada, que lidera a equipe de robótica da DeepMind, em um comunicado.
A demonstração faz parte de uma nova onda de robôs humanoides de gigantes da tecnologia como Google e Meta, e startups como Figure AI e Agility Robotics. Eles estão sendo apresentados como o futuro da logística e das tarefas domésticas. Talvez nenhuma tecnologia de ficção científica, além de carros voadores, nos tenha excitado tanto e por tanto tempo quanto a promessa de robôs ajudantes que finalmente nos libertariam do trabalho doméstico (ok, essas histórias também nos assustaram em algumas ocasiões). Agora, equipados com modelos avançados de IA, esses trabalhadores mecânicos estão dando seus primeiros passos tímidos para sair de nossa imaginação e se tornar realidade.
Mas, enquanto a tecnologia avança, uma pergunta fundamental permanece: devemos construir robôs para o nosso mundo, ou adaptar nossos espaços para máquinas mais simples?
Os fabricantes desses robôs humanoides estão defendendo a primeira opção. Eles argumentam que o mundo é projetado para corpos humanos, afinal, com escadas, prateleiras na altura dos ombros e coisas importantes localizadas na altura dos olhos. Os defensores de robôs humanoides argumentam que essa é a forma mais lógica para máquinas destinadas a se integrar em ambientes existentes como nossas cozinhas.
Eles estão enfrentando uma batalha difícil contra os únicos robôs bem-sucedidos até agora, que são em sua maioria robôs não-humanoides em armazéns, onde os sistemas de prateleiras são projetados para robôs de picking com rodas ou áreas isoladas que são apenas para robôs. Esses ambientes construídos para fins específicos permitem designs de robôs muito mais simples.
Mas as empresas de robótica humanoides têm uma nova ferramenta poderosa na qual estão apostando que mudará tudo: sistemas de IA como o Gemini do Google e o GPT da OpenAI que entendem e geram fala humana. Essa tecnologia poderia permitir que as pessoas simplesmente conversem com os robôs como conversam com uma pessoa – “dobre aquela camisa” ou “coloque a louça” – sem a necessidade de programação especializada ou conhecimento técnico. Ainda mais promissor, esses modelos de IA podem ajudar os robôs a se adaptarem a novas situações para as quais não foram especificamente treinados, possivelmente resolvendo um dos desafios mais persistentes da robótica.
Apesar de demonstrações impressionantes e promessas grandiosas, a realidade atual é mais modesta. Os robôs ainda são lentos para nós em comparação e têm dificuldade com itens delicados ou maleáveis que mudam de forma quando agarrados. O caos imprevisível de um lar com crianças correndo, brinquedos espalhados pelo chão ou situações inesperadas, como encontrar chaves na geladeira – o que poderia ser uma terça-feira normal em muitos lares – permanecem cenários em grande parte não testados e muito além das capacidades atuais.
Esses problemas não estão impedindo as empresas de ao menos tentar. A Meta está supostamente construindo uma plataforma para robôs humanoides que seria “o Android dos androides”. Elon Musk, já sobrecarregado com muitos, muitos projetos, encontrou tempo para continuar falando sobre o robô humanoide Optimus da Tesla. Ele anunciou recentemente no X que pelo menos um de seus robôs estará a caminho de Marte até o final do próximo ano, superando os humanos por pelo menos alguns anos.
Mas permanecem outras barreiras significativas antes que esses robôs entrem em uso generalizado. Pesquisadores em interação humano-robô observaram que os seres humanos geralmente têm uma tolerância muito menor para erros de robôs do que para erros humanos. Estudos nesse campo mostram que, enquanto podemos perdoar um colega humano que ocasionalmente deixa cair itens, um robô que comete um único erro significativo pode perder permanentemente a confiança do usuário.
Essa questão de confiança se torna ainda mais complicada à medida que os robôs integram grandes modelos de linguagem, que são conhecidos por ocasionalmente “alucinar” ou gerar informações incorretas. Um robô que interpreta erroneamente um comando devido a uma alucinação do modelo de linguagem pode criar situações perigosas em ambientes físicos. Enquanto o erro de um assistente de bate-papo de IA pode ser apenas frustrante, um robô agindo com base em instruções alucinadas poderia danificar propriedades ou ferir pessoas.
Independentemente disso, bilhões de dólares continuam fluindo para a robótica humanoides de líderes de tecnologia que cresceram imersos na ficção científica e não querem desistir do sonho. Na conferência anual de desenvolvedores da Nvidia nesta semana, o CEO Jensen Huang mostrou um novo software que, segundo ele, ajudaria robôs humanoides a se movimentar mais facilmente em nossos espaços. Quando questionado posteriormente sobre quando saberemos que a IA se tornou ubíqua, ele disse que será quando robôs humanoides estiverem “passeando por aí”. E ele disse que isso está chegando em breve.
“Este não é um problema para daqui a cinco anos”, disse ele. “Este é um problema para daqui a alguns anos.”