Nesta história, após pausar a capacidade do modelo de inteligência artificial da Google de gerar imagens de pessoas, a empresa está reintroduzindo a funcionalidade. Na quarta-feira, a Google mencionou que trará de volta a geração de imagens de pessoas do Gemini nos próximos dias, com acesso antecipado para usuários de língua inglesa dos serviços pagos Gemini Advanced, Business e Enterprise.
“Trabalhamos para fazer melhorias técnicas no produto, bem como melhoramos conjuntos de avaliação, exercícios de red teaming e princípios claros do produto”, disse Dave Citron, diretor sênior de gerenciamento de produtos da Google.
Com seu mais recente modelo de geração de imagens, o Imagen 3, que impulsiona alguns dos aplicativos do Gemini, a Google aparentemente “fez progressos significativos na melhoria da experiência do usuário ao gerar imagens de pessoas”, disse Citron. O gerador de imagens não permite aos usuários gerar indivíduos “fotorrealistas, identificáveis, representações de menores, ou cenas excessivamente sangrentas, violentas ou sexuais”.
Em fevereiro, a Google interrompeu a funcionalidade depois que os usuários apontaram que o Gemini estava gerando imagens historicamente imprecisas de pessoas, incluindo soldados alemães da era nazista racialmente diversos.
“O gerador de imagens de IA do Gemini gera uma ampla gama de pessoas”, disse a Google em um comunicado na época. “E isso geralmente é algo bom porque pessoas ao redor do mundo o utilizam. Mas está errando o alvo aqui.”
O CEO da Google, Sundar Pichai, chamou as respostas do Gemini de “completamente inaceitáveis” e disse que a empresa “errou” em um memorando para os funcionários.
A gigante da tecnologia continuará recebendo feedback sobre a ferramenta de geração de imagens de usuários antecipados e planeja disponibilizá-la para mais usuários e idiomas, disse Citron.
A empresa também está lançando os Gems, uma funcionalidade apresentada em sua conferência anual de desenvolvedores I/O em maio, para usuários do Gemini Advanced, Business e Enterprise. Os Gems têm a finalidade de permitir aos usuários personalizar o modelo de IA da Google para criar “especialistas de IA pessoais em qualquer assunto”.