A OpenAI enfrentou um problema comum para os geradores de imagem de IA ao lançar amplamente um novo recurso de edição para o ChatGPT’s DALL-E este mês. Muitas vezes, os geradores de imagens de IA entendem mal o que você quer criar, então a nova ferramenta da OpenAI permite que você destaque seções da sua imagem e as altere de acordo com suas especificações. A ferramenta parece ótima na teoria, mas na prática deixa algo a desejar.
O Gizmodo realizou alguns testes com a nova ferramenta de edição do DALL-E, que é muito semelhante ao recurso de preenchimento generativo do Adobe Photoshop, Firefly. Embora o DALL-E da OpenAI seja um dos melhores geradores de imagens de IA do mercado, a ferramenta de edição é um tanto decepcionante. Idealmente, uma ferramenta de edição de fotos deve permitir que você altere as coisas erradas em uma imagem. Descobrimos em grande parte que a ferramenta de edição do DALL-E se recusa ou simplesmente falha em produzir o que você pede. Em alguns casos, ele arruína completamente a foto.
A ferramenta destaca um fator limitante chave para os geradores de imagens de IA: eles não têm ideia do que estão criando. Em um momento ao usar o recurso de edição do DALL-E, o ChatGPT me disse: “Infelizmente, eu não posso editar imagens diretamente ou alterar elementos específicos dentro delas.” Isso porque a IA não sabe o que criou. Ela não pode dizer se há um primeiro plano, um plano de fundo ou até mesmo o que uma placa que criou diz.
Portanto, o recurso de edição não está realmente “editando” a foto. Na verdade, está editando seu prompt e gerando uma nova foto a cada vez na área que você especificar. O resultado é que o recurso de edição do DALL-E não oferece a precisão e o controle que você esperaria de uma ferramenta de edição.
Você precisa entender as limitações do DALL-E para usar a ferramenta de edição. Para aproveitá-la ao máximo, é preciso usar instruções claras e pedir apenas por mudanças bastante simples. Colocar um chapéu de aniversário em alguém, transformar uma cena do dia para a noite ou outras mudanças simples funcionaram rotineiramente em nossos testes, embora mudanças mais complicadas não funcionassem.
Para ser justo, este é o caso de todas as ferramentas de edição em geradores de imagens de IA no momento. Eles estão gerando algo novo a cada vez, e isso pode distorcer sua imagem. Embora o editor funcione em circunstâncias limitadas, ele não oferece a personalização que você poderia esperar. Aqui estão nossos testes com o editor de imagens do DALL-E.