OpenAI enfrentou um problema comum para geradores de imagens de IA quando lançou amplamente um novo recurso de edição para o ChatGPT’s DALL-E neste mês. Muitas vezes, os geradores de imagens de IA entendem erroneamente o que você deseja criar, então a nova ferramenta da OpenAI permite que você destaque seções da sua imagem e as altere de acordo com suas especificações. A ferramenta parece ótima na teoria, mas na prática deixa a desejar.
O Gizmodo fez alguns testes com a nova ferramenta de edição do DALL-E, que é muito semelhante ao recurso de preenchimento generativo do Adobe Photoshop, Firefly. Embora o DALL-E da OpenAI seja um dos melhores geradores de imagens de IA do mercado, a ferramenta de edição é um tanto decepcionante. Idealmente, uma ferramenta de edição de fotos deve permitir que você altere as coisas que estão erradas em uma imagem. Descobrimos que a ferramenta de edição do DALL-E muitas vezes se recusa ou simplesmente falha em produzir o que você pede. Em alguns casos, ela chega a arruinar completamente a foto.
A ferramenta destaca um fator limitante importante para geradores de imagens de IA: eles não têm ideia do que estão criando. Em um momento ao usar o recurso de edição do DALL-E, o ChatGPT me disse: “Infelizmente, não posso editar imagens diretamente ou alterar elementos específicos dentro delas.” Isso porque a IA não sabe o que criou. Ela não consegue identificar se há um primeiro plano, um plano de fundo ou até mesmo o que diz uma placa que ela criou.
Portanto, o recurso de edição não está realmente “editando” a foto. Na verdade, está editando sua solicitação e gerando uma nova foto cada vez na área que você especificar. O resultado é que o recurso de edição do DALL-E não oferece a precisão e o controle que você esperaria de uma ferramenta de edição.
Você precisa entender as limitações do DALL-E para usar a ferramenta de edição. Para aproveitá-la ao máximo, é realmente necessário usar instruções claras e pedir apenas por mudanças bastante simples. Colocar um chapéu de aniversário em alguém, transformar uma cena de dia para noite ou outras mudanças simples rotineiramente funcionaram em nossos testes, embora mudanças mais complicadas não tenham dado certo.
Para ser justo, esse é o caso de todas as ferramentas de edição em geradores de imagens de IA no momento. Elas estão gerando algo novo a cada vez, e isso pode distorcer sua imagem. Embora o editor funcione em circunstâncias limitadas, ele não oferece a personalização que você pode esperar. Aqui estão nossos testes com o editor de imagens do DALL-E.