OpenAI’s Recurso de Edição DALL-E Mostra Como IA Não Substituirá Seu Photoshop Ainda

A OpenAI enfrentou um problema comum para os geradores de imagens de IA quando lançou amplamente um novo recurso de edição para o ChatGPT’s DALL-E este mês. Muitas vezes, os geradores de imagens de IA não entendem o que você deseja criar, então a nova ferramenta da OpenAI permite que você destaque seções de sua imagem e as altere de acordo com suas especificações. A ferramenta parece ótima na teoria, mas na prática, deixa a desejar.

O Gizmodo realizou alguns testes com a nova ferramenta de edição do DALL-E, que é muito semelhante à ferramenta de preenchimento generativo do Adobe Photoshop, Firefly. Embora o DALL-E da OpenAI seja um dos melhores geradores de imagens de IA do mercado, a ferramenta de edição é um pouco decepcionante. Idealmente, uma ferramenta de edição de fotos deve permitir que você altere as coisas que estão erradas em uma imagem. Descobrimos amplamente que a ferramenta de edição do DALL-E se recusa ou simplesmente falha em produzir o que você pede. Em alguns casos, ela arruína completamente a foto.

A ferramenta destaca um fator limitante fundamental para os geradores de imagens de IA: eles não têm ideia do que estão fazendo. Em um momento, ao usar o recurso de edição do DALL-E, o ChatGPT me disse: “Infelizmente, não consigo editar imagens diretamente ou alterar elementos específicos dentro delas”. Isso acontece porque a IA não sabe o que criou. Ela não consegue identificar se há um primeiro plano, um plano de fundo ou mesmo o que diz uma placa que criou.

Portanto, o recurso de edição na verdade não está “editando” a foto. Ele está editando sua solicitação e gerando uma nova foto a cada vez na área que você especificar. O resultado é que o recurso de edição do DALL-E não oferece a precisão e o controle que se espera de uma ferramenta de edição.

Você precisa entender as limitações do DALL-E para usar a ferramenta de edição. Para aproveitá-la ao máximo, é necessário fornecer instruções claras e pedir mudanças bastante simples. Colocar um chapéu de aniversário em alguém, transformar uma cena de dia para noite ou outras mudanças simples funcionaram rotineiramente em nossos testes, embora mudanças mais complicadas não tenham funcionado.

Para ser justo, isso também se aplica a todas as ferramentas de edição nos geradores de imagens de IA no momento. Eles estão gerando algo novo a cada vez, o que pode distorcer sua imagem. Embora o editor funcione em circunstâncias limitadas, ele não oferece a personalização que você poderia esperar. Aqui estão nossos testes com o editor de imagens do DALL-E.