DALL-E da OpenAI Mostra Recurso de Edição e Como a IA Ainda não Substituirá seu Photoshop.

A OpenAI enfrentou um problema comum para os geradores de imagem de IA quando lançou amplamente um novo recurso de edição para o ChatGPT’s DALL-E neste mês. Muitas vezes, os geradores de imagem de IA não entendem o que você deseja criar, então a nova ferramenta da OpenAI permite que você destaque seções de sua imagem e as altere de acordo com suas especificações. A ferramenta soa ótima na teoria, mas na prática, deixa algo a desejar.

O Gizmodo realizou alguns testes da nova ferramenta de edição do DALL-E, que é muito semelhante ao recurso de preenchimento generativo do Adobe Photoshop, Firefly. Embora o DALL-E da OpenAI seja um dos melhores geradores de imagem de IA do mercado, a ferramenta de edição é um pouco decepcionante. Idealmente, uma ferramenta de edição de fotos deve permitir que você mude as coisas que estão erradas em uma imagem. Em grande parte, descobrimos que a ferramenta de edição do DALL-E se recusa ou simplesmente falha em produzir o que você pede. Em alguns casos, ela arruína completamente a foto.

A ferramenta destaca um fator limitante-chave para os geradores de imagem de IA: eles não têm ideia do que estão criando. Em um momento ao usar o recurso de edição do DALL-E, o ChatGPT me disse: “Infelizmente, não consigo editar diretamente imagens ou alterar elementos específicos dentro delas”. Isso ocorre porque a IA não sabe o que criou. Ela não consegue dizer se há um primeiro plano, um plano de fundo ou até mesmo o que diz um sinal que criou.

Portanto, o recurso de edição não está realmente “editando” a foto. Na verdade, está editando sua solicitação e gerando uma nova foto a cada vez na área que você especificar. O resultado é que o recurso de edição do DALL-E não oferece a precisão e o controle que você esperaria de uma ferramenta de edição.

Você precisa entender as limitações do DALL-E para usar a ferramenta de edição. Para obter o máximo dela, é realmente necessário usar instruções claras e pedir apenas alterações bastante simples. Colocar um chapéu de aniversário em alguém, transformar uma cena de dia para noite ou outras mudanças simples funcionaram rotineiramente em nossos testes, embora mudanças mais complicadas não tenham funcionado.

Para ser justo, este é o caso de todas as ferramentas de edição nos geradores de imagem de IA no momento. Elas estão gerando algo novo a cada vez, e isso pode distorcer sua imagem. Embora o editor funcione em circunstâncias limitadas, ele não oferece a personalização que você pode esperar. Aqui estão nossos testes com o editor de imagens do DALL-E.