Bora aprender sobre engenharia de prompt para criação de imagens, que é diferente de quando você está fazendo prompts para texto e outras atividades que você já deve ter visto aqui. A gente tem uma estrutura validada e utilizada, testada diversas vezes, que eu quero te apresentar. Também vou mostrar como esses prompts se comportam em diferentes ferramentas e fechar com dicas para você continuar aprendendo, além de uma técnica de como extrair prompts de um jeito bem relevante, que eu acho que tem pouca gente falando sobre isso.
O principal ponto na criação de imagens é que você pode fazer isso de duas maneiras: manualmente ou utilizando a IA para escrever seus prompts.
Sendo bem sincero, eu raramente escrevo meus prompts de imagem manualmente. O que eu faço é um formato de Vibe Prompt, que tem uma aula relacionada aqui para você aprender. Então você vai direcionando ali de forma mais natural, utilizando o seu jeito de falar, colocando referência, etc. A forma manual, que é o jeito tradicional e antigo, digamos assim, tem dois ou três anos no máximo, de estruturar os seus prompts. Mas é importante que você saiba por quê.
Mesmo se você utilizar a IA para fazer os seus prompts, você precisa saber se ele está funcionando ou não. Porque muitas vezes acontece de eu utilizar a Vibe Prompt, colocar ela na minha IA, mandar um áudio, mandar uma referência, e a IA escreve um prompt para mim, mas ele não funciona, não chega onde eu gostaria. Aí eu olho e sei onde corrigir, sei onde aquilo não vai funcionar. Em muitos casos, quando estou buscando algo mais experimental, mais original, o prompt manual também me garante isso.
Então isso dá a entender que saber fazer bons prompts manuais é algo importante para você, principalmente se busca trabalhar com imagens de forma mais profissional. Mas vamos lá! Prompts manuais. Qual é a estrutura que eu utilizo na grande maioria dos prompts que faço? Pensar a sua imagem com essa estrutura já vai ajudar bastante.
Primeira coisa: definir o Tipo de imagem que você quer fazer. É uma ilustração? É uma arte digital? É uma foto? É um retrato? É uma cena de filme? Parece meio óbvio, mas muitas pessoas não colocam isso e aí vem aquela imagem com uma cara de IA. Porque se você pede, por exemplo, uma mulher sentada numa cadeira, pense que a IA tem milhares, milhões de imagens que ela usa para se basear nessa criação.
E quando você não especifica se é uma foto ou uma ilustração, ela vai misturar tudo. Ela vai ver imagens de ilustrações, fotos, 3D de mulher numa cadeira e pega essa média para te entregar. Então a estética que você recebe não é nem 3D, nem ilustração, nem foto. Quando você chega e fala "quero um 3D de uma mulher", ela vai buscar nas imagens 3D essa base de criação.
Definir o tipo é bem importante, a não ser que você queira deixar isso aberto para a IA pirar. Outras definições essenciais:
- Assunto: Qual é a ideia, qual é o foco dessa sua imagem? Uma garota brasileira, um robô assistente, uma paisagem urbana, um grupo de amigos? O que vai lembrar? A primeira coisa que ela vai falar sobre sua imagem, se contar para alguém, esse é o seu assunto.
- Cenário e composição: Onde está o seu assunto? Em uma cidade cyberpunk, deitado em um gramado, sentado em um escritório? Quando você fala do background, fala da composição, pode usar um ângulo de câmera até nessa parte. E por fim,
- Estilo e detalhes: Aqui é o momento onde você traz mais personalidade para a sua imagem. Pode usar diversos elementos aqui, como por exemplo paleta de cores, um estilo específico de design e arquitetura, como a Bauhaus, um tipo de câmera, o tipo de lente, filme, tudo relacionado à direção criativa e estética que vai trazer mais personalidade para a imagem.
Quanto mais específico você for, melhor ainda. Quer uma imagem que quebre o padrão de beleza artificial que a IA sempre faz? É aqui que você vai colocar. Por exemplo, beleza natural, marcas de pele, suor, poros, todos esses elementos que vão direcionar sua imagem esteticamente, seja a paleta de cores ou que tragam imperfeições para sua imagem. Quanto mais elementos você colocar aqui, mais a sua imagem vai se diferenciar.
Então, tipo, assunto, cenário e composição, estilo e detalhes. Não necessariamente nessa ordem. O fato de organizar seu prompt não afeta tanto a geração da imagem, mas acho que essa é uma ordem lógica para você começar a pensar suas imagens utilizando engenharia de prompt manual.
Vamos ver alguns exemplos de como isso funciona? Preparei dois exemplos bem distintos. Um mais gráfico, que seria uma imagem de um robô segurando um pincel. O prompt está em inglês. É sempre melhor criar prompt em inglês se for usar ferramentas como Midjourney e Visual Electric. Embora funcionem em português, acho que o resultado é melhor em inglês, testei várias vezes e até agora é melhor. Farei uma tradução simultânea.
Um render 3D de um robô artista fofo segurando um pincel digital e um background clean na paleta de cores aquamarine e violeta — a paleta do CR_IA. Esse é o resultado do Midjourney V7 e aqui está a nossa estrutura de prompt: tipo, assunto, cenário e composição, estilo e detalhes. É um prompt simples, dá para colocar muito mais elementos, mas a ideia é entender o comportamento da IA.
Quero aproveitar para mostrar variações dentro do próprio Midjourney. Existem diversas aulas sobre Midjourney aqui, mas gosto de demonstrar isso no básico: se pegar esse mesmo prompt e usar meu código de personalização, ele vai gerar esse robô aqui, um estilo completamente diferente baseado na personalização do perfil V7, que foi o último lançado. Também tenho uma personalização do meu perfil V6, que é diferente. O mesmo prompt utilizado no perfil V6 leva a imagem para outro lugar. O código de personalização é algo simples que o Midjourney oferece, baseado nas escolhas que você faz de como treinar IA. Tem aula relacionada a isso aqui, mas quero mostrar que o mesmo prompt pode levar para lugares completamente diferentes dependendo da IA utilizada.
Falando nisso, se eu pegar esse prompt e levar para o ChatGPT, ele cria esse personagem aqui, completamente diferente, acertou o pincel digital (coisa que o Midjourney não acertou), mas é mais genérico, mais simples. Dependendo do estilo que procura, essa imagem pode ser útil.
Falando agora sobre realismo, no Midjourney o prompt é: um retrato de um homem de 30 anos usando óculos, segurando uma câmera em um café moderno na paleta de cores aquamarine e violeta, fotografado por uma lente 50mm. Gosto desse prompt para testar, porque tem uma mão segurando um objeto relativamente complexo, a câmera. Dá para ver o quanto essa IA faz boas mãos. Aqui acho que funcionou bem, e aqui está a estrutura do nosso prompt dentro do que falamos. Outro exemplo no Visual Electric, com a mesma estrutura e prompt. Você vai ver que ele vai para um lugar mais quente, pelo simples fato do estilo. Como as câmeras fotográficas têm estilos diferentes (Canon, Sony, Leica), o Visual Electric também tem seu estilo. E vai do seu gosto, acho que funciona super bem.
Gosto mais do Visual Electric para imagens realistas com uma estética mais brasileira. Acho que ele entende mais fácil; o Midjourney é muito "gringo" e sexista, principalmente na criação de mulheres. Acho que o Visual Electric consegue fazer algo mais dentro do que eu gosto. Aqui está o ChatGPT, que também funciona bem, traz um realismo legal, embora um pouco mais artificial. Mas se você trouxer elementos de estilo que forcem esse realismo, vai funcionar super bem.
Para fechar, como aprender a fazer prompts melhores além dessa aula que espero ter te ensinado bastante coisa sobre o básico da engenharia de prompts para imagem? Vou recomendar três perfis que acompanho e que todos os dias compartilham prompts que você pode usar, pois essa é a função deles. Aqui está o @FarukCreative, que posta prompts de sistema, ou seja, uma estrutura que você pode substituir para fazer a exemplo pôsteres do Messi ou Schumacher. O @ruido.98 é um perfil super estiloso, meio fashion, que vai te colocar numa estética distinta, e o @Alenn.design, que também faz e compartilha prompts completos.
O mais importante é olhar os prompts dentro das próprias ferramentas. Isso é simples e pouca gente fala porque é o lugar onde você pega prompt fácil, sem precisar seguir criadores, assinar planos ou comprar prompts. O que acontece: dentro do Midjourney e do Visual Electric, vou abrir o Midjourney, na área explorar, você clica em qualquer imagem e vê o prompt usado para criá-la. Você clica uma vez, e o prompt é seu.
O funcionamento dessas IAs de imagem como Midjourney e Visual Electric é deixar uma área de inspiração aberta, por exemplo, "Backlight silhuetado", e aqui está o prompt, bem simples. Você pode alterar, como trocar "red gradient" por "blue" e pegar esse prompt para você. Está sendo gerada essa imagem.
Explorar essas áreas é o jeito mais eficiente para encontrar prompts. Pode buscar, por exemplo, "Night City" e ver imagens de cidade à noite para se inspirar. Pode ser algo mais 2D, 3D, cyberpunk. Você clica e vê o prompt, aprende termos novos, como "Synthwave", e entende a estética. É um jeito legal de explorar. No Visual Electric também tem área de inspiração, a curadoria deles é excelente, melhor que a do Midjourney, e você consegue pegar exatamente o prompt usado para criar a imagem. Então, não compre bibliotecas de prompts, explore os prompts dentro da plataforma que você já usa, porque elas querem que você crie boas imagens e oferecem isso para você.
Vale dar uma olhada na área explorar e inspiração nessas duas plataformas. Por hoje é isso, espero que tenha curtido e bora ver as outras aulas de imagem relacionadas aqui.