Você vai aprender a criar imagens com inteligência artificial usando tanto prompts manuais quanto gerados automaticamente por IA. Entenda a evolução das ferramentas, como estruturar seus comandos para controlar o resultado e conheça os principais recursos de plataformas como Midjourney e Visual Electric. Descubra também como personalizar estilos, melhorar a qualidade das imagens e integrar diferentes ferramentas para potencializar resultados.
Escolha um tema e crie dois prompts: um básico e outro detalhado seguindo a estrutura tipo-assunto-cenário-estilo. Use o Midjourney ou Visual Electric para gerar pelo menos quatro imagens diferentes usando esses prompts. Depois, utilize uma ferramenta de upscaling como Magnific para melhorar a qualidade de uma das imagens criadas. Documente o processo e compare os resultados.
Hoje a gente vai falar sobre criação de imagens com IA, uma aula gratuita, mas antes de mais nada, queria me apresentar para vocês.
Eu sou o Paulo Aguiar, criador de conteúdo de inteligência artificial, também sou diretor de criação, designer. Faço muito conteúdo relacionado ao tema, não só de tutoriais e notícias, mas colocando muita mão na massa e participando de diversos projetos. Há um ano me dedico 100% a esse trabalho como criativo de IA, fazendo muita consultoria, projetos especiais, workshops, aulas, palestras e, é claro, sendo um dos professores aqui do CR_IA.
Uma das coisas que tenho mais explorado ao longo desse tempo trabalhando com IA é a criação de imagens. A ideia aqui é fazer uma aula gratuita para vocês, passando uma visão geral. Desculpa as atrapalhadas técnicas aí, espero que agora o áudio esteja ok, e vamos começar de fato a aula, pessoal. Qualquer dúvida, vocês podem ir colocando aqui no chat que eu vou dando uma olhada e trazendo mais detalhes para vocês, beleza?
Deixa eu só dar uma última olhada aqui que o pessoal falou que o áudio não está tão bom, se consigo melhorar. Na teoria está no máximo. Bom, vamos lá, pessoal.
Antes da gente começar, vamos conversar um pouquinho sobre a evolução das IAs de imagens. Assim que eu conseguir botar essa divisão aqui que acho que é a melhor, provavelmente sim.
A evolução das IAs de imagens, se vocês acompanham há algum tempo, devem ver que as coisas têm evoluído numa velocidade muito grande. Então, enquanto a gente olha para o Midjourney, que eu acho que é a IA mais popular de criação de imagens, o que a gente vê é uma evolução muito grande.
Aqui, por exemplo, o que era você pedir para o Midjourney criar uma imagem de uma menina cheirando uma flor? Isso aqui era na versão 1, isso aqui na versão 6. Nesse espaço foram dois anos de evolução. Outro exemplo: se você pedisse para a IA criar uma mulher astronauta com sorvete, isso era o que ela entendia no começo, e isso que ela entende hoje.
Aqui, um exemplo de um gato num jardim; no começo parecia que ele estava fundido com uma sacola, e agora a gente olha e vê que a qualidade está bem legal. Um exemplo de uma pita — que é uma grande sacanagem para quem ainda não usou — e um exemplo de produto também, a evolução da V1 para V6. Uma ilustração de uma família fazendo piquenique e uma ilustração isométrica, que no começo a IA não conseguia nem entender o que era uma imagem isométrica, e agora olha só onde a gente consegue chegar.
Hoje é possível criar universos inteiros. Quem trabalha com criação de imagens, ou em um estúdio de design, sabe que muitas vezes o “visual” é esse material que define uma estética, seja de uma campanha, seja de um visual. Hoje, expandimos para um universo onde é possível criar mundos visuais.
Aqui um exemplo de imagens criadas com Midjourney, algo muito mais gráfico, com cara até mais de campanha, mais design. Outro exemplo que é meio 3D e meio ilustração, e aqui um total 3D.
Vemos muita imagem de IA tentando imitar a realidade, mas eu gosto mais quando a gente vai para lugares onde cria o que seria impossível fazer com um modelo, por exemplo. Um exemplo disso é um trabalho que fiz para uma consultoria, onde criei todas essas imagens — vai passar mais ou menos umas cento e poucas. O mais legal é que criei um estilo de referência, onde qualquer pessoa lá na empresa pode criar uma imagem dentro dessa estética.
Então, pensa numa imagem de referência que influencia todas elas e também um prompt base, onde qualquer coisa que você escrever vai sair com essa estética. Se você escrever relógio, sai um relógio assim, garrafa, uma garrafa dessa, robô, mulher lendo um livro. Sem ter conhecimento técnico para criar uma imagem desse tipo, você consegue fazer, porque eu, como diretor criativo, como designer, consegui estabelecer isso.
Essa é uma das coisas legais: além de criar imagens para seu conteúdo, produto ou cliente, você pode criar um estilo para a marca inteira utilizando inteligência artificial. Eu gosto bastante desse trabalho, me digam aí se vocês também.
Outro exemplo de IA para imagem são as imagens realistas. Em 2022, se você pedisse para criar uma imagem de uma mulher palestrando no TED Talks, era isso que a IA fazia. Hoje, basicamente com o mesmo prompt, conseguimos criar isso — essa é a melhoria que a gente tem em dois anos.
Gosto muito de mostrar esses comparativos para pensarmos onde as coisas estarão daqui um ano, principalmente no caso de vídeo. Aqui mais um exemplo do mesmo artista que criou essas imagens.
Agora, antes de entrarmos nas ferramentas em si, que é o que vamos ver bastante hoje, percorrer as ferramentas e usar as ferramentas, eu queria falar sobre prompt.
É a base para conseguirmos criar boas imagens: entender e fazer bons prompts.
Hoje existem duas maneiras de fazer prompt de imagem: o que eu chamo de manual e o com IA, que é o automático. Dá para criar imagens hoje sem precisar parar para descrever um prompt. Você pode mandar uma imagem de referência, um áudio explicando o que quer e deixar que a IA crie seu prompt.
Mas é importante que saibamos fazer manualmente, até para entender se o prompt que a IA está fazendo para você, se esse prompt automático tem a qualidade necessária para alcançar o resultado desejado.
Então, hoje vamos explorar bastante como fazer bons prompts manuais.
Começando com uma estrutura básica que não precisa necessariamente seguir essa ordem, mas se você conseguir colocar esses quatro pontos no seu prompt de imagem, vai ter um bom resultado e um bom controle.
A fórmula é: tipo, assunto, cenário/composição, estilo e detalhes.
Quando você junta esses quatro pontos, tem um prompt com controle que certamente ajuda a criar a imagem.
Será que uso sempre essa estrutura? Não. Às vezes, começo só com o assunto e vou ajustando conforme vejo o que a IA cria. Às vezes tenho clareza do que quero e escrevo o prompt inteiro. Mas o ideal é que, na imagem final, esses elementos estejam presentes para dar controle e permitir alterações.
Tudo certo até aqui? Em qualquer dúvida vão me falando no chat, estou de olho.
Vamos ver uns exemplos. Criei dois prompts base, em inglês, e vou fazer a tradução em tempo real, pois funciona muito melhor em inglês, principalmente para Midjourney e Visual Electric, que são duas ferramentas que vamos ver.
O prompt é: um navio-robô pirata em background limpo, paleta de cores A com marina e violeta, estilo Bauhaus. O prompt é organizado, mas a ideia é mostrar como a IA entende. Tipo é 3D, navio-robô pirata é a ideia, cenário é background limpo, e estilo é a paleta e a Bauhaus, escola de design com visual específico que não tem nada a ver com robô pirata 3D, mas a influência da Bauhaus aparece na imagem.
Outro exemplo: retrato de fotografia realista de uma mulher de 30 anos segurando uma câmera digital vintage em um café hipster, paleta aquamarine e ultraviolet, fotografado com lente 50mm. O resultado do Midjourney mostra a importância da estrutura: se você não colocar “portrait”, a IA pode misturar foto com ilustração, causando resultados distantes do realismo. É o ponto do prompt.
Vamos às ferramentas para criação de imagens.
Uma dúvida comum era qual ferramenta usar. Embora Midjourney seja o mais falado, existem várias outras e novas surgem todo dia. Não temos tempo para testar todas, mas aqui no CR_IA eu, o Fê e a Ana testamos todas. Pelo menos uma vez por mês acesso todas para criar imagens com o mesmo prompt e comparar resultados, para saber qual melhorou ou piorou (nunca vi piorar). Cada uma vai a lugares diferentes.
No último mês testei todas com o mesmo prompt e vou mostrar aqui para vocês como esses prompts se comportam em cada uma das ferramentas para pensar no resultado que mais agrada. Vou focar nas que acredito que façam mais sentido para ensinar na live.
Lembrando os dois prompts: navio-robô pirata e mulher no café.
O DALL·E, da OpenAI, cria imagens minimalistas, achei o navio bonitinho. A imagem da mulher é mais caricata. Meta AI, que uso bastante, funciona no WhatsApp, gera imagens mais plásticas, mas chega a resultados legais dependendo da ideia.
O Flux cria imagens realistas, uso no Krea, rende resultados bem interessantes em realismo. O Firefly gera imagens em baixa resolução, mas eu gerei em alta para visualização, cores muito saturadas. Leonardo AI, vários modelos, usei o padrão, é um visual mais desaturado.
Runway não é focado em criação, mas é legal. Mystique do Magnific cria imagens com alto realismo, mas com repertório limitado para etnias, raça etc. Essa é a mulher brasileira segundo o Magnific.
Recraft é bem legal, tem um workflow ótimo, uso bastante. Videogram, conhecido, deixa o robô navio pirata mais robô, o que é um caminho diferente, o que é bom.
Visual Electric, que vamos falar depois, não pegou bem a ideia do robô navio pirata, mas o retrato ficou muito bom, próximo da lente pensada, imagem realista. Dream Studio (Stable Diffusion) e Imagine Art (gratuito) também são boas opções, com detalhes interessantes, embora algumas mãos fiquem esquisitas.
Midjourney V6, que começamos mostrando, tem um ponto delicado: tem ficado cada vez mais sexista, sensualiza mais a mulher. Se você não colocar instruções de roupa, ele sempre vai fazer uma mulher com pouca roupa, consequência do treino e uso da plataforma.
Uma forma de melhorar isso é usando personalização.
Não vou entrar em detalhes, mas se você usa bastante o Midjourney e rankeia as imagens, cria um estilo só seu baseado nas coisas que mais curtiu. Se evitar curtir imagens de mulheres com pouca roupa, a IA tende a tirar esse estilo no seu perfil personalizado.
Todas as preferências e estilos que você curte influenciam esse estilo.
Usando meu estilo personalizado no prompt da mulher, com 50% de interferência, gosto mais do resultado, que reduz a sensualização. O quanto a mulher parece brasileira ainda é subjetivo, mas o resultado tem mais a ver com minha realidade.
Com 100% de interferência, a paleta de cores às vezes é ignorada, mas o sistema entende que gosto mais de rosa, magenta.
O estilo personalizado vai evoluindo conforme você usa a plataforma, tornando suas imagens mais únicas.
Beleza, galera? Já vamos entrar nas plataformas para usar, mas antes queria falar que o formato manual é escrever seus próprios prompts.
O formato com IA é usar uma IA para escrever os prompts. Se entrarem no ChatGPT, na aba “explorar GPTs”, há bots criados para escrever prompts para você, incluindo para Midjourney, Visual Electric, Ideogram etc. Você pode pedir para criar a imagem e eles escreverão o prompt, que pode ser editado e alterado.
Também dá para transformar seu próprio ChatGPT, Claude ou Meta AI em um transformador de prompt. Por exemplo, no meu ChatGPT, pedi que ele atuasse como especialista em criação de imagens, escrevendo prompts precisos para Midjourney, transformando características das pessoas em personagens 3D estilo Pixar, carismáticos, protagonistas.
Enviei imagens e ele cria o prompt em inglês detalhado. Não cria a imagem automático, apenas o prompt, que eu depois uso no Midjourney.
Exemplos: imagens da Vic, do Alan (rosto e corpo) e do Jonas, todos criados no Midjourney usando prompts gerados pelo transformador.
Esse método é especialmente útil para criar várias imagens no mesmo estilo.
Agora, qual ferramenta usar? Não sei se tem fotógrafo aqui, mas quando falo sobre Midjourney, Recraft, Visual Electric, Flux, Leonardo, DALL·E, dar opinião sobre qual é a melhor é como perguntar qual a melhor câmera: Canon, Sony, Leica, Fuji, Blackmagic.
Para profissionais, a melhor câmera é a que você sabe usar melhor, a que tem mais experiência.
As IAs que mostrei são muito boas; a diferença de resultado depende muito da sua habilidade de usá-las.
Dá para criar resultados incríveis com todas, mas elas têm formatos de trabalho diferentes.
Minha dica para quem quer criar imagens com IA é escolher uma ou duas e se aprofundar ao máximo: veja mais vídeos, teste, estresse, passe tempo usando.
Pra mim, divido meu tempo entre Midjourney e Visual Electric, duas ferramentas fantásticas, e vou mostrar um pouco delas.
O Midjourney é só versão paga, então é legal dar uma olhada se quer usar ou não, se está começando e não tem muita noção.
O Visual Electric permite criar 20 imagens gratuitas.
Vou mostrar um pouco das duas e das funções mais importantes para usar essas IAs com qualidade.
Eu não tenho muita experiência com lives, desculpem algumas questões técnicas, estou fazendo o melhor para transmitir conteúdo.
Vamos lá, Midjourney.
Essa é a home do Midjourney quando você está logado. A dica mais importante: a melhor maneira de usar o Midjourney é vendo como as pessoas usam, porque ele é uma plataforma aberta — a não ser que você tenha a conta premium mais cara, de 80 dólares, tudo que você cria fica disponível para as pessoas. Você vê o prompt da pessoa, por exemplo: “3d, cartoon, snake, Chinese new year, Midjourney”.
Posso usar esse prompt diretamente.
Toda vez que vou começar um projeto, dou uma pesquisada em prompts semelhantes, tipo “woman coffee”, para ver as imagens já criadas dos usuários.
Vamos criar utilizando nosso prompt ao vivo aqui. Peguei o prompt dos testes da mulher tomando café.
A interface é simples, aqui você escreve o prompt. Tem parâmetros para alterar: formato (retrato, quadrado, paisagem), modo de uso (standard, raw, stylization — que define força do estilo Midjourney — weirdness, variety).
O modo inclui relax, fast e turbo, que afetam a velocidade e custo de uso.
Minha conta está no modo turbo para ser bem rápido. Quando criar a imagem com o prompt, ele cria quatro imagens por vez. Costumo criar muitas, posso dar rerun para gerar outras variações.
O Midjourney tem um padrão de beleza forte, que às vezes cria imagens muito “padrão”, “modelo”, que dificilmente quero publicar. Por isso, uso meu padrão, minha personalização (“traço traço P”), baseado nas imagens que mais curti e criei na plataforma.
Ele criou algo parecido com o que víamos na apresentação das variações de mulheres.
Você pode pedir variações: fortes (muda muito), subtis (pequenas diferenças), ou fazer upscale para criar imagem maior e com mais qualidade.
Também é possível editar as imagens, por exemplo:
O Midjourney permite usar imagens como referência para criar ou modificar imagens. Exemplo:
Exemplo: peguei uma imagem quente, laranja, para dar uma estética diferente ao prompt.
O resultado mantém a ideia, mas com a luz e estilo da imagem de referência.
Na primeira tentativa, eu faria umas 20 variações até chegar no resultado desejado.
Essa função ajuda a criar imagens com mesma personagem, mas estilos diferentes.
Não deu para mostrar tudo da ferramenta, talvez eu volte para Midjourney depois.
Agora vou mostrar o Visual Electric.
O Visual Electric tem funcionamento bem diferente do Midjourney em termos de interface.
Se alguém usa Illustrator, InDesign, Photoshop, a interface do Visual Electric é mais parecida: um dashboard em estilo Canva.
Tem parte de inspiração onde você vê o prompt das imagens criadas por outros, pode copiar os prompts.
Eu acho que o Visual Electric tem uma curadoria muito melhor que o Midjourney, as imagens são sempre muito boas e influenciadas por uma estética mais minimalista.
Hoje não uso só uma ferramenta, uso várias dependendo do tipo de entrega que quero.
Vamos criar um novo canvas. Coloco o prompt, escolho o formato, a paleta de cores, e o tipo de imagem desejada (fotografia, fashion, filme, flat design, mood, pixel art, fine art digital, etc.).
A ferramenta cria as imagens rápido.
Visual Electric é mais realista nas cores, dá um aspecto “abafado” na imagem que garante qualidade no resultado.
Sobre a questão da mulher brasileira, é subjetivo, mas acho que ele trata melhor esse tipo de questão, nunca vi entrega sexista ou muito sensual como o Midjourney.
Visual Electric permite variações e ajustes em direção de arte.
Você pode pedir, por exemplo, para fazer outdoor durante o dia e a ferramenta altera as imagens automaticamente.
Respondendo pergunta: o inglês funciona melhor sempre, porque, embora a tradução funcione para português, alguns termos técnicos específicos não traduzem bem.
Eu costumo criar o prompt em português, usar Google Translate, e colar na IA; sempre funciona melhor.
Aqui eu pedi imagem com “daytime” e ele foi ajustando.
Imagens legais, o que acham?
Posso criar variações e fazer upscale em 2x, 3x ou 4x. Para imagens realistas, não uso Magnific aqui, acho desnecessário.
Já nas imagens do Midjourney sinto que preciso passar pelo Magnific para melhorar.
Parece que o Midjourney ainda falta um pouco de ruído, um grão para qualidade superior.
Com os parâmetros para alterar o estilo, você já tem um bom controle.
Isso é útil especialmente para quem não tem conhecimento avançado de design e direção de arte.
Visual Electric é mais nova que Midjourney, deve evoluir muito nos próximos meses. Dá para criar até 20 imagens gratuitas.
Respondendo para Gabriel sobre tipografia: todas essas IAs conseguem chegar a um resultado legal.
Eu uso mais Visual Electric para isso e, inclusive, faremos amanhã um vídeo só sobre tipografia com IA usando essa plataforma.
Sobre subir foto do rosto e adicionar corpo diferente no Visual Electric: sim, ele faz, mas não cria o rosto igual ao original; usa esse rosto para imaginar um rosto novo. Então, a resposta é sim e não.
Hoje, para imagens realistas uso Visual Electric; para imagens surreais e compostas, prefiro Midjourney, que também uso para brainstorm rápido.
A Meta IA está bem legal para criar imagens, especialmente porque é rápida e gratuita.
Valeu demais, pessoal!
Obrigado, qualquer dúvida me mandem DM no Instagram, estou sempre online para ajudar vocês.