Bora conhecer o Midjourney, uma poderosa, talvez a mais poderosa ferramenta de criação de imagem e agora vídeo também, utilizando inteligência artificial. Desde 2022, ela vem sem dúvida figurando entre o Top 3 ferramentas de IA. Basicamente, é impossível hoje falar sobre inteligência artificial e criação sem falar do Midjourney. Hoje, vamos ter uma visão geral sobre essa plataforma, passando os principais parâmetros e como dar os primeiros passos. Uma coisa importante sobre o Midjourney é que ele não tem versão grátis. Ele até teve durante um tempo a possibilidade de você criar dez ou vinte imagens de forma gratuita, se não me engano, mas agora só criando a conta e escolhendo um dos planos para poder utilizar.
E é por aqui que eu vou começar. Acessando o site Midjourney.com, você vai criar sua conta e escolher um dos planos. O plano básico custa 10 dólares e oferece uma quantidade limitada de gerações, aproximadamente 200 imagens. Você tem direito de uso comercial geral e pode rodar até três trabalhos ao mesmo tempo.
O plano Standard, que é o que eu utilizo, dá gerações ilimitadas se você estiver no modo lento, que eu já vou explicar como funciona. Ele oferece 15 horas de gerações rápidas. Existem também o modo Pro e o modo Mega, com descrições detalhadas de uso. Quando trabalho em algum projeto comercial que vou vender as imagens para alguma marca, eu uso o modo Pro ou Mega, porque vou usar muito mais horas e também porque há um formato de geração stealth, que é quando você gera imagens e ninguém vê que está gerando.
O Midjourney tem o comportamento de, no modo básico ou standard, as suas imagens serem compartilhadas no modo Explorar, que é onde a gente vai ver agora. A função Explorar é a primeira no menu lateral. Lá você pode ver os trabalhos que outros usuários estão fazendo. Por exemplo, ele mostra os top do dia e você pode dar uma olhada. Se clicar em uma imagem, você vê o prompt que foi utilizado para criar essa imagem e, consequentemente, o vídeo. É um lugar legal para ficar por dentro das tendências. Tudo que você cria, a não ser que esteja no modo Pro, também vai aparecer ali para que outros usuários possam ver e remixar.
Mas vamos ao que interessa: como criar imagens no Midjourney. Clicando em "Create", você vai para o ambiente de criação. Não vou entrar muito em engenharia de prompt aqui, pois temos outras aulas para isso; aqui é mais sobre como usar as ferramentas. Quando você clica na caixa para imaginar, você escreve seu prompt. Mas antes disso, deve clicar em "Settings" no cantinho, onde você vê todos os parâmetros, começando pelo tamanho da imagem: modo retrato, quadrado ou landscape, ou algum outro que você pode mexer.
Você escolhe também o modelo, que pode ser Standard ou Raw. O Standard é o estilo tradicional da plataforma, guiado pelos usuários. Pense que todo mundo está utilizando, e conforme as pessoas vão curtindo as imagens, esse estilo do Midjourney vai sendo alterado. Já o Raw é o modo puro, cru. Você pode usar o Raw no modo tradicional ou no modo draft, que é mais rápido, ideal para brainstorm, quando você está pensando qual imagem vai fazer. A qualidade fica menor, mas depois pode-se fazer upscale.
Você escolhe ainda qual versão do Midjourney usar. Pode usar versões antigas, ou o Niji, que é uma personalização para um estilo mais de ilustração. Recomendo sempre usar a última versão; o 6.1 está entregando mais, e o 7 é um modelo mais recente e muito bom.
O parâmetro "stylize" determina o quanto sua imagem vai seguir os padrões de estilo da plataforma. Eu normalmente deixo entre 300 e 400, mas vou alterando conforme a ideia. Outro parâmetro é "weirdness", que define o quão estranho ou peculiar a imagem será, o quanto vai fugir do padrão. Eu sempre deixo no zero, a não ser que queira algo mais maluco. O "variety" é o padrão de caos, que cria alternativas do seu prompt. Por exemplo, se você está fazendo um retrato, aumentar o caos cria retratos com ângulos mais distorcidos, ou amplia a cena, saindo daquela visão tradicional.
Aqui também você escolhe a velocidade de geração. No plano Pro que uso, o modo Relax não consome horas, ou seja, pode criar imagens ilimitadas, porém é mais lento. O modo Fast consome suas horas rápidas, e o modo Turbo consome muito mais, mas gera muito mais rápido. Esses são os parâmetros gerais do Midjourney.
Agora, bora criar imagens. Aqui eu estava fazendo algumas com prompts simples que já vimos em outras aulas. Naturalmente, ele traz imagens diferentes porque o prompt está um pouco aberto. Tem também um prompt mais conciso, cujas imagens ficam mais semelhantes, como a visão dentro de um copo vendo a menina tomando. Pegando um prompt de exemplo, basta dar enter e ele começa a imaginar, aqui no modo Fast, que é intermédio. Ele já cria 4 imagens simultaneamente, padrão do Midjourney. Você vê os parâmetros usados, como o formato, versão e o quanto de stylize está aplicado. Ele processa a imagem por etapas até que fique pronta.
Concluímos a imagem, que trouxe quatro opções. Clicando, você vê maior e pode navegar pelas variações. Toda imagem criada tem um menu à direita para dizer se gostou ou não, importante para personalização, que falaremos depois. Você pode criar variações sutis ou bruscas. Também fazer upscale para aumentar a resolução de forma fiel ao original ou criativa. Pode remixar, ou seja, usar a imagem para colocar um prompt por cima. Ou rodar novamente com "re-run".
Também já é possível fazer vídeos, com duas opções: low motion, que anima de forma sutil, e high motion, mais intenso. Pode manter em loop ou não. Também é possível animar manualmente escrevendo um prompt para o movimento, mas nosso foco aqui são imagens. Vamos ver o que ele já gerou. O upscale sutil melhora a qualidade sem alterar muito, o upscale criativo altera mais a imagem, trazendo brilhos e uma aparência mais plástica. Raramente uso o criativo, porque prefiro fazer upscale em outras ferramentas, como o Magnific, que já temos aula.
O Midjourney também traz variações sutis, mudando ângulo e brilho, algo ótimo para ajustar uma imagem quase pronta, ajudando a chegar no resultado. Outra função legal é o modo draft de conversação, bem nova e pouco explorada. É muito útil quando você está em brainstorm, sem saber exatamente que imagem quer e quer criar rápido, usando linguagem natural sem termos técnicos.
Por exemplo, no prompt usual usamos termos técnicos de composição, design, fotografia. Se você não sabe esses termos, pode ligar o modo draft e de conversa e usar o microfone para descrever o que quer. Dizendo:
"Crie uma imagem de um homem em um café vintage"
ele compõe um prompt mais elaborado e cria uma imagem de qualidade melhor. Vai criando com ajustes, como: "esse homem deve estar olhando para a câmera, usando óculos de grau", e ele incorpora esses detalhes cada vez mais técnicos. Ele não pega só a frase e cria a imagem, mas interpreta e enriquece o prompt, gerando imagens de qualidade. Pode continuar detalhando, por exemplo, adicionando "ele deve estar na área externa do café, com luz projetada no rosto". Esse modo é muito legal para ir ajustando a ideia com linguagem natural, por exemplo:
"A imagem deve ser 3D estilo Pixar, com um gato branco ao lado dele."
Pode pedir um plano mais fechado, próximo ao rosto, mostrando o homem, o gato e uma xícara de café, num ambiente vintage muito bem iluminado. Ele nunca esquece os elementos combinados, como óculos, luz e olhar para a câmera, construindo a imagem com linguagem natural. O modo draft é ótimo pela velocidade. Se você já usou o ChatGPT para criar imagens, sabe que ele é excelente, mas lento. Olha a velocidade que criamos aqui várias variações da mesma ideia com um resultado bem legal.
Agora, falando da ferramenta de edição, que fica logo abaixo do botão Create. Você pode subir uma imagem do seu computador ou de URL, ou pegar de algum projeto seu, que é o que vamos fazer. Vou pegar essa imagem do gatinho surfando, clicar em editar. Você pode mudar a proporção da imagem, reconstruir cantos, algo que também pode fazer em outros softwares. Pode editar algo específico da imagem. Por exemplo, marcando um trecho e dizendo que o prompt que escrever vai agir só ali. Pode escrever algo novo ou editar o prompt existente.
Aqui, no prompt, ele estaria vestindo óculos retrô, vou tirar isso e submeter a edição. No resultado, ele tirou os óculos, mas ficou umas marcações que não gostei muito. Vamos fazer outro teste com essa imagem do nosso personagem e o gatinho. Vou tentar trocar o gatinho, passando o brush e colocando um elemento menor, que será um rato. Também vou testar a imagem mais vertical, tipo stories, diminuo largura e aumento altura. O resultado veio com um gato que parece rato, outro que não sei bem o que é, um ratinho mais realista, com braço inventado. Foi um teste rápido com prompt simples para você entender o funcionamento da plataforma. Eu uso bastante essa ferramenta de edição.
Outra função na edição é o retexture, que pega uma imagem existente e aplica uma textura completamente diferente. Para mostrar na prática, trouxe um projeto que fiz usando isso: peguei a imagem de uma mulher na frente de uma Sephora e escrevi um prompt para manter essa estrutura básica (mulher com cabelo encaracolado na frente da loja), mas mudar o background e a estética completamente. Isso permite sair de uma imagem e criar vários ambientes diferentes, mantendo a composição e iluminação, mas alterando tudo ao redor.
Fiz muitas imagens assim para um trabalho com vídeo to vídeo, onde o primeiro frame precisava ser diferente e, conforme a mulher caminha, a estética vai mudando. Aqui você vê várias versões alternativas da mesma cena, ótimo para testar possibilidades de direção de arte. No prompt, coloquei que deveria estar escrito "Sephora" com a tipografia certa, e ele foi acertando isso ao longo das imagens. Essa função é excelente para técnicas vídeo to vídeo, que temos aula, onde o primeiro frame precisa ser idêntico ao que você quer depois no vídeo, além de testar direções de arte e estética.
Para fechar nossa aula introdutória, que está quase avançada, quero falar sobre personalização, uma das coisas mais legais do Midjourney, que eu uso muito e que faz dele minha IA de imagem favorita. É a possibilidade de não só treinar meu código de personalização, como criar mood boards específicos para projetos e clientes. Clicando em personalização, você vê as possibilidades, a mais importante é treinar seu Midjourney para criar imagens de acordo com o seu gosto, além de criar mood boards específicos para projetos, seja para marca ou para você, para ter estilos diferentes.
Como fazer um código de personalização? Para usar o Midjourney 7, automaticamente você precisa rankear algumas imagens, e depois continuar fazendo isso para ter um estilo mais seu. Na prática, você cria uma imagem, por exemplo, usando um prompt do gatinho sem código de personalização, gera e observa o resultado. Depois, usa o mesmo prompt, mas ativando o código, clicando nesse "P", e gera novamente.
Baseado em milhares de imagens rankeadas, o Midjourney entende o tipo de imagem que você prefere em termos de composição, iluminação e realismo, tornando isso praticamente sua assinatura dentro da plataforma. Aqui estão exemplos: a mesma imagem feita sem e com código de personalização. Curiosamente, gostei mais da versão original, que achei mais épica, enquanto minha versão personalizada ficou mais minimalista. Outro exemplo: um retrato de mulher, versão padrão e personalizada, com um resultado completamente diferente. Meu código deu um estilo mais vintage, com paleta de cores marcada.
Outro exemplo, o homem no café, com paleta aqua marine e roxa, versão tradicional e personalizada. O resultado da personalização neste foi mais gritante e gostei mais da minha versão por causa da iluminação, que ficou mais realista. A paleta também me agrada mais, e o personagem está menos acabado que na versão padrão. Para ativar seu código, vá em personalização e coloque ON, eu sempre deixo assim. Mas o código só funciona se ativar o "pezinho" ao lado. Se não estiver ativado, usa o modo normal. Você sabe que deu certo quando aparece o "profile global v7".
No personalização, o Midjourney mostra duas imagens para você escolher qual prefere. Muitas vezes, elas são bem diferentes, e você pode escolher uma ou pular caso nenhuma agrade. Esse processo de escolha vai moldando seu código e seu estilo, mostrando seus gostos em traço, composição, cores, etc.
No começo, parece sem sentido porque aparecem imagens que você não gosta, mas conforme vai votando o código melhora. Eu tenho mais de 1.168 imagens rankeadas no Midjourney 7 e 1.369 na versão anterior (V6). Isso faz muita diferença: quanto mais votar, melhor fica seu código.
Dentro da personalização também tem os moodboards, onde você pode subir várias imagens para dar referência visual, diferente do profile que não aceita uploads. Pode ser fotos suas, imagens de IA, referências diversas. Fotógrafos, por exemplo, podem criar mood boards com seu estilo para gerar imagens nessa linha. Marcas com guia visual podem fazer o mesmo.
Eu faço projetos para NVIDIA e criei um Mood Board chamado RTX Concept, com imagens na estética que quero para a marca, misturando imagens conceituais verdes e lifestyle. Isso ajuda a manter consistência visual. Fiz mais de mil imagens para esse projeto e a unidade visual é incrível. Com a personalização clara, consigo criar imagens com pouquíssima informação no prompt. Exemplo: Criei uma imagem para Deepseek, uma IA representada por uma baleia. O prompt é "baleia futurista", "baleia cyberpunk", "baleia robô". Toda essa estética vem do meu código de personalização.
Isso ajuda bastante a alcançar consistência visual. Falando em consistência, o Midjourney ajuda também pelo Style Reference e Omni Reference para ter personagem consistente. Não é tão fiel quanto criar um LoRA, que é a forma mais exata de manter seu rosto e personagem, mas já é um avanço para projetos em que a consistência é importante. Na aba Create, ao escrever um prompt, você pode adicionar um style reference.
Por exemplo, se eu quero criar uma imagem com luz projetada similar a essa mas com uma mulher na faixa dos 50 anos num café vintage, posso arrastar essa imagem para style reference. Ela vira um filtro de estilo para a imagem que vou criar. Outra opção é usar a imagem como image prompt para criar um remix dela, usando a composição, a pessoa, etc. Também posso fazer upload para o Omni Reference, que traz unidade para personagem. Colocando a imagem, posso aumentar a força para ser fiel, e ele usa como personagem no seu prompt.
Testei criando um homem na praia e achei que ficou bom, apesar da qualidade média devido ao prompt simples. Também usei a imagem projetada para criar uma senhora de 50 anos, mantendo bastante da luz projetada. Esse recurso ajuda a manter consistência tanto de personagem quanto estética.
Com isso chegamos ao fim da nossa aula introdutória do Midjourney, que foi um tanto longa. Espero que você tenha curtido. Tentei trazer o máximo de informação para você ter uma visão geral da plataforma. Principalmente porque é uma plataforma paga, então, antes de pagar, espero que esse vídeo te ajude a decidir se vale a pena. Eu gosto muito, acho que tem muitas possibilidades e várias funções que não pude detalhar aqui.
Com essas informações, com certeza você já pode criar imagens de altíssima qualidade, principalmente se assistir outras aulas de prompt e souber trabalhar com as referências para evoluir dentro dessa plataforma tão poderosa.
E é isso!