Jak napisać dobry opis obrazu do Midjourney, Stable Diffusion i DALL-E?
Każdy generator obrazów AI mówi innym językiem. Midjourney lubi krótkie hasła oddzielone przecinkami. Stable Diffusion też lubi hasła, ale niektóre z liczbą obok, która mówi *„to jest dla mnie ważniejsze"*. DALL-E woli całe zdania, jak rozmowę z człowiekiem. Flux jest gdzieś pomiędzy.
Klikasz, co chcesz zobaczyć: temat, styl (np. fotorealistyczny, anime, akwarela), nastrój, światło, sposób kadrowania, paletę kolorów, proporcje obrazu. Możesz też zaznaczyć, czego unikać (*„bez znaków wodnych"*, *„bez rozmytego tła"*).
Narzędzie składa gotowy opis w formacie wybranego generatora. Ten sam pomysł dostajesz w czterech wersjach. Wklejasz tam, gdzie chcesz, i porównujesz, gdzie wyszło najlepiej. Bez zapamiętywania, jak który serwis działa.
Jak używać
- Co ma być na obrazie: napisz krótko, kto albo co. Przykład: *„młoda czarownica na miotle"*. Możesz dodać, co robi: *„rzuca zaklęcie nad świecącym kotłem"*.
- Wybierz styl z listy: fotorealistyczny, filmowy, anime, obraz olejny, pixel art, cyberpunk, fantasy, minimalizm, akwarela, render 3D. Jeden klik = pakiet pasujących haseł.
- Doprecyzuj klimat: nastrój (mroczny, radosny), światło (zachód słońca, neony, świece), kadr (ujęcie z dołu, zbliżenie twarzy), aparat (portret 85mm, makro), paleta (pastele, ciepłe, czarno-białe).
- Poziom szczegółu: prosty (szybko, do szkicu pomysłu), zbalansowany (domyślny), bardzo szczegółowy (dłużej generuje, więcej detali, ale czasem przesadza i np. psuje twarze).
- Proporcje obrazu (np. 16:9, 1:1): 1:1 do Instagrama, 9:16 do Reels i TikToka, 16:9 do tapety lub miniatury YouTube, 4:5 do pionowych postów.
- Lista rzeczy do pominięcia: kliknij gotowe (rozmyte, znaki wodne, brzydkie ręce) albo dopisz swoje. Narzędzie samo wstawi to we właściwe miejsce, każdy generator robi to inaczej.
- Wybierz, gdzie wkleisz: Midjourney, Stable Diffusion, DALL-E albo Flux. Format dopasuje się automatycznie. Możesz porównać wszystkie cztery wersje obok siebie.
Kiedy się przydaje
Sześć typowych sytuacji, w których kreator opisów daje Ci konkretną przewagę:
- Testujesz ten sam pomysł w kilku narzędziach. Masz koncept (*„wojownik w lesie o zachodzie słońca"*). Klikasz raz, dostajesz cztery wersje opisu (Midjourney, Stable Diffusion, DALL-E, Flux). Wklejasz każdą i wybierasz najładniejszy obraz.
- Robisz grafiki na social media. Potrzebujesz post na Instagram (kwadrat 1:1), Reels (pionowo 9:16), tapetę na blog (poziomo 16:9). Klikasz format, narzędzie dopisuje resztę. Nie musisz pamiętać, że Midjourney używa --ar 16:9.
- Ilustracje do bloga albo e-booka. Chcesz, żeby wszystkie obrazki w książce wyglądały podobnie. Wybierasz jeden styl (np. *„akwarela"*) i tylko zmieniasz temat każdego z nich. Wszystko wygląda jak z jednej ręki.
- Bawisz się stylami. Nie wiesz, jak wygląda *„cyberpunk + fotorealistyczny"*, a jak *„fantasy + akwarela"*. Klikasz, generujesz, widzisz. Nauka przez zabawę.
- Mockupy graficzne dla klienta. Klient chce trzy style do wyboru. Składasz trzy opisy, generujesz, pokazujesz. Szybciej niż rysowanie ręczne.
- Uczysz się, jak działa każdy generator. Patrzysz, czym Midjourney różni się od Stable Diffusion i widzisz gotowe przykłady zamiast czytać dokumentację.