Czemu Midjourney i Stable Diffusion mają różne formaty?

Bo **powstały w zupełnie inny sposób**. Midjourney zaczynało jako **bot na Discordzie** (komunikator do gier). Wpisywało się polecenia z myślnikami, jak w terminalu. Dlatego do dziś używa krótkich haseł po przecinku i parametrów typu **--ar 16:9**. Stable Diffusion robiła **społeczność programistów**, stąd *„wzmacnianie wybranych słów"* liczbami. DALL-E jest wbudowany w ChatGPT, dlatego rozumie zwykłe zdania, jak w rozmowie. Flux jest najnowszy i radzi sobie z obydwoma stylami. Każdy generator to inny *„dialekt"*.

Co to jest "negative prompt" (lista rzeczy do pominięcia)?

To **lista rzeczy, których nie chcesz na obrazie**. Klasyczny zestaw *„od czego boli głowa"*: **rozmyte, znak wodny, niska jakość, brzydkie ręce, zniekształcona twarz, dodatkowe palce, podpis, tekst**. Generatory AI często gubią się przy szczegółach, zwłaszcza ręce mają sześć palców, a w tle pojawiają się dziwne literki. **Stable Diffusion** ma osobne pole na tę listę. **Midjourney** używa **--no rozmyte, znaki wodne**. **DALL-E** nie ma takiej funkcji, trzeba dopisać do opisu zdanie: *„Unikaj rozmytego tła i znaków wodnych"*. Narzędzie samo wstawia w odpowiednie miejsce.

Jakie proporcje obrazu wybrać do Instagrama?

Najczęstsze proporcje i ich zastosowania: - **1:1** (kwadrat): klasyczny post w feedzie, awatar, zdjęcie profilowe. - **4:5** (lekko pionowy): najlepiej działa w feedzie, **zajmuje więcej miejsca na ekranie telefonu** = większy zasięg. - **9:16** (mocno pionowy): Reels, Stories, TikTok. - **16:9**: miniatury YouTube i tapety na monitor. - **21:9**: kinowe banery panoramiczne. - **2:3** albo **3:2**: wydruki (np. plakat), standard aparatów cyfrowych.

Czemu mój obraz wychodzi rozmyty?

Najczęstsze powody: **za dużo pomysłów naraz** (AI próbuje upchnąć wszystko, ostrość ucieka), **brak słowa o aparacie albo świetle** (generator zgaduje), **brak listy rzeczy do pominięcia** (zostaje *„rozmyte tło"*, bo nikt nie powiedział, że ma być ostro). Sprawdź też: czy w stylu jest *„fotografia"*. Jeśli tak, dopisz **„ostry, wysokiej jakości"** i do listy do pominięcia daj **„rozmyte, niska jakość"**. W Stable Diffusion można też **wzmocnić wybrane słowo**, np. (ostry:1.3). Im konkretniejszy opis, tym ostrzejszy obraz.

Jak skopiować styl z innego obrazu?

Trzy sposoby. **Pierwszy**: nazwij styl po imieniu (*„obraz olejny w stylu Van Gogha"*, *„fotografia jak z lat 80."*, *„anime jak Studio Ghibli"*). AI zna setki stylów po nazwie. **Drugi (Midjourney i Flux)**: użyj odnośnika do obrazu. Wklejasz link do zdjęcia, a generator próbuje skopiować nastrój i kolory. W Midjourney robi się to przez **/imagine [link do obrazu] mój opis**. **Trzeci (Stable Diffusion)**: pliki **LoRA**, gotowe paczki uczone na konkretnym stylu (do pobrania ze stron typu CivitAI). Najprostszy jest pierwszy sposób, często wystarcza.

Co to są te liczby przy słowach w Stable Diffusion (np. masterpiece:1.2)?

To **wzmacnianie wybranych słów**. Domyślnie każde słowo w opisie ma *„siłę"* 1.0. Jeśli zapiszesz **(masterpiece:1.2)**, mówisz generatorowi, że *„arcydzieło"* ma być widoczne **20% mocniej** niż reszta. Jeśli zapiszesz **(rozmyte:0.5)**, to *„rozmyte"* ma być **dwa razy słabsze**. Sensowne wartości: 1.1 do 1.3 dla wzmocnienia, 0.5 do 0.8 dla osłabienia. **Powyżej 1.5** generator zwykle *„wariuje"* i dorabia dziwne efekty. Narzędzie wstawia liczby automatycznie, nie musisz tego pamiętać.

Czy mogę używać DALL-E za darmo?

Częściowo. **DALL-E 3** jest wbudowany w **ChatGPT**, bezpłatna wersja pozwala wygenerować kilka obrazów dziennie. Pełny dostęp dostajesz w **ChatGPT Plus** ($20 miesięcznie). **Microsoft Copilot** (kiedyś Bing) też używa DALL-E i daje **15 darmowych szybkich obrazów dziennie**, potem wolniej, ale bez limitu. **Midjourney**: tylko płatne, od $10 miesięcznie. **Stable Diffusion**: możesz uruchomić za darmo na własnym komputerze (jeśli masz mocną kartę graficzną) albo w przeglądarce na stronach typu Leonardo AI, Playground.

Co znaczą "--ar 16:9 --v 6" w Midjourney?

To **parametry**, czyli polecenia po dwóch myślnikach: - **--ar 16:9**: proporcje obrazu (aspect ratio). - **--v 6**: której wersji Midjourney użyć (v6 to nowsza, v5.2 starsza i tańsza). - **--style raw**: mniej *„upiększania"*, bardziej naturalnie. - **--no rozmyte**: czego unikać. - **--seed 12345**: liczba, dzięki której obraz da się powtórzyć. Ten sam opis z tym samym seedem daje prawie identyczny obraz. Przydaje się, gdy chcesz wariacje tego samego pomysłu. Narzędzie wstawia parametry samo.

Mogę mieszać style, np. anime z fotorealistycznym?

Możesz, ale ostrożnie. **Midjourney i Flux** zwykle radzą sobie (*„portret w stylu anime, ale fotorealistyczny"*). **Stable Diffusion** może się pogubić, lepiej wzmocnić jedno słowo, a drugie osłabić: anime na 0.7, fotorealistyczny na 1.2. **DALL-E** świetnie miesza, bo rozumie zdania: *„obraz olejny w stylu Van Gogha, ale ze światłem jak na zdjęciu"*. Eksperymentuj: czasem wychodzą zaskakująco dobre rzeczy, czasem totalna pomyłka. To normalne.

Kreator promptów do obrazów AI - darmowy

Jak napisać dobry opis obrazu do Midjourney, Stable Diffusion i DALL-E?

Każdy generator obrazów AI mówi innym językiem. Midjourney lubi krótkie hasła oddzielone przecinkami. Stable Diffusion też lubi hasła, ale niektóre z liczbą obok, która mówi *„to jest dla mnie ważniejsze"*. DALL-E woli całe zdania, jak rozmowę z człowiekiem. Flux jest gdzieś pomiędzy.

Klikasz, co chcesz zobaczyć: temat, styl (np. fotorealistyczny, anime, akwarela), nastrój, światło, sposób kadrowania, paletę kolorów, proporcje obrazu. Możesz też zaznaczyć, czego unikać (*„bez znaków wodnych"*, *„bez rozmytego tła"*).

Narzędzie składa gotowy opis w formacie wybranego generatora. Ten sam pomysł dostajesz w czterech wersjach. Wklejasz tam, gdzie chcesz, i porównujesz, gdzie wyszło najlepiej. Bez zapamiętywania, jak który serwis działa.

Jak używać

Co ma być na obrazie: napisz krótko, kto albo co. Przykład: *„młoda czarownica na miotle"*. Możesz dodać, co robi: *„rzuca zaklęcie nad świecącym kotłem"*.
Wybierz styl z listy: fotorealistyczny, filmowy, anime, obraz olejny, pixel art, cyberpunk, fantasy, minimalizm, akwarela, render 3D. Jeden klik = pakiet pasujących haseł.
Doprecyzuj klimat: nastrój (mroczny, radosny), światło (zachód słońca, neony, świece), kadr (ujęcie z dołu, zbliżenie twarzy), aparat (portret 85mm, makro), paleta (pastele, ciepłe, czarno-białe).
Poziom szczegółu: prosty (szybko, do szkicu pomysłu), zbalansowany (domyślny), bardzo szczegółowy (dłużej generuje, więcej detali, ale czasem przesadza i np. psuje twarze).
Proporcje obrazu (np. 16:9, 1:1): 1:1 do Instagrama, 9:16 do Reels i TikToka, 16:9 do tapety lub miniatury YouTube, 4:5 do pionowych postów.
Lista rzeczy do pominięcia: kliknij gotowe (rozmyte, znaki wodne, brzydkie ręce) albo dopisz swoje. Narzędzie samo wstawi to we właściwe miejsce, każdy generator robi to inaczej.
Wybierz, gdzie wkleisz: Midjourney, Stable Diffusion, DALL-E albo Flux. Format dopasuje się automatycznie. Możesz porównać wszystkie cztery wersje obok siebie.

Kiedy się przydaje

Sześć typowych sytuacji, w których kreator opisów daje Ci konkretną przewagę:

Testujesz ten sam pomysł w kilku narzędziach. Masz koncept (*„wojownik w lesie o zachodzie słońca"*). Klikasz raz, dostajesz cztery wersje opisu (Midjourney, Stable Diffusion, DALL-E, Flux). Wklejasz każdą i wybierasz najładniejszy obraz.
Robisz grafiki na social media. Potrzebujesz post na Instagram (kwadrat 1:1), Reels (pionowo 9:16), tapetę na blog (poziomo 16:9). Klikasz format, narzędzie dopisuje resztę. Nie musisz pamiętać, że Midjourney używa --ar 16:9.
Ilustracje do bloga albo e-booka. Chcesz, żeby wszystkie obrazki w książce wyglądały podobnie. Wybierasz jeden styl (np. *„akwarela"*) i tylko zmieniasz temat każdego z nich. Wszystko wygląda jak z jednej ręki.
Bawisz się stylami. Nie wiesz, jak wygląda *„cyberpunk + fotorealistyczny"*, a jak *„fantasy + akwarela"*. Klikasz, generujesz, widzisz. Nauka przez zabawę.
Mockupy graficzne dla klienta. Klient chce trzy style do wyboru. Składasz trzy opisy, generujesz, pokazujesz. Szybciej niż rysowanie ręczne.
Uczysz się, jak działa każdy generator. Patrzysz, czym Midjourney różni się od Stable Diffusion i widzisz gotowe przykłady zamiast czytać dokumentację.

Pytania i odpowiedzi

Trzymaj się trzech rzeczy: co ma być na obrazie, w jakim stylu, w jakim świetle. Przykład: *„kobieta w czerwonej sukience na dachu wieżowca o zachodzie słońca, fotografia, miękkie złote światło"*. Krótkie hasła po przecinku, bez *„i"*, *„który"*, *„z"*. Na końcu dopisz --ar 16:9 (proporcje obrazu, np. 16:9 dla poziomego). Unikaj długich zdań, Midjourney i tak je rozetnie po przecinkach. Im prostszy opis, tym częściej AI trafia w to, co miałeś na myśli.

Jak napisać dobry opis obrazu do Midjourney, Stable Diffusion i DALL-E?

Jak używać

Co ma być na obrazie: napisz krótko, kto albo co. Przykład: *„młoda czarownica na miotle"*. Możesz dodać, co robi: *„rzuca zaklęcie nad świecącym kotłem"*.

Wybierz styl z listy: fotorealistyczny, filmowy, anime, obraz olejny, pixel art, cyberpunk, fantasy, minimalizm, akwarela, render 3D. Jeden klik = pakiet pasujących haseł.

Doprecyzuj klimat: nastrój (mroczny, radosny), światło (zachód słońca, neony, świece), kadr (ujęcie z dołu, zbliżenie twarzy), aparat (portret 85mm, makro), paleta (pastele, ciepłe, czarno-białe).

Poziom szczegółu: prosty (szybko, do szkicu pomysłu), zbalansowany (domyślny), bardzo szczegółowy (dłużej generuje, więcej detali, ale czasem przesadza i np. psuje twarze).

Proporcje obrazu (np. 16:9, 1:1): 1:1 do Instagrama, 9:16 do Reels i TikToka, 16:9 do tapety lub miniatury YouTube, 4:5 do pionowych postów.

Lista rzeczy do pominięcia: kliknij gotowe (rozmyte, znaki wodne, brzydkie ręce) albo dopisz swoje. Narzędzie samo wstawi to we właściwe miejsce, każdy generator robi to inaczej.

Wybierz, gdzie wkleisz: Midjourney, Stable Diffusion, DALL-E albo Flux. Format dopasuje się automatycznie. Możesz porównać wszystkie cztery wersje obok siebie.

Kiedy się przydaje

Sześć typowych sytuacji, w których kreator opisów daje Ci konkretną przewagę:

Testujesz ten sam pomysł w kilku narzędziach. Masz koncept (*„wojownik w lesie o zachodzie słońca"*). Klikasz raz, dostajesz cztery wersje opisu (Midjourney, Stable Diffusion, DALL-E, Flux). Wklejasz każdą i wybierasz najładniejszy obraz.
Robisz grafiki na social media. Potrzebujesz post na Instagram (kwadrat 1:1), Reels (pionowo 9:16), tapetę na blog (poziomo 16:9). Klikasz format, narzędzie dopisuje resztę. Nie musisz pamiętać, że Midjourney używa --ar 16:9.
Ilustracje do bloga albo e-booka. Chcesz, żeby wszystkie obrazki w książce wyglądały podobnie. Wybierasz jeden styl (np. *„akwarela"*) i tylko zmieniasz temat każdego z nich. Wszystko wygląda jak z jednej ręki.
Bawisz się stylami. Nie wiesz, jak wygląda *„cyberpunk + fotorealistyczny"*, a jak *„fantasy + akwarela"*. Klikasz, generujesz, widzisz. Nauka przez zabawę.
Mockupy graficzne dla klienta. Klient chce trzy style do wyboru. Składasz trzy opisy, generujesz, pokazujesz. Szybciej niż rysowanie ręczne.
Uczysz się, jak działa każdy generator. Patrzysz, czym Midjourney różni się od Stable Diffusion i widzisz gotowe przykłady zamiast czytać dokumentację.

Pytania i odpowiedzi

Kreator promptów do obrazów AI

Jak napisać dobry opis obrazu do Midjourney, Stable Diffusion i DALL-E?

Jak używać

Kiedy się przydaje

Pytania i odpowiedzi

Powiązane narzędzia

Biblioteka gotowych promptów LLM

Generator system prompt

Licznik tokenów LLM

Kreator promptów do obrazów AI

Jak napisać dobry opis obrazu do Midjourney, Stable Diffusion i DALL-E?

Jak używać

Kiedy się przydaje

Pytania i odpowiedzi

Powiązane narzędzia

Biblioteka gotowych promptów LLM

Generator system prompt

Licznik tokenów LLM