Potřebuješ poradit? Vyber si z nabídky příruček nebo si domluv konzultaci v naší digitální poradně!

Předpokládaná doba čtení: 15 minut

Srovnání AI obrazových generátorů

S generátory obrázků se zabudovanou umělou inteligencí se roztrhl pytel a začíná být složité zorientovat se, který co umí a neumí. Jak si mezi nimi vybrat? Tento článek popisuje více podrobně 4 AI generátory a tak upozorňujeme na delší rozsah článku.
Shoptet vs Woocommerce

Nelze jednoznačně určit, který generátor je nejlepší, který toho umí nejvíce a který se používá nejsnadněji. Každý z nich má své specifické funkce, které ten druhý nemá. Některé z generátorů jsme vyzkoušeli a sepsali pár poznatků.

Midjourney

AI generátor Midjourney byl jeden z prvních generátorů v digitálním světě. Hned první zvláštností tohoto generátoru je fakt, že samotné tvoření obrázků probíhá na Discordu, což je komunikační (chatovací) platforma. Midjourney má veřejný charakter. To znamená, že vše můžete sdílet s ostatními uživateli, pokud chcete. Samotné vytváření obrázků funguje na principu komunikace s botem na Discordu. Do chatovacího řádku se zadávají příkazy (prompty) a to buď ve veřejných chatovacích místnostech, kde následně vaše výtvory vidí i ostatní uživatelé, nebo v soukromé komunikaci s botem. To je ovšem možné pouze při zakoupení členství. Všechny vaše vytvořené obrázky jsou pak ukládány v galerii na profilu v Midjourney.

v Midjourney vygenerované obrázky s avokádem
Čtveřice obrázků vygenerovaných v Midjourney – „Avokádo na stole“

Neplacená verze

Neplacená verze je omezena počtem vygenerovaných obrázků. Prvních cca 25 obrázků můžete vygenerovat zdarma, ale tím to jednou pro vždy hasne. Žádné obnovení „free kreditů“ se nekoná a žádné kredity nelze dokoupit. Pokud chcete dále tvořit, je nutné si koupit jedno z typů měsíčního členství, které Midjourney nabízí.

Měnou na Midjourney je tzv. GPU-minuta případně GPU-hodina (GPU = graphics processing unit = grafický procesor). Výchozí nastavení pro vygenerování jednoho obrázku odpovídá přibližně 1 GPU-minutě. V závislosti na zadaných parametrech v promptu (příkazu) lze regulovat náklady na jeden obrázek. Midjourney nabízí pro fyzické uživatele dva typy členství plus jedno pro firmy. My si řekneme více o členství Basic a Standard pro běžné uživatele.

Reklamní vizuál od umělé inteligence
Vizuální podklad reklamy na restauraci generovaný v Midjourney

Placená verze

Členství Basic zahrnuje 200 GPU-minut za $10 + tax/měsíc. To by mělo vystačit cca na 200 obrázků a po vyčerpání minut již dále není možné tvořit. Je to tedy spíše pro občasné uživatele. Nezdá se to, ale 200 GPU-minut je fuč během chvilky. Druhý typ členství, tedy Standard, je už o něco výhodnější. Za $30 + tax/měsíc budete mít k dispozici 15 GPU-hodin.

Midjourney umí tvořit ve dvou módech – Fast a Relax. Fast mód je automatický pro všechny typy členství. V členství Standard je možné zvolit režim Relax a tím šetřit GPU čas. V Relax režimu ve členství Standard je možné tvořit i poté, co vyčerpáte 15 GPU-hodin. Můžeme tedy říct, že Midjourney umožňuje v členství Standard neomezené množství času pro generování obrázků, ale pozor – po vyčerpání 15 GPU-hodin, kdy automaticky naskočíte do režimu Relax, se omezí některé funkce a generování obrázků se zpomalí. K opětovnému zrychlení a obnovení funkcí dojde při obnovení GPU-hodin, což je v den další měsíční automatické platby. Po obnovení členství automaticky skočíte opět do režimu Fast.

ceník Midjourney

Chatování s botem na Discord

Ať už máte placenou či neplacenou verzi Midjourney, musíte mít vytvořený účet na Discordu. Discord je komunikační platforma, která funguje zdarma i v prohlížeči. Na Discordu pošlete chatovou zprávu Midjourney botovi a na základě toho vám během pár vteřin vygeneruje čtyři varianty vašeho obrázku. Pokud nezadáte bližší informace o stylu, barvách, kvalitě atd., tak vykreslí obrázky ve svém osobitém stylu. Obecně platí, že Midjourney je spíše více uměleckým nástrojem, než aby vykresloval obrázky v realistické podobě. My jsme pro příklad zadali jednoduchý prompt „Avocado on a table“. V galerii se můžete podívat jak si s tímto příkazem Midjourney poradil. Samozřejmě by to zvládl i lépe, pokud bychom více specifikovali různé parametry. Pro naše účely to prozatím stačí. Stejný prompt jsme zadali i do ostatních generátorů, abychom mohli porovnat výstupy.

pokus o logo Apple pomocí AI
Zkušební redesign loga na Apple generovaný v Midjourney

Tyto výstupy samozřejmě nemusí být výsledným produktem. Obrázky lze dále upravovat, vytvářet variace, upscalovat až do rozměru 2048×2048 px v případě čtverce. Více se nám zatím nepodařilo upscalovat. U obdélníku se maximální rozlišení různí podle poměru stran. Ovšem funkce se na Midjourney neustále rozrůstají, stejně tak jako schopnosti celého generátoru. Je možné, že i maximální rozlišení bude postupně stoupat. Midjourney má řadu příkazů, které se zadávají na konec promptu. Tím lze ovlivnit například velikost, míru realističnosti, jak moc se bot má vykreslením obrázku zabývat apod. Midjourney je velmi proaktivní, co se týče inovací. Například nejnovějším updatem na verzi 4 nechává daleko za sebou své předešlé verze a také již zmíněný osobitý Midjourney „signature“ styl. Verze 4 lépe reaguje na komplikovanější zadání, není tak obtížné vysvětlit botovi, co přesně by na obrázku mělo být. Záleží na preferencích a kdykoliv se lze vrátit do předešlých verzí. Tato nejnovější verze zatím neumí tvořit v jiném než čtvercovém tvaru (platí k 20.11.2022).

Více o funkcích Midjourney si řekneme v příštím článku.

plakát od umělé inteligence
Plakát na závody starých aut generovaný v Midjourney

Dall-E 2

Generátor obrázků Dall-E 2 je už dnes přístupný pro všechny a lze ho vyzkoušet zdarma. To znamená, že už není nutné se registrovat na waitlist a čekat na pozvánku. Při prvním přihlášení může prostředí Dall-E 2 působit trochu jednoduchým dojmem oproti Midjourney.

Do začátku dostanete 50 kreditů a každý další měsíc 15 kreditů zdarma. Oproti Midjourney je tedy šance si službu více vyzkoušet, než si zakoupíte další kredity. Pokud vás generování obrázků nadchne a rozhodnete se zakoupit kredity, bude vás to stát $15 za 115 kreditů. Čekali byste, že čím více jich koupíte, tím méně zaplatíte? Ne. Je to úplně jedno, ať si jich koupíte kolik chcete, pořád to vyjde nastejno.

Avokado na stole Dall-E 2
„Avokádo na stole“ generované v Dall-E 2

Výstupy z Dall-E 2

Dall-E 2 tvoří na základně vašeho příkazu spíše realistické výstupy, pokud nebudete obrázek více specifikovat. Jak se povedlo „avokádo na stole“, můžete vidět v galerii. Aby byl výsledek trochu kreativní a nepřipomínal obyčejnou fotku, je nutné se trochu rozepsat a snažit se lépe popsat, jak by měl výsledek vypadat.

„Avokádo na stole“ generované v Dall-E 2

Dall-E 2 vytvoří na jeden prompt také vždy čtyři variace, které lze dále upravovat. Za každé vygenerování je stržen jeden kredit a to platí i pro generování dalších variací na již existující obrázek. V praktickém postranním panelu můžete vidět poslední vygenerované čtveřice obrázků a mezi nimi rychle vybírat. U variací pak vždy vidíte i originální obrázek, který byl použit pro vytvoření těchto variací. Rozlišení výstupu je 1024 x 1024 px. Na rozdíl od Midjourney ale obrázky nelze více vykreslovat a upscalovat. Jediný tvar, který Dall-E 2 vygeneruje po zadání promptu, je čtverec. Ovšem je tu možnost, jak výsledné rozlišení plátna a tvar změnit.

Avokádo na stole generované v Dall-E 2
„Avokádo na stole“ generované v Dall-E 2

Pokročilejší funkce

Obrovskou předností Dall-E 2 je totiž možnost rozšiřování obrázku do stran, nahoru, dolu, jak je libo. Okolo celého obrázku lze přidat další navazující čtverce o stejném rozměru. Takže přidáte 3 čtvercové obrázky ke svému výtvoru a máte dvojnásobné rozlišení. Nebo přidáte jeden čtverec nad nebo pod obrázek a máte obdélník na výšku. Dokonce lze vygumovat určité části hotového obrazu, které se vám nelíbí a ty přetvořit. V editoru jednoduše zvolíte gumu, nastavíte si velikost a vymažete části obrázku, které chcete změnit. Samozřejmě je nutné znovu popsat, co by se ve vygumované oblasti mělo nacházet. Pak už jen dáte generovat a opět dostanete čtyři nové variace. Ostatní části obrázku zůstanou beze změny. Pokusili jsme se vytvořit úplně jednoduchý příklad, jak lze dosáhnout větších obrazů pomocí Dall-E 2 rozšířením původního obrazu do strany. Začali jsme pomerančem a postupně do stran přidávali další ovoce.

Rozsireny obrazek z Dall-E 2
Rozšířený obrázek generovaný v Dall-E 2

Velkou nevýhodou Dall-E 2 je, že neukládá do galerie rozšířené varianty obrázků, ale pouze všechna nová rozšíření samostatně. Rozšířený obraz v jednom celku je nutné uložit do počítače. Pokud ho chcete dále upravovat, musíte ho nahrát zpět do Dall-E 2 a pak můžete pokračovat v úpravách. Na to upozorňuje i samotné Dall-E 2, které je zatím stále v beta verzi. Dotvořené a rozšířené obrázky se do galerie neuloží a pokud kliknete špatně, může celá práce přijít vniveč. Ale budete mít stále k dispozici všechna nová rozšíření obrázku, která si pak můžete dohromady poskládat v jakémkoliv grafickém programu. Dall-E 2 také umožňuje upload vlastní fotografie či obrázku. Ty můžete upravovat v editoru a dotvářet okolí vlastní fotografie o nové prvky. Je to super zábava, ale člověk musí přemýšlet, jinak vystřílí kredity během chvíle.

DreamStudio Lite

DreamStudio je nástroj vyvinutý týmem ze stability.ai. Přihlásit se lze pod Google účtem a do začátku je poskytnuto zdarma 200 jednorázových kreditů. Pro tvoření dalších obrázků je nutné si kredity přikoupit. Například za $10 pořídíte cca tisíc dalších pokusů na generování obrázků. Ve výchozím nastavení odpovídá jeden vygenerovaný obrázek hodnotě jednoho kreditu, což se dá regulovat nastavením parametrů obrázku.

„Avokádo na stole“ generované v DreamStudio

Základní velikost obrázku je nastavena na 512 x 512 px, což lze změnit až na dvojnásobek. Nastavením větších rozměrů ale zvyšujete náklady na vygenerování jednoho obrázku. Stejně tak pokud budete zvyšovat počet kroků, které má DreamStudio vynaložit na vygenerování obrázku. Například jeden obrázek sestavený během 50 kroků o velikosti 512 x 512 px bude stát 1 kredit. V parametrech je také defaultně nastaven pouze jeden generovaný obrázek, ale DreamStudio umí až devět variací na jeden prompt najednou. Každá další variace navíc navyšuje počet stržených kreditů. Nastavit můžete i stupeň přesnosti, neboli jak moc se má výstup blížit promptu. Čím vyšší hodnota, tím více by se měl generátor držet zadání. Čím nižší, tím více prostoru mu necháváte pro kreativitu.

Obrázek vygenerovaný pomocí DreamStudio
Obrázek generovaný v DreamStudio

Historie generování je uložena v historii prohlížeče. Jakmile vymažete údaje o prohlížení, tak zmizí i historie generování v DreamStudiu. To asi není taková pohroma, protože z historie už si obrázek stejně nelze stáhnout. Pokud se vám tedy podaří vygenerovat něco kloudného, tak je potřeba si to stáhnout ihned po vygenerování. Později už to není možné. Historie je dobrá pouze pro zkopírování promptu, nebo pro použití tlačítka „redream“ u obrázku. Tato funkce vytvoří na obrázek v historii novou variaci. V galerii najdete jen 100 posledních vygenerovaných obrázků a to ovšem jen do té doby, než smažete v prohlížeči údaje o prohlížení. Každý z obrázků má své tzv. seed number, což je unikátní číslo pro každý vygenerovaný obrázek. Toto číslo lze zadat do parametrů v nastavení a generátor se pak bude snažit vytvořit na základě promptu a vloženého seedu nový obrázek. Jak DreamStudio vytvořilo náš jednoduchý požadavek na „avokádo na stole“ můžete vidět v galerii.

Přímo v DreamStudiu je editor, kde lze obrázek ještě editovat. Podobně jako v Dall-E 2 můžete vymazat některé části obrázku a ty se pak vygenerují znovu. Je to celkem fajn funkce, která třeba na Midjourney chybí.

obrazek vygenerovany v DreamStudio
Obrázek generovaný v DreamStudio

Wombo Dream

Wombo Dream je nástroj, který funguje v prohlížeči zcela zdarma. Vyzkoušet si ho můžete i bez přihlášení, ale obrázky se vám neuloží do galerie. Abyste mohli nahlížet do historie vygenerovaných obrázků, lze se jednoduše přihlásit pomocí Google účtu. Prompt může obsahovat 200 znaků (včetně mezer) a je nutné zvolit jeden z nabízených stylů. Vygeneruje se jeden obraz, který si můžete uložit do galerie kliknutím na tlačítko „publish“. Jakmile na to zapomenete a obrázek si ani nestáhnete, nenávratně o něj přijdete. Pokud se vám obrázek nelíbí, můžete vytvářet nové a nové variace. Obrázky jsou generované pouze v orientaci na výšku a rozměr ani kvalitu nelze ovlivnit.

Wombo Dream můžete používat i jako mobilní aplikaci, ve které se otevírá více možností než v prohlížeči. Používání aplikace je zdarma, takže sem tam reklama, ale pro odemčení dalších funkcí je nutné si zakoupit Premium účetMěsíční předplatné vychází na cca $včetně daně. Mezi výhody placené verze patří odemknutí dalších stylů, generování 4 obrázků namísto jednoho, historie zadaných promptů, tmavý režim aplikace, vytváření variací a další.

Stejně jako do ostatních výše zmíněných generátorů, tak i do Wombo Dream lze nahrát vlastní obrázek a nechat ho upravit pomocí umělé inteligence. Wombo Dream je poměrně rychlý generátor a během pár sekund dokáže vygenerovat celkem pěkné obrázky. Jediný rozměr, který tento nástroj dokáže udělat, je 960×1568 px. Hodí se dobře pro vytváření tapet na plochy mobilních telefonů. Dokáže vytvořit oku lahodící kompozice a zajímavě vyplnit celý prostor obrázku. Je to vhodný nástroj pro ty, kteří si chtějí generování obrázků vyzkoušet, nechtějí hned utrácet a zároveň mít  kvalitní obrázky. Jak si poradil Wombo Dream s naším zadáním „avokádo na stole“ můžete vidět v galerii.

avokado na stole generovane ve Wombo Dream
„Avokádo na stole“ generované ve Wombo Dream

Co říci závěrem?

Je asi jasné, že záleží na osobních preferencích a očekáváních každého člověka. Každému mohou vyhovovat jiné funkce, rozměry, ceny, kvalita či styly výstupů. Vyzkoušet již lze všechny veřejně známé generátory bez nutnosti čekání na pozvánku. Do některých se lze registrovat Google účtem, ale třeba do Midjourney je registrace trochu náročnější. Po vyzkoušení free verzí generátorů se stačí rozhodnout, zda budete tvořit jen pro sebe a pro zábavu, nebo budete tvořit na profesionální úrovni. Nejpokročilejší funkce nabízí AI generátor Midjourney, kde lze tvořit v mnoha stylech, rozměrech a lze výstupy dále upravovat. Také nabízí nejlepší rozlišení obrázku. Toho v Dall-E 2 docílíte také a to pomocí rozšiřování o nové obrázky do stran, což je trochu namáhavější. Finální rozlišení je ale neomezené. Dall-E 2 nabízí realističtější výstupy podobné fotografiím. Midjourney umí velmi umělecké výstupy. Docílíte i realistických výstupů připomínajících fotografii, ale daný prompt musíte velmi podrobně rozepsat. DreamStudio má velmi problematickou práci s galerií obrázků a jeho výstupy jsou ve velmi malém rozlišení. Wombo Dream zase umí obrázky pouze na výšku a v nižším rozlišení oproti Midjourney a Dall-E 2. Takže vyzkoušejte všechny a sami uvidíte. Třeba budete nakonec ve své tvorbě kombinovat více generátorů.

Na závěr ještě přikládáme tabulku s přehlednými informacemi. Myslete na to, že umělá inteligence se nyní velmi rychle vyvíjí a s tím se budou měnit i její funkce a cenové plány. Aktuální informace proto vždy hledejte na oficiálních stránkách vývojářů AI.

srovnání cen jednotlivých obrazových generátorů s umělou inteligencí

Použité zdroje:

https://runesnielsen.com/news/2022/8/18/ai-art-and-why-its-a-whole-new-game-with-stable-diffusion

https://dataconomy.com/2022/09/ai-art-how-to-use-wombo-dream-app-prompts

https://www.makeuseof.com/ai-text-to-art-generators

https://www.unite.ai/10-best-ai-art-generators

https://www.youtube.com/watch?v=ZRox1WHqZWs

https://docs.midjourney.com/docs/plans

20.11.2022, Sonet Studio Dream Team

9

KONTAKTUJ NÁS

hodnocení Google

Sleduj nás i na sociálních sítích

Jsme součástí programu DoToho!

Mohly by tě zajímat i tyto články

Kontakt

Rychlá zpráva | poptávka:

Odesláním formuláře souhlasíte se zpracováním osobních údajů.