Tento obrázek jsem nekreslila já.
Vznikl na základě mých pokynů umělé inteligenci, které zněly asi takto: „portrét ilustrátorky šokované tím, že DALL-E umí malovat a kreslit lépe než ona – styl komiksové ilustrace“.
V posledních týdnech jste tuhle zábavu nejspíš zaregistrovali taky. Já sice tento rychlý vývoj AI důkladněji sleduju cca od začátku roku, ale snažila jsem se vám její existenci zatajit. 😉
Protože jako pro ilustrátorku pro mě představuje jasnou hrozbu…
Nebo ne?
Než vám odpovím, přidám rychlý úvod pro ty, co zatím neměli čas se v tématu porozhlédnout.
Jde o to, že se v posledních měsících dostalo na veřejnost několik programů se strojovým učením, které se specializují na generování obrázků podle slovního zadání.
❗ Podobné programy existují už dlouhou dobu, ale dřív k nim mělo přístup jen omezené množství umělců či tvůrců. Generování obrazu bylo taky hodně zdlouhavé (zabralo i několik hodin), průlom tak nastal i v případě zrychlení.
Sociální sítě a články tak teď začaly zaplavovat série obrázků tvořené za pomoci zcela nového nástroje – umělé inteligence. Lidé jsou tím pochopitelně nadšení, minimálně dokud jim nedojde free kredit na všech dostupných nástrojích.
👉 A na všech frontách se vedou diskuze o tom, co bude tento průlom znamenat pro kreativní profese.
V současné době je možné vybírat z několika nástrojů s volným nebo částečně omezeným přístupem, do většiny z nich budete potřebovat minimálně registraci účtu. Nejznámější jsou DALL-E, Midjourney, Stable Diffusion a NightCafe.
Jejich kvalita, možnosti, ovládání i výstupy se výrazně liší. Úvodní obrázek tohoto článku vznikl za pomocí nástroje DALL-E, tento obrázek vznikl pomocí NightCafe za použití stejného slovního zadání:
Jediným nástrojem s naprosto neomezeným přístupem bez registrace je Craiyon, beta verze DALL-E, který má ale velmi omezené výstupy.
To je vidět i na ukázce, kdy jsem opět použila stejné zadání jako v úvodu článku:
Z dlouhodobého pozorování potom nejlíp vychází nástroj Midjourney, který má poměrně propracované a přitom soudržné (a občas i nápadité) výsledky. Ne nadarmo obrázek vygenerovaný s jeho pomocí vyhrál soutěž.
Na ukázce je výsledek stejného zadání jako v úvodu článku. Vidíme, že Midjourney mnohem líp zvládá vykreslení obličeje a celkovou „pohlednost“ obrázku. Naopak vůbec nezohledňuje emoci zděšení ze zadání a nepřidává ani výrazné rozpoznávací znaky ilustrátorky:
Zadání s postavami a emocemi jsou však pro AI jedny z nejnáročnějších, ukážeme si srovnání u jednoduššího úkolu.
Na ukázce vidíme srovnání výsledků mezi DALL-E (vlevo) a Midjourney (vpravo) při použití stejného zadání: „otevřené středověké dveře do jiné dimenze, magie, světla, příroda, tajemství, ultrarealistické“. Na první pohled je vidět větší propracovanost i uvěřitelnost výsledku z Midjourney.
To vypadá dobře, že? Takže mám radši hledat nový obor?
Nemyslím si.
Jakkoli je umělá inteligence zajímavý nový obzor, zatím má spoustu mušek i much. Nebudu zmiňovat, že má obvykle velký problém s vykreslením obličeje (ani na jedné z ukázek není obličej zachycený uspokojivě, dokonce i Midjourney má divný tvar očí). Nebo že často obsahuje spoustu chybek, šumů nebo tvarových nesrovnalostí.
To jsou věci, které se nejspíš poměrně rychle naučí vyřešit.
Co se však naučí obtížněji?
Než jsem se pustila do tohoto článku, udělala jsem si menší rešerši názorů v mé sociální bublině. Postupně zaznělo několik opravdu palčivých problémů, na které jsem sama při testování AI narazila:
Duše: někteří ji prostě v počítačových obrázcích nevidí a vnímají to jako zásadní problém z hlediska hloubky a energie obrázku.
Brand: s počítačem neproberete podrobnosti o své značce, nezeptá se vás na zásadní otázky, nedonutí vás zamyslet se nad jádrem vašeho byznysu.
Péče: s počítačem si taky nepopovídáte, nenavážete vztah, nedokáže postihnout váš vývoj v dlouhodobé spolupráci a nepřipraví vám potřebné velikosti obrázků pro web a sítě.
Styl: většina AI nástrojů má několik výrazných stylů, které se neustále opakují. Rozhodně neumějí generovat styl přesně na míru vaší značce, protože jsou (a vždy budou) závislé na objemu předlohových obrázků.*
Marketingový nápad: AI za vás nevymyslí, jaký motiv nejlíp vystihuje vaši značku, jaký motiv ukáže prodejní argumenty, jaký motiv vypíchne vaši konkurenční výhodu.
Soudržnost: AI má problém vygenerovat víc obrázků v jasně soudržném stylu, u větších souborů tak vzniká problém „každý pes, jiná ves“.
Zadání: formulovat zadání (tzv. „prompt“) tak, aby byl výsledek uspokojivý, není úplně snadné – ne nadarmo pomalu vzniká nový obor „promt manažer“, což je člověk, který zadává příkazy umělé inteligenci.
Směr a korekce: sama od sebe AI netvoří, někdo musí zadat příkaz. Ale hlavně výsledek pak někdo musí kontrolovat, opravit, navrhnout změny a nakonec vybrat nejlepší variantu. A aby to mohl udělat, musí umět poznat, kdy a proč to vypadá „správně“ – z různých hledisek.
Na pozadí těchto problémů mi přijde nereálné, že by si klienti v dohledné době hromadně generovali AI obrázky a už nikdy nepotřebovali žádnou ilustrátorku či aspoň odbornou pomoc.
Když mám konkrétní představu o motivu a stylu, je to s AI docela oříšek. Přibližně po desátém pokusu o dostatečně konkrétní a názornou formulaci (a vyčerpání značného množství volných kreditů) odcházím k tabletu a za několik minut svůj požadavek jednoduše a velmi konkrétně nakreslím.
AI je mnohem spíš prostě další nástroj. Jsem stále otevřená AI v budoucnu zapojit do své tvůrčí rutiny, pokud to bude urychlovat práci nebo přinášet jednoznačnou výhodu. Zatím nepřináší.
Jsou ale lidé, pro které může v určitých situacích dávat dokonalý smysl AI obrázky použít. Práce AI vás nejvíc uspokojí, pokud vám stačí abstraktní obrázky čistě pro dokreslení nálady.
👉 Suma sumárum: vnímám AI jako velmi uspokojivou alternativu fotobanky – dřív jste hledali obrázky tam, teď je zkoušíte zadat počítači.
V některých případech to může stačit.
A někdy prostě zjistíte, že radši napíšete ilustrátorce. 😉
Jak to vnímáte vy?
Máte zkušenost s generováním obrázků?
Připadají vám výsledky uspokojivé?
Vidíte v tom pro sebe budoucnost v pořizování obrázků?
Přidejte se do diskuze u mě do skupiny Vybarvi se online.
Těším se tam na vás!
* Závislost AI na předloze v podobě existujících autorských děl je nejproblematičtější moment celého tématu. Jedná se vlastně o elegantní a velmi efektivní krádež práce jiných autorů. Elegantní proto, že je to kopie tak velkého množství děl, že už to nikdo nikdy nedostopuje. Efektivní proto, že podobná elegantní krádež by samozřejmě šla udělat i cestou fotomontáže, ale trvalo by to mnohem dýl, takhle je to otázka jednoho kliku. Když potom autoři vidí díla nerozeznatelná od svého vlastního rukopisu, která ve velkém chrlí AI, můžou jen stěží prokázat, že se jedná o plagiát. Technicky nejedná. Zatím. Tohle by se mělo změnit.
0 komentářů