Už před pár lety nám výrobci tvrdili, že mají smartphony s pokročilou umělou inteligencí. Ve skutečnosti se však jednalo jen o strojové učení, které zjišťovalo, co s telefonem děláte, a podle toho optimalizovalo spouštění aplikací. Qualcomm však na veletrhu MWC v Barceloně prezentoval možnosti skutečné umělé inteligence, která pomocí algoritmu Stable Diffusion 1.5 u čipsetu Snapdragon 8 Gen 2 dokáže lokálně vygenerovat obrázek podle textového zadání. A to za pouhých patnáct sekund.
Jistě, technologie má ještě několik omezení, je to první důležitý krok k tomu, aby bylo možné umělou inteligenci efektivně využívat ke generování grafiky v offline režimu přímo na mobilních zařízeních. Vysoký výpočetní výkon smartphonů má vlastně po letech konečně smysl.
Největší krok v mobilní umělé inteligenci
Vystavený referenční telefon byl v režimu letadlo, tedy bez jakékoliv konektivity. V aplikaci s názvem Stable Diffusion stačilo jen textově popsat obrázek, který záhy zhmotnila umělá inteligence. Postup tvorby bylo možné vidět v reálném čase, kdy se „z mlhy“ vynořila hotová fotografie. Telefonu zabrala tvorba fotografie cca 15 sekund, musíme však dodat, že výsledná grafika měla rozlišení 512 × 512 pixelů.

Stable DIffusion hlásí hotovo! Obrázek s rozlišením 512 × 512 byl dle zadání vygenerován za necelých 15 sekund
Rozlišení je nízké, doba generování dlouhá, jenže na smartphone jsou to skvělé výsledky. V některých případech dokonce rychlost lokálního generování překonává i počítače. Aplikace je součástí interního projektu Qualcomm AI research, a tentokrát se polovodičový gigant hodně vytáhl.

Ukázkové výstupy při zadání popisu: „#Japanese garden at wildlife river and mountain range, highly detailed, digital illustration, artstation, concept art, matte, sharp focus, illustration, dramatic, sunset, hearthstone, art by Artgerm and Greg Rutkowski and Alphonse Mucha.“
Qualcomm celé řešení ukazoval jako koncept, u něhož nedovolil ukládat žádné hotové snímky. V naší galerii tak vidíte výstupy, které firma zveřejnila v rámci tiskové zprávy. V té se taktéž uvádí, že technici Qualcommu museli u umělé inteligence provést řadu optimalizací, a tak ani není jasné, zda zůstane jen u ukázky, nebo Qualcomm postupem času zveřejní tuto aplikaci i k „domácímu testování“.
Zatím jen jako velmi nadějné demo
O tom, že se jedná o koncept, svědčí i to, že na jeden konkrétní dotaz byl vygenerován jeden obrázek. Pokud jste nechali úplně stejný textový popis, na nově generované grafice se nezměnilo vůbec nic. To však může být jen otázka interního nastavení aplikace, která v rámci „výpočetní úspory“ negeneruje nové obrázky, pokud je vstupní řetězec úplně stejný. U oficiální grafiky Qualcomm totiž na jeden dotaz přiložil čtyři hned ukázkové výstupy. Stable Diffusion dnes už úspěšně funguje na webu, ovšem je náročný na čas, finance i výpočetní výkon. Mít jej v mobilu, to otevírá úplně nové možnosti využití.

Další ukázka mobilního Stable Diffusion. Tentokrát na dotaz: „#Super cute fluffy cat warrior in armor, photorealistic, 4K, ultra detailed, vray rendering, unreal engine.“
Na generování grafiky v offline režimu o vyšším rozlišení bychom si u smartphonů ochotně počkali déle...
Stable Diffusion 1.5 u Snapdragonu 8 Gen 2: