Google věnoval úvodní keynote na vývojářské konferenci Google I/O 2024 převážně umělé inteligenci, a její možnosti firma rozšíří i na Androidu. Hlavní novinkou je vylepšení funkce Circle to Search, která se jako první objevila u Samsungů. Stačí zakroužkovat cokoliv na displeji, a Google vám k tomu vyhledá podrobnosti. V průběhu roku začala funkce podporovat překlady v reálném čase, nově pomůže studentům s fyzikálními a matematickými rovnicemi. V budoucnu se funkce rozšíří o řešení komplexních matematických problémů, diagramů a grafů. Do konce roku má být tato funkce až na 200 milionech Androidů.

Gemini v Androidu dokáže reagovat na kontext, tedy na to, co na telefonu právě děláte, nebo na to, co lze vidět v hledáčku fotoaparátu
Gemini na Androidu už nebude obyčejnou aplikací, ale nově dokáže překrýt stávající aplikační okna a dokáže si uvědomit kontext. K němu můžete pokládat doplňující otázky (např. k aktuálně přehrávanému YouTube videu), popř. můžete do aktuálně zobrazené aplikace přetahovat nově vygenerované fotografie. Tyto funkce se do Gemini dostanou v průběhu několika následujících měsíců, a do budoucna chce Google pracovat na tom, aby Gemini umělo daleko dynamičtěji reagovat na to, co máte právě na displeji.
Gemini Nano lépe rozpozná objekty
Google zmínil i multimodální možnosti, které přistanou do Gemini Nano, tedy umělé inteligence, která zůstává na samotném mobilním zařízení a nepotřebuje pro svoji činnost připojení na cloud. Může tak pracovat rychleji, ale také bezpečněji. Stane se tak později v letošním roce a konkrétně u Pixelů.
Telefony od Googlu tak budou schopné nejen zpracovat textový vstup, ale i hlas nebo obraz a zejména také porozumět kontextu. Gemini Nano rozpozná památky, různé zvuky i mluvenou řeč. Profitovat z toho bude i funkce TalkBack, která pomáhá zrakově postiženým. Ti každý den narazí v průměru na 90 objektů, resp. fotek, které telefon nedokáže detailněji popsat. A umělá inteligence by měla zaplnit všechny potřebné mezery.



Gemini na Androidu, to není už jen generování obrázků a tvoření „výcuců“ z dlouhých textů, ale také kontextuální porozumění problému. Z vloženého videa nebo obrázku dokáže Gemini i bez konkrétního zadání rozpoznat situaci a adekvátně ji popsat. Jinými slovy, můžete se zeptat například zcela obecným dotazem „Co je na obrázku špatně?“
Poslední dnešní AI novinka pro Android se týká varování na telefonní podvody v reálném čase. Umělá inteligence Gemini Nano bude v konverzaci hledat známky podvodu, např. toho, kdy se protistrana maskuje za zástupce banky a bude po vás požadovat platbu, detaily platební karty nebo nutný převod vašich peněz na neznámý účet. Veškeré detaily z hovoru přitom zůstanou na zařízení a nebudou se nikam sdílet. Do této funkce se bude možné volitelně přihlásit, detaily však Google oznámí až v průběhu letošního roku.
Zdroj: Google Blog