Gemini AI ještě víc proroste do Androidu. Porozumí, co na telefonu děláte, co fotíte a naštěstí si to nechá pro sebe

  • Google I/O je prakticky celá věnovaná umělé inteligenci
  • Část novinek se týká i operačního systému Android
  • Vděčíme za to vylepšením v Gemini a Gemini Nano

Google věnoval úvodní keynote na vývojářské konferenci Google I/O 2024 převážně umělé inteligenci, a její možnosti firma rozšíří i na Androidu. Hlavní novinkou je vylepšení funkce Circle to Search, která se jako první objevila u Samsungů. Stačí zakroužkovat cokoliv na displeji, a Google vám k tomu vyhledá podrobnosti. V průběhu roku začala funkce podporovat překlady v reálném čase, nově pomůže studentům s fyzikálními a matematickými rovnicemi. V budoucnu se funkce rozšíří o řešení komplexních matematických problémů, diagramů a grafů. Do konce roku má být tato funkce až na 200 milionech Androidů.

Klepněte pro větší obrázek
Gemini v Androidu dokáže reagovat na kontext, tedy na to, co na telefonu právě děláte, nebo na to, co lze vidět v hledáčku fotoaparátu

Gemini na Androidu už nebude obyčejnou aplikací, ale nově dokáže překrýt stávající aplikační okna a dokáže si uvědomit kontext. K němu můžete pokládat doplňující otázky (např. k aktuálně přehrávanému YouTube videu), popř. můžete do aktuálně zobrazené aplikace přetahovat nově vygenerované fotografie. Tyto funkce se do Gemini dostanou v průběhu několika následujících měsíců, a do budoucna chce Google pracovat na tom, aby Gemini umělo daleko dynamičtěji reagovat na to, co máte právě na displeji.

Gemini Nano lépe rozpozná objekty

Google zmínil i multimodální možnosti, které přistanou do Gemini Nano, tedy umělé inteligence, která zůstává na samotném mobilním zařízení a nepotřebuje pro svoji činnost připojení na cloud. Může tak pracovat rychleji, ale také bezpečněji. Stane se tak později v letošním roce a konkrétně u Pixelů.

Telefony od Googlu tak budou schopné nejen zpracovat textový vstup, ale i hlas nebo obraz a zejména také porozumět kontextu. Gemini Nano rozpozná památky, různé zvuky i mluvenou řeč. Profitovat z toho bude i funkce TalkBack, která pomáhá zrakově postiženým. Ti každý den narazí v průměru na 90 objektů, resp. fotek, které telefon nedokáže detailněji popsat. A umělá inteligence by měla zaplnit všechny potřebné mezery.

Klepněte pro větší obrázekKlepněte pro větší obrázekKlepněte pro větší obrázek
Gemini na Androidu, to není už jen generování obrázků a tvoření „výcuců“ z dlouhých textů, ale také kontextuální porozumění problému. Z vloženého videa nebo obrázku dokáže Gemini i bez konkrétního zadání rozpoznat situaci a adekvátně ji popsat. Jinými slovy, můžete se zeptat například zcela obecným dotazem „Co je na obrázku špatně?“

Poslední dnešní AI novinka pro Android se týká varování na telefonní podvody v reálném čase. Umělá inteligence Gemini Nano bude v konverzaci hledat známky podvodu, např. toho, kdy se protistrana maskuje za zástupce banky a bude po vás požadovat platbu, detaily platební karty nebo nutný převod vašich peněz na neznámý účet. Veškeré detaily z hovoru přitom zůstanou na zařízení a nebudou se nikam sdílet. Do této funkce se bude možné volitelně přihlásit, detaily však Google oznámí až v průběhu letošního roku.

Zdroj: Google Blog

Diskuze (19) Další článek: T Phone 2 je podstatně vylepšená řada 5G telefonů od T-Mobile. Od procesoru až po 120Hz displeje a rychlejší nabíjení

Témata článku: Google, , , , , , , Google blog, Funkce, Novinka, Telefon, TalkBack, Gemini Nano, Gemini AI, Circle ten Search, Google I / O,