Šest týdnů po uvedení nové architektury v9 Arm představil i první procesorová jádra na nich postavená. Ta pak doplní i o čtyři grafické čipy nové generace. V obou případech roste výkon i efektivita. V prvních produktech se jich dočkáme příští rok.
Cortex-X2
Nejvýkonnějším procesorovým jádrem nové rodiny Armu bude Cortex-X2. Jeho předchůdce X1 plní roli top jádra ve Snapdragonu 888 a Exynosu 2100. U novinky Arm věří v rychlou adopci jak u špičkových mobilů, tak i notebooků. X2 slibuje lepší predikci větvení, má o 30 % větší reorder buffer a o jeden cyklus kratší pipeline.
Podle Armu by měl jeho celočíselný výkon stoupnout oproti X1 až o 16 %, výkon ve strojovém učení pak bude dvojnásobný. Armv9 totiž s sebou přináší i vektorové jednotky pomáhající v AI a vědeckých výpočtech, v případě X2 se využívají SVE2 o šířce 128 bitů. SVE znamená křemík navíc, ten ale Arm ušetřil tím, že z jádra odstranil podporu 32bitových instrukcí, jde tedy o plně 64bitový procesor.
Nové mobily s jádry Cortex-X2 mají nabídnout až o 30 % vyšší než ty stávající (zdroj: Arm)
Cortex-X2 se bude v mobilech nejčastěji používat v jednojádrové variantě, avšak špičkové čipy mohou nabídnout i čtyři jádra v kombinaci s novými Cortexy-A710, o nichž bude řeč v další kapitole. Do notebooků pak budou moci zamířit i osmijádrové procesory tvořené pouze jedním klastrem jader X2. Jednovláknový výkon X2 je podle Armu až o 40 % vyšší než u Intelu i5-1135G7.
A jak je na tom IPC v porovnání s ostatními Cortexy? Jako základ mějme dva roky starý model A77, který ještě dnes najdeme ve spoustě mobilů. Cortex-A78 zvýšil výkon o 7 %. Cortex-X1 je o 20 % výkonnější než A78. A Cortex-X2 pak o zmíněných 16 % před X1.
Cortex-A710
Áčková jádra přecházejí na trojciferné značení. Nový Cortex-A710 je tak nástupcem loňských A78 a bude plnit roli výkonných zároveň efektivních dříčů. I zde došlo na úrovni mikroarchitektury k několika změnám. Arm rovněž zkrátil pipeline i jeden cyklus na celkových deset, snížil se počet instrukcí za cyklus z 6 na 5, Arm zlepšil predikci větvení a L1 TLB zvětšil o polovinu.
Díky úpravám by Cortex-A710 měl být o 10 % výkonnější než A78, případně při stejném výkonu o 30 % úspornější. AI výkon i zde stoupl na dvojnásobek. A710 na rozdíl od X2 stále podporuje i 32bitové instrukce, ale podle Armu již všechna jádra od roku 2023 budou pracovat jen s AArch64. Potenciální jádra A711 či A720 již tedy budou očesaná.
Cortex-A710 (zdroj: Arm)
Nárůsty výkonu u všech oznámených jader od Armu je nicméně třeba brát trochu s rezervou. Nová platforma DSU-110, v rámci níž firma jednotlivé klastry různých procesorových jader propojuje, totiž nově může nést až 16 MB sdílené vyrovnávací paměti L3, kdežto u předchůdců to bylo maximálně 8 MB. Větší cache tak může hrát důležitou roli, a přitom její dostupnost ani kapacita není v koncových produktech garantovaná. Je totiž volitelná, avšak Arm s ní v marketingu počítá, a to rovnou v plné velikosti.
Cortex-A510
Cortex-A710 je hierarchii Armu označen jako big, nový Cortex-A510 bude LITTLE. Po čtyřech letech od uvedení jader A55 jsme se tak dočkali nových úsporných jednotek, které v řadě levných mobilů a další elektroniky najdeme i bez podpory silnějších jader A7x.
Kvůli dlouhé odmlce zde Arm přichystal nejvíce změn z celé nové rodiny. Zpracování instrukcí zůstává in-order, ale nově zpracuje tři místo dvou instrukcí za takt. Datová i instrukční L1 cache má nově minimálně 32 kB (místo 16 kB) a volitelná L2 pak může mít až 512 kB (místo 256 kB). Jádro je již pouze 64bitové a protože je rovněž postaveno na Armv9, nabízí SVE2 jednotku, konkrétně s 64- nebo 128bitovými vektory.
Cortex-A510 (zdroj: Arm)
Jedna změna ale může mít spíš negativní dopad na výkon, ale zato pozitivní pro velikost čipu a efektivitu. Výrobci čipsetů mohou využít tzv. merged-core mikroarchitekturu, kdy se místo dvou samostatných jader použije jeden dvoujádrový komplex, u něhož se obě jádra dělí o L2 TLB, L2 cache a NEON/SVE2 jednotku.
Tak či onak, Arm věří, že úpravy přinesou hlavně výkonnostní nárůst. Cortex-A510 má být až o 35 % výkonnější než A55 v celočíselných operacích a až třikrát rychlejší ve strojovém učení. Výkon už prakticky dohnal i pět let staré out-of-order big jádro Cortex-A73, IPC je u A510 jen o 10 % nižší, avšak spotřeba až o 35 % nižší.
Mali-G710, G610, G510 a G310
Arm nevyvíjí jen procesorová jádra, ale také ta grafická. Její GPU Mali využívají Samsung, Huawei, Mediatek a další, díky čemuž jsou tak fakticky nejrozšířenější na světě. Do rodiny přibydou tři nové grafiky označené jako Mali-G710 (nástupce G78 z roku 2020), Mali-G610 (nástupce G68 z roku 2020), Mali-G510 (nástupce G52 z roku 2018) a Mali-G310 (nástupce G31 z roku 2018).
Všechny poběží na třetí verzi architekturu Valhall a pochopitelně se budou lišit výkonem. Na vrcholu bude Mali-G710, které oproti předchůdci zvýší herní výkon při stejné spotřebě až o 20 %, nebo při stejném výkon sníží o 20 % spotřebu.
Mali-G710 (zdroj: Arm)
Architektura je opět škálovatelná, takže Mali-G710 může mít 7 až 16 výpočetních jednotek. Předchůdce jich měl až 24, ale ty byly menší a méně komplexní. Arm také slibuje přepracovanou správu úloh, která má být vhodnější pro moderní API, jako je Vulkan.
Mali-G710 podporuje Vulkan 1.2, OpenGL ES 3.2 a OpenCL 2.0, je však stále bez DirectX, takže ve světě Windows jej potkávat nebudeme. Arm navíc navyšoval zejména hrubý výkon, ale nepřidal nové technologie, jako se teď na PC a v konzolích rozšiřují, tedy hlavně realtime ray tracing, variable rate shading apod.
Tento článek je součástí balíčku PREMIUM+
Odemkněte si exkluzivní obsah a videa bez reklam na devíti webech.
Vyzkoušet za 1 Kč
Nebo samostatné Živě Premium