Brněnská firma má světový unikát. Její rozpoznávání hlasu využívá výhradně neuronové sítě

Rozpoznávání hlasu je zase o něco pokročilejší. Brněnská firma Phonexia představila novou verzi technologie, která je oproti předchůdci výrazně rychlejší a přesnější. Využití nachází zejména u bezpečnostních složek, uplatnit se může i u bank.

Nová technologie Deep Embeddings údajně jako první na světě využívá pro identifikaci hlasu výhradně neuronové sítě. Pomocí strojového učení rozpoznají unikátní prvky hlasu každé osoby, což zásadně zvyšuje přesnost a rychlost identifikace. Hlavním přínosem metody je efektivita, algoritmy se „samy“ učí identifikovat konkrétní hlasy. 

Firma přitom technologii pouze vyvíjí, ke klientům se dostává až prostřednictvím partnerů, kteří ji integrují do konkrétních produktů, softwaru, systémů. V březnu představená technologie zatím nemá žádného koncového uživatele, u řady klientů se však ladí pro konkrétní použití.

Pro bezpečnostní složky je zajímavá zejména schopnost rozpoznat řečníka, jeho pohlaví nebo dokonce i přibližný věk. „Technologii tak lze využít například při identifikaci pachatelů trestných činů nebo odhalování možných teroristických hrozeb. V komerčním sektoru ji lze uplatnit například při hlasové autorizaci úkonů v bankách,” vyjmenovává potenciál nové technologie Michal Hrabí, výkonný ředitel společnosti Phonexia.

Využití je ale širší, neuronové sítě umožňují vyhledávat v nahrávkách řeči stejně snadno, jako pomocí textu vyhledáváme na internetu. Otevírá se tak další zdroj informací, jako například vyhledávání v přednáškách, hlasových poznámkách apod.

Česko jako velmoc v rozpoznávání hlasu

Brněnská technologická firma Phonexia, která dodává technologii na rozpoznávání hlasu i zahraničním bezpečnostním složkám, loni dosáhla zisku před zdaněním 7,5 milionu korun. Tržby se oproti minulému roku téměř zdvojnásobily na zhruba 50 milionů korun. V letošním roce Phonexia plánuje růst tržeb o dalších 60 procent a rozšířit svůj tým na 60 zaměstnanců.

Firmu v roce 2006 založilo šest vědců. Nyní poskytuje služby pro kontaktní centra, finanční instituce a organizace bojující s kriminalitou ve více než 60 zemích. Právě ze zahraničí loni pocházely čtyři pětiny všech tržeb.

Po klávesnici a mikrofonu přijde foťák. Google nás učí vyhledávat obrazem, ale zatím to trochu drhne:

V tuzemsku jsou ale i další vývojová centra, která se zaměřují na analýzu mluveného slova. Například na Technické univerzitě v Liberci se specializují na rozpoznávání a diktování češtiny, na Západočeské univerzitě zase vyvinuli systém schopný titulkovat živé pořady.

Diskuze (5) Další článek: Nebuďte zmlsaní. Jen se podívejte, kolik inovací zvládla jedna relativně neznámá čínská značka

Témata článku: , , , , Identifikace, Nová verze, Brněnská firma, Rozpoznávání hlasu, Kontaktní centrum, Unikát, Trestný čin, Mluvené slovo, Česká republika, Pachatel, Bezpečnostní složka, Liberec, Strojové učení, Zdroj informací, Koncový uživatel, Složka, Hlasová poznámka, Minulý rok, Výkonný ředitel, Hlas, Světový unikát