Linux E X P R E S, Mozilla vydává první verzi modelu pro rozpoznávání řeči

Mozilla vydává první verzi modelu pro rozpoznávání řeči

Mozilla vydává první verzi svého modelu pro rozpoznávání řeči (Deep Speech) včetně balíku skoro 400 tisíc záznamů řečových dat (Common Voice).

Sunday, 3. December 2017 | Autor Lukáš Jelínek | známka 1.00
jelínek, mozilla, rozpoznávání řeči, voice

Mozilla pracuje na dvou projektech, které se týkají strojového rozpoznávání řeči. Jedním je Deep Speech, což je model pro rozpoznávání včetně implementace (opírá se o vědeckou práci Deep Speech a využívá knihovnu TensorFlow), druhý komunitní sběr řečových dat Common Voice (zatím v angličtině, ale brzy by měly přibýt i další jazyky).

Nyní Mozilla vydává první ucelenou verzi výsledků obou projektů. Kromě modelu rozpoznávače je součástí také skoro 400 tisíc záznamů řečových dat (dohromady cca 500 hodin) od více než 20 tisíc lidí. Pro účely projektu Deep Speech ale slouží i jiné datové sady, například LibriSpeech nebo VoxForge.

Architektura modelu (Reuben Morais, CC BY-SA 3.0+)

Nahoru

Přidat téma diskuse

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích a pravidlech najdete v nápovědě.
Diskuzi můžete sledovat pomocí RSS kanálu

Top články z OpenOffice.cz

Novinky v LibreOffice 7.5 Community – Writer, Calc

Nové příručky pro LibreOffice

Novinky v LibreOffice 7.5 Community – obecné změny, Impress, Draw, Math

Příručky k LibreOffice - aktualizace

LibreOffice 7.4.4 Community opravuje 114 chyb

Thunderbird 102 přináší změny ve vzhledu a vyšší efektivitu

Vydán Apache OpenOffice 4.1.13

Novinky v LibreOffice 7.3 - Calc, Impress, podpora OOXML

Lukáš Jelínek

Dlouholetý člen autorského týmu LinuxEXPRESu a OpenOffice.cz. Vystudoval FEL ČVUT v oboru Výpočetní technika. Žije v Kutné Hoře, podniká v oblasti IT a zároveň pracuje v týmu projektu Turris. Ve volném čase rád fotografuje, natáčí a stříhá video, občas se věnuje powerkitingu a na prahu čtyřicítky začal hrát tenis.

Distribuce: Debian, Kubuntu, Linux Mint
Grafické prostředí: