přejít na obsah přejít na navigaci

Linux E X P R E S, Mozilla vydává první verzi modelu pro rozpoznávání řeči

Control

Mozilla vydává první verzi modelu pro rozpoznávání řeči

Mozilla

Mozilla vydává první verzi svého modelu pro rozpoznávání řeči (Deep Speech) včetně balíku skoro 400 tisíc záznamů řečových dat (Common Voice).


reklama

Mozilla pracuje na dvou projektech, které se týkají strojového rozpoznávání řeči. Jedním je Deep Speech, což je model pro rozpoznávání včetně implementace (opírá se o vědeckou práci Deep Speech a využívá knihovnu TensorFlow), druhý komunitní sběr řečových dat Common Voice (zatím v angličtině, ale brzy by měly přibýt i další jazyky).

Nyní Mozilla vydává první ucelenou verzi výsledků obou projektů. Kromě modelu rozpoznávače je součástí také skoro 400 tisíc záznamů řečových dat (dohromady cca 500 hodin) od více než 20 tisíc lidí. Pro účely projektu Deep Speech ale slouží i jiné datové sady, například LibriSpeech nebo VoxForge.

Architektura modelu
Architektura modelu (Reuben Morais, CC BY-SA 3.0+)

Nahoru

(Jako ve škole)
Průměr: 1,00 | Hodnotilo: 1
 

Top články z OpenOffice.cz

Přidat téma diskuse

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích a pravidlech najdete v nápovědě.
Diskuzi můžete sledovat pomocí RSS kanálu rss



 
 

Lukáš Jelínek

Lukáš Jelínek

Šéfredaktor LinuxEXPRESu a OpenOffice.cz. Vystudoval FEL ČVUT v oboru Výpočetní technika. Žije v Kutné Hoře a podniká v oblasti informačních technologií. Ve volném čase rád fotografuje, natáčí a stříhá video, občas se věnuje powerkitingu a na prahu čtyřicítky začal hrát tenis.


  • Distribuce: Debian, Linux Mint
  • Grafické prostředí: KDE
  • Hodnocení autora: ***

| proč linux | blog