přejít na obsah přejít na navigaci

Linux E X P R E S, Svobodné slovníky pro Linux

Svobodné slovníky pro Linux

Kolik řečí umíš, tolikrát jsi člověkem. V případě Linuxu to platí dvojnásob, tvrdí Petr Vojnar.


Na naší planetě žije velké množství národů a abychom to v životě neměli moc jednoduché, každý národ má svůj vlastníjazyk, pomocí kterého se dorozumívá. Bohužel obyčejný člověk z tohoto velkého počtu jazyků ovládá většinou jen pár. A i když už nějaký ten jazyk umí, neznamená to, že jej zvládá celý, tzn. že mu určité slovní spojení nemůže dělat problémy.

Naštěstí existují překladové slovníky z jednoho jazyka do druhého. Pokud tedy nevíme, co znamená určité slovo v daném cizím jazyce, tak si jej jednoduše najdeme v příslušném slovníku. Jenže slovníky jsou většinou dosti rozsáhlé a i když nám hledání zjednodušuje abecední řazení, stejně je to pořád pomalé. Zvlášť pro ty, kteří se takovou činností živí.

S vývojem výpočetní techniky tedy přirozeně přišla potřeba převést slovník z papírové podoby do podoby elektronické. Určitě znáte např. Lingeu Lexicon (LinuxEXPRES 7/05), což je ovšem komerční produkt. Ale jak už to ve světě svobodného softwaru bývá, najde se pár lidí, co přeloží nějaká ta slovíčka, vytvoří z nich databázi v elektronické podobě (nejlépe pod licencí GNU FDL) a... a co teď? V takových databázích se dá hledat ručně, ale lepší je to pomocí nějakého programu.

GNU FDL znamená GNU Free Documentation License, tedy jakási obdoba GNU GPL pro dokumenty. Musím poznamenat, že zkratka GNU je na místě a správně se u této svobodné licence musí psát, prosté „GPL“ by znamenalo Obecnou veřejnou licenci, kterých může být stovky.

A takové programy si v následujících odstavcích přiblížíme. Kritériem výběru číslo jedna byla samozřejmě dostupnost pod licencí GNU GPL, běh pod operačním systémem Linux a aby to bylo praktické, tak možnost překladu alespoň z jednoho cizího jazyka do naší mateřštiny. Důležité je také to, že následující programy lze používat i bez připojení k internetu. Tedy pokud jde o samotné používání, stáhnout je samozřejmě nějakým způsobem musíte.

Programům, které se dají použít bez připojení k Internetu, říkáme offline slovníky. Možná se ptáte, jaký mají dnes offline slovníky smysl. Vězte, že připojit se na internet (pustit prohlížeč, najít stránku, vložit dotaz a čekat na výsledek) stojí drahocenný čas. Taková ikona na ploše nebo klávesová zkratka na offline slovník je k nezaplacení.

Stardict

Obrázek: 1.png

Autorem tohoto programu je Hu Zheng, je multiplatformní čili jej lze používat např. i ve Windows, na FreeBSD a na Solarisu. Naprogramován je v jazyce C++, využívá knihovny GTK 2 a lze jej zkompilovat s podporou pro GNOME, popř. i bez ní. O jeho popularitě svědčí např. to, že na webu www.linuxpackages.net je jako jediný dostupný jako binární balíček pro Slackware.

Obrázek: 3.png

Kromě verze Stardictu s GUI je k dispozici i verze konzolová jako samostatný projekt SDCV dostupný na sdcv.sourceforge.net.

A když už jsme u těch balíčků, Stardict je přímo na stránce projektu dostupný jako RPM balíček a také jako RPM balíček bez podpory GNOME. Samozřejmě jsou k dispozici zdrojové kódy. Co se týče velikosti, záleží jakou verzi stahujete, největší jsou zdrojové kódy, které mají asi 1 MB.

Obrázek: 2.png

Samotný program by nám byl na nic, potřebujeme tedy ještě nějaké slovníky. V sekci Dictionaries na webu lze stahovat slovníky pocházející z různých zdrojů, např. www.freedict.de a vyskytují se tam i jiné než překladové. Bohužel, co se týče češtiny, podařilo se mi zprovoznit pouze jeden malý česko-anglický slovník, který má jen 487 hesel. Našel jsem sice i nějaké další slovníky, ale ty mi se Stardictem nefungovaly (ač by měly). Slovníky se nainstalují tak, že se nakopírují do adresáře /usr/share/stardict/dic. Za zmínku stojí také to, že lze stáhnout výslovnost ve formátu *.wav pro některá anglická slova. (Slovníky pro Stardict lze vygenerovat z oficiálního GNU FDL slovníku přiloženým nástrojem. Pozn. redakce.)

Ovládání programu je intuitivní a nenáročně, u všech tlačítek je k dispozici bublinková nápověda a přímo v programu si lze změnit např. font. Pole pro zadávání slova, které chceme přeložit, navíc disponuje historií. Stardict podporuje vyhledávání pomoci zástupných znaků * a ?, fuzzy vyhledávání a automatické vyhledávání na základě označení slova v jiné aplikaci (výsledek se zobrazuje ve vyskakovacím okénku, vlastnost lze samozřejmě vypnout a zapnout). Pro uživatele GNOME a XFce jasná volba, ostatní by jej měli určitě vyzkoušet.

Fuzzy vyhledávání využijete tehdy, pokud si slovo, které chcete vyhledat, nepamatujete přesně, pak jej stačí zadat jen přibližně. Částečně tedy můžete najít slovo u kterého si nejste jisti, jak se píše.

A[d]dict

Obrázek: 4.png

Další program pochází od Vladimíra Kotaly a opět se jedná o multiplatformní záležitost, lze jej provozovat na Linuxu i ve Windows, a to díky použití knihovny wxWindows. Těžko se určuje, zda-li se ještě vyvíjí, nebo ne, protože autor vtipně neuvádí žádná data na stránce tohoto projektu.

Pokud se rozhodnete kompilovat samotný A[d]dict, je potřeba přepsat původní Makefile souborem makefile.unx a do adresáře se zdrojovými kódy nakopírovat soubor addict.xpm.

Nejvhodnější je stáhnout verzi vše-v-jednom (asi 10 MB), která obsahuje jak samotný program tak i velké množství slovníků. Obsahuje verzi jak pro Windows tak i pro Linux a také zdrojové kódy pro případné úpravy a překlad. Jednotlivé části lze stáhnout i samostatně. Musím zde také uvést varování, že nejnovější verze 0.3.1 funguje pouze s wxWindows 2.4.2, které navíc musíte kompilovat, protože autor provedl vlastní modifikace zdrojových kódů (viz src/grid/readme.txt). Je také nutné kompilovat wxWindows BEZ podpory GTK 2 (tedy jen GTK 1).

Mezi slovníky lze v A[d]dictu rychle přepínat pomocí klávesových zkratek [Alt+->] a [Alt+<-].

Program je primárně určen pro projekt GNU FDL Anglicko-Český slovník (slovnik.zcu.cz), ale lze jej používat i pro jiné slovníky, a to i výkladové. Data z tohoto slovníku se samozřejmě neustále mění, a tak je dobré tyto data čas od času aktualizovat. Pro tento úkol lze použít přiložené skripty getdict_iso (pro kódování ISO8859-2) a getdict_utf (pro kódování UTF-8). Slovníková data se indexují, takže samotné vyhledávání je rychlé a nenáročné. Kromě angličtiny obsahuje také němčinu.

Rozhraní A[d]dictu je velice jednoduché, skládá se jen z vyhledávacího pole, seznamu slovíček a ikonek pro přepínání slovníků. Zadávací pole je vylepšeno o vlastnost vyhledávání ve slovníku za běhu, tj. tak jak postupně píšete nějaké slovo, tak se vyhledává ve slovníku již napsaná část. Editací konfiguračního souboru Addict.ini lze měnit barvy, parametry slovníků aj.

pDict

Autorem tohoto počinu je Jiří Popek a je to v podstatě takový pokračovatel A[d]dictu, jen je napsán v Pythonu a vyžaduje ještě PyQT. Narozdíl od předchozích dvou funguje pouze v Linuxu.

Od verze 1.1 je pDict modulární, takže je možné si vybrat, které slovníky bude obsahovat.

Samotný program je velice malý, má pouhých 21 kB. Je k dispozici i balíček pro Debian, ale ne pro nejnovější verzi. Nemusí se instalovat, stačí jej pouze rozbalit do nějakého adresáře a spustit. Pokud jej přesto chceme nainstalovat tak pak pomocí příkazu python setup.py install.

Obrázek: 5.png

Pro smysluplnou funkci programu samozřejmě opět potřebujeme slovníková data, jak jinak než z webu slovnik.zcu.cz. Ty pak nakopírujeme buď do adresáře /usr/local/share/pdict (pro použití libovolným uživatelem) nebo do ~/pdict (pro aktuálního uživatele).

Rozhraní programu je funkčně totožné jako u A[d]dictu, opět obsahuje vyhledávací pole, rozbalovací seznam pro volbu slovníku a seznam nalezených slovíček. Stejně tak u vyhledávacího pole funguje vyhledávání za běhu.

GTK Slovník

Obrázek: 7.png

Dalším programem ke zkoumání je dílo Luboše Nováka, samotný slovník je naprogramován v jazyce C za pomocí GTK, pomocné programy jsou pak napsány v C++. Podporuje dokonce i morfologický analyzátor Ajka, ovšem podpora této vlastnosti není standardně zapnuta.

Obrázek: 6.png

Nejaktuálnější verze je 0.4 a její velikost je asi 36 kB. K instalaci stačí rozbalit archiv a v adresáří gtksl spustit make. Co všechno je potřeba ke kompilaci se dovíte v souboru INSTALL.

Pro slovníková data využívá GTK Slovník opět projekt na stránkách slovnik.zcu.cz. Jak nainstalovat konkrétní slovník se dozvíte jak jinak než v souboru INSTALL. Existují dva způsoby, jak to udělat, přičemž ten starší se mi zdá jednodušší, tj. použití skriptu vytvor_data. Pozor, na starších počítačích se může tato akce protáhnout. Data se ukládají do tzv. trií (inspirace Ajkou). Pro každý jazyk existuje trie, což je strom umožňující kompresi prefixu.

Obrázek: 8.png

Uživatelské rozhraní je opět velmi jednoduché. Skládá se z vyhledávacího pole, rozbalovacího seznamu pro volbu vstupního jazyka, ze seznamu pro volbu jazyka, do kterého chceme dané slovo přeložit, ze seznamu variant v případě zapnuté podpory pro Ajku a konečně ze seznamu výsledků. Překlad probíhá až po zadání celého vstupního slova a odeslání klávesou [Enter]. Podobně jako Stardict umožňuje překlad výběrem pomocí myši a navíc překlad obsahu schránky. Naráz lze použít pouze jednu možnost, popř. tuto vlastnost nechat vypnutou.

Podpora Ajky není standardně zapnutá, protože data k ní nejsou volně dostupná. Pokud náhodou Javu nemáte nainstalovanou, tak se v důsledku jejího stažení velikost slovníku poněkud nepříjemně zvětší.

Simple Dictionary Application

Tento slovník je naprogramován v Javě, a proto mu nečiní potíže běžet na jakékoliv platformě, kde je Java dostupná. Poslední verze nese číslo 1.02, pro stažení je k dispozici ZIP archiv o velikosti pouhých 19 kB. Ten lze opět rozbalit do libovolného adresáře a samotný program se pak spustí pomocí příkazu java -jar SDA.jar. Pro běh programu tedy samozřejmě potřebujete Java JRE neboli Java Runtime Environment (též J2SE - Java 2 Standard Edition).

Obrázek: 9.png

Důležitou potravou pro tento program jsou opět slovníková data, která lze získat na http://dicts.info/uddl.php (Universal Dictionary - UD). O UD se na stránkách SDA tvrdí, že v současnosti propojuje asi 31 jazyků, což je opravdu slušné množství. Namátkou uvedu hlavně z těch méně obvyklých např. bulharštinu, esperanto, islandštinu, indonéštinu nebo třeba turečtinu. Na stránce je též odkaz na projekty dalších slovníků.

Možná se pozastavujete nad tím, pro píšu, že UD propojuje místo obsahuje. Projekt UD je totiž zajímavý v tom, že se snaží vytvořit jeden univerzální slovník pro všechny jazyky. Pro zvědavce - z výše uvedené stránky se lze proklikat k podrobnostem, zde to už více nebudu rozvádět. Pro praxi je důležité to, že na již zmíněné stránce http://dicts.info/uddl.php si můžete snadno vytvořit takový dvoujazyčný slovník, který potřebujete, což většinou dostačuje. Rozhraní programu je jako u většiny ostatních velmi jednoduché. Okno SDA se skládá ze dvou částí. V té horní je postupně zleva rozbalovací seznam pro volbu konkrétního slovníku, dále samotné pole pro zadávání a nakonec tlačítko pro vyhledání, ovšem stejně dobře poslouží i [Enter]. Dolní část pak tvoří textová oblast, kde se zobrazují výsledky hledání.

Pokud zadáte k vyhledání nějaké slovo, zobrazí se jako výsledek všechny slova které na toto slovo začínají. Zároveň si můžete všimnout (pokud zadáte takové slovo, pro které bude více výsledků, než se vlezou do okna), že oblast pro výsledky je rozdělena do dvou částí. Levá část obsahuje překlad, který jste požadovali a pravá část obsahuje přesný opak, tedy např. v případě překladu z češtiny do angličtiny pokus o přeložení všech slov z angličtiny do češtiny začínajících na vyhledávané slovo.

PEKI

Posledním pánem na holení je slovník PEKI od Pavla Ponce, který je výjimkou. Na začátku jsem totiž řekl, že budu uvažovat pouze slovníky pod svobodnou licencí. Tento program je ovšem „pouze" freeware. Tedy je zadarmo, ale už nejsou dostupné zdrojové kódy a vývoj je pouze na autorovi. Slovník opět využívá multiplatformní Javy, takže jej lze provozovat skoro kdekoliv.

Obrázek: 11.png

Nejčerstvější verze je 1.20 (z ledna 2005) a stáhnout lze několika způsoby. Pro nás - linuxové uživatele - je nejlepší hned první soubor v sekci Download - inst_peki.zip. Tento ZIP archiv obsahuje vše potřebné a jeho velikost je vzhledem k přibaleným datům asi 8 MB. Stejně jako u SDA potřebujete Java JRE. Pro spuštění opět stačí pouhé rozbalení archivu do nějakého adresáře následované příkazem sh peki.sh.

Slovníková data, která jsou přibalena v archivu pokrývají např. angličtinu, němčinu, dánštinu, ruštinu, esperanto a další, kompletní seznam získáte pohledem do adresáře data/datasource. Prozradím alespoň to, že slovníků je celkem 28. Jako zdroj lze použít také http://slovnik.zcu.cz. Na stránkách programu jsou pak opět uvedeny odkazy na další použitelné slovníky resp. zdroje, ze kterých autor čerpal slovníková data vyskytující se v ZIP archivu.

Před prvním použitím slovníku je nutno vytvořit binární databáze, tedy pokud spustíte slovník, tak v úvodním okně (databázový manažér) zvolit vytvořit a pak už jen čekat. Samozřejmě nemusíte zvolit všechny, stačí si v záložce Databázové parametry nastavit pouze ty, které potřebujete (a taky další parametry jako např. kódování). Jakmile se databáze vytvořit, zvolte Konec a spustí se samotný slovník. Databázový manažer se už pak při dalším spuštění neobjeví, ale lze jej v případě potřeby vyvolat pomocí příkazu sh peki.sh -dbmanager.

Obrázek: 10.png

Grafické rozhraní samotného slovníku je bohatší než v několika předchozích případech. Program obsahuje jednoduché menu, kde lze nastavit jaký slovník se má použít a podle jakého sloupce se má třídit výstup. Dále lze volit lokalizaci rozhraní, dokonce i vzhled (téma), zda-li se má použít rychlé vyhledávání nebo překlad ze schránky. Dokonce je přítomna i vestavěná nápověda.

Rozhraní se dále skládá klasicky z vyhledávacího pole, tlačítek pro vyhledávání, detail slovíčka a pro volbu předchozí a další stránky ve výpisu slovíček. Výpis je již od začátku naplněn obsahem, většinou je dvousloupcový, ale někdy obsahuje i výslovnost, to záleží na použitém slovníku. Jak už bylo řečeno výše, program disponuje šikovnými funkcemi rychlé vyhledávání (tj. souběžné hledání při zadávání slova) a překlad ze schránky.

Závěr

Jak je vidět, programů pro práci s offline slovníky existuje dostatečné množství, takže si je z čeho vybírat. Z výše uvedených slovníků nelze jednoznačně určit ten nejlepší, každý má své pro a proti, to už je jen na vás, který bude nejlépe vyhovovat. Protože slovníky (resp. slovníková data) musí být znovu vytvářeny kvůli licencím v komerčních produktech, nedosahují někdy požadovaného rozsahu, ale některé se jistě rychle přibližují. Každopádně všechny jsou prakticky dobře použitelné, co se týče základní funkčnosti. Problém může být jen v občasné nekompatibilitě datových souborů, kterou lze však většinou vyřešit jednoduchou konverzí.

Nahoru

Odkazy

Přidat téma diskuse

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích a pravidlech najdete v nápovědě.
Diskuzi můžete sledovat pomocí RSS kanálu rss



 
 

Top články z OpenOffice.cz