přejít na obsah přejít na navigaci

Linux E X P R E S, Seriál o Elasticsearch: Úvod

Alvao

Seriál o Elasticsearch: Úvod

Elasticsearch

V tomto seriálu se budu snažit vysvětlit problematiku fulltextového vyhledávání a postupně jej implementovat pomocí nástroje Elasticsearch . Fulltextové vyhledávání je poměrně komplexní problematika, budu se ji tedy snažit rozdělit na několik samostatných částí a ty postupně projít.


reklama

Specializuji se na Elasticsearch a jsem fanouškem DevOps. Nabízím konzultace a školení Elasticsearch - pokud jej chcete poznat důkladněji, zjistit, zda se hodí pro váš projekt, nebo uspořádat školení ve vaší firmě, neváhejte se mi ozvat.

Nebudu se zaměřovat na implementaci vyhledávacího nástroje pomocí konkrétního programovacího jazyka - knihovny pracující s Elasticsearch jsou obdobné napříč různými jazyky, a vesměs kopírují API, kterým disponuje Elasticsearch. Budu se snažit uvést i související teoretické znalosti - věřím, že hlubší znalost dané problematiky je užitečná k nalezení optimálního řešení problému.

V následujících dílech tohoto seriálu postupně projdu:

  1. Základní pojmy
  2. Instalace Elasticsearch
  3. Ukládání a zobrazení dat
  4. Fulltextové vyhledávání v češtině
  5. Pokročilé fulltextové vyhledávání

Na konci tohoto seriálu byste měli být schopni implementovat fulltextové vyhledávání v českém jazyce s pomocí Elasticsearch. Veškeré zdrojové kódy jsou dostupné na GitHubu.

Trocha motivace úvodem

A jaké jsou hlavní důvody, proč použít pro vyhledávání právě Elasticsearch? Především má velké množství funkcí, kterými lze vyhledávání vytvořit přesně na míru danému účelu. Elasticsearch disponuje podporou češtiny a dalších jazyků, poradí si se skloňováním, časováním, synonymy nebo našeptáváním. Zároveň obsahuje základní nastavení pro řadu jazyků, s kterým vyhledávání obstojně funguje bez složitého nastavování.

Dalším důvodem pro jeho použití je rychlost, s kterou je možné vyhledávát. Omezením není ani rostoucí množství dat, Elasticsearch je možné jednoduše vertikálně škálovat, stačí přidat další servery do clusteru a Elasticsearch se o zbytek postará sám. S tím souvisí také to, že data mohou být automaticky replikována mezi servery, při výpadku některého z nich tak nedochází k výpadku celé služby, ani ztrátě dat.

Fulltextovým vyhledáváním však funkce Elasticsearch nekončí. Lze jej využít pro výpočty nad nalezenými daty, která mohou být například použita pro vytvoření filtrů na webu. Dalším možným použitím je vytvoření nástroje pro ukládání logů ze všech možných zdrojů a následné vytváření vizualizací a dashboardů pomocí nástroje Kibana.

Pokud jste připraveni vrhnout se do tajů fulltextového vyhledávání a Elasticsearch poznat důkladněji, pokračujte prosím následující kapitolou.

Nahoru

Přidat téma diskuse

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích a pravidlech najdete v nápovědě.
Diskuzi můžete sledovat pomocí RSS kanálu rss



 
 

Top články z OpenOffice.cz

Luděk Veselý

Luděk Veselý

Pracuji jako vývojář ve Vodafone. Specializuji se na Elasticsearch a jsem fanouškem DevOps.
www.ludekvesely.cz


| blog



Public Relations

Visibilita a řízení přístupu v síti: Detekce a řízení vnitřních hrozeb

Dimension DataHackeři to mají čím dál jednodušší. Ve stále rostoucí IT infrastruktuře firem, do které se připojují další a další uživatelé a zařízení, internetoví zločinci snadno skryjí své aktivity. Kvůli menší přehlednosti sítě mají spoustu času na krádež dat, financí nebo poškození firmy dříve, než je bezpečnostní systémy odhalí. Řešením je zavedení bezpečnostní politiky uvnitř sítě. Navštivte seminář společnosti Dimension Data, který vám pomůže se v této problematice zorientovat.

Pokračování ...


Alvao

Redakční blog

Redakce

Redakce, 21. prosinec

Pište pro LinuxEXPRES

Baví vás Linux? Pište o něm, není to nic těžkého. LinuxEXPRES hledá nové autory.


Pavel Fric

Pavel Fric, 23. říjen

Nové motivy pro přehrávač Sayonara

Pomozte rozšířit možnost měnit vzhled programu za běhu


Pavel Fric

Pavel Fric, 28. únor

Lollypop


Všechny blogy »

RedHat