Pátek, 11. listopad 2016 | | známka 1,00



Otevřená data jsou, když…

…jsou data zveřejněna v úplné podobě, pod neomezující licencí (pro nekomerční i komerční použití), strojově zpracovatelná, v otevřeném datovém formátu a v českém právním prostředí také zařazena do příslušného katalogu. Postupem času přibývá orgánů veřejné správy, které otevřená data poskytují a stejně tak přibývá i počet zpřístupněných datových sad.

Rada hlavního města Prahy zařadila otevření dat do svého programového prohlášení, v květnu 2015 schválila její ICT komise projektový záměr a postupně se přešlo k realizaci, kdy se koordinátorem stal člen komise Ondřej Profant, který o celé záležitosti pohovořil na konferenci OpenAlt.

Ondřej Profant při své přednášce o celopražských otevřených datech

Digitální strategie a otevřená data

V červenci 2015 schválila Rada hl. m. Prahy dokument Teze digitální strategie hl. města Prahy, který se stal základem pro další postup. „Myslím si, že je to velmi zajímavý a dobrý dokument, kterým se mohou inspirovat v dalších obcích. Ten dokument je čitelný, má jednu a půl stránky a je to opravdu myšleno tak, abyste to mohli ukázat politikovi a on to alespoň z části byl schopen pochopit,“ říká k dokumentu Ondřej Profant.

Jednou z tezí obsažených v dokumentu je, že otevřená data jsou „nová ropa“. Na základě toho vznikl projekt celopražských otevřených dat. Do něj je již dnes zapojeno čtrnáct organizací. „Například data o údržbě silnic nemá magistrát. To má Technická správa komunikací.“ Projekt šel „cestou nejmenšího odporu“ a nesnaží se konsolidovat data.

Prosklená část budovy FIT VUT, kde se konala konference OpenAlt

Místo toho jednotlivé organizace přistupují do systému CKAN a vkládají do něj svá data, která mohou být různého charakteru – od statických dat (která se v nějakém intervalu pravidelně exportují – třeba z excelových tabulek či databází) až po data poskytovaná v reálném čase.

Zatím jen částečné zapojení

Zapojení orgánů a organizací v rámci celé Prahy je zatím jen částečné, zejména z hlediska jednotlivých městských částí. „Třeba máme faktury z pěti městských částí.“ Škála aktuálně dostupných dat je poměrně velká – k dispozici jsou například data o hromadné dopravě (včetně jízdních řádů), o zoologické zahradě, informace o majetku, o výpůjčkách z knihovny…

Ondřej Profant vyzývá zájemce o využití dat, z něhož bude nějaký výstup, aby se mu ozvali: „My bychom rádi ty výstupy konsolidovali, dělali jim zpětně reklamu a je to pro nás důležité i vnitřně – že ta data opravdu někdo využívá.“

Datové formáty a technické řešení

Pražská otevřená data se zveřejňují v celé řadě datových formátů. „U spousty aplikací jsme rádi, že dokážeme exportovat CSV. Mapy mají různé souřadnicové systémy… Naštěstí náš Institut plánování a rozvoje dodává [geografická data] ve všech formátech rovnou.“ Jízdní řády jsou ve formátu GTFS.

Nabídka formátů pro data o zastávkách MHD

Technické řešení je založeno především na systému CKAN, určeném pro tyto účely, tedy zveřejňování a katalogizaci otevřených dat. Systém je napsán v jazyce Python. Katalogizovat v tomto systému lze nejen data, ale třeba také API nebo dokumentaci. Při nasazování systému CKAN implementátoři přispívali i do upstreamu, implementační skripty jsou pod open-source licencí.

Systém běží na linuxové distribuci CentOS a data se ukládají do databáze PostgreSQL.

Již samotný systém umožňuje s daty poměrně široce pracovat a prezentovat je – ať už ve formě tabulek, grafů nebo map. Náhled na data si lze vložit na vlastní web nebo do blogu (je to řešeno přes iframe, takže je potřeba podpora tohoto řešení).

Mapa zastávek MHD vygenerovaná z dat

„[Z porovnání povodňových map] můžete vidět, jak jsou alespoň teoreticky účinná protipovodňová opatření, která se za spoustu peněz postavila od povodní,“ popisuje jedno z možných využití dat Ondřej Profant.

Některé aplikace využívající pražská data

Jednou z aplikací, které využívají celopražská otevřená data, je Supervizor vytvořený na ministerstvu financí a vizualizující data o výdajích daného subjektu. V první fázi zobrazuje data z Institutu plánování a rozvoje, připravuje se nasazení na data městských částí a magistrátu.

Výdaje IPR v aplikaci Supervizor

Vyvíjí se nová verze aplikace (s pracovním názvem Supervizor+), která zobrazuje rozklikávací rozpočet. „Funguje s jakýkoli účetnictvím, což je velmi důležité, protože když to budeme dávat dalším obcím, nebudeme po nich chtít, aby dělaly nějaké integrace. (…) Oni budou vědět, že když jejich účetnictví splňuje zákonné normy, mohou mít rozklikávací rozpočet zdarma.“

V Novém Městě na Moravě používají aplikaci rozklikávacího rozpočtu i k rozpočtovému plánování, tedy nikoli jen jako informace pro občany.

Otevřená data ovšem masivně využívají i soukromé firmy, ať už pro vlastní účely nebo na nich přímo stavějí své služby. „Největším uživatelem našich dat je Seznam.cz,“ říká Ondřej Profant. Všechny firmy mají k dispozici stejná data a mohou si tak konkurovat v tom, kdo nabídne lepší služby. To je zásadní rozdíl oproti tomu, když jsou data dostupná jen přes nějakou „oficiální“ aplikaci, ať již vyvinutou pro daný orgán veřejné správy nebo mající na data exkluzivitu.

Z konference OpenAlt – svobodně si vyrobte, co potřebujete

Typickou ukázkou exkluzivního přístupu k datům jsou celostátní jízdní řády. Data shromažďovaná od dopravců ministerstvem dopravy získává firma CHAPS a ta je poskytuje vydavatelství MAFRA provozujícímu webové jízdní řády. Nikdo jiný data využívat nemůže, takže pokud někomu daná webová aplikace nevyhovuje nebo by chtěl vytvořit něco lepšího, má smůlu.

Otevřená data s nadstandardními službami

Řečené ovšem neznamená, že by nebylo možné poskytovat na komerční bázi k datům ještě určité nadstandardní služby. „Já osobně mám plán, zatím nerealizovaný ve formě nějakého projektu, na komerční otevřená data,“ přibližuje další záměry Profant. „Budeme uzavírat smlouvy s konkrétními uživateli, kterým budeme garantovat dostupnost a kvalitu dat.“

Stánek české komunity Mozilla (webový prohlížeč je nejčastějším „oknem“ do otevřených dat)

Shrnutí

Celopražská otevřená data mají velký potenciál, jehož využití bude záviset jak na zpřístupňování dalších dat (z více městských částí a dalších orgánů a organizací, více druhů dat), tak na ochotě vytvářet aplikace, které budou data využívat. Zatím je to spíš tak, že brzdou je spíš to první a zájem tvořit aplikace je. Z toho, co se vytvoří a vyzkouší v rámci Prahy, pak budou moci těžit města a obce po celé republice.