Německé servery Thomas-Krenn.AG

  • Sestavte si server v našem online konfigurátoru
  • Sestavy testovány s více než 30 operačními systémy
  • Nasazujeme Red Hat, CentOS, SUSE, Debian, Ubuntu
  • 98 % serverů  jsme schopni sestavit a dodat do 24 hodin
  • Každý server je před odesláním otestován
  • Technická podpora 24/7

Nabízíme rackové servery 1U, 2U, 3U/4U, Silent servery, virtualizační a storage & backup řešení.

Matematický software R: S ním je každá statistika hezčí

Rlogo.jpg R je matematický software specializovaný na statistiku. Jde o open-source implementaci jazyka S, který používají profesionální statistické programy. Pokud vám stačí spočítat si pár čísel, tak se většinou spokojíte s tabulkovým procesorem, jako je Calc nebo Excel. Musíte-li ale zpracovat spoustu dat, tak se budete muset poohlédnout po něčem jiném - a zde se může hodit právě R.


R můžete, s velkou pravděpodobností, najít v repozitářích své linuxové distribuce. Ve Fedoře můžete instalovat pomocí yum a v Ubuntu pak sudo aptitude install r-base r-base-dev. R se spouští z terminálu pomocí příkazu R (pozor, rozlišují se velká a malá písmena). Chcete-li používat GUI, pak prosím použijte následující postup:

  • Nainstalujte balíček r-cran-rcmdr.
  • Spusťte R (v terminálu pomocí příkazu R) a napište library(Rcmdr), čímž vyvoláte grafické rozhraní pro R. V případě, že by některé softwarové balíky nebyly nainstalovány, tak se vás R zeptá, jestli je má stáhnout a nainstalovat. Stačí tedy potvrdit že ano, vybrat, odkud se stáhnou, a vše by mělo proběhnout bez problémů.

Klikací rozhraní, tedy GUIKlikací rozhraní, tedy GUI

Jak jsem již psal, R je program specializovaný na statistiku, nicméně můžete jej, jako Matlab, používat i na maticové výpočty. My se ale budeme věnovat statistice. R umí testování hypotéz, výpočet analýzy rozptylu (ANOVA), Weibullovo, Studentovo a další rozdělení, můžete si samozřejmě psát i své vlastní skripty. Skripty můžete načítat z místního disku a nebo třeba přes FTP. Můžete vykreslovat 2D i 3D grafy, dávat jim popisky, měnit barvy, atd.

3D Graf3D Graf

Abyste si R trochu vyzkoušeli, tak si napíšeme pár velmi jednoduchých příkazů. Následující příklady jsou pro R spuštěné v terminálu bez grafického rozhraní, stačí tedy příkazy jen opisovat. Chcete-li použít grafické rozhraní, doporučuji, abyste se s ním nejdříve naučili pracovat, například z tohoto anglického návodu. Pro jednoduchost a rychlost doporučuji grafické rozhraní úplně přeskočit. Navíc jej k využití plného potenciálu programu nepotřebujete.

x <- c(1,2,2,2,2,5,6,6,6,7,9) # vytvoří vektor s názvem x
summary(x)

Výpis bude vypadat asi takto:

> summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  1.000   2.000   5.000   4.364   6.000   9.000

Kde Min. je nejnižší číslo, 1st Qu. je dolní kvartil, Median je medián, Mean je průměr, 3rd Qu. je horní kvartil a Max. je nejvyšší číslo. Samozřejmě si můžete jednotlivé příkazy vyvolat zvlášť, například mean(x) spočítá aritmetický průměr.

Grafy

hist(x) # vykreslí histogram

HistogramHistogram

boxplot(x,main='Příklad pro Linuxexpres') # kromě vykreslení krabicového
grafu změní i nadpis

Graf s popiskemGraf s popiskem

Zkuste třeba ještě stripchart(x), plot(x) a qqnorm(x).

x <- x*1000 # vynásobí vektor hodnotou tisíc
x # vypíše novou hodnotu x
x2 <- log(x) # spočítá přirozený logaritmus
x2 # vypíše výsledek
x+x2 # sečte vektory, můžete odečítat, dělit, násobit, atd...

Následující ukázka je z webu addictedtor.free.fr.

par(bg="cornsilk")
coplot(lat ~ long | depth, data=quakes, pch=21, bg="green3")

Složitější grafSložitější graf

Zde jsou dvě ukázky interaktivních grafů, které slouží k výuce. Studenti zde vidí, jak změna hodnot ovlivní výsledek. Napište dva následující příkazy, které spustí interaktivní graf. Budete-li měnit hodnoty, přímka se bude měnit také.

library(tcltk)
demo(tkcanvas)

Další ukázka:

library(tcltk)
demo(tkdensity)

Proč R? Proč statistika?

V práci používám statistiku poměrně často a R se mi hodí ze dvou důvodů. Tím prvním je, že dokáže pracovat s více daty než MS Excel, který je omezený 256 sloupci a 65 tisíci řádky. Možná se vám to zdá hodně, když ale budete zpracovávat data z produkce za poslední dva roky, tak tento počet lehce překročíte.

Druhým důvodem jsou pokročilé statistické funkce, jako již zmíněná ANOVA, Chi-square test a nebo bootstrapping. Možná se o těchto metodách budete učit ve škole a R vám pomůže se semestrální prací. Ne že by ji za vás R napsalo, ale minimálně vám může pomoci spočítat nejednu úlohu. R je na vysokých školách a ve vědeckých kruzích populární a využívá jej poměrně hodně univerzit po celém světě, nejvíce však asi v USA. U nás jsem se s R zatím příliš nesetkal, což je docela škoda, neboť tak chybí návody v češtině a taky by neškodilo, kdyby se tento velmi kvalitní software dostal více do povědomí studentů, kteří by jej pak mohli využívat ke studiu.

Pokud s R budete pracovat poprvé a nemáte zkušenosti s programy jako Matlab nebo Maple, tak pro vás práce může být z počátku obtížná. Software se přece jen ovládá příkazy a ne z menu. Zde se právě objevuje ona obtížnost, neboť abyste příkazy mohli psát, tak je musíte nejdříve znát. K překonání toho problému by vám mělo pomoci několik odkazů na různé návody v závěru článku. Předpokládejme, že už jste zkušenější uživatel a přečetli jste si nějaký ten návod a nebo jste se na střední škole potkali s Matlabem. V takovém případě je práce s R velmi jednoduchá a podobá se práci s ním.

R pracuje rychle a je stabilní. Za celou dobu, co software používám jsem nikdy nezažil pád programu. Příkazy se provádí okamžitě, jejich zápis je relativně jednoduchý a názvy dobře zapamatovatelné, vykreslování grafů je také velmi rychlé. Statistika programu R je na velmi dobré úrovni, ale nemusíte využívat jen statistiku. R můžete používat k maticovým počtům, vektorům, řešení rovnic a pod. Já osobně jsem R taky občas používal k tomu, abych si ověřil ruční výpočty, při učení se na písemky. R je program všestranný a i když se v jedné pohádce zpívá, že statistika nuda je, tak bychom přece jen měli mít na paměti, že má cenné údaje, a když tak R vyzkoušet a nějaké ty údaje si spočítat.

Nahoru

Linuxová knihovnička - obchod.liberix.cz

Notebooky s Linuxem a bez operačního systému

Odkazy

(Jako ve škole)
 

Příspěvky

Matematický software R: S ním je každá statistika hezčí
pedro 4. 06. 2009, 16:33:53
Odpovědět
Super, dekuji na stotisickrat, protoze "statisticky software" je priserne drahy.
Re:Matematický software R: S ním je každá statistika hezčí
gofree 4. 06. 2009, 19:00:10
Odpovědět
ot na R : dokaze rata cronbachovu alfu? korelaciu?

pre Pedra : skus sa pozriet na pspp, k spss to ma daleko ale stoji za vyskusanie
Radim Šimánek Re:Re:Matematický software R: S ním je každá statistika hezčí
Radim Simanek 4. 06. 2009, 20:42:04
Odpovědět
http://rss.acs.unt.edu/Rdoc/library/multilevel/html/cronbach.html

http://rss.acs.unt.edu/Rdoc/library/multilevel/html/00Index.html
Matematický software R: S ním je každá statistika hezčí
Marek Omelka 4. 06. 2009, 21:43:23
Odpovědět
U nas na katedre (KPMS MFF UK) se R-ko s oblibou pro vyuku statistiky vyuziva. Ale
je pravda, ze jsme v tomto dost ojedineli.

Pokud vim, literatura v cestine je dost zlomkovita. Napr.
Michal Kulich se snazil napsat nejaky uvod, viz
http://www.karlin.mff.cuni.cz/~kulich/vyuka/Rdoc/uvodr.pdf

Za zkousku by mozna stalo si nechat zaslat dokumentaci k
balicku "vsePackage", ktery se da stahnout z
http://www.karlin.mff.cuni.cz/~komarek/software.html#Rko
a ktery Arnost Komarek vyuziva pro vyuku na VSE v Jindrichove Hradci.

Kdysi na root-u vysel serial o tvorbe grafu v R-ku.
http://www.root.cz/serialy/tvorba-grafu-pomoci-programu-r/


R-ko je fajn. Jako statistika mne tesi, ze diky balickum, ktere lze
stahnou z http://cran.at.r-project.org/ v R-ku lze delat temer vse,
co lide v mem oboru vymysleli. Co se tyka statistiky, tak R-ko neni
vhodne pro obrovske datove soubory (databaze s miliony klientu).
V tomto pripade kolegove vetsinou sahaji po nekterem z placenych softwaru
jako je SPSS ci SAS.
vsePackage
petr 8. 06. 2009, 07:07:37
Odpovědět
popis funkcí z vsePackage je ve skriptech pro statistiku na FM VŠE, které napsal Komárek
Vojtěch Zeisek Matematický software R: S ním je každá statistika hezčí
Vojtěch Zeisek 7. 06. 2009, 20:35:00
Odpovědět
Zajímavé GUI je i Rkward: http://rkward.sourceforge.net/, ale podle vývojářů je stále ještě ve vývojové verzi a místy je to na něm vidět... Podobně i doplněk do OpenOffice.org Calc R4Calc: http://extensions.services.openoffice.org/project/R4Calc Nicméně oba projekty jsou na dobré cestě. :-)

Jen tak mimochodem, netušíte někdo, jak v R spočítat UPGMA, MST a PCoA, když máte tabulku diploidních dat? (jde o geny, takže máte např. 10 genů, z nichž každý je ve dvou verzích - od tatínka a maminky, takže to nelze počítat klasicky: jeden sloupec není jeden znak...) Nebo když máte již hotovou matici genetických vzdáleností a nechcete po R standardizaci, ale jen třeba bootstrap?
Omlouvám se za obskurní otázky... O:-)
RKWard
petr 8. 06. 2009, 07:04:31
Odpovědět
na R-ko jsem používal jedině RKWard, je mnohem více user-friendly než Rcmdr
Matematický software R: S ním je každá statistika hezčí
Arnošt Komárek 12. 06. 2009, 10:12:27
Odpovědět
Rko se v Čechách kromě MFF prosadilo do výuky i na někým zmíněné FM VŠE, na PřF UK a od příštího roku bude nejspíš i na FBMI ČVUT (takže okruh uživatelů snad poroste ;-)). Jinak relativně podrobný návod pro základní statistiku (od popisné až po jednodušší regresi) v R je tady:
http://www.karlin.mff.cuni.cz/~komarek/publication.html#Textbooks
PDF pošlu každému, kdo mi mailem aspoň jednou větou sdělí, k čemu by se mu to mohlo hodit.

Přidat názor

Nejsou podporovány žádné značky, komentáře jsou jen čistě textové. Více o diskuzích najdete v nápovědě.
Diskuzi můžete sledovat pomocí RSS kanálu rss



 
 
rss

Radim Šimánek


  • Distribuce: Fedora/Ubuntu

profil autora


Blogy rss
Seriály
Martin Šín

Martin Šín, 29. srpen

Jak změnit Gnome na Windows 7

Chcete, aby vaše Gnome vypadalo jako Windows 7? Pak čtěte dál ..


Pavel Fric

Pavel Fric, 28. srpen

Tagaini Jisho

Nově je dostupný ke stažení překlad s přeloženými položkami filtru skupin: slovní druh, obor, nářečí,...


Václav Hejda

Václav Hejda, 23. srpen

Bounce - webová služba pro tvorbu, úpravu a sdílení screenshotů

Chtěli byste jednoduše pořizovat screenshoty webových stránek a sdílet je se svými přáteli? Vyzkoušejte...


Miroslav Hrončok

Miroslav Hrončok, 21. srpen

Kdybyste třeba nevěděli, co je to kahan

Přes prázdniny překládám vzdělávací programy KDE, jako je Kalzium, Rocs nebo Marble.


Pavel Fric

Pavel Fric, 18. srpen

nano

Ano


Všechny blogy »

Legální operační systém

Kniha Ubuntu 10.04 CZ
Top Multimediální centra