R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

R-kieli

Mikä on R?

R on ohjelmointikieli, joka on kehitetty tilastotieteellistä ohjelmointia varten. R on tilastomatematiikan lingua franca S-kielen ohella. Sen avulla voi käsitellä aineistoja, laskea tunnuslukuja, piirtää kuvia – tehdä oikeastaan mitä vain mikä liittyy dataan. R on ns. open source-ohjelma, eli se on vapaasti ladattivissa verkosta, ja kuka tahansa voi periaatteessa kehittää ohjelmaa eteenpäin. R on saatavilla hyvin monille alustoille, mm. Windows:lle, Linux:lle ja MacOS:lle.

R löytyy osoitteesta www.r-project.org

Historiaa:

R-kielen kehittivät Robert Gentleman ja Ross Ihaka Aucklandin yliopistosta Uudesta-Seelannista (lue R:n kuvaava alkuperäinen artikkeli). Vuonna 1997 R-kielen ja -ohjelman kehityksen otti vastuulleen ns. R Core Group (tai R Core Team),  johon kuuluu noin 20 tilastotieteen ja ohjelmoinnin ammattilaista eri puolilta maailmaa.

Vahvuudet:

R-kielen vahvuuksia ovat mm.

  • Koodin avoimuus
    • R:n ohjelmakoodi on täysin avoin (GNU-lisenssi) ja kuka tahansa voi periaattessa osallistua ohjelman kehittämiseen.
  • Suuri käyttäjäryhmä ja yhteisö
    • R:ää käyttää tuhannet ihmiset ympäri maailmaa. Samalla myös ohjelman kehittäjiä on kymmeniä ellei peräti satoja. Tämä tarkoittaa sitä, että ohjelma kehittyy kovaa vauhtia ja ohjelmakoodissa havaitut virheet korjataan nopeasti. (John Foxin esitelmä Use-R 2008 tapaamisessa)
  • R-help
    • R-help on postituslista, jonne kuka tahansa R-käyttäjä voi kirjoittaa ja kysyä neuvoa ja apua ongelmaansa. Listalle tulee kymmeniä viestejä päivässä ja avun voi saada hyvinkin nopeasti.
  • Monipuolisuus (paketit/funktiokirjastot)
    • Käyttäjät voivat kehittää omia funktiota ja julkaista ne kaikkien saataville verkkoon (CRAN). Tällä hetkellä funktiokirjastoja (packages/library) on jo lähes 1500. Monet näistä keskittyvät johonkin tietyyn tieteenalaan tai sovellusalueeseen, kuten esim. ekonometriaan, kasvibiologiaan, geologiaan tai vaikkapa kategoristen muuttujien analyysiin.
  • Yhteyden muihin ohjelmointikieliin ja sovelluksiin
    • R-ohjelmasta on hyvät yhteydet sisään ja ulospäin. Dataa saa tuotua useasta eri järjestelmästä useassa eri muodossa. R-kieltä voi upottaa esim. Perl-ohjelmiin tai C-kieleen. Tämä mahdollistaa R:n käytön siellä missä sitä tarvitaan ja vice versa.
  • Nopeus
    • R käsittelee dataa hyvin nopeasti, joskin hyvin isojen aineistojen kanssa R voi olla vaikeuksissa (esim. jos data-matriisissa on rivejä > 200 000 ja muuttujia 100). Periaatteessa kuitenkin vain tietokoneen muisti rajaa R:ssä käytettävien objektien koon.
  • Ilmaisuus


Category