R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

marraskuu, 2009

Survive R

Seitsemän vinkkiä miten R:n kanssa selviää.

Posted in Aiheeton | No Comments »

Muuttujien erottaminen taulusta muuttujatyypin perusteella

Alla lyhyt esimerkki miten esim. faktorit saa data.framesta otettua toiseen (uuteen) data.frameen. Tässä esimerkissä faktori-tyyppiset muuttujat ”wool” ja ”tension” siirretään uuteen objektiin. > head(warpbreaks) breaks wool tension 1 26 A L 2 30 A L 3 54 A L 4 25 A L 5 70 A L 6 52 A L > str(warpbreaks) ’data.frame’: 54 […]

Posted in R-ohjelmointi, Skriptit | No Comments »

Spatial data: Suomen kuntien piirtäminen R:llä

R soveltuu myös kartta-aineistojen ja GIS-datan käsittelyyn, koordinaattien laskentaan ja karttojen piirtämiseen. Global Admininstrative Areas (GADM) – verkkosivusto tarjoaa dataa valtioiden hallinnollisista aluesta (valtiot, maakunnat, kunnat). Datan voi ladata monessa muodossa: shapefile:na, ESRI geodatabase-tiedostona, Google Earth-tiedostona  ja nyt myös .Rdata-tiedostona. Ohessa lyhyt esimerkki Suomen kuntien plottaamisesta kartalle. Laajemmat ja hienommat karttatulkinnat löytyvät mm. ”R” you […]

Posted in R-ohjelmointi, Skriptit | 1 Comment »

Artikkeli SAS:sta NYT:ssa

SAS:sta oli mielenkiintoinen artikkeli 21.11.2009 julkaistussa New York Times-lehdessä. R mainitaan artikkelissa SASin mahdollisena kilpailijana. SASin kiinnostus Open Sourcea ja etenkin R:ää kohtaan on noussut viime vuosina.

Posted in R-ohjelmointi | No Comments »

R-harjoituksia yhteiskuntatieteilijöille

Wikiverisityyn on perustettu R:ää varten oma sivunsa, jossa on vinkkejä, linkkejä ja harjoituksia R:n liittyen: ”R-harjoituksia yhteiskuntatieteilijöille -itseopiskeluaineisto on tarkoitettu täydentämään Menetelmäopetuksen tietovarannon kvalitatiivisia menetelmiä opettavaa osuutta” Eikun tutustumaan!

Posted in Aiheeton | No Comments »

Python: poista > ja + merkit R koodista

Tein pienen Python-skriptin, jolla saa > ja + merkit pois esim. tähän blogiin postatuista R-skripteistä (jotka on copy-pastettu RGui:sta). #!/Python26/ # -*- coding: utf-8 -*-   import sys   def main(argv): if len(argv) < 2: sys.stderr.write("Usage: %s <file.txt>" % (argv[0],)) return 1   f = open(sys.argv[1]) lines = f.readlines() f.close()   for line in lines: […]

Posted in Muu ohjelmointi, R-ohjelmointi, Skriptit | No Comments »

Data excelistä (csv): päivämäärä R:n ymmärtämään muotoon, osa 2

Pohdin edellisen postin jälkeen, että miten useamman päivämäärämuuttujan saa kerralla muutettua R:n ymmärtämään muotoon. Koska data.frame on periaatteessa lista, onnistuu se käyttämällä lapply-funktiota. Tässä esimerkki, muitakin (parempia?) keinoja varmasti on: > #Asetetaan työalue > setwd("C:/temp/") > #Tuodaan data > p <- read.csv2("C:pvmexcel.csv", header=T, na.strings="", strip.white=T) > #tehdään regexpi, joka tarkastaa päivämäärämuodon dd.mm.yyyy > md <- […]

Posted in R-ohjelmointi, Skriptit | 2 Comments »

Data excelistä (csv): päivämäärä R:n ymmärtämään muotoon

MS Exceliä käytetään laajasti, ja analysoitava data on usein .xls-muodossa. Yleensä toimin niin, että tallennan datan .csv-muotoon (jotta ylimääräiset roskat poistuvat) ja importoin tiedoston R:ään. Usein taulukoissa on päivämääräkenttiä, jota pitää muuttaa R:n ymmärtämään muotoon. Ohessa esimerkki, joka kuvaa tyypillisen tilanteen ja ratkaisun päivämään muuntamiseen R:lle suotuisaan formaattiin: > #Asetetaan työalue > setwd("C:/temp/") > #Tuodaan […]

Posted in R-ohjelmointi, Skriptit | No Comments »

R ekologeille: muutama linkki

Jari Oksasen ”R: opas ekologeille”-monisteen lisäksi ekologeille löytyy myös muita lähteitä R-tiedon juurille. Tässä muutama linkki: Ecological Statistics with R! Ecological Models and Data in R R-taskhelp: Ecology R Labs for Vegetation Ecologists Journal of Statistical Software: Ecology and Ecological Modeling in R Sähköpostilista: R-sig-ecology

Posted in R-ohjelmointi | No Comments »