R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

huhtikuu, 2011

SAS-tiedostot R:ään

R:n foreign-paketti mahdollistaa monien tilasto-ohjelmistojen, kuten IBM SPSS:n, tiedostojen lukemisen suoraan R:ään, mutta SAS:n suljetulle tiedostomuodolle (sas7bdat-tiedostot) ei tällaista ominaisuutta R:stä ole vielä löytynyt. Olen aiemmin muuntanut SAS-tiedostot sarake-erotelluiksi tekstitiedostoiksi SAS Universal Viewer -ohjelmalla, ja lukenut ne sitten R:ään, mutta nyt BioStatMatt-blogissa on julkaistu R-kielinen ratkaisu. Käyttö on helppoa (esimerkki suoraan mainitusta blogista): source("http://biostatmatt.com/R/sas7bdat.R") read.sas7bdat("http://bus.utk.edu/stat/stat579/hotel.sas7bdat")source("http://biostatmatt.com/R/sas7bdat.R") […]

Posted in R-ohjelmointi | No Comments »

Summary-funktio

R:ssa on useita tapoja summata dataa ryhmän mukaan. Tällaisia funktioita on mm. aggregate, tapply, summaryBy (doBy-kirjasto), reshape (reshape- ja reshape2-kirjastot), plyr-kiraston monet funktiot ja niin edelleen. Käyttäjät voivat kehittää myös omia summary-funktiota perustuen olemassaoleviin funkitoihin. Tässä yksi esimerkki tällaisestä funktiosta: set.seed(90) ; v <- rnorm(200, 200, 20) ; g <- factor(rep(LETTERS[1:5],c(50,40,30,60,20)), levels=LETTERS[1:10])   group.sum <- […]

Posted in R-ohjelmointi, Skriptit | No Comments »

Helsinki Region Infoshare

Helsinki Region Infoshare (HRI) -palvelu tarjoaa tietoa Helsingin seudusta. HRI jakaa julkisten tietovarantojen sisältöjä avoimena datana. Palvelu on vielä kehitysvaiheessa, mutta tarjolla on jo runsaasti erilaisia aineistoja. Sivustolta löytyy myös linkkejä muihin avoimen datan lähteisiin, kuten Tilastokeskuksen ja Kelan tilastoihin. Tällä hetkellä HRI:n jakamien aineistojen käytettävyys on rajallista, sillä aineistoja jaetaan useissa erilaisissa formaateissa, esimerkiksi […]

Posted in Aiheeton, Yleistä | No Comments »

Category