R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

joulukuu, 2008

Rivien ja sarakkeiden yhdistäminen: smartbind

R:ssä matriisien (matrix) ja datamatriisien (data.frame) rivien ja sarakkeiden yhdistelyyn on olemassa useita käteviä funktiota. Tärkeimmät perusfunktiot ovat rbind ja cbind. Ensimmäinen on tarkoitettu yhdistämään rivejä ja jälkimmäinen sarakkeita. Näiden lisäksi gtools-funktiokirjastosta löytyy funktio smartbind, joka osaa mm. yhdistää riviejä, joiden sarakenimet eivät yhdisty. Alla esimerkki smartbind-funktion käytöstä. #Tehdään datamatriisit g1 <- data.frame(ic = 1, […]

Posted in R-ohjelmointi, Skriptit | Kommentit pois päältä artikkelissa Rivien ja sarakkeiden yhdistäminen: smartbind

Reshaping data

Duncan Golicherin blogissa on mielenkiintoinen artikkeli liittyen R-funktiokirjastoon nimeltä reshape. Tämä on erittäin kätevä paketti/kirjasto datan pyörittelyyn ja funktioita on helppo käyttää. Tärkeimmät funktiot paketissa ovat ehdottomasti melt ja cast, joiden avulla data kääntyy aika moneen muotoon. Kannattaa kokeilla.

Posted in R-ohjelmointi | Kommentit pois päältä artikkelissa Reshaping data

R ja BioConductor

R:ään perustuvia sivuprojekteja on maailmalla muutamia. Yksi näistä on BioConductor, joka on nykyisin monen bioinformaatikon päätyökalu geenidatan analysoinnissa. Sain kaverini kautta tietää, että IRCnetissä on R/Bioconductor-käyttäjiä varten perustettu oma kanava: #r-project@IRCnet. Kanava toimii R/BioConductor-käyttäjien tiedonvaihtofoorumina. Bioinformatiikasta kiinnostuneille löytyy myös oma kanavansa: #bioinfoseura@IRCnet.

Posted in BioConductor, R-ohjelmointi | Kommentit pois päältä artikkelissa R ja BioConductor