R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

joulukuu, 2008

Rivien ja sarakkeiden yhdistäminen: smartbind

R:ssä matriisien (matrix) ja datamatriisien (data.frame) rivien ja sarakkeiden yhdistelyyn on olemassa useita käteviä funktiota. Tärkeimmät perusfunktiot ovat rbind ja cbind. Ensimmäinen on tarkoitettu yhdistämään rivejä ja jälkimmäinen sarakkeita. Näiden lisäksi gtools-funktiokirjastosta löytyy funktio smartbind, joka osaa mm. yhdistää riviejä, joiden sarakenimet eivät yhdisty. Alla esimerkki smartbind-funktion käytöstä. #Tehdään datamatriisit g1 <- data.frame(ic = 1, […]

Posted in R-ohjelmointi, Skriptit | No Comments »

Reshaping data

Duncan Golicherin blogissa on mielenkiintoinen artikkeli liittyen R-funktiokirjastoon nimeltä reshape. Tämä on erittäin kätevä paketti/kirjasto datan pyörittelyyn ja funktioita on helppo käyttää. Tärkeimmät funktiot paketissa ovat ehdottomasti melt ja cast, joiden avulla data kääntyy aika moneen muotoon. Kannattaa kokeilla.

Posted in R-ohjelmointi | No Comments »

R ja BioConductor

R:ään perustuvia sivuprojekteja on maailmalla muutamia. Yksi näistä on BioConductor, joka on nykyisin monen bioinformaatikon päätyökalu geenidatan analysoinnissa. Sain kaverini kautta tietää, että IRCnetissä on R/Bioconductor-käyttäjiä varten perustettu oma kanava: #r-project@IRCnet. Kanava toimii R/BioConductor-käyttäjien tiedonvaihtofoorumina. Bioinformatiikasta kiinnostuneille löytyy myös oma kanavansa: #bioinfoseura@IRCnet.

Posted in BioConductor, R-ohjelmointi | No Comments »

Regular Expression Analyzer

Dataa analysoidessa tulee usein vastaan tilanne, jossa on tarpeen erottaa tai ”validoida” osia merkkijonosta. Tämä onnistuu ns. säännöllisten lausekkeiden eli regular expressioneiden (lyh. regexp) avulla. R:ssä regexp-moottoria hyödyntäviä funktoita ovat mm. grep, sub, gsub, regexp ja gregexpr. Myös eräissä muissa funktioissa on mahdollista käyttää säännöllisiä lausekkeita (esim. ls). R:ssä säännöllisten lausekkeiden käyttöön saa ohjeitta kirjoittamalla […]

Posted in R-ohjelmointi | 1 Comment »

Luottamusvälien piirtäminen

Keskiarvon luottamusvälien piirtäminen ei R:ssä ole välttämättä kovin suoraviivaista. Apu tähän löytyy kuintenkin mm. gregmisc-paketeista. Ohessa muutama esimerkki tästä: #install.packages("gregmisc") library(gregmisc) #piirretään keskarvot ja luottamusvälit käyttäen #plotmeans-funktiota with(Indometh, plotmeans(conc ~ Subject, ylim=c(0,2), main="Luottamusvälit"))   #tehdään kuva käyttäen plotCI-funktiota g <- with(Indometh, tapply(conc, list(Subject), ci)) g <- data.frame(do.call("rbind", g)) names(g) <- c("estimaatti","li","ui","stderr") plotCI(g$estimaatti, li=g$li, ui=g$ui, xaxt="n", […]

Posted in R-ohjelmointi, Skriptit | No Comments »

Category