R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

elokuu, 2010

Siloitettu hajontakuvio: ggplot2-versio

Kuten edellisessä esimerkissä todettiin, asioiden tekemiseen R:llä on useita vaihtoehtoja. Tässä esimerkki siloitettujen hajontakuvioiden piirtämisestä käyttäen ggplot2-grafiikkaa: install.packages(c("ggplot2", "gridExtra")) library(ggplot2) library(gridExtra)   x<-rnorm(45000) y<-x+rnorm(45000, mean=1, sd=0.5)   a <- qplot(x, y, alpha = I(1/1)) b <- qplot(x, y, alpha = I(1/10)) c <- qplot(x, y, alpha = I(1/100)) d <- qplot(x, y, alpha = I(1/200)) […]

Posted in Grafiikka, R-ohjelmointi | No Comments »

Siloitettu hajontakuvio

Jos on tarpeen esittää hajontakuviossa suuri määrä havaintoja, voi tavanomaisesta hajontakuviosta olla vaikea hahmottaa muuttujien suhdetta. Tällöin voidaan käyttää jonkinlaista siloitettua tai pehmennettyä hajontakuviota. Sellaisten piirtämiseen on R:ssä runsaasti erilaisia mahdollisuuksia, esimerkiksi: # Simuloidaan aineisto x<-rnorm(45000) y<-x+rnorm(45000, mean=1, sd=0.5)   # Tehdään viisi pikkukuvaa par(mfrow=c(3,2), mar=c(2,2,2,2))   # Tavanomainen hajontakuvio plot(x, y, pch=20, main="plot()")   […]

Posted in Grafiikka | No Comments »

PyCon Finland 2010

Hieman off-topic, mutta R-koodareita saattaa kiinnostaa, että Turussa järjestetään 21.10.2010 Python-kehittäjien konferenssi PyCon Finland 2010. Tapaamisen tiedot tarkentuvat lähitulevaisuudessa.

Posted in Muu ohjelmointi | No Comments »

Gene Expression Omnibus (GEO) ja GEOmetadb

Bob O’Hara pyysi jo pari vuotta sitten blogissaan Deep Thoughts and Silliness selvittämään GEO-tietokannan eksperimenttien koot. GEO-tietokantaan on tallennettu DNA-sirukokeiden tuloksia. Bioconductorin laajennuspaketilla GEOmetadb eksperimenttien kokojen selvittäminen käy äkkiä. Aiempaan 10% otokseen GEO:sta perustuva arvioni siitä, että 90% eksperimenteista koostuu alle 50 DNA-sirusta piti näemmä aika tarkalleen paikkansa: koko tietokannan perusteella 89,4% eksperimenteistä on kooltaan […]

Posted in BioConductor | No Comments »

GLMM-kirjallisuutta

Yleistetyt lineaariset sekamallit (GLMM) ovat muun muassa ekologisessa tutkimuksessa saavuttaneet viime vuosina suurta suosiota. Ben Bolker on kirjoittanut aihetta sivuavan kirjan, jonka vedos on ilmaiseksi saatavilla. Bolkerin GLMM-artikkelin liittyvään Wikiin on kerätty GLMM-menetelmien käyttöön liittyviä vinkkejä. Myös Highland Statistics on julkaissut useita kirjoja, joissa GLMM-menetelmiä käsitellään ymmärrettävästi, ja soveltajan kannalta varsin kattavasti. Lisäksi ovat tietysti […]

Posted in Aiheeton | No Comments »

Cairo

R:n grafiikkamoottori Cairo tuottaa ihan mukavannäköistä grafiikkaa. Asennettaan Cairo CRANista: setwd("C:/Temp/") install.packages("Cairo") library(Cairo)setwd("C:/Temp/") install.packages("Cairo") library(Cairo) Plotataan .png-kuva: Cairo(600, 600, file="plot.png", type="png", bg="white") plot(rnorm(4000),rnorm(4000),col="#ff000018",pch=19,cex=2) dev.off()Cairo(600, 600, file="plot.png", type="png", bg="white") plot(rnorm(4000),rnorm(4000),col="#ff000018",pch=19,cex=2) dev.off() Plotataan .pdf-kuva: CairoPDF("plot.pdf", 6, 6, bg="transparent") data(iris) attach(iris) plot(Petal.Length, rep(-0.03,length(Species)), xlim=c(1,7), ylim=c(0,1.7), xlab="Petal.Length", ylab="Density", pch=21, cex=1.5, col="#00000001", main = "Iris (yet again)", bg=c("#ff000020","#00ff0020","#0000ff20")[unclass(Species)]) for (i […]

Posted in Grafiikka, R-ohjelmointi | No Comments »

apply-funktiot: demystified

Useimmissa ohjelmointikielissä käytetään runsaasti for-silmukkaa. R:ssä for-silmukan käyttö on vähäisempää, johtuen lähinnä siitä, että R sisältää suorituskyvyn näkökulmasta tehokkaampia funktioita. Tällaisia ovat muun muassa apply-perheen funktiot (apply, lapply, sapply jne.). Nämä käsittelevät dataa verktorisoidussa muodossa ja ovat tämän johdosta R:n for silmukkaa tehokkaampia. Apply-funktioihin kannattaa ehdottomasti tutusta. Tässä auttaa mm. What You’re Doing Is Rather Desperate-blogin […]

Posted in R-ohjelmointi | No Comments »

Red-R

Red-R on visuaalinen ohjelmointiympäristö R:ään. Visuaalisessa ohjelmoinnissa ohjelman komponentteja yhdistellään graafisessa ympäristössä, eikä ohjelmaa luoda perinteiseen tapaan kirjoittamalla. Red-R on vielä kehitysvaiheessa, ja sisältää melko rajoittuneen työkaluvalikoiman, mutta on tutustumisen ja seuraamisen arvoinen projekti.

Posted in Aiheeton | No Comments »

R ja SAS-teemaan liittyen

Tähän ”R ja SAS”-teemaan liittyen netistä löytyy mielenkiintoinen 4Pharma Oy:n esitys ”Ärrälle ja Sassiin”. Siinä esitetään, että miten SAS IML-studion kautta R:ää voidaan kutsua suoraan. Kannattaa tsekata.

Posted in R-ohjelmointi, Yleistä | No Comments »

Category