R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

tammikuu, 2009

DNA microarray data analysis using Bioconductor

Jarno Tuimala on julkaissut kuukausi pari sitten oppaan DNA microarray datan analysointiin R/BioConductor-ympäristössä. Oppaan nimi on ”DNA microarray data analysis using Bioconductor”. Linkki oppaaseen löytyy Tuimalan sivuilta.

Posted in BioConductor, R-ohjelmointi | No Comments »

Tilastollisen kuvion valinta

Andrew Abela on tehnyt kuvan, joka saattaa helpottaa aineistoon sopivamman tilastollisen kuvion valintaa. Itse ainakin koin tämän hyödylliseksi. Katso myös FlowingDatan viisi parasta datan visualisointia viime vuodelta.

Posted in Aiheeton | No Comments »

R ja epidemiologia

R:sta löytyy funktiokirjastoja joka lähtöön, myös epidemiologian alalle. Tärkeimmät paketit epidemiologeille ovat Epi ja epitools. Ne sisältävät useita hyviä funktiota epidemiologisten aineistojen käsittelyyn. Itse olen käyttänyt Epi-paketista mm. funktiota twoby2 (kategoristen aineistojen analyyseihin), pctab (prosenttien laskemiseen taulukoihin), stat.table (taulukoiden tekemiseen), plotEst (mallin estimaattien piirtämiseen), cal.yr (päivämäärien muuttamiseen numeeriseen muotoon) ja ci.lin (esim. odds ration ja […]

Posted in R-ohjelmointi, Skriptit | No Comments »

Kuinka R:ää voi oppia nopeasti?

Andrew Gelman pohtii blogissaan kuinka mm. taloustieteilijät voivat oppia R-kieltä nopeasti. En ole kyseisiä kirjoja lukenut, mutta uskon, että niiden avulla voi oppia ymmärtämään R:ää syvällisemmin. R:n oppiminen vie joka tapauksessa aikaa, ihan niin kuin minkä tahansa ohjelmointikielen, eikä helppoa tietä ole olemassa. Onneksi oppaita on olemassa paljon, ja seuraamalla mm. R-help-keskustelupalstaa, voi oppia nopeastikin […]

Posted in R-ohjelmointi, Yleistä | No Comments »

Kirja-arvostelu: Introductory Statistics with R (Second Edition)

Peter Dalgaardin kirjasta Introductory Statistics with R on ilmestynyt syksyllä toinen painos. Ensimmäiseen painokseen nähden aiheita kirjaan on tullut muutama lisää, kuten kappaleet Poisson regressiosta ja kehittyneestä datan käsittelystä. Kirjasta löytyy tuore arvio Journal of Statistical Software:n sivuilla.

Posted in R-ohjelmointi | No Comments »

Pylväsdiagrammi (barplot): n:t pylväiden päälle

Usein on tarpeen esittää dataa pylväsdiagrammina ja saada n:t pylväiden päälle. Alla oleva esimerkki näyttää, kuinka kuvan tekeminen onnistuu R:llä. #otetaan R:n sisäisestä esimerkkiaineistosta subsetti pop <- state.x77[1:5,1]   #tehdään pylväsdiagrammi bp <- barplot(pop, ylim = range(pop) * c(0, 1.1))   #funktiolla text kirjoitetaan numeeriset arvot pylväiden päälle text(bp, pop, pop, adj = c(0.5, -0.5)) […]

Posted in R-ohjelmointi, Skriptit | No Comments »

ASC2008 R Workshop

Viime kesällä järjestetyn Australia Statistical Conference:n workshopin aiheena oli R:n käyttö tilastotieteessä. Aiheena olivat mm. grafiikka, Rattle (Data mining), yleistetyt lineaariset mallit, R ja Latex etc.  Ohessa linkki tilaisuuden esityksiin.

Posted in R-ohjelmointi | No Comments »

The R Inferno

Burns Statistics on julkaissut uuden oppaan R:n käyttäjille: The R Inferno (pdf). Katsoin oppaan läpi ja uskon, että tähän oppaaseen täytyy vielä palata, näytti todella mielenkiintoiselta.

Posted in R-ohjelmointi | No Comments »

RExcel

Edellisessä postauksessani oli linkki New York Timesin artikkeliin, joka käsitteli R:ää. Artikkelissa sanotaan, että ”Some people familiar with R describe it as a supercharged version of Microsoft’s Excel spreadsheet software…” eli lyhyesti suomennettuna: ”Eräät ihmiset, jotka osaavat ohjelmoida R-kielellä, kuvailevat R:ää boostatuksi Microsoft Excel taulukkolaskentaohjelmaksi”. Todellisuus on aivan toinen. R ei ensinnäkään ole taulukkolaskentaohjelma vaan […]

Posted in R-ohjelmointi | No Comments »

R ja New York times

New York Times julkaisi pitkän arkittelin R:stä eilisessä lehdessään. Kannattaa lukea.

Posted in R-ohjelmointi, Yleistä | No Comments »

Category