R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

lokakuu, 2012

Kurssimateriaalia suomeksi

R:n opiskelusta kiinnostuneille löytyy englanniksi paljon materiaalia verkosta. Suomeksi alkeisoppaita on kovin vähän tarjolla. Yksi lisäys tähän tarjoomaan on Tuomas Rajalan Jyväskylän yliopiston tilastotieteen laitoksella valmistelema R-kurssimateriaali. Tuomaksen mukaan materiaalin on tarkoitus toimia ”matalan kynnyksen” oppaana R-maailmaan. Ehdottomasti tutustumisen arvoinen kokonaisuus myös edistyneemmälle R-kehittäjälle.

Posted in R-ohjelmointi, Yleistä | No Comments »

Uusien annotaatiopakettien luominen AnnotationDbi:n työkaluilla

DNA-siruaineistojen analysoimiseen R:ssä voidaan käyttää Bioconductor-projektin tuottamia lajennuspaketteja. Monet normalisointia monimutkaisemmat analyysivaiheet vaativat tueksi annotaatiopaketin, joka yhdistää sirulla olevat koettimet muun muassa niiden kohdegeenien toiminnalliseen kuvaukseen. Bioconductor-projekti tuottaa annotaatiopaketteja yleisimmille siruille, ja ne löytyvät projektin sivuilta metadata- tai AnnotationData-nimellä. Kaikille markkinoilla oleville siruille annotaatiopaketteja ei projektin sivuilta kuitenkaan löydy, ja niinpä uusia annotaatiopaketteja voi olla […]

Posted in BioConductor | 2 Comments »

Ajatusten lukua R:llä

R-listoilla nähtyjä ”repäisyjä” keräävä fortunes-laajennuspaketti sisältää mm. seuraavan: library(fortunes) fortune(182)library(fortunes) fortune(182) Brian Ripley: Where did you tell it […]? (Nowhere: R is lacking a mind_read() function!) Peter Dalgaard: Please stop complaining about missing features. Patches will be considered. Oh, it’s you, Brian. Never mind then. You’ll get to it, I’m sure. 😉 — Brian Ripley […]

Posted in Muu ohjelmointi | No Comments »

Data-analyysien vaatiman työmäärän arviointi

Olen viime aikoina yrittänyt tutustua ohjelmoijien tuottavuuden mittaamiseen, lähinnä sitä ajatellen, että osaisin ennen projektin alkamista karkeasti haarukoida tarvittavan työmäärän. Merkittävä osa työstäni nimittäin koostuu erilaisten tilastollisten aineistojen analysoimisesta, ja käytän pääasiallisena työvälineenäni  R-ohjelmistoa. Olen viimeiset vuodet pitänyt kirjaa kuhunkin projektiin käyttämästäni työajasta, ja tässä muutamia kokemuksiani. Olen ottanut tavaksi kommentoida tutkimushankkeissa käyttämäni koodin melko […]

Posted in Aiheeton | No Comments »

Category