R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

Skriptit

Tyhjien korvaaminen edellisellä arvolla

R on täynnä toinen toistaan hyödyllisempia valmiita funktioita. Usein on tilanne, että data ei ole rakenteeltaan eheää ja sitä joutuu käsittelemään paljonkin ennen varsinaista analyysiä. Törmäsin tänään tilanteeseen, jossa datassa oli mukana väliotsikot yhdessä sarakkeessa ja väliotsikoiden alla tyhjää (NA). Tavoitteenani oli täyttää nämä tyhjät rivit väliotsikoilla, ja tämän jälkeen suodattaa datasta pois tietyt rivit […]

Posted in Aiheeton, R-ohjelmointi, Skriptit | Kommentit pois päältä artikkelissa Tyhjien korvaaminen edellisellä arvolla

Datan lukeminen R:ään: Scan

Blogin päivittämisessä on ollut kohtalaisen pitkä tauko muiden kiireiden johdosta. Ajattelin, että seuraava koodinpätkä voisi olla jakamisen arvoinen, se osoittaa mielestäni hyvin R:n ilmaisuvoiman. Esimerkin lähtökohtana on data, jossa koko data on tekstitiedostossa yhdellä rivillä. Datan rakenne on seuraava: Henkilö1 Hetu Henkilö2 Hetu… Seuraava koodi muuttaa datan data.frame-muotoon: x <- scan(file = textConnection("Henkilo1 XXXXXX-XXXX Henkilo2 […]

Posted in R-ohjelmointi, Skriptit | Kommentit pois päältä artikkelissa Datan lukeminen R:ään: Scan

%nin%

Monesti R-koodissa esiintyy operaattori %in%, joka palauttaa boolean vektorin kahden vektorin vastaavuuksista. Usein tarvitsee palauttaa käänteinen tilanne, josta tässä esimerkki: a <- 1:5 b <- 3:5 which(a %in% b) "%nin%" <- function(x, y) !(x %in% y) which(a %nin% b)a <- 1:5 b <- 3:5 which(a %in% b) "%nin%" <- function(x, y) !(x %in% y) which(a […]

Posted in R-ohjelmointi, Skriptit | 2 Comments »