R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

Tyhjien korvaaminen edellisellä arvolla

R on täynnä toinen toistaan hyödyllisempia valmiita funktioita. Usein on tilanne, että data ei ole rakenteeltaan eheää ja sitä joutuu käsittelemään paljonkin ennen varsinaista analyysiä. Törmäsin tänään tilanteeseen, jossa datassa oli mukana väliotsikot yhdessä sarakkeessa ja väliotsikoiden alla tyhjää (NA). Tavoitteenani oli täyttää nämä tyhjät rivit väliotsikoilla, ja tämän jälkeen suodattaa datasta pois tietyt rivit väliotsikoiden perusteella. Mietin, että miten tämän asian voisin toteuttaa, kunnes keksin, että joku on varmasti tämän jo miettinyt valmiiksi. Nopea googlaus, ja vastaus oli löytynyt.

Ohessa esimerkki:

library(zoo)
DF <- data.frame(var1 = c("a", NA, NA, NA, "b", NA, NA, NA, "c", NA), var2 = 1:10)
> DF
   var1 var2
1     a    1
2  <NA>    2
3  <NA>    3
4  <NA>    4
5     b    5
6  <NA>    6
7  <NA>    7
8  <NA>    8
9     c    9
10 <NA>   10
DF$var1 <- na.locf(DF$var1)
>DF
   var1 var2
1     a    1
2     a    2
3     a    3
4     a    4
5     b    5
6     b    6
7     b    7
8     b    8
9     c    9
10    c   10
>


Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *