R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

joulukuu, 2015

Datan esikäsittelyvaiheet ja siihen tarkoitetut R-paketit

Datan muokkaus vie aikaa Suuri osa data-analyysin vaatimasta ajasta kuluu tyypillisesti aineiston käsittelyyn analysoitavaan muotoon. Usein kuulee sanottavan, että aineiston muokkaaminen vie koko analyysiin tarvittavasti ajasta suurimman osan, keskimäärin jopa 80% ajasta. Käytännössä siis analyysin vaatimista vaiheista hitain on juuri aineiston käsittely. Tähän vaiheeseen voi mennä vieläkin pidemmän aikaa, jos samalla joutuu tutustumaan aineiston muodostaneisiin […]

Posted in R-ohjelmointi, Yleistä | 2 Comments »

Propensiteettipistemäärään perustuva kaltaistaminen havainnoivien tutkimusten analysoinnissa

Taustaa Sekoittavat muuttujat (confounders) haittaavat altisteiden (esim. tupakka) ja vasteiden (esim. keuhkosyöpä) välisten suhteiden selvittämistä. Sekoittavat tekijät ovat ominaisuuksia, jotka liittyvät sekä vasteeseen että sitä selittäviin muuttujiin. Esimerkiksi kaivostyöntekijöillä on muita enemmän keuhkosyöpää, mutta toisaalta he myös tupakoivat keskimääräistä enemmän. Kaivostyöskentely on siten tupakoinnin ja keuhkosyövän välistä yhteyttä sekoittavatekijä. Sekoittavat tekijät voidaan toisinaan huomioida koeasetelmalla, […]

Posted in R-ohjelmointi | Kommentit pois päältä artikkelissa Propensiteettipistemäärään perustuva kaltaistaminen havainnoivien tutkimusten analysoinnissa

ASCII art from R

There’s a plethora of suitable software freely available on the Internet, but I haven’t found a single R function that would allow conversion of images to ASCII art. I can’t quite figure out why, but I’ve always had a sore spot for ASCII art, so I had to cook a function of my own. The […]

Posted in Grafiikka, R-ohjelmointi | 1 Comment »

Category