R-ohjelmointi.org
Tilastotieteellistä ohjelmointia R-kielellä
joulukuu, 2015
Datan esikäsittelyvaiheet ja siihen tarkoitetut R-paketit
Datan muokkaus vie aikaa Suuri osa data-analyysin vaatimasta ajasta kuluu tyypillisesti aineiston käsittelyyn analysoitavaan muotoon. Usein kuulee sanottavan, että aineiston muokkaaminen vie koko analyysiin tarvittavasti ajasta suurimman osan, keskimäärin jopa 80% ajasta. Käytännössä siis analyysin vaatimista vaiheista hitain on juuri aineiston käsittely. Tähän vaiheeseen voi mennä vieläkin pidemmän aikaa, jos samalla joutuu tutustumaan aineiston muodostaneisiin […]
Posted in R-ohjelmointi, Yleistä | 2 Comments »
Propensiteettipistemäärään perustuva kaltaistaminen havainnoivien tutkimusten analysoinnissa
Taustaa Sekoittavat muuttujat (confounders) haittaavat altisteiden (esim. tupakka) ja vasteiden (esim. keuhkosyöpä) välisten suhteiden selvittämistä. Sekoittavat tekijät ovat ominaisuuksia, jotka liittyvät sekä vasteeseen että sitä selittäviin muuttujiin. Esimerkiksi kaivostyöntekijöillä on muita enemmän keuhkosyöpää, mutta toisaalta he myös tupakoivat keskimääräistä enemmän. Kaivostyöskentely on siten tupakoinnin ja keuhkosyövän välistä yhteyttä sekoittavatekijä. Sekoittavat tekijät voidaan toisinaan huomioida koeasetelmalla, […]
Posted in R-ohjelmointi | Kommentit pois päältä artikkelissa Propensiteettipistemäärään perustuva kaltaistaminen havainnoivien tutkimusten analysoinnissa
ASCII art from R
There’s a plethora of suitable software freely available on the Internet, but I haven’t found a single R function that would allow conversion of images to ASCII art. I can’t quite figure out why, but I’ve always had a sore spot for ASCII art, so I had to cook a function of my own. The […]
Posted in Grafiikka, R-ohjelmointi | 1 Comment »