R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

joulukuu, 2015

Datan esikäsittelyvaiheet ja siihen tarkoitetut R-paketit

Datan muokkaus vie aikaa Suuri osa data-analyysin vaatimasta ajasta kuluu tyypillisesti aineiston käsittelyyn analysoitavaan muotoon. Usein kuulee sanottavan, että aineiston muokkaaminen vie koko analyysiin tarvittavasti ajasta suurimman osan, keskimäärin jopa 80% ajasta. Käytännössä siis analyysin vaatimista vaiheista hitain on juuri aineiston käsittely. Tähän vaiheeseen voi mennä vieläkin pidemmän aikaa, jos samalla joutuu tutustumaan aineiston muodostaneisiin […]

Posted in R-ohjelmointi, Yleistä | 2 Comments »

Propensiteettipistemäärään perustuva kaltaistaminen havainnoivien tutkimusten analysoinnissa

Taustaa Sekoittavat muuttujat (confounders) haittaavat altisteiden (esim. tupakka) ja vasteiden (esim. keuhkosyöpä) välisten suhteiden selvittämistä. Sekoittavat tekijät ovat ominaisuuksia, jotka liittyvät sekä vasteeseen että sitä selittäviin muuttujiin. Esimerkiksi kaivostyöntekijöillä on muita enemmän keuhkosyöpää, mutta toisaalta he myös tupakoivat keskimääräistä enemmän. Kaivostyöskentely on siten tupakoinnin ja keuhkosyövän välistä yhteyttä sekoittavatekijä. Sekoittavat tekijät voidaan toisinaan huomioida koeasetelmalla, […]

Posted in R-ohjelmointi | No Comments »

ASCII art from R

There’s a plethora of suitable software freely available on the Internet, but I haven’t found a single R function that would allow conversion of images to ASCII art. I can’t quite figure out why, but I’ve always had a sore spot for ASCII art, so I had to cook a function of my own. The […]

Posted in Grafiikka, R-ohjelmointi | 1 Comment »

Kuvakollaasi EBImage-paketilla

Ilmeni yllättävä tarve tehdä valokuvakollaasi. Kollaasia varten oli tarpeen poistaa kuvista ylimääräisiä reunoja ja sen jälkeen skaalata kaikki kuvat saman kokoisiksi. Mahdollisuuksia Ei itse asiassa pahakaan homma, jos kuvia on vain muutama, mutta esim. GIMP:in tai Irfanview:n kliksuttelu alkaa käydä jo muutaman kuvan jälkeen tylsäksi. Kuvankäsittelyohjelmien lisäksi tavanomainen ratkaisu tähän ongelmaan on esimerkiksi ImageMagick, jonka […]

Posted in Grafiikka, R-ohjelmointi | 1 Comment »