R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

huhtikuu, 2016

Todennäköisyys, että raportoitu löydös on oikea

Viime aikoina olen kuullut keskustelua siitä, että joka ikisen analyysin yhteydessä pitäisi ilmoittaa todennäköisyys, että löydös on väärä. Ilmeisesti keskustelu ei ole koskenut p-arvoa, vaan nimenomaan väärän johtopäätöksen todennäköisyyttä, mikä tekeekin asiasta hieman kinkkisemmän. P-arvohan on frekventistisen tilastotieteen käsite, joka ilmoittaa toistetun otannan tilanteessa sen frekvenssin, jolla havaittua testisuureen arvoa äärevämpiä arvoja esiintyy, jos nollahypoteesi […]

Posted in Aiheeton | Kommentit pois päältä artikkelissa Todennäköisyys, että raportoitu löydös on oikea

Muistatteko nopean fread() -funktion? Nyt sillä on kaverikin: fwrite()!

R:n laajennuspaketissa data.table on funktio fread(), jolla suurienkin tekstitiedostojen lukeminen R:ään onnistuu suhteellisen nopeasti. Nyt funktiolle on tullut aisapariksi funktio fwrite(), jolla tekstitiedostojen kirjoittaminen onnistuu nopeasti. Kirjoitusfunktio on paketin uusimmassa kehitysversiossa,joka asennetaan seuraavasti: library(devtools) install_github("Rdatatable/data.table")library(devtools) install_github("Rdatatable/data.table") Asennus vaatii Rtools-työkalustosta paikallisen asennuksen. Otetaanpa esimerkki, miten data.table-paketin funktioita käytetään. Latasin airlines-aineistosta vuoden 2008, ja poimin siitä 1 […]

Posted in R-ohjelmointi | Kommentit pois päältä artikkelissa Muistatteko nopean fread() -funktion? Nyt sillä on kaverikin: fwrite()!

Elämä viikkoina esitettynä

Miltä näyttää keskimääräinen suomalaisen ihmisen elämä viikkoina havainnollistettuna? Katsotaanpa. Mainittakoon alkajaisiksi, että tämä havainnollistamistapa sai alkunsa, kun yritin selvittää vuoden viikkoja päivämäärien perusteella. Tämä onnistuu nähtävästi R:ssä helposti esimerkiksi seuravalla koodilla: as.numeric(format(as.Date(2016-04-18″), ”%V”)). Tässä muodostettavan kuvion esitystapa noudattelee löyhästi usein epidemiologiassa käytettyjä tapoja. Niissä havainnollistetaan yksiköitä (henkilö, aika, yms.) yksittäisinä symboleina, jolloin luonnollisten frekvenssien hahmottaminen […]

Posted in Grafiikka, R-ohjelmointi | 1 Comment »