R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

huhtikuu, 2015

Molekyylisystematiikkaa R:llä

Molekyylisystematiikka on tieteen ala, jossa tutkitaan lajien sukulaisuussuhteita geneettisten tuntomerkkien, kuten DNA-sekvenssien avulla. Alaa on perinteisesti leimannut työkalujen sekalaisuus, millä tarkoitan sitä, että tulosten saaminen on edellyttänyt kohtuullisen määrän eri ohjelmistojen opettelua ja niiden ominaisuuksien yhdistelyä. Ohjelmistoja, jotka ovat jokseenkin yleisessä käytössä on kymmeniä, joten aiemmin toimin ihan tavanomaisesti esimerkiksi seuraavasti: 1) hain sekvenssit Genbank-tietokannasta […]

Posted in BioConductor, Note to self, R-ohjelmointi | No Comments »

Tekstitiedostojen lukeminen R:ään nopeasti: read.table, read_table ja fread

Johdanto Lienee jokseenkin tunnettu tosiseikka, että R:n tavanomainen funktio read.table() on melko hidas. Tiedostoja on mahdollista lukea paljon nopeamminkin eräiden laajennuspakettien funktioilla. Tällainen on esimerkiksi paketin data.table funktio fread(). Nyt markkinoille on tullut Hadley Wickhamin uusi paketti readr, jonka funktio read_table() on tarkoitettu nopeuttamaan datan lukemista R:ään. Testejä R:ssä Kokeillaanpa. Testinä on aineisto, jossa on […]

Posted in R-ohjelmointi | No Comments »