R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

marraskuu, 2014

Työhakemiston asettaminen interaktiivisesti

R:n käyttöä Windows:ssa haittaa pieni, mutta aavistuksen rasittava piirre: työhakemiston vaihtaminen on kankeaa. Periaatteessa työhakemisto on helppoa vaihtaa vaikkapa valikoista Menu->Choose Dir… tai komennolla setwd(choose.dir()), mutta molemmat avaavat hakemistoselaimen, jossa pitää C-levyn juuuren kautta hakeutua työpöydälle (C:->Users->käyttäjä->Desktop). Turhia klikkauksia! Jos kansiossa on tiedostoja, on eräs helpompi tapa siirtyä oikeaan kansioon komento setwd(dirname(file.choose())). Nyt on enää […]

Posted in Note to self, R-ohjelmointi | No Comments »

Editointietäisyys

Editointietäisyys on mitta, joka kertoo, kuinka monta merkkiä merkkijonossa pitää muuttaa, jotta se muuttuu toiseksi. R:ssä on varsin salamannopea implementaatio editointietäisyyden laskemista varten: paketin stringdist funktio stringdist(). Esimerkiksi suomenkielen sanalistasta voidaan tällä etsiä hyvin nopeasti sanoja, jotka muuttuvat pienin muutoksin joksikin toiseksi tyyliin: ”ERKKI, erkki, pepussas on MERKKI”. Mikä olisi esimerkiksi koiralle sopiva rimmaava toinen […]

Posted in Note to self, R-ohjelmointi | No Comments »

Oletusselaimen asettaminen R:ssä

Päivitin taannoin Google Chrome-selaimeni, ja samassa yhteydessä R:n HTML help-toiminnallisuus rikkoutui. Jos siis nykyisin kirjoitan R:n kehotteeseen help.start(), minkä pitäisi avata apusivusto selainikkunaan, mitään ei tapahdu. Tämä on kuitenkin mahdollista korjata antamalla seuraava komento työskentelyn aluksi, ja tämän jälkeen help aukeaa haluttuun selaimeen (OS: Windows 7): options(browser="C:\\Program Files (x86)\\Google\\Chrome\\Application\\chrome.exe") Funktion argumentille browser pitää antaa polku […]

Posted in Note to self, R-ohjelmointi | No Comments »

ABO-veriryhmän alleelifrekvenssit

Hardy-Weinbergin laki Hardy-Weinbergin laki (HW) kuvaa eri genotyyppifrekvenssien ja alleelifrekvenssien suhdetta vapaasti sekoittuvassa (tasapaino)populaatiossa. Laki yksinkertaistaa eri genotyyppien frekvenssit kaavaksi 1 = (p+q)^2 = p^2+2pq+q^2, jossa p on tietyn lokuksen dominoivan alleelin frekvenssi ja q resessiivisen alleelin frekvenssi populaatiossa. Kaava lienee useimmille tuttu jo lukiosta. Esitetty kaava ei sellaisenaan kuvaa tilannetta kolmen alleelin lokuksessa, jollainen […]

Posted in Grafiikka, R-ohjelmointi | No Comments »