R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

syyskuu, 2014

Microsoft Excel tutkimusaineiston hallintavälineenä

Microsoft Excel tai jokin muu vastaavanlainen taulukkolaskentaohjelma lienee eräs yleisimmistä aineistojen tallentamiseen ja manipulointiin käytetyistä tietokoneohjelmistoista. Sitä voi mainiosti käyttää vaikkapa tutkimusaineiston hallintavälineenä, mutta käytännössä voi olla hyötyä, jos toisettavan tutkimuksen (”reproducible research”) ideoita sovelletaan datan hallinnassa. Toistettavan tutkimuksen ajatuksena on, että aineiston analyysin aikana tehdyt muokkaukset ja sovelletut menetelmät tulevat dokumentoitua sellaisella tarkkuudella, että […]

Posted in Yleistä | No Comments »

Yksinkertaista tekstinlouhintaa

Olen tainnut useammankin kerran kirjoittaa R:n tarjoamista mahdollisuuksista harrastaa ruudunkaavintaa (screen scraping). R:ssä on myös varsin hyvät ominaisuudet esimerkiksi tekstinlouhintaa ajatellen, esimerkiksi paketit tm ja qdap. Ruudunkaavinnalla hankitun tekstuaalisen aineiston analyysissä tekstinlouhintatyökalut ovat varsin keskeisiä. Harmillisesti toiminnallisuus keskittyy etupäässä englanninkielisen tekstin käsittelyyn, ja suomenkielistä tekstiä varten soveltuvia analyysiä tukevia aineistoja, esimerkiksi sanalistoja, ei ole kovin […]

Posted in Grafiikka, R-ohjelmointi, Skriptit | No Comments »