R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

kesäkuu, 2015

Kuolleisuustrendit Suomessa 1998-2013

Sydänkuolleisuuden trendeihin liittyvä keskustelu on kerännyt runsaasti kommentteja Turun Sanomien blogissa. Keskustelu on useasti sivunnut tämänkin blogin aihepiiriin kuuluvia menetelmällisiä seikkoja, kuten ikävakiointia. Vaikuttaa siltä, että aineistolle, jossa on esitetty sekä havaitut että vakioidut tai odotetut kuolemat tai kuolleisuusluvut, voisi olla käyttöä laajemminkin. Koska kaikki tarvittava data on avoimena datana saatavilla Tilastokeskuksesta, voidaan kaikki siitä […]

Posted in Grafiikka, R-ohjelmointi | No Comments »

Tekstinlouhintaa R:llä, osa 2

Kirjoitin jo aiemmin R:n tarjoamista mahdollisuuksista harrastaa tekstinlouhintaa. Tuossa aiemmassa artikkelissa esiteltyjä funktioita on nyt kehitetty hieman eteenpäin, ja toiminnallisuutta on myös paranneltu. Seuraava esimerkki kuvaa mitä funktioilla voi nykyisin tehdä. Uusina lisäyksinä ovat mm. tekstin irrottaminen suoraan PDF-tiedostoista, kielen tunnistaminen ja tekstien filtteröinti kielen perusteella sekä erilaiset semanttiset mallit ja topic modeling. Funktioiden koodin […]

Posted in R-ohjelmointi, Yleistä | No Comments »

Category