R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

Note to self

Seemingly unrelated regression (SUR) R:llä

Seemingly unrelated regressions (SUR) on ekonometrinen menetelmä, jossa aineistoon sovitetaan useampia regressiomalleja, joiden virhetermien välillä on korrelaatiota. SUR voidaan käsittää myös klassisessa mielessä paneelidatamenetelmäksi, ja se muistuttaa eräiltä piirteiltään myös structural equation model (SEM) -malleja. R:ssä tällaisen mallin voi sovittaa systemfit-paketin funktioilla. Paketti antaa myös mahdollisuuden testata mm. erilaisia hypoteeseja mallien parametrien estimaattien suhteesta. Otetaanpa […]

Tags: ,

Posted in Note to self, R-ohjelmointi | Kommentit pois päältä artikkelissa Seemingly unrelated regression (SUR) R:llä

A quick note on Spark and R

Apache Spark is cluster-computing system with a few add-on tools for added functionality such as SQL queries and machine learning. Spark has an APIs in several languages, one of which is R. There are at least two R packages that implement an interface to Spark. These are SparkR and sparklyr. Package sparklyr makes installing Hadoop, […]

Tags: ,

Posted in Note to self, R-ohjelmointi | Kommentit pois päältä artikkelissa A quick note on Spark and R

Interaktiivinen kuntakartta

R:n karttaominaisuudet parantuvat vuosi vuodelta. Samaten kartta-aineiston saatavuus on viime vuosina oleellisesti parantunut Maanmittauslaitoksen ja Tilastokeskuksen alettua tarjota pohjakarttoja ilmaiseksi. Muun muassa Louhos-blogissa on jo aiemmin katsahdettu suomalaisten kuntien tietojen visualisointiin R:ssä. Täydennän luentomateriaalin vielä seuraavalla esityksellä kloropleettikarttojen muodostamisesta Tilastokeskuksen Kuntien avainluvut -tilastosta. Tilastokeskus on toki tehnyt vastaavanlaisen visualisoinnin, mutta sama onnistuu nykyisin hyvin R:lläkin. […]

Posted in Grafiikka, Note to self, R-ohjelmointi | Kommentit pois päältä artikkelissa Interaktiivinen kuntakartta