R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

Tilastokeskuksen verotilastot R:llä Power BI:hin, osa 2

Edellisessä osassa haravoitiin Tilastokeskuksen tilastoista verotukseen liittyviä tietoja. Tässä artikkelissa testataan Microsoftin Power BI:n R-liittymää, ja ladataan sen avulla edellisessä osassa esiteltyjä tietoja suoraan Power BI:hin. Tiedot on haettu Tilastokeskuksen sivuilta 9.2.2016. Power BI on Microsoftin ilmainen Business Intelligence -työkalu. Power BI muistuttaa toimintatavaltaan muita tunnettuja BI -työkaluja, kuten Tableau:ta, mutta on tällä hetkellä niitä […]

Posted in Grafiikka, R-ohjelmointi | No Comments

Tilastokeskuksen verotilastot R:ään, osa 1

Verotilastot Ilmaisten verotilastojen tuottaminen on nykyisin pääasiassa Tilastokeskuksen vastuulla. Tilastoja on kahdenlaisia: Aiemmin Verohallinnon ylläpitämät tilastot löytyvät nykyisin vero2.stat.fi -osoitteesta. Muut verotilastot löytyvät Tilastokeskuksen tilastoista Veronalaiset tulot ja Verot ja veronluoteiset maksut. Verotilastojen kyseleminen R:stä Verotilastot voidaan lukea ohjelmallisesti suoraan R:ään pakettien pxR ja pxweb funktioilla. Tilastoissa Veronalaiset tulot ja Verot ja veronluoteiset maksut käytettäviä […]

Posted in Grafiikka, R-ohjelmointi | No Comments

Liiketoiminnan tarpeita: päivystysvuorolista ja muutama R-jippo

Katselin vierestä, kun työkaverini lupautui auttamaan työvuorolistan luomisessa. Ongelma oli periaatteessa yksinkertainen. Päivystyslistalla oli n kappaletta asiantuntijoita, jotka tuli sijoittaa kullekin vuoden k viikolle p päivystysvuoroon siten, ettei kukaan saanut esimerkiksi etupäivystysvuoroa useammin kuin muut. Etupäivystäjä on henkilö, johon aina ensimmäisenä otetaan yhteyttä, joten hänen työkuormansa on etupäivystysviikolla todennäköisesti muita suurempi, ja sen vuoksi kyseinen […]

Posted in Note to self, R-ohjelmointi | 1 Comment

Apufunktiot GAM-mallien sovittamiseen

OIVA-palvelu Ympäristöhallinnon ympäristö- ja paikkatietopalvelu OIVA tarjoaa muun muassa erilaisia ympäristön tilan seurantaan liittyviä aikasarja-aineistoja. Palvelusta saa esimerkiksi kasviplanktonin seurannassa kerättyjä tietoja. Aineistojen avulla voidaan selvittää vaikkapa kasviplanktonin biomassassa tapahtuneita pitkäaikaismuutoksia. Aineisto Hain palvelusta Suomenlahden rannikon näytteenottopisteen ’Suomenl Haapas Kyvy-11’ kasviplankton- ja ympäristötekijätietoja 30.1.2016. Katsotaanpa, miten aineistoon voidaan sovittaa Generalized Additive Model (GAM)-malli, jonka avulla […]

Posted in R-ohjelmointi | 2 Comments

Jonotusjärjestelmän tapahtumakohtainen simulointi simmer-paketilla

Yksinkertainen jonotusjärjestelmä on esimerkiksi kaupan kassajono. Monimutkaisempia jonotusjärjestelmiä ovat vaikkapa sairaalan poliklinikan moniammatillisen tiimin toiminta tai postin kuljetusketju. Tällaisten jonotusjärjestelmien toimintaa voidaan tutkia esimerkiksi simuloimalla. Simulaatiomenetelmät Simulointimenetelmät voidaan jakaa kahteen ryhmään, tapahtumakohtaisiin ja jatkuvatoimisiin. Tapahtumakohtaisessa simuloinnissa mallin tilan muutoksen aiheuttaa jokin tapahtuma. Jatkuvatoimisissa simulaatioissa mallin tilaa seurataan jatkuvasti esimerkiksi ajan funktiona. Simulaatiomenetelmät voidaan jakaa myös […]

Posted in R-ohjelmointi | No Comments

Junaliikenteen aikataulut

Luin tänään Ilta-Sanomista uudesta Junat.net -palvelusta, joka näyttää tietyn aseman junien kulkutiedot ja mahdolliset aikataulusta muuttuneet kulkutiedot. Palvelu näyttää ulkoasultaan siistiltä ja selkeältä, ja sitä on helppo käyttää. Pakkohan tuota oli kokeilla R:lläkin! Tietojen keruu ja käsittely Junat.net -palvelu käyttää rata.digitraffic.fi:n tarjoamaa avointa rajapintaa, joka julkaistu lisenssillä Creative Commons Nimeä 4.0. Junien kulkutiedot on helppo […]

Posted in R-ohjelmointi | No Comments

Lisää pelejä: labyrinttitehtävän puitteet

Tutustuin mielenkiinnosta uuteen peruskoulun opetussuunnitelmaan, johon sisältyy ohjelmointiopetusta, ja ajauduin sitä kautta (jälleen!) Koodaustunnin sivustolle. Sivustolla on muun muassa linkkejä harjoitustehtäviin, joita koodaustunnilla voidaan tehdä. Harjoitukset ovat melko yksinkertaisia Scratch:llä toteutettavia labyrintin läpi kulkevan reitin muodostamiseen tähtääviä tehtäviä. Muistan miten minulla oli yli 30 vuotta sitten ohjelmointia aloittaessani hankaluuksia ymmärtää muun muassa, mikä on silmukka, […]

Posted in Grafiikka, Muu ohjelmointi, R-ohjelmointi | No Comments

Mastermind (Bulls and Cows) R:llä

Mikä on Mastermind? Mastermind on kahden pelaajan kaupallinen peli, jossa ensimmäinen pelaaja muodostaa neljän värin mittaisen salakoodin, jonka toinen pelaaja (koodinmurtaja) yrittää selvittää. Koodissa voi käyttää kuutta eri väriä. Peli muistuttaa vanhempaa peliä Bulls and Cows. Pelien tärkeimpänä erona on, että Mastermind:ssä on käytettävissä kuusi eri väriä, ja värit voivat esiintyä koodissa useana kopiona, kun […]

Posted in R-ohjelmointi | No Comments

Numeronarvauspeli

Väsäsin yhden aamupäivän ratoksi numeronarvauspelin. Tiedättehän sen, jossa pitää arvata tietokoneen arpoma luku väliltä 1-100? Ei mitenkään edistynyttä ohjelmointia, mutta peli on hyvä esimerkki ongelmasta, jonka ratkaisemiseen voi käyttää erilaisia algoritmeija. Rekrytoimani testiryhmän mielestä peli oli väsynyt :-O (”Ei grafiikkaa!”, ”Missä on äänet?”, ”Et kai sä vaan taas yritä opettaa ohjelmointia?”) Opin testiryhmältä silti jotakin: […]

Posted in R-ohjelmointi | 2 Comments

Datan esikäsittelyvaiheet ja siihen tarkoitetut R-paketit

Datan muokkaus vie aikaa Suuri osa data-analyysin vaatimasta ajasta kuluu tyypillisesti aineiston käsittelyyn analysoitavaan muotoon. Usein kuulee sanottavan, että aineiston muokkaaminen vie koko analyysiin tarvittavasti ajasta suurimman osan, keskimäärin jopa 80% ajasta. Käytännössä siis analyysin vaatimista vaiheista hitain on juuri aineiston käsittely. Tähän vaiheeseen voi mennä vieläkin pidemmän aikaa, jos samalla joutuu tutustumaan aineiston muodostaneisiin […]

Posted in R-ohjelmointi, Yleistä | 2 Comments