R-ohjelmointi.org
Tilastotieteellistä ohjelmointia R-kielellä
Apufunktio uusien pakettien asentamiseen
Minulla on tapana asentaa aina kaikki saatavilla olevat paketit R:ään. Tämä siksi, että jossain vaiheessa kuitenkin huomaan olevani jossakin korvessa ilman verkkoyhteyttä, ja juuri silloin alkaa kovasti tehdä mieli laskea jotakin käänteentekevää, esimerkiksi optimoida mökin lämmitys sopivan koesuunnitelman pohjalta. Toimittuani tällä tavoin yli 10 vuotta, sain vihdoin tehtyä apufunktion, joka tarkistaa tietokoneelle asennetut paketit, ja [...]
Posted in R-ohjelmointi | No Comments
Euroviisut, GitHub:sta lukeminen ja graafiteoriaa
Euroviisujen vuoden 2013 finaali järjestetään 18.5. Malmössä. Koska satuin löytämään GitHub:sta Euroviisujen annettujen äänten jakauman kullekin maalle vuosina 1998-2012, saavat Euroviisut nyt hieman palstatilaa tässäkin blogissa. Halusin selvittää, mitkä maat jakavat toisilleen ääniä, ja onko maan sijainnilla esimerkiksi Pohjois-Euroopassa vaikutusta asiaan. Ensin piti kuitenkin hankkia aineisto. Aineisto on mahdollista ladata GitHub:sta verkkoselaimella, mutta paljon elegantimpaa [...]
Posted in R-ohjelmointi | No Comments
HSL:n datapaketti joukkoliikenteestä
Helsingin kaupunginvaltuutettu Otso Kivekäs mainitsi blogikirjoituksessaan pari kuukautta takaperin HSL:n datapaketista, josta löytyy pääkaupunkiseudun bussien ja ratikoiden saapumis- ja lähtöajankohdat kullakin pysäkillä. Data-paketissa on aineistoa noin viikon ajalta tammikuulta 2013. Datalle on helppo kuvitella useitakin käyttötarkoituksia, mutta koska en ole aiemmin tutustunut joukkoliikenneaineistoon, yritin saada aineiston luonteesta yleissilmäyksen tekemällä muutamia kaavioita eri bussilinjoista hahmottaakseni keskimääräisten [...]
Posted in R-ohjelmointi | 2 Comments
Harppauskerroksen määrittäminen
Harppauskerros on vesistössä eri vesimassojen välinen vaihettumisvyöhyke. Esimerkiksi lämpötilan suhteen järveen tai mereen voi muodostua termokliini. Itämeressä on myös tyypillisesti halokliini eli kahden eri suolapitoisuudeltaan erilaisen vesimassa välinen vyöhyke. Termokliini on helppo määrittää mittaamalla vesistön tietyn pisteen lämpötila pinnasta riittävän syvälle saakka metrin välein. Homman voi tehdä lämpömittarilla tai sopivalla anturilla, joita saa esimerkiksi kaikuluotaimiin. [...]
Posted in Grafiikka, R-ohjelmointi | No Comments
Valtion ja kuntien työntekijöiden määrä
Tämän aamun (14.4.2013) Helsingin Sanomien Torsti Tietää -palstalla oli kysymys julkisen sektorin työntekijöiden määristä. Kysyjä epäili, että julkisen sektorin, siis kuntien ja valtion, työntekijöiden määrä kaikista työssäkäyvistä olisi kasvanut vuoden 1970 10 %:sta vuoden 2013 32 %:iin. Torsti viittaa valtion työmarkkinalaitoksen, KT Kuntatyönantajien ja Tilastokeskuksen lukuihin, joiden mukaan kasvu ei ole ollut ihan näin suurta, [...]
Posted in Grafiikka, R-ohjelmointi | No Comments
Laajennuspakettien lataaminen
Miten toimisit, jos organisaatiosi verkko estää R:n Windows-versiota lataamasta laajennuspaketteja verkon yli automaattisesti? Tällöin esimerkiksi Packages-valikon toiminnot eivät toimi kunnolla. Vaihtoehtoja on useita, mutta ensimmäisenä kannattanee kokeilla antaa komento setInternet2(TRUE) ennen pakettien asentamista. Kyseinen komento nimittäin ohjaa R:stä tulevan internet-liikenteen käyttämään Internet Explorer-selaimen toiminnallisuutta. Muita mahdollisuuksia on muun muassa kuvattu R FAQ-ohjeessa. Jos mikään muu [...]
Posted in R-ohjelmointi | No Comments
R-blogi
R:stä löytyy asiaa myös Markus Kainun blogista, kannattaa mm. katsoa video aiheesta “Reproducible reports“.
Posted in R-ohjelmointi | No Comments
Muste-workshop 2
Survo-käyttäjät kokoontuvat jälleen Muste-workshopin merkeissä huhtikuussa. Lisätietoja saa yhdistyksen sihteeriltä. Muste on R-ohjelmistolle kehitetty, avoimeen lähdekoodiin perustuva ja vapaasti saatavilla oleva toteutus professori Seppo Mustosen elämäntyönään luomasta Survoohjelmistosta, jonka kehityskaari on jo yli 50 vuoden mittainen.
Posted in Muu ohjelmointi, Yleistä | No Comments
R-kielen perusteet -kirja
Työstin muutama vuosi sitten melko laajaa suomenkielistä R-opasta, mutta työ jäi kesken. En ole ehtinyt päivittämään käsikirjoitusta viimeiseen kahteen vuoteen, mutta tarkoituksenani on julkaista se jossakin muodossa päivitettynä tulevaisuudessa. Julkaisen joka tapauksessa nyt parin vuoden takaisen käsikirjoitusversion (R-kielen_perusteet_2010-04-14) PDF-muodossa alla mainitulla CC-lisenssillä. Käsikirjoitus sisältää varmasti virheitä, epätarkkuuksia ja turhan laajoja yleistyksiä, ja tällä alustuksella vastuu [...]
Posted in Aiheeton | No Comments
Progress bar (tilapalkki)
Eteeni tuli tilanne, jossa oli tarpeen antaa käyttäjälle tietoa silmukalla toteutetun laskennan tilanteesta. Silmukan indeksin voi tietysti tulostaa ruudulle määrä välein, mutta se ei ole kovin kaunis ratkaisu. Sen sijaan funktio txtProgressBar() tulostaa komentoikkunaan etenevän tilapalkin. Erityisen kätevää on antaa funktion styke-argumentin arvoksi numero 3, joka lisää tilapalkin oikeaan reunaan läpikäytyjen silmukoiden suhteellisen osuuden prosentteina, [...]
Posted in R-ohjelmointi | No Comments