R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

lokakuu, 2016

Riskin visualisointi: esimerkkinä rokotukset

Kirjoitin jo aiemmin riskien visualisoinnista luonnollisia frekvenssejä käyttäen. Ylen Prisma Studion Näkökulmassa oli vastikään artikkeli, josta sain aiheen palata tällaiseen visualisointiin uudelleen. Artikkelissa nimittäin havainnollistetaan rokottamiseen ja rokottamatta jättämiseen liittyviä riskejä vertaamalla niiden suuruuksia noppapeliin. Riskien suuruuksien hahmottamisessa riskiteatteri voisi kuitenkin olla hyödyllinen lisätyökalu. Esimerkiksi todennäköisyyttä saada tuhkarokkorokotteesta verihiutaleniukkuus (trombosytopenia) kuvataan artikkelissa seuraavasti: ”Toisella kierroksella […]

Posted in Grafiikka | Kommentit pois päältä artikkelissa Riskin visualisointi: esimerkkinä rokotukset

RStudio ja R Notebooks

RStudion esimulgaisuversiossa on uutena ominaisuutena R Notebook-toiminnallisuus. Muistikirjaominaisuuden ydinajatuksena on nivoa yhteen ohjelmointikieliset komennot, niiden tuottamat tulosteet ja näiden selväkieliset selitykset, tulkinnat ja muut vastaavanlaiset muistiinpanot. RStudion:n muistikirjat muistuttavat Pythonin Jupyter-muistikirjoja tai IPython-muistikirjoja. RStudio ei ole suinkaan ainoa tuote R-markkinoilla, vaan saatavilla on mm. Beaker Notebook ja rNotebook (github). RStudion R Notebooks -tutoriaali tarjoaa eväät […]

Posted in R-ohjelmointi, Yleistä | No Comments »

Biodiversiteettiä Suomessa

Global Biodiversity Information Facility (GBIF) on eräs eliölajiston monipuolisuus- ja levinneisyystietoa keräävistä kansainvälisistä yhteistyöhankkeista. Suomi on GBIF:n osallistunut toimintaan vuodesta 2001. Osallistuvissa maissa on kansallinen solmu, joka hoitaa lajistotiedon vaihtoa GBIF-projektin kanssa. Suomessa solmuna on Suomen lajitietokeskus (laji.fi). Lajitietokeskuksella on puolestaan omia kansallisia yhteistyökumppaneita, joiden keräämän lähdeaineiston varaan mm. laji.fi:täkin rakennetaan. Laji.fi ei vielä tarjoa […]

Posted in Grafiikka, R-ohjelmointi | No Comments »

Preattentiivinen prosessointi ja sen hyödyntäminen datan visualisoinnissa

Ihmisen näköaisti Tilastollisten kaavioiden laatimiseen on tiettyjä hyväksi havaittuja pääsääntöjä, jotka perustuvat tieteellisiin tutkimuksiin ihmisen näköaistista ja näköhavaintojen tulkintaan liittyvistä neurologisista prosesseista. Tiedon visualisointi onkin arvostettu ja pitkän historian omaava tieteenala. Ihmisen näköaistin toimintaa koskeva feature integration theory (Treisman, 1998) postuloi, että näköaistimukset analysoidaan kahdessa vaiheessa: 1) preattentiivisessa vaiheessa havaitaan yleisiä näkökentässä olevia peruspiirteitä, jotka […]

Posted in Grafiikka, R-ohjelmointi | No Comments »

Using sqldf to manipulate data frames and SQLite databases

Sqldf is an R package that offers tools for manipulating tabular data. Tabular data can be either data frames or tables in a database. The next code collection goes through some common manipulations of the data frames covering both the canonical (base-R) and the sqldf ways to implement these manipulations. In addition, the last code […]

Posted in Note to self, R-ohjelmointi | No Comments »

Kuvakollaasi magick-paketilla

Jarno kirjoitti aiemmin kuvakollaasin tekemisestä EBImage-paketilla. EBImagen kuvankäsittelyominaisuudet eivät valitettavasti tyydytä kaikilta osin omia vaatimuksiani. Esimerkiksi kuvan pienentäminen paketin resize-funktiolla heikentää usein kuvan laatua merkittävästi. Onneksi kuvankäsittely R:ssä on ottanut hiljattain aimo askelen eteenpäin. Uusi magick-paketti tuo tunnetun ImageMagick-kirjaston laajat kuvankäsittelyominaisuudet R:n käyttöön ja tarjoaa mahdollisuuden tehdä kaiken vektoroidusti, eli vaikkapa koko hakemiston kuville kerralla. […]

Posted in Grafiikka, R-ohjelmointi | No Comments »

Category