R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

Biodiversiteettiä Suomessa

Global Biodiversity Information Facility (GBIF) on eräs eliölajiston monipuolisuus- ja levinneisyystietoa keräävistä kansainvälisistä yhteistyöhankkeista. Suomi on GBIF:n osallistunut toimintaan vuodesta 2001. Osallistuvissa maissa on kansallinen solmu, joka hoitaa lajistotiedon vaihtoa GBIF-projektin kanssa. Suomessa solmuna on Suomen lajitietokeskus (laji.fi). Lajitietokeskuksella on puolestaan omia kansallisia yhteistyökumppaneita, joiden keräämän lähdeaineiston varaan mm. laji.fi:täkin rakennetaan. Laji.fi ei vielä tarjoa […]

Posted in Grafiikka, R-ohjelmointi | No Comments

Preattentiivinen prosessointi ja sen hyödyntäminen datan visualisoinnissa

Ihmisen näköaisti Tilastollisten kaavioiden laatimiseen on tiettyjä hyväksi havaittuja pääsääntöjä, jotka perustuvat tieteellisiin tutkimuksiin ihmisen näköaistista ja näköhavaintojen tulkintaan liittyvistä neurologisista prosesseista. Tiedon visualisointi onkin arvostettu ja pitkän historian omaava tieteenala. Ihmisen näköaistin toimintaa koskeva feature integration theory (Treisman, 1998) postuloi, että näköaistimukset analysoidaan kahdessa vaiheessa: 1) preattentiivisessa vaiheessa havaitaan yleisiä näkökentässä olevia peruspiirteitä, jotka […]

Posted in Grafiikka, R-ohjelmointi | No Comments

Using sqldf to manipulate data frames and SQLite databases

Sqldf is an R package that offers tools for manipulating tabular data. Tabular data can be either data frames or tables in a database. The next code collection goes through some common manipulations of the data frames covering both the canonical (base-R) and the sqldf ways to implement these manipulations. In addition, the last code […]

Posted in Note to self, R-ohjelmointi | No Comments

Kuvakollaasi magick-paketilla

Jarno kirjoitti aiemmin kuvakollaasin tekemisestä EBImage-paketilla. EBImagen kuvankäsittelyominaisuudet eivät valitettavasti tyydytä kaikilta osin omia vaatimuksiani. Esimerkiksi kuvan pienentäminen paketin resize-funktiolla heikentää usein kuvan laatua merkittävästi. Onneksi kuvankäsittely R:ssä on ottanut hiljattain aimo askelen eteenpäin. Uusi magick-paketti tuo tunnetun ImageMagick-kirjaston laajat kuvankäsittelyominaisuudet R:n käyttöön ja tarjoaa mahdollisuuden tehdä kaiken vektoroidusti, eli vaikkapa koko hakemiston kuville kerralla. […]

Posted in Grafiikka, R-ohjelmointi | No Comments

Paikalliset pakettikirjastot – esimerkki SURVO R:stä

Survo on tekstin ja numeerisen tiedon käyttöympäristö. Survon uusin inkarnaatio on SURVO M (Muste). Survo R on oikeastaan pakettikokoelma, joka asennetaan erillisestä pakettikirjastosta. Asennusohje pyytää ajamaan seuraavan komennon: source("http://www.survo.fi/install.R") Jos työskentelee organisaatiossa, jossa paketteja ei voi noutaa suoraan internetistä, tulee asennuksessa helposti vastaan ongelmia. Tiedän useita organisaatioita, joilla on oma, paikallinen pakettikirjasto, josta asennukset tehdään. […]

Posted in R-ohjelmointi | No Comments

Äänen tuottaminen R:llä

R osaa tuottaa ääntä, eikä tekninen toteutus ole edes kovin vaikeaa. Mutta miksi kukaan haluaisi tehdä niin? Äänten tuotosta data-analyysien yhteydessä voi olla monenlaista hyötyä. Kaikki eivät esimerkiksi hahmota kuvallisia esitysmuotoja yhtä helposti kuin ääniä tai musiikkia, jolloin vaikkapa äänenkorkeuden vaihtelulla voidaan ilmaista muutoksia tai trendejä aineistossa. Äänten käyttö mahdollistaa tai ainakin helpottaa analyysien tekemistä […]

Posted in R-ohjelmointi | No Comments

Blogin siirto ja kiitokset!

Lauri Nikkinen kertoo: ”Perustin tämän blogin kahdeksan vuotta sitten. Olin tutustunut R:ään pari vuotta aikaisemmin ja alkanut käyttämään sitä ahkerasti kaikissa töissäni. Syynä blogin kirjoittamiseen oli halu jakaa opittuja asioita samalla toivoen, että R-tietoisuus lisääntyy ja yhä useammat datan kanssa työskentelevät ottavat sen omakseen. Voin sanoa, että näin on käynyt. Yhä useammin mm. työpaikkailmoituksissa haetaan […]

Posted in Yleistä | No Comments

Värisokeuden vaikutuksen simulointi

Värisokeus tarkoittaa tilaa, jossa ihmisen väriaisti on häiriintynyt. Yleensä tila johtuu silmän verkkokalvon joidenkin tappisolutyyppien viallisuudesta tai puuttumisesta. On arvioitu, että jopa 10 % miehistä saattaa kärsiä värisokeudesta. Värisokeus on tärkeää huomioida, kun tuotetaan esimerkiksi esitysgrafiikkaa. Jos tätä ei huomioida, voivat jotkin kuvien värit mennä keskenään sekaisin, koska ne eivät erotu toisistaan tarpeeksi. Verkossa on […]

Posted in R-ohjelmointi | No Comments

Missä aktiiviset tulivuoret sijaitsevat?

Eilisessä postauksessa sijoitin kartalle maanjäristyksiä. Tänään ovat vuorossa tulivuoret. Tsunami Laboratory jakelee listaa aktiivisista tulivuorista. Listan avulla maanpäälliset ja merenalaiset tulivuoret on helppo sijoittaa paikoilleen. Eilisen postauksen tapaan listaus voidaan hakea suoraan R:ään. Pienten aineiston muunnosten jälkeen voidaan piirtää maailman kartalle maanpäälliset tulivuoret punaisella ja merenalaiset sinisellä: library(XML) library(mapdata)   v<-readHTMLTable("http://tsun.sscc.ru/nh/volcano.php?iname=&country=&min_absh=-6200&max_absh=6885&min_relh=0&max_relh=8000&min_lat=-90&max_lat=90&min_lng=-180&max_lng=180&d%5B%5D=A&per_page=-1&search=Search+Database") v<-v[[4]]   v$lat<-as.numeric(as.character(v$Lat)) v$lon<-as.numeric(as.character(v$Long)) […]

Posted in Grafiikka, R-ohjelmointi | 1 Comment

Missä maa järisee?

Maanjäristyksiä esiintyy tunnetusti erityisesti mannerlaattojen yhtymäkohdissa ympäri maailmaa. Mutta miten ne sijoittuvat kartalle? Tarkastelin kouluajoilta perinnöksi jäänyttä kartastoani, eikä se varsinaisesti antanut asiasta riittävän hyvää kuvaa. Niinpä lähdin jälleen metsästämään dataa verkosta. Northern California Earthquake Data Center tarjoaa aineistoja maanjäristysten sijainneista, tapahtumahetkistä ja järistysten magnitudeista ilmaiseksi. Palvelusta ladatun aineiston perusteella on mahdollista sijoittaa maanjäristykset kartalle. […]

Posted in Grafiikka, R-ohjelmointi | No Comments