R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

tammikuu, 2015

R, Excel ja rivinvaihdot soluissa

Rivinvaihdot kentissä Esimerkiksi Excel-tiedostoissa voi olla rivinvaihtoja solujen sisällä. Tyypillisesti tällainen tilanne syntyy vaikkapa, kun soluun halutaan tallentaa osoitetieto, jossa nimi, katuosoite ja postinumero ovat kukin omilla riveillään. Jos tällaisen tiedoston luo Excelissä (Book1.xlsx), ja tallentaa sen csv-muodossa (Book1.csv), tulee rivinvaihtoja sisältävien solujen sisältö tiedostoon lainausmerkeissä, mikä taas mahdollistaa tiedoston lukemisen oikein esimerkiksi R:ään. Sama […]

Posted in R-ohjelmointi | No Comments »

Taulukoiden tuottaminen R:stä

Taulukoiden tuottaminen esimerkiksi Word-tiedostoon tai Excel-taulukoksi on perinteisesti ollut eräs R:n hankalimmin tehtävistä perustoimenpiteistä. Useimmiten olen vain kopioinut R:n komentoriviltä raaka-taulukon tekstinä, pilkkonut sen vaikkapa Excelissä sarakkeisiin, ja muokannut lopulliseen muotoon. Tiesin kyllä, että näppärämpiäkin keinoja on, mutten ollut jaksanut aiemmin niihin tutustua. Kokosin nyt parin viikon testikäytön jälkeen alle lyhyen koodikatkelman ja esimerkkejä eräistä […]

Posted in Note to self, R-ohjelmointi | No Comments »

read.spss {foreign} ja päivämäärät

Foreign-paketti tarjoaa näppärän tavan lukea SPSS-muotoisia tiedostoja R:ään. Hieman harmilinen piirre liittyy päivämäärien lukuun: R nimittäin esittää ne SPSS-tiedostosta luettuna sekuntimuodossa. Onneksi ongelma on helppo korjata, sillä SPSS:n numeerinen esitysmuoto on sekuntia päivästä (oikeastaan keskiyöstä) 14.10.1582 (gregoriaanisen kalenterin alkuhetki). Tällöin päivämäärät voidaan muuntaa R:ssä sopivaan muotoon esimerkiksi seuraavasti: dates<-c(13234838400) as.Date(as.POSIXlt(dates, origin="1582/10/14")) # 2002-03-07dates<-c(13234838400) as.Date(as.POSIXlt(dates, origin="1582/10/14")) […]

Posted in Note to self, R-ohjelmointi | No Comments »