R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

toukokuu, 2011

Lineaarinen ja Deming-regressio

Toisinaan tulee esille lineaarisen regression ja pääkomponenttianalyysin ero, tarkemmin sanoen kaksiulotteiseen avaruuteen sovitetun lineaarisella regressiosuoran ja pääkomponentin ero. Asiaa voi havainnollistaa esimerkiksi graafisesti. Alla oleva R-koodi x <- rnorm(10000) y <- x + rnorm(10000, mean=0, sd=0.5) plot(y~x,pch=19,cex=0.5,xlab="Isän pituus (normitettu)",ylab="Pojan pituus (normitettu)", las=1) r <- lm(y~x) abline(r, col="#CC0000",lwd=3) r <- princomp(cbind(x,y)) b <- r$loadings[2,1] / r$loadings[1,1] […]

Posted in Aiheeton | No Comments »

Päivitys sivulle ’Editorit’

Päivitin Editorit-sivullle infoa RStudiosta.

Posted in Yleistä | No Comments »

CART-analyysin visualisointi

Classification and regression trees (CART, päätöspuut) on menetelmä, jolla luodaan tietyn aineiston pohjalta puukaavion muodossa esitetty päätäntäkaavio, jota seuraamalla päästää johonkin päättötapahtumaan. Tarkastellaanpa vaikka Titanicin matkustajien selviämistä onnettomuudesta. Analyysi tehdään R:ssä esimerkiksi seuraavasti: library(rpart) data(ptitanic) fit1 <- rpart(survived ~ ., data=ptitanic, cp=.02) plot(fit1, uniform=TRUE, compress=TRUE, branch=1) text(fit1, use.n=TRUE, cex=1, xpd=NA) Tuloksena syntyy aika karunnäköinen kaavio: […]

Posted in Aiheeton | No Comments »