R-ohjelmointi.org

Tilastotieteellistä ohjelmointia R-kielellä

BioConductor

Molekyylisystematiikkaa R:llä

Molekyylisystematiikka on tieteen ala, jossa tutkitaan lajien sukulaisuussuhteita geneettisten tuntomerkkien, kuten DNA-sekvenssien avulla. Alaa on perinteisesti leimannut työkalujen sekalaisuus, millä tarkoitan sitä, että tulosten saaminen on edellyttänyt kohtuullisen määrän eri ohjelmistojen opettelua ja niiden ominaisuuksien yhdistelyä. Ohjelmistoja, jotka ovat jokseenkin yleisessä käytössä on kymmeniä, joten aiemmin toimin ihan tavanomaisesti esimerkiksi seuraavasti: 1) hain sekvenssit Genbank-tietokannasta […]

Posted in BioConductor, Note to self, R-ohjelmointi | No Comments »

Uusien annotaatiopakettien luominen AnnotationDbi:n työkaluilla

DNA-siruaineistojen analysoimiseen R:ssä voidaan käyttää Bioconductor-projektin tuottamia lajennuspaketteja. Monet normalisointia monimutkaisemmat analyysivaiheet vaativat tueksi annotaatiopaketin, joka yhdistää sirulla olevat koettimet muun muassa niiden kohdegeenien toiminnalliseen kuvaukseen. Bioconductor-projekti tuottaa annotaatiopaketteja yleisimmille siruille, ja ne löytyvät projektin sivuilta metadata- tai AnnotationData-nimellä. Kaikille markkinoilla oleville siruille annotaatiopaketteja ei projektin sivuilta kuitenkaan löydy, ja niinpä uusia annotaatiopaketteja voi olla […]

Posted in BioConductor | 2 Comments »

Gene Expression Omnibus (GEO) ja GEOmetadb

Bob O’Hara pyysi jo pari vuotta sitten blogissaan Deep Thoughts and Silliness selvittämään GEO-tietokannan eksperimenttien koot. GEO-tietokantaan on tallennettu DNA-sirukokeiden tuloksia. Bioconductorin laajennuspaketilla GEOmetadb eksperimenttien kokojen selvittäminen käy äkkiä. Aiempaan 10% otokseen GEO:sta perustuva arvioni siitä, että 90% eksperimenteista koostuu alle 50 DNA-sirusta piti näemmä aika tarkalleen paikkansa: koko tietokannan perusteella 89,4% eksperimenteistä on kooltaan […]

Posted in BioConductor | No Comments »

Omegahat

R-projekti on tuottanut muutamia oheisprojekteja ympärilleen, kuten esimerkiksi Bioconductorin. Toinen vastaavan tyyppinen oheisprojekti on vuonna 1998 pystyyn polkaistu Omegahat (Omega), jonka tarkoituksena on lyhyesti sanottuna tarjota R-käyttäjille rajapintoja eri ohjelmointikieliin ja ”käyttöliittymiin”. Omegahatin sivuilta: ”Omega is a joint project with the goal of providing a variety of open-source software for statistical applications. The Omega project […]

Posted in BioConductor, R-ohjelmointi | No Comments »

CSC:n kurssi Microarray-datan analysoinnista

Tiedoksi, että CSC eli tieteen tietotekniikan keskus on järjestämässä kurssia DNA ekspressiodatan analysoinnnista R/Bioconductorilla.

Posted in BioConductor, R-ohjelmointi | No Comments »

DNA microarray data analysis using Bioconductor

Jarno Tuimala on julkaissut kuukausi pari sitten oppaan DNA microarray datan analysointiin R/BioConductor-ympäristössä. Oppaan nimi on ”DNA microarray data analysis using Bioconductor”. Linkki oppaaseen löytyy Tuimalan sivuilta.

Posted in BioConductor, R-ohjelmointi | No Comments »

R ja BioConductor

R:ään perustuvia sivuprojekteja on maailmalla muutamia. Yksi näistä on BioConductor, joka on nykyisin monen bioinformaatikon päätyökalu geenidatan analysoinnissa. Sain kaverini kautta tietää, että IRCnetissä on R/Bioconductor-käyttäjiä varten perustettu oma kanava: #r-project@IRCnet. Kanava toimii R/BioConductor-käyttäjien tiedonvaihtofoorumina. Bioinformatiikasta kiinnostuneille löytyy myös oma kanavansa: #bioinfoseura@IRCnet.

Posted in BioConductor, R-ohjelmointi | No Comments »