Propera reunió 3 de maig 19h PRBB

25 04 2012

Bona tarda usuaris d’R de Barcelona,

Ens plau anunciar la propera reunió del grup RUGBCN, el dijous dia 3 de maig a les 19:00 a la sala Ramón y Cajal del PRBB, on es pot entrar a la sala directament des de la plaça central del edifici. Mapa aquí: http://g.co/maps/786na

En aquesta reunió tindrem l’oprtunitat de tenir una introducció de dos packages específics d’R. A part de conèixer les següents llibreries que ens poden ser útils en el futur, ens permetrà comprovar la versabilitat i els diferents usos que es donen a l’R.

Les presentacions seran les següents

  1. Package seqnir by Pau Corral about 30 min
  2. Package vars by Jilbert Urbina  about 30-40 min

Tal i com varem decidir a l’anterior reunió també hi haurà un espai dedicat als que venen de zero o fa poc que han començat. A la mateixa sala però una mica apartats l’Andreu Vall farà una Introducció a l’R. Si sabeu d’algú que vulgui entrar a l’R però que necessiti un cop de ma, aquesta pot ser una bona ocasió per començar.

Al final de la reunió hem reservat una estona per preparar la propera reunió i explicar com hem anat organitzant les darreres reunions, què s’ha de fer, comentar si algú vol col·laborar, si hi ha idees noves, opcions per millorar etc etc.

Us hi esperem,

Lluís Ramon, RUGBCN





Propera reunió 15 març 19:00 PRBB

28 02 2012

Salut Ristes de Barcelona!

ens plau anunciar la propera reunió del grup d’usuaris d’R de Barcelona, RUGBCN, el dijous dia 15 de març a les 19:00 a la sala Charles Darwin del PRBB: mapa aquí: http://g.co/maps/786na

es pot entrar a la sala directamente des de la plaça central del edifici.El programa es consisteix en fer grups petits de treball (com va funcionar molt bé la darrera vegada) en 2 blocs:

19-20h Grups temàtics:

“Objectes bàsics” by Aleix Ruiz

“Tets estadístics with R” by Roger Borràs

20-21h How to make your code faster

“vectorització vs apply vs bucle” by Tim Riffe

“Parallel” by Aleix Ruiz de Villa

“compile” by Lluís Ramon

com es veu, els temes son variats i pertinents per a usuaris de nivells diverses.

…i després fem copes!

us hi esperem!

Tim, RUGBCN

—————-// English \\——————————-

Greetings R users of Barcelona!

we’re pleased to announce the next meeting of RUGBCN, to be held Thursday March 15th at 19:00 in the Charles Darwin room of the PRBB (Barcelona Biomedical Research Park), located here: http://g.co/maps/786na

you can enter the room directly from the building’s central square.

Since it worked so well last time, we’ve decided to do small hands-on groups, this time in 2 blocks:

19-20h topic groups:

“Basic objects” by Aleix Ruiz

“Statistical Tests with R” by Roger Borràs

20-21h How to make your code faster

“vectorization vs apply vs looping” by Tim Riffe

“Parallel” by Aleix Ruiz de Villa

“compile” by Lluís Ramon

(language of presentation might vary by group, so we’ll figure it out at the meeting)- looks like it’ll be a pretty awesome meeting though. The topic level will be more varied than at previous meetings, so it would be appropriate (we suppose) to invite people that are just getting started.

Afterwards join in for drinks!

we’ll see you there!

Tim, RUGBCN





ggplot2: Com canviar els colors per defecte

25 02 2012

Tot i que a diferents reunions hem parlat de la llibreria ggplot2, com per exemple quan en Maik ens va fer una introducció al package o quan  vam veure plegats el webinar del mateix Hadley sobre les futures millores, al bloc no havíem fet encara cap entrada. Espero que amb aquest post es vegi la qualitat dels gràfics que es poden generar amb ggplot2 i animar a qui no el faci servir a donar-li una oportunitat.

Un dels grans avantatges que té la llibreria ggplot2 és que gestiona automàticament tot el format dels gràfics de forma molt agradable visualment, amb un resultat espectacular. Tot i així, a vegades potser preferiries tenir uns altres colors, escales, background, etc.

Amb aquest post mostro com canviar els colors que posa per defecte ggplot2 amb una variable continua. Primer de tot, utilitzaré un data.frame de base que tothom tingui com és el diamonds i faig un gràfic qualsevol on veiem els colors que utilitza el package per defecte.

library(ggplot2) # Carreguem la llibreria
data(diamonds) # Dataframe de ggplot2 que faré servir per fer els exemples
grafic_Base_continua = qplot(carat, price, data = diamonds, colour = carat)
grafic_Base_continua

qplot amb colors per defecte


Tot seguit canvio el gradient de colors, que en lloc de blau cap a vermell, vull que sigui de taronja cap a verd.

grafic_Base_continua + scale_colour_gradient(low="orange", high="green")

qplot canviant els colors del gradient


Per acabar, faig el mateix tot imposant que a l’escala de colors passi pel blanc. Això ho haurà de fer en el punt 2, això s’especifica amb midpoint.

# Passant per un punt mig de color blanc
grafic_Base_continua + scale_colour_gradient2(low="orange", mid = "white", high="green", midpoint = 2)

qplot canviant els colors del gradient passant per un color entremig

Espero que us pugui ser útil. En un altre post explicaré com canviar la paleta de colors si la variable és categòrica.

Lluís Ramon, RUGBCN





Què desconeixes d’un package? i d’R?

22 02 2012

Fàcilment podràs identificar què saps o utilitzes d’un package o de l’R, però com pots quantificar el que no saps? No t’has trobat mai que després d’utilitzar durant força temps l’R o un package concret descobreixes una funció nova que resulta que és gairebé màgica? Que et soluciona de forma més ràpida o amb una línia de codi allò que t’havia donat tants problemes.

Com casi sempre, al CRAN hi ha un package que omple aquest buit. El package en qüestió és l’unknownR. Fa un cert temps el van presentar al LondonR, la versió londinenca de RUGBCN.

Com funciona:

El package unknownR té només dues funcions, unk i learn.

La funció unk obre un entorn gràfic utilitzant la interfície tcl/tk. Al mateix temps llista totes les funcions que hi ha al package que vols analitzar. Tot seguit les va mostrant d’una en una i llavors has d’anar indicant si la coneixes o no, amb l’espai en cas afirmatiu o amb l’enter en cas negatiu.

unk(pkgs = c("plyr"), top= 0)

En aquest cas analitzariem el package plyr. El paràmetre top inclourà a la llista ha analitzar el nombre indicat de packages més famosos de Crantastic.

Quan vulguis acabar, pots sortir en qualsevol moment i et guardarà les funcions que desconeixes en un fitxer definit segons el paràmetre fnam, podent continuar en un altre moment el procés d’identificar que desconeixes del package en qüestió.

learn()

Un cop fas la instrucció learn, totes aquelles funcions que desconeixies aniran apareixent d’una a una i se’t obrirà el help d’aquesta funció en qüestió. Un cop premis enter, passarà a la següent i continuem amb el procés.

Les funcions que vagis passant ja no et sortiran en el futur que facis learn a no ser que ho identifiquis al paràmetre relearn.

Petites crítiques:

Tot i que l’unknownR em sembla molt interessant, trobo que per a packages amb moltes funcions o amb el base de l’R pots estar molta estona indicant si coneixes o no totes les funcions que conté. A part, com que vols anar depresa per acabar quan abans millor, algunes vegades, sobretot al principi, pots equivocar-te amb facilitat i marcar que coneixes una funció que desconeixes o viceversa. En aquest cas hi ha un botó Back per anar enrere però no acaba de ser massa pràctic.

Una cosa que milloraria més el package seria que també et mostrés el source code. A veure si ho implementen en la propera versió.

Més informació:

La presentació que es va presentar al londonR http://www.londonr.org/unknownR.pdf

Pàgina del projecte a R-forgehttp://unknownr.r-forge.r-project.org/

Interfície gràfica al fer unk

Lluís Ramon, RUGBCN





Resum 3a reunió, Hadley Wickham en directe

15 02 2012

Tercera reunió:

Just fa una setmana, el 8 de febrer de 2012,  ens vam reunir de nou el R User Group Barcelona (RUGBCN).  De nou la reunió va ser al Parc de Recerca Biomèdica de Barcelona (PRBB), a una sala que ens va facilitar en Maik.

Aquest cop en vam ser una mica menys, entre els que van venir a la primera part i els que van venir a la segona deuríem ser uns 14 més o menys. Cares noves i cares conegudes. Potser perquè jugava el Barça :) i no som tant mediàtics com en Messi.

Un cop acabada la reunió, i com ja havíem fet en altres ocasions uns pocs vam caminar fins al bar més proper ( el Tim anava en crosses) i vam sopar mentre el Barça guanyava.

Presentacions:

1) Petits grups temàtics

Com estava previst es van fer els 3 grups temàtics Unit testing by Maik Röder, Transformacions de dades (plyr/ reshape) by Lluís Ramon i Sweave by Tim Riffe.

La veritat és que va ser una presentació molt propera i que permetia ser molt interactiu entre qui presentava la temàtica i qui escoltava. Donava lloc a provar directament a l’R el que estaves explicant i no quedar-se encallat a la presentació única i exclusivament. Aquest format de reunió el fèiem per primer cop, i com a prova pilot,  personalment em va agradar i crec que haurem de tenir-lo present per a futures reunions.

2) Webinar de Hadley Wickham presentant el futur de ggplot2

El webinar del Hadley va ser interessant on passava una presentació i es sentia la seva veu en segon pla.  Com a cosa curiosa, des de Revolutions feien enquestes al moment i a RUGBCN es votava el que la majoria opinava, p.ex: Volum de dades que utilitzes, Com aprens noves tècniques amb l’R, etc i després mostraven els resultats. A la xerrada va explicar les noves millores que ha implementat, tant en eficiència de memòria i velocitat, com afegint nous gràfics, com documentant millore el codi del package. De tot el que va dir, jo em quedo en la disculpava per no estar ben documentat el package però que calia consideraar que ggplot2 va ser el seu segon package i que ara ja n’ha fet més de 30. En quan a les millores, la que més gràcia em va fer, és que a partir de la propera versió es podrà fer un print de qualsevol objecte obtenint les dades exactes que s’han dibuixat com les escales que s’han fet servir.

Podeu veure en diferit el webinar a la pàgina dedicada dins de Revolutions al següent enllaç.

Fotos:

Al següent enllaç hi ha un conjunt de fotografies pujades al picassa de la tercera reunió d’usuaris d’R.

Lluís Ramon, RUGBCN





Grup de Lectura

13 02 2012

S’ha començat un grup de lectura del llibre “The Elements of Statistical Learning”. Aquest es un llibre de referencia força conegut en l’entorn de data minig/statistical learning/machine learning. Ja van pel quart capítol, però si hi esteu interessats segur que us hi podeu enganxar. El format de funcionament és una pagina del tipus “StackOverflow” on cadascú hi penja els dubtes i comentaris. Hi ha també algunes implementacions i exemples amb R.

Per a mes informació

http://esl.ubidata.org/

http://www.datanalytics.com/blog/2011/12/23/%C2%BFnos-leemos-the-elements-of-statistical-learning-de-tapa-a-tapa/#comment-6323

Us animem a que us hi apunteu. Si surt algun tema també es pot presentar al grup RUGBCN.

Aleix, RUGBCN





Rprofile: Personalitzar els packages que es carreguen a l’inici

13 02 2012

Quan inicies una sessió d’R, per defecte es carreguen un conjunt de packages. Normalment són el base, mes els següents datasets, utils, grDevices, graphics, stats i methods. Pots comprovar quins són els que se’t carreguen per defecte fent la següent instrucció:

 getOption("defaultPackages") 

Pots modificar els packages que es carreguen a l’inici d’una sessió d’R has d’anar al fitxer Rprofile que normalment es troba:

  • Library/Frameworks/R.framework/Versions/2.14/Resources/library/base/R [Mac OS X]
  • C:\Archivos de programa\R\R-2.14.1\library\base\R [Windows]
  • /usr/lib/R/library/base/R/Rprofile [Linux] (Actualització gràcies al comentari del Tim)
El fitxer Rprofile conté molts paràmetres d’inicialització que podeu adaptar-los a les vostres necessitats però per personalitzar els packages a carregar heu de buscar el codi següent:

local({dp <- as.vector(Sys.getenv("R_DEFAULT_PACKAGES"))

if(identical(dp, "")) # marginally faster to do methods last

dp <- c("datasets", "utils", "grDevices", "graphics",

"stats", "methods")

else if(identical(dp, "NULL")) dp <- character(0)

else dp <- strsplit(dp, ",")[[1]]

dp <- sub("[[:blank:]]*([[:alnum:]]+)", "\\1", dp) # strip whitespace

options(defaultPackages = dp)

})

Llavors cal modificar la línia de codi que hi ha:

 dp <- c("datasets", "utils", "grDevices", "graphics","stats", "methods") 

i la ampliem amb els packages que utilitzem habitualment, com poden ser el plyr o el ggplot2

 dp <- c("datasets", "utils", "grDevices", "graphics","stats", "methods", "plyr", "ggplot2") 

i a partir de que guardeu el fitxer i reinicieu l’R  ja els tindreu carregats plyr i ggplot 2 cada cop que inicieu l’R. Per més detalls, llegir el següent enllaç al CRAN.

PS: Algú em pot dir on està l’Rprofile en Linux? Actualitzaria el post.

Lluís Ramon, RUGBCN








Follow

Get every new post delivered to your Inbox.