Archive | Manuals d’R & packages RSS for this section

Nou R, RStudio, user2014, web tutorials i concursos

Ja s’acosta l’estiu i molts ja estem preparant les vacances d’estiu. Si teniu algun moment ociós, amb ganes d’actualitzar o jugar amb les darreres novetats de l’R, aquí us passo algunes de les que jo tinc a la meva llista:

RNova versió d’R

El 10 de juliol de 2014 han anunciat la nova versió d’R, la 3.1.1 amb nom en clau Sock it to Me va veure la llum. Podeu llegir els canvis aquí.

Nova versió d’RStudio

Fa gairebé un mes que els desenvolupadors de l’RStudio IDE van anunciar una nova versió del seu entorn de programació amb R, la versió v0.98.932.

Aquesta versió fa petites millores i correccions en molts aspectes, però on realment puja encara més el nivell és amb la integració amb la evolució de l’R Markdown, que permet crear de forma fàcil words, pdf, presentacions, etc.

Podeu baixar la nova versió de l’RStudio al següent enllaç i veure les novetats.

Val al pena donar un cop d’ull a rmarkdown, que és molt interessant i que tard o d’hora haurem de parlar a una reunió presencial.

user2014,  xerrades i slides

La conferència internacional d’R (useR!) es va celebrar de 1 al 3 de juliol de 2014 a Los Angeles.

Allí es van presentar moltes coses interessants. Moltes presentacions s’han compartit per blocs i Twitter però el més fàcil és buscar-les a la web del congrés. Allí hi ha els abstarcts de les xerrades i moltes de les presentacions que es van dur a terme i el codi que van usar. Esperem que vagin afegint les que encara falten.

RStudio web tutorials

També l’equip d’RStudio presenta Essential Tools for Data Science with R. És un conjunt de webinar amb els diferents packages que han desenvolupat que faran al llarg de l’estiu.

Molts dels tutorials o presentacions que van realitzar al useR! sembla que en faran una versió online perquè els que no vam poder assistir també en puguem gaudir. A continuació les llisto:

  • The Grammar and Graphics of Data Science (30-7-14)
    • dplyr: a grammar of data manipulation – Hadley Wickham
    • ggvis: Interactive graphics in R – Winston Chang
  • Reproducible Reporting (13-8-14)
    • The Next Generation of R Markdown – Jeff Allen
    • Knitr Ninja – Yihui Xie
    • Packrat – A Dependency Management System for R – J.J. Allaire & Kevin Ushey
  • Interactive Reporting (3-9-14)
    • Embedding Shiny Apps in R Markdown documents – Garrett Grolemund
    • Shiny: R made interactive – Joe Cheng

Concursos

Finalment, si necessiteu un concurs per motivar-vos una mica, n’hi ha un per finals de més i específic d’R per fer mapes dels grups d’usuaris d’R a nivell mundial, el Prizes for Best R User Groups Plotting Code.

Un altre concurs és el [Official Rules for the F1® Connectivity Innovation Prize][] sobre dades de la formula 1, tot i que el primer challenge ja ha acabat el termini. Si us agrada la F1 caldrà que estigueu atents pels següents. [Official Rules for the F1® Connectivity Innovation Prize]: https://prize.tatacommunications.com/rules

Si cap dels dos et motiven suficient sempre quedarà Kaggle i la seva llista de propostes.

Bones vacances a tots!!!

Advertisements

Introducing ggvis

RStudio Blog

Our first public release of ggvis, version 0.3, is now available on CRAN. What is ggvis? It’s a new package for data visualization. Like ggplot2, it is built on concepts from the grammar of graphics, but it also adds interactivity, a new data pipeline, and it renders in a web browser. Our goal is to make an interface that’s flexible, so that you can compose new kinds of visualizations, yet simple, so that it’s accessible to all R users.

Update: there was an issue affecting interactive plots in version 0.3. Version 0.3.0.1 fixes the issue. The updated source package is now on CRAN, and Windows and Mac binary packages will be available shortly.

ggvis_movies

ggvis integrates with Shiny, so you can use dynamic, interactive ggvis graphics in Shiny applications. We hope that the combination of ggvis and Shiny will make it easy for you to create applications for interactive data exploration and…

View original post 153 more words

Reunions de maig i juny

Ja tenim planificades les pròximes reunions. Una de Machine learning on l’Aleix portarà la veu cantant i una de Shiny on serà el Roc qui ens ensenyarà les bondats i particularitats d’aquest package. Les dues ja estan anunciades al Meetup de Rugbcn. Si encara no esteu apuntats, afegiu-vos, que ja superem els 100 R-users.

Machine learning

Dia: dimecres 21 maig 2014 a les 18:30 Lloc: itnig (the hacker accelerator) àlaba 61, 5-2, Barcelona

Aquesta sessió serà una visió general del camp del Machine Learning. L’Aleix parlarà sobre el principal tipus de tècniques, quines són les aplicacions típiques i com implementar-ho amb R. També s’aprofitarà la sessió per presentar el “Grup d’Estudi de Machine Learning de Barcelona”, GEMLeB.

Per apuntar-vos, informació addicional o comentaris aneu al meetup de l’event.

Introducció a Shiny

Dia: dimecres 25 juny 2014 18:30 Lloc: itnig (the hacker accelerator) àlaba 61, 5-2, Barcelona

Shiny és un package d’R que permet fer aplicacions interactives de forma relativament fàcil. Pots utilitzar aquestes aplicacions en local o si es disposa d’un servidor tenir-les a la web. Aquestes aplicacions permeten des de gràfics interactius, taules, mapes o el que la teva imaginació i les dades et permetin, donant tota la potència de l’R al teu navegador. Però el millor és que mireu els exemples a continuació http://shiny.rstudio.com/gallery/

Per apuntar-vos, informació addicional o comentaris aneu al meetup de la introducció a Shiny.

Cloud Machine Learning

Propera reunió: Creant mapes amb R

Hola R-users,

A la darrera reunió es va mostrar interès per una reunió específica de mapes amb R.

Tot i que potser no té tota la potència d’un GIS es poden obtenir resultats molt espectaculars.

Com a les darreres reunions, ho hem organitzat des del meetup dels usuaris d’R de Barcelona que si encara no sou membres, us convido a afegir-vos, ja som 72 R-users!!!

Per qui vulgui assistir a la reunió siusplau apunteu-vos al meetup ja que en funció del nombre d’assistents anirem a una sala o una altra.

Presentacions:

  • Introducció a mapes amb R per Lluís Ramon
  • Introducció al package rasterVis per Agustin Lobo

Lloc i data:

Ens reunirem el 22 d’abril a les 18:30 a l’Institut de Ciencies de la Terra “Jaume Almera” CSIC, (link mapa), just davant del bar de Biologia de la UB.

Informació relacionada

Per qui no pugui esperar o vulgui veure mapes que es poden fer amb R, afegeixo dues presentacions sobre el tema que ja vam fer al grup d’usuaris d’R de Barcelona:

Barcelona ggmap

Evolució del preu de l’electricitat

Com cada any s’incrementa el preu de la llum, he pensat comparar el que paguem per l’electricitat respecte als nostres veïns europeus i mirar l’evolució dels darrers anys.

Les dades les agafo d’Eurostat, les importo amb el package SmarterPoland i faré l’evolució amb ggplot2.

Què és Eurostat?

Agafant la definició de la wikipedia directament:

L’Eurostat (en anglès: Statistical Office of the European Communities) és l’oficina estadística de la Comissió Europea, que produeix dades sobre la Unió Europea (UE) i promou l’harmonització dels mètodes estadístics dels estats membres.

Package SmarterPoland

Amb l’R moltes vegades val la pena provar sort a google i veure si algú ja ha fet el que intentes realitzar. En el meu cas, importar dades d’Eurostat a l’R. Amb un nom poc intuïtiu hi ha el package SmarterPoland que ens fa la feina d’importar les taules d’Eurostat a l’R a la perfecció.

El package té molt poques funcions, i si tens el codi de la taula d’EuroStat amb getEurostatRCV te la importa a l’R. Pots donar una ullada a tot el que es pot agafar d’Eurostat amb getEurostatTOC.

library("SmarterPoland")

## Loading required package: reshape
## Loading required package: plyr
## 
## Attaching package: 'reshape'
## 
## The following objects are masked from 'package:plyr':
## 
##     rename, round_any
## 
## Loading required package: rjson


tmp <- getEurostatTOC()
head(tmp)

##                                                              title
## 1                                               Database by themes
## 2                                  General and regional statistics
## 3         European and national indicators for short-term analysis
## 4                 Business and consumer surveys (source: DG ECFIN)
## 5                              Consumer surveys (source: DG ECFIN)
## 6                                         Consumers - monthly data
##        code    type last.update.of.data last.table.structure.change
## 1      data  folder                                                
## 2   general  folder                                                
## 3   euroind  folder                                                
## 4    ei_bcs  folder                                                
## 5 ei_bcs_cs  folder                                                
## 6 ei_bsco_m dataset          31.01.2014                  30.01.2014
##   data.start data.end values
## 1                         NA
## 2                         NA
## 3                         NA
## 4                         NA
## 5                         NA
## 6    1985M01  2014M01     NA

dim(tmp)

## [1] 7736    8

table(tmp$type)

## 
## dataset  folder   table 
##    4864    1342    1530

Com que hi ha tantes taules i datasets, per trobar el preu de l’electricitat, he buscat a Eurostat primer a la secció d’energia mirant les taules principals i escollint Electricity prices for household consumers que té codi ten00115. Ho importem a l’R de la següent forma:

preu_elec <- getEurostatRCV("ten00115")
head(preu_elec)

##   currency unit indic_en geo time  value
## 1      EUR  KWH     MSHH  AL 2002     NA
## 2      EUR  KWH     MSHH  AT 2002 0.0932
## 3      EUR  KWH     MSHH  BA 2002     NA
## 4      EUR  KWH     MSHH  BE 2002 0.1137
## 5      EUR  KWH     MSHH  BG 2002     NA
## 6      EUR  KWH     MSHH  CY 2002 0.0845

summary(preu_elec)

##  currency   unit     indic_en        geo           time         value     
##  EUR:456   KWH:456   MSHH:456   AL     : 12   2002   : 38   Min.   :0.04  
##                                 AT     : 12   2003   : 38   1st Qu.:0.09  
##                                 BA     : 12   2004   : 38   Median :0.11  
##                                 BE     : 12   2005   : 38   Mean   :0.11  
##                                 BG     : 12   2006   : 38   3rd Qu.:0.13  
##                                 CY     : 12   2007   : 38   Max.   :0.23  
##                                 (Other):384   (Other):228   NA's   :81

Evolució amb ggplot2

Per fer gràfiques amb l’R, és molt recomanable la llibreria ggplot2. Tot i que inicialment pot ser una mica complicada, un cop ho tens per la ma resulta molt pràctica. Si us decidiu a provar-la, us afegeixo un taller de ggplot2 que vam fer a les IV Jornadas de usuarios de R.

library(ggplot2)

# Creem una variable pais que ens diferenciara Espanya, la mitjana UE27 i la
# resta de paisos.
preu_elec$Pais = ifelse(preu_elec$geo == "ES", "Espanya", "Paisos UE")
preu_elec$Pais = ifelse(preu_elec$geo == "EU27", "EU 27", preu_elec$Pais)

# Cada linia blava representa un pais amb dades a EuroStat
qplot(time, value, data = preu_elec, group = geo, geom = "line", colour = Pais, 
    size = Pais) + scale_size_manual(values = c(2, 2, 0.4))

## Warning: Removed 78 rows containing missing values (geom_path).

Evolucio preu electricitat

Mirem quins són els 5 països amb l’electricitat més elevada.

# L'any 2013 està amb un espai al final.
cond <- preu_elec$time == "2013 "
preu_elec_13 <- preu_elec[cond, ]

head(preu_elec_13[order(preu_elec_13$value, decreasing = TRUE), ], 5)

##     currency unit indic_en geo  time  value      Pais
## 424      EUR  KWH     MSHH  CY 2013  0.2277 Paisos UE
## 438      EUR  KWH     MSHH  IE 2013  0.1951 Paisos UE
## 431      EUR  KWH     MSHH  ES 2013  0.1752   Espanya
## 456      EUR  KWH     MSHH  UK 2013  0.1658 Paisos UE
## 446      EUR  KWH     MSHH  MT 2013  0.1615 Paisos UE


# Xipre, Irlanda, Espanya, Regne Unit i Malta

Conclusions

  • L’any 2013 tenim medalla de bronze al preu de l’electricitat a Europa. Només ens supera Xipre i Irlanda.
  • El preu de l’electricitat a Espanya s’ha incrementat un 74,5% des de l’any 2007. Mentre que la mitjana del preu a la UE27 s’ha incrementat un 17,3% des de l’any 2007.
  • Quan l’economia espanyola anava bé pagàvem menys que la mitjana europea per l’electricitat, llavors el preu estava estabilitzat amb pocs increments d’un any a un altre. En plena crisi el preu es dispara any rere any i paguem molt més que la mitjana europea.
  • A sobre i per empitjorar encara més les coses, a les dades d’Eurostat no es contempla el dèficit tarifari.

PS: Quan escrivia el post hi havia problemes a l’obtenir les dades perquè el servidor d’eurostat estava caigut. Suposo que no és habitual però per si de cas mireu que funcioni 🙂

V Jornadas de Usuarios de R

Aquests proppassats 12 i 13 de desembre s’han celebrat les V jornades d’usuaris de R a Saragossa, organitzades per la Comunidad R Hispano. RugBcn hi ha tingut presència presentant un taller del paquet relenium, desenvolupat per alguns dels seus membres. El taller el podeu trobar desglossat en 3 parts:

Esperem que us siguin d’utilitat.

Aleix Ruiz de Villa,

RugBcn.

Talleres IV Jornadas de usuarios de R

Los talleres de las IV Jornadas de usuarios de R celebradas en Barcelona, fueron grabadas gracias a los cámaras Xavi de Pedro y Esteban Vegas.

Finalmente, el mismo Xavi y yo los hemos subido a un canal de YouTube para que las personas interesadas que no pudieran asistir puedan ver los talleres.

Los talleres que se realizaron fueron los siguientes:

Espero que los videos os sean útiles .

Recordar que las V Jornadas de usuarios de R, que se organizan en Zaragoza el 12 y 13 de diciembre, ya están en marcha.

%d bloggers like this: