Archive | Info RSS for this section

Nou R, RStudio, user2014, web tutorials i concursos

Ja s’acosta l’estiu i molts ja estem preparant les vacances d’estiu. Si teniu algun moment ociós, amb ganes d’actualitzar o jugar amb les darreres novetats de l’R, aquí us passo algunes de les que jo tinc a la meva llista:

RNova versió d’R

El 10 de juliol de 2014 han anunciat la nova versió d’R, la 3.1.1 amb nom en clau Sock it to Me va veure la llum. Podeu llegir els canvis aquí.

Nova versió d’RStudio

Fa gairebé un mes que els desenvolupadors de l’RStudio IDE van anunciar una nova versió del seu entorn de programació amb R, la versió v0.98.932.

Aquesta versió fa petites millores i correccions en molts aspectes, però on realment puja encara més el nivell és amb la integració amb la evolució de l’R Markdown, que permet crear de forma fàcil words, pdf, presentacions, etc.

Podeu baixar la nova versió de l’RStudio al següent enllaç i veure les novetats.

Val al pena donar un cop d’ull a rmarkdown, que és molt interessant i que tard o d’hora haurem de parlar a una reunió presencial.

user2014,  xerrades i slides

La conferència internacional d’R (useR!) es va celebrar de 1 al 3 de juliol de 2014 a Los Angeles.

Allí es van presentar moltes coses interessants. Moltes presentacions s’han compartit per blocs i Twitter però el més fàcil és buscar-les a la web del congrés. Allí hi ha els abstarcts de les xerrades i moltes de les presentacions que es van dur a terme i el codi que van usar. Esperem que vagin afegint les que encara falten.

RStudio web tutorials

També l’equip d’RStudio presenta Essential Tools for Data Science with R. És un conjunt de webinar amb els diferents packages que han desenvolupat que faran al llarg de l’estiu.

Molts dels tutorials o presentacions que van realitzar al useR! sembla que en faran una versió online perquè els que no vam poder assistir també en puguem gaudir. A continuació les llisto:

  • The Grammar and Graphics of Data Science (30-7-14)
    • dplyr: a grammar of data manipulation – Hadley Wickham
    • ggvis: Interactive graphics in R – Winston Chang
  • Reproducible Reporting (13-8-14)
    • The Next Generation of R Markdown – Jeff Allen
    • Knitr Ninja – Yihui Xie
    • Packrat – A Dependency Management System for R – J.J. Allaire & Kevin Ushey
  • Interactive Reporting (3-9-14)
    • Embedding Shiny Apps in R Markdown documents – Garrett Grolemund
    • Shiny: R made interactive – Joe Cheng

Concursos

Finalment, si necessiteu un concurs per motivar-vos una mica, n’hi ha un per finals de més i específic d’R per fer mapes dels grups d’usuaris d’R a nivell mundial, el Prizes for Best R User Groups Plotting Code.

Un altre concurs és el [Official Rules for the F1® Connectivity Innovation Prize][] sobre dades de la formula 1, tot i que el primer challenge ja ha acabat el termini. Si us agrada la F1 caldrà que estigueu atents pels següents. [Official Rules for the F1® Connectivity Innovation Prize]: https://prize.tatacommunications.com/rules

Si cap dels dos et motiven suficient sempre quedarà Kaggle i la seva llista de propostes.

Bones vacances a tots!!!

Advertisements

VI Jornadas de Usuarios de R (Santiago de Compostela)

IV_jornadasJa fa dies que han anunciat les VI Jornadas de usuarios de R però fins ara no he pogut publicar-ho. Aquest any se celebraran a Santiago de Compostela el 23 i 24 d’octubre de 2014.

Com en les darreres jornades hi ha la modalitat de presentació oral (15 min.), presentació breu (5 min.) i tallers (2h).

El preu és gratuït. També hi ha l’opció de l’assistència a distància via streaming. (Suposo que el Xavi de Pedro deu estar preparant això).

Les dates importants són:

  • 31/07: data límit d’enviament de treballs per a la seva avaluació
  • 31/07: fi d’acceptació de proposta de tallers
  • 15/09: notificació d’acceptació als treballs i dels tallers
  • 23-24/10: celebració de les jornades

Per més detalls consultar la pàgina oficial.

 

R Insurance 2014 amb ponència de Montserrat Guillén

El segon congrés sobre R i assegurances se celebrarà el dilluns 14 juliol 2014 al Cass Business School de Londres, Regne Unit.

Tal com expliquen a la pàgina web del congrés el públic objectiu inclou tant acadèmics i professionals que estan actius o interessats en les aplicacions de R en Assegurances.

El congrés és d’un dia i se centrarà en les aplicacions de les assegurances i de la ciència actuarial que utilitzen l’R. Els temes poden incloure estadística actuarial, models de capital, preus, reservant, reassegurances i els fenòmens extrems, l’assignació de carteres, eines avançades de risc, computació d’alt rendiment, econometria i més. Tots els temes seran discutits en el context de la utilització d’R com una eina primordial per a la gestió de riscos d’assegurances, anàlisi i models.

Una de les ponències principals és la Montserrat Guillén Directora del Riskcenter, the Research Group on Risk in Insurance and Finance, de la Universitat de Barcelona.

Si esteu interessats en l’R i assegurances pot ser un bon lloc per aprendre com s’integren i gent que ho està fent.

R Insurance

Contents amb rugbcn a Meetup

meetup

Bona nit R-users,

Després de la primera reunió a Meetup i les diferents incorporacions de membres, considerem molt positiu el canvi a meetup on ja hi ha més de 50 usuaris d’R. Si encara no us heu apuntat, és molt fàcil i ho podeu fer al següent enllaç.

Pròxima reunió Introducció a l’R

La setmana que ve, el dimecres 5, l’Aleix farà una introducció a R amb l’objectiu d’aprendre les comades bàsiques de R i que després es pugui provar a casa. Donar una visió general de les possibilitats i aplicacions amb R. No cal cap coneixement previ (ni tan sols estadística).

Més informació per apuntar-se i lloc al Meetup de l’event

Primera reunió amb èxit

Gràcies al bon funcionament d’Itnig tot va anar molt bé i hi havia bastanta gent nova. A continuació afegeixo els enllaços de les presentacions:

Web scrapping amb Relenium

L’Aleix va realitzar una petita introducció als conceptes bàsics per entendre web scrapping on podeu veure la presentació al següent enllaç Web Scrapping.

En una segona presentació va mostrar com es podria realitzar utilitzant el package relenium, que està disponible al següent enllaç Relenium.

Dates and Times

La presentació la vaig fer amb RStudio R Presentation i està disponible a rpubs al següent enllaç Dates and Date-Times Classes. La veritat és que és molt fàcil de funcionar i queda bastant bé tot i que penso que el resultat que obtens és un pel rígid.

Per a la presentació vaig crear un repositori a github Dates-and-Date-Times-in-R on hi ha l’script per provar totes les funcions i les dades d’exemple. També està el codi per generar la presentació amb R Presentation.

Properes reunions

Per les properes reunions hem pensat obrir a Meetup reunions sense data que els diferents R-users considerin d’interès. Quan hi hagi un cert quòrum disposats a parlar-ne o assistir i ponents per explicar les temàtiques d’interès fixarem una data.

De moment he obert una d’Introducció a mapes amb R, on el format o el que es vulgui explicar està obert a discussió.

Consulteu la presentació del Data Tuesday

Hola usuaris! Ja podeu consultar aquí la presentació que vam preparar per la primera reunió del Data Tuesday a Barcelona. Aquesta presentació va ser feta amb R Presentations , una nova eina disponible a la versió preview d’RStudio.

Hi users! The presentation we prepared for the Barcelona Data Tuesday launch meeting is now available here. Just let you know that for this presentation we used R Presentations, a new feature available at the preview release of RStudio.

Transport Public de Zagreb amb R

Aquest estiu he anat a Croàcia. Abans del viatge vaig buscar informació del transport públic de Zagreb per mirar les opcions d’anar de l’hotel al centre. La web del transport públic no tenia cap mapa i amb els noms de les estacions en croata no m’aclaria. Buscant per internet vaig trobar la informació a l’Open Street Map (OSM).

Llavors acabava de llegir l’article de l’RJournal osmar: OpenStreetMap and R que explicava com aquest package permet agafar dades de l’OSM. Finalment acabaven de publicar al bloc de Github que es peremetien visualitzar els teus mapes a un repositori.

Tot era massa temptador com per no provar-ho!

Open Street Map (OSM)

OpenStreetMap és un projecte col·laboratiu per crear mapes de contingut lliure usant dades obtingudes mitjançant dispositius GPS i altres fonts de dades. Les dades dels mapes es lliuren sota la llicència Open Database License i tenen els següents elements:

  • Node: Conté els camps latitud i longitud.
  • Way: Un conjunt ordenat de nodes per representar un objecte lineal.
  • Relation: Un grup d’elements (nodes, ways i/o relations) que estan geogràficament relacionades.

Importar dades d’OSM

Aquí és on entra en joc el package osmar. Aquest package és molt diferent i interessant respecte a altres packages que ja havia parlat a Presentació de Mapes amb R. osmar permet agafar la informació que ofereix OSM per treballar directament amb R, no el la imatge de fons sino els objectes.

Per exemple podeu veure les dades disponibles a OSM del transport públic de Zagreb i podeu veure que cada tram és una relation amb un número. Aquest és el número que hem d’utilitzar per importar les dades a l’R utilitzant les funcions get_osm i relation del package osmar. També podem representar les línies del tram amb plot i plot_ways.

library("osmar")

tram5 <- get_osm(relation(2136275), full = TRUE)
tram17 <- get_osm(relation(2114098), full = TRUE)

plot(tram5)

tram5

plot_ways(tram5, col = "blue")
plot_ways(tram17, add = TRUE, col = "red")

tram5 i 17


# Passem les dades a objectes sp.
tram5_lines <- as_sp(tram5, "lines")
tram5_points <- as_sp(tram5, "points")
is(tram5_lines)

## [1] "SpatialLinesDataFrame" "SpatialLines"          "Spatial"

is(tram5_points)

## [1] "SpatialPointsDataFrame" "SpatialPoints"         
## [3] "Spatial"

Convertir les dades a geojson

Segons les explicacions de github, un dels formats que accepten és geojson. Aquest és un format obert per codificar objectes espaials amb els seus atributs no espacials utilitzant JSON.

Utilitzant el package rgdal podem escriure en aquest format les dades que disposem.

library(rgdal)

writeOGR(tram5_lines, "tram5.geojson", "tram5", driver = "GeoJSON")
writeOGR(tram5_points, "tram5_points.geojson", "tram5", driver = "GeoJSON")

Publicar el mapa a github i wordpress

Un cop tenim els fitxers en geojson, vaig crear un repositori a github anomenat rgeojson i fas el commit pertinent amb les dades. Si clickes a un dels fitxers veuràs el mapa.

Jo el que volia era incloure el mapa a l’entrada del bloc però no funcionava. Per lo vist, a wordpress.com que és el servei gratuït que utilitzem, no permeten afegir ni pluguins ni javascript ni res i per això no funcionava l’opció d’afegir el mapa del repositori de github. Per aquest motiu no havia publicat encara l’entrada, perquè sense el mapa em semblava que faltava la peça clau.

Des de github han treballat per disposar els teus mapes en un gist i per sort aquests sí que els accepta wordpress.com.

Aquí teniu el mapa del tram 5 de Zagreb.

Made in Barcelona: Projecte Citybikes

CityBikes

Una de les coses que m’agraden d’escriure al bloc és el feedback que reps. Amb l’entrada Dades del bicing i aplicació amb Shiny, on explicava com obtenir les dades del bicing utilitzant el servei citibikes i com importar-ho a l’R amb JSON, ha superat totes les meves expectatives.

Estant de vacances vaig rebre un correu de Lluís Eskerda, el programador darrere de citybikes, l’aplicació que facilita les dades del bicing i de serveis similars d’altres ciutats del món.

Em va fer molta gràcia saber que el projecte era genuí de Barcelona i la volta que ha fet la informació, en Ramnath Vaidyanathanal al Canadà utilitza les dades recopilades a Barcelona per fer una visualització amb R i torna a Barcelona quan faig l’entrada al bloc dels usuaris d’R de Barcelona.

A més, em va explicar l’objectiu del seu projecte que traduint-ho del lloc oficial:

La raó principal d’aquest projecte és per mostrar a la gent dels beneficis de proporcionar dades lliures.

Sembla que després de 3 anys a Barcelona s’han adonat i ja les ofereixen a l’Open Data Barcelona.

Afegeixo diferents enllaços interessants per si voleu saber-ne més del projecte.

%d bloggers like this: