32
Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Embed Size (px)

Citation preview

Page 1: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Aplicaciones de Big Data en R

V Jornadas de Usuarios de RZaragoza, diciembre 2013

Page 2: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Índice presentación• Introducción : Tecnología Big Data. ¿Dónde

encaja R en todo esto?• Principios: herramientas básicas y cómo

trabajar en Big Data• ¿Qué es Map-Reduce?• Map-Reduce programando en R• Map-Reduce usando paquetes de R• Map-Reduce usando SQL desde R

© 2013 Synergic Partners – Proprietary and Confidential

Page 3: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Introducción : Tecnología Big Data. ¿Dónde encaja R en todo esto? (I)

¿Qué es?

• Big Data != muchos datos• Hadoop

– Pig, jaql– Hive– HBase– …

• MongoDB• Cassandra• … © 2013 Synergic Partners – Proprietary and Confidential

Page 4: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Introducción : Tecnología Big Data. ¿Dónde encaja R en todo esto? (II)

• Usamos datos tabulados. (En caso contrario, habría otras soluciones que no explicamos aquí.)

• R es:– la solución analítica – la consola de control de (casi) todo el sistema

© 2013 Synergic Partners – Proprietary and Confidential

Page 5: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Principios: herramientas básicas y cómo trabajar en Big Data (I)

© 2013 Synergic Partners – Proprietary and Confidential

Page 6: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Principios: herramientas básicas y cómo trabajar en Big Data (II)

© 2013 Synergic Partners – Proprietary and Confidential

Page 7: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Principios: herramientas básicas y cómo trabajar en Big Data (III)

© 2013 Synergic Partners – Proprietary and Confidential

Page 8: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

¿Qué es Map-Reduce? (I)

© 2013 Synergic Partners – Proprietary and Confidential

Page 9: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

¿Qué es Map-Reduce? (II)Tanto para clasificación como para regresión:

• Algunos algoritmos se pueden paralelizar de manera centralizada. Por ejemplo: Regresión lineal, regresión logística, k-means

• Algunos algoritmos se pueden paralelizar “as is” y combinar todos los modelos en un único modelo. Por ejemplo: Random Forests

• Todos los algoritmos se pueden paralelizar “as is” y utilizar una metaheurística (por ejemplo, un voto ponderado) para obtener una clasificación conjunta.

© 2013 Synergic Partners – Proprietary and Confidential

Page 10: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

¿Qué es Map-Reduce? (III)

En R

• Podemos programar Map-Reduce• Podemos usar un paquete que use Map-

Reduce• Podemos controlar desde R programas como

Hive que usan Map-Reduce

© 2013 Synergic Partners – Proprietary and Confidential

Page 11: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (I)

Page 12: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (I)

Page 13: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (I)

Page 14: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (I)

© 2013 Synergic Partners – Proprietary and Confidential

Page 15: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (II)

Page 16: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (II)

Page 17: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (II)

© 2013 Synergic Partners – Proprietary and Confidential

Page 18: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce programando en R (III)

Page 19: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando paquetes de R (I)

Page 20: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando paquetes de R (I)

Page 21: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando paquetes de R (II)

Page 22: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando paquetes de R (II)

Page 23: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando paquetes de R (II)

Page 24: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando paquetes de R (II)

Page 25: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (I)

Page 26: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (II)

Page 27: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (III)

Page 28: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (III)

© 2013 Synergic Partners – Proprietary and Confidential

Page 29: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (III)

© 2013 Synergic Partners – Proprietary and Confidential

Page 30: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (III)

© 2013 Synergic Partners – Proprietary and Confidential

Page 31: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

Map-Reduce usando SQL desde R (III)

© 2013 Synergic Partners – Proprietary and Confidential

Page 32: Aplicaciones de Big Data en R V Jornadas de Usuarios de R Zaragoza, diciembre 2013

www.synergicpartners.com