159
Guatemala, 19 de Noviembre 2012 Guatemala, 19 de Noviembre 2012 DR. MARIO MELGAR DR. MARIO MELGAR Tendencias del Análisis de Tendencias del Análisis de Datos a Nivel Mundial” Datos a Nivel Mundial” Conferencia presentada en el Curso de: Conferencia presentada en el Curso de: Métodos de Investigación Cuantitativa Métodos de Investigación Cuantitativa Doctorado en Ciencias Agrícolas y Doctorado en Ciencias Agrícolas y Ambientales Facultad de Agronomía Ambientales Facultad de Agronomía Universidad de San Carlos de Guatemala Universidad de San Carlos de Guatemala

Tend. analisis de datos a n. mundial sl

Embed Size (px)

Citation preview

Page 1: Tend. analisis de datos a n. mundial sl

Guatemala, 19 de Noviembre 2012Guatemala, 19 de Noviembre 2012

DR. MARIO MELGARDR. MARIO MELGAR

““Tendencias del Análisis de Tendencias del Análisis de Datos a Nivel Mundial”Datos a Nivel Mundial”

Conferencia presentada en el Curso de:Conferencia presentada en el Curso de: Métodos de Investigación Cuantitativa Métodos de Investigación Cuantitativa Doctorado en Ciencias Agrícolas y Doctorado en Ciencias Agrícolas y Ambientales Facultad de AgronomíaAmbientales Facultad de Agronomía Universidad de San Carlos de GuatemalaUniversidad de San Carlos de Guatemala

Page 2: Tend. analisis de datos a n. mundial sl

ContenidoContenido

BIG DATA ENFOQUES DATA SCIENCE MINERÍA DE

DATOS VISUALIZACIÓN

Page 3: Tend. analisis de datos a n. mundial sl
Page 4: Tend. analisis de datos a n. mundial sl

The next five years will produce more research data than has been produced in all of previous human history, presenting researchers with daunting discovery challenges.The data deluge was highlighted and deepened by monumental big bang and astronomy projects such as the Large Hadron Collider and the planned Square Kilometre Array, said Ross Wilkinson, executive director of the Monash University-based Australian National Data Service.

The European Union's collider would produce a petabyte of data each month, while the data generation of the SKA was so mind-boggling that the term exobyte had been coined to describe its data output.

"An exabyte is 1000 petabytes; a petabyte is 1000 terabytes; a terabyte is 1000 gigabytes and a gigabyte is 1000 megabytes," Dr. Wilkinson said."You can read about 2GB of text, or about as much text that can fit on two CDs, in a lifetime, so it's really scary numbers."

SOURCE: THE AUSTRALIAN, APRIL 29, 2009

Page 5: Tend. analisis de datos a n. mundial sl
Page 6: Tend. analisis de datos a n. mundial sl

NOMBRE TAMAÑO

BYTE 1

KBYTE 1000

MEGABYTE 1 000 000

GYGABYTE 1 000 000 000

TERABYTE 1 000 000 000 000

PETABYTE 1 000 000 000 000 000

EXABYTE 1 000 000 000 000 000 000

ZETTABYTE 1 000 000000000000000000

Page 7: Tend. analisis de datos a n. mundial sl

UNIDAD VALOR/EJEMPLO

Byte Es la unidad elemental de información que puede guardar un carácter: letra, número o signo

2 kilobytes Una página

5 megabytes Obras completas de Shakespare; 30 segundos de video.

100 megabytes Radiografia Digital.

500 megabytes CD

Page 8: Tend. analisis de datos a n. mundial sl

1 gigabyte (GB) Sinfonía en sonido de alta fidelidad.

2 gigabytes 20 metros de estantería de libros, lo que una persona puede leer en toda su vida

20 gigabytes Archivos de audio de la obra de Beethoven

Terabyte (TB) 1000 GB

1 terabyte Todas las películas radiográficas de un hospital de alta tecnología.50000 árboles transformados en papel e impresos.

10 terabytes Colección impresa de la biblioteca del Congreso de EE.UU.

Petabytes (PB) 1000 TB

2 petabytes Todas las bibliotecas de investigación académica de EE.UU.

Exabyte (EB) 10000 PB

5 exabytes Todas las palabras dichas alguna vez por los seres humanos.

ZettabyteFuente: Ambrosi, H. 2008. La Verdad de las Estadisticas. Ediciones Lumiere.

1000 Exabytes

Page 9: Tend. analisis de datos a n. mundial sl
Page 10: Tend. analisis de datos a n. mundial sl
Page 11: Tend. analisis de datos a n. mundial sl
Page 12: Tend. analisis de datos a n. mundial sl
Page 13: Tend. analisis de datos a n. mundial sl
Page 14: Tend. analisis de datos a n. mundial sl
Page 15: Tend. analisis de datos a n. mundial sl
Page 16: Tend. analisis de datos a n. mundial sl

1. Internet2. Celulares3. NASA4. Astronomía5. Universo6. Genómica7. Física8. Imágenes Médicas9. AT&T, WALMART, etc.

Page 17: Tend. analisis de datos a n. mundial sl
Page 18: Tend. analisis de datos a n. mundial sl

The Conversation Prism Infographichttp://jess3.com/the-conversation-prism-v3/

Page 19: Tend. analisis de datos a n. mundial sl
Page 20: Tend. analisis de datos a n. mundial sl

2008 MySQL Conference & Expo

Jacek Becla, SLAC

Page 21: Tend. analisis de datos a n. mundial sl

212008 MySQL Conference & Expo Jacek Becla, SLAC

Science & Petabytes

� 4 PB in 2005 (images)

NASA: Earth Observing System

Page 22: Tend. analisis de datos a n. mundial sl

222008 MySQL Conference & Expo Jacek Becla, SLAC

Science & Petabytes

� Huge telescopes� Multi-gigapixel cameras� Getting ready for…

– Trillions of observations– 50+ PB of images

– 20+ PB database

Astronomy

Page 23: Tend. analisis de datos a n. mundial sl

232008 MySQL Conference & Expo Jacek Becla, SLAC

Untangling the Universe

� Overlapping� Moving� Disappearing� Highly correlated

Astronomy: It’s All About “Astronomical Objects”

Needle in haystack Spatial correlations Time series

Needle in haystack Spatial correlations Time series

Needle in haystack Spatial correlations Time series

Page 24: Tend. analisis de datos a n. mundial sl

242008 MySQL Conference & Expo Jacek Becla, SLAC

Science & Petabytes

� Trying to put together database of all known DNA sequences

� Multi-petabytes

Genomics

Page 25: Tend. analisis de datos a n. mundial sl

25

How does the human genome stack up?

Organism Genome Size (Bases) Estimated Genes

Amoeba dubia (ameba) 670 billion ?

Porocentrum micans (protista) 245 billion 92,000

Pez leopardo (Propterus aethiopicus) 130 billion ?

Caña de azúcar (S. officinarum) 7.4 billion 35,000

Human (Homo sapiens) 3 billion 25,000

Laboratory mouse (M. musculus) 2.6 billion 30,000

Mustard weed (A. thaliana) 100 million 25,000

Roundworm (C. elegans) 97 million 19,000

Fruit fly (D. melanogaster) 137 million 13,000

Yeast (S. cerevisiae) 12.1 million 6,000

Bacterium (E. coli) 4.6 million 3,200

Human immunodeficiency virus (HIV) 9700 9

Page 26: Tend. analisis de datos a n. mundial sl

26

Examples of Large Data Sets:Genomics

• 25,000 genes in human genome

• 3 billion bases

• 3 Gigabytes of genetic data

Page 27: Tend. analisis de datos a n. mundial sl

272008 MySQL Conference & Expo Jacek Becla, SLAC

Understanding Dynamics of Biological Processes

Needle in haystack Correlations Time series

Page 28: Tend. analisis de datos a n. mundial sl
Page 29: Tend. analisis de datos a n. mundial sl

29

Page 30: Tend. analisis de datos a n. mundial sl

30

Page 31: Tend. analisis de datos a n. mundial sl

31

Page 32: Tend. analisis de datos a n. mundial sl

32

Page 33: Tend. analisis de datos a n. mundial sl

33

Page 34: Tend. analisis de datos a n. mundial sl

34

Page 35: Tend. analisis de datos a n. mundial sl

35

Page 36: Tend. analisis de datos a n. mundial sl

36

Page 37: Tend. analisis de datos a n. mundial sl

37

Page 38: Tend. analisis de datos a n. mundial sl

38

Page 39: Tend. analisis de datos a n. mundial sl

39

Page 40: Tend. analisis de datos a n. mundial sl

40

Page 41: Tend. analisis de datos a n. mundial sl

41

Page 42: Tend. analisis de datos a n. mundial sl

422008 MySQL Conference & Expo Jacek Becla, SLAC

Science & Petabytes

� ½ PB/sec– Small fraction saved

� Trillions of collisions� 15 PB/year

– Starting later this year

High Energy Physics: LHC

Page 43: Tend. analisis de datos a n. mundial sl

43

Page 44: Tend. analisis de datos a n. mundial sl

44

Examples of Large Data Sets:Credit card transactions

• 142 billion transactions in 2004 in US alone

• 115 Terabytes of data transmitted to processing center in 2004

Page 45: Tend. analisis de datos a n. mundial sl

45

Examples of Large Data Sets:Phone call billing records

• 250M calls/day

• 60G calls/year

• 40 bytes/call

• 2.5 Terabytes/year

Page 46: Tend. analisis de datos a n. mundial sl

462008 MySQL Conference & Expo Jacek Becla, SLAC

0

50

100

150

2000 2005 2010 2015 2020 2025

year

PB

Science, Industry & Petabytes

?GoogleYahoo!

Microsoft

AT&TWalmart

EBayFacebookfew others

Page 47: Tend. analisis de datos a n. mundial sl
Page 48: Tend. analisis de datos a n. mundial sl

Enfoques

Page 49: Tend. analisis de datos a n. mundial sl

Competitive Edger or Colossal Migraine?

Page 50: Tend. analisis de datos a n. mundial sl
Page 51: Tend. analisis de datos a n. mundial sl

InfoVis 51

Big Challenge

• How do we make sense of it?• How do we harness this data in decision-

making processes?

Page 52: Tend. analisis de datos a n. mundial sl
Page 53: Tend. analisis de datos a n. mundial sl

Enfoques para el Manejo de los Datos

53

1. Empresas Especializadas en Gerencia de Datos

2. Data Science3. Minería de Datos4. Visualización

Page 54: Tend. analisis de datos a n. mundial sl

Grandes Empresas

IBMMicrosoftOracleSAPIMBSASEtc. …Están surgiendo cientos…

Page 55: Tend. analisis de datos a n. mundial sl
Page 56: Tend. analisis de datos a n. mundial sl
Page 57: Tend. analisis de datos a n. mundial sl
Page 58: Tend. analisis de datos a n. mundial sl
Page 59: Tend. analisis de datos a n. mundial sl
Page 60: Tend. analisis de datos a n. mundial sl
Page 61: Tend. analisis de datos a n. mundial sl
Page 62: Tend. analisis de datos a n. mundial sl
Page 63: Tend. analisis de datos a n. mundial sl
Page 64: Tend. analisis de datos a n. mundial sl
Page 65: Tend. analisis de datos a n. mundial sl
Page 66: Tend. analisis de datos a n. mundial sl
Page 67: Tend. analisis de datos a n. mundial sl
Page 68: Tend. analisis de datos a n. mundial sl
Page 69: Tend. analisis de datos a n. mundial sl
Page 70: Tend. analisis de datos a n. mundial sl
Page 71: Tend. analisis de datos a n. mundial sl
Page 72: Tend. analisis de datos a n. mundial sl
Page 73: Tend. analisis de datos a n. mundial sl
Page 74: Tend. analisis de datos a n. mundial sl
Page 75: Tend. analisis de datos a n. mundial sl
Page 76: Tend. analisis de datos a n. mundial sl
Page 77: Tend. analisis de datos a n. mundial sl
Page 78: Tend. analisis de datos a n. mundial sl
Page 79: Tend. analisis de datos a n. mundial sl
Page 80: Tend. analisis de datos a n. mundial sl

Enfoques para el Manejo de los Datos

81

1. Empresas Especializadas en Gerencia de Datos

2. Data Science3. Minería de Datos4. Visualización

Page 81: Tend. analisis de datos a n. mundial sl

Data Science: An Introduction/A History of Data Science

Chapter Summary

Data Science is a composite of a number of pre-existing disciplines. It is a young professional and academic discipline. The term was first coined in 2001. Its popularity has exploded since 2010, pushed by the need for teams of people to analyze the big data that corporations and governments are collecting. The Google search engine is a classic example of the power of data science.

Discussion

Data science is a discipline that incorporates varying degrees of Data Engineering, Scientific Method, Math, Statistics, Advanced Computing, Visualization, Hacker mindset, and Domain Expertise. A practitioner of Data Science is called a Data Scientist. Data Scientists solve complex data analysis problems.

Origins

The term "Data Science" was coined at the beginning of the 21st Century. It is attributed to William S. Cleveland[1] who, in 2001, wrote "Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics."[2] About a year later, the International Council for Science: Committee on Data for Science and Technology[3] started publishing the CODATA Data Science Journal beginning April 2002.[4] Shortly thereafter, in January of 2003, Columbia University began publishing The Journal of Data Science .

Page 82: Tend. analisis de datos a n. mundial sl
Page 83: Tend. analisis de datos a n. mundial sl

El “Ecosistema” de los datos

Page 84: Tend. analisis de datos a n. mundial sl
Page 85: Tend. analisis de datos a n. mundial sl
Page 86: Tend. analisis de datos a n. mundial sl
Page 87: Tend. analisis de datos a n. mundial sl
Page 88: Tend. analisis de datos a n. mundial sl
Page 89: Tend. analisis de datos a n. mundial sl

Data Mining: Confluence of Multiple Disciplines

Page 90: Tend. analisis de datos a n. mundial sl

ANÁLISIS UNIVARIADO ASOCIACIÓN ENTRE VARIABLES

Análisis multivariado

Variables Cualitativas

Variables Cuantitativas

Cualitativas con

cualitativas

Cualitativas con cuantitativas

Cuantitativas con cuantitativas

FrecuenciasProporciones Gráficas de barrasGráficas de pastelPictogramasGráficas de puntosPirámides

Distr. De frecuenciasHistogramasGráficas de tallos y hojasGráficas de cajasGráficas de normalidadMedidas de: - Tendencias central - Dispersión - Percentiles

Tablas de ContingenciaGráficas de barras

Tablas de clasificaciónGráficas de medias

Diagrama de dispersión3 D

Gráficas de HistogramasCaras de ChernoffEstrellasFlechasGlifosMatriz de correlaciones

Page 91: Tend. analisis de datos a n. mundial sl

Temas tratados en el libro digital. http://www.statsoft.com/textbook

Page 92: Tend. analisis de datos a n. mundial sl

Temas tratados en el libro digital. http://www.statsoft.com/textbook

Page 93: Tend. analisis de datos a n. mundial sl

VARIABLES CUANTITATIVAS VARIABLES CUALITATIVAS

POBLACIONES Contínuas Discretas Binominal Multinomial

Una t Wilcoxon Binomial, Z X²

Dos independientes

t Mann-Whitney Irwin-FisherExacta FisherX², Z

Dos dependientes t Wilcoxon McNemar Stuart

Tres o más independientes

F ANDEVA D.C.A.Una vía

Contrastes

Kruskal-Wallis

Contrastes

X²Contrastes

X²Contrastes

Tres o más dependientes

F ANDEVAD.C.A.Dos vías

Contrastes

Friedman

Contrastes

Cochran

Contrastes

Friedman (Ordinal)

Dependencia

Relación

Regresión

Pearson

Wilcoxon

SpearmanHipergeométrica0

Page 94: Tend. analisis de datos a n. mundial sl

Análisis Multivariado• Conjunto de técnicas para el análisis estadístico de datos,

obtenidas a través de la medición de varias variables sobre cada individuo o unidad estudiada.

• Esas variables están correlacionadas.

UNIDAD Variables a explicar o dependientes

Variables Explicativas o independientes

Y1, Y2, . . . . . . . . . . . .Yɋ

X1, X2, . . . . . .. . . . .Xƿ

U1

U2

.

.

.Un

ESTRUCTURA DE LOS DATOS PROVENIENTES DE UN

ESTUDIO

Page 95: Tend. analisis de datos a n. mundial sl

Variables dependientes

Variables independientes

Cualitativa Cuantitativa

1 variable >1 variable 1 variable >1 variable

Ninguna Binomial Chi-cuadradoMedidas de asociación

T Matriz de correlacionesComponentesPrincipalesAnálisis de factoresAnálisis Cluster

Cualitativa1

>1

Chi-cuadradoExactaFischer

Log-LinearModelos

Log-LinearModelosRegresiónLogística

Log-Linearmodelos

RegresiónLogística

Análisis discriminante

RegresiónLogística

Análisis discriminante

Cuantitativa1

>1

TAnálisis de varianza

T² HotellingAnálisis de varianzaMultivariado

Análisis de varianza

Análisis de varianzaMultivariado

Regresión linealRegresión no linealCorrelación

Regresión multivariadaCorrelación canónica

Regresión múltiple

Regresión multivariadaCorrelación canónicaPath Analysisestructurales

Page 96: Tend. analisis de datos a n. mundial sl
Page 97: Tend. analisis de datos a n. mundial sl
Page 98: Tend. analisis de datos a n. mundial sl
Page 99: Tend. analisis de datos a n. mundial sl
Page 100: Tend. analisis de datos a n. mundial sl
Page 101: Tend. analisis de datos a n. mundial sl

SAS

SQL

XL Miner

Page 102: Tend. analisis de datos a n. mundial sl
Page 103: Tend. analisis de datos a n. mundial sl
Page 104: Tend. analisis de datos a n. mundial sl
Page 105: Tend. analisis de datos a n. mundial sl
Page 106: Tend. analisis de datos a n. mundial sl

Visualización

Page 107: Tend. analisis de datos a n. mundial sl
Page 108: Tend. analisis de datos a n. mundial sl
Page 109: Tend. analisis de datos a n. mundial sl
Page 110: Tend. analisis de datos a n. mundial sl
Page 111: Tend. analisis de datos a n. mundial sl
Page 112: Tend. analisis de datos a n. mundial sl
Page 113: Tend. analisis de datos a n. mundial sl
Page 114: Tend. analisis de datos a n. mundial sl
Page 115: Tend. analisis de datos a n. mundial sl
Page 116: Tend. analisis de datos a n. mundial sl
Page 117: Tend. analisis de datos a n. mundial sl

InfoVis 119

Example

Example courtesyof Chris North

Which state has the highest income?Is there a relationship between income and education?Are there any outliers?

Questions:

Page 118: Tend. analisis de datos a n. mundial sl

InfoVis 120

Visualize the Data

Per Capita Income

Col

lege

Deg

ree

%

Page 119: Tend. analisis de datos a n. mundial sl

InfoVis 121

Atlanta Flight Traffic

AJC

Page 120: Tend. analisis de datos a n. mundial sl

InfoVis 122

London Subway

Page 121: Tend. analisis de datos a n. mundial sl
Page 122: Tend. analisis de datos a n. mundial sl

• Tabla periodica

Page 123: Tend. analisis de datos a n. mundial sl

1252008 MySQL Conference & Expo Jacek Becla, SLAC

Summary� Data avalanche� Need scalable,

sophisticated tools

� You are facing it too

Credit: ncids.org

Page 124: Tend. analisis de datos a n. mundial sl

HANS

Page 125: Tend. analisis de datos a n. mundial sl

BienvenidosCENGICAÑA

Visión:Ser líderes en generar cambios tecnológicos para

incrementar la competitividad de la Agroindustria Azucarera en la región.

02/03/2012

Dr. Mario Melgar

Page 126: Tend. analisis de datos a n. mundial sl

Evolución de la productividad Evolución de la productividad GuatemalaGuatemala

60 65 70 75 80 85 90 95 00 05 100

1

2

3

4

5

6

7

8

9

10

11

TAH

Año

Quinquenio TCH % Sac TAH

1959/60* 53 9.70 5.20

1960/65 57 9.34 5.34

1965/70 62 9.24 5.76

1970/75 74 8.83 6.58

1975/80 77 8.49 6.54

1980/85 76 9.10 6.58

1985/90 71 9.66 6.90

1990/95 82 10.10 8.32

1995/00 85 10.42 8.87

2000/05 90 11.33 10.17

2005/10 94 10.75 10.05

Rendimiento de Azúcar/TAH 1960-2010

Page 127: Tend. analisis de datos a n. mundial sl

Evolución de análisis de Evolución de análisis de productividad de la productividad de la

Agroindustria Azucarera Agroindustria Azucarera GuatemaltecaGuatemalteca

Page 128: Tend. analisis de datos a n. mundial sl
Page 129: Tend. analisis de datos a n. mundial sl
Page 130: Tend. analisis de datos a n. mundial sl
Page 131: Tend. analisis de datos a n. mundial sl
Page 132: Tend. analisis de datos a n. mundial sl

Factores relacionados con el Factores relacionados con el rendimiento de un cultivorendimiento de un cultivo

y = f (A, G, M)y = f (A, G, M)

Y = RendimientoY = RendimientoA = AmbienteA = AmbienteG = GenéticaG = GenéticaM = ManejoM = Manejo

Fuente: Altieri, M. 1987. Agroecology. Westview Press. 227 p.

Page 133: Tend. analisis de datos a n. mundial sl

TCHTCHTAHTAH$/H$/H

AmbientalesAmbientales

GenéticosGenéticos

ManejoManejo

Zona agroecológica (1-44)Zona agroecológica (1-44)Finca (1 – nFinca (1 – n11))Lote (1 – nLote (1 – n22) (total 14,000)) (total 14,000)

Variedad (67)Variedad (67)No. de corteNo. de corteMes de cosechaMes de cosecha

Ingenio (1-8)Ingenio (1-8)

FertilizaciónFertilización

Riegos (1-4)Riegos (1-4)

Madurantes (1-6)Madurantes (1-6)

Edad de cosechaEdad de cosecha

Balance hídricoBalance hídricoGrupos de sueloGrupos de suelo

N (1-7)N (1-7)P (1-4)P (1-4)K (1-4)K (1-4)S (1-3)S (1-3)

VARIABLES VARIABLES RESPUESTARESPUESTA FACTORESFACTORES

Page 134: Tend. analisis de datos a n. mundial sl

AnálisisAnálisis

Sistemas de Sistemas de Información Información GeográficaGeográfica

Bases de Bases de datosdatos

Análisis Análisis detallado detallado de de variedadesvariedades

MapasMapas

Estadística descriptiva Estadística descriptiva (Gráficos, cuadros)(Gráficos, cuadros)

Estadística inferencialEstadística inferencialMinería de datosMinería de datos

ZAE, finca, lote, ZAE, finca, lote, Mes de cosechaMes de cosechaFactores de manejoFactores de manejo

Page 135: Tend. analisis de datos a n. mundial sl
Page 136: Tend. analisis de datos a n. mundial sl
Page 137: Tend. analisis de datos a n. mundial sl
Page 138: Tend. analisis de datos a n. mundial sl
Page 139: Tend. analisis de datos a n. mundial sl
Page 140: Tend. analisis de datos a n. mundial sl

BASE DE DATOS DE EXCEL PARA COMPARTIR

Menú Principal Formularios de Comparación

Menú Principal Gráficos Productividad

Page 141: Tend. analisis de datos a n. mundial sl

Fuente: LMC Sugar Technical Performance - Executive Summary-Sma605 September 2008Fuente: LMC Sugar Technical Performance - Executive Summary-Sma605 September 2008

Indicadores de Competitividad

Al 02/05/2010

USA

Thailand

swazilandia

Sudan

Sudáfrica

México

India

Guatemala

Colombia

China

Brasil (N.E.)

Brasil (C.S.)

Australia

6

11

16

21

26

31

36

6 7 8 9 10 11 12 13 14 15 16

Rendimiento azúcar (TAH)

Azú

car

prod

ucid

a po

r to

nela

da d

e ca

paci

tdad

de

mol

iend

a (t

ib a

zúca

r/to

n ca

paci

dad)

11.5

9.4

6.5

9.5

14.6

12.2

7.9

9.3

6.6

10.8

13.9

7.3

9.1

13.15

Page 142: Tend. analisis de datos a n. mundial sl

Gráficos por países, períodos por quinquénios: Gráficos por países, períodos por quinquénios: 19881988

País TAH

Utilización de la

Capacidad

Área Sembrada

Australia 9.80 12.60 352,023.00Brasil (C.S.) 8.60 15.00 2,585,063.00Brasil (N.E.) 5.80 15.40 1,287,453.00China 4.80 9.40 881,000.00Colombia 11.10 24.40 140,297.00Guatemala 6.99 8.80 84,333.00India 7.10 12.50 3,072,052.00México 8.00 10.00 535,884.00South Africa 5.70 19.90 408,743.00Swaziland 23.90 36,014.00Thailand 5.30 7.80 559,638.00

USA 9.30 10.60 344,436.00

Page 143: Tend. analisis de datos a n. mundial sl

Gráficos por países, períodos por quinquénios: Gráficos por países, períodos por quinquénios: 19981998

País TAH

Utilización de la

Capacidad

Área Sembrada

Australia 11.60 17.40 420,572.00Brasil (C.S.) 9.90 18.30 3,250,190.00Brasil (N.E.) 6.30 12.00 1,105,856.00China 6.80 9.50 915,878.00Colombia 12.50 27.90 178,687.00Guatemala 10.30 12.50 151,540.00India 8.00 13.60 3,836,021.00México 9.10 12.70 570,322.00South Africa 4.90 15.70 397,026.00Swaziland 13.60 22.00 38,182.00Thailand 6.40 8.40 963,256.00

USA 8.80 10.60 391,873.00

Page 144: Tend. analisis de datos a n. mundial sl

Gráficos por países, períodos por quinquénios: Gráficos por países, períodos por quinquénios: 20082008

País TAH

Utilización de la

Capacidad

Área Sembrada

Australia 11.50 16.70 453,316.00Brasil (C.S.) 10.40 22.70 5,035,284.00Brasil (N.E.) 7.40 17.00 1,120,375.00China 9.50 13.20 1,128,841.00Colombia 14.60 31.80 199,910.00Guatemala 12.20 15.90 197,600.00India 7.90 12.20 4,294,400.00México 9.30 14.80 686,855.00South Africa 6.60 23.50 426,738.00Swaziland 13.90 24.30 50,720.00Thailand 7.30 8.60 1,070,630.00

USA 9.10 11.40 393,744.00

Page 145: Tend. analisis de datos a n. mundial sl
Page 146: Tend. analisis de datos a n. mundial sl
Page 147: Tend. analisis de datos a n. mundial sl
Page 148: Tend. analisis de datos a n. mundial sl
Page 149: Tend. analisis de datos a n. mundial sl
Page 150: Tend. analisis de datos a n. mundial sl
Page 151: Tend. analisis de datos a n. mundial sl
Page 152: Tend. analisis de datos a n. mundial sl
Page 153: Tend. analisis de datos a n. mundial sl
Page 154: Tend. analisis de datos a n. mundial sl
Page 155: Tend. analisis de datos a n. mundial sl
Page 156: Tend. analisis de datos a n. mundial sl

CONCLUSIONES1. A nivel mundial esta ocurriendo literalmente una explosión de datos, tanto a

nivel social (redes sociales, comunicación digital, etc.), a nivel comercial (internet, tarjetas de crédito, etc.) a nivel científico (astronomía, física, genómica, medicina, etc.). A este fenómeno se le a denominado “BIG DATA”. Se menciona ya no solo gigabytes sino Tera, peta y exabytes y hasta zettabytes.

2. Se están desarrollando constantemente tecnologías para la recolección (sensores, imágenes, etc.) Almacenamiento (datawarehouse, nube, etc), análisis y visualización de los datos. Los datos deben convertirse en información y estos en conocimiento.

3. Todos los países, sectores, empresas o personas, que quieran obtener un valor agregado de este diluvio de datos, deben de prepararse para utilizar la tecnologías apropiadas.

Page 157: Tend. analisis de datos a n. mundial sl

4. El Big Data Análisis que es la aplicación de técnicas avanzadas de análisis para conjuntos de grandes volúmenes de datos, esta generando el surgimiento de cientos de empresas asociadas: Microsoft, Oracle, SAP, Tableau, Teradata, SAS, Cloudera, MySQL, Hadoop, Cassandra, Data Miner , Cubenube, etc.

5. Esta surgiendo una nueva ciencia denominada “La Ciencia de los Datos”, que reúne disciplinas como: Ingeniería de datos, método científico, matemáticas, estadística, computación avanzada, visualización y experiencia en áreas especificas para resolver problemas de análisis de datos. Data Science requiere trabajo multidisciplinario.

Page 158: Tend. analisis de datos a n. mundial sl

CONCLUSIONES ESPECIFICASDE LA AGROINDUSTRIA AZUCARERA

GUATEMALTECA

1. En cada uno de los eslabones de la cadena de valor de la agroindustria (campo, fabrica, transporte y comercialización) esta creciendo el volumen de datos que se generan, algunos ingenios han contratado empresas especificas para el manejo de los datos: Automatización, manejo integral de toda la información: Pantaleón (SAP), La Unión (BIOSALC), Magdalena(ORACLE), etc.

2. Para el manejo de información tecnológica de las áreas de trabajo de CENGICAÑA, se esta desarrollando la base de datos institucional con aportes principalmente del área de análisis de productividad, sistemas de información para agricultura de precisión (SIAP), Sistema de información meteorológica (SIM) y CENGIDOC. Para el desarrollo de la base de datos institucional cada área deberá aportar la información respectiva y actualizarse en el uso de las tecnologías de información.

Page 159: Tend. analisis de datos a n. mundial sl

Muchas gracias

Foto: Paulo Stupiello