47
1.- Tablas de frecuencia 2.- Gráficos: histograma, ojiva, columna, barra, dispersión Unidad II Organización y Presentación de Datos

Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

1.- Tablas de frecuencia

2.- Gráficos: histograma, ojiva, columna, barra, dispersión

Unidad II

Organización y Presentación de Datos

Page 2: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Adquirir habilidades concretas para construir una tabla de frecuencias

Observar la ganancia en términos de facilidad de interpretación y de

disposición de la información original.

Relacionar la información contenida en la tabla con el tipo de variable

que se está tabulando

Page 3: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Ejemplos de Distribución de

Frecuencias Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 4: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Representación gráfica de los datos

• Los gráficos permiten visualizar en forma global

y rápida el comportamiento de los datos.

• Para datos cuantitativos agrupados en clases,

comúnmente se utilizan tres gráficos:

– Histogramas.

– Polígono de frecuencias.

– Ojiva o Polígono de frecuencias acumuladas.

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 5: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Representación gráfica de los datos

Histograma

Page 6: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Representación gráfica de los datos

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Histograma y Polígono de Frecuencias

Page 7: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Ojiva

Representación gráfica de los datos

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 8: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Representación gráfica de los datos

• Para datos cualitativos se usan:

– Curvas

– Barras

– Sectores

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 9: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Barras

Representación gráfica de los datos

Barras

Page 10: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Representación gráfica de los datos

Curvas

Page 11: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Representación gráfica de los datosSectores, torta o circular

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 12: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Ejemplos de construcción de

gráficos

Slider de Apoyo

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 13: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Imagina que hemos preguntado a un conjunto de N personas qué opinión

tienen acerca de la mejoría en la educación que se ah tenido en los

últimos años en México.

Las N respuestas se encuentran en una escala que va de 1 a 9, donde 1

representa un total desacuerdo con la pregunta, mientras que 9 quiere

significar un acuerdo total.

El resultado de la medición es el siguiente:

Page 14: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Organización de los datos

• Una vez que se ha realizado la

recolección de los datos, se obtienen

datos en bruto, los cuales rara vez son

significativos sin una organización y

tabulación.

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 15: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Organización de los datos

• Formas de organizar los datos:

– Un arreglo: es la forma más sencilla de organizar los

datos en bruto, consiste en colocar las observaciones

en orden según su magnitud: ascendente o

descendente.

– Poco práctica cuando se tiene una gran cantidad de

datos.

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 16: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Organización de los datos

– Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.

Clase Pto.

Medio

fi Fi fri FRi

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 17: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Organización de los datos

• La Distribución de Frecuencias:

– Se recomienda su uso cuando se tienen grandes cantidades de datos (n).

– Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.

– Para definir la cantidad de intervalos de clase (k), se puede usar:

• La regla de Sturges: k = 1 + 3.3log(n)

• k = n

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 18: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Organización de los datos

• La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.

• La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.

• Los límites de las clases deben tener una cifras significativas más que los datos en bruto.

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 19: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Organización de los datos

• Determinar:

– Punto medio = (Li+Ls)/2.

– Frecuencia absoluta de la clase (fi).

– Frecuencia acumulada de la clase (Fi).

– Frecuencia relativa de la clase (fri):

• fri = fi/n

– Frecuencia relativa acumulada de la clase (FRi).

Tem

a 2

. Esta

dístic

a D

esc

riptiv

a

Page 20: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Intenta responder a las siguientes preguntas:

•Cuántas personas fueron encuestadas

•Cuál fue la respuesta más frecuente

•Cuántas personas tienen, como máximo, una actitud de cuatro puntos

en la escala (es decir, cuántas personas se encuentran en desacuerdo)

7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4 8 4 3 4

3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2

6 3 4 2 4 1 3 6 3 1 2 4

4 6 2 4 7 4 2 4 6 4 4 6 7 5 8 5 7 6 5 6 5 7 5 6

4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6 5 4 4 3 5 5 9 4 3 6 5 7 3 2

4 4 7 4 2 1 8 2 7 4 5 5 7 5 5 1 5 8 5

6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5

Tabla 1: Conjunto original de datos

Page 21: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Es difícil responder a las tres cuestiones.

Unas más que otras. ¿Cuál es el problema?

Las personas tenemos dificultades para procesar o tener en cuenta

mucha información de forma simultanea. La tabla se muestra

demasiados datos y es preciso contar con mucha paciencia y una

buena vista para responder a las preguntas anteriores con seguridad.

¿Qué hacer?

Una solución alternativa al repaso repetitivo de la tabla 1 es organizar

los datos de tal forma que tengan una disposición que facilite la lectura.

En este sentido, la primera acción a realizar es ordenar los datos desde

el que posee el valor más pequeño hasta el que cuenta con el valor

mayor.

Observa el resultado:

Page 22: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 4

4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5

5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5

5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6

6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9

Tabla 2: Conjunto ordenado de datos

7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4 8 4 3 4

3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2

6 3 4 2 4 1 3 6 3 1 2 4

4 6 2 4 7 4 2 4 6 4 4 6 7 5 8 5 7 6 5 6 5 7 5 6

4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6 5 4 4 3 5 5 9 4 3 6 5 7 3 2

4 4 7 4 2 1 8 2 7 4 5 5 7 5 5 1 5 8 5

6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5

Tabla 1: Conjunto original de datos

Page 23: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Observa que tiene lugar una ganancia al pasar de la tabla 1 a la

tabla 2.

Parece que ésta es más fácil de interpretar. No ha desaparecido

ninguna información; el único cambio está en la ordenación de los

mismos datos.

No obstante, la solución es parcial, puesto que aún debe ser

mejorada (sigue siendo difícil responder a las preguntas).

Si observas la tabla 2, contiene una sucesión de datos con

valores repetidos. Por ejemplo, el valor 1 se encuentra presente

en seis ocasiones.

Luego, una buena estrategia es mostrar una sola vez cada valor y

hacerlo seguir por su frecuencia, es decir, por la cantidad de

ocasiones en que aparece.

Siguiendo este criterio, hemos conseguido la tabla 3:

Page 24: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

1 (6), 2 (11), 3 (12),

4 (30), 5 (40), 6 (25),

7 (14), 8 (9), 9 (3)

Tabla 3: Conjunto ordenado de "valores" y "frecuencias"

1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 4

4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5

5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5

5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6

6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9

Tabla 2: Conjunto ordenado de datos

Page 25: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Aún se puede disponer la información de tal forma que resulte

extremadamente fácil responder a preguntas del mismo tipo que las que

hemos planteado.

En la tabla 3 se ha mantenido la misma disposición que en la tabla 2.

Esto es innecesario, para disponer la información de manera óptima,

vamos a generar una tabla que tenga dos columnas.

En la columna primera se presentarán los valores, que representaremos

con la letra X mientras que en la segunda columna se dispondrán las

frecuencias, que representaremos con la letra f.

Observa el resultado en la tabla 4:

Page 26: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

X f

1

2

3

4

5

6

7

8

9

6

11

12

30

40

25

14

9

3

Total 150

Tabla 4: Tabla de frecuencias

1 (6), 2 (11), 3 (12),

4 (30), 5 (40), 6 (25),

7 (14), 8 (9), 9 (3)

Tabla 3: Conjunto ordenado de "valores" y "frecuencias"

Como has podido leer en el título de la

tabla 4, se trata de lo que llamamos, una

tabla de frecuencias.

Como ves, la estadística no se complica

en exceso a la hora de bautizar sus

productos.

Eso está bien ¿No?

Page 27: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Ahora sí, la tabla de frecuencias nos permite responder a las

preguntas planteadas con facilidad:

¿Cuántas personas fueron encuestadas?

Solución: 150

¿Cuál fue la respuesta más frecuente?

Solución: 5 (40 datos)

¿Cuántas personas tienen, como máximo, una actitud de cuatro puntos

en la escala?

Solución: 59 (6+11+12+30)

Page 28: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

No todas las preguntas que hemos realizado sobre el mismo conjunto

de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas

sobre el número de datos y el valor más frecuente se han respondido

con una lectura de la tabla, la tercera pregunta ha necesitado de

algunas operaciones.

¿Recuerdas la pregunta?:

Cuántas personas tienen, como máximo, una actitud de cuatro puntos

en la escala.

Solución: 59 (6+11+12+30)

Page 29: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Para responder a esa pregunta hemos tenido que realizar una suma: la de

todas las frecuencias comprendidas entre el primer valor de la tabla y el

valor que nos interesa, ambos inclusive. Esta cantidad final recibe el

nombre de frecuencia acumulada (como puedes comprobar, la

complejidad de la estadística no se encuentra en las denominaciones de

sus objetos)

Muchos interrogantes requieren respuestas que se basan en las

frecuencias acumuladas. Luego, es recomendable escribir esta nueva

información en la tabla, de tal forma que permita respuestas directas en el

futuro. Observa el resultado:

Page 30: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

X f

1

2

3

4

5

6

7

8

9

6

11

12

30

40

25

14

9

3

Total 150

Tabla 4: Tabla de

frecuencias

X f F

1

2

3

4

5

6

7

8

9

6

11

12

30

40

25

14

9

3

6

17

29

59

99

124

138

147

150

Total 150

Tabla 5: Tabla de frecuencias de tres

columnas

Page 31: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Imagina ahora que hemos preguntado a 25 personas por su provincia

de nacimiento, obteniendo los siguientes resultados:

Sevilla, Córdoba, Huelva, Granada, Granada,

Cádiz, Huelva, Almería, Sevilla, Málaga,

Jaén, Huelva, Almería, Sevilla, Córdoba,

Almería, Málaga, Córdoba, Málaga, Almería,

Málaga, Sevilla, Cádiz, Jaén, Cádiz

Construye una tabla de frecuencias con la información sobre las provincias

de nacimiento, utilizando la siguiente equivalencia:

Page 32: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Provincia Código

Almería

Cádiz

Córdoba

Granada

Huelva

Jaén

Málaga

Sevilla

1

2

3

4

5

6

7

8

Quizá tu respuesta haya sido ésta:

Page 33: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Provincia Código f F

Almería

Cádiz

Córdoba

Granada

Huelva

Jaén

Málaga

Sevilla

1

2

3

4

5

6

7

8

4

3

2

2

3

2

4

4

4

7

10

12

15

17

21

25

Tabla 6: Distribución por provincias

Page 34: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Si es así ... ¡Error!

La estadística es como un cuchillo. Constituye una herramienta

extraordinariamente útil para multitud de menesteres cotidianos. Pero

también puede utilizarse para fines, digamos, inapropiadamente

peligrosos.

El cuchillo ignora qué se está haciendo con él. La responsabilidad es de

quien lo empuña.

¿Qué sentido tiene acumular frecuencias en el problema que se ha

planteado sobre las provincias?.

Por ejemplo, ¿Qué significado tiene la cantidad 12 que acompaña al

valor 4 (Granada)? Sólo se puede hacer una lectura: hay doce personas

que han nacido en Granada o en menos que Granada. No podemos

afirmar que Córdoba, Cádiz o Almería sean menos provincia de

nacimiento que Granada.

Page 35: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

La diferencia esencial entre el problema de las provincias de

nacimiento y el de las respuestas a la escala de acuerdo, se

encuentra en el tipo de variable.

En el caso de las provincias, éstas no pueden ordenarse en

función de ser más o ser menos "provincia de nacimiento" se

pueden ordenar según número de habitantes, extensión, altitud

media, etc.

Pero no en función de ser más o ser menos provincia de

nacimiento.

Luego, la acumulación de frecuencias sólo procede si los valores

de la variable que se está estudiando se pueden ordenar.

Así, la respuesta correcta al problema debe ser:

Page 36: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Provincia Código f

Almería

Cádiz

Córdoba

Granada

Huelva

Jaén

Málaga

Sevilla

1

2

3

4

5

6

7

8

4

3

2

2

3

2

4

4

Tabla 7: Distribución por provincias

Page 37: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Retomamos ahora el primer problema de la educación en México.

La tabla de frecuencias no termina donde la hemos dejado. Se puede

añadir más información útil en la que basar respuestas para otras

preguntas.

Por ejemplo ¿Cuántas personas han respondido con una actitud

media (valor 5)? Solución: 40.

Observa ahora la siguiente tabla y responde a la misma pregunta.

Page 38: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

X f

1

2

3

4

5

6

7

8

9

200

170

120

60

40

60

120

170

200

Total 1140

Tabla 7: Nueva tabla de frecuencias

Page 39: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

¿Qué ocurre ahora?

En la tabla 7 ha cambiado el conjunto de datos. Ahora son 1140, frente a

los 150 del colectivo anterior. Una misma frecuencia, en este caso f=40,

no tiene la misma interpretación en ambas tablas.

¿Qué ha cambiado?:

La importancia relativa de la frecuencia, puesto que f=40 frente a N=150

es diferente a f=40 frente a N=1140. De hecho, el valor 5 pasa incluso de

ser el más frecuente al menos presente.

La solución se encuentra en expresar las frecuencias en términos

relativos en vez de absolutos. Esto es precisamente lo que consiguen las

proporciones: expresar una cantidad con respecto al total.

Page 40: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Así, añadimos una nueva columna, conteniendo las frecuencias relativas

(fr) que surgen de hacer la operación fr = f / N. Observa el resultado

comparando el obtenido con cada una de las dos tablas:

Nuevos datos Datos anteriores

X f fr f fr

1

2

3

4

5

6

7

8

9

200

170

120

60

40

60

120

170

200

0,1754

0,1491

0,1053

0,0526

0,0351

0,0526

0,1053

0,1491

0,1754

6

11

12

30

40

25

14

9

3

0,0400

0,0733

0,0800

0,2000

0,2667

0,1667

0,0933

0,0600

0,0200

Total 1140 1,0000 150 1,0000

Tabla 8: Comparación entre dos tablas de frecuencias

Page 41: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Observa que el valor 5 pasa de contar con una frecuencia relativa

fr=0,2667 (más de la cuarta parte) a fr=0,0351 al ser comparado,

respectivamente, con un total de n=150 a n=1140.

Un aspecto de interés se encuentra en la fila de los totales. Observa que

el resultado es 1,0000 en los dos casos. Esto debe ocurrir siempre. Lo

que se hacer al traducir las frecuencias absolutas a las relativas es

unificar el referente. En el conjunto de datos de la tabla 4, el referente

absoluto es 150.

En el conjunto de datos de la tabla 7, el referente absoluto es 1140. No

podemos comparar frecuencias de conjuntos de datos diferentes porque

los referentes son diferentes. Para que la comparación sea factible es

necesario unificar. Dado que las proporciones se expresan en tantos por

uno, es posible comparar frecuencias entre tablas.

Page 42: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

En otros términos: para interpretar una frecuencia absoluta

necesitamos conocer el número total de datos puesto que, según

hemos visto, el número de datos condiciona la importancia de una

frecuencia.

Pero para interpretar una frecuencia relativa expresada como una

proporción no es necesario conocer el número total de datos, puesto

que aquí el referente es constante de una tabla a otra: 1,0000.

Sin embargo, no se terminó el proceso de enriquecimiento de la tabla.

Las proporciones se expresan siempre en cantidades que se sitúan

entre 0 y 1. Es decir, las proporciones son números decimales.

Y las personas también nos sentimos incómodas con las cantidades

decimales.

¿Solución?

Page 43: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Por lo general, cuando se exponen los resultados de una encuesta en

un medio de comunicación, lo habitual es utilizar otro tipo de

frecuencias relativas: los porcentajes.

El principio que rige la utilización de los porcentajes es el mismo que

para las proporciones: utilizar un referente fijo de tal forma que no sea

necesario contar con el número total de datos para interpretar una

frecuencia.

La diferencia entre los porcentajes y las proporciones es que los

primeros utilizan el referente 100, mientras que las proporciones

utilizan el 1.

Luego, conseguir los porcentajes es muy fácil si se cuenta con las

proporciones: bastará con multiplicar a

Page 44: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

X f fr %

1

2

3

4

5

6

7

8

9

6

11

12

30

40

25

14

9

3

0,0400

0,0733

0,0800

0,2000

0,2667

0,1667

0,0933

0,0600

0,0200

4,00

7,33

8,00

20,00

26,67

16,67

9,33

6,00

2,00

Total 150 1,0000 100,00

Tabla 9: Tabla de frecuencias con porcentajes

Page 45: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Podemos completar también la tabla que se

refiere a las provincias de nacimiento:

Provincia Código f fr %

Almería

Cádiz

Córdoba

Granada

Huelva

Jaén

Málaga

Sevilla

1

2

3

4

5

6

7

8

4

3

2

2

3

2

4

4

0,16

0,12

0,08

0,08

0,12

0,08

0,16

0,16

16

12

8

8

12

8

16

16

Tabla 10: Distribución por provincias

Page 46: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han

Y, por último...

Se podría completar la tabla, de la educación en México bastará con

acumular sus frecuencias:

X f fr % F Fr %a

1

2

3

4

5

6

7

8

9

6

11

12

30

40

25

14

9

3

0,0400

0,0733

0,0800

0,2000

0,2667

0,1667

0,0933

0,0600

0,0200

4,00

7,33

8,00

20,00

26,67

16,67

9,33

6,00

2,00

6

17

29

59

99

124

138

147

150

0,0400

0,1133

0,1933

0,3933

0,6600

0,8267

0,9200

0,9800

1,0000

4,00

11,33

19,33

39,33

66,00

82,67

92,00

98,00

100,00

Total 150 1,0000 100,00

Tabla 11: Tabla de frecuencias completa

Page 47: Unidad II Organización y Presentación de Datos...de datos han exigido el mismo esfuerzo. Así, mientras que las preguntas sobre el número de datos y el valor más frecuente se han