31
DISTRIBUCIÓN DE FRECUENCIAS Y REPRESENTACIONES GRAFICAS Probabilidad y estadística para ingenieros

Distribucion de Frecuencias

Embed Size (px)

DESCRIPTION

Estadística Para Ingenieros Civiles

Citation preview

Page 1: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIAS Y

REPRESENTACIONES GRAFICAS

Probabilidad y estadística para ingenieros

Page 2: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIA

• Es una tabla que tienen como finalidad presentar en forma ordenada los valores que toman las diferentes variables las cuales suelen ser discretas

• Bajo este principio los datos se clasifican y ordenan de acuerdo a ciertas características cualitativas y/o cuantitativas, indicándose el numero de veces que se repiten

• se presentan dos clases de distribución de frecuencia según el tipo de variable: distribución de frecuencia simple y distribución de frecuencia por intervalos

Page 3: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIA SIMPLE

• Antes de elaborar una tabla de frecuencia se debe conocer la simbología que se utiliza en la elaboración de estas

• N = tamaño poblacional• n = Tamaño de la muestra, es el numero de observaciones• Xi = La variable: es cada uno de los diferentes valores o

cualidades que se han observado.Existen dos tipo de variables: Cualitativas : no expresan cantidades ej: barrios/ país/ marca de carros/ marca de cemento. Estas se organizan en orden alfabético, según su importancia, o por región geográfica

Page 4: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIA SIMPLE

• Cuantitativas: son aquellas que se expresan en números ej: peso, talla, humedad, temperatura etc. Estas se organizan de menor a mayor o forma ascendente.

Atendiendo los valores de estas variables se distinguen dos clases:1. Variables discretas: admite únicamente valores

numéricos enteros por ejemplo: cantidad de libros, numero de hijos por familia, empleados etc..

2. Variables continuas: si admiten valores fraccionarios, por ejemplo: peso, longitud, temperatura etc….

Page 5: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIA

• fi= frecuencia absoluta o simplemente frecuencia: es el numero de veces que se repite la variable Xi

• fa = Frecuencia acumulada: se obtiene acumulando la frecuencia absoluta

• fr= Frecuencia relativa: es el resultado de dividir cada una de las frecuencias absolutas por el tamaño de la muestra

• fra= Frecuencia relativa acumulada: se obtiene dividiendo la frecuencia acumulada por el tamaño de la muestra• m = número de valores que toma la variable

Page 6: Distribucion de Frecuencias

DISTRIBUCIÓN TEÓRICA DE FRECUENCIAS DE n OBSERVACIONES

Variable (Xi)

Frecuencia (fi)

Frecuencia acumulada

(fa)

Frecuencia relativa

(fr)

Frecuencia relativa

acumuladaX1 f1 f1 F1/n F1/n

X2 f2 f1+f2 F2/n (F1+f2)/n

X3 f3 F1+f2+f3 F3/n (f1+f2+f3)/n

. . . . .

. . . . .

Xm fm F1+f2+f3..+fm Fm/n (F1+f2+f3..+fm)/n

n 1

Page 7: Distribucion de Frecuencias

Ejercicio 1

• Supóngase que en la pavimentación de la calle 26 entre Cra 3ra y Cra 9 de la ciudad de Quibdó el ingeniero residente quiere conocer las edades de los obreros , para ello recoge información a una muestra de 50 obrero la que se relaciona en la tabla No 1.

Page 8: Distribucion de Frecuencias

Tabla No 1. Edades de 50 obreros de la pavimentación de la cll 26 entre la Cra 3 y 9 de la ciudad de Quibdó

Edad (años) Edad (años) Edad (años) Edad (años) Edad (años)

32 34 35 36 32

34 31 35 33 37

35 34 32 37 36

34 35 35 34 31

33 34 33 33 38

36 36 37 30 35

34 32 34 35 33

38 34 35 32 34

31 33 33 33 33

34 35 35 34 36

Page 9: Distribucion de Frecuencias

Tabla No 2. Distribución de frecuencia edades de 50 obreros de la pavimentación de la cll 26 entre la Cra 3 y 9 de la ciudad de Quibdó

Edad (años)Xi

fi fa fr fra

30 1 1 1/50 = 0.02 1/50 = 0.02

31 3 4 3/50 = 0.06 4/50 = 0.08

32 5 9 0.10 0.18

33 9 18 0.18 0.3634 12 30 0.24 0.60

35 10 40 0.20 0.80

36 5 45 0.10 0.90

37 3 48 0.06 0.96

38 2 50 0.04 1.00

Sumas 50 1.00

Page 10: Distribucion de Frecuencias

Conclusiones

• Analizando las porcentuales fr y fra se obtiene entre otras las siguientes conclusiones:

• Solo el 4% de los obreros tienen la mayor edad la cual corresponde a 38 años y corresponde a 2 obreros• Solo un obrero lo que constituye el 2% del personal

encuestado tiene una edad de 30 años• El 62% de los obreros tienen edades entre 33 y 35 años • El 60 % de los obreros tienen edades de 34 años o menos

Page 11: Distribucion de Frecuencias

Ejercicio 2• Se ha realizado una encuesta en una clase de 30 alumnos

acerca de la adquisición anual de libros, obteniendo los siguientes resultados

• Tabla No 3. Adquisición anual de libros de 30 alumnos

• Definir: cual es la variable, que tipo es la variable, cual es el valor de m y construir una distribución de frecuencia

No libro al año

No libro al año

No libro al año

No libro al año

No libro al año

No libro al año

1 0 3 2 4 5

2 3 4 0 0 3

5 2 1 3 2 2

0 1 3 2 1 1

1 2 4 3 4 5

Page 12: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIA POR INTERVALOS

• Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de frecuencia simple, debido a que se encuentra distribuido y el numero de veces que se repite cada observación no es significativo en todos los casos y en la mayoría de ellos su frecuencia es baja. Una tabla de frecuencia simple construida en estas condiciones no presenta ninguna utilidad.

• Las variables que se utilizan para la distribución de frecuencia por intervalo suelen ser variables continuas

• Cuando se presentan estas condiciones se hace necesario el agrupamiento en intervalos o clases que hagan mas compacta, manejable y presentable la información

Page 13: Distribucion de Frecuencias

DISTRIBUCIÓN DE FRECUENCIA POR INTERVALOS

• El numero de clase y la amplitud de los intervalos los fija el investigador de acuerdo con el conocimiento que posea de la población.

• En términos generales, es usual que el numero de intervalos no sea inferior a 5 ni superior a 15. una de las formas de obtener el numero de intervalo (m) es aplicando la regla de Sturges que propone que m sea determinado por la siguiente expresión

m = 1 + 3.3 log (n)

• La amplitud debe ser igual para todos los intervalos• Se utilizan variables continuas

Page 14: Distribucion de Frecuencias

Pasos para la construcción de intervalos

• Cuando no se tiene experiencia en el manejo de la información es necesario seguir los siguientes pasos

• 1. Determinar los datos de mayor y menor valor : Xmin; Xmax• 2. Calcular el Rango o recorrido: R = Xmax – Xmin• 3. Determinar el numero de intervalos m = 1 + 3.3 log (n)

y es un numero entero• 4. Se calcula la amplitud: A A >R/m• 5. calcular el rango ampliado: Ra = m*A

Page 15: Distribucion de Frecuencias

Pasos para la construcción de intervalos

• 6. Establecer la diferencia: a = Ra – R, es decir la cantidad en que ha sido alterado el rango, la cual no debe ser superior a la amplitud.

• 7. distribuir adecuadamente la cantidad “a” de la siguiente manera:

• Al valor Xmin se le resta aproximadamente a/2 y le parte restante se le suma a Xmax, obteniendo el limite inferior del primer intervalo y el limite superior del ultimo intervalo.

• Xmin - = a/2 = LIPI Xmax + = a/2 = LSUI

• 8. Contruir los intervalos, calcular los puntos medios o marcas de clase y hacer el agrupamiento de frecuencia

Page 16: Distribucion de Frecuencias

Ejercicio 3• Supongamos que en el barrio Medrano de la ciudad de Quibdó

residen 300 familias y el gerente de aguas del Atrato requiere conocer el consumo de agua en m3 en el mes de febrero de 2015 por familia en dicho barrio, por motivos de tiempo y personal disponible se toma la decisión de revisar un 10% de las familias; es decir 30 familias de un total de 300, donde se obtuvo la siguiente información

• Tabla No 4 Consumo de agua(m3) mes de febrero de 2015 de 30 familias en el barrio Medrano de la ciudad de Quibdó

M3 M3 M3 M3 M3 M34 8 8 13 15 20

10 15 17 19 20 21

26 12 18 15 22 23

11 14 25 6 5 16

19 27 28 29 26 23

Page 17: Distribucion de Frecuencias

Tabla No 5. Consumo de agua(m3) mes de febrero de 2015 de 30 familias en el barrio Medrano de la ciudad de Quibdó

• Fuente: Datos tomados en campo

Intervalo (m3)

Marcas de clase Xi

fi fa fr Fra

2 – 7 (2+7)/2= 4.5 3 3 0.1 0.10

7 – 12 (7+12)/2= 9.5 4 7 0.13 0.23

12 – 17 14.5 7 24 0.23 0.46

17 – 22 19.5 7 21 0.23 0.69

22 – 27 24.5 6 27 0.20 0.89

27 – 32 29.5 3 30 0.10 1.0

30 1.0

Page 18: Distribucion de Frecuencias

Conclusiones

• El 69% de las familias del barrio Medrano en el mes de febrero consumieron menos de 22 m3 de agua

• Solo el 10% de las familias del barrio Medrano en el mes de febrero mas de 27 m3 de agua.

Page 19: Distribucion de Frecuencias

REPRESENTACIONES GRAFICAS

Es un dibujo complementario a una tabla o cuadro que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables allí relacionadas

COMPONENTES DE UNA GRAFICAUna grafica, al igual que un cuadro o una tabla debe constar: Titulo: este debe ser adecuado, claro, conciso, que

aclare su contenido y que debe responder a los interrogantes: Que, como, cuándo y donde

Page 20: Distribucion de Frecuencias

Cuerpo: o grafico en si, cuya elección debe considerar el o los tipos de variables a relacionar

Notas de pie de grafico: donde se presentan aclaraciones respecto al grafico, la escala de los ejes, o se otorgan los créditos a las fuentes respectivas que suministraron la información

• Fuente: DANE

1994 1995 1996 1997 1998 1999 20000

5

10

15

20

25

Variacion de la inflacion en Colombia 1995 - 2000

Años

Porc

enta

jes

Page 21: Distribucion de Frecuencias

PRINCIPALES TIPOS DE GRAFICOSGrafico de líneas: se usa básicamente para mostrar el

comportamiento de una variable cuantitativa a través del tiempo, es uno de los mas utilizados pero al mismo tiempo presenta mayores dificultades en la visualización de los datos debido a la confección de la escala de los ejes. En este tipo de grafica lo común es que la variable tiempo se coloque en el eje horizontal y los valores que toma la variable en el eje vertical

1994 1995 1996 1997 1998 1999 20000

5

10

15

20

25

Variacion de la inflacion en Colombia 1995 - 2000

Años

Porc

enta

jes

Page 22: Distribucion de Frecuencias

• Grafico de líneas compuesto: Cuando se tiene varias variables para representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlo en un solo grafico.

Variación de la inflación y el salario en Colombia 1995 - 20000

1994 1995 1996 1997 1998 1999 20000

5

10

15

20

25

30

35

40

45

salarioinflacion

Año

Porc

enta

jes

Page 23: Distribucion de Frecuencias

• Grafico de barras: Esta constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre si. Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo cuando el numero de item es reducido. Estos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal

Page 24: Distribucion de Frecuencias

• Gráfica de barras compuesto: Este tipo de gráfica se usa cuando las diferentes categorías de datos se componen de otras variables , de tal forma que cada barra se pueda subdividir y representar cada una de estas variables . Así mismo, entre las categorías y sus componentes se compara valores.

• horizontales o de barras verticales; su escogencia depende de lo que se pretenda ilustrar para que facilite su visualización.

Page 25: Distribucion de Frecuencias

• Grafico de sectores circulares: Usualmente llamado grafico de pastel o torta, debido a su forma característica de una circunferencia dividida en casco. Se usa para representar variables cualitativas y sirve para resaltar las diferencias en los en porcentajes en que esta dada la distribución. Este tipo de comparaciones es relativamente efectivo siempre y cuando los segmentos sean suficientemente grandes para permitir comparaciones.

• Para su construcción se procede de la siguiente forma: la circunferencia tiene en su interior 360 grados, los cuales hacemos corresponder el total de la información, es decir 100%, para determinar el numero de grados correspondiente a cada componente se multiplica el porcentaje respectivo por 360 y se divide por 100, los cuales se miden con la ayuda de un transportador.

Page 26: Distribucion de Frecuencias

• Ejemplo: se tienen los siguientes datos: estado civil de 50 obreros

• Casado = 20% (20x360)/100 = 72°• Soltero = 60% (60x360)/100 = 216°• Unión libre = 10% (10x360)/100 = 36°• Viudo = 10% (10x360)/100 = 36°•

20%

60%

10%

10%

Estado civil de 50 obreros

casadosolteroU.libreviudo

Page 27: Distribucion de Frecuencias

• Histogramas de frecuencia: Una de las maneras más comunes de representar una distribución de frecuencia por intervalo. Su grafica consiste en un conjunto de barras, en la que la base de cada barra representa una clase o intervalo, indicada en el eje horizontal, y la altura por su frecuencia (absoluta o relativa) indicada en el eje vertical. Generalmente las barras se trazan adyacentes una a la otra.

Page 28: Distribucion de Frecuencias

• Polígono de frecuencia: para la construcción de un polígono de frecuencias se marcan los puntos medios de cada uno delos intervalos en la parte superior de cada barra del histograma de frecuencia, los cuales se unen con segmentos de recta

Page 29: Distribucion de Frecuencias

• Histograma de frecuencia acumulada: También es obtenido a partir de una distribución de frecuencia por intervalos, tomando en el eje horizontal las clases de las variable y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo.

• OJIVA : Es un polígono acumulado de frecuencia absoluta, relativa o porcentual y por lo tanto representa segmentos de línea que se origina al conectar los puntos formados por la intersección entre el punto medio de cada intervalo con la frecuencia acumulada. La ojiva es importante por que nos permite extrapolar información que la distribución de frecuencia oculta y así como calcular estadísticos como la mediana, cuartiles, deciles y percentiles, en forma aproximada.

Page 30: Distribucion de Frecuencias

Histograma de frecuencia acumulada

Ojiva

Page 31: Distribucion de Frecuencias

Muchas gracias