16
30 UNIDAD II PRINCIPIOS ESTADÍSTICOS APLICADOS EN CONTROL DE CALIDAD Por: Prof. Gastón A. Pérez U. 2.3- PROBABILIDAD Y DISTRIBUCIÓN DE PROBABILIDAD

Guia Unidad II Probabilidad y Distribución de Probabilidad

Embed Size (px)

DESCRIPTION

Probabilidad y estadistica

Citation preview

Page 1: Guia Unidad II Probabilidad y Distribución de Probabilidad

30

UNIDAD II

PRINCIPIOS ESTADÍSTICOS APLICADOS EN CONTROL DE CALIDAD

Por: Prof. Gastón A. Pérez U.

2.3- PROBABILIDAD Y DISTRIBUCIÓN DE PROBABILIDAD

Page 2: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

31

Page 3: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

32

(2.3.2) DISTRIBUCIÓN DE PROBABILIDAD

“ES UNA DESCRIPCIÓN DEL CONJUNTO DE LOS VALORES POSIBLES DE X CON LA PROBABILIDAD ASOCIADA A CADA UNO DE ESTOS VALORES”

Page 4: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

33

VARIABLE ALEATORIA DISCRETA:

• Es aquella que tiene un rango finito (o infinito numerable) y en donde las características que están siendo medidas pueden tomar sólo ciertos valores específicos.

• Ej.- Números enteros como 0,1,2… Número de errores de un operador.

Page 5: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

34

• Su distribución de probabilidad se denomina: “Distribución de probabilidad discreta”. • Ej.- La distribución del número de defectos r en una muestra de 5 artículos es una distribución de

probabilidad discreta porque r sólo puede ser 0, 1, 2, 3, 4 o 5. PROPIEDADES

• En este caso la función F(x) = P(X=x) que va del rango de X al intervalo [0,1] recibe el nombre de Función de probabilidad.

1. F(x) = P(X=x) 2. F(x) ≥ 0 (para toda x) 3. ∑ f(x)=1 (la suma de todos los valores posibles de x=1)

• Las distribuciones discretas de uso frecuente en calidad son: 1. Poisson

2. Binomial 3. Geométrica

4. Hipergeométrica.

VARIABLE ALEATORIA CONTINUA

• Es aquella que contiene un intervalo finito o infinito de números reales y en donde las características que están siendo medidas pueden tomar cualquier valor.

• Ej.- Peso, volumen, longitud, etc. las especificaciones de una pieza metálica. • Su distribución de probabilidad se llama “Distribución de probabilidad continua”.

PROPIEDADES

A. Si F(x) es una función de densidad de probabilidades de la variable aleatoria continua X; entonces, para cualquier intervalo de números reales [x

1,X

2] se cumple:

1. F(x) ≥ 0

2. ∫ ( )

(el área bajo la curva = 1)

3. P(X1 ≤ X ≤ X

2) = ∫ ( )

(la probabilidad es igual al área bajo la curva entre los

valores X1 y X

2)

• La mayoría de las características continuas siguen una de las siguientes distribuciones de probabilidad: 1. Normal 2. Exponencial 3. Weibull

• Estas distribuciones encuentran las probabilidades asociadas con la ocurrencia de los valores reales. • Otras distribuciones continuas como t, F y Chi cuadrada son importantes para el análisis de datos pero no

ayudan a predecir directamente la probabilidad de ocurrencia de los valores reales.

(2.3.3)- DISTRIBUCIONES DE PROBABILIDAD CONTINUAS Como estudiamos en la sección (2.3.2) cuando se usan datos medibles como metros, kilogramos, voltios, etc.

la distribución de probabilidad es continua.

En este segmento estudiaremos las tres más utilizadas en control de calidad: normal, exponencial y Weibull.

Page 6: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

35

A- DISTRIBUCIÓN NORMAL

ASPECTOS A CONSIDERAR:

La curva para la distribución normal está relacionada con una distribución de frecuencia y su histograma.

La forma de un histograma de una muestra de datos proporciona ciertos indicios sobre la distribución de probabilidad de la población.

Conforme la muestra se va haciendo más y más grande, y la anchura de cada celda se vuelve más y más pequeño, el histograma se acerca a una curva grande.

Si el histograma se asemeja a la forma de una campana como el de la figura anterior, ésta es una base para asumir que la población sigue una distribución de probabilidad normal.

Por lo que sí se midiera la población entera y ésta estuviese distribuida normalmente, el resultado sería idéntico al de la figura anterior.

Para calcular probabilidades utilizando la distribución normal sólo se requiere conocer la media (µ) y la desviación estándar de la población (σ); de manera que sólo necesitaremos 2 estimaciones y una tabla para predecir:

1. La estimación de µ es ̅ (promedio muestral) 2. La estimación de σ es s (desviación estándar muestral) 3. La tabla para la distribución normal contiene un parámetro llamado “Z”, el cual se calcula

con la siguiente ecuación:

La tabla ofrece los valores probabilísticos asociados a las estimaciones.

(Z negativo) (Z positivo)

Existen tablas de distribución normal que presentan valores considerando μ=0 y σ=1; se conoce como distribución normal estándar [N(0,1)] P(Z>z) (los valores de Z son todos positivos)

Estudiemos la distribución normal con un ejemplo:

Un fabricante llegó a la conclusión de que el tiempo de vida de una bombilla eléctrica sigue una distribución normal. Una muestra de 50 focos se puso a prueba, y el promedio de vida fue de 60 días,

Page 7: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

36

con una desviación estándar de 20 días ¿Cuántas bombillas de la población entera de focos se puede esperar que sigan trabajando después de 100 días de vida?

Solución:

El área bajo la curva entre 2 límites representa la probabilidad de que ocurra.

Para hallar la probabilidad utilizando la tabla de distribución normal debemos calcular primero a Z:

Y donde x = valor particular.

Buscamos para Z = +2.0 en la tabla de distribución normal y hallamos que la probabilidad de que un foco dure 100 días o menos es de 0.9773.

El área total bajo la curva en la distribución normal es = 1, por lo que:

P ( > 100 ) = 1 – 0.9773 = 0.0227 = 2.27 %

<< 2.27 % de los focos seguirán funcionando después de 100 días >>

B- DISTRIBUCIÓN EXPONENCIAL

La curva en la distribución exponencial describe el patrón de carga para algunos miembros estructurales.

La curva exponencial también sirve para describir la distribución de los tiempos de falla en los equipos complejos.

Una propiedad muy característica de la distribución exponencial es que la desviación estándar es igual a la media.

En una población exponencial:

Page 8: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

37

36.8 % se encuentra por encima del promedio. 63.2 % se encuentran por debajo del promedio.

Se utiliza una tabla para hacer una predicción en una distribución exponencial, es decir, para hallar el área bajo la curva. En ella encontramos el valor de la distribución exponencial e -x/µ, el parámetro que

presenta la tabla es

para diferentes valores de X.

Estudiemos la distribución exponencial con un ejemplo:

Se mide el tiempo entre las fallas sucesivas de una pieza compleja de equipo reparable y se determina que el histograma resultante se parece a la curva de probabilidad exponencial; para la medición que se hizo, la media del tiempo entre falla (MTBF) es de 100 hr ¿Cuál es la probabilidad de que el tiempo entre 2 fallas sucesivas del equipo sea de al menos 20 hr?

Solución:

Buscamos en la tabla este valor y encontramos 0.8187. Es decir: ≈ 82 % de posibilidad que el equipo opere de manera continúa sin fallas por al menos 20 hr.

C- DISTRIBUCIÓN DE WEIBULL

La curva de la función varía grandemente dependiendo de los valores numéricos de los parámetros.

El parámetro „β‟ es el más importante porque refleja el patrón de la curva (parámetro de forma): - β = 1 se acerca a la distribución exponencial - β = 3.5 se acerca a la distribución normal.

- En la práctica β varía entre

y 5.

El parámetro de escala „α‟ está vinculado al grado de apuntamiento de la curva, es decir, si „α‟ cambia, la curva se vuelve más plana o apuntada.

El parámetro de ubicación „γ‟ es el valor más pequeño posible de X. Con frecuencia se asume igual a 0, lo cual simplifica la ecuación.

Se utiliza una hoja de probabilidad de Weibull (ver figura siguiente):

Page 9: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

38

Con ella se puede estimar β dibujando una línea paralela a la línea que mejor se adapte y a través de un punto marcado en la escala vertical de 40.0 Entonces, la intersección con el arco da una estimación de β.

En la práctica, Weibull es muy popular porque cubre muchas formas de distribución ya que reduce los problemas de examinar una serie de datos y decidir cuál de las distribuciones comunes se adapta mejor 1.

Estudiemos la distribución Weibull con un ejemplo:

Se sometieron a prueba 7 mangos tratados con calor hasta que cada uno fallara; la vida de fatiga (# de ciclos hasta la falla) fue como sigue:

11251. 17786. 26432. 28811. 40122. 46638. 52374

¿Utilice Weibull y trate de predecir el % de fallas de la población?

Solución:

1 Excel de Microsoft es útil para llevar a cabo análisis Weibull.

Page 10: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

39

1. Diagramar los datos en una hoja Weibull y observar si los puntos caen aproximadamente en una línea recta:

2. En un diagrama Weibull los datos originales se diagraman en comparación con las “calificaciones promedios”, éstas se calculan con la siguiente formula:

Dónde:

i = No. de falla correspondiente

N = tamaño de la muestra

(*) Las calificaciones promedios las podemos encontrar directamente en la tabla de Weibull; para ello

buscamos en la escala horizontal los valores asociados a 7 que es el total de muestras sometidas a pruebas. Procedemos a diagramar en la hoja Weibull los valores encontrados: en la escala horizontal la característica de interés (ciclos) y en la vertical los porcentajes (CPx100). Ver figura siguiente:

Datos i CP % Valores CP según Tabla

(*) %

11251 1 0.099 9.9 0.0943 9.43

17786 2 0.230 23 0.2295 22.95

26432 3 0.365 36.5 0.3648 36.48

28811 4 0.500 50 0.5000 50

40122 5 0.635 63.5 0.6352 63.52

46638 6 0.770 77 0.7705 77.05

52374 7 0.905 90.5 0.9057 90.57

8000

5 %

Page 11: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

40

La grafica indica que cerca del 80% de la población fallará en menos de 52.000 ciclos.

Con Weibull podemos extrapolar para por ejemplo, pronosticar la vida de los mangos. Supongamos que se especificó una vida mínima de fatiga de 8000 ciclos; aparentemente todas cumplieron con la especificación, no obstante, extrapolando en la hoja, vemos que predice que cerca del 5% de la población de mangos fallará en menos de 8000 ciclos; esto a todas luces no es alentador; Weibull actúa en este caso como una señal de alarma destacando un problema potencial.

Por último, debemos tomar en cuenta que para diagramar en Weibull se requieren al menos 7 puntos.

(2.3.4) DISTRIBUCIONES DE PROBABILIDADES DISCRETAS Como ya estudiamos en la sección (2.3.2), cuando se usan valores específicos como los números enteros (0,

1, 2, 3…), la distribución de probabilidad es discreta.

En esta sección estudiaremos las distribuciones de uso frecuente en control de calidad: binomial,

hipergeométrica, Poisson y geométrica.

EXPERIMENTO BERNOULLI

En calidad es frecuente que se den variables del tipo Pasa/No Pasa; por ejemplo:

Se cumple o no con las especificaciones

Resiste cierta fuerza o no

Una lámpara enciende o no

Un experimento aleatorio donde los posibles resultados son éxito o fracaso se denomina: “Experimento

Bernoulli”.

Un experimento aleatorio que consiste en una secuencia de `n´ ensayos Bernoulli y en donde además se

cumple que (1) Los ensayos son independientes (2) La probabilidad de éxito en cada ensayo (p) permanece

constante se denomina: Experimento Binomial”.

A- DISTRIBUCIÓN BINOMIAL

n = No. de pruebas/No. en la muestra r = No. de ocurrencias/Cantidad de no conformes en la muestra p = Probabilidad de ocurrencia/Proporción de no conformes en la población q = proporción de conformes (1-p) en la población

𝑛𝑟 Combinaciones

Page 12: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

41

DISTRIBUCIÓN BINOMIAL (n, p): es la que proporciona la probabilidad de observar x éxitos en una secuencia de n experimentos Bernoulli independientes con una probabilidad constante p de éxito.

Consideraciones:

En la mayor parte de los casos de control de calidad no interesa toda la distribución, sino sólo uno o dos términos del desarrollo binomial; la función de probabilidad binomial (fórmula anterior) se utiliza para calcular un término.

Aplicaciones de la distribución:

Se usa para el caso infinito (aunque bajo ciertas condiciones puede aproximarse a la distribución hipergeométrica).

Se requiere que haya dos y sólo dos resultados posibles (unidad conforme o no conforme), y que no cambie la probabilidad de cada resultado.

Requiere que los intentos sean independientes; es decir, si se presenta una unidad no conforme, la probabilidad de que la siguiente sea no conforme no aumenta ni disminuye.

En la práctica, la presunción de una probabilidad constante de ocurrencia es considerada razonable cuando el tamaño de la población es de al menos 10 veces el tamaño de la muestra.

Se utiliza una tabla donde se presentan valores para `n´ y `p´ y con éstos encontramos los valores de `r´ y sus respectivas probabilidades.

Cuando p = q la distribución es simétrica p ≠ q la distribución es asimétrica

La forma de la distribución siempre es función del tamaño de muestra n, y de la proporción de no conformes p. El cambio de alguno de estos valores causa una distribución diferente.

Estudiemos la distribución binomial con un ejemplo:

Un lote de 100 unidades de producto se presenta a un vendedor cuya calidad pasada ha tenido 5% de defectos. Se selecciona una muestra aleatoria de 6 unidades del lote ¿Encuentre las posibles probabilidades de piezas con defectos?

n = No. de pruebas (muestras) = 6 r = No. de ocurrencias o ensayos con éxito (0-6)

p = probabilidad de ocurrencia (no conformidades) = 0.05 q = 1 – p = 1 – 0.05 = 0.95

<< De manera que por ejemplo la probabilidad de encontrar 2 defectos en la muestra es de .306 >>

Utilizando la tabla Binomial para n = 6 y p = 0.05 obtenemos directamente los siguientes valores (comparar con los calculados con la fórmula):

0 .7351 1 .2321 2 .0305 3 .0021 4 0.0001 5 0.0000

Algunos ejemplos típicos de la distribución son los siguientes:

1. Un proceso produce 5% de piezas defectuosas. Sea X el número de piezas defectuosas en las siguientes 20 piezas producidas.

r (x)

Y=

( ) ( ) ( )

r (x)

Y=

( ) ( ) ( )

r (x)

Y=

( ) ( ) ( )

0 0.7351 2 0.3060 4 0.0001

1 0.2321 3 0.0021 5 0.0000

6 0.0000

Page 13: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

42

2. En la prueba final de artículos electrónicos se tiene un historial de que 1% tiene alguna falla que es necesario reparar antes de liberarlo. Sea X la cantidad de artículos con fallas en los siguientes 50 inspeccionados.

3. En una zona costera se ha determinado que el porcentaje de incidencia del cólera es de 20%. Sea X las muestras positivas en los siguientes 15 muestreos.

B- DISTRIBUCIÓN HIPERGEOMÉTRICA DEFINICIÓN: es la que da la probabilidad de obtener X éxitos en n experimentos Bernoulli, donde la probabilidad de éxito cambia de un experimento al siguiente.

Aplicación: Cuando el tamaño del lote (población finita) es pequeño con respecto al tamaño de la

muestra (ésta se toma sin sustitución).

Cuando no se puede utilizar la presunción de Poisson o la Binomial.

Consta de 3 combinaciones:

1. Combinaciones Totales:

2. Combinaciones No Conformes:

3. Combinaciones Conformes:

Su forma es:

( )

-

-

Dónde: P(d) = Probabilidad de „d‟ unidades no conformes en una muestra de tamaño „n‟.

= Combinación de todas las unidades.

= Combinación de unidades no conformes.

= Combinación de unidades conformes.

N = No. de unidades en el lote (población). n = No. de unidades en la muestra. D = No. de unidades no conformes en el lote. d = No. de unidades no conformes en la muestra. N-D = No. de unidades conformes en el lote. n-d = No. de unidades conformes en la muestra. La fórmula para resolver combinaciones viene dada por:

( - ) Por definición: 0!=1

Ej. Un lote de 9 termostatos está en una caja que contienen 3 unidades no conformes ¿Cuál es la

probabilidad de sacar 1 unidad no conforme, en una muestra aleatoria de 4?

Lote: Muestra:

N = población = 9 n = tamaño muestra = 4

D = No conformes = 3 d = No conformes = 1

N - D = 9 – 3 = 6 n – d = 4 – 1 = 3

El cálculo para la 1ra muestra sería:

Page 14: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

43

( )

( - )

( - )

( - )

Si efectuamos los cálculos para P(0), P(2) y P(3) (sólo hay 3 unidades no conformes) obtenemos:

P(0) = 0.119 P(2) = 0.357 P(3) = 0.048

La suma de todas las probabilidades = 1 (de acuerdo a las propiedades de las distribuciones de probabilidades discretas):

P(T) = P(0)+P(1)+P(2)+P(3) = 0.119+0.476+0.357+0.048 = 1.00

Utilizando la tabla suministrada de probabilidades acumuladas de la distribución Hipergeométrica (en donde D = r ; d = x) con los valores siguientes:

N = 9 r = 3 n = 4 x = 1

De manera que los valores pueden considerarse similares ya que sólo difieren por el número de cifras decimales utilizados.

C- DISTRIBUCIÓN DE POISSON

En control de calidad es frecuente evaluar variables tales como:

No. de defectos por artículos

No. de defectos por m2

No. de defectos por unidad de área

No. de impurezas en un líquido

No. de errores de un trabajador

Lo anterior puede resumirse de la siguiente manera: No. De eventos por unidad (área-volumen-tiempo-

etc.)

Este tipo de variables tiene frecuentemente una distribución de Poisson cuya función viene dada por:

d=x (No conformes) P(x) acumuladas P(x) individuales

0 .1190 .1190-.0000 = .1190

1 .5952 .5952-.1190 = .4752

2 .9523 .9523-.5952 = .3571

3 .9999 .9999-.9523 = .0476

∑ = 1

Page 15: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

44

r = No. de ocurrencias o No. de eventos de determinada clasificación que se presenta en una muestra (artículos defectuosos o no conformidades, etc.). np = cuenta promedio o No. promedio de eventos de determinada clasificación que hay en una muestra. e = 2,718281

Para la distribución de Poisson se cuentan con dos tablas donde se presentan las probabilidades acumulativas o sin acumular (ambas son suministradas como anexo).

La tabla contiene en sentido horizontal la probabilidad de „r‟ o menos ocurrencias del evento que tiene un número promedio de ocurrencias igual a „np‟ (algunos lo llaman λ) en la primera columna (ver

figura).

r np (λ) ↓

Estudiemos la distribución de Poisson con un ejemplo: Un vendedor cuya calidad pasada ha sido aproximadamente 2% de defectos, presenta un lote de 300 unidades de producto. Se selecciona del lote una muestra aleatoria de 40 unidades ¿Cuál es la probabilidad de piezas con defectos?

Solución: Para encontrar los valores de `r` en la tabla, necesitamos calcular primero a `np`:

n = No. de intentos o pruebas = 40 n.p = 40 x 0.02 = 0.800 p = probabilidad de ocurrencia = 0.02

Buscamos en la tabla de la distribución de Poisson que presenta la probabilidad de encontrar „r’ (No. de defectos) en una muestra de „n’ unidades.

Para el valor calculado de np = 0.800. Buscamos en la tabla y encontramos „r’ hasta un máximo de 5 defectos (el sexto igual a 1.000 no se considera); Con los datos obtenidos construimos la siguiente tabla:

r (# de eventos)

Probabilidad acumulativas r

Probabilidades individuales r

0 .449 .449-0 = .449

1 .809 .809-.449 = .360

2 .953 .953-.809 = .144

3 .991 .991-.953 = .38

4 .999 .999-.991 = .8

5 1.000 1.000-.999 = .1

En la otra tabla suministrada de la distribución de Poisson, los valores de probabilidades individuales son directamente obtenidos sin tener que efectuar los cálculos anteriores (debido a que se utilizan 4 cifras decimales, aparece valor para r = 6).

Según la tabla anterior: o La probabilidad de encontrar 2 defectos = 0.144 (14.4%). o La probabilidad de encontrar 4 defectos = 0.8 (80%).

CONSIDERACIONES SOBRE POISSON:

Page 16: Guia Unidad II Probabilidad y Distribución de Probabilidad

Guía de estudio para la unidad II de Control de Calidad elaborado por el Prof. Gastón Pérez

45

Poisson es una aproximación de distribuciones más exactas como por ejemplo la binomial; puede utilizarse como una distribución exacta cuando un evento tiene muchas oportunidades de ocurrir.

Es útil para calcular las probabilidades asociadas con los procedimientos de muestreo. Se aplica cuando el tamaño de la muestra es de al menos 16 (ej. = 40); el tamaño de la población es

de al menos 10 veces el tamaño de la muestra (40 x 10 = 400) y la probabilidad de ocurrencia „p‟ en

cada intento menor a 0.1 (ej. 0.02). Casi siempre se cumplen estas condiciones.

Poisson es la base de las gráficas de Control de atributos y el muestreo de aceptación.

D- DISTRIBUCIÓN GEOMÉTRICA DEFINICIÓN: es la que proporciona la probabilidad de requerir X repeticiones independientes de un

experimento Bernoulli para observar el primer éxito.

( ) ( )