75
Notas de PROBABILIDAD y ESTAD ´ ISTICA Humberto Barrios Docente UPC

Nueva Esta Di Stica

Embed Size (px)

DESCRIPTION

notas de clase estadistica upc

Citation preview

  • Notas de PROBABILIDAD y ESTADISTICA

    Humberto Barrios

    Docente UPC

  • IntroduccionDESCRIPCIONES DE UN CONJUNTO DEMEDICIONES

    DISTRIBUCIONES DE FRECUENCIAS

    METODO GRAFICO

    MEDIDAS NUMERICAS DESCRIPTIVASMEDIDAS DE TENDENCIA CENTRAL

    MEDIDAS DE DISPERSIONOTRAS MEDIDAS DESCRIPTIVAS

    EJERCICIOS

    1. Estadstica Descriptiva

    1.1 Introduccion

    Estamos en una epoca en la que nos agobian acontecimientos y numeros, las llama-das, estadsticas, acerca de cualquier tema comprensible. Se escuchan o se leen inda-gaciones de los medios de comunicaciones del numero de personas desplazadas por laviolencia a las que ayuda el gobierno, el numero de hectareas sembradas de coca radica-das diariamente por el actual gobierno y cronicas deportivas sobre el numero promediosde goles en los partidos de futbol en una semana determinada. En este sentido paramucha gente, el termino estadstica significa descripcion numerica. En un sentido masamplio, se puede establecer que el objetivo de la estadstica es hacer inferencias conrespecto a una poblacion a partir de la informacion contenida en una muestra y propor-cionar una medida (probabilidad) correspondiente para la bondad de la inferencia. Esdecir, la estadstica trata del diseno de experimento o encuestas (investigacion) median-te muestras para obtener una cantidad determinada de informacion a un costo mnimoy del uso optimo de esta informacion para sacar conclusiones (inferencias inductivas)con respecto a una poblacion.

    En estadstica la inferencia es inductiva porque se proyecta de lo especifico (la muestra)hacia lo general (poblacion). En un procedimiento de esta naturaleza siempre existe laposibilidad de error. Nunca se tendra el cien por ciento de seguridad sobre una propor-cion en la que se basa la inferencia estadstica. Sin embargo, lo que hace de la estadsticauna ciencia (separandola del arte de adivinar la suerte) es que, unida cualquiera propo-sicion o afirmacion, existe una medida de la confiabilidad de esta. En estadstica se midela confiabilidad en terminos de probabilidad (un tema que se estudiara mas adelante).En otras palabras, para cada inferencia estadstica se identifica la probabilidad de quela inferencia sea correcta. Los problemas estadsticos se caracterizan por los siguientescuatro elementos:

    1. La poblacion de interes y el procedimiento cientfico que se emplea para seleccionarla muestra.

    2. La muestra y el analisis matematico de la informacion.3. Las inferencias estadsticas que resulten del analisis de la muestra.4. La probabilidad o confiabilidad de que las inferencias sean correctas.

  • 4 Captulo 1. Estadstica Descriptiva

    Para comprender la naturaleza de la estadstica inferencial, es necesario precisar algunosconceptos.

    Definicion 1.1.1 Una poblacion es el conjunto de todas las mediciones de interespara determinado problema. En estadstica, poblacion es un concepto mucho masgeneral del que tiene el concepto comun de esta palabra.

    En este sentido, una poblacion es cualquier coleccion ya sea de un numero finito demediciones o una coleccion grande, virtualmente infinita, de datos acerca de algo deinteres.

    Definicion 1.1.2 Una muestra es un subconjunto de la poblacion que contiene lasmediciones obtenidas mediante un experimento. De esta forma, una buena muestraes aquella que refleja las caractersticas esenciales de la poblacion de la cual se obtuvo.

    En estadstica, el objetivo de las tecnicas de muestreo es asegurar que cada observacionen la poblacion tiene una oportunidad igual e independiente de ser incluida en la mues-tra. Tales procesos de muestreo conducen a una muestra aleatoria. Las observacionesde la muestra aleatoria se usan para calcular ciertas caractersticas de la muestra lla-madas estadsticas. Las estadsticas se usan como base para hacer inferencias de ciertascaractersticas de la poblacion, que reciben el nombre de parametros.

    En cada uno de los siguientes casos se describe la poblacion correspondiente, el objetivoinferencial y que es lo que se hara para obtener una buena muestra.

    Ejemplo 1.1 La Facultad de Ciencias de la Salud de la UPC quiere hacer un estu-dio acerca de los niveles de resistencia fsica de estudiantes varones que recientementeingresaron a la universidad.

    Poblacion: Son todos los estudiantes varones de primer semestre de la UPC.

    Objetivo inferencial: Estimar la distribucion de frecuencias, por edades, la resistenciafsica de estudiantes varones que recientemente ingresaron a la universidad.

    Muestra: Seleccionar una muestras de estudiantes varones que ingresaron a la UPC,en el primer semestre.

    Ejemplo 1.2 Un ingeniero desea estimar el consumo semanal promedio de agua porfamilias en Valledupar.

    Poblacion: Todas las familias que viven en Valledupar.

    Objetivo inferencial: Estimar el consumo semanal promedio de agua por familias.

    Muestra: Tomar un subconjunto de todas las familias de Valledupar, de tal maneraque estas familias sean representativas.

    Ejemplo 1.3 Un ingeniero electronico desea determinar si la duracion promedio decierto tipo de transistores supera las 500 horas.

    Humberto Barrios - [email protected]

  • 1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES 5

    Poblacion: En este caso, la poblacion puede estar constituida por todos los transistoresproducidos por una fabrica durante una semana o tambien se puede considerar los quese pueden fabricar en el futuro. En este caso, la poblacion es virtualmente infinita.

    Objetivo inferencial: Estimar si la duracion promedio de cierto tipo de transistoressupera las 500 horas.

    Muestra: Seleccionar una muestra aleatoria de la produccion de un lote de varios das.

    1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES

    1.2.1 DISTRIBUCIONES DE FRECUENCIAS

    En el sentido mas amplio, hacer inferencias implica la descripcion parcial o total deun fenomeno u objeto fsico. Por consiguiente, un preludio necesario a la explicacion decomo hacer inferencias, es la elaboracion de un metodo para describir un conjunto denumeros. La descripcion debe ser tal, que el conocimiento de las medidas descriptivasnos permita tener una apreciacion clara del conjunto de datos. Ademas es de esperarseque la descripcion posea un sentido pragmatica, para que el conocimiento de las medidasdescriptivas de una poblacion nos ayude a resolver un problema practico no estadstico,por ejemplo, en la toma de decisiones.

    Ejemplo 1.4 Si se seleccionaron aleatoriamente en un proceso de fabricacion de unasemana, 100 bateras para hallar algun tipo de regularidad en el proceso de fabricacion.En el cuadro 1.1 se dan los datos que representan el tiempo de duracion en das de cadauno de las bateras:

    Cuadro 1.1: Tiempo de duracion de 100 bateras178 221 157 153 107 188 220 157 184 173221 153 177 173 182 185 111 151 178 167164 234 151 169 174 229 192 109 118 135205 181 155 176 146 187 168 188 222 156200 134 174 200 191 165 187 175 169 162206 139 176 160 226 188 155 185 187 184199 174 165 168 124 149 203 159 164 166226 191 195 182 160 193 140 167 218 183122 224 187 104 173 194 181 151 198 172218 236 176 150 158 199 144 202 208 178

    Si quisieramos buscar algun tipo de regularidad en este conjunto de datos sera impo-sible encontrarla a simple vista. Una manera sencilla para organizar datos es prepararun arreglo ordenado. Un arreglo ordenado es una lista de valores de una poblacion omuestra en orden de magnitud de menor a mayor valor. Un arreglo ordenado permitedeterminar con rapidez los valores de las mediciones mas pequenos, de los mas grandes.A continuacion se muestra la construccion de un arreglo ordenado con los datos que semuestran en el cuadro 1.1.

    Facilmente es posible identificar rapidamente la batera que duro menos das (104) y laque duro mas das (236).

    Humberto Barrios - [email protected]

  • 6 Captulo 1. Estadstica Descriptiva

    Cuadro 1.2: Tiempo de duracion de 100 bateras ordenadas de menor a mayor104 107 109 111 118 122 124 134 135 139140 144 146 149 150 151 151 151 153 153155 155 156 157 157 158 159 160 160 162164 164 165 165 166 167 167 168 168 169169 172 173 173 173 174 174 174 175 176176 176 177 178 178 178 181 181 182 182183 184 184 185 185 187 187 187 187 188188 188 191 191 192 193 194 195 198 199199 200 200 202 203 205 206 208 218 218220 221 221 222 224 226 226 229 234 236

    Pero para identificar los patrones en un conjunto de datos es necesario agrupar lasobservaciones en un numero relativamente pequeno de clases que no se interceptenentre s, de tal manera que no exista ninguna ambiguedad con respecto a la clase quepertenece una observacion en particular. El numero de observaciones que caen en unaclase recibe el nombre de frecuencia de clase (fi), mientras que el cociente de unafrecuencia de clase con respecto al numero de observaciones (n) en la muestra se conocecomo frecuencia relativa (fi/n) de la clase. Los lmites de las clases se denominanfronteras de clases, y el promedio aritmetico entre los lmites superior (Li) e inferior(Ls) recibe el nombre de marca de clase o punto medio de clase (xi).

    El numero de clase que se emplean para clasificar a un conjunto de datos depende delnumero total de observaciones. Si el numero de observaciones es relativamente pequeno,el numero a emplear sera cinco o mas. Si existe un numero sustancial de datos, elnumero de clases debe ser de quince clases o menos. Es decir, el numero de clases que sedeben tomar no debe ser mayor a quince ni menor de cinco. Un numero muy pequenode clases puede ocultar la distribucion real del conjunto de datos, mientras que unamuy numerosa puede dejar sin observaciones a algunas clases, limitando de esta formasu uso.

    Para determinar el numero aproximado de clases, tambien se puede hacer uso de laRegla de Sturges:

    k = 1 + 3.3 log n

    donde

    K es el numero de clasesn es el numero total de observaciones de la muestralog es el logaritmo comun base 10.

    Se debe dejar en claro que la Regla de Sturges es una aproximacion del numero de clases,siempre es posible tomar una mas o una menos de lo que la formula nos da.

    Una buena practica es la creacion de clases que tengan longitudes iguales. Esto puedelograrse tomando la diferencia entre los valores extremos del conjunto de los datos, loque se conoce como rango (R), y dividiendolo sobre el numero de clases, el resultado

    Humberto Barrios - [email protected]

  • 1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES 7

    sera aproximadamente la longitud para cada clase. Sin embargo, existen casos dondeesta regla no se puede aplicar o no debe aplicarse. Como ilustracion, tomemos los datosde la tabla 1, para establecer un esquema de agrupamiento para este conjunto de datosy determinar las frecuencias de clases, frecuencias relativas de clases, marcas de clasesy fronteras de clases. Agrupar los datos en clases de igual longitud.

    El rango = valor mayor - valor menor = 236 104 = 132

    Por ejemplo, si aplicamos la Regla de Sturges el numero de clases que debemos tomarsera de 8.

    Por lo tanto, la Longitud de clase = 132/8 ' 17.

    Para establecer las fronteras de cada clase, es necesario considerar la unidad mas cercanacon respecto a la cual se mide las observaciones. As, las ocho clases a considerar son:

    (103, 120], (120, 137], (137, 154], (154, 171], (171, 188], (188, 205], (205, 222], (222, 239]

    Por lo tanto, una manera de representar a un conjunto de datos es como se muestraen el siguiente cuadro, distribucion de frecuencias correspondiente a la duracion de 100bateras, seleccionadas de manera aleatoria, de la produccion de una fabrica en unasemana.

    Cuadro 1.3: Distribucion de frecuenciasLi Ls xi fi fi % Fi Fi %

    103 120 111.5 5 5 % 5 5 %120 137 128.5 4 4 % 9 9 %137 154 145.5 11 11 % 20 20 %154 171 162.5 21 21 % 41 41 %171 188 179.5 31 31 % 72 72 %188 205 196.5 14 14 % 89 86 %205 222 213.5 8 8 % 94 94 %222 239 230.5 6 6 % 100 100 %

    Donde

    Li limite inferior de la clase i-esima.Ls limite superior de la clase i-esima.xi marca de clase de la clase i-esima.fi frecuencia absoluta de la clase i-esima.fi % frecuencia porcentual de la clase i-esima.Fi frecuencia acumulada absoluta de la clase i-esima.Fi % frecuencia acumulada porcentual de la clase i-esima.

    El cuadro 1.3 de frecuencias proporciona mucha mas informacion a simple vista quelos datos originales, cuadro 1.1. En un estudio de la vida de las bateras, hay muchaspreguntas que pueden ahora responderse. Por ejemplo, Que fraccion o porcentaje delas bateras puede esperarse de la poblacion en estudio tengan una duracion entre 171a 188 das?

    Humberto Barrios - [email protected]

  • 8 Captulo 1. Estadstica Descriptiva

    Es claro, que si la muestra es el reflejo de la poblacion, o como dicen mis companerosde la UPC es representativa, entonces la respuesta es 0.31, es decir, el 31 %. Muchaspreguntas mas se pueden responder con la tabla anterior, como por ejemplo, Cuantasbateras fallaran antes de 205 horas? La respuesta a esta pregunta sera sumar todaslas frecuencias que ocurren antes de 205, esto es, sumar las frecuencias: 5 %, 4 %, 11 %,21 %, 31 %, y 14 % lo que suma 84 %. La suma de las frecuencias (fi ) de las obser-vaciones cuyos valores son menores o iguales al lmite superior de una clase dada sedenomina frecuencia acumulada (Fi). De la misma manera se definen la frecuenciaacumulada relativa (Fi/n).

    1.2.2 METODO GRAFICO

    Otra manera util de representar los datos de una muestra es a traves de graficos.El principal objetivo de la representacion grafica de las frecuencias de clases como lasfrecuencias acumuladas es mostrar el perfil de distribucion de los datos. El conocimientode este perfil es util en varias formas, para los analisis apropiados para las inferenciasestadsticas o con el fin de comparar los perfiles de dos o mas conjunto de datos.

    Histograma de frecuencias. Un histograma es una representacion grafica de los da-tos que muestra la frecuencias de los casos (valores de los datos) en categoras. Lasfrecuencias se representan para examinar la forma de la distribucion de las respuestas.El histograma de frecuencias se construye levantando rectangulos con centros en lasmarca de clases, con base de longitud igual a la longitud real del intervalo de clase(L = LS LI) y altura igual a la frecuencia de la respectiva clase, en un eje de coorde-nadas. Para la distribucion de frecuencias del cuadro 1.3, el histograma de frecuenciasfigura 2.1:

    Figura 1.1: Histograma de frecuencias

    x103 120 137 154 171 188 205 222 239

    5

    10

    15

    20

    25

    30

    f

    Polgono de frecuencias. Los polgonos de frecuencias son otra forma de representargraficamente distribuciones de clases (o distribuciones relativas de clases). Para construirun polgono de frecuencias senalamos en el eje horizontal las marcas de clases, en el

    Humberto Barrios - [email protected]

  • 1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES 9

    eje vertical las frecuencias correspondientes y en los extremos se anaden dos clasescon frecuencia cero, en un sistema de coordenadas, y conectamos con segmentos lospuntos sobre el plano. Para la distribucion de frecuencias del cuadro 1.3, el polgono defrecuencias es la figura 2.2:

    Figura 1.2: Polgono de frecuencias

    x

    103

    111.5 128.5 145.5 162.5 179.5 196.5 213.5 220.5

    239

    5

    10

    15

    20

    25

    30

    f

    Los histogramas y los polgonos de frecuencias son parecidos. Como se puede observaren los graficos anteriores. Pero se pueden senalar las ventajas de los histogramas, lasque se pueden resumir as: los rectangulos muestran cada clase de la distribucion porseparado y el area de cada rectangulo, en relacion con el resto, muestra la proporciondel numero total de observaciones que se encuentra en cada clase.

    Los polgonos, sin embargo, tambien poseen ciertas ventajas, de las cuales se puedenresaltar: el polgono de frecuencias es mas sencillo que el histograma, traza con masclaridad el perfil de patron de los datos y por ultimo, el polgono se vuelve mas liso yparecido a una curva conforme aumenta el numero de clases y el numero de observacio-nes. Un polgono como el que acabamos de describir, alisado mediante el aumento declases y de puntos de datos, se conoce como curva de frecuencias.

    Diagrama de tallo y hojas. Una variante del histograma es el diagrama de tallo y hojaque tiene la misma similitud y proposito pero que tambien proporciona una enumeracioncompleta de los valores de los datos reales. Para construirlo basta separar en cada datoel ultimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (queformara el tallo). El siguiente ejemplo ilustra la construccion del diagrama de tallo yhojas.

    Ejemplo 1.5 Utilice los datos de los tiempo de duracion del cuadro 1.1 para construirdiagrama de tallo y hojas.

    Solucion Puesto que todas las mediciones son numeros de tres dgitos, se tiene tallos

    Humberto Barrios - [email protected]

  • 10 Captulo 1. Estadstica Descriptiva

    de dos dgitos y hojas de un solo dgito. Por ejemplo, la medicion 175 tiene un tallo 17y una hoja de 5. La siguiente tabla 1.4 muestra el diagrama de tallo y hojas para losdatos.

    Cuadro 1.4: Diagrama de tallo y hojas para eltiempo duracion de 100 bateras

    10 4791812 2445914 0469011133556778916 0024455677889923334445666788818 112234455777788811234589920 00235688822 0112466946

    Ojiva. Para graficar la distribucion de frecuencias acumulada (o relativa acumulada),sobre un eje de coordenadas, se ubican los limites reales de las clases sobre el eje hori-zontal contra las frecuencias acumuladas (o relativas acumuladas) en el eje vertical y seunen todos los puntos consecutivos. Para la distribucion de frecuencias acumulada delcuadro 1.3 , la ojiva de las frecuencias acumuladas (o relativas acumuladas) es la figura2.3:

    Figura 1.3: Distribucion frecuencias acumulada

    x

    20

    40

    60

    80

    100

    F

    En este contexto el principal uso de la distribucion acumulada (o acumulada relativa) eslo que comunmente se denomina como cuantiles. Con respecto a una distribucion relativaacumulada, se define un cuantil como el valor bajo el cual se encuentra una determinadaproporcion de los valores de la distribucion. En la proxima seccion se dara una formulapara calcular los cantiles correspondiente a una distribucion de frecuencia acumulada.

    1.3 MEDIDAS NUMERICAS DESCRIPTIVAS

    Las descripciones graficas de los datos presentadas en la seccion anterior propor-cionan una informacion util respecto al conjunto de mediciones, pero no es adecuado

    Humberto Barrios - [email protected]

  • 1.3 MEDIDAS NUMERICAS DESCRIPTIVAS 11

    para hacer inferencias, sobre todo porque ninguna de las representaciones (tablas ygraficas) no estan bien definidas. Por ejemplo, se podran elaborar muchos histogramassimilares a partir del mismo conjunto de mediciones. Para poder hacer inferencias conrespecto a una poblacion, basada en la informacion contenida en una muestra y medirla confiabilidad de la inferencia, en terminos de probabilidades, se requieren cantida-des obtenidas de expresiones rigurosamente definidas para analizar la informacion dela muestra. Es posible obtener, mediante las matematicas, ciertas propiedades de esascantidades muestrales y establecer conclusiones probabilsticas con respecto a la validezde las inferencias.

    Las cantidades que se pretenden definir son medidas numericas descriptivas de un con-junto de datos. Se buscan numeros que describan la distribucion de frecuencias paracualquier conjunto de mediciones.

    Existen dos medidas de interes para cualquier conjunto de datos: la localizacion de sucentro y su variabilidad.

    1.3.1 MEDIDAS DE TENDENCIA CENTRAL

    Las medidas de tendencia central de un conjunto de datos es la disposicion de estospara agruparse ya sea alrededor del centro o de ciertos valores numericos. Existen prin-cipalmente tres medidas de tendencia central: la media, la mediana y la moda.

    Definicion 1.3.1 Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clases f1,f2, f3, . . . fk, respectivamente, en una distribucion de frecuencias. Entonces la mediaes

    x =1

    n

    ki=1

    xifi (1.1)

    Donde n = f1 + f2 + f3 + . . . + fk. En el caso, f1 = f2 = f3 = . . . = fk = 1entonces los datos se dicen no agrupados. As, la formula para la media se convierteen

    x =1

    n

    ni=1

    xi (1.2)

    La media es una medida apropiada de tendencia central para muchos conjuntos de datos.Sin embargo, dado que todas las mediciones se emplean para su calculo, el valor de lamedia puede afectarse por la existencia de algunos valores extremos.

    Definicion 1.3.2 La mediana en un conjunto de datos no agrupados, ordenados demenor a mayor, es el valor medio si el numero de datos es impar o el promedio de losdos valores centrales cuando el numero de datos es par. Se notara la mediana por x.

    Para el caso de datos agrupados o para una distribucion de frecuencias, se procedecomo sigue:

    1. Se identifica la clase mediana, la cual sera la que contiene el elemento para el

    Humberto Barrios - [email protected]

  • 12 Captulo 1. Estadstica Descriptiva

    cual la mitad de todas las observaciones es menor y la otra mitad es mayor.2. Lm = limite real inferior de la clase mediana3. fm = frecuencia de la clase mediana4. Fm1 = frecuencia acumulada anterior a la clase mediana5. c = ancho real de la clase mediana6. n = numero de observaciones en la muestra o tamano de muestra.Por consiguiente, la ecuacion para la mediana con datos agrupados sera:

    x = Lm +n2 Fm1

    fmc (1.3)

    Puesto que la mediana es un valor que se basa en la secuencia ordenada de las nmediciones, es necesario saber que la existencia de valores extremos y agregado muyalto de observaciones, no afecta su valor, en este sentido la mediana es mejor que lamedia. Generalmente los conjuntos de datos que describen informacion de ingresos caenen esta categora.

    Definicion 1.3.3 La moda para un conjunto de datos no agrupados es el valor de lasobservaciones que ocurre con mayor frecuencia. La cual notaremos por: Mo.

    Cuando los datos se encuentran agrupados en una distribucion de frecuencias, sepuede suponer que la moda esta localizada en la clase de mayor frecuencia. Paradeterminar un solo valor para la moda a partir de esta clase modal, identifica:

    1. LMo = limite real inferior de la clase modal2. 1 = frecuencia de la clase modal menos la frecuencia que se encuentra inme-

    diatamente por encima de ella3. 2 = frecuencia de la clase modal menos la frecuencia que se encuentra inme-

    diatamente por debajo de ella4. c = ancho real de la clase modal

    Entonces se utiliza la siguiente ecuacion:

    Mo = LMo +

    (1

    1 + 2

    )c (1.4)

    En muchas ocasiones en una serie de datos, puede ocurrir mas de una observacion con lamisma frecuencia. En este caso, se dice que la distribucion de frecuencias es multimodal.Como en todos los aspectos de la vida, el azar puede desempenar un papel importanteen la organizacion en un conjunto de mediciones. En ocasiones, el azar hace que unsolo elemento no representativo se repita lo suficiente para ser el valor mas frecuentedel conjunto de mediciones. Es por esta razon que rara vez se utilice la moda de unconjunto de datos no agrupados como medida de tendencia central.

    Se explicaran el calculo de la media, mediana y moda con los ejemplos siguientes:

    Ejemplo 1.6 (Para datos no agrupados). El tiempo de reparacion, medido en horas,de un instrumento electronico tiene un comportamiento aleatorio. Los tiempos de repa-racion de 16 de tales instrumentos, elegidos a traves de un mecanismo aleatorio, son lossiguientes:

    Humberto Barrios - [email protected]

  • 1.3 MEDIDAS NUMERICAS DESCRIPTIVAS 13

    5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5

    Calcular la media, mediana y moda de este conjunto de datos.

    Para calcular la media se utiliza la formula (1.2), es decir,

    x =1

    n

    ni=1

    xi =1

    16(5 + 6 + 3 + 6 + 11 + 7 + 9 + 10 + 2 + 4 + 10 + 6 + 2 + 8 + 1 + 5) = 5.94

    Para el caso de la mediana se ordenan los datos de menor a mayor, como en este casoel numero de elementos es par, la mediana sera el promedio de los dos valores centrales.

    1 2 2 3 4 5 5 6 6 6 7 8 9 10 10 11

    Es decir,

    x =6 + 6

    2= 6

    La moda en una serie de datos es el valor con mayor frecuencia, en este caso el valorcon mayor frecuencia es el 6. Entonces

    Mo = 6

    Ejemplo 1.7 (Para datos agrupados). Con la distribucion de frecuencias del cuadro ??.Calcular la media, mediana y moda.

    Solucion

    De la distribucion de frecuencias correspondiente a la duracion de 100 bateras, paracalcular la media multiplicamos las marcas de clases por las respectivas frecuencias declase y dividimos por las suma de las frecuencias. Es decir,

    x =1

    n

    Li=1

    xifi

    =1

    100[111.5(5) + 128.5(4) + 145.5(11) + 162.5(21)

    + 179.5(31) + 196.5(14) + 213.5(8) + 230.5(6)] = 174.9

    Otra manera para calcular la media es utilizando el cuadro 1.3, construyendo otracolumna resultado de multiplicar las marcas de clases por sus respectivas frecuencias, ydividir la suma de esta por la suma de las frecuencias.

    Para calcular la mediana de la distribucion de frecuencias del cuadro 1.3.

    Humberto Barrios - [email protected]

  • 14 Captulo 1. Estadstica Descriptiva

    1. Se identifica la clase mediana, la cual sera la que contiene el elemento para el cualla mitad de todas las observaciones es menor y la otra mitad es mayor. Por lotanto la clase mediana es: 171-188.

    2. Lm = limite real inferior de la clase mediana = 1713. fm = frecuencia de la clase mediana = 314. Fm1 = frecuencia acumulada anterior a la clase mediana=215. c = ancho real de la clase mediana =146. n = numero de observaciones en la muestra o tamano de muestra = 100.

    Por consiguiente, la ecuacion para la mediana con datos agrupados sera:

    x = Lm +

    ( n2 Fm1

    fm

    )c = 171 +

    (50 41

    31

    )(17) = 175.9

    Para determinar el valor para la moda, identificamos la clase modal es: 171-188.

    1. LMo = lmite real inferior de la clase modal= 1712. 1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmedia-

    tamente por encima de ella = 31-21 = 103. 2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmedia-

    tamente por debajo de ella = 31 -14=174. c = ancho real de la clase modal = 17

    Entonces se utiliza la siguiente ecuacion:

    Mo = LMo +

    (1

    1 + 2

    )c = 171 +

    (10

    10 + 17

    )(17) = 177.3

    Cuando se trabaja un problema en estadstica, se debe decidir cual de las medidas detendencia central se va ha utilizar. Por ejemplo, si la distribucion es simetrica, es claroque en este caso solo tienen una moda. Por lo tanto el mismo valor para la media,la mediana y la moda. En tales casos, no es necesario escoger la medida de tendenciacentral, pues ya esta hecha la seleccion, cualquiera de ellas es una buena opcion.

    En una distribucion sesgada positiva. Es decir, sesgada hacia la derecha, la moda seencuentra en el punto mas alto de la distribucion, la mediana esta a la derecha de lamoda y la media se encuentra todava mas a la derecha de la moda y la mediana. Esdecir, se tiene la siguiente relacion:

    Mo < x < x

    En una distribucion sesgada negativa. Es decir, sesgada hacia la izquierda, la moda seencuentra en el punto mas alto de la distribucion, la mediana esta hacia la izquierda dela moda y la media se encuentra todava mas a la izquierda de la moda y la mediana.Es decir, se tiene la siguiente relacion:

    Mo > x > x

    Cuando la poblacion esta sesgada negativamente o positivamente, con frecuencia lamediana resulta ser la mejor medida de posicion, debido a que siempre esta entre lamoda y la media. La mediana no se ve influida por la frecuencia de aparicion de un solovalor como es el caso de la moda, ni se distorsion con la presencia de valores extremoscomo la media.

    Humberto Barrios - [email protected]

  • 1.3 MEDIDAS NUMERICAS DESCRIPTIVAS 15

    En cualquier otro caso, no existen reglas universales para la aplicacion de la media, lamediana o la moda como medidas de tendencia central para diferentes poblaciones. Cadacaso debera considerarse de manera independiente, de acuerdo con las lneas generalesque se ha analizado.

    1.3.2 MEDIDAS DE DISPERSION

    Las medidas de tendencia central de un conjunto de mediciones solamente localizanel centro de la distribucion de los datos. Por si mismo, no ofrecen una descripcionadecuada de los datos. Por ejemplo, dos conjuntos de mediciones podran tener susdistribuciones de frecuencias muy diferentes pero con la misma media. La diferenciasentre dos distribuciones, puede estar en variacion o dispersion a ambos lados de lamedia. Una descripcion adecuada de los datos requiere de la definicion de una medida devariabilidad de los datos. La medida mas comun de variabilidad usada en la estadsticaes la varianza, que es una funcion de las desviaciones (o distancia) de las medicionescon respecto a su media.

    Definicion 1.3.4 Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clasesf1, f2, f3, . . . fk, respectivamente, en una distribucion de frecuencias. Entonces lavarianza es

    s2 =1

    n 1

    ki=1

    (xi x)2fi (1.5)

    Donde n = f1 + f2 + f3 + . . .+ fk. En el caso, f1 = f2 = f3 = . . . = fk = 1 entonceslos datos se dicen no agrupados. As, la formula para la varianza se convierte en

    s2 =1

    n 1

    ni=1

    (xi x)2 (1.6)

    La varianza es util en la comparacion de la variacion relativa de dos conjuntos demediciones, pero solo aporta informacion con respecto a la variacion en un solo conjuntocuando se interpreta en terminos de la desviacion estandar. La desviacion estandar deun conjunto de medidas es la raz cuadrada positiva de la varianza, es decir,

    s =s2 (1.7)

    La varianza y la desviacion estandar no son medidas de variabilidad distintas, debidoa que la ultima no puede determinarse a menos que se conozca la primera. A menudose prefiere la desviacion estandar en relacion con la varianza, porque se expresa en lasmismas unidades fsicas de las observaciones.

    Otra medida util de la variabilidad tiene base en el valor absoluto de las diferenciasentres el conjunto de mediciones y la media o la mediana, dependiendo de cual de lasdos se emplee como medida de tendencia central.

    Humberto Barrios - [email protected]

  • 16 Captulo 1. Estadstica Descriptiva

    Definicion 1.3.5 Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clasesf1, f2, f3, . . . fk, respectivamente, en una distribucion de frecuencias. Entonces ladesviacion media esta dada por

    DM =1

    n

    ki=1

    |xi x|fi (1.8)

    Donde n = f1 + f2 + f3 + . . .+ fk. En el caso, f1 = f2 = f3 = . . . = fk = 1 entonceslos datos se dicen no agrupados. As, la formula para la desviacion media esta seconvierte en

    DM =1

    n

    ni=1

    |xi x| (1.9)

    Cuando se sustituye la media por la mediana en (1.8) y (1.9) se obtiene la desviacionmediana, la que se notara por DMd.

    La desviacion media es una medida de la variacion de un conjunto de mediciones, es-pecialmente en el contexto de la evidencia emprica, debido a que en muchas ocasionesel interes se centra en las desviaciones y no en los signos de estas. Sin embargo, desdeun punto de vista teorico, el empleo de desviacion media como medida de dispersionesta en desventaja dado que, matematicamente, es difcil de obtener. De cualquiera ma-nera, la desviacion media es menos sensible a los efectos inducidos por las observacionesextremas del conjunto de datos que la varianza o la desviacion estandar. Sin importarla presencia de pocos valores extremos, la desviacion media puede proporcionar unamedida de dispersion mucho mas real que la obtenida por la desviacion estandar.

    Cuando la mediana se utiliza como medida de tendencia central con el proposito deamortiguar los efectos de la existencia de algunos valores extremos en el conjunto demediciones, debe preferirse a la desviacion mediana como una medida de dispersion porla misma razon, es decir, con la intencion amortiguar los efectos de la existencia devalores extremos en el conjunto de mediciones.

    A continuacion se ilustran los pasos que se deben seguir para los calculos de la varianza,desviacion estandar, desviacion media y desviacion mediana, para los datos no agrupadosdel ejemplo 1 y para los datos agrupados de la tabla 2.

    Ejemplo 1.8 El tiempo de reparacion, medio en horas, de un instrumento electronicotiene un comportamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumen-tos, elegidos a traves de un mecanismo aleatorio, son los siguientes:

    5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5

    Calcular la varianza, desviacion estandar, desviacion media y desviacion mediana deeste conjunto de datos.

    Solucion

    Para la varianza se tiene

    Humberto Barrios - [email protected]

  • 1.3 MEDIDAS NUMERICAS DESCRIPTIVAS 17

    s2 =1

    n 1

    ni=1

    (xi x)2

    =1

    16 1[(5 5.94)2 + (6 5.94)2

    + (3 5.94)2 + (6 5.94)2 + (2 5.94)2

    + (4 5.94)2 + (11 5.94)2 + (7 5.94)2

    + (9 5.94)2 + (10 5.94)2 + (10 5.94)2

    + (6 5.94)2 + (2 5.94)2 + (8 5.94)2

    + (1 5.94)2 + (5 5.94)2]= 9.53

    La desviacion estandar es

    s =

    9.5333 = 3.0876

    Para la desviacion media se tiene

    DM =1

    n

    ni=1

    |xi x|

    =1

    16[|5 5.94|+ |6 5.94|+ |3 5.94|+ |6 5.94|

    + |2 5.94|+ |4 5.94|+ |11 5.94|+ |7 5.94|+ |9 5.94|+ |10 5.94|+ |10 5.94|+ |6 5.94|+ |2 5.94|+ |8 5.94|+ |1 5.94|+ |5 5.94|= 2.445

    Para la desviacion mediana se tiene

    DMd =1

    n

    ni=1

    |xi x|

    =1

    16[|5 6|+ |6 6|+ |3 6|+ |6 6|

    + |2 6|+ |4 6|+ |11 6|+ |7 6|+ |9 6|+ |10 5.94|+ |10 6|+ |6 6|+ |2 6|+ |8 6|+ |1 6|+ |5 6|= 2.4375

    Ejemplo 1.9 Con la distribucion de frecuencias de la tabla 2. Calcular la varianza,desviacion estandar, desviacion media y desviacion mediana.

    Solucion

    Humberto Barrios - [email protected]

  • 18 Captulo 1. Estadstica Descriptiva

    Cuadro 1.5: Medidas descritivas en una distribucionxi fi xifi (xi x)2fi |xi x|fi |xi x|fi

    111.5 5 557.5 20104.1 317.0 322.0128.5 4 514.0 8615.6 185.6 189.6145.5 11 1600.5 9514.4 323.5 334.4162.5 21 3412.5 3234.2 260.6 281.4179.5 31 5564.5 653.1 142.3 111.6196.5 14 2751.0 6525.8 302.3 288.4213.5 8 1708.0 11913.5 308.7 300.8230.5 6 1383.0 18541.5 333.5 327.6

    Total 100 17491.0 79102.0 2174.0 2156.0

    Utilicemos el cuadro 1.5, para la varianza, desviacion estandar, desviacion media ydesviacion mediana. Por lo tanto la

    varianza es: s2 = 799.0

    Desviacion estandar es: s = 28.26

    Desviacion media es: D.M. = 21.74

    Desviacion mediana es: D.Md. = 21.56.

    1.3.3 OTRAS MEDIDAS DESCRIPTIVAS

    El principal uso de la distribucion acumulada es lo que comunmente se conoce comocuantiles. Con respecto a una distribucion de frecuencias relativa acumulada, se defineun cuantil como el valor bajo el cual se encuentra una determinada proporcion de losvalores de la distribucion. Para identifica la clase cuantil, la cual sera la que contieneel elemento para el cual la proporcion 100q% de todas las observaciones es menor y laotra proporcion 100(1 q) % es mayor en una distribucion de frecuencias.

    Definicion 1.3.6 Para calcular el cuantil q se utiliza la siguiente formula

    xq = Lq +nq Fq1

    fqc (1.10)

    1. Se identifica la clase cuantil, la cual sera la que contiene el elemento para elcual la q% de todas las observaciones es menor y la otra (100 q) % es mayor.

    2. Lq = limite real inferior de la clase cuantil3. fq = frecuencia de la clase cuantil4. Fq1 = frecuencia acumulada anterior a la clase cuantil5. c = ancho real de la clase cuantil6. n = numero de observaciones en la muestra o tamano de muestra.

    Definicion 1.3.7 Una medida que compara la dispersion relativa de dos distribucionesde frecuencias es el coeficiente de variacion, que esta definido por:

    cv =s

    x100 % (1.11)

    Humberto Barrios - [email protected]

  • 1.3 MEDIDAS NUMERICAS DESCRIPTIVAS 19

    Los cantiles comunmente mas utilizados son los percentiles, deciles y cuartiles. Lospercentiles son los puntos que dividen a la distribucion de frecuencias en 100 paresiguales, cada uno con una frecuencia relativa q = 0.01; los deciles y cuartiles son lospuntos que dividen a la distribucion de frecuencias en 10 y 4 partes iguales, cada unocon frecuencia relativa q = 0.1 y q = 0.01, respectivamente. Notese que la mediana esel cincuentavo percentil, el quinto decil y el segundo cuartil.

    Definicion 1.3.8 La diferencia entre los percentiles 90 avo y 10 avo recibe el nombrede recorrido interdecil.

    Definicion 1.3.9 La diferencia entre los percentiles 75avo y 25avo recibe el nombre derecorrido intercuartil.

    En este contexto el recorrido interdecil es una medida de la dispersion del 80 % de ladistribucion de frecuencia, en tanto que el recorrido intercuartil refleja la variacion del50 % de la distribucion de frecuencia. En ambos casos, al excluir los efectos de los valoresextremos de la distribucion de frecuencia, se tiene la capacidad de medir la variabilidaddel conjunto de mediciones de la mitad de una distribucion de frecuencia.

    Los recorridos interdecil e intercuartil, son dos medidas de dispersion que se emplean endisciplinas como educacion, economa, finazas e ingeniera. El recorrido interdecil se em-plea muchas veces en pruebas educacionales para medir la variabilidad en el desempenosin importar los valores por arriba o por debajo de un 10 % de un valor predeterminado.El recorrido intercuartil se emplea en muchas ocasiones, en economa y finanzas, paramedir la variabilidad de un conjunto de mediciones de una proporcion de su distribucionde frecuencia.

    El coeficiente de variacion expresa la magnitud de la dispersion de un conjunto demediciones con respecto a la media, es una medida estandarizada de la variacion conrespecto a la media, especialmente util para comparar dos distribuciones de frecuenciascuando la escala de medicion difiere de manera apreciable entre estas. Es decir, como elcoeficiente de variaciones la razon de dos promedios, es independiente de las unidadesde medidas usadas, por ejemplo, da igual que se usen libras o gramos para medir elpeso.

    Ejemplo 1.10 . Para la distribucion de frecuencia de la Tabla 2. Calcular los recorridointerdecil, recorrido intercuartil y el coeficiente de variacion.

    Solucion Las clases percentiles 10ava y 90ava son respectivamente (137, 154] y (205, 222],entonces para calcular a x0.1 se tiene:

    1. Se identifica la clase cuantil, la cual sera la que contiene el elemento para el cualla q% de todas las observaciones es menor y la otra (100 q) % es mayor.

    2. Lq = limite real inferior de la clase 10ava = 1373. fq = frecuencia de la clase 10ava = 114. Fq1 = frecuencia acumulada anterior a la clase cuantil =95. c = ancho real de la clase cuantil =176. n = numero de observaciones en la muestra o tamano de muestra =100.

    Humberto Barrios - [email protected]

  • 20 Captulo 1. Estadstica Descriptiva

    Se utiliza la siguiente formula:

    xq = Lq +nq Fq1

    fqc = 137 +

    0.1(100) 911

    (17) = 138.5

    De la misma manera se calcula x0.9,

    xq = Lq +nq Fq1

    fqc = 205 +

    0.9(100) 868

    (17) = 213.5

    As, el recorrido interdecil es = 213.5-138.5 = 75.

    De igual forma se realizan los calculos para el recorrido intercuartil.

    El coeficiente de variacion es:

    cv =s

    x100 =

    28.26

    174.91(100) = 16 %

    Observese 1.5 que los valores de las medidas de tendencias central se encuentran muycerca entre si, tambien se puede afirmar lo mismo de las desviaciones estandar, mediay mediana. Sin embargo, no es de esperar que todas las distribuciones de frecuenciatengan este comportamiento.

    Estas comparaciones aclaran lo que las medidas numericas y las distribuciones de fre-cuencia pueden hacer para descubrir la naturaleza inherente de un conjunto de medi-ciones. En consecuencias, el usuario debe tener cuidado tanto en la eleccion como en lainterpretacion de estas medidas. A pesar que la media y la desviacion estandar se hanempleado de manera extensa como medidas de tendencia central y dispersion respec-tivamente, aunque tiene propiedades matematicas muy interesantes existen problemaspara los cuales no puede ser las medidas mas deseables. Para conjuntos de medicionesfsicas como lecturas de instrumentos, especificaciones de partes, pesos, etc., la mediay la desviacion estandar o desviacion media, son medidas anheladas. Para conjunto demediciones afines con ingresos y otras informaciones de tipo economico y financieros,la mejor eleccion para la medida de tendencia central y dispersion son la media y ladesviacion de la mediana respectivamente.

    En muchas investigaciones de tipo economico y social proporcionan informacion entablas de frecuencia que no solo contienen clases de diferentes amplitudes sino tambienclases abiertas como mayores que o menor que con el proposito de tener mayor coberturade los datos. Estas clases se presentan en los extremos de la distribucion de frecuenciay no se especifica los lmites de las clases. Como resultado, no se encuentra definidoel punto medio de la clase abierta y en consecuencias no se puede calcular la media,varianza, desviacion estandar y desviacion media, a menos que se conozca un valorparticular de la clase o que sea conocido su promedio aritmetico.

    1.4 EJERCICIOS

    1. Los siguientes datos son los tiempos, en minutos, correspondiente a una muestraaleatoria de 50 personas que estuvieron cobrando un cheque, un fin de mes en unbanco de la cuidad

    Humberto Barrios - [email protected]

  • 1.4 EJERCICIOS 21

    17 16 39 30 23 38 32 20 43 32

    44 41 23 17 29 26 21 34 44 24

    21 27 36 21 17 28 29 34 24 28

    25 29 45 23 16 34 20 30 23 35

    35 27 19 31 45 40 14 29 23 19

    a) Construir una distribucion de frecuencias, de clases, relativa, acumulada yrelativa acumulada.

    b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar,

    desviacion media, desviacion mediana, y los recorridos intercuartil e interde-cil.

    2. Con los siguiente tres conjuntos de datos:

    1 2 3 4 5 6

    1 1 1 6 6 6

    13 2 3 4 5 20

    Calcular la media y la varianza para cada conjunto de datos. Que se puedeconcluir?

    3. Con los datos del ejercicio 1, sea xi el tiempo que gasta el i-esimo cliente en cobrarun cheque para i = 1, 2, . . . , 50. Transformar los datos por medio de la relacion

    zi = (xi 28.2)/8.928Con los datos transformados

    a) Construir una distribucion de frecuencias, de clases, relativa, acumulada yrelativa acumulada.

    b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar,

    desviacion media, desviacion mediana, y los recorridos intercuartil e interde-cil.

    d) Ha ocurrido algun cambio en la naturaleza de la distribucion de frecuenciacuando esta se compara con los del ejercicio 1?

    4. Los datos que tienen una distribucion acampanada tienen caractersticas bien defi-nidas con respecto a la variacion, que se puede expresar en el siguiente enunciado:Regla emprica. Para una distribucion de mediciones que es aproximadamenteacampanada (forma normal), el intervalo( , + ) Contiene aproximadamente el 68 % de las mediciones( 2, + 2) Contiene aproximadamente el 95 % de las mediciones( 3, + 3) Contiene casi todas las mediciones

    Donde y son la media poblacional y desviacion estandar poblacional respec-tivamente.

    Calcular el intervalo (x k, x + k) para k =1, 2, y 3, del ejercicio 1, cuentael numero de mediciones que se ubican dentro de cada intervalo y compara estosresultados con el numero que podra esperarse de acuerdo a la regla emprica.

    Humberto Barrios - [email protected]

  • 22 Captulo 1. Estadstica Descriptiva

    5. Los siguientes datos agrupados representan las ventas ($1000) de 50 tiendas, se-leccionadas aleatoriamente del municipio de Valledupar, de un da cualquiera dela semana.

    Clases Frecuencias

    110-186 4187-263 14264-340 11341-417 9418-494 7495-571 1572-648 2649-727 2

    a) Construir una distribucion de frecuencia acumulada y relativa acumulada.b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.c) Calcular la media, mediana, moda, desviacion estandar, desviacion media,

    desviacion mediana, y los recorridos intercuartil e interdecil.La regla emprica senala que se puede aproximar la desviacion estandar de unconjunto de mediciones por una cuarta parte del rango. Calcule esta aproximacionpara la desviacion estandar en los conjunto de datos de la tabla 1 y del ejercicio1.

    6. Las siguiente tres propiedades son importante cuando se emplea el smbolo de lasumatoria.

    a)ni=1

    c = nc

    b)ni=1

    cxi = cni=1

    xi

    c)ni=1

    (xi + yi) =ni=1

    xi +ni=1

    yi

    1. Demostrar las siguientes identidades algebraicas:

    a)ni=1

    (xi x) = 0

    b) s2 = 1n1

    [ki=1

    x2i fi nx2]

    2. Demuestre que la funcion

    h(y) =

    ni=1

    (xi y)2

    Tiene un mnimo en x . Utilice sus conocimientos de Calculo Diferencial.7. Sea k 1. Demuestre que para cualquier conjunto de n mediciones, la fraccion

    que queda incluida en el intervalo (x ks, x+ ks) es por lo menos (1 1k2

    ). Esteresultado se conoce con el nombre de teorema de Tchbysheff.

    8. Supongamos que tenemos las siguientes medias: x1 = 37, x2 = 41 y x3 = 28,basadas en 50, 20 y 10 observaciones respectivamente. Si hay que escoger unasola media, Cual sera su eleccion? Por que? Cuales son los totales de lasmuestras originales? Como se usara estos totales para hallar la media de las 80observaciones?

    Humberto Barrios - [email protected]

  • 1.4 EJERCICIOS 23

    9. Sea x1, x2, . . . , xn una muestra aleatoria de una poblacion. Demuestre que

    max1in

    |xi x| 0. Entoncesla probabilidad condicional del evento A, dado que el evento B ocurrio, se define comola razon

    P (A|B) = P (A BP (B)

    .

    De la misma manera se define

    P (B|A) = P (A BP (A)

    .

    Tambien de la definicion de probabilidad condicional se obtiene lo que se conoce comoteorema de multiplicacion

    P (A B) = P (A|B)P (B) = P (B|A)P (A).

    Ejemplo 2.6 Supongamos que en una oficina hay 100 maquinas calculadoras. Algunasde esas maquinas son electricas (E), mientras otras son manuales (M). Ademas, algunasson nuevas (N), mientras otras son usadas (U). La siguiente tabla da el numero demaquinas de cada categora.

    E M Total

    N 40 30 70

    U 20 10 30

    Total 60 40 100

    Una persona entra a la oficina, escoge una maquina al azar y descubre que es nueva.Cual es la probabilidad de que sea electrica?Solucion. Se sabe que la persona escogio una maquina nueva de la 70 y se tienen 40,por lo tanto

    P (E|N) = 47.

    Otra forma es calcular la probabilidad que se nueva y electrica,

    P (E N) = 0.40 y P (N) = 0.70.

    Entonces

    P (E|N) = P (E N)P (N)

    =0.40

    0.70=

    4

    7.

    Ejemplo 2.7 Considerese las familias que tienen dos hijos y supongamos que varonesy mujeres son igualmente probables. Si se escoge una familia al azar y en la familia hayun hijo varon cual es la probabilidad de que el otro sea varon?Solucion. En este caso el espacio muestral es

    = {(v, v), (v,m), (m, v), (m,m)}.

    Donde v es varon, m es mujer y el orden del par es el orden de los nacimientos. Cadauno de los puntos tiene la probabilidad 14 . Sean los eventos A: uno de los hijos es varony B: ambos son varones, entonces

    Humberto Barrios - [email protected]

  • 36 Captulo 2. PROBABILIDAD

    A = {(v, v), (v,m), (m, v)}

    y

    B = {(v, v)}

    como B A entonces B = A B. Por lo tanto

    P (A|B) = P (A B)P (B)

    =1

    3.

    Definicion 2.4.2 Se dice que los eventos B1, B2, B3, B4, . . . Bn representa una particiondel espacio muestral si:

    1. Bi Bj = para todo i 6= j.

    2.ni=1

    Bi =

    3. P (Bi) > 0 para todo i = 1, 2, 3, . . . , n.

    Teorema 2.4.1 Teorema de la Probabilidad Total. Sea B1, B2, B3, . . . , Bn una parti-cion del espacio muestral y A un evento de . Entonces

    P (A) =

    ni=1

    P (A|Bi)P (Bi).

    Demostracion. Es facil observar en la figura 2.4 que A es la union disjunta de elementosde , como se muestra en la siguiente grafica.

    Figura 2.4: Particion de

    B1

    B2

    B3

    Bn

    A

    Esto es:

    A = (A B1) (A B2) (A B3) . . . (A Bn)

    donde

    (A B1) (A B2 = ; para todo i 6= j

    entonces

    P (A) =ni=1

    P (A Bi) (2.9)

    Humberto Barrios - [email protected]

  • 2.4 PROBABILIDAD CONDICIONAL 37

    pero tenemos que para i = 1, 2, . . . , n

    P (A Bi) = P (A|Bi)P (Bi) (2.10)

    sustituyendo (2.10) en (2.9), se obtiene

    P (A) =

    ni=1

    P (A|Bi)P (Bi).

    Ejemplo 2.8 Cierto artculo se hace en una de tres fabricas, digamos 1,2 y 3. Se sabeque la primera produce el doble de artculos que la segunda. Tambien se sabe que lasegunda y la tercera producen el mismo numero de artculo(durante un periodo deproduccion especfico). Se conoce tambien que el 2 % de los artculos producidos porcada una de las dos primeras son defectuosos; mientras que 4 % de los manufacturadospor la tercera son defectuosos. Todos los artculos se colocan en una fila y se escoge unoal azar.

    1. Cual es la probabilidad de que este artculo sea defectuoso?2. Si las tres fabricas producen 10000 artculos Cual es el numero de artculos de-

    fectuosos que produce cada fabrica?3. Si se sabe que el artculo es defectuoso Cual es la probabilidad de que este articulo

    proceda de la fabrica dos?Solucion. Definamos

    1. los siguientes eventos:

    A = {el artculo es defectuoso}B1 = {el artculo proviene de la fabrica 1}B2 = {el artculo proviene de la fabrica 2}B3 = {el artculo proviene de la fabrica 3}.

    Entonces para i = 1, 2, 3

    (A B1) = {el articulo es defectuoso y proviene de la fabrica i}

    Luego

    A = (A B1) (A B2) (A B3)

    por otra parte se tiene que

    P (A|B1) = 0.02P (A|B2) = 0.02P (A|B3) = 0.04P (B1) = 0.5

    P (B2) = 0.25

    P (B3) = 0.25.

    Humberto Barrios - [email protected]

  • 38 Captulo 2. PROBABILIDAD

    Figura 2.5:

    P(B

    1) =

    37

    P (B2|B1

    ) =69P (B1 B2) = P (B2|B1)P (B1) = 1863

    P (O2 |B

    1) = 39

    P (B1 O2) = P (O2|B1)P (B1) = 963

    P(O1 ) =

    47

    P (B2 |O

    1) = 59

    P (O2|O1

    ) =49P (O1 O2) = P (O2|O1)P (O1) = 1663

    P (B2 O1) = P (B2|O1)P (O1) = 2063

    Reemplazando los valores anteriores en

    P (A) = P (A|B1)P (B1) + P (A|B2)P (B2) + P (A|B3)(B3)se obtiene

    P (A) = (0.02)(0.5) + (0.02)(0.25) + (0.04)(0.25) = 0.025.

    Por lo tanto la probabilidad que un artculo sea defectuoso es 0.025.Los puntos 2. y 3. se dejan al lector.

    Ejemplo 2.9 Supongase que tenemos una urna con cuatro monedas de oro y tres debronce, y una segunda urna contiene tres de oro y cinco de bronce. Las monedas en lasdos urnas son todas identicas. Se selecciona una moneda de la primera urna y se colocasin verla en la segunda urna. Cual es la probabilidad de que ahora se seleccione unamoneda de bronce de la segunda?

    Solucion. Sean B1 y B2, la seleccion de una moneda de bronce de la urna 1 y unamoneda de bronce de la segunda urna respectivamente, y O1 una moneda de oro de laurna 1. Debemos calcular la probabilidad de la union de los eventos B1 B2 y O1 B2.Las diferentes posibilidades que se pueden dar se muestran el diagrama de arbol, figura2.5. Entonces

    Por lo tanto, la probabilidad se seleccionar una moneda de bronce de la segundaurna es:

    P (B2) = P ((B1 B2) (O1 B2))= P (B1 B2) + P (O1 B2)= P (B2|B1)P (B1) + P (B2|O1)P (O1)

    =18

    63+

    20

    63=

    38

    63.

    Humberto Barrios - [email protected]

  • 2.4 PROBABILIDAD CONDICIONAL 39

    Teorema 2.4.2 Teorema de Bayes. Sea B1, B2, B3, . . . , Bn una particion del espaciomuestral . Para cualquier evento A de , done P (A) > 0 y cualquier j, 1 j n.Entonces

    P (Bj |A) =P (A|Bj)P (Bj)ni=1

    P (A|Bi)P (Bi).

    Demostracion. Por la definicion de probabilidad condicional se tiene

    P (Bj |A) =P (A Bj)P (A)

    (2.11)

    Por otra parte se tiene que

    P (Bj A) = P (A | Bj)P (Bj) (2.12)

    por teorema de la probabilidad total

    P (A) =ni=1

    P (A | Bi)P (Bi) (2.13)

    reemplazando (2.12) y (2.13) en (2.11) se obtiene

    P (Bj |A) =P (A | Bj)P (Bj)ni=1

    P (A|Bi)P (Bi).

    Ejemplo 2.10 Supongamos que varias cajas son de dos tipos B1 y B2 . El tipo B1contiene 70 % de caramelos dulces y 30 % de caramelos acidos, mientras que el tipo B2dicho porcentaje esta invertido. Supongamos ademas que el 60 % de todas las cajas sondel tipo B1 , mientras que el resto son del tipo B2. Si se escoge un caramelo dulce alazar de una caja desconocida. Decidir de que tipo proviene.

    Solucion. Se tienen dos tipos de cajas B1 y B2 con probabilidades de seleccion

    P (B1) = 0.60

    y

    P (B2) = 0.40.

    Sea los eventos

    D = conjunto de caramelos dulces

    A = conjunto de caramelos acidos

    por otra parte se tiene que

    Humberto Barrios - [email protected]

  • 40 Captulo 2. PROBABILIDAD

    P (D|B1) = 0.70P (D|B2) = 0.30P (A|B1) = 0.30P (A|B2) = 0.70.

    As

    P (B1|D) =P (D|B1)P (B1)

    P (D|B1)P (B1) + P (D|B2)P (B2)=

    (0.7)(0.6)

    (0.7)(0.6) + (0.3)(0.4)=

    7

    9

    y

    P (B2|D) =P (D|B2)P (B2)

    P (D|B1)P (B1) + P (D|B2)P (B2)=

    (0.3)(0.4)

    (0.7)(0.6) + (0.3)(0.4)=

    2

    9

    Por lo tanto se decide a favor de los caramelos que provienen de las cajas B1.

    2.5 EVENTOS INDEPENDIENTESDefinicion 2.5.1 Los eventos A1, A2, A3, . . . , An de se dicen independientes si paratodo conjunto de ndices i1, i2, i3, . . . , ik entre 1 y n se tiene que

    P (Ai1 Ai2 Ai3 . . . Aik) = P (Ai1)P (Ai2)P (Ai3) . . . P (Aik).

    En particular, los eventos A y B son eventos independientes en , si

    P (A B) = P (A)P (B).

    Es facil verificar que los eventos y son independientes.

    Ejemplo 2.11 Un lote de diez objetos contiene cuatro defectuosas y seis en buen estado.Se extraen dos objetos sucesivamente y sin reemplazo. Sea

    D1 = {el primer objeto es defectuoso}D2 = {el segundo objeto es defectuoso}

    1. Son independientes estos eventos?2. Que sucede si los objetos se extraen con reemplazo?

    Solucion. Si D1, el primer objeto es defectuoso, entonces

    P (D1) =2

    5

    y la probabilidad del evento D2 el segundo objeto es defectuoso, es

    Humberto Barrios - [email protected]

  • 2.5 EVENTOS INDEPENDIENTES 41

    P (D2) = P (D2|D1)P (D1) + P (D2|Dc1)P (Dc1) =1

    3

    2

    5+

    4

    9

    3

    5=

    2

    5.

    Por otra parte, la probabilidad de D2 dado que ocurrio D1 es:

    P (D2|D1) =3

    9

    de lo cual se tiene que

    P (D2|D1) 6= P (D2)

    En el segundo caso se tiene

    P (D1) = P (D2) =2

    5

    y

    P (D1 D2) = P (D1)P (D2) =4

    25.

    Por lo tanto, si la seleccion se realiza con reemplazo los eventos son independientes.

    Si A1, A2, A3, . . . , An son eventos tales que Ai1 , Ai2 , Ai3 , . . . , Aik son independientespara todos los indices distintos i1, i2, . . . , ik, k = 1, 2, . . . , n 1, de esto no se sigue que

    A1, A2, A3, . . . , An

    son independientes. Por ejemplo, se el lanzamiento de una moneda dos veces, ysignemos una probabilidad de 1/4 a cada resultado de = {cc, cs, sc, ss}. Sean loseventos

    A = {cc, cs}B = {cc, sc}C = {cc, ss}

    Entonces se tiene

    P (A B) = P ({cc}) = 14 = P (A)P (B) =1212

    P (A C) = P ({cc}) = 14 = P (A)P (C) =1212

    P (B C) = P ({cc}) = 14 = P (B)P (C) =1212

    pero

    P (A B C) = P ({cc}) = 146= 1

    8= P (A)P (B)P (C) =

    1

    2

    1

    2

    1

    2.

    Entonces A y B, A y C, B y C son independientes pero A, B y C no lo son.

    Inversamente, si P (A1 A2 . . . An) = P (A1)P (A2) . . . P (An), esto no implica que

    P (Ai1 Ai2 . . . Aik) = P (Ai1)P (Ai2) . . . P (Ain)

    Humberto Barrios - [email protected]

  • 42 Captulo 2. PROBABILIDAD

    cuando k < n. Por ejemplo, supongamos el lanzamiento de dos dados. Es claro, que elespacio muestral es conjunto formado por todas las parejas (i, j), i, j = 1, 2, 3, 4, 5, 6con probabilidad 1/36. Sean los siguientes eventos

    A = {el segundo dado muestra 1, 2, o 5}B = {el segundo dado muestra 4, 5 , o 6}B = {la suma de las dos caras sea nueve}

    En este caso, es facil ver que

    P (A B) 6= P (A)P (B)P (A C) 6= P (A)P (C)P (B C) 6= P (B)P (C)

    pero

    P (A B C) = P (A)P (B)PC).

    Por lo tanto los eventos A, B y C no son independientes.

    Ejemplo 2.12 El siguiente circuito (figura 2.6) funciona si y solo si hay un caminoen el cual todos los dispositivos funcionan de izquierda a derecha. Suponga que losdispositivos funcionen de forma independiente y que la probabilidad de que funcione undispositivo es como se muestra en la grafica.

    1. Cual es la probabilidad de que el circuito funcione?2. Cual es la probabilidad de que el no circuito funcione?

    Figura 2.6:

    0.90 0.90

    0.97

    0.98

    0.98

    0.99

    A1 A2

    A3

    A4

    A5

    A6

    Solucion. Para solucionar este problema procedemos como sigue:1. La trayectoria de A1 a A2 funciona si y solo si los dispositivos A1 y A2 funcionan

    simultaneamente. Por lo tanto, la probabilidad de que funciona, dado que losdispositivos funcionan de manera independiente, es:

    P (A1 A2) = P (A1)P (A2) = (0.90)(0.90) = 0.81

    Humberto Barrios - [email protected]

  • 2.6 EJERCICIOS 43

    Figura 2.7:

    0.81

    0.97

    0.98

    0.98

    0.99

    A1

    A3

    A4

    A5

    A6

    As, se tiene el siguiente circuito equivalente al dado en la figura 2.6Por otra parte, la trayectoria del rectangulo en el circuito de la 2.7 funciona si losdispositivos A1 o A3 funciones, es decir, no funciona si y solo si los dispositivosA1 y A3 no funcionan simultaneamente. En consecuencia, la probabilidad que nofuncione es:

    P (Ac1Ac3) = P (Ac1)P (Ac3) = (1P (Ac1))(1P (Ac3)) = (10.81)(10.97) = 0.0057

    Luego la probabilidad que funcione la trayectoria del rectangulo es:

    P (A1 A3) = 1 P ((A1 A3)c) = 1 P (Ac1 Ac3) = 1 0.0057 = 0.9943

    De manera similar se resuelve para el caso de la trayectoria compuesta por elcuadrado

    P (A4 A5) = 1 (1 P (Ac4))(1 P (Ac5)) = 0.9996

    Resumiendo lo anterior se llega al circuito

    Figura 2.8:

    0.994 0.999 0.990

    A1 A2 A3

    Para que el circuito de la figura 2.8 funcione es necesario que los tres dispositivosfunciones simultaneamente, y por ser independientes, la probabilidad que funcioneel circuito es:

    P (A1 A2 A3) = P (A1)P (A2)P (A3) = 0.983.

    2. La probabilidad que no funcione el circuito de la figura 2.6 es: 0.017.

    2.6 EJERCICIOS

    1. Supongamos que se lanzan tres monedas perfectas y se observa el resultado de lascaras que quedan hacia arriba.

    Humberto Barrios - [email protected]

  • 44 Captulo 2. PROBABILIDAD

    a) Establezca los puntos muestrales de este experimento.b) Asigne una probabilidad razonable a cada punto.c) Sea A el evento de observar exactamente una cara y B el evento de observar

    al menos una cara. Obtenga los puntos muestrales de los eventos A y B.d) De la respuesta de (c), calcular P (A), P (B), P (AB), P (AB) y P (AcB).

    2. Cuatro administradores de empresa solicitan dos puestos en una compana. Unoy solamente uno de los aspirantes es miembro de una etnica de la Sierra Nevadade Santa Marta. Los puestos se otorgan seleccionado aleatoriamente dos de losaspirantes.

    a) Establezca los puntos muestrales de este experimento.b) Asigne las probabilidades a los resultados del espacio muestral.c) Encuentre la probabilidad de que el aspirante de la etnica de la Sierra Nevada

    de Santa Marta se seleccionado para un puesto.

    3. Un equipo de comunicacion contiene seis sistemas electronicos complejos. Se se-leccionan aleatoriamente dos de los seis para someterlos a pruebas rigurosas yclasificarlos como defectuosos y no defectuosos.

    a) Si dos de los seis sistemas son realmente defectuosos, encuentre la proba-bilidad que al menos uno de los dos sistemas probados sean defectuosos.Encuentre la probabilidad que los dos sean defectuosos.

    b) Encuentre la probabilidad indicada en (a) para el caso en que cuatro de losseis sistemas sean realmente defectuosos.

    4. Un supermercado vende solamente dos tipos de lamparas electricas y la experienciamuestra que tienen igual demanda. Cuatro clientes entran uno tras otro paracomprar una lampara. El vendedor se interesa por la preferencia de sus clientes.

    a) Establezca los puntos muestrales de este experimento.b) Asigne las probabilidades a los resultados del espacio muestral.c) Sea A el evento de que los cuatro clientes prefieren el mismo tipo de lampara.

    Calcular P (A).

    5. Dos equipos de futbol, I Y II, tienen la misma capacidad y juegan uno contra elotro una serie de cuatro juegos. Se registra el resultado de cada juego.

    a) Establezca los puntos del espacio muestral de este experimento.b) Asigne las probabilidades a los resultados del espacio muestral.c) Sea A el evento de que el equipo I gana exactamente tres veces. Calcular

    P (A).

    6. Los enfermos no hospitalizados que acuden a una clnico pueden elegir una detres secciones para ser atendidos. Suponga que los medicos son asignados aleato-riamente a tales secciones y que por esto los pacientes no presentan preferenciaalguna con respecto a una seccion. Tres pacientes acuden a la clnico y se observanla seccion que eligen.

    a) Establezca los puntos del espacio muestral de este experimento.b) Asigne las probabilidades a los resultados del espacio muestral.c) Sea A el evento de que cada seccion recibe un paciente. Establezca los puntos

    muestrales de A. Calcular P (A).

    7. Se tienen 3 libros: uno de aritmetica (A), uno de biologa (B) y otro de calculo(C).De cuantas maneras se pueden ordenar en un estante?

    8. Se tienen 7 libros y solo 3 espacios en una biblioteca, suponiendo que no existanrazones para preferir alguno. De cuantas maneras se pueden colocar 3 libroselegidos; entre los siete dados?

    9. Cuantas permutaciones pueden formarse con las letras de la palabra BONDAD?

    Humberto Barrios - [email protected]

  • 2.6 EJERCICIOS 45

    10. Cuantos grupos de 5 alumnos pueden formarse con los treinta alumnos de unaclase. (Un grupo es distinto de otro si se diferencia de otro por lo menos en unalumno).

    11. Una aerolnea tiene seis vuelos diarios Barranquilla a Medelln y siete vuelos deMedelln a Cali. Si los vuelos se hacen en das separados. Cuantos arreglos dife-rentes de vuelos puede ofrecer la aerolnea de Barranquilla a Cali?

    12. Una operacion de montaje en una fabrica manufacturara requiere tres pasos quepueden realizarse en cualquier orden. De cuantas maneras se puede hacer elmontaje?

    13. Cierta marca de automovil tiene cinco modelos diferentes, con cuatro tipo demotores, con dos tipos de transmision, y en ocho colores.

    a) Cuantos automoviles tendra que adquirir un distribuidor si quiere incluirun carro por combinacion modelo-motor-trasmision?

    b) Cuantos automoviles tendra que tener en existencia un centro de distri-bucion si almacenara los carros de todos los colores disponibles para cadacombinacion en (a.)?

    14. Un investigador quiere determinar el efecto de tres variables, presion, tempera-tura y el tipo de catalizador, en el proceso de refinacion. Si el investigador tienela intencion de utilizar tres temperaturas, tres presiones y dos tipos de cataliza-dor. Cuantos experimentos habra que hacer si quiere incluir todas las posiblescombinaciones de temperaturas, de presiones y tipos de catalizador?

    15. Cinco empresas F1, F2, F3, F4 y F5, hacen propuestas con respecto a tres contra-tos separados, C1, C2 y C3. Una empresa solo puede obtener a lo mas un contrato.Los contratos son bastante diferentes, de tal manera que la asignacion de C1 a F1se debe diferenciar de la asignacion de C2 a F2.

    a) Cuantos puntos muestrales tiene este experimento que trata de la asignacionde los contratos a las empresas?

    b) Encuentre la probabilidad de que se conceda un contrato a la empresa F3,bajo el supuesto de que los puntos muestrales son equiprobable.

    16. Dado los siguientes eventos A y B, tales que P (A) = 0.5, P (B) = 0.3, y P (AB) =0.1, encontrar lo siguiente:

    a) P (A|B)b) P (B|A)c) P (A|A B)d) P (A|A B)e) P (A B|A B)

    17. Un armador de ventiladores electricos usa motores de dos proveedores. La com-pana A le suministra el 70 % y la compana B el otro 30 % de los motores. Su-pongamos que sabe que el 5 % de los motores que suministra la compana A sondefectuosos que el 3 % de los que suministra B tambien lo son. Se selecciona unventilador ya armado.

    a) Cual es la probabilidad que tenga un motor defectuoso?b) Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido

    suministrado por la compana A?c) Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido

    suministrado por la compana B?

    18. Los empleados de un supermercado se encuentra clasificado en tres categoras:administradores, supervisores y vendedores. La siguiente tabla indica el numerode empleados en cada division clasificados por sexo:

    Humberto Barrios - [email protected]

  • 46 Captulo 2. PROBABILIDAD

    Mujeres (M) Hombres (H) Total

    Administradores (A) 20 30 50

    Supervisores (S) 50 20 70

    Vendedores (V) 100 80 180

    Total 170 130 300

    a) Si elige aleatoriamente un empleado:1) Cual es la probabilidad que sea mujer?2) Cual es la probabilidad que sea un vendedor?3) Cual es la probabilidad que sea mujer y trabaje en la seccion de admi-

    nistracion?4) Cual es la probabilidad que sea mujer si trabaja en la division de su-

    pervisor?b) Son los eventos V y H estadsticamente independientes?c) Son los eventos A y M estadsticamente independientes?d) Determine las siguientes probabilidades:

    1) P (A M)2) P (A M c)3) P (S M)4) P (M |A)

    19. Sean A y B dos eventos cualesquiera de un espacio muestral . Si A y B sonmutuamente excluyentes, muestrese que no pueden ser independientes. Deduzcaseque dos eventos independientes son, tambien, mutuamente.

    20. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara.a) Cual es la probabilidad de este evento?b) Cual es la probabilidad de que en el decimoprimero lanzamiento el resultado

    sea cara?21. Una agencia de automoviles recibe un embarque de 20 automoviles nuevos. En-

    tre estos, dos tienen defectos. La agencia decide seleccionar, aleatoriamente, dosautomoviles entre los 20 y aceptar el embarque si ninguno de los dos vehculosseleccionados tienen defectos. Cual es la probabilidad de aceptar el embarque?

    22. Se lanza una moneda con una probabilidad de 23 que el resultado sea cara. Siaparece una cara, se extrae una pelota, aleatoriamente, de una urna que contienedos pelotas rojas y tres verdes. Si el resultado es sello se extrae una pelota, de otraurna, que contiene dos rojas y dos verdes. Cual es la probabilidad de extraer unapelota roja?

    23. De entre 20 tanques de combustible fabricados para el trasbordador espacial, tresse encuentran defectuosos. Si se seleccionan aleatoriamente cuatro tanques:

    a) Cual es la probabilidad que ninguno de los tanques se encuentre defectuoso?b) Cual es la probabilidad de que uno de los tanques tenga defectos?

    24. La probabilidad de que cierto componente electrico funcione es de 0.9. un aparatocontiene dos de estos componentes. El aparato funciona mientras lo haga, por lomenos, uno de los componentes.

    a) Sin importar cual de los dos componente funcione o no. Cuales son losposibles resultados y sus respectivas probabilidades?. Suponga independenciaen la operacion entre los componentes.

    b) Cual es la probabilidad que el aparato funcione?25. Con base en varios estudios una compana ha clasificado, de acuerdo con la posibi-

    lidad de descubrir petroleo, las formaciones geologicas en tres tipos. La companapretende perforar un pozo en determinado sitio, al que le asigna las probabilidades

    Humberto Barrios - [email protected]

  • 2.6 EJERCICIOS 47

    0.35, 0.40 y 0.25 para los tres tipos de formaciones respectivas. De acuerdo conla experiencia, se sabe que el petroleo se encuentra en un 40 % de formaciones detipo I, en un 20 % de formaciones de tipo II y en un 30 % de formaciones de tipoIII. Si la compana no descubre petroleo en ese lugar, determnese la probabilidadde que exista una formacion de tipo II.

    26. Se debe examinar un grupo grande de personas respecto a dos sntomas comunesde cierta enfermedad. Se considera que el 20 % de las personas presentan solamenteel sntoma A, el 30 % tienen solamente el sntoma B, 10 % tienen ambos sntomas,y el resto no tiene sntoma alguno. Para una persona escogida aleatoriamente deeste grupo, encuentre las probabilidades de los eventos siguientes:

    a) Que la persona presente al menos un sntoma?b) Que la persona no presente sntoma alguno?c) Que la persona presente ambos sntoma, dado que presenta el sntoma B?

    27. Una planta ensambladora recibe circuitos proveniente de tres fabricas distintasB1, B2 y B3. El 50 % del total se compran a B1 mientras que a B2 y B3 se lescompra un 25 % a cada una. El porcentaje de circuitos defectuosos para B1, B2 yB3 es 5, 10 y 12 % respectivamente. Si los circuitos se almacenan en la planta sinimportar quien fue el proveedor:

    a) Determinar la probabilidad de que una unidad armada en la planta contengaun circuito defectuoso

    b) Si un circuito no es defectuoso. Cual es la probabilidad de que haya sidovendido por el proveedor B2?

    28. Supongamos que hay nueve lugares disponibles en un estacionamiento, uno juntoal otro. Un acomodador tiene que estacionar nueve carros. Tres son carros depor-tivos, tres son carros grandes nacionales, y tres son carros compactos importados.Cual es la probabilidad de que los tres carros deportivos se encuentren juntos,suponiendo que el acomodador estaciona los carros de manera aleatoria?

    29. Se clasifican ocho marcas de llantas de 1 a 8 (de la mejor a la peor) segun elkilometraje que aguanten. Si un comprador escoge cuatro llantas aleatoriamente,encuentre la probabilidad de que la mejor llanta entre las seleccionadas por elcomprador se encuentre realmente en el tercer lugar entre las ocho llantas origi-nales.

    30. Una maquinaria para producir un nuevo tubo electronico experimental generatubos defectuosos de vez en cuando, de una manera aleatoria. El ingeniero super-visor de una maquina en particular, ha notado que los tubos defectuosos parecenagruparse (y, por tanto, aparecen de manera no aleatoria) y esto sugiere el malfuncionamiento de alguna de la maquina. Una prueba para detectar la no alea-toriedad de un evento, se basa en el numero de corridas de artculos defectuososy buenos (una corrida es una sucesion no interrumpida de artculos defectuososo buenos). Mientras mas pequena sea el numero de corridas, mas grande es laevidencia que indica la no aleatoriedad. De 12 tubos producidos por la maquina,los 10 primeros eran buenos y los dos ultimos defectuosos (BBBBBBBBBBDD).Suponga la aleatoriedad.

    a) Cual es la probabilidad de observar la secuencia antes mencionada (resul-tante de dos corridas) dado que los 10 tubos de 12 son buenos?

    b) Cual es la probabilidad de observar dos corridas?c) Cual es la probabilidad de que el numero de corridas R sea R=3?

    31. Suponga que la probabilidad de exposicion a la gripe durante una epidemia es 0.6.La experiencia ha mostrado que una vacuna tiene 80 % de efectividad en proteger

    Humberto Barrios - [email protected]

  • 48 Captulo 2. PROBABILIDAD

    a una persona sobre la gripe, si esta expuesta a la epidemia. Una persona tiene unaprobabilidad de 0.90 de ser afectada por la gripe al ser expuesta. Dos personas, unavacunada y la otra no, realizan una tarea altamente especializada en un negocio.Suponga que no se ubican en la misma localizacion, que no entra en contacto conla misma persona, y no se expone la una a la otra. Cual es la probabilidad deque al menos una sea afectada por la gripe?

    32. Si A y B son eventos tales que A B. Demuestrese que P (A) P (B).33. Sean A, B y C eventos mutuamente excluyentes. Entonces

    P (A B C) = P (A) + P (B) + P (C)

    34. Sean A y B eventos cualesquiera. Entonces

    P (A B) P (A) + P (B) 1

    35. Sean A, B y C eventos cualesquiera. Entonces

    P (ABC) = P (A)+P (B)+P (C)P (AB)P (AC)P (BC)+P (ABC)

    36. Sea (, P ) un espacio de probabilidad. Dada la funcion PH : () 7 0.Demuestrese que

    a) PH es un funcion de probabilidadb) PH() = 0c) PH(A B) = PH(A) + PH(B), si A B = d) PH(A

    c) = 1 P (A)e) PH(AB) = PH(A)+PH(B)PH(AB), para A y B eventos cualesquiera.

    37. Sean A1, A2, . . . , An eventos definidos en el espacio muestral y Ai Aj = ,i 6= j. Demostrar que

    P (

    ni=1

    Ai) =

    ni=1

    P (Ai)

    38. Sea A evento tal que A . Demuestrese que P (A) 1.39. Sea A1, A2, . . . , An una particion del espacio muestral y B un evento de .

    Entonces

    P (B) =

    ni=1

    P (Ai B)

    40. Sean A1, A2, . . . , An eventos del espacio muestral . Entonces

    P (

    ni=1

    Ai) ni=1

    P (Ai)

    41. Sean A1, A2, . . . , An eventos del espacio muestral . Entonces

    P (ni=1

    Ai) =ni=1

    P (Ai)ni

  • 2.6 EJERCICIOS 49

    42. Sean A y B eventos cualesquiera del espacio muestral , tales que P (A) = 0.2,P (B) = 0.3 y P (A B) = 0.4. Calcular:

    a) P (A B)b) P (Ac B)c) P (Ac Bc)d) P (Ac Bc)

    43. Sean A y B eventos independientes del espacio muestral tales que P (A) = 0.5y P (B) = 0.4. Calcular:

    a) P (A B)b) P (Ac B)c) P (Ac Bc)d) P (Ac Bc)

    44. Sean A y B eventos cualesquiera del espacio muestral . Demuestrese:

    a) Si A B = = P (A|B) = 0b) Si A B = P (B|A) = 1

    45. Se lanzan dos dados hasta que la suma de los dos puntos sea 7 u 8. si sale 7, ganael jugador A, y si sale 8 gana el jugador B. Cual es la probabilidad que gane B?

    46. En el control preventivo de una poblacion donde la proporcion de enfermos es, seusa el examen radiologico para detectar posibles enfermos. Se sabe que la proba-bilidad de que, aplicando el examen a un enfermo, la muestra como tal, es 0.90; yque la probabilidad de que el examen aplicado a una persona sana la senale comoenfermo es 0.01. calcular la probabilidad de que una persona dada este realmenteenferma, si el examen radiologico lo mostro como tal. Considerese el experimentode elegir una persona de la poblacion de manera aleatoria.

    47. Supongamos que tenemos tres escritorios identicos, A, B y C, cada uno con doscajones. En A, cada cajon contiene una moneda de oro; en B, un cajon contieneuna moneda de oro y el otro una de plata, y en C, cada cajon contiene una deplata. Se elige un escritorio al azar, se abre uno de los cajones y encontramos unamoneda de oro. Cual es la probabilidad de que el escritorio elegido sea el B?

    48. Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren si-multaneamente, y con probabilidad 13 ninguno ocurre. Halle P (A) y P (B). Estandeterminadas en forma unica estas probabilidades?

    49. Sean A y B dos eventos independientes tales que con probabilidad 16ocurren si-multaneamente, y con probabilidad 13 ocurre A y B no ocurre. Halle P (A) y P (B).Estan determinadas en forma unica estas probabilidades?

    50. Cual es el menor valor de n para el cual la probabilidad de obtener al menos un6 en una serie de n lanzamientos de un dado es mayor que 34?

    51. Los A1, A2, . . . son independientes y P (Ai) = p, i = 1, 2, . . . . Hallar el menor n

    para el cual P (ni=1

    Ai) p0, donde p0 es un numero fijo.

    52. Sean A y B dos eventos cualesquiera. Cual de las siguientes afirmaciones es falsa?

    a) P (A|B) + P (Ac|Bc) = 1b) P (A|B) + P (A|Bc) = 1c) P (A|B) + P (Ac|B) = 1

    53. Sean A y B dos eventos cualesquiera tales que P (A|B) = P (B|A), P (A B) = 1y P (A | B) > 0. Demostrar que P (A) > 1/2.

    54. SeanA1, A2, . . . , An eventos independientes en el espacio muestral si 0 < P (Aj) P (B) y rechaza a B si P (B|A) < P (B).

    56. Probar que A atrae a B si y solo si B atrae a A. Luego diremos que A y B sonmutuamente atractivos si A atrae B.

    57. Probar que A no atrae ni rechaza a B si y solo si A y son B independientes.58. Probar que A y B son mutuamente atractivos si y solo si P (B|A) > P (B|Ac).59. Probar que A atrae a B, entonces A rechaza a Bc.60. Probar que si A atrae B y C, y A rechaza a BC, entonces A atrae BC. Hallar

    un ejemplo en el cual A atrae a B y C y rechace a B C?61. Probar que si B1, B2, . . . , Bn es una coleccion mutuamente disjunta y si A atrae

    algun Bi, entonces A rechaza algun Bj .62. Muestre que para A y B eventos en un espacio de probabilidad:

    a) P ((A Bc) (B Ac)) = P (A) + P (B) 2P (A B)b) P (A B) P (A) P (A B) P (A) + P (B)c) Si P (A) = y P (B) = entonces P (A B) + 1.

    63. Un suero de la verdad tiene la propiedad de que el 90 % de los sospechosos culpablesse juzgan de forma adecuada; mientras que, por supuesto, 10 % de lo sospechososerroneamente se consideran inocentes. Por otro lado, a los sospechosos inocentesse les juzga de manera erronea 1 % de las veces. Si el sospechoso se selecciona de ungrupo de sospechosos, de los cuales solo el 5 % alguna vez han cometido un delito,y el suero indica que es culpable, cual es la probabilidad de que sea inocente?

    Humberto Barrios - [email protected]

  • IntroduccionVariables Aleatorias DiscretasValor Esperado y VarianzaDistribucion BinomialDistribucion PoissonDistribucion GeometricaDistribucion Binomial NegativaDistribucion HipergeometricaEjercicios

    3. Variables Aleatorias Discretas

    3.1 Introduccion

    En el captulo anterior se estudio los conceptos basicos de probabilidad con respectoa los resultados posibles de un experimento aleatorio. Se considero al espacio muestral, como el conjunto de todos los resultados posibles de un experimento aleatorio. Es-tos resultados pueden ser cualitativos o cuantitativos. Por ejemplo, en un proceso defabricacion se puede estar interesado en el hecho si el producto es defectuoso o no de-fectuoso o una persona puede estar interesada en el consumo de agua diarias de unafamilia en Valledupar. Con frecuencia puede ser util la cuantificacion de los resultadosde un espacio muestral y, mediante la asignacion de un numero real a cada elemento de, estudiar su comportamiento aleatorio. El concepto de variable aleatoria facilita unmedio para relacionar un resultado de un espacio muestral con un numero real. Es decir,utilizaremos el concepto de variable aleatoria para referirnos a experimentos donde cadaresultado posible queda caracterizado por un valor numerico.

    Algunos modelos de funciones de probabilidad ocurren con muchas frecuencias en elcontexto de la estadstica teorica como aplicada, esto nos motiva al estudio en detallede algunos modelos de probabilidad, los cuales han demostrados ser util en el campo delas aplicaciones. A pesar de ello tales funciones de probabilidad presentan un caracterteorico en el sentido en que son modelos que se deducen matematicamente con baseen ciertos supuestos que se atribuyen ciertos para los fenomenos aleatorios. La eleccionde un modelo de distribucion de probabilidad para representar un fenomeno de interespractico debe estar motivada tanto por la compresion de la naturaleza del fenomeno ens, como por la posible verificacion de la distribucion seleccionada a traves de la eviden-cia emprica. En todo momento antes de aplicar un modelo de funcion de frecuencia deprobabilidad debe realizarse un analisis crtico del problema de investigacion.

    En este capitulo se examina, mas con la intuicion que con cierto rigor matematico,algunos modelos de frecuencia de probabilidad discretas, destacando ciertas aplicacionesde ellas.

  • 52 Captulo 3. Variables Aleatorias Discretas

    3.2 Variables Aleatorias Discretas

    Hasta ahora, estamos familiarizados con una funcion cuyo dominio y recorrido son sub-conjuntos de los numeros reales. Una funcion que tiene como dominio un espacio mues-tral y su recorrido es un subconjunto de los numeros reales se llama variable aleatoria.

    Definicion 3.2.1 Sea (, P ) un espacio de probabilidad y R el conjunto de los numerosreales. Una funcion

    X : R

    se llama una variable aleatoria real.

    Ejemplo 3.1 Considerese el experimento del lanzamiento de tres monedas una sola vez.El espacio muestral es:

    = {ccc, css, scs, ssc, ccs, csc, scc, sss}

    Sea la variable aleatoria X =numero de sellos en el lanzamiento de las dos monedas,entonces los posibles valores de esta variable aleatoria son: X(ccc) = 1, X(css) =X(scs) = X(ssc) = 1, X(ccs) = X(csc) = X(scc) = 2 y X(sss) = 3, es costumbrerepresentar una variable aleatoria solo por los valores que toma. As, la variable aleatoriodel ejemplo, quedara representada por X = 0, 1, 2, 3.

    Ejemplo 3.2 Supongase que se lanza un dado corriente dos veces consecutivas. Entoncesen este caso el espacio muestral es:

    =

    (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)(3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

    y definamos la variable aleatoria X =suma de las dos caras, entonces los posiblesvalores de esta variable aleatoria son: X = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.

    Es decir, una funcion X que asigna a cada uno de los elementos w , un numero realX(w), se llama una variable aleatoria.

    Definicion 3.2.2 Sea X una variable aleatoria definida sobre el espacio muestral .Si el numero de valores posibles de X es a lo mas numerable, diremos que X esuna variable aleatoria discreta. Es decir, si se pueden anotar los valores posibles deX como x1, x2, . . . , xn, . . .. En el caso finito, la lista termina y en el caso infinitonumerable, la lista continua indefinidamente.

    Las variables aleatorias definidas en los ejemplos anteriores, son claramente variablesaleatorias discretas.

    Definicion 3.2.3 Sea X una variable aleatoria discreta definida sobre el espacio deprobabilidad (, P ). Entonces definimos:

    1. La funcion de probabilidad de densidad (abreviada fpd) de X, como la funcion

    Humberto Barrios - [email protected]

  • 3.2 Variables Aleatorias Discretas 53

    PX(x) tal que para cualquier numero real x R,

    PX(x) = PX(X = x) = P ({w |X(w) = x}) (3.1)

    2. la funcion de distribucion acumulada de X (abreviada fda), la cual se notarapor F (x), por

    F (x) = PX(X x) = P ({w | X(w) x} (3.2)

    La funcion de probabilidad de densidad PX(x) como la funcion de distribucion acumu-lada F (x) para una variable aleatoria discreta X se pueden representa por una formula,una tabla o una grafica.

    Observese que PX(x) es la probabilidad de que la variable aleatoria X tome exactamenteel valor x y F (x) es la probabilidad que la variable aleatoria X tome todos aquellos valoresmenores o iguales a x.

    Ejemplo 3.3 Hallar la funcion de probabilidad de densidad PX(x), la funcion de dis-tribucion acumulada F (x) y graficas de PX(x) y F (x) para la variable aleatoria delejemplo 3.1.

    Solucion En la tabla siguiente se muestra, en la primera columna todos los resultadosposibles, es decir, el espacio muestral del experimento: lanzamiento de tres monedauna sola vez, en la segunda columna los valores que toma la variable aleatoria X numerode sellos en el lanzamiento de tres moneda una sola vez y en las columnas tres y cuatrola funcion de probabilidad de densidad PX(x) y la funcion de distribucion acumuladaF (x) para la variable aleatoria X respectivamente.

    x PX(x) F (x)

    ccc 0 1818

    css, scs, ssc 1 3848

    ccs, csc, scc 2 3878

    ccc 3 18 1

    Por lo tanto la probabilidad PX(0) =18 es la probabilidad de que en un lanzamiento de

    tres monedas no salga ninguna cara, PX(2) =18 es la probabilidad de obtener exacta-

    mente dos cara en el lanzamiento de tres moneda una sola vez y F (3) = PX(X 3) = 78es la probabilidad de obtener a los mas dos cara en el lanzamiento de tres moneda unasola vez.

    Igualmente se puede graficar la funcion de probabilidad de la variable aleatoria X, comose muestra a continuacion:

    Humberto Barrios - [email protected]

  • 54 Captulo 3. Variables Aleatorias Discretas

    0 1 2 3 x

    18

    14

    PX(x)

    Grafica de PX

    Es facil ver que la funcion de distribucion acumulada F (x) de una variable aleatoriacualesquiera esta definida en todo el conjunto de los reales R. Por lo tanto, la funcion dedistribucion acumulada de la variable aleatoria X numero de sellos en el lanzamientode tres monedas una sola vez se puede representar mediante la siguiente formula:

    F (x) =

    0, si x < 018 , si 0 x < 114 , si 1 x < 214 , si 2 x < 31, si x 3

    Por consiguiente, F (x) se puede representar como se muestra en la siguiente grafica

    0 1 2 3 x

    18

    48

    78

    1

    F (x)

    Grafica de F (x)

    En la grafica se puede establecer que la probabilidad F (2.5) = 48 , haciendo la interpo-lacion como se puede ver en la grafica.

    Ejemplo 3.4 Hallar la funcion de probabilidad de densidad PX(x), la funcion de dis-tribucion acumulada F (x) y graficas de PX(x) y F (x) para la variable aleatoria delejemplo 3.2.Solucion En la tabla siguiente se muestra, en la primera columna todos los resultadosposibles, es decir, el espacio muestral del experimento: lanzamiento de un dado co-rriente dos veces en forma consecutiva, en la segunda columna los valores que toma la

    Humberto Barrios - [email protected]

  • 3.2 Variables Aleatorias Discretas 55

    variable aleatoria X suma de las dos caras en el lanzamiento de un dado corriente dosveces y en las columnas tres y cuatro la funcion de probabilidad de densidad PX(x) y lafuncion de distribucion acumulada F (x) para la variable aleatoria X respectivamente.

    x PX(x) F (x)

    (1,1) 2 136136

    (1,2) (2,1) 3 236336

    (1,3) (2,2) (3,1) 4 336636

    (1,4) (2,3) (3,2) (4,1) 5 4361036

    (1,5) (2,4) (3,3) (4,2) (5,1) 6 5361536

    (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) 7 6362136

    (2,6) (2,6) (4,4) (5,3) (6,2) 8 5362736

    (3,6) (3,6) (4,5) (6,3) 9 4363036

    (4,6) (4,6) (6,4) 10 3363336

    (5,6) (5,6) 11 2363536

    (6,6) 12 136 1

    Por lo tanto la probabilidad de observar que la suma de las dos caras se exactamente7 es PX(7) =

    636 , PX(8) =

    536 es la probabilidad de obtener exactamente 8 en la suma

    de las dos cara en el lanzamiento de un dado corriente y F (4) = PX(X 4) = 636 es laprobabilidad de obtener a los mas 4 como suma de las dos cara.

    Igualmente se puede graficar la funcion de probabilidad y la funcion de distribucionacumulada de la variable aleatoria X, como se muestra a continuacion:

    1 2 3 4 5 6 7 8 9 10 11 12 x

    136

    236

    336

    436

    536

    636

    PX(x) Grafica de PX

    Como en el caso anterior del ejemplo 3.1 la grafica de la distribucion acumulada nospermite responder preguntas referentes a la probabilidades de aquellos valores que notoma la variable aleatoria X, pero que si estan en el dominio de la funcion de distribucionacumulada F , puesto que F esta definida en todo el conjunto de los numeros reales.

    Humberto Barrios - [email protected]

  • 56 Captulo 3. Variables Aleatorias Discretas

    1 2 3 4 5 6 7 8 9 10 11 12 x

    636

    1236

    1836

    2436

    3036

    1

    F (x)