32
ESTADISTICA (Segundo curso de Ingenier´ ıa Inform´ atica) Programa. Curso 2002-2003 1 Probabilidad: introducci´ on y conceptos b´ asicos. 2 Variables aleatorias: distribuci´ on de una variable aleatoria. Esperanza mate- atica. Media y varianza. Algunas distribuciones notables. 3 Vectores aleatorios: Distribuciones conjunta, marginales y condicionadas (casos sencillos). Independencia. Suma de variables aleatorias independientes. 4 La ley de los grandes n´ umeros y el teorema central del l´ ımite: inter- pretaci´ on y significado pr´ actico. Fundamentos probabil´ ısticos de los m´ etodos de simulaci´ on. 5 Estimaci´ on param´ etrica: estimaci´ on puntual. Conceptos b´ asicos sobre esti- madores. El m´ etodo de m´ axima verosimilitud. Estimaci´ on por intervalos de confianza. Distribuciones en el muestreo asociadas a la normal. Construcci´ on de intervalos de confianza: algunos ejemplos t´ ıpicos para el caso de poblaciones normales. Intervalos de confianza aproximados. 6 Contraste de hip´ otesis: conceptos b´ asicos. Relaci´ on entre contraste de hip´ otesis e intervalos de confianza: Ejemplos. Algunos contrastes cl´ asicos relativos a par´ a- metros de distribuciones binomiales y normales. Contrastes no param´ etricos, tipo “chi-cuadrado” (χ 2 ), de bondad de ajuste, homogeneidad e independencia. 7 Introducci´ on a los modelos de regresi´ on: distribucion normal bivariante; regresi´ on lineal simple. Rectas de regresi´ on. Coeficiente de correlaci´ on y su sig- nificado. 1

2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

  • Upload
    others

  • View
    65

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

ESTADISTICA(Segundo curso de Ingenierıa Informatica)

Programa. Curso 2002-2003

1 Probabilidad: introduccion y conceptos basicos.

2 Variables aleatorias: distribucion de una variable aleatoria. Esperanza mate-matica. Media y varianza. Algunas distribuciones notables.

3 Vectores aleatorios: Distribuciones conjunta, marginales y condicionadas (casossencillos). Independencia. Suma de variables aleatorias independientes.

4 La ley de los grandes numeros y el teorema central del lımite: inter-pretacion y significado practico. Fundamentos probabilısticos de los metodos desimulacion.

5 Estimacion parametrica: estimacion puntual. Conceptos basicos sobre esti-madores. El metodo de maxima verosimilitud. Estimacion por intervalos deconfianza. Distribuciones en el muestreo asociadas a la normal. Construccionde intervalos de confianza: algunos ejemplos tıpicos para el caso de poblacionesnormales. Intervalos de confianza aproximados.

6 Contraste de hipotesis: conceptos basicos. Relacion entre contraste de hipotesise intervalos de confianza: Ejemplos. Algunos contrastes clasicos relativos a para-metros de distribuciones binomiales y normales. Contrastes no parametricos, tipo“chi-cuadrado” (χ2), de bondad de ajuste, homogeneidad e independencia.

7 Introduccion a los modelos de regresion: distribucion normal bivariante;regresion lineal simple. Rectas de regresion. Coeficiente de correlacion y su sig-nificado.

1

Page 2: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

BIBLIOGRAFIA

DeGroot, M.H. (1988). Probabilidad y Estadıstica. Addison-Wesley Iberoamericana.

de la Horra, J. (2003). Estadıstica Aplicada. Dıaz de Santos.

Mendenhall, R.L., Scheaffer, R.L., Wackerly, D.D. (1986). Estadıstica Matematicacon Aplicaciones. Grupo Editorial Iberoamerica.

Montgomery, D.C., Runger, G.C. (1996). Probabilidad y Estadıstica aplicadas ala Ingenierıa. McGraw Hill.

Pena, D. (2001). Fundamentos de Estadıstica. Alianza Editiorial.

Pena , D. Romo, J.(1997). Introduccion a la Estadıstica para las Ciencias Sociales.McGraw-Hill, 1997

Press, W.H., Teukolsky, S.A., Vetterling, W.T., Flannery, B.P. (1992).Numerical Recipes in C. Cambridge University Press.

Rice, J.A. (1995). Mathematical Statistics and Data Analysis. Wadsworth & Brooks.

Ross, S.M. (1987). Probability and Statistics for Engineers and Scientists. Wiley.

Scheaffer, R.L., McClave, J.T. (1993). Probabilidad y Estadıstica para Ingenierıa.Grupo Editorial Iberoamerica.

Trivedi, K.S. (1982). Probability and Statistics with Reliability, Queuing and Com-puter Science Applications. Prentice-Hall.

2

Page 3: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

ESTADISTICA. Segundo curso de ingenierıa informaticaEjercicios propuestos. Curso 2003-2004

1. En un directorio informatico hay 20 archivos, de los cuales 6 son “‘grandes” (detamano superior a un Mb) y el resto “pequenos”. Se seleccionan al azar, sinreemplazamiento, 5 archivos de entre los 20. Calcular la probabilidad de que hayaexactamente dos archivos “grandes” entre los seleccionados. Resolver el mismoproblema en el caso de que los archivos se seleccionen con reemplazamiento.

2. En un laboratorio de informatica hay 50 ordenadores de los cuales 15 estan afecta-dos por un virus. Diez estudiantes llegan al laboratorio y se sientan aleatoriamentecada uno de ellos ante un ordenador. Calcular la probabilidad de que al menostres estudiantes hayan elegido ordenadores “contaminados”. No es imprescindiblerealizar los calculos; pueden dejarse indicados en la forma mas simplificada quesea posible.

3. Una empresa de software que disena juegos para ordenador somete los disenospreliminares de sus productos a la evaluacion previa de un grupo seleccionadode clientes. Segun muestra la experiencia, el 95% de los productos que tuvieronun gran exito en el mercado recibieron buenas evaluaciones, el 60% de los deexito moderado recibieron buenas evaluaciones y solo el 10% de los que tuvieronescaso exito fueron valorados favorablemente. Ademas, globalmente el 40% de losproductos de la empresa ha tenido mucho exito, el 35% un exito moderado y el25% una baja aceptacion.

a) ¿Cual es la probabilidad de que un producto, elegido al azar entre la produccionde la fabrica obtenga una buena evaluacion previa?

b) Si un nuevo producto obtiene una buena evaluacion ¿cual es la probabilidad deque se convierta en un producto de gran exito?

c) Si un producto no obtiene una buena evaluacion ¿cual es la probabilidad de quese convierta en un producto de gran exito?

4. El 20% de las visitas que recibe la pagina web de una empresa proceden de Japon,el 30% de la Union Europea, el 40% del continente americano y el 10% del resto delmundo. Supongamos que la probabilidad de que un visitante realice una compraes, para las cuatro procedencias indicadas, 0.10, 0.35, 0.25, 0.20, respectivamente.Calcular la probabilidad de que un visitante elegido al azar realice una compra.Calcular la probabilidad de que un visitante que no ha ha hecho ninguna compraproceda de Japon.

3

Page 4: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

5. Se elige al azar un numero decimal de tres dıgitos. Calcular la probabilidad deque exactamente k dıgitos sean mayores o iguales que 5, para 0 ≤ k ≤ 3.

6. Calcular la probabilidad de que, al lanzar repetidamente un dado, el tercer “seis”aparezca exactamente en el decimo lanzamiento.

7. Supongamos que los chips producidos por una determinada companıa se sometena un control de calidad de tal forma que la probabilidad de detectar un chipdefectuoso es 0.95 y la probabilidad de declarar ”no defectuoso” un chip querealmente es correcto es 0.97. Si el 5% de los chips presentan alguna averıa ¿Cuales la probabilidad de que un chip que se identifica como defectuoso sea correcto?

8. El Departamento de Control de Calidad (DCC) de una fabrica se encarga de exa-minar el funcionamiento de los aparatos producidos por la misma. Cada aparatotiene (independientemente de los demas) algun defecto con probabilidad p. Si unaparato es defectuoso el DCC lo detecta con probabilidad α. Ademas, durantesu comprobacion en el DCC un aparato en buen estado puede comportarse comodefectuoso con una probabilidad β. Todos los aparatos que se han revelado comodefectuosos durante la comprobacion se desechan. Hallar la probabilidad q0 deque un aparato no desechado tenga algun defecto y la probabilidad q1 de que unaparato desechado tenga algun defecto. ¿En que condiciones es q0 > q1?

9. La probabilidad de que falle durante el perıodo de garantıa un conector electricoque se mantiene seco es 0.01. Si el conector se humedece la probabilidad de fallodurante el perıodo de garantıa es 0.05. Si el 90% de los conectores se mantienensecos y el 10% se humedecen, ¿que proporcion de conectores se espera que fallendurante el perıodo de garantıa?.

10. Un canal de comunicacion recibe impulsos independientes a razon de 12 impulsospor microsegundo. La probabilidad de un error de transmision es de 0.001 paracada impulso. Calcular las probabilidades de los siguientes sucesos:

(a) No hay ningun error en un microsegundo.

(b) Hay exactamente un error en un microsegundo.

(c) Hay al menos un error en un microsegundo.

4

Page 5: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

(d) Hay exactamente dos errores en un microsegundo.

11. Los vuelos nacionales de una cierta companıa aerea disponen de 12 plazas de clasepreferente. La companıa sabe, por experiencia, que solo el 90% de los pasajerosque reservan plaza en esta categorıa acuden finalmente a retirar su billete. Poresta razon, deciden admitir hasta 14 reservas de clase preferente para cada vuelo.Suponiendo que el cumplimiento de las reservas es independiente de unos pasajerosa otros, calcular la probabilidad de que en un vuelo la companıa tenga efectiva-mente mas pasajeros que plazas en clase preferente.

12. La probabilidad de que un sistema tenga n fallos durante un dıa viene dada por

Pn =1

e(n!)n = 0, 1, 2, ...

Si se presentan n fallos, el sistema deja de funcionar con probabilidad 1− (1/2)n.Calcular la probabilidad de que el sistema haya tenido n fallos si ha dejado defuncionar.

13. Demostrar que la funcion p(n) = cn, para n = 1, 2, . . . no puede ser, para ningun

valor de c, funcion de probabilidad de una distribucion discreta.

14. Supongamos que un juego que consiste en sucesivos lanzamientos de moneda. Sisale cara un jugador gana la cantidad que ha apostado, y si sale cruz pierde estacantidad. Supongamos que el jugador adopta la estrategia de doblar la apuestadespues de cada jugada en que haya perdido y retirarse del juego en el momentoen que gane por primera vez en algun lanzamiento. La apuesta en el primerlanzamiento es de una unidad monetaria. Calcular la distribucion de la ultimaapuesta realizada por el jugador. Obtener la media de esta distribucion y comentarel resultado (Paradoja de San Petersburgo).

15. Calcular el area esperada de un cuadrado cuyo lado tiene longitud aleatoria condistribucion uniforme en el intervalo (0, 1). Calcular y dibujar las graficas de lasfunciones de distribucion y de densidad de la variable aleatoria area.

5

Page 6: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

16. La probabilidad de error en la transmision de un bit por un canal de comunicaciones p = 10−4. ¿Cual es la probabilidad de que se produzcan mas de tres errores altransmitir un bloque de 1000 bits?

17. Un individuo se reune una vez por semana con su grupo de amigos, son 10 entotal, para cenar. Cada semana sortean una botella de vino entre ellos.

a) Calcular la probabilidad de que el individuo gane por primera vez la quintasemana.

b) Calcular la probabilidad de que en 8 semanas no gane nada.

c) Calcular la probabilidad de que en 8 semanas gane 4 botellas.

18. Supongamos que el numero de mensajes que entran en un canal de comunicacionen un intervalo de t segundos de duracion es una variable aleatoria con distribucionde Poisson de parametro 0.3t. Calcular las probabilidades de los siguientes sucesos:

(a) En un intervalo de 10 segundos llegan exactamente 3 mensajes.

(b) En un perıodo de 20 segundos llegan a lo sumo 20 mensajes.

(c) El numero de mensajes que llegan en un intervalo de 5 segundos de duracionesta comprendido entre 3 y 7.

19. En cada pagina de una enciclopedia caben 3000 letras. La editorial estima que secomete una errata en cada 50000 letras. Suponiendo que el numero de erratas porpagina sigue aproximadamente una distribucion de Poisson, se pide

(a) Calcular la probabilidad de que en una pagina haya exactamente dos erratas.

(b) Si se van revisando las paginas una a una, calcular la probabilidad de que laprimera errata que se encuentra aparezca en la quinta pagina revisada.

(c) Calcular la probabilidad de que en las cinco primeras paginas haya al menosdos erratas.

20. Una editorial tiene contratados a varios correctores de pruebas. Un tercio de ellosson considerados excelentes y el resto normales. El numero de erratas detectadaspor cada corrector sigue una distribucion de Poisson. Un corrector excelente de-tecta una media de 3 erratas por cada hora de trabajo y uno normal una mediade 2.

Hallar la probabilidad de que un corrector elegido al azar encuentre 12 erratas sitrabaja 5 horas seguidas.

6

Page 7: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

21. Una persona ebria realiza un paseo aleatorio de la siguiente forma: cada minutoda un paso hacia el norte o hacia el sur con probabilidad 1/2, y los sucesivos pasosson independientes. La longitud del paso es 1 m.

a) Calcular la probabilidad de que al cabo de una hora haya dado exactamente 20pasos hacia el norte.

b) Calcular la probabilidad de que al cabo de una hora este a menos de 3 metrosdel punto de partida.

22. Se sabe que aproximadamente el 20% de los usuarios de Windows-NT no cierranel programa adecuadamente. Supongamos que el Windows-NT esta instalado enun ordenador publico que es utilizado aleatoriamente por personas que actuanindependientemente unas de otras.

(a) ¿Cual es la probabilidad de que al menos 6 de las 9 primeras personas que vana usar el ordenador cierre adecuadamente el Windows-NT?

(b) ¿Cual es el numero medio de personas que usan el ordenador desde el momentoen que se instala hasta que alguien no cierra el programa adecuadamente?

23. En cierta poblacion, el numero diario de accidentes de trafico sigue una distribucionde Poisson de parametro 0.9.

(a) Calcular la probabilidad de que en un dıa haya al menos dos accidentes.

(b) Si los accidentes en los diferentes dıas se producen de manera independien-te, calcular la probabilidad de que en un ano haya mas de 90 dıas en los que seproducen al menos dos accidentes.

24. Los impulsos procedentes de una fuente emisora tienen una intensidad cuya funcionde distribucion es F (x) = x4/81, para 0 ≤ x < 3 (por tanto, F (x) = 0 para x < 0y F (x) = 1 para x ≥ 3).

a) Se observan 10 de estos impulsos, cuyas intensidades se suponen independientes.¿Cual es la probabilidad de que al menos 2 de ellos tengan una intensidad superiora 2?

b) Si se observan 100 impulsos independientes ¿cual es la probabilidad de que almenos 75 de ellos tengan una intensidad superior a 2?

c) Si se observan secuencialmente impulsos independientes producidos por la fuenteemisora ¿Cual es la probabilidad de que haya que observar 14 de estos impulsospara encontrar 4 que tengan una intensidad superior a 2?

7

Page 8: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

25. De una estacion parte un tren cada 20 minutos. Un viajero llega de improviso.Hallar:

1) Funcion de distribucion de la variable aleatoria “tiempo de espera”.

2) Probabilidad de que espere al tren menos de 7 minutos.

3) Esperanza y varianza de la variable aleatoria “tiempo de espera”.

4) Probabilidad de que espere exactamente 12 minutos.

26. El tiempo X (expresado en minutos) entre dos visitas consecutivas en una paginaweb durante el horario diurno es una variable aleatoria continua con funcion dedensidad

f(x) =1

3e−x/3, para x > 0.

a) Calcular E(X) y P{X > 1}.b) Calcular la funcion de distribucion de X.

c) Calcular la probabilidad de que el intervalo entre dos visitas sea mayor que 4minutos si se sabe que su duracion ya ha sido al menos 2 minutos.

d) Se observan de manera secuencial las duraciones (que se suponen indepen-dientes) de intervalos consecutivos entre visitas. ¿Cual es la probabilidad de quehaya que observar 12 de estos intervalos para encontrar 3 que tengan una duracionmayor que 4 minutos?

27. En un centro de calculo universitario se reciben programas a una tasa promedio deλ = 0.1 programas por segundo. Suponiendo que el numero de llegadas por unidadde tiempo tiene distribucion de Poisson, entonces el tiempo X transcurrido entredos llegadas consecutivas tiene distribucion exponencial de parametro λ. Calcularla probabilidad de que en un intervalo de 10 segundos no llegue ningun programaal centro de calculo.

28. Supongamos que el tiempo de CPU requerido para ejecutar cierto tipo de pro-gramas sigue aproximadamente una distribucion exponencial de parametro 1/140por milisegundo. El sistema esta organizado de tal manera que si un trabajo nose completa en un perıodo de 100 milisegundos se envıa a una cola de espera.Calcular la probabilidad de que un programa que llega al ordenador sea enviadoa dicha cola de espera. Si a lo largo de un dıa se envıan 800 programas ¿cual esel numero esperado de programas que se finalizaran dentro del primer perıodo de100 milisegundos?

8

Page 9: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

29. Un sistema electronico tiene n componentes identicos y de funcionamiento inde-pendiente que estan conectados en serie, de forma que el sistema falla tan prontocomo uno de los componentes falla. Supongase que el tiempo de vida de cada com-ponente, medido en horas, tiene una funcion de distribucion F (t) = 1− exp(−θt)para t ≥ 0, F (t) = 0 para t < 0 (θ > 0). Sea la v.a. Tn= “tiempo transcurridohasta que falla el sistema”.

(a) Calcular P{Tn > 1} y la funcion de distribucion de Tn.

(b) Demostrar que Tn −→ 0, en probabilidad, cuando n →∞.

30. En un cierto sistema electrico el voltaje X es una variable aleatoria que tiene lasiguiente funcion de distribucion: F (x) = 0, para x ≤ 0, F (x) = x/(1 + x), parax ≥ 0. Demostrar que F es efectivamente una funcion de distribucion. Calcularsu correspondiente densidad y la probabilidad del intervalo (3,5).

31. Un programa se divide en tres bloques que se compilan simultanea e independi-entemente por tres ordenadores en paralelo. El tiempo en minutos requerido porcada ordenador es una variable aleatoria con funcion distribucion F (t) = 1− e−5t

(para t > 0). El programa esta completo cuando los tres bloques estan compilados.

(a) Calcular el tiempo medio requerido por cada ordenador para compilar el bloqueque le ha correspondido.

(b) Calcular la funcion de distribucion del tiempo necesario para compilar el pro-grama completo. ¿Cual es la probabilidad de que este tiempo este comprendidoentre 6 y 7 minutos?

32. Dos modelos probabilısticos que se utilizan en Economıa para estudiar el repartode ingresos en una poblacion son las distribuciones de Pareto y logarıtmico normalcuyas respectivas funciones de densidad son:

f(x) =θxθ

0

xθ+1, para x > x0,

donde x0 y θ son parametros positivos.

g(x) =1

x√

2πσexp[−(log x− µ)2]/2σ2], para x > 0,

donde µ ∈ IR y σ > 0 son parametros.

(a) Demostrar que f es una funcion de densidad. Calcular la correspondientefuncion de distribucion y la media.

9

Page 10: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

(b) Comprueba que si X es una variable aleatoria N(µ, σ), entonces Y = eX esuna variable aleatoria con funcion de densidad g.

33. El tiempo de CPU, T , requerido para realizar un trabajo, elegido aleatoriamente deentre los que llegan a un centro de calculo, sigue aproximadamente una distribucionhiperexponencial dada por

P{T ≤ t} = FT (t) = α(1− e−λ1t) + (1− α)(1− e−λ2t),

donde α = 0.6, λ1 = 10, λ2 = 1. Calcular

(a) La funcion de densidad de T .

(b) El tiempo medio de servicio E(T ).

(c) La varianza del tiempo de servicio V (T ).

34. El tiempo de servicio (en dıas) de una cierta maquina es una v.a. con funcion dedensidad f(t) = (1/α)e−t/α, para t > 0, (siendo α una constante mayor que cero).Si η es la v.a. que expresa el numero de dıas en que la maquina funciona el dıacompleto, obtener la distribucion de η.

35. Una central hidroelectrica tiene, en esquema, el siguiente funcionamiento desde elpunto de vista economico (durante el perıodo de un ano): hay un coste fijo anualde c1 pesetas (destinado a gastos de personal y mantenimiento). Cada kw.-h. deenergıa producida supone un coste de c2 pesetas y se vende a un precio de c3.

Supongamos que la cantidad de energıa producida (que depende de la cantidadde lluvia caıda en la zona) puede considerarse aproximadamente una v.a. X condistribucion absolutamente continua y densidad dada por f(x) = α2x exp(−αx),para x ≥ 0 (α > 0). Se pide:

(a) Calcular la ganancia esperada anual.

(b) Calcular la probabilidad de que al final del ano la empresa que gestiona lacentral tenga deudas, supuesto que dispone inicialmente de c4 pesetas (c4 < c1).

36. El tiempo de duracion de los chips producidos por un fabricante de semiconduc-tores es una variable aleatoria cuya distribucion es aproximadamente normal conµ = 5.106 horas y σ = 5.105 horas. Un fabricante de ordenadores esta dispuesto acomprar una gran cantidad de chips siempre que al menos el 95% del lote tenga

10

Page 11: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

un tiempo de vida superior a 4.106 horas. ¿Que decision deberıa tomar en vistade la informacion disponible?

37. El valor absoluto V de la velocidad de una molecula de un gas sigue la distribucionde Maxwell cuya densidad es

f(v) =

√2/π

σ3v2e−v2/2σ2

,

para v ≥ 0. El parametro σ > 0 depende de la temperatura del gas. Calcular lamedia de la v.a. ”energıa cinetica”, definida por X = 1

2mV 2 (m es la masa).

38. Un fabricante vende un artıculo a un precio fijo unitario. Si el peso del artıculo esinferior a 8 Kg. este resulta no apto para la venta, lo cual representa la perdidatotal de su valor. El peso de un artıculo se puede considerar como una v.a. condistribucion N(µ, 1). El coste de produccion de un artıculo es c = 0.05µ + 0.30.Calcular el peso medio µ que maximiza el beneficio esperado por el fabricante.

39. (a) La probabilidad de que una componente de un cierto tipo tenga alguna averıaen las primeras 75 semanas es 0.9. Un sistema consta de seis de estas componentesque funcionan en paralelo de manera independiente. ¿Cual es la probabilidad deque fallen exactamente cuatro de ellas en las primeras 75 semanas si se sabe que,al menos, dos de las componentes han fallado en ese perıodo?

(b) Supongamos ahora que el tiempo (en semanas) de funcionamiento sin averıasde cada componente es una v.a. absolutamente continua con funcion de densidad

f(x) =1

12

(x

3

)−3/4

e−(x3 )

1/4

, para x > 0

Calcular la probabilidad de que una componente funcione mas de 50 semanas sinaveriarse.

40. Supongamos que, para cada S > 0 prefijado, el numero de arboles existentesen cualquier zona de extension S de un determinado bosque es una v.a. condistribucion de Poisson de parametro θS, (con θ > 0 constante). Calcular ladistribucion de la distancia entre cualquier punto dado y el arbol mas proximo ael.

11

Page 12: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

41. Sea X una v.a. con distribucion uniforme en el intervalo [0,1]. Sea U la v.a.”primer dıgito de X” y V el segundo dıgito de X. Calcular las distribuciones de Uy de V y demostrar que ambas variables son independientes. Sugerir alguna posi-ble interpretacion o aplicacion de este resultado, referida al problema de generarnumeros aleatorios en un ordenador.

42. Sea X una v.a. con funcion de distribucion continua F . Demostrar que Y =F (X) tiene distribucion uniforme en el intervalo (0,1). Comentar el interes de esteresultado en relacion con el problema de generar numeros aleatorios.

43. La funcion de densidad conjunta de dos variables aleatorias con distribucion con-tinua es:

f(x, y) =

{k(x + xy) si x ∈ (0, 1) e y ∈ (0, 1)0 en otro caso

(a) Obtener el valor de k.

(b) Funciones de densidad marginales.

(c) ¿Son independientes ambas marginales?

44. Sea (X, Y ) un vector aleatorio con funcion de densidad conjunta

f(x, y) =

{ky si 0 < x < y < 10 en otro caso

Calcular:

a) El valor de k.

b) E(Y ).

c) P (X > Y ).

45. Sean X1 y X2 variables aleatorias independientes e identicamente distribuidas condistribucion uniforme en el intervalo (0,1).

Calcular E(X21 + X2

2 ) y P{X21 + X2

2 ≤ 1}.

12

Page 13: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

46. Se tiran dos dados. Consideremos las variables aleatorias X = “n de puntos del1er dado” e Y = “n maximo de los dos obtenidos”.

a) Hallar la funcion de masa conjunta y las marginales

b) Calcular las probabilidades de los distintos valores de X si sabemos que Y = 4.

c) Obtener la distribucion de la variable aleatoria Z = suma de los puntos obtenidos.

d) Calcular la distribucion condicionada de Z si sabemos que X = 1.

47. a) Dos personas llegan totalmente al azar e independientemente una de otra aun lugar determinado, entre las 12 y la 1. Disenar un modelo para sus posiblesllegadas mediante un par de variables aleatorias, indicando su densidad conjuntay marginales.

b) Supongamos ahora que los instantes de llegada de las dos personas tienen comofuncion de densidad conjunta:

f(x, y) = 4xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1

¿Son independientes las llegadas de ambos? ¿Cual es la distribucion segun la cualllega ahora cada uno?

48. Sea (X, Y ) un vector aleatorio que tiene por funcion de densidad:

f(x, y) = 1 |y| < x, 0 < x < 1

a) Comprobar que es funcion de densidad.

b) Hallar las medias de X y de Y . Calcular las distribuciones condicionadas.

49. Un sistema tiene n componentes cuyos tiempos de vida X1, ..., Xn son variablesaleatorias independientes e identicamente distribuidas con distribucion exponen-cial de parametro λ . Obtener la distribucion de las variables aleatorias

M = max{X1, ..., Xn} N = min{X1, ..., Xn}.

a) Supongamos que el sistema funciona mientras funciona al menos una de suscomponentes. Si λ = 1 dıa, calcular la probabilidad de que el sistema se pareantes de tres dıas.

b) Supongamos que el sistema se para si falla una de sus componentes. Si λ = 1dıa, calcular la probabilidad de que el sistema funcione mas de 2 dıas.

13

Page 14: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

50. A una centralita telefonica llegan simultaneamente tres clientes: los clientes 1 y2 ocupan las dos cabinas disponibles y el cliente 3 queda esperando hasta quequede libre una de las dos cabinas. Suponiendo que los tiempos de conversacion,T1 y T2 de los dos primeros clientes son variables aleatorias independientes condistribucion exponencial de parametro λ, calcular la distribucion y la media de lav.a. T = ‘tiempo de espera (para acceder a una cabina) del cliente 3.

51. Un sistema electronico consta de cuatro componentes. Sea Xj el tiempo defuncionamiento de la componente j-esima (j = 1, . . . , 4). Supongamos que lasvariables Xj son independientes e identicamente distribuidas con funcion de dis-tribucion continua F . Supongamos tambien que el sistema funciona mientrasfuncione la componente 1 y al menos una de las otras tres componentes. Obtenerla funcion de distribucion de la v.a. T=“tiempo de funcionamiento del sistema”.

52. Una empresa fabrica estructuras metalicas modulares. Se define la resistencia deuna estructura de este tipo, despues de ser sometida a una carga, como X = ρ−C,siendo ρ la resistencia a la tension y C la carga. Se supone que ρ y C son v.a.independientes con distribuciones ρ ∼ N(µρ = 800, σρ = 60), C ∼ N(µC =550, σC = 70). Se entiende que una estructura puede soportar la carga a la que essometida si X > 0.

a) Calcular la probabilidad del suceso {X > 0}.b) ¿Que recomendacion de carga maxima se hara al vender una de estas estruc-

turas metalicas para que la pueda soportar con una probabilidad de 0.995?

c) Durante un ano la empresa tiene previsto fabricar 1500 estructuras y, si laprobabilidad de que al menos 15 de ellas fallen es mayor que 0.95, decidiraemprender un proyecto de modificacion de la produccion. ¿Que decision debetomar la empresa sobre este proyecto?

53. Un contador de partıculas tiene un mecanismo imperfecto que detecta una par-tıcula que llega al contador con probabilidad p. Si la distribucion del numerode partıculas que llegan al contador en una unidad de tiempo es una Poisson deparametro λ ¿Cual es la distribucion del numero de partıculas registradas por elcontador?

54. El numero de partıculas que llega a un contador en un tiempo t tiene una dis-tribucion de Poisson de parametro λt. El contador solo esta abierto un tiempo

14

Page 15: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

aleatorio t cuya distribucion es exponencial de parametro λ. Calcular la dis-tribucion de la v.a. N= numero total de partıculas registradas por el contador.

55. Sea f una funcion tal que 0 < f(x) < M , ∀x ∈ [a, b]. Supongamos que sequiere evaluar aproximadamente el valor de la integral I =

∫ ba f(x)dx. Esto puede

hacerse utilizando tecnicas de simulacion, por el siguiente procedimiento (Metodode Montecarlo):

A) Se simulan n observaciones (X1, Y1), . . . , (Xn, Yn) de una v.a. con distribucionuniforme en el rectangulo [a, b]× [0, M ].

B) Se aproxima el valor de I mediante

In = (b− a)MA

n,

donde A denota el numero de observaciones (Xi, Yi) para las que Yi < f(Xi).

Demostrar, utilizando la ley de los grandes numeros, que In → I, (en prob.).

56. Un tren de circulacion diaria se retrasa, independientemente de un dıa a otro,un tiempo aleatorio con distribucion exponencial de parametro 0.25 (el tiempo semide en minutos). Calcular la probabilidad de que, a lo largo de un ano, el trense retrase 6 o mas minutos en mas de 50 ocasiones.

57. Una radiologa que trabaja en el servicio de traumatologıa de un gran hospitalha comprobado que el tiempo, en minutos, que tarda en atender a cada pacientees una variable aleatoria con media 7 y desviacion tıpica 2. Durante su jornadalaboral trabaja 6 horas atendiendo pacientes sucesivamente y sin interrupcion.

Calcular aproximadamente la probabilidad de que durante un dıa pueda atendera 55 pacientes dentro del horario de su jornada laboral. Se supone que todos lospacientes estan en la consulta con suficiente antelacion, de manera que no hay“tiempos vacıos” entre dos pacientes consecutivos.

58. Las longitudes de los lados de un rectangulo son dos variables aleatorias X,Yindependientes normales de medias 4 y 7 y varianzas 9 y 16 respectivamente.

a) Calcular la probabilidad de que el perimetro del rectangulo sea mayor que 21.

b) Calcular la probabilidad de que Y ≥ 3X2

15

Page 16: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

59. Se observa que el tiempo diario de estudio, ademas de las horas de clase, de unalumno medio sigue una distribucion normal con media 2 y desviacion tıpica 0.4(en horas).

a) Se considera que ha tenido un dia de poco estudio si estudia menos de hora ymedia. Calcular la probabilidad de que esto ocurra.

b) Se observa su comportamiento durante cinco dıas consecutivos (de un lunes aun viernes). Hallar la probabilidad de que en ese perıodo tenga al menos 4 diasde poco estudio.

c) Segun la normativa europea, el curso academico tiene 200 dıas de estudio. Hallarla probabilidad de que a lo largo de un curso academico estudie mas de 350 horasen total.

En los apartados b) y c) suponer que los tiempos que dedica al estudio en diasdistintos son independientes.

60. El tiempo (en meses) que tardan en sufrir una averıa los ordenadores de un deter-minado modelo es una variable aleatoria con funcion de densidad f(t) = (1/4)e−t/4,para t > 0.

(a) Calcular la probabilidad de que uno de estos ordenadores funcione sin averıasdurante mas de cinco meses.

(b) Si se seleccionan al azar 6 ordenadores nuevos de ese modelo ¿cual es la prob-abilidad de que al menos 3 de ellos funcionen sin averıas durante mas de 5 meses?

(c) Si se seleccionan al azar 600 ordenadores nuevos de ese modelo, ¿cual es laprobabilidad de que al menos 180 de ellos funcionen sin averıas durante mas de 5meses?

61. La longitud de las varillas fabricadas en una factorıa sigue una distribucion normalN(30, 2) (en cm).

a) Se eligen dos varillas al azar e independientemente. Calcula la probabilidad deque la diferencia de sus longitudes sea menor que 1 cm.

b) De las dos varillas nos quedamos con la mas larga. Calcula la probabilidad deque su longitud sea menor que 31 cm.

62. El tiempo de permanencia de los coches en un gran aparcamiento es una vari-able aleatoria de media 176 minutos y desviacion tıpica 40 minutos. Calcularaproximadamente la probabilidad de que el tiempo medio de permanencia en elaparcamiento de 100 coches elegidos al azar sea superior a 180 minutos. Indicar

16

Page 17: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

claramente las suposiciones previas y las aproximaciones en las que se basa lavalidez del calculo realizado.

63. Calcular la funcion generatriz correspondiente a la distribucion de Poisson (λ)

(≡ P(λ)), cuya funcion de probabilidad es P{X = k} = e−λ λk

k!, k = 0, 1, . . . ,

Demostrar que si X1, . . . , X1000 son v.a.i.i.d. con distribucion P(1) entonces Z =∑1000i=1 Xi ∼ P(1000)

64. El centro de calculo de una universidad dispone de un servidor para gestionar laspaginas web personales de profesores y alumnos. Supongamos que la cantidad dememoria ocupada por una de estas paginas puede considerarse como una variablealeatoria con una media de 1.3 MB y una desviacion tıpica de 0.3. Si el servidorva a gestionar un total de 500 paginas, calcular aproximadamente la probabilidadde que la cantidad total de memoria necesaria supere los 660 MB.

65. Se han medido los tiempos de residencia en memoria de 13171 programas obtenien-dose que la media muestral es 0.05 y la varianza muestral es 0.006724. Si el tiempode residencia es una variable aleatoria con distribucion gamma de parametros ay p, calcular las estimaciones de estos parametros obtenidas por el metodo de losmomentos.

66. El peso de las personas de una poblacion sigue una distribucion Normal con media72 kg. y desviacion tıpica 10.

a) Cuatro personas elegidas al azar en esa poblacion entran en un ascensor cuyacarga maxima es de 350 Kg. ACual es la probabilidad de que entre los cuatrosuperen esa carga maxima?

b) ACual es la probabilidad de que dos personas, elegidas al azar en esa poblacion,puedan jugar en un balancın, si solo pueden hacerlo cuando sus pesos difieren enmenos de 5 kg?

67. Cierto individuo valora como factor decisivo para la compra de un coche el consumode gasolina. Debe decidir entre dos modelos A y B.

El fabricante de A afirma que su consumo sigue una distribucion N(8; 5) (enlitros/100 Km.), mientras que el de B dice que es N(8; 3).

17

Page 18: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

a) Hallar la probabilidad de que el coche A consuma mas de 9 litros y la proba-bilidad de que B consuma entre 7 y 8,5 litros.

b) Si decide comprar el modelo B, calcular la probabilidad de que ahorre mas de2 litros/100 Km.

68. En un examen se plantean 10 cuestiones a las que debe responderse verdaderoo falso. Un alumno aprobara el examen si al menos 7 respuestas son acertadas.AQue probabilidad de aprobar tiene un estudiante que responde todo al azar? AYuno que sabe el 30% de la asignatura?

69. Para llegar a una medida del ”pie”, en el siglo XVI en Alemania, se realizo lasiguiente operacion. En un domingo se alinearon los 60 primeros hombres quellegaron a la iglesia y se midio, en cada uno, la longitud de su pie izquierdo; a lalongitud media se le denomino ”pie legal”.

Si la longitud media del pie izquierdo de un hombre adulto en Alemania era µy la desviacion tıpica 12 mm., calcular la probabilidad de que dos ”pies legales”definidos respecto a dos grupos distintos de hombres difieran en mas de 5 mm.

ACuantos hombres deberıan tomarse para que, con probabilidad 0’99, la dimensionmedia de sus pies difiera de µ en menos de 0’5mm.?

AY si la desviacion tıpica es desconocida?

70. El coseno X del angulo con el que se emiten los electrones en un proceso radiactivoes una variable aleatoria con funcion de densidad

fθ(x) =

{1+θx

2si − 1 ≤ x ≤ 1 (−1 ≤ θ ≤ 1)

0 en el resto

Consideremos una muestra aleatoria (X1, . . . , Xn) de esta variable aleatoria.

(a) Obtener el estimador de θ por el metodo de los momentos.

(b) Calcular la varianza de este estimador y demostrar que es consistente paraestimar θ.

71. Una variable aleatoria X tiene un funcion de densidad f(x) = e−(x−θ) siendo x ≥ θ.

a) Calcular E(X) y obtener un estimador de θ basado en la media muestral (ometodo de los momentos). Calcular la esperanza del estimador obtenido.

18

Page 19: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

b) Obtener un estimador de Θ por el metodo de la maxima verosimilitud.

72. La lectura de voltaje dada por un voltımetro conectado a un circuito electrico esuna variable aleatoria con distribucion uniforme en el intervalo (θ, θ + 1), siendo θel verdadero valor (desconocido) del voltaje. Sea X1, . . . , Xn una muestra aleatoriade lecturas de dicho voltımetro.

(a) Demostrar que la media muestral X es un estimador sesgado de θ y calcularel sesgo.

(b) Calcular el error cuadratico medio de X.

(c) Obtener, a partir de X, un estimador insesgado de θ.

73. Obtener el estimador de maxima verosimilitud, basado en muestras de tamano n,para el parametro θ en una distribucion uniforme en [0, θ]. Estudiar su compor-tamiento lımite. ¿Es un estimador insesgado de θ?

74. El error en la medida de una magnitud es una variable aleatoria con funcion dedensidad f(x) = 1√

2πθexp(−x2

2θ) para x ∈ (−∞,∞) (θ > 0). Calcular el estimador

de maxima verosimilitud de Vθ(X) = θ. ¿Es consistente?

75. Un partido polıtico que concurre a las elecciones municipales en una gran ciudadquiere encargar una encuesta para estimar su porcentaje P de votacion medianteun intervalo de la forma P ± 1.5 cuyo nivel de confianza sea 0.95. ¿Que tamanomuestral debe utilizarse en la encuesta para alcanzar aproximadamente este obje-tivo sabiendo que en un pequeno sondeo orientativo (muestra piloto) el porcentajede votacion estimado fue del 15%?

76. El numero de errores en el analisis de un cierto producto sigue una distribucionde Poisson de parametro λ. Una muestra de 400 datos ha dado los siguientesresultados

No¯ errores 0 1 2 3 4 5

No¯ analisis 213 128 37 18 3 1

a) Obtener un estimador de λ basado en la media muestral. Calcular la esperanzadel estimador obtenido.

19

Page 20: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

b) Hallar un intervalo de confianza de nivel 95% para el parametro λ

77. Se quiere comparar dos metodos, A y B para determinar el calor latente de fusiondel hielo. La siguiente tabla da los resultados obtenidos (en calorıas por gramo demasa para pasar de -0.72o

¯ C a 0o¯) usando reiteradamente ambos metodos:

Metodo A: 79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04, 79.97, 80.05, 80.03, 80.02,80.00, 80.02.

Metodo B: 80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95, 79.97.

Se supone que en ambos metodos el calor tiene una distribucion normal.

Obtener un intervalo de confianza de coeficiente 0.95 para comparar las medicionesmedias obtenidas por ambos metodos. Comprobar primero si se puede suponerque las varianzas son iguales.

78. Una caracteristica de los individuos de una poblacion sigue una distribucion normalde media µ y varianza σ2 = 16. Dicha caracteristica se observara en n individuoselegidos al azar e independientemente. Sea X la media que se obtendra de las nobservaciones

a) Si n = 100 calcular A para que con probabilidad 90100

se tenga que µ ≤ X + A

b) Calcular el tamano n que debe tener la muestra para que con probabilidad 95100

se tenga que µ ≤ X + 0.32

c) Si n = 64 x = 15 σ es desconocida y s2 = 9 calcular un intervalo de confianzadel 98% para la media.

79. Las tensiones de rotura (en Kp.) de 5 cables de un determinado metal fueron 660,460, 540, 580, 550. Suponiendo normalidad para las tensiones:

(a) Estimar la tension media de rotura mediante un intervalo de confianza decoeficiente 0.95.

(b) Estimar σ2 mediante un intervalo de confianza de coeficiente 0.9.

80. Se desea estimar el tiempo medio de ejecucion µ de un programa. Para ello seejecuta dicho programa 6 veces utilizando conjuntos de datos elegidos aleatoria-mente, obteniendose que la media muestral y la cuasi-desviacion tıpica muestralson, respectivamente, x = 230 ms. y s = 14 ms. Obtener un intervalo de confianzaal 98% para µ. (suponer normalidad).

20

Page 21: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

81. (a) Se desea evaluar aproximadamente, por el “metodo de Montecarlo”, la in-tegral p =

∫ 10 f(x)dx de una funcion continua f : [0, 1] → [0, 1]. Para ello

se generan 500 observaciones independientes (Xi, Yi), i = 1, . . . , 500 con dis-tribucion uniforme en el cuadrado [0, 1]× [0, 1] y se estima p mediante

p =500∑i=1

Zi

500,

donde Zi vale 1 si Yi ≤ f(Xi) y 0 en caso contrario. ¿Que distribucion tienenlas Zi?. Obtener un intervalo de confianza de nivel 0.99 para estimar p.

(b) Supongamos ahora que se desea evaluar por el metodo de Montecarlo laintegral p =

∫ 10 x2dx. ¿Cuantos puntos (Xi, Yi) habrıa que generar para tener

una probabilidad 0.99 de evaluar p con un error inferior a una centesima?

82. Los tiempos de ejecucion (en segundos) de 40 trabajos procesados por un centrode calculo han resultado ser

10 19 90 40 15 11 32 17 4 15223 13 36 101 2 14 2 23 34 1527 1 57 17 3 30 50 4 62 489 11 20 13 38 54 46 12 5 26

Calcular la media y la cuasi-desviacion tıpica muestrales. Obtener intervalos deconfianza al 90% para la media y la varianza del tiempo de ejecucion de un trabajo,suponiendo que esta variable aleatoria tiene distribucion normal.

83. En una ciudad se quiere hacer un estudio rapido para valorar el consumo de aguaen los domicilios particulares durante los meses de mayor sequıa. Para ello seseleccionaron al azar 15 domicilios y se midieron sus consumos (xi) en metroscubicos durante el mes de agosto. Los resultados fueron

∑xi = 280.5,

∑x2

i =5308.35. En vista de estos datos ¿hay suficiente evidencia estadıstica, al nivel 0.05,a favor de la hipotesis de que el consumo medio de los particulares durante el mesde agosto es mayor que 18 m3 (que es el consumo considerado como “sostenible”)?

84. La duracion media de una muestra de 10 bombillas es x = 1250 horas, con unacuasidesviacion tıpica muestral de sX = 115. Se cambia el material del filamentopor otro nuevo y, entonces, de una muestra de 12 bombillas se obtuvo una duracionmedia de y = 1340 horas, con una cuasidesviacion tıpica muestral de sY = 106.

a) ¿Puede aceptarse que las varianzas, antes y despues del cambio de filamento,son iguales? ¿Bajo que hipotesis?

21

Page 22: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

b) ¿Ha aumentado la duracion media de las bombillas?

85. El consumo de gasolina (en litros por 100 Km.) de los coches de un determinadomodelo sigue una distribucion normal con media 8. Se ha introducido una modifi-cacion en el motor con objeto de disminuir el consumo y se han probado 10 cochescon el motor modificado, obteniendose los siguientes consumos por 100 Km: 7.8,7.7, 8.1, 7.6, 8.0, 7.7, 7.6, 8.2, 7.3, 7.5.

Suponiendo que la modificacion mantiene la normalidad, ¿hay suficiente evidenciaestadıstica (al nivel de significacion 0.05) para poder afirmar que la modificacionha reducido el consumo medio?

NOTA: Denotando las observaciones por xi, se tiene∑

xi = 77.5,∑

x2i = 601.33.

86. En un proyecto de investigacion se necesita resolver un gran numero de ecuacionesdiferenciales por metodos numericos. Para ello utilizan un programa FORTRANdisenado por uno de los investigadores del equipo. Una empresa de software ofreceun nuevo programa de resolucion de ecuaciones afirmando que es mas rapido queel antiguo. Antes de decidir la adquisicion del nuevo programa, los responsablesdel proyecto de investigacion realizan una prueba, eligiendo al azar 12 ecuacionesy resolviendo cada una de ellas con el programa antiguo y con el nuevo. Losresultados fueron

12∑i=1

xi = 51.6,12∑i=1

x2i = 226.2,

12∑i=1

yi = 46.8,12∑i=1

y2i = 186.84,

12∑i=1

xiyi = 205.36

donde xi e yi denotan, respectivamente, los tiempos (en minutos) empleados porel programa antiguo y por el nuevo en resolver la ecuacion i-esima.

¿Proporcionan estos datos suficiente evidencia estadıstica, al nivel 0.05, a favorde la hipotesis de que el nuevo programa es mas rapido que el antiguo? Indicarclaramente las suposiciones requeridas para la validez del procedimiento empleado.

87. La concentracion media de dioxido de carbono en el aire en una cierta zona noes habitualmente mayor que 355 p.p.m.v. (partes por millon en volumen). Sesospecha que esta concentracion es mayor en la capa de aire mas proxima a lasuperficie. Para contrastar esta hipotesis se analiza el aire en 20 puntos elegidosaleatoriamente a una misma altura cerca del suelo. Resulto una media muestral de580 p.p.m.v. y una cuasi-desviacion tıpica muestral de 180. Suponiendo normali-dad para las mediciones, ¿proporcionan estos datos suficiente evidencia estadıstica,al nivel 0.01, a favor de la hipotesis de que la concentracion es mayor cerca delsuelo?

22

Page 23: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

88. Se han seleccionado al azar 500 usuarios de correo electronico en Estados Unidosy ha resultado que 22 de ellos han recibido virus informaticos a traves del correolo largo del ultimo ano. Se ha realizado otro muestreo independiente eligiendoal azar 300 usuarios en la Union Europea resultando que 9 de ellos han tenidoproblemas de este tipo en el mismo perıodo. ¿Proporcionan estos datos suficienteevidencia estadıstica, al nivel 0.05, a favor de la hipotesis de que la incidencia delos virus es mayor en Estados Unidos? El p-valor del contraste ¿es mayor o menorque 0.01?

89. Se ha hecho un estudio para comparar los tiempos de acceso, en diferentes mo-mentos del dıa, a internet desde ordenadores domesticos con modem. Para ello secargan 8 paginas web por la tarde en el perıodo de 14 a 15 h. y, con el mismoordenador, las mismas 8 paginas por la noche en el perıodo de 22 a 23 h. Losrespectivos tiempos de acceso en minutos fueron

De 22 a 23 h. 2.9 1.4 1.2 3.4 1.3 2.5 1.6 1.8De 14 a 15h. 2.3 1.5 1 2.7 1.4 1.9 0.8 1.1

¿Hay suficiente evidencia estadıstica, al nivel 0.01, a favor de la hipotesis de queel acceso es mas lento en el horario nocturno?

90. El tiempo de acceso al disco duro en un cierto modelo de ordenadores es unavariable aleatoria con media 15 milisegundos. Se ha propuesto una modificaciontecnica con objeto de disminuir este tiempo de acceso. Se prueba el nuevo sistemaen 10 ordenadores obteniendose una media muestral x = 14 ms. y una cuasi-desviacion tıpica muestral s = 2.286.

(a) ¿Hay suficiente evidencia estadıstica, al nivel 0.05, a favor de la hipotesis deque el nuevo modelo disminuye el tiempo de acceso?

(b) Calcula aproximadamente el p-valor. Indica un par de valores de x y de s quehubiesen llevado a un p-valor de 0.005. ¿Que decision se deberıa tomar en estecaso respecto al nuevo modelo?

91. Un metodo estadıstico de reconocimiento de formas para distinguir entre la letraB y el numero 8 se basa en observar una v.a. X definida como el cociente dela altura del sımbolo y la longitud del arco en el lado izquierdo y realizar untest de hipotesis. Supongamos que la distribucion de X cuando el sımbolo es

23

Page 24: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

8 es N(0.8, 0.01) y la distribucion de X cuando el sımbolo es B viene dada porN(0.96, 0.01). El problema de reconocimiento de formas puede formularse entoncescomo un problema de contraste de hipotesis del tipo

H0 : E(X) = 0.8 frente a H1 : E(X) = 0.96

Si se decide rechazar H0 siempre que x > 0.90, calcular las probabilidades deerrores de tipo I y II.

92. Para determinar el precio de sus polizas, una empresa de seguros tiene siempre encuenta el siguiente Principio basico (conocido desde hace anos):

Como mucho un 2 por ciento de los vehıculos asegurados sufre algun rasguno enla chapa cada ano.

Para ver si este dato sigue siendo correcto, decide hacer un estudio tomando unamuestra de 1000 asegurados. Obtiene que 30 de ellos ha tenido durante ese anoalgun raguno en la chapa.

a) Determina el p-valor de este contraste.

b) Sabemos que en todo contraste de hipotesis hay un margen de error. Porejemplo, puede que el Principio basico sea correcto, pero nuestro contraste digaque no lo es. Queremos que ese error sea pequeno, de modo que, si el Principiobasico es correcto, con un 99,9 por ciento de probabilidad nuestro contraste locorrobore. Planteando ası el contraste y con los datos anteriores, decide si haysuficiente evidencia estadıstica a favor de que el Principio basico es incorrecto.

93. Un metodo de tratamiento contra la leucemia mieloblastica aguda consiste ensometer al paciente a quimioterapia intensiva. Se sabe que este tratamiento pro-porciona un porcentaje de remision de un 70%. Se aplica un nuevo metodo detratamiento a 50 voluntarios. ¿Cual es el mınimo numero de casos de remision dela enfermedad que debe observarse para poder afirmar (a un nivel de significaciondel 0.025) que el nuevo metodo produce una tasa de remision mas alta que elantiguo?

94. En un estudio sobre un nuevo programa piloto para el aprendizaje a distancia porordenador, se eligieron al azar 21 estudiantes de una clase para seguir el nuevoprograma (grupo piloto) mientras que los 23 restantes seguıan el metodo habitual(grupo control).

Finalizado el curso, se realizo un examen obteniendose los siguientes resultados:Grupo piloto: Calificacion media = 51,48 puntos, Cuasi-desviacion tıpica = 11,01.Grupo control: Calificacion media = 41,52 puntos, Cuasi-desviacion tıpica =14,15

24

Page 25: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

Suponiendo igualdad de varianzas, contrastar si hay evidencia estadıstica (a nivelα = 0, 05) de que el nuevo metodo piloto da mejores resultados que el metodohabitual.

Indicar claramente el modelo probabilıstico utilizado y todos los elementos el con-traste realizado.

95. Dos empresas competidoras (A y B) en un mismo sector han puesto en marcha, casisimultaneamente, paginas de internet para la venta electronica. Se han elegido alazar ocho clientes que han visitado la pagina A y, de manera independiente, otrosocho que han visitado la B y se han medido el tiempo (en minutos) de la duracionde la visita de cada cliente. Los resultados fueron los siguientes:

Pagina A (x) 2.3 3.5 4.2 3.2 4.4 2.1 1.6 5.3Pagina B (y) 1.3 2.3 4.4 3.7 2.8 6.5 3.6 4.5

¿Proporcionan estos datos suficiente evidencia estadıstica (al nivel 0.05) para afir-mar que los tiempos medios de duracion de las visitas en ambas paginas sondiferentes? Indicar claramente las suposiciones en las que se basa la validez delmetodo empleado.

[∑

xi = 26.6,∑

yi = 29.1,∑

x2i = 99.84,

∑y2

i = 123.33]

96. En la fabricacion de chips para circuitos integrados hay una variable, denominadaamplitud de ventana que esta relacionada con los procedimientos de interconexionentre los circuitos.

Se desea estudiar el efecto que tiene sobre la amplitud de ventana una determinadareaccion quımica que se produce durante el proceso de fabricacion de los chips.Para ello se ha medido dicha variable (Phadke et al. (1983) Bell System Tech. J.)antes de la reaccion quımica, en una muestra aleatoria de 10 lugares, obteniendoselos siguientes resultados (en milimicras):

xi: 2.52, 2.50, 2.66, 2.73, 2.71, 2.67, 2.06, 1.66, 1.78, 2.56

Se midieron tambien las amplitudes de ventana, despues de la reaccion en unanueva muestra independiente de la anterior, obteniendose

yi: 3.21, 2.49, 2.94, 4.38, 4.02, 3.82, 3.30, 2.85, 3.34, 3.91

Suponiendo normalidad e igualdad de las varianzas poblacionales (antes y despuesde la reaccion), ¿hay suficiente evidencia estadıstica (al nivel de significacion 0.01)para poder afirmar que despues de la reaccion ha aumentado la amplitud mediade ventana? Indicacion:

∑xi=23.85,

∑x2

i =58.3231,∑

yi=34.26,∑

y2i =120.5412.

25

Page 26: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

97. El gasto telefonico medio bimensual en una muestra de 10 usuarios elegidos al azaren una ciudad ha resultado ser 90 euros y la cuasi-desviacion tıpica, 11 euros. Enotra ciudad se ha tomado, de modo independiente, otra muestra de 12 usuariosy los valores obtenidos para la media y la cuasi-desviacion tıpica muestrales hansido, respectivamente, 80 y 10.

(a) ¿Proporcionan estos datos suficiente evidencia estadıstica, al nivel 0.05, afavor de la hipotesis de que el gasto medio en la primera ciudad es mas altoque el gasto medio en la segunda? Suponer que las varianzas de las variablesque indican los gastos telefonicos en ambas ciudades son iguales. Indicarclaramente las restantes suposiciones necesarias para garantizar la validezdel procedimiento empleado.

(b) El p-valor ¿es mayor o menor que 0.01? Razonar la respuesta.

98. Con objeto de averiguar si la estatura de las personas disminuye significativamentea lo largo de la jornada se seleccionaron al azar diez mujeres de la misma edad delas que se midio su estatura (en cm.) por la manana al levantarse (Xi) y por lanoche antes de acostarse (Yi). Se obtuvieron los siguientes resultados:

Xi 169.7 168.5 165.9 177.8 179.6 168.9 169.2 167.9 181.8 163.3Yi 168.2 166.4 166.7 177.2 177.9 168.0 169.5 166.7 182.5 161.1

¿Proporcionan estos datos suficiente evidencia estadıstica, al nivel 0.05, a favor dela hipotesis de que la estatura disminuye a lo largo de la jornada?

99. Se ha realizado un estudio comparando la cantidad media (en kilos/ano) de dese-chos contaminantes (aceite de automoviles, baterıas, pinturas,...) producidos porcasas particulares y pequenos negocios. Para ellos se han seleccionado dos mues-tras (de tamanos n1 = 1000 y n2 = 1500) en dos ciudades distintas (1 y 2). Lasmedias muestrales obtenidas han sido x1 = 10.60 kilos/ano y x2 = 13.4 kilos/ano,respectivamente. Las cuasi-varianzas muestrales han sido s2

1 = 14 y s22 = 16. ¿Pro-

porcionan estos datos suficiente evidencia estadıstica, al nivel 0.01, a favor de lahipotesis de que en la ciudad 2 la cantidad media de desperdicios es mas alta queen la primera? Suponer que las varianzas de las variables que indican las canti-dades de residuos en ambas ciudades son iguales. Indicar claramente las restantessuposiciones necesarias para garantizar la validez del procedimiento empleado.

26

Page 27: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

100. Un cierto programa de ordenador se supone que genera cifras de cero a nuevetotalmente al azar. De 200 cifras obtenidas se observaron las siguientes frecuencias:

0 1 2 3 4 5 6 7 8 9Frecuencias 27 22 15 18 23 26 19 20 16 14

Con un nivel de significacion de 0.05, ¿es bueno el programa?

101. Segun los datos de un exhaustivo estudio de mercado que se realizo en una granciudad, las ventas de impresoras para ordenadores personales de uso domesticose dividen entre cuatro marcas (A, B, C y D) cuyos porcentajes del total de lasventas son 18%, 22%, 35% y 25%, respectivamente.

Un ano despues, se quiere analizar de nuevo la situacion pero no se dispone dedinero para repetir un estudio de mercado a gran escala. Se decide, por tanto,observar la marca adquirida por 200 compradores de impresoras elegidos al azar,obteniendose que de ellos 28 habıan elegido la marca A, 48 la B, 77 la C y 47 laD. ¿Hay suficiente evidencia estadıstica, al nivel 0.05, para afirmar que el repartodel mercado ya no es el mismo que el ano anterior?

102. En el transcurso de dos horas, el numero de llamadas por minuto, solicitadas auna centralita telefonica fue:

No¯ llamadas/minuto 0 1 2 3 4 5 6

Frecuencia 6 18 32 35 17 10 2

¿Se puede aceptar que el numero de llamadas por minuto sigue una distribucionde Poisson?

103. Se quiere estudiar la relacion entre la edad de los chicos y el tiempo T que vensemanalmente la television. Con una muestra de 200 chicos se obtuvieron lossiguientes resultados

TIEMPOCHICOS A B C

P 20 30 30M 20 40 60

indicando por P el grupo formado por los chicos entre 6 y 10 anos, M el grupo delos chicos entre 11 y 15 anos, A el grupo de chicos que ven la television menos de14 horas, B entre 14 y 18 horas, C ven la television mas de 18 horas.

27

Page 28: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

a) Indicar el tipo de contraste adecuado para esta situacion, plantear la hipotesisnula y decidir si hay evidencia estadistica significativa con nivel α = 0.05 de queexiste relacion entre la edad y el tiempo que ven la television. b) Preguntados 200chicos del grupo P sobre el numero de horas que ven la television en sabado seobtuvieron los siguientes resultados

No¯ horas 0 1 2 3 4

No¯ chicos 30 50 50 30 40

Es admisible que el numero de horas que ven la television (con α = 0.05) sigueuna distribucion de Poisson?

104. En un estudio sobre el uso de sistemas operativos se han seleccionado al azar 150profesores universitarios (PU), 150 profesionales tecnicos (PT) de grado medio quetrabajan en la industria y 150 personas con cargos directivos (CD) en empresas. Acada uno de los seleccionados se le ha preguntado cual es el sistema operativo (A,B o C) que utiliza habitualmente en su trabajo con ordenadores. Los resultadosse resumen en la siguiente tabla:

A B CPU 52 40 58PT 42 45 63CD 28 47 75

¿Hay suficiente evidencia estadıstica, al nivel 0.05, para concluir que existe algunaasociacion entre el status profesional y la preferencia por un sistema operativo?Formular con precision la hipotesis que se contrasta. Indicar razonadamente si elp-valor es mayor o menor que 0.01.

105. Una fabrica de automoviles quiere averiguar si la preferencia de modelo tienerelacion con el sexo de los clientes. Se toman dos muestras aleatorias de 1000hombres y 1000 mujeres observandose las siguientes preferencias:

MODELOSEXO A B CMujer 340 400 260

Hombre 350 270 380

¿Son homogeneas las preferencias entre hombres y mujeres, al nivel de significacion0.01?

28

Page 29: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

Supongamos ahora que los resultados de la tabla anterior correspondiesen a unamuestra aleatoria de 2000 personas, clasificadas de acuerdo con el doble criteriosexo/preferencia de modelo. ¿En que se modificarıa el planteamiento o la inter-pretacion de los resultados anteriores?

106. Un estudio sobre tabaquismo en tres comunidades, mediante tres muestras aleato-rias de tamano 100, proporciona los siguientes resultados:

Comunidad fumadores no fumadoresA 13 87B 17 83C 18 82

¿Pueden considerarse homogeneas las tres poblaciones en cuanto a sus habitosfumadores, al nivel 0.05?

107. Se ha realizado una encuesta en una ciudad con objeto de estudiar las posiblesrelaciones entre el nivel educativo (educacion superior, media o primaria) de laspersonas y el nivel de consumo (bajo, medio o alto) de un determinado producto.Los resultados, para 400 personas seleccionadas al azar, han sido:

BAJO MEDIO ALTOSUPERIOR 31 41 44

MEDIA 28 79 125PRIMARIA 16 17 19

Contrastar estadısticamente (al nivel 0.01) la independencia entre el nivel educa-tivo y el nivel de consumo.

108. En un estudio (H. Behbahani, Universidad de Florida, 1977) acerca del efecto dela tasa agua/cemento sobre la resistencia del material resultante al cabo de 28dıas, se obtuvieron los siguientes datos

X=Tasa agua/cemento 1.21 1.29 1.37 1.46 1.62 1.79Y =Resistencia (100 pies/libra) 1.302 1.231 1.061 1.040 0.803 0.711

Ajustar un modelo lineal simple.

29

Page 30: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

109. Se desea estudiar la relacion entre la intensidad de regadıo (x) y la productividad(Y) de un cierto cultivo. Se han obtenido los siguientes resultados:

xi : 9 10 13 15 18 13Yi : 36 44 48 63 70 45

Ajustar un modelo lineal simple.

110. K. Pearson estudio la relacion entre la altura del padre (X) y la de su hijo (Y )tomando 1078 casos de padres con uno o dos hijos (datos de 1903). Observo quelas variables X e Y se ajustaban bien a una Normal bivariante con parametros(en cm):

µ1 = 172, σ1 = 6, 91, µ2 = 174, 4, σ2 = 6, 98, ρ = 0, 51.

a) Hallar la altura esperada de un hijo cuyo padre mide 178 cm.

b) Si se elige una familia al azar, calcular la probabilidad de que la altura del hijosupere en 5 cm la del padre.

c) Probabilidad de que la altura de un hijo supere los 180 cm.

d) Probabilidad de que la altura de un hijo supere los 180 cm, sabiendo que supadre mide 176 cm.

111. Se ha realizado un experimento para medir la velocidad del sonido en el aire adiferentes temperaturas. Los resultados obtenidos se indican en la siguiente tabla:

Temperatura en 0C (x) -13 0 9 20 33 50Velocidad en m/s (y) 322 335 337 346 352 365

Estimar la funcion de regresion lineal de y sobre x.

[∑

xi = 99,∑

yi = 2057,∑

x2i = 4239,

∑y2

i = 706323,∑

xiyi = 35633]

30

Page 31: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

112. En la siguiente tabla de datos la variable y representa la pureza (en porcentaje) deloxıgeno producido en un cierto proceso quımico de destilacion y x es el porcentajede hidrocarburos presentes en el condensador principal de la unidad de destilacion.

N0 de observacion Nivel de hidrocarburo, x (%) Pureza, y (%)1 0.99 90.012 1.02 89.053 1.15 91.434 1.29 93.745 1.46 96.736 1.36 94.457 0.87 87.598 1.23 91.779 1.55 99.4210 1.40 93.6511 1.19 93.5412 1.15 92.5213 0.98 90.5614 1.01 89.5415 1.11 89.8516 1.20 90.3917 1.26 93.2518 1.32 93.4119 1.43 94.9820 0.95 87.33

Efectuado un analisis con el programa SPSS se obtiene:

Interpretar los resultados.

31

Page 32: 2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

113. Una companıa productora de energıa electrica esta interesada en desarrollar unmodelo que relacione la “demanda pico” por hora (variable Y , en kw) con el usototal de energıa al mes (variable X, en kwh). La siguiente tabla muestra losresultados obtenidos en una muestra de 50 clientes:

Cliente Xi Yi Cliente Xi Yi

1 679 0.79 26 1434 0.312 292 0.44 27 837 4.203 1012 0.56 28 1748 4.884 493 0.79 29 1381 3.485 582 2.70 30 1428 7.586 1156 3.64 31 1255 2.637 997 4.73 32 1777 4.998 2189 9.50 33 370 0.599 1097 5.34 34 2316 8.1910 2078 6.85 35 1130 4.7911 1818 5.84 36 463 0.5112 1700 5.21 37 770 1.7413 747 3.25 38 724 4.1014 2030 4.43 39 808 3.9415 1643 3.16 40 790 0.9616 414 0.50 41 783 3.2917 354 0.17 42 406 0.4418 1276 1.88 43 1242 3.2419 745 0.77 44 658 2.1420 795 3.70 45 1746 5.7121 540 0.56 46 895 4.1222 874 1.56 47 1114 1.9023 1543 5.28 48 413 0.5124 1029 0.64 49 1787 8.3325 710 4.00 50 3560 14.94

Efectuado un analisis con el programa SPSS se obtiene:

Interpretar los resultados.

32