Muestras Aleatorias y Distribuciones de Muestreo

Embed Size (px)

Citation preview

Pag. 1 Estadstica I Prof. Luis Ramrez MUESTRAS ALEATORIAS Y DISTRIBUCIONES DE MUESTREO Definicin:Silasvariablesaleatoriasx1.x2...........xn.tienenlamismafuncinde densidaddeprobabilidadqueladeladistribucindelapoblacin,ysufuncinde distribucinconjuntadeprobabilidadesigualalproductodelasmarginales,entonces x1.x2............xn formanunconjuntodenvariablesaleatoriasindependientese idnticamentedistribuidas(IID)queconstituyenunamuestraaleatoriadela poblacin. Definicin:UnParmetroesunacaracterizacinnumricadeladistribucindela poblacin de manera que describe, parcial o completamente la funcin de densidad de poblacin de la caracterstica de inters. Definicin:Unaestadstica(unestadstico)escualquierfuncindelasvariables aleatoriasqueseobservaronenlamuestra,demaneraqueestafuncinnocontiene cantidades desconocidas. Definicin:Ladistribucindemuestreodeunaestadsticaesladistribucinde probabilidadquepuedeobtenersecomoresultadodeunnmeroinfinitodemuestras aleatoriasindependientes,cadaunadetamaonprovenientesdelapoblacinde inters. TEOREMA:Seanx1.x2...........xn,unconjuntodevariablesaleatoriasindependientes normalmentedistribuidasconmediasE(xi)=yvarianzasVar(xi)=oi2,parai= 1.2.......n.SiY=a1x1+a2x2+......+anxn,endondea1.a2...ansonconstantes,entonces Y es una variable aleatoria distribuida normalmente con mediaE(y) = a11 + a22 +......+ ann y varianzaVar(y) = a12o12 + a22o22 +...+an2on2. TEOREMA DEL LMITE CENTRAL : Sean x1.x2.........xn, n variables aleatorias independientes idnticamente distribuidas con media y varianza o2 ambas finitas. La suma de esas variables Sn = x1+x2+ ...+ xn es una variable aleatoria con media n y varianza no2, entonces Z= 2 nno SnsedistribuyecomounanormalN(0;1).Enotraspalabras,elteorema expresa que cuandon crece sin lmite, la variable z tiende a distribuirse normalmente. Si las variables no son idnticamente distribuidas, se podra demostrar igualmente que: z=-2ii o xisedistribuyecomounanormalN(0;1),esdecirquelasumade variablesindependientestiendeasernormalconmediasumademediasyvarianza suma de varianzas. Pag. 2 Estadstica I Prof. Luis Ramrez DISTRIBUCIN DE LA MEDIA MUESTRALX : Def.Seax1,x2, xnunamuestraaleatoriadetamaondeunapoblacinconfuncin de densidad f(x) con mediay varianza 2 . La media muestral representada porx , es la media aritmtica de los elementos de la muestra, es decir:nxxn1 ii == . Teorema: Sea x1,x2,..,xn, una muestra aleatoria que consiste de n variables aleatorias independientes normalmente distribuidas con medias E(xi) =y varianzas Var(xi) = 2 , i = 1,2, , n. Entonces la distribucin de la media muestralxes normal con mediay varianza no2. En efecto: E ( x ) = E (nxi) = n1) ( xiE= 1/n(n.) E( x ) = . Var ( x ) = Var||.|

\|nxi = nxiVar2) (= nn22o Var ( x ) = no2. De aqu se tiene quex ~N(, no2.)Luego: Z = ( )nxo ~ N(0,1) Teorema: Sean x1,x2, ..xn una muestra aleatoria de tamao n, de una distribucin normalconmediayvarianza2.Entonceszi= (xi)/sonvariablesaleatorias normalesestndareindependientes,i=1,2,..,ny ni z12= ||.|

\|=n1 i2-oxitieneuna distribucin_2 con n grados de libertad En la tabla correspondiente a esta distribucin, podemos encontrar valores de _o2 tales que P ( _2 > _o2) = o .

_o2 Pag. 3 Estadstica I Prof. Luis Ramrez

La distribucin de muestreo de S2: Teorema: Sea X1, X 2,, Xn, una muestra aleatoria de una distribucin normal con media y varianza 2. Entonces:( )21 i2xo =nix = ( )221os n tiene unadistribucin_2 con (n-1) grados de libertad.xy s2 son tambin variables aleatorias independientes. Ejemplo: Si X1, X2,.,X10 es una muestra aleatoria de una poblacin distribuida normalmente con media 8 y varianza 9. Calcular la probabilidad de que la varianza muestral sea mayor que 3,753 Definicin: Sea Z una variable aleatoria normal estndar y sea _2una aleatoria Ji-cuadrada con v grados de libertad. Entonces si Z y _2 son independientes: T = vZ2_ se dice que tiene una distribucin t con v grados de libertad. Si no se conoce y n < 30, se tiene sustituyendo en la expresin anterior: T = 221) - (n 1)s - (n -oonx|.|

\| = - xsn ~ t n-1g.l. Distribucin F: Supngase que deseamos comparar las varianzas de dos poblaciones normalesbasadosenlainformacincontenidaenmuestrasaleatoriasindependientes delaspoblaciones.Supngasequeunamuestraaleatoriacontienen1 variables aleatorias distribuidas normalmente con una varianza comn o21 y que la otra muestra aleatoriacontienen2 variablesaleatoriasdistribuidasnormalmenteconunavarianza comn o22.Sicalculamos s21delasobservacionesenlamuestra1,entonces s21es unaestimacinde o21.Demanerasimilar s22calculadaapartirdelasobservaciones delasegundamuestraesunaestimacinpara o22.Asintuitivamentepodramos pensar en utilizar ss2221 para hacer inferencias con respecto a las magnitudes relativas de o21 y o22; si dividimos cada s21 por o21entonces la razn siguiente: Pag. 4 Estadstica I Prof. Luis Ramrez oo22222121ss= ss22212122ootieneunadistribucinFcon(n1-1)y(n2-1)gradosdelibertad.La definicin general de una distribucin F es como sigue: Definicin:Sean _21y _22variablesaleatoriasindependientesconv1yv2gradosde libertad respectivamente. Entonces: F = 222121vv__ se dice que tiene una distribucin F con v1 grados de libertad del numerador y v2 grados de libertad del denominador. DISTRIBUCIN DE LA PROPORCIN MUESTRAL: En unapoblacinbinomial, dada una muestra aleatoria (con reemplazamiento), la proporcin muestral se define como el cociente delnmerodeelementos de lamuestra que tienenla caracterstica deseada, entre el nmero total de elementos de la muestranx = p . E ( p ) = E(x/n) = 1/n E(x) = n1np E ( p ) = p Var ( p ) = Var(x/n) = 21nVar(x) = 21nn.p.q Var ( p ) = nq p.luego p ~N (p; pq/n), es decir: Z = npqp - p ~ N (0,1). PROBLEMAS 1.-Unafbricaproductoradealimentosenvasamermeladadefrutaspormediodeunproceso automtico.ELpesonetodeunfrascoseconsideraunavariablealeatoriaconunpromediode 420 gr.Y una desviacin estndar de 15gr. El peso neto de cada frasco no afecta ni es afectado por el peso neto de los otros. Una vez llenos los frascos se empacan en cajas de 72 frascos cada una. cul es la probabilidad de que una caja contenga menos de 30 Kg. De mermelada. 2.- Una empresa firma un contrato para la entrega de 1290 unidades de un producto en un mes. La empresa tiene 64 obreros, el nmero de unidades producidas por obrero por mesesunavariablealeatoriaconmediade20unidadesydesviacinestndarde 2..Cul es la probabilidad de que el contrato sea cumplido?. Pag. 5 Estadstica I Prof. Luis Ramrez 3.-Paraunniveldeingresos,elSENIATsabequelascantidadesdeclaradaspor conceptodededuccionesmdicas,contribucionescaritativasygastosvariosson variables aleatorias independientes, normalmente distribuidas con medias $400; $800 y $100ydesviacionesestndar$100;$250y$40respectivamente.A)Culesla probabilidad de que la cantidad total declarada por concepto de estas tres deducciones noseamayorde$1600?B)Siunapersonaconesteniveldeingresosdeclarapor conceptodeestasdeduccionesuntotalde$2100,qutanprobableesteneruna cantidad igual o mayor a este monto bajo las condiciones dadas?. 4.-Setieneunamquinadellenadoparavaciar500gr.decerealenunacajade cartn.Supngasequelacantidaddecerealquesecolocaencadacajaesuna variable aleatoria normalmente distribuida con media 500gr. Y desviacin estndar igual a 20gr. Para verificar que el peso promedio de cada caja semantieneen 500 gr., se toma una muestra aleatoria de 25 de stas en forma peridica y se pesa el contenido de cadacaja.Elgerentedelaplantahadecididodetenerelprocesoyencontrarlafalla cada vez que el valor promedio de la muestra sea mayor de 510gr. o menor de 490gr. Obtener la probabilidad de detener e proceso. 5.-Supngasequeelnmerodebarrilesdepetrleocrudoqueproduceunpozo diariamente es una variable aleatoria con una distribucin no especificada.Se observa laproduccinen64das,seleccionadosenformaaleatoria,ysisesabequela desviacinestndardelnmerodebarrilespordaes16,determneselaprobabilidad de que la media muestral se encuentra a no ms de 4 barriles del verdadero valor de la produccin por da. 6.-Uninvestigadordeseaestimarlamediadeunapoblacinusandounamuestra suficientemente grande, para que la probabilidad de que la media muestral no difiera de la media de la poblacin en ms del 25% de la desviacin estndar, sea 0,95. De qu tamao debe tomarse la muestra? 7.- Si x1.x2.........x10es una muestra aleatoria de una poblacin distribuida normalmente con media 8 y varianza 9.Calcular la probabilidad de que lamedia de lamuestra sea mayor que 9. 8.- La resistencia a la tensin para cierto tipo de alambre se distribuye normalmente con una mediay una varianza desconocida o2.Se seleccionaron al azar 6 segmentos de alambre de un rollo grande; encuentre la probabilidadde que lamediamuestral esta lo sumo a 2,015 ns de la verdadera media poblacional . 9.-Si x1.x2.....x16es una muestra aleatoria de una poblacin binomial con p =0,7. Cul es la probabilidad de que la proporcin muestral sea menor que 0,5?. 10.-SupngasequequiereencontrarlaproporcindeloshabitantesdeCaracasque favorecelaconstruccindeunalneadelMETRO.Acuntoshabitantesseledebe preguntarparaquelaprobabilidaddequelaproporcinobservadaafavordela construccin de la lnea difiera de la verdadera proporcin en menos del 5% sea0,98?. Pag. 6 Estadstica I Prof. Luis Ramrez 11.-Un fabricante de cigarrillos asegura que el contenido promedio de nicotina en una de susmarcas, es de 0,6mg. por cigarrillo.Una organizacin independientemide el contenido de nicotina de 16 cigarrillos de esta marcay, encuentra que el promedio y la desviacin estndar es de 0,75 y 0,175 mg. Respectivamente de nicotina.Si se supone que la cantidad denicotinaen estoscigarrillos es una variable aleatorianormal, qu tan probable es el resultado muestral dado el dato proporcionado por el fabricante?. 12.-El Departamento de Proteccin al Medio Ambiente asegura que, para un automvil compactoenparticular,elconsumodegasolinaencarreteraesdeungalnporcada 45millas.Unaorganizacinindependientedeconsumidoresadquierenunodeestos automviles y lo somete a prueba con el propsito de verificar la cifra proporcionada por el DPMA.El automvil recorri una distancia de 100 millas en 25 ocasiones.En cada recorridoseanotelnmerodegalonesnecesariospararealizarelviaje.Los25 ensayos,elvalorpromedioyladesviacinestndartuvieronunvalorde43,5y2,5 millas por galn respectivamente.Si se supone que el nmero de milla que se recorre porgalnesunavariablealeatoriadistribuidanormalmente,conbaseenestaprueba existe alguna razn para dudar de la veracidad del dato dado por el DPMA?.