II Trabajo de Probabilidad

Embed Size (px)

DESCRIPTION

Probabilidad y Estadistica

Citation preview

Repblica Bolivariana de VenezuelaMinisterio Para del Poder Popular para la Educacin SuperiorUniversidad Nacional Experimental PolitcnicoAntonio Jos de SucreVice-Rectorado BarquisimetoDepartamento de Ing. Industrial

Inferencia Estadstica

Alumno: Jos R ColmenaresC.I.: 18.432.814Prof.: Eduardo PintoSeccin: 03

Barquisimeto; Marzo 2013MUESTREOEn ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una poblacin), se selecciona una muestra, entendiendo por tal una parte representativa de la poblacin. El muestreo es por lo tanto una herramienta de la investigacin cientfica, cuya funcin bsica es determinar que parte de una poblacin debe examinarse, con la finalidad de hacer inferencias sobre dicha poblacin. La muestra debe lograr una representacin adecuada de la poblacin, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha poblacin que son importantes para la investigacin. Para que una muestra sea representativa, y por lo tanto til, debe de reflejar las similitudes y diferencias encontradas en la poblacin, es decir ejemplificar las caractersticas de sta.Los errores ms comunes que se pueden cometer son:1.- Hacer conclusiones muy generales a partir de la observacin de slo una parte de la Poblacin, se denomina error de muestreo. 2.- Hacer conclusiones hacia una Poblacin mucho ms grandes de la que originalmente se tom la muestra. Error de Inferencia. En la estadstica se usa la palabra poblacin para referirse no slo a personas sino a todos los elementos que han sido escogidos para su estudio y el trmino muestra se usa para describir una porcin escogida de la poblacin. TIPOS DE MUESTREOExisten diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos.

I. Muestreo probabilstico Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo probabilsticos encontramos los siguientes tipos: 1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande. 2.- Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. 3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades...). La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de diferentes tipos: Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales. Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato. Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin.

4.- Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos. II. Mtodos de muestreo no probabilsticos A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la poblacin), pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilstico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la poblacin.Entre los mtodos de muestreo no probabilsticos ms utilizados en investigacin encontramos: 1.- Muestreo por cuotas: Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul. En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin. 2.- Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. Tambin puede ser que el investigador seleccione directa e intencionadamente los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).3.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

4.- Muestreo Discrecional A criterio del investigador los elementos son elegidos sobre lo que l cree que pueden aportar al estudio.ESTIMACION DE PARAMETROSEl proceso de estimacin en inferencia estadstica puede ser descrito como el proceso de estimar un parmetro a partir del estadstico correspondiente, tal como usar una media muestral (Estadstico) para estimar la media poblacional, (parmetro).La estimacin de parmetros puede ser: Puntual o Por Punto. Por Intervalo.

Estimacin Puntual:Tiene como objetivo dar un valor numrico que aproxime en forma muy cercana al parmetro poblacional.La estimacin puntual de un parmetro de una poblacin es un solo valor numrico de un estadstico que corresponde a este parmetro.Un estadstico utilizado para aproximar a un parmetro de una poblacin se denomina Estimador del Parmetro. El nmero obtenido cuando se evala el estimador para una muestra particular, se denomina Estimacin del Parmetro.Sea X una variable aleatoria de inters con distribucin de probabilidad . : Parmetro Desconocido.

M.A. de tamao n.

Estimador:Por ejemplo: es un posible estimador de .: Estimador puntual de , porque al evaluarlo para una muestra es concreto, da un solo nmero o punto. : Estimacin puntual de .

Propiedades De Los Estimadores Puntuales: Insesgabilidad Eficiencia Consistencia

Estimador Insesgado:Sea un estimador puntual de un parmetro , entonces es un estimador insesgado si E ( ) = de lo contrario se dice que es sesgado

Distribucin muestral de un estimador insesgado.

Distribucin muestral de un estimador sesgado positivamente, para el cual Eficiencia Relativa:La eficiencia relativa entre dos estimadores y de un parmetro , con ECM respectivos ECM ( ) y ECM ( ) se define como:

Estimador Consistente:Si es un estimador insesgado de , basado en una M.A. de tamao n, decimos que es consistente para , si:

La consistencia es una propiedad de muestras grandes.

Estimacin Por Intervalo.Un estimador por intervalo es una regla que especifica un mtodo que utiliza las mediciones de la muestra para calcular dos nmeros que forman los extremos del intervalo.Tiene como objetivo encontrar un estimador por intervalo que genere intervalos angostos que contengan a (parmetro) con una alta probabilidad.Los estimadores por intervalo se denominan comnmente intervalos de confianza.Un intervalo de confianza de , es un intervalo [L, U] que incluye a con un grado de certidumbre establecido.L y U se denominan extremos inferior y superior del intervalo de confianza.L: Lmite inferior de confianza.U: Limite de confianza superior.L, U: Estadsticos (variables aleatorias).Para construir un estimador por intervalo del parmetro desconocido, debemos encontrar L y U tal que:P (L U) = 1 La probabilidad 1 se le llama Coeficiente de Confianza. Usualmente, se expresa en porcentaje: 100 (1 ) %.1 es la probabilidad de que el intervalo contenga al parmetro.0 < < 1El intervalo resultante:L USe llama intervalo de confianza del 100 (1 ) % para el parmetro . (Intervalo de confianza de dos lados).En ocasiones un intervalo de confianza de un lado podra ser til.L Intervalo de confianza inferior del 100 (1 ) %. U Intervalo de confianza superior del 100 (1 ) %Donde U se elige de modo que:P ( U) = 1 -

PRUEBAS DE HIPOTESIS DE PARAMETROS

Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro.

Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis.

Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms poblaciones.

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del parmetro.

2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo.

3. Cuando el valor del parmetro proviene de consideraciones externas tales como las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el nombre de prueba hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.

La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es decir, la creencia a priori).La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta generalmente es la hiptesis a investigar. La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis son: Rechazar Ho o No rechazar Ho.

PRUEBAS DE BONDAD DE AJUSTE (CHI-CUADRADO)

PRUEBAS DE BONDAD DE AJUSTE Estas pruebas permiten verificar que la poblacin de la cual proviene una muestra tiene una distribucin especificada o supuesta.

Sea X: variable aleatoria poblacional la distribucin (o densidad) de probabilidad especificada o supuesta para X

Se desea probar la hiptesis:

En contraste con la hiptesis alterna:

PRUEBA CHI-CUADRADO

Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea una muestra aleatoria de tamao n tomada de una poblacin con una distribucin especificada que es de inters verificar.

Suponer que las observaciones de la muestra estn agrupadas en k clases, siendo la cantidad de observaciones en cada clase i = 1, 2,..., k

Con el modelo especificado se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada para la clase i, es decir, la cantidad de datos que segn el modelo especificado deberan estar incluidos en la clase i: ; n, i = 1, 2,..., k

Tenemos entonces dos valores de frecuencia para cada clase i : Frecuencia observada (corresponde a los datos de la muestra) : Frecuencia esperada (corresponde al modelo propuesto)

La teora estadstica demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste:

Definicin: Estadstico para la prueba de bondad de ajuste Chi-Cuadrado

Distribucin Chi-Cuadrado con =kr1 grados de libertad donde r es la cantidad de parmetros de la distribucin que deben estimarse a partir de la muestra. Es una condicin necesaria para aplicar esta prueba que

CASO PRCTICO

1.- Encontrar un intervalo de confianza del 80% para media de una fundicin nodular, sabiendo que a partir de una muestra de 8 probetas que dio los siguientes resultados 9, 14, 10, 12, 7, 13, 11 y 12.

Solucin:Debemos encontrar el intervalo de confianza, para ello usamos la frmula: Pero sabemos que as, = 88; n = 8

(10.0935 ; 11.9065)

Una empresa X concluye que su producto (Tubos de acero cdula 40) tendr una vida til de 10 aos. Se elige una muestra entre los cuales tenemos: 11.8-9.7-10.5-12.1-13.3-13.4-10.3-8.5-15.0-10.5-7.6-6.3. Teniendo en cuenta una desviacin poblacional de 1.2 aos. De acuerdo a lo anterior se puede corroborar que la desviacin poblacional es de 1.2 aos?Solucin: Debemos corroborar que la desviacin poblacional es de 1.2 aos, para ellos usamos la frmula Datos:

De acuerdo a lo anterior se puede observar que la desviacin poblacional es mayor que 1.2 aos (debido a que el valor de Chi Cuadrado es muy alto y por lo tanto no cae dentro del intervalo de confianza para una muestra de 12).