15
República Bolivariana de Venezuela Ministerio Del Poder Popular Para la Educación Instituto Universitario de Tecnología “Antonio José De Sucre” Barquisimeto-Edo Lara Alumno: Sarmiento Luis J. C.I:23.575.065 Barquisimeto 31 de agosto 2014

presentacion estadistica

Embed Size (px)

Citation preview

República Bolivariana de Venezuela

Ministerio Del Poder Popular Para la Educación

Instituto Universitario de Tecnología

“Antonio José De Sucre”

Barquisimeto-Edo Lara

Alumno:

Sarmiento Luis J.

C.I:23.575.065

Barquisimeto 31 de agosto 2014

Es una parte de la estadística que comprende los métodos y

procedimientos que por medio de la inducción determina propiedades de una

población estadística, a partir de una pequeña parte de la misma. La

estadística inferencial comprende como aspectos importantes:

La toma de muestras o muestreo.

La estimación de parámetros o variables estadísticas.

El contraste de hipótesis.

El diseño experimental.

La inferencia bayesiana.

Los métodos no paramétricos

En teoría de la probabilidad y estadística, la distribución de

probabilidad de una variable aleatoria es una función que

asigna a cada suceso definido sobre la variable aleatoria, la

probabilidad de que dicho suceso ocurra. La distribución de

probabilidad está definida sobre el conjunto de todos los

sucesos, cada uno de los sucesos es el rango de valores de la

variable aleatoria.

son aquellas en las que la variable puede pude tomar un número

determinado de valores:

Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si

se tira un dado puede salir un número de 1 al 6; en una ruleta el

número puede tomar un valor del 1 al 32

son aquellas que presentan un número infinito de posibles soluciones:

Ejemplo: El peso medio de los alumnos de una clase puede tomar

infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42,

376541kg, etc); la esperanza media de vida de una población (72,5

años, 7,513 años, 72, 51234 años).

La importancia de esta distribución radica en que permite modelar numerosos

fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos

que subyacen a gran parte de este tipo de fenómenos son desconocidos, por

la enorme cantidad de variables incontrolables que en ellos intervienen, el uso

del modelo normal puede justificarse asumiendo que cada observación se

obtiene como la suma de unas pocas causas independientes.

Propiedades de la distribución normal

Algunas propiedades de la distribución normal son:

1.Es simétrica respecto de su media, μ; Distribución de probabilidad

alrededor de la media en una distribución N(μ, σ2).

2.La moda y la mediana son ambas iguales a la media, μ;

3.Los puntos de inflexión de la curva se dan para x = μ − σ y x = μ + σ.

4.Distribución de probabilidad en un entorno de la media.

Un caso específico de ajuste a una distribución teórica es la

correspondiente a la distribución normal. Este contraste se realiza para

comprobar si se verifica la hipótesis de normalidad necesaria para que

el resultado de algunos análisis sea fiable, como por ejemplo para el

ANOVA.

Para comprobar la hipótesis nula de que la muestra ha sido extraída de

una población con distribución de probabilidad normal se puede realizar

un estudio gráfico y/o analítico.

Este proceso permite ahorrar recursos, y a la vez obtener resultados

parecidos a los que se alcanzarían si se realizase un estudio de toda la

población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar

un estudio adecuado (que consienta no solo hacer estimaciones de la

población sino estimar también los márgenes de error correspondientes

a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos

estar enteramente seguros de que el resultado sea una muestra

representativa, pero sí podemos actuar de manera que esta condición se

alcance con una probabilidad alta.

Consiste en la división previa de la población de estudio en grupos o clases que se

suponen homogéneos respecto a característica a estudiar y que no se solapen.

Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los

estratos, existen dos técnicas de muestreo estratificado:

1.Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a

su tamaño en la población.

2.Asignación óptima: la muestra recogerá más individuos de aquellos estratos que

tengan más variabilidad. Para ello es necesario un conocimiento previo de la

población.

Es un método en el cual la unidad de muestreo consiste de un grupo

de unidades elementales. Es decir, que cada grupo o conglomerado

es un agregado de unidades elementales. Cada conglomerado es

considerado como una unidad de muestreo de diferente rango a las

unidades elementales que son las de interés.

En muestreo por conglomerados se tienen 2 tipos de unidades:

1) Unidades elementales (de interés)

2) Conglomerados (Unidades de Muestreo)

El muestreo puede hacerse con o sin reposición, y la población de partida

puede ser infinita o finita. Una población finita en la que se efectúa

muestreo con reposición puede considerarse infinita teóricamente.

También, a efectos prácticos, una población muy grande puede

considerarse como infinita. En todo nuestro estudio vamos a limitarnos a

una población de partida infinita o a muestreo con reposición.

Consideremos todas las posibles muestras de tamaño n en una población.

Para cada muestra podemos calcular un estadístico (media, desviación

típica, proporción,...) que variará de una a otra. Así obtenemos una

distribución del estadístico que se llama distribución muestral.

El error estándar es la desviación estándar de la distribución muestral de un

estadístico.[1] El término se refiere también a una estimación de la

desviación estándar, derivada de una muestra particular usada para

computar la estimación.

a partir de las medias muéstrales) es la desviación estándar de todas las

posibles muestras (de un tamaño dado) escogidos de esa población.

Además, el error estándar de la media puede referirse a una estimación de

la desviación estándar, calculada desde una muestra de datos que está

siendo analizada al mismo tiempo.

El teorema del límite central o teorema central del límite indica que,

en condiciones muy generales, si Sn es la suma de n variables

aleatorias independientes, entonces la función de distribución de Sn

«se aproxima bien» a una distribución normal (también llamada

distribución gaussiana, curva de Gauss o campana de Gauss). Así

pues, el teorema asegura que esto ocurre cuando la suma de estas

variables aleatorias e independientes es lo suficientemente grande.

nos dice que: “La probabilidad de que una variable aleatoria tome

un valor contenido en K desviaciones estándar de la media es

cuando menos “ En términos intuitivos, la varianza y la desviación

estándar de una distribución de una probabilidad mide el grado

de dispersión: Cuando la desviación estándar es pequeña, la

probabilidad de obtener un valor cercano a la media es alta.

Cuando la desviación estándar es grande, la probabilidad de

obtener un valor cercano a la media es pequeña.