Upload
thuraya-chaka
View
21
Download
2
Embed Size (px)
DESCRIPTION
Probabilidad. CONTENIDO. Introducción Experimento aleatorio Variable aleatoria Modelos de distribución Modelos de distribución discretos Modelos de distribución continuos. OBJETIVOS. Introducir el concepto de probabilidad. Introducir el concepto de variable aleatoria. - PowerPoint PPT Presentation
Citation preview
2
Introducción
Experimento aleatorio
Variable aleatoria
Modelos de distribución
Modelos de distribución discretos
Modelos de distribución continuos
CONTENIDO
3
OBJETIVOS
Introducir el concepto de probabilidad.
Introducir el concepto de variable aleatoria.
Describir los modelos de distribución de las variables aleatorias.
4
INTRODUCCIÓN
La teoría de probabilidad permite establecer modelos matemáticos que analizan y predicen el comportamiento y los resultados de fenómenos observables cuyos resultados no son predecibles.
Se denominan fenómenos observables a todos aquellos que pueden ser con resultados no predecibles
5
INTRODUCCIÓN
Fenómenos observables con resultados impredecibles:
Los juegos de azar,
La duración de aparatos electrónicos,
La emisión de partículas de una fuente radioactiva,
El crecimiento de camarones,
El contenido de proteínas del trigo,
La temperatura atmosférica en cierto día a cierta hora.
Estos son ejemplos de fenómenos observables de los cuales no se pueden predecir los resultados antes de medirlos u observarlos.
6
INTRODUCCIÓN
Al estudiar un fenómeno aleatorio muchas veces, y en diferentes condiciones, ocurren ciertos resultados con una proporción estable. A esa proporción le llamamos probabilidad de ocurrencia de los resultados.
7
INTRODUCCIÓN
¿Qué significa la probabilidad en la práctica?
A todos aquellos hechos sobre los cuales no estamos seguros del resultado, les asignamos una probabilidad.
Si estamos seguros del resultado, la probabilidad será 1.
Si consideramos que el hecho es imposible, la probabilidad es 0.
Si conocemos algo de los posibles resultados, establecemos un riesgo de acierto entre 0 y 1.
8
CONCEPTOS BASICOS
En términos de probabilidad, se dice que se realiza un experimento aleatorio cuando se observa un fenómeno que bajo un mismo conjunto de condiciones específicas, produce resultados diversos no predecibles.
Los experimentos aleatorios presentan cierta regularidad estadística, ya que cuando se realizan numerosas observaciones de los resultados, sus frecuencias de ocurrencia muestran una tendencia a estabilizarse.
9
CONCEPTOS BASICOS
La proteína de trigo de un lote fue de 8.20%.
¿Cuál es la probabilidad de que haya más lotes de trigo con porcentaje de proteína entre 8.0% y 8.40% ?
10
CONCEPTOS BASICOS
Si sacamos un pez del conjunto de peces, ¿Cuál es la probabilidad de que sea lisa?
¿Cuántas lisas aparecen en varios conjuntos grandes de peces?
11
CONCEPTOS BASICOS
Al conjunto de posibles resultados de un experimento aleatorio se le conoce como espacio muestral, el cual se denota con la letra W. Un evento es un subconjunto del espacio muestral W.
Un experimento aleatorio: Observar la especie de pez al lanzar una red en el Golfo de California. Supongamos que la red contiene 500 peces. El espacio muestral está formado por:
W= { lisa, otros peces }
Sea el evento A, que el pescado sea lisa:
A = {lisa}
12
CONCEPTOS BASICOS
La probabilidad de ocurrencia de un evento se define como el valor al cual se acercan las frecuencias de ocurrencia de éste evento, cuando el experimento se repite muchas veces bajo un mismo conjunto de condiciones.
En el ejemplo de captura de peces del Mar de Cortez, podemos tener los siguientes resultados:
P(A) = P(lisa) = 57/500= 0.114.
13
CONCEPTOS BASICOSSea el experimento aleatorio: Determinar el
porcentaje de proteína de trigo producido en Sonora.
El espacio muestral será:
W= {0, 0.001,.......... 19.999, 20.000, } El evento A es: La proteína está entre 8.0 y 8.4.
A= {8.0 < Proteína < 8.4}Si realizamos 1,000 determinaciones de
proteína, podríamos tener algo como:P(A) = 280 / 1000 = 0.28
14
PROBABILIDAD CONDICIONAL
La probabilidad de un resultado puede cambiar, si conocemos que ya ha ocurrido otro resultado más general que el primero.
Por ejemplo, se sabe que la incidencia de diabetes en una región es de 75 personas en mil personas. La probabilidad de encontrar al azar una persona con diabetes en el conjunto de personas de esa región es de p = 75/1000 = 0.075.
15
PROBABILIDAD CONDICIONAL
¿Es esa misma la probabilidad de que si se busca sólo entre personas hospitalizadas se encuentre una persona con diabetes?
No lo es, ya que de las personas que ingresan al hospital, el 13% padecen diabetes.
O sea, dado el evento más grande de que la persona ingresó al hospital, la probabilidad de que tenga diabetes
aumenta a p = 0.13.
Esto se escribe de la siguiente forma:
P[Diabetes/ Persona está hospitalizada] = 0.13
16
PROBABILIDAD CONDICIONALCálculo de probabilidad condicional:
P [A/B] = P (A y B) / P (B)
P(B) = 0.06
P (A y B) = 0.0078
P [A/B] = 0.0078 / 0.06 = 0.13
A: Padecer de
diabetes B: Estar en el
hospital
A y B:Diabetes y
hospital
17
VARIABLE ALEATORIA
Una variable aleatoria es una función que tiene como valores de X los eventos del espacio muestral y como valores de f(x) números reales asignados a los eventos.
En el ejemplo de los peces, los eventos del espacio muestral son {lisa} y {otros}. Al evento {lisa} se le asigna un valor 1, y al evento {otros} se le asigna un valor 0. Esta variable aleatoria tendrá entonces dos valores: 1 cuando se encuentra un pez que es lisa, y 0 cuando se encuentra otro pez.
En el ejemplo de proteína de trigo los eventos del espacio muestral son infinitos, por ello a cada evento le asignaremos el valor que corresponde al contenido de proteína (en %).
18
Ejercicio
Se está estudiando la infestación por insectos de un cierto grano.
Supongamos que existen 7 especies (o géneros) de insectos que pueden estar presentes en el grano. Una de las especies es Rhizopertha Dominica.
19
Ejercicio
Defina el espacio muestral para el experimento aleatorio de encontrar un lote de grano infestado por insectos (de cualquier especie).
Defina el espacio muestral para el experimento aleatorio de encontrar Rhizopertha Dominica, dado que el grano estaba infestado por insectos
20
VARIABLE ALEATORIA
A cualquier variable aleatoria se le puede asignar un modelo de distribución de probabilidades. Este modelo describe qué valores tiene la variable aleatoria y qué probabilidades tiene cada valor de la variable.
Tendremos variables aleatorias discretas (toman sólo ciertos valores en el espacio muestral) y variables aleatorias continuas (toman infinitos valores en el espacio muestral).
21
MODELOS DISCRETOS
Una variable de Bernoulli se origina en un evento que tiene sólo dos posibles resultados: Exito y Fracaso.
Estos pueden ser eventos del tipo: Lanzamiento de una moneda (Cara – sello); selección de una persona de un conjunto grande: (Hombre – mujer); Resultado de un examen (Aprueba - no aprueba); Sanidad de un camarón en un criadero: (Enfermo – Sano).
A la probabilidad de obtener un éxito se le asigna el valor p. A la probabilidad de fracaso se le asigna el valor q; de tal modo que p+q=1.
22
MODELOS DISCRETOS
Si un ensayo de Bernoulli se repite n veces, la variable aleatoria discreta que cuenta el número de éxitos en n ensayos independientes se denomina Binomial.
Si X es la variable aleatoria discreta que cuenta el número de éxitos en n ensayos entonces, X puede tomar los siguientes valores:
X = {0, 1, 2, ... , n}
23
MODELOS DISCRETOS
La probabilidad de tener k éxitos en n pruebas es:
knknk qpC)kX(P )!kn(!k
!nCn
k
24
MODELOS DISCRETOS
Distribución de Poisson. X cuenta el número de ocurrencias del evento de interés en un intervalo de tiempo, de longitud, de área, o de volumen.
Donde l es el promedio de ocurrencias por unidad.
x!
λexXP
xλ
25
MODELOS DISCRETOS
Modelo de distribución uniforme discreto
Cuando tomamos una muestra al azar, cada observación de la muestra tiene la misma probabilidad de estar en la muestra.
Si tenemos una muestra de 18 observaciones la probabilidad de que la primera observación aparezca en la muestra es de 1/18 = 0.0556.
La probabilidad de que la octava observación aparezca en la muestra es también de 0.0556. Es decir, todas las observaciones tendrán una probabilidad de aparición de 0.0556.
X1, X5 , X11, X16
0.000
0.010
0.020
0.030
0.040
0.050
0.060
26
MODELOS CONTINUOSLa variable aleatoria continua más
sencilla es la Uniforme. Los valores de la variable sólo se encuentran en un intervalo [a,b], su función de densidad es una constante y está dada por:
x
]b,a[x,ab
)x(f
1
Densidad
0 1 2 3 4 0
0,1
0,2
0,3
0,4
a=0.5 y b=3.5
]b,a[x,ab
)x(f
1
27
DISTRIBUCIONES CONTINUAS
El modelo de distribución continua más importante es la Normal, ya que gran parte de los procedimientos de estadística inferencial se basan en que los datos analizados sigan ésta distribución de probabilidades.
2
2
2 22
1
)x(exp)x(f
),(N~X 2
29
DISTRIBUCION NORMAL ESTANDAR
= 1
= 1
= 0
64.5% de las observaciones van a caer dentro de este rango
31
Ejercicio
Del ejercicio anterior, se tienen dos experimentos aleatorios:
1. Encontrar un lote de grano (en una gran cantidad de lotes de grano) infestado por insectos.
2. Encontrar el insecto Rhizopertha Dominica, dado que el lote de grano estaba infestado por insectos.
Señale qué tipo de variable aleatoria se genera en cada uno de los dos experimentos aleatorios, y qué modelo de distribución sería el más adecuado.
32
MEDIA Y VARIANZA DE LOS MODELOS DE DISTRIBUCIÓN
La media de una variable aleatoria X o valor esperado de X se denota por
XEX
)X(VarX 2
La varianza de una variable aleatoria X se denota por
En la tabla siguiente se describen las medias y varianzas de algunas distribuciones.
33
MEDIA Y VARIANZA DE LOS MODELOS DE DISTRIBUCIÓN
xn
x
Modelo de Distribución
Media de la Distribución
Varianza de la Distribución
Estimador de la Media de la Distribución
Binomial
Poisson
Normal
np
np npq
m
s2 x
37
¿Cómo verifico la distribución de mis datos?
Se comienza por identificar la escala de los datos y el tipo de variable que se tiene:
Que tipo de datos son: Nominales, ordinales, intervalo o proporción.
Si son nominales u ordinales la distribución de los datos tendrá un modelo Discreto.
Si son de intervalo o de proporción el modelo será Continuo.
Que tipo de variable: Alfanumérica (Nombres, categorías) o numérica. Dentro de numérica: discreta o continua.
38
¿Cómo verifico la distribución de mis datos?
Que tipo de variable: Alfanumérica (Nombres, categorías) o numérica. Dentro de numérica: discreta o continua.
Si la variable es alfanumérica o alfabética y hay solo dos posibles valores ((Si, No), (bueno, malo), (aprobó, reprobó)) el modelo distribucional será posiblemente Binomial. Si hay más de dos categorías el modelo será Multinomial.
Si la variable es numérica discreta (conteos en un área o volumen fijo, categorías ordenadas tales como índices sensoriales), los modelos más probables son el de Poisson (primer caso), Multinomial, Binomial negativa, o no tiene un modelo reconocible (segundo caso).
39
¿Cómo verifico la distribución de mis datos?
Que tipo de variable: Alfanumérica (Nombres, categorías) o numérica. Dentro de numérica: discreta o continua.
Si la variable es numérica continua (pesos, volúmenes, longitudes, fuerza, etc.) se podrá tener un modelo de distribución continuo. Pero hay una gran cantidad de modelos además del normal, como Exponencial, Logístico, Weibull, o Logarítmico-
normal, por citar algunos que ocurren en alimentos.
Si los datos están en escala de intervalo, muy probablemente el modelo distribucional de los datos no sea normal.
40
¿Cómo verifico la distribución de mis datos?
En una segunda etapa, una vez identificado el tipo de variable de que se trata, se tienen dos alternativas:
Tratarlos como normales cuando el número de datos es grande*Cuando el número de datos es chico, se deben analizar con métodos no-paramétricos.
En el caso de datos contínuos, hacer transformaciones de los datos para “normalizarlos”.
* Se harán comentarios sobre este caso.
41
Herramientas de estadística descriptiva para verificar la
distribución de datos
Histogramas
Diagramas de caja
42
Herramientas de estadística descriptiva para verificar la
distribución de datos
Diagramas de cuantil
Pruebas de normalidad*
43
RESUMEN
La incertidumbre en el resultado de los eventos o fenómenos genera el concepto de probabilidad. No conocemos el resultado de determinado evento o fenómeno. Sólo podemos expresar una medida de riesgo de que ocurra determinado resultado: Esta el la probabilidad.
Variable aleatoria Modelos de distribución y regularidad estadística.