44
Probabilidad

Probabilidad

Embed Size (px)

DESCRIPTION

Probabilidad. CONTENIDO. Introducción Experimento aleatorio Variable aleatoria Modelos de distribución Modelos de distribución discretos Modelos de distribución continuos. OBJETIVOS. Introducir el concepto de probabilidad. Introducir el concepto de variable aleatoria. - PowerPoint PPT Presentation

Citation preview

Probabilidad

2

Introducción

Experimento aleatorio

Variable aleatoria

Modelos de distribución

Modelos de distribución discretos

Modelos de distribución continuos

CONTENIDO

3

OBJETIVOS

Introducir el concepto de probabilidad.

Introducir el concepto de variable aleatoria.

Describir los modelos de distribución de las variables aleatorias.

4

INTRODUCCIÓN

La teoría de probabilidad permite establecer modelos matemáticos que analizan y predicen el comportamiento y los resultados de fenómenos observables cuyos resultados no son predecibles.

Se denominan fenómenos observables a todos aquellos que pueden ser con resultados no predecibles

5

INTRODUCCIÓN

Fenómenos observables con resultados impredecibles:

Los juegos de azar,

La duración de aparatos electrónicos,

La emisión de partículas de una fuente radioactiva,

El crecimiento de camarones,

El contenido de proteínas del trigo,

La temperatura atmosférica en cierto día a cierta hora.

Estos son ejemplos de fenómenos observables de los cuales no se pueden predecir los resultados antes de medirlos u observarlos.

6

INTRODUCCIÓN

Al estudiar un fenómeno aleatorio muchas veces, y en diferentes condiciones, ocurren ciertos resultados con una proporción estable. A esa proporción le llamamos probabilidad de ocurrencia de los resultados.

7

INTRODUCCIÓN

¿Qué significa la probabilidad en la práctica?

A todos aquellos hechos sobre los cuales no estamos seguros del resultado, les asignamos una probabilidad.

Si estamos seguros del resultado, la probabilidad será 1.

Si consideramos que el hecho es imposible, la probabilidad es 0.

Si conocemos algo de los posibles resultados, establecemos un riesgo de acierto entre 0 y 1.

8

CONCEPTOS BASICOS

En términos de probabilidad, se dice que se realiza un experimento aleatorio cuando se observa un fenómeno que bajo un mismo conjunto de condiciones específicas, produce resultados diversos no predecibles.

Los experimentos aleatorios presentan cierta regularidad estadística, ya que cuando se realizan numerosas observaciones de los resultados, sus frecuencias de ocurrencia muestran una tendencia a estabilizarse.

9

CONCEPTOS BASICOS

La proteína de trigo de un lote fue de 8.20%.

¿Cuál es la probabilidad de que haya más lotes de trigo con porcentaje de proteína entre 8.0% y 8.40% ?

10

CONCEPTOS BASICOS

Si sacamos un pez del conjunto de peces, ¿Cuál es la probabilidad de que sea lisa?

¿Cuántas lisas aparecen en varios conjuntos grandes de peces?

11

CONCEPTOS BASICOS

Al conjunto de posibles resultados de un experimento aleatorio se le conoce como espacio muestral, el cual se denota con la letra W. Un evento es un subconjunto del espacio muestral W.

Un experimento aleatorio: Observar la especie de pez al lanzar una red en el Golfo de California. Supongamos que la red contiene 500 peces. El espacio muestral está formado por:

W= { lisa, otros peces }

Sea el evento A, que el pescado sea lisa:

A = {lisa}

12

CONCEPTOS BASICOS

La probabilidad de ocurrencia de un evento se define como el valor al cual se acercan las frecuencias de ocurrencia de éste evento, cuando el experimento se repite muchas veces bajo un mismo conjunto de condiciones.

En el ejemplo de captura de peces del Mar de Cortez, podemos tener los siguientes resultados:

P(A) = P(lisa) = 57/500= 0.114.

13

CONCEPTOS BASICOSSea el experimento aleatorio: Determinar el

porcentaje de proteína de trigo producido en Sonora.

El espacio muestral será:

W= {0, 0.001,.......... 19.999, 20.000, } El evento A es: La proteína está entre 8.0 y 8.4.

A= {8.0 < Proteína < 8.4}Si realizamos 1,000 determinaciones de

proteína, podríamos tener algo como:P(A) = 280 / 1000 = 0.28

14

PROBABILIDAD CONDICIONAL

La probabilidad de un resultado puede cambiar, si conocemos que ya ha ocurrido otro resultado más general que el primero.

Por ejemplo, se sabe que la incidencia de diabetes en una región es de 75 personas en mil personas. La probabilidad de encontrar al azar una persona con diabetes en el conjunto de personas de esa región es de p = 75/1000 = 0.075.

15

PROBABILIDAD CONDICIONAL

¿Es esa misma la probabilidad de que si se busca sólo entre personas hospitalizadas se encuentre una persona con diabetes?

No lo es, ya que de las personas que ingresan al hospital, el 13% padecen diabetes.

O sea, dado el evento más grande de que la persona ingresó al hospital, la probabilidad de que tenga diabetes

aumenta a p = 0.13.

Esto se escribe de la siguiente forma:

P[Diabetes/ Persona está hospitalizada] = 0.13

16

PROBABILIDAD CONDICIONALCálculo de probabilidad condicional:

P [A/B] = P (A y B) / P (B)

P(B) = 0.06

P (A y B) = 0.0078

P [A/B] = 0.0078 / 0.06 = 0.13

A: Padecer de

diabetes B: Estar en el

hospital

A y B:Diabetes y

hospital

17

VARIABLE ALEATORIA

Una variable aleatoria es una función que tiene como valores de X los eventos del espacio muestral y como valores de f(x) números reales asignados a los eventos.

En el ejemplo de los peces, los eventos del espacio muestral son {lisa} y {otros}. Al evento {lisa} se le asigna un valor 1, y al evento {otros} se le asigna un valor 0. Esta variable aleatoria tendrá entonces dos valores: 1 cuando se encuentra un pez que es lisa, y 0 cuando se encuentra otro pez.

En el ejemplo de proteína de trigo los eventos del espacio muestral son infinitos, por ello a cada evento le asignaremos el valor que corresponde al contenido de proteína (en %).

18

Ejercicio

Se está estudiando la infestación por insectos de un cierto grano.

Supongamos que existen 7 especies (o géneros) de insectos que pueden estar presentes en el grano. Una de las especies es Rhizopertha Dominica.

19

Ejercicio

Defina el espacio muestral para el experimento aleatorio de encontrar un lote de grano infestado por insectos (de cualquier especie).

Defina el espacio muestral para el experimento aleatorio de encontrar Rhizopertha Dominica, dado que el grano estaba infestado por insectos

20

VARIABLE ALEATORIA

A cualquier variable aleatoria se le puede asignar un modelo de distribución de probabilidades. Este modelo describe qué valores tiene la variable aleatoria y qué probabilidades tiene cada valor de la variable.

Tendremos variables aleatorias discretas (toman sólo ciertos valores en el espacio muestral) y variables aleatorias continuas (toman infinitos valores en el espacio muestral).

21

MODELOS DISCRETOS

Una variable de Bernoulli se origina en un evento que tiene sólo dos posibles resultados: Exito y Fracaso.

Estos pueden ser eventos del tipo: Lanzamiento de una moneda (Cara – sello); selección de una persona de un conjunto grande: (Hombre – mujer); Resultado de un examen (Aprueba - no aprueba); Sanidad de un camarón en un criadero: (Enfermo – Sano).

A la probabilidad de obtener un éxito se le asigna el valor p. A la probabilidad de fracaso se le asigna el valor q; de tal modo que p+q=1.

22

MODELOS DISCRETOS

Si un ensayo de Bernoulli se repite n veces, la variable aleatoria discreta que cuenta el número de éxitos en n ensayos independientes se denomina Binomial.

Si X es la variable aleatoria discreta que cuenta el número de éxitos en n ensayos entonces, X puede tomar los siguientes valores: 

X = {0, 1, 2, ... , n}

23

MODELOS DISCRETOS

La probabilidad de tener k éxitos en n pruebas es:

knknk qpC)kX(P )!kn(!k

!nCn

k

24

MODELOS DISCRETOS

Distribución de Poisson. X cuenta el número de ocurrencias del evento de interés en un intervalo de tiempo, de longitud, de área, o de volumen. 

Donde l es el promedio de ocurrencias por unidad.

x!

λexXP

25

MODELOS DISCRETOS

Modelo de distribución uniforme discreto

Cuando tomamos una muestra al azar, cada observación de la muestra tiene la misma probabilidad de estar en la muestra.

Si tenemos una muestra de 18 observaciones la probabilidad de que la primera observación aparezca en la muestra es de 1/18 = 0.0556.

La probabilidad de que la octava observación aparezca en la muestra es también de 0.0556. Es decir, todas las observaciones tendrán una probabilidad de aparición de 0.0556.

X1, X5 , X11, X16

0.000

0.010

0.020

0.030

0.040

0.050

0.060

26

MODELOS CONTINUOSLa variable aleatoria continua más

sencilla es la Uniforme. Los valores de la variable sólo se encuentran en un intervalo [a,b], su función de densidad es una constante y está dada por:

x

]b,a[x,ab

)x(f

1

Densidad

0 1 2 3 4 0

0,1

0,2

0,3

0,4

a=0.5 y b=3.5

]b,a[x,ab

)x(f

1

27

DISTRIBUCIONES CONTINUAS

El modelo de distribución continua más importante es la Normal, ya que gran parte de los procedimientos de estadística inferencial se basan en que los datos analizados sigan ésta distribución de probabilidades.

2

2

2 22

1

)x(exp)x(f

),(N~X 2

28

DISTRIBUCION NORMAL ESTANDAR

= 0

= 1

= 1

29

DISTRIBUCION NORMAL ESTANDAR

= 1

= 1

= 0

64.5% de las observaciones van a caer dentro de este rango

30

DISTRIBUCION NORMAL ESTANDAR

= 1

= 1

= 0

95% de las observaciones van a caer entre -2 y +2

31

Ejercicio

Del ejercicio anterior, se tienen dos experimentos aleatorios:

1. Encontrar un lote de grano (en una gran cantidad de lotes de grano) infestado por insectos.

2. Encontrar el insecto Rhizopertha Dominica, dado que el lote de grano estaba infestado por insectos.

Señale qué tipo de variable aleatoria se genera en cada uno de los dos experimentos aleatorios, y qué modelo de distribución sería el más adecuado.

32

MEDIA Y VARIANZA DE LOS MODELOS DE DISTRIBUCIÓN

La media de una variable aleatoria X o valor esperado de X se denota por

XEX

)X(VarX 2

La varianza de una variable aleatoria X se denota por

En la tabla siguiente se describen las medias y varianzas de algunas distribuciones.

33

MEDIA Y VARIANZA DE LOS MODELOS DE DISTRIBUCIÓN

xn

x

Modelo de Distribución

Media de la Distribución

Varianza de la Distribución

Estimador de la Media de la Distribución

Binomial

Poisson

Normal

np

np npq

m

s2 x

34

EFECTO DE LA MEDIA EN LA DISTRIBUCION NORMAL

1 2Valores de X

35

EFECTO DE LA VARIANZA EN LA DISTRIBUCION NORMAL

Valores de X

Valores de X

36

MODELOS DE DISTRIBUCIÓN CONTINUOS

Areas bajo la función de densidad normal.

37

¿Cómo verifico la distribución de mis datos?

Se comienza por identificar la escala de los datos y el tipo de variable que se tiene:

Que tipo de datos son: Nominales, ordinales, intervalo o proporción.

Si son nominales u ordinales la distribución de los datos tendrá un modelo Discreto.

Si son de intervalo o de proporción el modelo será Continuo.

Que tipo de variable: Alfanumérica (Nombres, categorías) o numérica. Dentro de numérica: discreta o continua.

38

¿Cómo verifico la distribución de mis datos?

Que tipo de variable: Alfanumérica (Nombres, categorías) o numérica. Dentro de numérica: discreta o continua.

Si la variable es alfanumérica o alfabética y hay solo dos posibles valores ((Si, No), (bueno, malo), (aprobó, reprobó)) el modelo distribucional será posiblemente Binomial. Si hay más de dos categorías el modelo será Multinomial.

Si la variable es numérica discreta (conteos en un área o volumen fijo, categorías ordenadas tales como índices sensoriales), los modelos más probables son el de Poisson (primer caso), Multinomial, Binomial negativa, o no tiene un modelo reconocible (segundo caso).

39

¿Cómo verifico la distribución de mis datos?

Que tipo de variable: Alfanumérica (Nombres, categorías) o numérica. Dentro de numérica: discreta o continua.

Si la variable es numérica continua (pesos, volúmenes, longitudes, fuerza, etc.) se podrá tener un modelo de distribución continuo. Pero hay una gran cantidad de modelos además del normal, como Exponencial, Logístico, Weibull, o Logarítmico-

normal, por citar algunos que ocurren en alimentos.

Si los datos están en escala de intervalo, muy probablemente el modelo distribucional de los datos no sea normal.

40

¿Cómo verifico la distribución de mis datos?

En una segunda etapa, una vez identificado el tipo de variable de que se trata, se tienen dos alternativas:

Tratarlos como normales cuando el número de datos es grande*Cuando el número de datos es chico, se deben analizar con métodos no-paramétricos.

En el caso de datos contínuos, hacer transformaciones de los datos para “normalizarlos”.

* Se harán comentarios sobre este caso.

41

Herramientas de estadística descriptiva para verificar la

distribución de datos

Histogramas

Diagramas de caja

42

Herramientas de estadística descriptiva para verificar la

distribución de datos

Diagramas de cuantil

Pruebas de normalidad*

43

RESUMEN

La incertidumbre en el resultado de los eventos o fenómenos genera el concepto de probabilidad. No conocemos el resultado de determinado evento o fenómeno. Sólo podemos expresar una medida de riesgo de que ocurra determinado resultado: Esta el la probabilidad.

Variable aleatoria Modelos de distribución y regularidad estadística.

44

RESUMEN

Variables discretas y continuas Medias y varianzas de las distribuciones ¿Qué se puede hacer cuando no se conoce el

modelo de distribución más probable de una variable aleatoria?