Author
empresa-minera-gonzales
View
6.668
Download
2
Embed Size (px)
DIRECCION DE EDUCACIÓN DE ESTUDIOS A
DISTANCIA
GUÍA DE PROBABILIDADES Y PROCESOS ESTOCÁSTICOS
Tercer Semestre
Realizado por: Ing. SHIRLEY DEFAZ
Marzo de 2007
1. DATOS INFORMATIVOS
FACULTAD: Ciencias de la Computación y Electrónica
ESCUELA: Electrónica
ASIGNATURA: Probabilidades y Procesos Estocásticos
NIVEL: Tercero
AUTOR DE LA GUIA: Ing. Shirley Défaz Silva
E-MAIL:
FECHA DE EDICIÓN: Marzo de 2007
2. PRESENTACIÓN DE LA ASIGNATURA
La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea.
Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y
transformarla, predecir su futuro o simplemente conocerla.
La Estadística responde a nuevas demandas sociales. Para realizar investigaciones exhaustivas
sobre temas sociales surgen tres problemas básicos a la hora del trabajo de campo, como el tiempo
que tardaríamos en entrevistar a toda la población y el costo económico y de personal de estas
entrevistas. Con las técnicas de muestreo se consigue hacer buenas investigaciones sobre una
pequeña parte de esa población, obteniendo resultados válidos para toda ella.
La Estadística responde a las necesidades del desarrollo científico y tecnológico de la sociedad.
Tras la Revolución Industrial se produce un desarrollo de la sociedad en todos sus ámbitos y, en
particular, en el Científico y Tecnológico. Las Comunicaciones, la Industria, la Agricultura, la
Salud... se desarrollan rápidamente y se exige el máximo rendimiento y la mejor utilización de
estos sectores. Con estudios estadísticos aplicados a la Agricultura y a la Pesca podemos estimar
los rendimientos obtenidos en una cosecha, o encontrar bancos de peces.
Por otro lado, el desarrollo de la teoría de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadística, de forma que casi cualquier investigación científica requiere de los
fundamentos de la Teoría de la Probabilidad para que pueda desarrollarse adecuadamente. La
probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el
tipo y la cantidad de datos necesarios en un determinado estudio estadístico. En esta asignatura,
abarcaremos, tal y como se refleja en los contenidos, los conceptos fundamentales dentro de este
campo. Los Procesos Estocásticos constituyen una parte esencial de la Probabilidad y son mucho
interés en la actualidad por la cantidad de situaciones prácticas en los que pueden ser de utilidad.
Son modelos probabilísticos utilizados para representar situaciones de la vida cotidiana, que
generalmente se desarrollan a lo largo del tiempo, y para hacer predicciones y poder así tomar las
decisiones más apropiadas al respecto. En esta asignatura estudiaremos los modelos de procesos
estocásticos fundamentales: Los recorridos aleatorios y las cadenas de Markov. Con el estudio de
los Procesos Estocásticos se puede tener una mejor comprensión de fenómenos de
comportamiento aleatorio como meteorología, física nuclear, campañas de seguridad, etc.
3. OBJETIVO GENERAL DE LA ASIGNATURA DE PROBABILIDADES Y
PROCESOS ESTOCÁSTICOS
4. OBJETIVOS ESPECÍFICOS DE LA ASIGNATURA
SISTEMA DE CONOCIMIENTOS ESENCIALES POR UNIDADES DIDÁCTICAS
SISTEMA DE HABILIDADES A DESARROLLAR
Al finalizar el nivel, estudiante va a adquirir las siguientes destrezas y habilidades:
Distinguir diferentes tipos de procesos estocásticos dependiendo de los instantes de
observación y de los resultados observados.
Conocer las propiedades básicas de las cadenas de Markov en tiempo discreto
PROBABILIDADES Y PROCESOS
ESTOCÁSTICOS
-Estadísticas-Tipos de variables-Medidas de tendencia central-Medidas de dispersión
FUNCIONES PROBABILÍSTICAS
ESTADÍSTICA Y PROBABILIDAD
BÁSICA
PROCESOS ESTOCÁSTICOS
-Probabilidad clásica-Técnicas de Conteo-Probabilidad Condicional
-Distribución de probabilidad-Distribución binomial-Dist. hipergeométrica-Dist. de Poisson-Dist. Normal
-Ruido-Movimiento Browniano-Matriz de transición-Cadenas de Markov en tiempo discreto-Cadenas de Markov en tiempo continuo-Teoría Ergódica-Ecuaciones de Chapman-Kolmogorov
Modelar mediante cadenas de Markov situaciones que evolucionan aleatoriamente
Describir el comportamiento transitorio de una cadena de Markov mediante la matriz de
transición y sus potencias.
Conocer las propiedades y características más relevantes del Proceso de Poisson y de otros
procesos en tiempo continuo.
5. ORIENTACIONES SOBRE EL PROCESO DE EVALUACION DEL
APRENDIZAJE
PROCESOS DEL APRENDIZAJE EN LA ASIGNATURA
Desde el contenido de los diferentes capítulos y en la realización de las tareas, se trabajará en
aspectos vitales de la formación de la personalidad como la responsabilidad al exigir la
puntualidad en la entrega de tareas así como asistencia, perseverancia al enfrentar la complejidad
gradual de los diferentes temas y en la discusión de la solución de problemas. Investigación al
permitir que el alumno evidencie por si solo la importancia de las ciencias físicas en el desarrollo
de su profesión.
Se dará énfasis en el interés por realizar los trabajos extracurriculares y por destacar los valores de
la profesión.
Al estudiante se le exigirá fundamentar correctamente sus ideas con una adecuada coherencia, así
mismo en sus informes escritos deberá presentarlos con una buena redacción.
Se resolverán problemas vinculados a aspectos relevantes de la profesión y de la protección del
medio ambiente.
Para resolver un problema de una situación real se tiene que:
Formular el problema
Graficar el problema
Modelar el problema
Resolver el modelo matemático del problema
Interpretar los resultados
Extraer conclusiones
ORIENTACIONES SOBRE EL PROCESO DE EVALUACION DEL APRENDIZAJE
En cada unidad didáctica Ud. encuentra un objetivo. Él le indica lo que debe dominar o saber
hacer al terminar de estudiar la unidad. Esto es muy importante, no deje de analizarlo y hacer que
se cumpla.
Si no está seguro que cumplió el objetivo, vuelva a leer y realizar o revisar los ejercicios
resueltos que el texto guía le presenta hasta que este seguro de haber cumplido con el objetivo.
Las unidades se encuentran en una secuencia progresiva de aprendizaje. Por tal motivo, se
sugiere seguir el orden en el cual se presentan, ya que lo estudiado en un tema es base para el
siguiente tema.
Adquiera un cuaderno o una carpeta, en el cual se sugiere anotar los resúmenes de lo que va
estudiando y los ejercicios de las diferentes actividades que se proponen en la presente guía, así
como la resolución de las autoevaluaciones. Al mismo tiempo debe ir anotando la consulta que
necesita hacer a su tutor, de esta forma llevará su proceso de aprendizaje, organizado y podrá Ud.
mismo evidenciar el desarrollo y cambios que se están produciendo.
Cada vez que se disponga a estudiar la materia, escoja el sitio más apropiado y el tiempo
apropiado.
Lea el tema y revise los ejercicios resueltos del texto guía las veces que sea necesario con el
mejor ánimo de entenderlos. Si algún tema no está claro no pierda tiempo ni se mortifique tratando
de entenderlo, no dude en llamar o ponerse en contacto con su tutor inmediatamente para
solucionar sus inquietudes o dudas.
La autoevaluación es en proceso que le indica el avance en su aprendizaje. No se engañe. No
busque quien le haga los trabajos que Ud. debe realizar, busque a través de sus compañeros o de
su tutor la asesoría en aquello que no está claro.
6. INDICADORES DE EVALUACION
Todas las tareas indicadas en cada unidad serán evaluadas sobre diez puntos, de acuerdo a
la originalidad, presentación (limpieza, orden, fecha de entrega), cientificidad y el desarrollo en sí
de cada problema. Es necesario que en cada tarea presentada por Ud. haga constar su propia
autoevaluación entre uno y diez puntos de acuerdo a su dedicación al desarrollo de la misma y al
nivel de asimilación logrado.
En cada encuentro se realizarán plenarias, clases talleres, debates, etc.; y, de acuerdo a su
participación, se asignará una nota entre uno y diez que resultará del promedio entre su propia
autoevaluación, la que le otorgue el grupo y la del profesor.
La resolución de problemas propuestos en el aula, se la realizará utilizando técnicas
grupales y de exposición, a fin de desarrollar las capacidades de expresión oral y pensamiento
crítico.
Los indicadores principales serán: la correcta interpretación del problema, la lógica del
problema a resolver, las conclusiones que se obtengan de esta resolución, la responsabilidad y la
honestidad.
El cuaderno de anotaciones será evaluado sobre diez puntos de acuerdo a la presentación
( limpieza, orden), el desarrollo de los contenidos y a la forma coherente y sistémica que ha tratado
los temas.
Las tareas integradoras de cada unidad serán evaluadas sobre diez puntos y corresponderá
al 50% de la nota a promediarse con la prueba.
La tarea integradora de la asignatura será evaluada sobre diez puntos y corresponderá al
50% del examen final.
La asistencia a los encuentros también será considerada en la evaluación general de
acuerdo al consenso con el grupo.
7. BIBLIOGRAFIA BASICA Y COMPLEMENTARIA
TEXTOS BASICOS
CHAO Lincoln. Estadística para las Ciencias Administrativas. Mcgraw-Hill, tercera
edición. Bogotá-Colombia, 1998.
GALINDO Edwin. Estadística para la Ingeniería. Quito-Ecuador, 1998.
DIRECCIONES DE INTERNET
http://www.monografias.com/trabajos15/estadistica/estadistica.shtml
http://es.wikipedia.org/wiki/estadistica
http://es.wikipedia.org/wiki/Variable_aleatoria
http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
http://es.wikipedia.org/wiki/Dispersi%C3%B3n_(matem%C3%A1ticas)
http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr
%20Hipergeometrica.htm
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Poisson
http://facultad.sagrado.edu/ConceptosBasicos.pdf
http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm
http://weblogs.udp.cl/pplaza/archivos/(4137)Markov-Discreto.pdf
http://usuarios.lycos.es/paradojaparrondo/cadenas_markov.htm
http://www.omerique.net/calcumat/estocasticas1.htm
http://www.bioestadistica.uma.es/libro/node23.htm
http://www.uantof.cl/facultades/csbasicas/Matematicas/academicos/emartinez/magister/
confiabilidad/seccion2/distribucion.html
ORIENTACIONES PARA EL TRABAJO CON LAS UNIDADES DIDACTICAS
La presente guía está dividida en 3 unidades didácticas. Los temas pertenecientes a cada una de las
unidades se encuentran agrupados por semanas. Cada una de las semanas se encuentra conformada
por: teoría, ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y
adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se
sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos.
UNIDAD I
ESTADÍSTICA Y PROBABILIDAD BÁSICA
Objetivos:
Familiarizarse con los aspectos básicos del Cálculo de Probabilidades y la Estadística y aplicar
los procedimientos estadísticos para el análisis de una muestra.
Describir adecuadamente espacios muestrales asociados a ciertos experimentos aleatorios,
previamente planteados.
Definir sucesos aleatorios y asignarles sus probabilidades de ocurrencia.
Aplicar los conceptos y reglas fundamentales de probabilidad.
Aplicar correctamente las distribuciones de la media, proporción y varianza muestrales en el
cálculo de probabilidades
Determinar el tamaño de muestra representativo y sus elementos, mediante las técnicas de
muestreo.
Efectuar estimaciones puntuales de los parámetros de una población: media, proporción y
varianza poblacional.
ORIENTACIONES PARA EL TRABAJO CON LA UNIDAD I
La unidad 1 se estudiará durante las 7 primeras semanas de clases y comprende temas como: tipos
de variables estadísticas, medidas de tendencia central, medidas de dispersión, probabilidad clásica
y técnicas de conteo aplicadas al cálculo de probabilidades.
Los temas a revisarse durante cada una de las semanas se encuentran conformados por: teoría,
ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y
adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se
sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos.
SEMANA 1
ESTADISTICA
“La Estadística es una ciencia matemática que se utiliza para describir, analizar e interpretar
ciertas características de un conjunto de individuos llamado población”.
La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos
sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los
fenómenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la
estadística, debido al gran campo de aplicación que posee.
La Estadística se divide en dos ramas:
Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un conjunto de datos,
obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las
relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo
referirse a la observación de todos los elementos de una población (observación exhaustiva) sino
también a la descripción de los elementos de una muestra (observación parcial).
Estadística Inductiva:
Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven para
deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un
grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases
numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por
los mismos elementos.
OTRAS DEFINICIONES IMPORTANTES
Población
"Una población es un conjunto de elementos que presentan una característica común". Cadenas
(1974). Ejemplo: La población de ballenas.
Según el número de elementos la población puede ser finita o infinita. Cuando el número de
elementos que integra la población es muy grande, se puede considerar a esta como una población
infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella
que está formada por un limitado número de elementos, por ejemplo; el número de estudiantes de
la UNITA.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se
dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este
inconveniente se utiliza una muestra estadística.
Muestra
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R.
Spiegel (1991).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se
obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Ejemplo: El estudio realizado a 33 estudiantes de la FCCE de la UNITA.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer
referencias sobre la población que está representada por la muestra. En consecuencia muestra y
población son conceptos relativos. Una población es un todo y una muestra es una fracción o
segmento de ese todo.
Muestreo
Esto no es más que el procedimiento empleado para obtener una o más muestras de una población;
el muestreo es una técnica que sirve para obtener una o más muestras de población.
Ejemplo:
Consideremos como una población a los estudiantes de educación secundaria del Colegio Colón,
determinando por lo menos dos caracteres ser estudiados en dicha población: Religión de los
estudiantes y Sexo.
VARIABLE ESTADÍSTICA
Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando
diferentes valores en cada uno de los casos de un estudio.
Clasificación de las variables
En un estudio científico, podemos clasificar las variables según la escala de medición o la
influencia que asignemos a unas variables sobre otras. Según la escala de medición:
Variables cualitativas: Son las variables que expresan distintas cualidades, características o
modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición
consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y
nominales. Ejemplo: sexo de una persona (hombre, mujer), color de ojos (cafés, verdes, azules)
Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las
variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala
de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de
valores entre los distintos valores específicos que la variable pueda asumir. Un ejemplo es
el número de hijos.
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado
por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre
dos cualesquiera.
Ejercicios propuestos
1. Clasificar las siguientes variables:
Preferencias políticas (izquierda, derecha o centro).
Marcas de cerveza.
Velocidad en Km/h.
El peso en Kg.
Signo del zodiaco.
Nivel educativo (primario secundario, superior).
Años de estudios completados.
Tipo de enseñanza (privada o pública).
Número de empleados de una empresa.
La temperatura de un enfermo en grados Celsius.
La clase social (baja, media o alta). La presión de un neumático en
2. Clasifique las variables que aparecen en el siguiente cuestionario.
¿Cuál es su edad?
Estado civil:
¿Cuanto tiempo emplea para desplazarse a su trabajo?
¿Está afiliado a la seguridad social?
Tamaño de su ciudad: ciudad pequeña (de 50.000 a 100.000 hab.), ciudad grande (más de
100.000 hab.)
SEMANA 2
MEDIDAS DE TENDENCIA CENTRAL
Son un grupo de estadísticos que permiten ver lo dominante, lo típico o la tendencia de una
distribución de datos en el sentido de cuáles son sus valores medios. Las medidas de tendencia
central más conocidas son: la media aritmética, la mediana y la moda.
Media
La media aritmética o promedio, de una cantidad finita de números, es igual a la suma de todos
ellos dividida entre el número de sumandos.
Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de
la variable distribuida a partes iguales entre cada observación. Por ejemplo, si en una habitación
hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el
dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una
forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada
observación (persona) tendría la misma cantidad de la variable.
También la media aritmética puede ser denominada como centro de gravedad de una distribución,
el cual no es necesariamente la mitad. Solamente puede utilizarse con variables cuantitativas.
Así, dados los números a1,a2, ... , an, la media aritmética será igual a:
Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:
Media ponderada
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para
determinado estudio. En esos casos se puede utilizar una media ponderada.
Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus ‘pesos’ respectivos la media ponderada se
define de la siguiente forma:
Ejemplo: Las calificaciones en la asignatura de Matemáticas de 39 alumnos se registran en la siguiente tabla:
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
Moda
La moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima.
Una distribución trimodal de los datos es en la que encontramos tres modas.
Si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.
El intervalo modal es el de mayor frecuencia absoluta.
Ejemplo:
En la distribución:
5, 8, 9, 4, 5, 5, 8, 1, 2
La moda es 5, pues es el valor que cuenta con la mayor frecuencia: Aparece 3 veces.
Una distribución puede tener más de una moda si dos o más datos, o clases de datos, tienen la
misma frecuencia y esta es la más alta de la distribución.
Moda de datos agrupados
Para calcular la moda de los valores pertenecientes a una clase se cuenta con la siguiente fórmula.
En donde f es la frecuencia del intervalo y x su marca de clase o punto medio.
SEMANA 3
Mediana
Dentro de la rama de medidas de tendencia central en estadística descriptiva, y considerando
los datos de una muestra ordenada en orden creciente (de menor a mayor),
definiremos como mediana al valor de la variable que deja el mismo número de datos antes y
después que él. De acuerdo con esta definición el conjunto de datos menores o iguales que la
mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán
el otro 50% del total de datos de la muestra.
Matemáticamente hablando la mediana sería: Me = , si n es impar --> Me será la
observación central de los valores, una vez que estos han sido ordenados en orden creciente o
decreciente.
Me = , si n es par --> Me será el promedio aritmético de las dos observaciones
centrales.
Observaciones:
- La mediana de un conjunto de datos es única.
- El valor de la mediana no es sensible a la presencia de datos extremos.
Ejemplo (sobre la representatividad)
Supongamos que hay 19 pobres y un millonario en una habitación. Cada uno pone $5 sobre la
mesa pero el millonario aporta un millón. Eso da un total de $1.000.095.
Si el dinero se repartiese por partes iguales, eso daría un promedio (media) de $50.004,75, pero la
mediana da $5, ya que si uno divide el grupo en 2, se puede decir que 10
personas aportaron $5 o menos, mientras que las otras 10 personas aportaron $5
o más.
En ese sentido, la mediana representa la cantidad típica que cada persona aportó.
En contraste, el promedio es para nada típico, ya que nadie aportó ni cerca de los
$50.004.75
Ejemplo ( N impar )
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la
siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).
Así, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y
basándonos en la fórmula que hace referencia a las frecuencias absolutas -->
Ni-1< n/2 < Ni = N19 < 19.5 < N20
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En nuestro ejemplo,
21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable
no olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.
Ejemplo ( N par )
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la
siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 6 9 4 4 2
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen
derecho).
xi fi Fi
1 2 2
2 2 4
3 4 8
4 5 13
5 8 21 > 19.5
6 9 30
7 3 33
8 4 37
9 2 39
xi fi Fi
1 2 2
2 2 4
3 4 8
4 5 13
5 6 19 = 19
6 9 28
7 4 32
8 4 36
9 2 38
Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y
basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18
< 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el
decimonoveno y el vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo
hasta el vigésimo octavo)
con lo que Me = (5+6)/2 = 5,5 puntos.
La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más
SEMANA 4
MEDIDAS DE DISPERSION
La dispersión mide cuan alejados están un conjunto de valores respecto a su media aritmética. Así
cuanto menos disperso sea el conjunto más cerca del valor medio se encontrarán sus valores.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia
central, sino que necesitamos conocer también la desviación que representan los datos en su
distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones. Las medidas de dispersión más usadas son:
el rango o amplitud, la varianza, la desviación estándar y la covarianza.
Ejemplo:
Podemos tener un conjunto de átomos de una sustancia con una media de velocidades 0. De ello
no cabe concluir que los miembros del sistema están quietos. Ello implicaría que la substancia se
encontraría cerca del cero absoluto. Con una media de 0 podemos tener desde un sólido
cristalizado hasta un gas muy caliente. La variable que determinará en qué estado de agitación
térmica se encuentran los átomos del sistema será la dispersión de velocidades.
EL RANGO O AMPLITUD
Es la diferencia entre el valor más grande y el más pequeño de un conjunto de valores. Puede verse
afectada por valores extremos, poco representativos. Además, esta medida al aumentar el número
de valores aumenta o se queda igual pero nunca disminuye. Esta medida presenta problemas que la
hacen poco apta para usos estadísticos.
VARIANZA
La varianza representa la media aritmética de las desviaciones de la media elevadas al cuadrado. Si
atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza
poblacional; y si por el contrario prestamos atención sólo a una muestra de la población,
obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen
a continuación.
Expresión de la varianza muestral:
Expresión de la varianza poblacional:
DESVIACION ESTANDAR
La desviación estándar (DS/DE), también conocida como desviación típica, es una medida de
dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del
promedio en una distribución. De hecho, específicamente, la desviación estándar es "el promedio
de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra
sigma, . Una desviación estándar grande indica que los puntos están lejos de la media, y una
desviación pequeña indica que los datos están agrupados cerca de la media.
Una vez entendida la formulación de la varianza podemos pasar a obtener la desviación estándar,
tomando la raíz cuadrada positiva de la varianza.
Expresión de la desviación estándar muestral:
Expresión de la desviación estándar poblacional:
Ejemplo:
Las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus
desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación
mucho menor que las otras dos porque sus valores están más cerca de 7.
Ejemplo:
Aquí se muestra cómo calcular la desviación estándar de un conjunto de datos. Los datos
representan la edad de los miembros de un grupo de niños. { 4, 1, 11, 13, 2, 7 }
1. Calcular el promedio o media aritmética .
.
Este es el promedio.
2. Calcular la desviación estándar
Esta es la desviación estándar.
Ejemplo:
Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros: 3,3,4,4,5
Solución:
Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto
al cual vamos a medir las diferencias. Éste es la media:
La varianza es:
siendo la desviación típica su raíz cuadrada:
SEMANA 5
TEORIA DE LA PROBABILIDAD
La teoría de probabilidad es la teoría matemática que modela los fenómenos aleatorios, éstos
deben contraponerse a los fenómenos determinísticos,
Fenómeno determinístico
Son fenómenos en los cuales el resultado de un experimento, realizado bajo condiciones
determinadas, produce un resultado único o previsible. Ejemplo: El agua calentada a 100 grados
centígrados, a presión normal, se transforma en vapor.
Fenómeno aleatorio
Un fenómeno aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas
condiciones determinadas, tiene como resultados posibles un conjunto de alternativas. Ejemplo:
lanzar un dado o una moneda.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece
a la regla de cálculo de casos favorables sobre casos posibles, permitió la modelación matemática
de sofisticados fenómenos aleatorios. Actualmente, estos fenómenos encuentran aplicación en las
más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el
desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo
de Black y Scholes para la valuación de acciones).
VARIABLE ALEATORIA
En estadística y teoría de probabilidad una variable aleatoria se define como el resultado
numérico de un experimento aleatorio en el cual dicha variable toma diferentes valores.
Matemáticamente, es una función medible que da un valor numérico, del conjunto
de los reales, a cada suceso en el espacio Ω del espacio muestral del experimento. El espacio
muestral está conformado por los posibles resultados de un experimento. Al conjunto de los
valores posibles de una variable aleatoria se conoce como rango.
Dado una variable aleatoria X se pueden calcular estimadores estadísticos diferentes como la
media (Media aritmética, Media geométrica, Media ponderada) y valor esperado y varianza de la
distribución de probabilidad de X.
Ejemplo
Suponga que lanzamos dos monedas al aire y, sea X la variable aleatoria que identifica el número
de caras obtenidas en el lanzamiento.
X: Número de caras obtenidas en el lanzamiento.
Ω = { cc, cs, sc, ss } (c identifica una cara, s una cruz)
RX = { 0, 1, 2 } (Recorrido de X)
Entonces asociando Omega con el Recorrido de X, tenemos que:
Tipos de Variables aleatorias
Variable aleatoria discreta: variable que toma un número finito o infinito de valores
numerables. Variable aleatoria que puede tomar sólo un número limitado de valores.
Variable aleatoria continua: variable que toma un valor infinito de valores no numerables.
Variable aleatoria que puede tomar cualquier valor dentro de un intervalo dado de valores.
DEFINICIÓN CLÁSICA DE PROBABILIDAD
La probabilidad es la característica de un suceso del que existen razones para creer que se
realizará. Los sucesos tienden a ser una frecuencia relativa del número de veces que se realiza el
experimento. La probabilidad pude tomarse como una medida del riesgo de que un evento ocurra.
Así, la probabilidad se calcula de la siguiente forma:
# casos favorables
P(A) = ------------------------------------
# total de resultados posibles
Probabilidad discreta
Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes que son el
resultado de la cuenta de alguna característica de interés.
Estos Valores pueden ser de varios tipos ya sean Finitos o Infinitos, Numerables o innumerables
Ejemplo: Sea X el número de caras obtenidas al lanzar 3 veces una moneda. Aquí los valores de X
son x = 0, 1, 2, 3
Como se muestra en el ejemplo 1 estos valores son Numerables, y Finitos, ya que se nos da un
número de específico de casos y solo nos pueden dar un numero especifico de resultados.
Probabilidad continua
Una variable aleatoria es una función
que da un valor numérico a cada suceso en Ω.
Ejemplos:
a) la posibilidad de seleccionar una carta de un mazo
b) la posibilidad que un producto nuevo tenga aceptación en el mercado
c) la posibilidad de que un estudiante seleccionado al azar en una clase tenga un promedio de B
Ejemplo:
Se lanzan dos monedas al aire, ¿cuál es la probabilidad de que ambas salgan cara?
S = { cc, cs, sc, ss }
P ( cc ) = 2/4 = 0.5
Ejemplo:
Se lanzan dos dados al aire, ¿cuál es la probabilidad de que la suma sea mayor de 7?
S = {1,1; 1,2; 1,3; 1,4; …………… 6,1; 6,2;…. 6,6}
Tamaño de S = 36
P ( ∑ d > 7 ) = 15 / 36
DEFINICIONES BASICAS
Experimento. Cualquier acción cuyo resultado se registra como un dato.
Espacio Muestral (S). El conjunto de todos los posibles resultados de un experimento.
Ejemplo:
Supongamos el lanzar un dado al aire y observaremos los resultados siguientes:
S = {1, 2, 3, 4, 5, 6 } S = { 6 }
Ejemplo:
En el lanzamiento de dos monedas tenemos
S = {cc, cs, sc, ss } S = { 4 }
Evento. Es el resultado de un experimento. Cuando cada evento es seleccionado al azar, el
experimento se denomina aleatorio o al azar.
Evento Simple (E). Cada uno de los posibles resultados de un experimento y que no se puede
descomponer. En el caso del lanzamiento del dado, cada uno de los posibles números en la cara del
dado es un evento simple.
Evento Compuesto. Los eventos A, B, C, etc., son eventos compuestos si se componen de dos o
más eventos simples.
Ejemplos de eventos simples y compuestos:
Evento simple: Lanzamiento de un dado
A = {evento que salga un # impar}
A = {1, 3, 5}
B = {el número sea ≤ 4} = {1, 2, 3, 4}
Evento Compuesto: Lanzamiento de dos monedas
A = el evento de observar una cara
A = {cc, cs, sc, ss}
Operaciones de conjuntos
Es necesario recordar las operaciones de conjuntos puesto que constituyen el fundamento de las
probabilidades.
Unión. La unión de dos conjuntos A y B es el conjunto C que está formado por los elementos
de A, de B o de ambos.
Intersección. La intersección de dos conjuntos A y B es el conjunto C que está formado por
los elementos que pertenecen a ambos conjuntos simultáneamente.
Complementos. El complemento de un conjunto A que se denota por A’ son todos los demás
elementos que no se encuentran en A.
Tipos de eventos
Eventos Mutuamente excluyentes
Si dos conjuntos A y B no tienen elementos en común, su intersección será nula o vacía. En este
caso A y B se dicen eventos mutuamente excluyentes.
A ∩ B = {Φ}
Eventos colectivamente exhaustivos
Dos eventos son colectivamente exhaustivos si al hacer la unión de los mismos, se obtiene el
espacio muestral.
A U B = {S}
Reglas Básicas de Probabilidades Para Eventos Simples
1. Ley Fundamental de la probabilidad
Una probabilidad siempre estará comprendida entre 0 y 1. Cuando el suceso es imposible se dice
que su probabilidad es 0 y se dice que es un suceso cierto cuando siempre tiene que ocurrir y su
probabilidad es 1.
0 ≤ P(A) ≤ 1
2. ∑ P(A) = 1. La suma de las probabilidades de todos los eventos simples posibles del espacio
muestral es 1.
3. Ley del Complemento. Si A’ es el complemento de A, entonces, P (A’) + P (A) = 1
Proceso Para Calcular la probabilidad de un Evento
1) Haga una lista de todos los eventos contenidos en el espacio muestral.
2) Asigne la probabilidad que corresponda a cada evento simple.
3) Determine los eventos simples que constituyen el evento de interés.
4) Sume las probabilidades de todos los eventos simples que constituyen el evento de interés.
Regla de Suma de Probabilidades
Eventos Mutuamente Excluyentes
Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir al mismo tiempo.
P(A U B) = P(A) + P(B) ssi [ P(AB) = 0 ]
b. Eventos No Mutuamente Excluyentes
Dos eventos A y B son no mutuamente excluyentes si ambos pueden ocurrir simultáneamente.
P(A U B) = P(A) + P(B) - P(A_B)
Ejercicio propuesto
1. La tabla siguiente muestra el número de hornos microondas vendidos por día en una tienda de
ventas al detalle del área metropolitana de San Juan
# de microhondas (E) # de días
0 15
1 48
2 25
3 22
4 10
Determinar la probabilidad de que el número de microondas que se vendan actualmente sean:
a) 3 b) menos de 2 c) más de 1 d) por lo menos 2 e) entre 1 y 3 ambos incluidos f) exactamente 4
SEMANA 6
TÉCNICAS DE CONTEO
El análisis de los problemas de probabilidad se facilita a través de métodos sistemáticos de conteo
de los grupos y arreglos de los datos.
Principio de Multiplicación
Si un experimento puede describirse como una secuencia de k pasos y en cada paso hay n1
resultados en el primer paso, n2 resultados en el segundo paso, n3 resultados en el tercer paso, y
así sucesivamente, entonces el número de eventos que pueden ocurrir será,
(n1) • (n2) • (n3) • (n4) • • • • • • (nk)
Ejemplos:
1. Lanzar dos dados:
(n1) • (n2) = (6) • (6) = 36
2. Suponga que se desea formar un comité de tres miembros en el cuál se elegirá un presidente, un
vicepresidente y un tesorero. Hay dos candidatos para la presidencia, 4 para la vicepresidencia y 3
para el tesorero. ¿De cuántas formas se puede formar el comité?
# de formas para escoger presidencia: 2
# de formas para escoger vicepresidencia : 4
# de formas para escoger el tesorero : 3
# formas para escoger las posiciones: 2 • 4 • 3 = 24
Muestras Ordenadas
PERMUTACIÓN (P)
Cada arreglo de datos donde el orden es importante y que puede realizarse tomando algunos datos
o todos los datos contenidos en el grupo.
NPn = N! / [N – n]!
N = # de elementos diferentes disponibles (población)
n = # número de elementos tomados de N (muestra)
También se denota como:
o
NOTA
Definición de Factorial.
El simbolo n! que se lee “n factorial “ se refiere al producto de todos los enteros desde n hasta 1.
n ! = n ( n – 1 ) ( n – 2 ) ( n – 3 ) ……….3.2.1
definición: 0 ! = 1 ( cero factorial es 1 )
ejemplos; 5 ! = 5 . 4 . 3 . 2 . 1
5 ! = 5 . 4 !
4 ! = 4 . 3 . 2 . 1 4 ! = 4 . 3 !
3 ! = 3 . 2 . 1 3 ! = 3 . 2 !
2 ! = 2 . 1
Ejemplo. ¿De cuántas maneras se pueden ordenar las letras A, B, C tomándolas todas a la vez?
Solución:
3P3 = 6 ; P= [ ABC, BCA, CAB, BAC, CBA, ACB ]
Ejemplo:
Un examen de candidatura consta de 5 partes que pueden obtenerse de un total de 10 temas. ¿de
cuántas maneras se pueden escoger las 5 partes?
10P5 = 10! / [10 – 5]! = 120
Ejemplo:
Haga una lista de las permutaciones que pueden formarse con los #s: 1, 2, 3 y 4 tomando dos a la
vez.
4P2 = 4! = 4 • 3 • 2! = 12
(4- 2)! 2 !
Muestras no ordenadas sin repetición.
Cuando el orden en que se seleccionan los objetos no importa, tenemos lo que se denomina una
Combinación.
COMBINACIONES (C)
Número de formas diferentes que se pueden seleccionar n objetos de un total de N objetos distintos
sin importar el orden (Ej. juego de póker).
NCn = N! / n! ( N – n ) !
También se denota como:
o como: o como:
Ejemplo:
Se dispone de 8 personas, 5 hombres y 3 mujeres, para formar un comité de 5 personas.
¿De cuántas maneras se puede formar el comité si debe incluir 3 hombres y 2 mujeres?
NCn = 8C5 = [5C3][3C2 ] = [ 5! / 3! (5-3)! ] [ 3! / 2! (3-2)!]
NCn= 8C5 = [10] [3] = 30
Las permutaciones están ligadas a las combinaciones mediante la siguiente identidad:
Ejercicios resueltos1
1. ¿Cuántos números de 3 cifras distintas se pueden formar con los números 2, 3, 5, 7, 8, 9?
Solución: 6P3 = 120
2. Cinco personas entran en un vagón de ferrocarril en que hay 7 asientos. ¿De cuántas maneras
distintas pueden sentarse?
Solución: 7P5 = 2520
1 Tomado de: http://ima.ucv.cl/mapoyo/guias/nat_combinatoria.pdf
3. ¿Cuántos números de 4 cifras distintas se pueden formar con los números 1, 3, 5, 6, 8, 0?
¿Cuantos de ellos son pares?
Ayuda: No hay que considerar los que empiezan con 0, por ejemplo 0135 135, y éste no es un
número de 4 cifras.
Respuesta: 6P4 – 5P3 = 360 – 60 = 300; pares = 5P3 * 3 – 5P3 = 120
20. ¿Cuántas permutaciones pueden formarse con las letras de la palabra CUADERNO?
¿Cuántas comenzarán con C y terminarán con O?
21. ¿De cuántas maneras 4 hombres y 4 mujeres pueden sentarse alrededor de una mesa
redonda, si se intercalan los sexos?
SEMANA 7
PROBABILIDAD CONDICIONAL
En muchas ocasiones la probabilidad de que ocurra un evento depende de lo que ha ocurrido con
otro evento. En este caso tenemos lo que se llama probabilidad condicional.
Definición de probabilidad condicional
Se llama probabilidad condicional a la probabilidad de que un suceso se cumpla habiéndose cumplido ya otro. Se nota
"probabilidad de A sabiendo que B se ha cumplido" de la siguiente manera:
pB(A) ó p(A\B)
Dicha probabilidad se calculará de la siguiente forma:
La probabilidad condicional de A, dado que ha ocurrido el evento B, se escribe P(A/B). O sea, es
la probabilidad de que ocurra un evento A cuando se conoce cierta información relacionada con la
ocurrencia de otro evento B.
P(A/B) probabilidad de que ocurra A dado que B ha ocurrido.
P(B/A) probabilidad de que ocurra B dado que A ha ocurrido.
P(A/B) = P(A_B) / P(B) probabilidad condicional de A
P(B/A) = P(A_B) / P(A) probabilidad condicional de B
P(A_B). Es la probabilidad conjunta porque denota la intersección de dos eventos, A y B.
P(A) y P(B) se denominan probabilidades marginales
Eventos Independientes y Dependientes
Se dice que dos eventos son independientes si y solo si, P(A/B) = P(A)
Se dice que dos eventos son dependientes si la ocurrencia de uno de ellos afecta la ocurrencia del
otro. P(A/B) ≠ P(A)
Regla de Multiplicación de probabilidad
Esta regla de probabilidad se deriva de la definición de probabilidad condicional y utiliza el
concepto de intersección de eventos para su aplicación.
a. Si A y B son eventos independientes, entonces,
P(A_B) = P(A) • P(B)
b. Si A y B son eventos dependientes, entonces,
P(A_B) = P(B) • P(A/B)
P(A_B) = P(A) • P(B/A)
Ejemplo de probabilidad condicional 1:
Un importador de piñas recibe un cargamento de 500 cajas de la República Dominicana. Los datos
de piñas dañadas en cada caja se muestran a continuación. El cálculo de las probabilidades
correspondientes se muestra en la columna P(E).
Evento ( E )
# de piñas dañadas
# de cajas P ( E )
0 385 385 / 500 = 0.77
1 90 90 / 500 = 0.18
2 14 14 / 500 = 0.028
3 11 11 / 500 = 0.022
Ejemplo de probabilidad condicional 2:
La tabla a continuación nos presenta el ascenso a catedráticos de los profesores de una institución
durante los últimos 5 años.
Tabla de Ascenso al rango de Catedrático
Hombres Mujeres Totales
Ascendido A 278 26 304
No ascendido A' 662 194 856
Totales 940 220 1,160
En la tabla de las probabilidades las probabilidades conjuntas aparecen en el interior de la tabla y
las probabilidades marginales en los márgenes. Estas últimas se llaman probabilidades marginales.
Tabla de Probabilidades Conjunta
Hombres Mujeres Totales
A 0.24 0.02 0.26
A' 0.57 0.17 0.74
Totales 0.81 0.19 1.00
A- ascendido A'- no ascendido
¿Cuál es la probabilidad de que un profesor seleccionado al azar sea hombre (H) y fue ascendido?
P(H_A) = 278 / 1160 = 0.24
¿Cuál es la probabilidad de que un profesor seleccionado al azar sea hombre (H) y no fue
ascendido?
P(H_A') = 662 / 1160 = .57
¿Cuál es la probabilidad de que un profesor seleccionado al azar sea mujer (M) fue ascendido?
P(M_A) = 26 / 1160 = .02
¿Cuál es la probabilidad de que un profesor seleccionado al azar sea mujer (M) y no fue
ascendido?
P(M_A') = 194 / 1160 = .17
Ejemplo de probabilidad condicional 3:
Considerando los datos del ejemplo anterior, calcule:
a. Cuál es la probabilidad de que un profesor escogido al azar sea ascendido dado que es hombre
(H)?
P(A/H) = 278 / 940 = 0.30
Alternativamente
P(A_H) = P(H) • P(A/H)
P(A/H) = P(A_H)/P(H) = 0.24 / 0.81 = .030
b. La probabilidad de que un profesor escogido al azar sea ascendido dado que es hombre (M)
P(A/M) = 26 / 220
Alternativamente P(A_M) = P(M) • P(A/M)
P(A/M) = P(A_M) / P(M)= 0.02 / 0.19 = 0.12
Ejercicios de probabilidades propuestos 2
1. Una urna contiene 10 bolas, 6 blancas y 4 negras. Si se saca una bola al azar, ¿cuál es la
probabilidad de que la bola sea blanca? Respuesta: 0.60
2. Se saca una carta de un mazo de 52 cartas:
a. la probabilidad de que la carta sea un rey. Respuesta: 0 .071
b. la probabilidad que sea un As de corazón rojo. Respuesta: 0.019
c. la probabilidad que la carta sea negra. Respuesta: 0 .5
d. la probabilidad que la carta sea de espada. Respuesta: 0.25
3. Se saca una carta de un mazo de 52 cartas, ¿cuáles la probabilidad de que sea un As o un Rey?
Respuesta: 0.1538
2 http://facultad.sagrado.edu/ConceptosBasicos.pdf
4. Se saca una bola de una urna que contiene 12 bolas, 7 azules y 5 blancas, ¿cuál es la
probabilidad de que sea azul o blanca.
5. Un individuo que entra a una farmacia tiene una probabilidad de comprar pasta dental de 0.45,
de comprar desodorante de 0.35 y de comprar ambos de 0.25. Si ese individuo entra a la farmacia,
¿cuál es la probabilidad la de que compre pasta dental o desodorante? Respuesta: 0.55
6. Se saca una carta de un mazo de 52 cartas, ¿cuál es la probabilidad de que se obtenga un As o
una carta roja? Respuesta: 0.538
7. En la población de Puerto Rico se ha estimado que la probabilidad de fumar es de 0.65 y la de
fumar ocasionalmente de 0.20, ¿cuál es la probabilidad de no fumar para esa población?
8. En una universidad 40% poseen un diploma en el idioma Francés, 30% poseen un diploma en el
idioma Italiano y 10% poseen un diploma en ambos idiomas. Si se escoge un miembro de esa
comunidad al azar, ¿cuál es la probabilidad de que posea un diploma de Francés o Italiano?
9. Suponga que un distribuidor de autos recibe 12 nuevos modelos, 8 automáticos y 4 estándares.
Si se venden cuatro autos el próximo mes, ¿cuál es la probabilidad de que los autos vendidos sean
dos automáticos y dos estándares? ¿Cuál es la probabilidad de que los 4 sean o automáticos o
estándares? Respuesta: 0.33 y 0.1434
10. La probabilidad de que ocurra el evento A es 0.35, la probabilidad de que ocurra el evento B es
0.10. Si A y B son eventos independientes, ¿cuál es la probabilidad de que ocurra el evento
[P(A∩B]?
11. 55 porciento de las personas de Puerto Rico viven en el área metropolitana de San Juan
(SJMA). Además, 70 porciento de esas personas se sienten felices y 40 porciento de todas las
personas de PR viven en el SJMA y son felices. Demostrar si los eventos vivir en el SJMA y ser
felices son eventos dependientes o independientes.
12. Si los eventos A y B son mutuamente excluyentes y si P(A) = 0.30 y P(B) = 0.45, determinar
P(A B ) y P( A / B)
13. El 50% de las personas de una comunidad poseen una cámara digital y una computadora.
Además, 30% posee una computadora y 40% una cámara digital. ¿Cuál es la probabilidad que si
seleccionamos una persona al azar posea una cámara o una computadora?
UNIDAD II
FUNCIONES PROBABILÍSTICAS
Objetivos:
Determinar y graficar las funciones de probabilidad y de distribución de una cierta variable
aleatoria discreta y continua.
Distinguir una ley de probabilidades de otra mediante sus características
ORIENTACIONES PARA EL TRABAJO CON LA UNIDAD II
La unidad 2 se estudia desde la 8va hasta la 11ra semana de clases y comprende temas como:
distribución de probabilidad, distribución binomial, distribución hipergeométrica, distribución de
Poisson, distribución de Gauss.
Los temas a revisarse durante cada una de las semanas se encuentran conformados por: teoría,
ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y
adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se
sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos.
SEMANA 8
DISTRIBUCIONES DE PROBABILIDAD
Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo
tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen
exactamente las mismas condiciones iniciales que lo determinan sino sólo unas pocas. Los
procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos
complejos donde no se conocen todos los parámetros que intervienen o no son reproducibles sus
condiciones iniciales (teoría del caos). Para simplificar, generalmente a este tipo de problemas
también se le considera aleatorio aunque estrictamente hablando no lo sea.
La distribución de probabilidad es un modelo teórico que describe la forma en que varían los
resultados de un experimento aleatorio. Lista de los resultados de un experimento con las
probabilidades que se esperarían ver asociadas con cada resultado.
Función de densidad de probabilidad
La función de densidad, o densidad de probabilidad de una variable aleatoria, es una función a
partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el
caso de variables aleatorias continuas es la distribución de probabilidad. En el caso de variables
aleatorias discretas la distribución de probabilidad se obtiene a través del sumatorio de la función
de densidad.
Es una función que mide concentración de probabilidad alrededor de los valores de una variable
aleatoria continua.
Función de probabilidad: función que asigna probabilidades a cada uno de los valores de
una variable aleatoria discreta.
Función de distribución: función que acumula probabilidades asociadas a una variable
aleatoria.
ESPERANZA MATEMATICA O VALOR ESPERADO
En estadística la esperanza matemática o valor esperado de una variable aleatoria es la suma de la
probabilidad de cada suceso multiplicada por su valor. Por ejemplo en un juego de azar el valor
esperado es el beneficio medio.
Es el valor de la variable aleatoria para el cual la función de distribución se maximiza. Para
funciones de distribución simétricas con un máximo central el valor esperado coincide con la
Media ponderada. Si todos los sucesos son de igual probabilidad la esperanza es la media
aritmética.
Definición de la esperanza
Para una variable aleatoria discreta con valores posibles y sus posibilidades
representadas por la función de masa p(xi) la esperanza se calcula con
Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los
valores y la función de densidad f(x):
o
La esperanza también se suele simbolizar con μ = E[X]
Las esperanzas para se llaman momentos de orden . Más importantes
son los momentos centrados .
No todas las variables aleatorias tienen un valor esperado (por ejemplo la distribución de Cauchy).
La esperanza es un operador lineal, ya que
,
donde e son variables aleatorias y y dos constantes cualesquiera
SEMANA 9
DISTRIBUCION BINOMIAL
Supongamos que un experimento aleatorio tiene las siguientes características:
En cada prueba del experimento sólo son posibles dos resultados: el suceso A
(éxito) y su contrario (fracaso).
El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
La probabilidad del suceso A es constante, la representamos por p, y no varía de
una prueba a otra. La probabilidad de A’ es 1- p y la representamos por q .
El experimento consta de un número n de pruebas.
Todo experimento que tenga estas características diremos que sigue el modelo de la distribución
Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del
experimento, la llamaremos variable aleatoria binomial.
La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3,
4,..n suponiendo que se han realizado n pruebas. Como hay que considerar todas las maneras
posibles de obtener k-éxitos y (n-k) fracasos debemos calcular éstas por combinaciones (número
combinatorio n sobre k).
La distribución Binomial se suele representar por B(n,p) siendo n y p los parámetros de dicha
distribución.
Parámetros de la Distribución Binomial
Función de Distribución de la v.a. Binomial
siendo k el mayor número entero menor o igual a xi.
Esta función de distribución proporciona, para cada número real xi, la probabilidad de que la
variable X tome valores menores o iguales que xi.
El cálculo de las F(x) = p( X x) puede resultar laborioso, por ello se han construido tablas para
algunos valores de n y p que nos facilitan el trabajo.
Sea X una variable aleatoria discreta correspondiente a una distribución binomial.
Ejemplo 1
Una máquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas
defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo haya una defectuosa.
Solución:
Se trata de una distribución binomial de parámetros B(50, 0'007) y debemos calcular la
probabilidad p(X=1).
Ejemplo 2
La probabilidad de éxito de una determinada vacuna es 0,72. Calcula la probabilidad de a que una
vez administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solución :
Se trata de una distribución binomial de parámetros B(15, 0'72)
Ejemplo 3
La probabilidad de que el carburador de un coche salga de fábrica defectuoso es del 4 por 100.
Hallar:
a) El número de carburadores defectuosos esperados en un lote de 1000
b) La varianza y la desviación típica.
Solución:
DISTRIBUCION HIPERGEOMETRICA
Los experimentos que tienen este tipo de distribución tienen las siguientes características:
a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.
b) Las probabilidades asociadas a cada uno de los resultados no son constantes.
c) Cada ensayo o repetición del experimento no es independiente de los demás.
d) El número de repeticiones del experimento (n) es constante.
Se calcula así:
nN
xnaNxa
C
C*C)n,x(p
Donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados
xnaNxa C*C muestras de n objetos en donde hay x que son defectuosos y n-x buenos
nN C todas las muestras posibles de seleccionar de n objetos tomadas de entre N
objetos en total = espacio muestral
Ejemplo:
Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de
seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?
Solución:
N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
!)!(
!!)!(
!*
!)!(
!
C
C*C
C
C*C)n,x(p
4410
10227
7
223
3
42410
2723
410
2431023
!!
!*
xxx
xxx
!!
!xxxx!!
!xx*
!!
!xx
!!
!!!
!*
!!
!
22
4
78910
6723
46
67891025
567
21
123
46
1025
7
21
3
donde:
78910
6723
xxx
xxx
probabilidad asociada a cada muestra de 4 objetos que se seleccionaron,
con lo que se demuestra que las probabilidades no son constantes
!!
!
22
4
formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados =
muestras de 4 objetos entre los que 2 son defectuosos
Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería:
30020160
6048
4
24
5040
252
22
4
78910
6723.*
!!
!*
xxx
xxx
Ejemplo:
Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una
botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la
aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el
viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea
arrestado por posesión de narcóticos?
Solución:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico
que se puede encontrar al seleccionar las 3 tabletas
p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas
haya 1 o más tabletas de narcótico)
315
0936
315
1926
315
29163321C
C*C
C
C*C
C
C*C)n;tabletasó,x(p
815380
455
371
455
20135216
455
120
455
915
455
366.
))(())(())((
otra forma de resolver;
p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas
seleccionadas no haya una sola de narcótico)
315
39061301C
C*C)n;x(p
81538501846150
455
8411 ..
))((
a) p(no sea arrestado por posesión de narcóticos)
315
390630C
C*C)n;x(p
1846150
455
841.
))((
Ejemplo:
De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3 proyectiles
defectuosos que no explotarán, ¿cuál es la probabilidad de que , a) los 4 exploten?, b) al menos 2
no exploten?
Solución:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de proyectiles que
explotan entre la muestra que se dispara
166670
210
35
210
13544
410
0347 .))((
C
C*C)n;x(p
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =
3333330
210
70
210
763
210
71213
410
17332723 .))(())((
C
C*CC*C
Ejemplo:
Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas únicamente a dos
menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los
cuales 4 no tienen la edad suficiente?, b) ¿Cuál es la probabilidad de que como máximo 2 de las
identificaciones pertenezcan a menores de edad?
Solución:
a) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas menores
de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
2380950
126
10352
59
3524.
))((
C
C*C)n,x(p
b) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas menores de
edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
126
10654115210
59
352445145504 ))(())(())((
C
C*CC*CC*C)n;,,x(p
642860
126
81
126
60201.
Ejercicio propuesto
1. Una compañía manufacturera utiliza un esquema para la aceptación de los artículos producidos
antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se
selecciona una muestra de 3 para verificar si tienen algún artículo defectuoso. Si se encuentra uno,
la caja entera se regresa para verificarla al 100%. Si no se encuentra ningún artículo defectuoso, la
caja se embarca. a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos
defectuosos?, b) ¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso
se regresa para verificación?
SEMANA 10
DISTRIBUCION DE POISSON
Es una distribución de probabilidad discreta. Expresa la probabilidad de un número de eventos
ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y son
independientes del tiempo desde el último evento. Su distribución de probabilidad está dada por:
Donde:
e es el base del logaritmo natural (e = 2.71828...),
k! es el factorial de k,
λ es un número real positivo, equivalente al número esperado de ocurrencias durante un
intervalo dado. Por ejemplo, si los eventos ocurren de media cada 4 minutos, y se está
interesado en el número de eventos ocurriendo en un intervalo de 10 minutos, se usaría
como modelo una distribución de Poisson con λ = 2.5.
Ejemplo:
Por ejemplo, si 2% de los libros encuadernados en cierto taller tiene encuadernación defectuosa,
obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan
encuadernaciones defectuosas.
SEMANA 11
DISTRIBUCION NORMAL
La distribución normal, también llamada distribución de Gauss o distribución gaussiana, es la
distribución de probabilidad que con más frecuencia aparece en estadística y teoría de
probabilidades. Esto se debe a dos razones fundamentalmente:
Su función de densidad es simétrica y con forma de campana, lo que favorece su aplicación
como modelo a gran número de variables estadísticas.
Es, además, límite de otras distribuciones y aparece relacionada con multitud de resultados
ligados a la teoría de las probabilidades gracias a sus propiedades matemáticas.
La función de densidad está dada por:
donde μ (Μ) es la media y σ (sigma) es la desviación estándar (σ2 es la varianza).
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma
de campana.
La importancia de la distribución normal se debe principalmente a que hay muchas variables
asociadas a fenómenos naturales que siguen el modelo de la normal:
Caracteres morfológicos de individuos
Caracteres fisiológicos como el efecto de un fármaco
Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de
individuos
Caracteres psicológicos como el cociente intelectual
Errores cometidos al medir ciertas magnitudes
Valores estadísticos muestrales como la media
Distribución normal estándar. Estandarización
Cuando μ = 0 y σ = 1, la distribución se conoce con el nombre de normal estándar.
Dada una variable aleatoria normal X, con media (también llamada Esperanza matemática) μ y
desviación típica σ, si definimos otra variable aleatoria entonces la variable
aleatoria Z tendrá una distribución normal estándar μ = 0 y σ = 1. Se dice que se ha tipificado la
variable X.
Ejemplo:
Para hallar la probabilidad de la distribución normal, se deben usar tablas predefinidas que nos dan
estos valores directamente, si bien éstas se calculan para la distribución Normal Tipificada.
En el caso de que la distribución no sea estándar, por ejemplo, x=2.6 y N(μ,σ) con μ = 2 y σ = 3,
tendremos que tipificar la variable:
Obtenemos una variable Z normal, que además está tipificada. Si ahora consultamos en la tabla,
UNIDAD III
PROCESOS ESTOCÁSTICOS
Objetivos:
Introducir al estudiante en la problemática del modelamiento de sistemas estocásticos.
Resolver problemas asociados a las transiciones entre estados
Adquirir los conceptos de irreducibilidad y periodicidad. Clasificar los estados de una cadena
de Markov.
Utilizar la clasificación de los estados y la periodicidad de los mismos para conocer el
comportamiento a largo plazo de una cadena de Markov.
ORIENTACIONES PARA EL TRABAJO CON LA UNIDAD III
La unidad III se estudiará desde la 12da hasta la 18va semana de clases y comprende temas como:
Ruido, movimiento Browniano, cadenas de Harkov en tiempo discreto y continuo, teoría ergódica,
para finalmente terminar revisando las ecuaciones de Chapman-Kolmogorov.
Los temas a revisarse durante cada una de las semanas se encuentran conformados por: teoría,
ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y
adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se
sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos.
SEMANA 12
PROCESOS GAUSSIANOS
RUIDO
El ruido es la suma de múltiples interferencias, de origen desconocido y de naturaleza aleatoria.
Origen del ruido
El ruido se genera de varias formas entre las que tenemos:
La agitación térmica producida en las moléculas del material que forma el conductor, por el
choque con los electrones en movimiento.
La irradiación de los cuerpos negros es otro factor importante en el ruido de las
comunicaciones por radio, ya que todos los objetos del universo, dependiendo de su
temperatura, emiten energía en forma de ondas electromagnéticas.
El ruido producido por fuentes tales como contactos defectuosos, artefactos eléctricos,
radiación por ignición y alumbrado fluorescente.
El ruido errático producido por fenómenos naturales tales como tormentas eléctricas con
relámpagos y rayos.
La magnitud del ruido generado por un dispositivo electrónico, se puede expresar mediante el
denominado factor de ruido (F), que es el resultado de dividir la relación señal/ruido en la entrada
(S/R)ent por la relación señal/ruido en la salida (S/R)sal.
El factor de ruido es un parámetro importante en los sistemas de transmisión, ya que mientras el
ruido externo nunca se podrá eliminar totalmente, la reducción del ruido generado por los equipos
depende del cuidado de su diseño.
MOVIMIENTO BROWNIANO
Observemos con cuidado la bocanada de humo que lanza al aire un fumador. Veremos que está
compuesta de pequeñísimas partículas que se están moviendo continuamente en todas las
direcciones, también en zigzag.
Se observa que partículas muy pequeñas se hallan inmersas en un fluido, que en éste caso es el aire
de la atmósfera.
El movimiento descrito, que lleva a cabo una partícula muy pequeña que está inmersa en un fluido,
se llama movimiento browniano. Este movimiento se caracteriza por ser continuo y muy irregular.
La trayectoria que sigue la partícula es en zigzag.
El movimiento browniano es de tipo estocástico y su descripción se hace en términos de su
distribución. Además hay que tener en mente que esta fuerza estocástica cambia al transcurrir el
tiempo, lo que significa que no sólo hay que decir algo acerca de su distribución en un instante
dado de tiempo, sino también algo acerca de cómo están relacionados los valores de las fuerzas
estocásticas en distintos instantes.
Langevin formuló la hipótesis, que de hecho es la más sencilla, de que la distribución de la fuerza
estocástica es gaussiana. Por tanto, su determinación se reduce a conocer su promedio y su
desviación estándar.
DISTRIBUCION DE RAYLEIGH
Esta distribución es usada en trabajos de confiabilidad asociados a problemas en teoría del sonido.
Su función de densidad está dada por
La función de distribución acumulada está dada por
Si T es una variable aleatoria que sigue esta ley de probabilidad se puede demostrar que su
esperanza es
Siendo G ( ) la función gamma definida por
Ejemplo:
Se suele presentar cuando un vector bidimensional (por ejemplo, el que representa la velocidad del
viento) tiene sus dos componentes, ortogonales, independientes y siguen una distribución normal.
Su valor absoluto seguirá entonces una distribución de Rayleigh. Esta distribución también se
puede presentar en el caso de números complejos con componentes real e imaginaria
independientes y siguiendo una distribución normal. Su valor absoluto sigue una distribución de
Rayleigh.
Ejemplo:
Interfaz de radio con GSM
Si suponemos que el móvil se mueve (como es evidente), añadimos los efectos de la propagación
terrestre, que está dominada por la influencia más destructiva de todas: los desvanecimientos
Rayleigh. Dado que las ondas de radio pueden seguir una variedad de caminos hasta el receptor
móvil, pueden ocurrir cambios de fase, que son dependientes de la frecuencia. Este tipo de
desvanecimientos ocurren con una distribución estadística llamada distribución Rayleigh. La
distribución tipo Rayleigh que involucra el voltaje recibido antes de la detección de envolvente, y
la potencia media de la señal recibida antes de la detección de envolvente. La probabilidad de que
la envolvente de la señal recibida no exceda un valor especificado R está data por la
correspondiente función de distribución acumulativa
SEMANA 13
PROCESOS ESTOCASTICOS
DEFINICIONES DE PROCESOS ESTOCASTICOS
Palabra proveniente del griego: στοχαστικός, hábil en conjeturar. Significa "perteneciente o
relativo al azar" según el diccionario.
Se denomina estocástico a aquel sistema que funciona, sobre todo, por el azar. Las leyes de causa-
efecto no explican cómo actúa el sistema (y de modo reducido el fenómeno) de manera
determinista, sino en función de probabilidades.
En Matemáticas y en concreto en Estadística y Teoría de la Probabilidad un proceso aleatorio o
proceso estocástico (o probabilístico) es un concepto matemático que sirve para caracterizar y
estudiar todo tipo fenómenos aleatorios (estocásticos) que evolucionan, generalmente, con el
tiempo.
Ejemplo:
El índice de la bolsa es un ejemplo de proceso estocástico de tipo no estacionario, por eso no se
puede predecir.
Los siguientes son ejemplos de procesos estocásticos dentro del amplio grupo de las series
temporales:
o Señales de telecomunicación
o Señales biomédicas (electrocardiograma, encefalograma, etc...)
o Señales sísmicas
o El número de manchas solares año tras año
o El índice de la bolsa segundo a segundo
o La evolución de la población de un municipio año tras año
El tiempo de espera en cola de cada uno de los usuarios que van llegando a una ventanilla
El clima es un gigantesco cúmulo de procesos estocásticos interrelacionados (velocidad del
viento, humedad del aire, temperatura, etc.) que evolucionan en el espacio y en el tiempo.
Definición matemática
Un proceso estocástico se puede definir equivalentemente de dos formas diferentes:
Como un conjunto de variables aleatorias Xk indexadas por un índice k, que puede ser
continuo o discreto
Como un conjunto de realizaciones temporales y un índice aleatorio que selecciona una de
ellas.
Las variables aleatorias Xk toman valores en un conjunto que se denomina espacio de estados
CADENAS DE MARKOV
Una cadena de Markov, propuesta por el matemático ruso Andrei Markov en 1907, es una serie
de eventos (X1, X2, …,Xn), en la cual la probabilidad de que ocurra un evento depende del evento
inmediato anterior. El rango de estas variables, es llamado espacio estado, el valor de Xn es el
estado del proceso en el tiempo n. Las cadenas de este tipo tienen memoria. "Recuerdan" el último
evento y esto condiciona las posibilidades de los eventos futuros. Esta dependencia del evento
anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una
moneda al aire o un dado.
Ejemplo:
En los negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra de
los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de
equipo. Todos estos procesos se caracterizan porque su estado presente resume toda la información
relevante para describir en probabilidad su estado futuro.
Ejemplo:
Escogemos 4 estudiantes al azar en una clase formada por 10 chicos y 5 chicas. ¿Cuál es la
probabilidad de que hayan sido elegidos chico, chica, chica, chica en ese orden?
Solución:
Nótese que éstos sucesos son dependientes pero NO son estocásticos ya que por ejemplo la
ocurrencia del último evento no de pende solo del inmediatamente anterior, sino de todos los
anteriores puesto que existe un orden predefinido.
P(O1∩A2∩A3∩A4)=P(O1).P(A2/O1).P(A3/O1∩A2).P(A4/O1∩A2∩A3)=01830
12
3
13
4
14
5
15
10....
Ejemplo:
Sea el experimento de tirar dardos 4 veces sobre una diana con probabilidad de acertar cada vez
igual a 0.4.
Solución:
Otra vez es una sucesión de 4 pruebas y cada una de ellas tiene dos acontecimientos posibles:
acertar o errar. Pero ahora las pruebas son independientes y, por lo tanto, la probabilidad de que
ocurra un suceso determinado en una de las pruebas es independiente del resultado de las
anteriores.
Por ejemplo la probabilidad de que hayan ocurrido acierto, error, error, error en ese orden sería:
P(A1∩E2∩E3∩E4)=P(A1).P(E2).P(E3).P(E4)= (0.4).(0.6).(0.6).(0.6)= 0.0864
Este es un proceso probabilística que NO es estocástico.
Ejemplo:
Durante las cuatro horas a la semana que tienen los alumnos de Estadística se reparten entre dos
aulas: o van al aula de Informática, o trabajan en clase. Nunca van a los ordenadores dos días
seguidos pero si un día trabaja en clase es igualmente probable que el día siguiente realice
cualquiera de las dos tareas. El lunes, el profesor tira una moneda para decidir a dónde van.
Solución:
Una vez más el experimento consta de cuatro pruebas con dos sucesos en cada una de ellas (ir al
aula de informática o no ir). A diferencia de los experimentos anteriores, la probabilidad de que
en cada una de las pruebas ocurra un acontecimiento depende únicamente del resultado de
la prueba anterior. Procesos de este tipo SI son estocásticos.
La probabilidad de ir al aula de informática sólo el primer día: (I :"ir al aula de informática"; C="
trabaja en clase").
P( I1∩C2∩C3∩C4)= P(I1).P(C2/I1).P(C3/C2).P(C4/C3)=1250
2
1
2
11
2
1....
Ejemplo:
Calcule la probabilidad de ir al aula de informática el tercer día. p1(2).
Solución:
(Aquí hay que tener en cuenta las probabilidades iniciales p1(0) y p2
(0)) , entonces:
p1(2)=p11
(2).p1(0)+ p21
(2).p2(0)=0.375 )
Ejercicios propuestos
Considere que los posibles estados del experimento anterior son:
a1="ir al aula de Informática"
a2= "trabaja en clase"
p1(0)=probabilidad inicial de ir al estado
a1=1/2
p11=probabilidad de ir del estado a1 al estado
a1=0
p12=probabilidad de ir del estado a1 al estado
a2=1
p2(0)=probabilidad inicial de ir al estado
a2=1/2
p21=probabilidad de ir del estado a2 al estado
a1=1/2
p22=probabilidad de ir del estado a2 al estado
a2=1/2
Se llaman probabilidades de transición entre
estados de la cadena
Ahora, escriba los valores de las probabilidades de la matriz de transición del problema anterior a
lo largo de cuatro días seguidos (n=3 pasos) ¿Qué ocurrirá?
1. Observe los caminos que hay para ir de a1(primer día) a a1 el cuarto día (en n=3 pasos). La
escena te da la probabilidad que será llamada p11(3). Compruebe que te da lo mismo que la
probabilidad de ir al aula de informática en tres pasos (el cuarto día) sabiendo que también fueron
el primer día.
2. Lo mismo para ir de a1 a a2 en tres pasos. p12(3).
3. ¿Y de a2 a a1 en tres pasos? p21(3).
4. Lo mismo de a2 a a2 en tres pasos. p22(3)..
5. Observe que tiene que ocurrir que p1(0)
+ p2(0)=1
6. Observe que tiene que ocurrir que p11+ p12=1 p21+ p22=1
Calcule ahora las siguientes probabilidades para el problema anterior:
7. Calcule la probabilidad de ir al aula de informática en tres pasos (el cuarto día): p1(3).
¿Qué diferencia observas entre la cuestión 1ª y esta?¿Qué probabilidades intervienen?
SEMANA 14
CADENAS FINITAS DE MARKOV
Un proceso estocástico finito en el que se verifica que el resultado de una prueba determinada
depende como máximo de la prueba inmediatamente anterior y no de ninguno de los resultado
previos , recibe el nombre de Cadena finita de Markov.
En una cadena de Markov hay:
Un espacio de estados E={a1,a2,a3,.... an } (Cada estado son todos los resultados
posibles de cada una de las pruebas).
Cuando el resultado de la prueba r es ai decimos que el proceso está en el estado ai en el paso
r-ésimo.
Para cada dos estados ai y aj , la probabilidad de que el estado aj ocurra
inmediatamente después que el estado ai, que llamaremos probabilidad de transición
del estado ai al estado aj , y que designaremos por Pij.
Si ordenamos todas las probabilidades de transición Pij en una matriz nxn obtenemos
la matriz de transición del proceso:
nnnn
n
n
PPP
PPP
PPP
P
.......
......................
.......
.......
21
22221
11211
Ejemplo:
El departamento de estudios de mercado de una fábrica estima que el 20% de la gente que compra
un producto un mes, no lo comprará el mes siguiente. Además, el 30% de quienes no lo compren
un mes lo adquirirá al mes siguiente. En una población de 1000 individuos, 100 compraron el
producto el primer mes. ¿Cuántos lo comprarán al mes próximo? ¿Y dentro de dos meses ?
Solución
Para entender el problema, se recomienda realizar un gráfico del mismo.
Así, la matriz de probabilidades de transición es:
Compra el producto No compra el producto Al estado
0,80 0,30 Compra el producto
0,20 0,70 No compra el producto
La matriz es estocástica (P) porque sumando todas sus columnas, el resultado es 1.
Ahora formamos la matriz de estado con los datos del problema (le llamaremos X). Nótese que en
X, en la primera fila he puesto las personas que compran el producto 100, en la segunda los que no
lo compran 1000-100=900.
Ahora para averiguar la nueva matriz de estado en el primer mes se debe multiplicar la matriz de
probabilidades de transición P por la matriz inicial de estado X. Al primer mes, 350 han comprado
el producto y 650 no lo han comprado.
Para el siguiente mes, vuelvo a multiplicar la matriz de probabilidades de transición por la nueva
matriz de estado obtenida. En este caso, primero se ha asignado a X el producto de P.X, con lo
cual se tiene la nueva matriz de estado al cabo del primer mes. Para el siguiente mes, el proceso se
repite, y la matriz obtenida sería la nueva matriz de estado (en el segundo mes de estudio).
Otro procedimiento sería haber dejado la matriz de estado inicial X y para el segundo mes, como
se debe multiplicar dos veces por P (por la izquierda), se podría haber efectuado (P2 . X). El
resultado indica que en el segundo mes 475 personas han comprado el producto y 525 no.
Vamos a hacer un experimento ya que disponemos de la Classpad que nos ahorra cálculos
repetitivos. ¿Qué pasará en los meses siguientes suponiendo que no cambia la matriz de
probabilidades de transición?
Nótese que en este tipo de problemas, el producto Pn . X tiende a un estado estacionario, el cual es
independiente de la matriz de estado inicial X.
MATRIZ ESTOCÁSTICA O DE PROBABILIDADES DE TRANSICIÓN
En esta matriz cada línea contiene las probabilidades de transición de un estado determinado a
todos los demás, es decir, las probabilidades de todos los resultados posibles de la próxima prueba.
La suma de todas estas probabilidades debe de ser 1 y, por tanto, la suma de los elementos de
cada fila de la matriz de transición vale 1. Como además todos los elementos de la matriz son
≥0 por ser probabilidades, la matriz de transición es una matriz estocástica.
El vector formado por las probabilidades del estado inicial del sistema., llamado
vector de probabilidad inicial
),.......,,( )()()()( 002
01
0nPPPP
Obsérvese que la suma de las probabilidades que expresan los elementos del vector debe ser igual
a 1 y, por lo tanto, el vector de probabilidad inicial es un vector estocástico.
Ejercicios propuestos
1. Escriba el espacio de estados y la matriz de transición para el ejemplo de la escena anterior.
2. Un alumno acude al Instituto, o bien en bicicleta o andando. Si un día emplea la bicicleta, al día
siguiente utilizará la bicicleta con probabilidad 1/2, y si va andando al día siguiente también lo
hará con probabilidad 3/4. Calcule el espacio de estados, la matriz de transición del proceso.
3. En una región, si un día hay niebla al siguiente llueve pero, si llueve, el día siguiente es
soleado. Se tiene observado que las probabilidades de que a un día con sol suceda un día nublado o
lluvioso son, respectivamente, 0.4 y 0.6. Definir el espacio de estados y la matriz de transición del
proceso.
4. Una Central de seguridad vial chequea a menudo uno de tres puntos conflictivos A, B y C. La
probabilidad de que un día controle el mismo lugar que el día anterior es 1/2 y las probabilidades
de que controle uno cualquiera de los otros dos puntos restantes son iguales. Definir el espacio de
estados y la matriz de transición del proceso.
PROBABILIDAD DE TRANSICIÓN EN K PASOS
Es la probabilidad de que un proceso pase del estado ai al estado aj en k pasos . se escribe
)(kijP
para i,j=1,2,3,....,n. Estas probabilidades se pueden ordenar en una matriz que se llama matriz de
transición en k pasos:
)()(2
)(1
)(2
)(22
)(21
)(1
)(12
)(11
)(
......
...........................
......
......
knn
kn
kn
kn
kk
kn
kk
k
PPP
PPP
PPP
P
Teorema:
Si P es la matriz de transición de una cadena de Markov, entonces la matriz de transición de k
pasos es la k-ésima potencia de P
kk PP )(
Ejercicios propuestos
1. En una ciudad existen dos partidos políticos, uno de derechas y otro de izquierdas. Los alcaldes
son elegidos por un período de un año y se ha observado que la probabilidad de que a un alcalde
de derechas suceda otro del mismo signo político es 3/5 y que a un alcalde de izquierdas siga otro
de izquierdas es 1/2. a) Supongamos que en 2005 hay alcalde de izquierdas. ¿Cuál será la
probabilidad de que en 2008 siga un alcalde de izquierdas al frente del concejo?
2. Un hombre conduce su coche o toma el tren para ir a trabajar cada día. Supongamos que nunca
toma el tren dos días seguidos; pero si conduce para ir a trabajar, entonces al día siguiente es tan
probable que conduzca de nuevo como que tome el tren. a) Escribe la matriz de transición del
proceso. b) Calcule la probabilidad de que vaya en coche, cuatro días después de haber ido en tren.
3. Un ascensor de un edificio con bajo y dos pisos realiza viajes de uno a otro piso (lleno o vacío
de ocupantes). El piso en el que termina el viaje n-ésimo del ascensor sigue una cadena de
Markov. Se sabe que la mitad de los viajes que parten del bajo se dirigen a cada uno de los otros
dos pisos, mientras que si un viaje comienza en el primer piso, sólo el 25 % de las veces finaliza
en el segundo. Por último, si un trayecto comienza en el segundo piso, siempre termina en el bajo.
A) Calcular la matriz de probabilidades de transición de la cadena.
B) Dibujar su gráfico asociado. Es regular.
C) ¿Dónde es más probable que esté el ascensor después de cuatro viajes, si salió del Bajo?
4. Una familia planifica cada año sus vacaciones de la siguiente manera. Si un año va a la montaña
al año siguiente va al mar y al segundo año descansa en la casa. Pero al año siguiente es
igualmente probable que se traslade al mar o a la montaña. En 2005 quedarán en casa. ¿Dónde es
más probable que pasen sus vacaciones en el año 2010?
SEMANA 15
PROBABILIDADES TOTALES
La probabilidad de que el proceso se encuentre en el estado ai después de k pasos recibe el
nombre de probabilidad total o absoluta.
)(kiP
A cada paso k le corresponde un vector estocástico formado por todas las probabilidades totales de
ese paso:
),....,,( )()(2
)(1
)( kn
kkk PPPP en particular el vector de probabilidad inicial:
),....,,( )0()0(2
)0(1
)0(nPPPP
descrito en la primera escena de la página 1, que corresponde a la
distribución de probabilidades de paso 0.
El siguiente teorema nos proporciona un método para calcular las probabilidades absolutas
correspondientes a una prueba k del sistema:
Teorema:
En una cadena de Markov con matriz de transición P se obtiene lo que sigue:
k)()(k(k)
)()()(
)()()(
)()(
.PP.PPP
.....
.PP.PPP
.PP.PPP
.PPP
01
3023
2012
01
Es decir las distribuciones de probabilidad del paso k se pueden calcular multiplicando el vector de
probabilidad inicial por la potencia correspondiente de la matriz de transición
Ejercicios propuestos
1. Dada la matriz de transición
2121
01
//P
con distribución de probabilidad P(0)=(1/3 2/3). Definir y hallar
)()()( ,, 332
321 PPP
2. En una ciudad existen dos partidos políticos, uno de derecha y otro de izquierda. Los alcaldes
son elegidos por un período de un año y se ha observado que la probabilidad de que a un alcalde
de derechas suceda otro del mismo signo político es 3/5 y que a un alcalde de izquierdas siga otro
de izquierdas es 1/2. ¿Cuál serán las probabilidades de cada partido en el año 2010?
3. Un hombre conduce su auto o toma el tren para ir a trabajar cada día. Supongamos que nunca
toma el tren dos días seguidos; pero si conduce para ir a trabajar, entonces al día siguiente es tan
probable que conduzca de nuevo como que tome el tren. Si se sabe que el primer día de trabajo el
hombre lanza un dado para decidir que si sale un 6 lleva el coche y si no va en tren. Calcula la
distribución de probabilidad después de cuatro días.
4. Un supermercado realiza la experiencia siguiente en relación con las preferencias de sus
clientes. Se observa que: El 80% de las personas que compran un día el producto A repite al día
siguiente. El 60% de los que no lo compran el producto A un día, lo compran al día siguiente. Si
el 50% compró el producto un día determinado, ¿qué podemos predecir para la compra del
producto el segundo día? ¿Y para el tercero?
5. Una persona puede escoger entre tres restaurantes para comer diariamente. si un día escoge el
restaurante A, al día siguiente escoge el B y al día siguiente del B siempre el C, pero cuando va a
C es igualmente probable que al día siguiente vaya a A o a B. Escribir la matriz de transición del
proceso y calculando después la tercera potencia de esa matriz, estimar a) la probabilidad de que
vaya a B tres días después de ir a A. b) Las probabilidades absolutas de ir a cada restaurante
después de cuatro días.
CADENAS DE MARKOV REGULARES
Son aquellas en las que es posible pasar a través de todos los estados de la cadena sin que este
paso se realice de una forma cíclica. A su correspondiente matriz de transición se le denomina
MATRIZ DE TRANSICIÓN REGULAR.
Se prueba que una matriz estocástica es regular si todos los elementos de una potencia Pn son
positivos, para un cierto valor de n. Todos los estados son transitorios.
Si una matriz tiene un 1 en la diagonal principal, NO es regular (el estado al que corresponde
se dirá estado absorbente)
Compruebe con las siguientes escenas que las matrices M y H son regulares y que las R y S no
son regulares. Observa el diagrama, los 1 en la diagonal principal y las potencias de P.
001
100
010
10
3231
04143
54051
41430
01
2121SRHM
//
//
//
////
Ejercicios propuestos
1. Utilizando la escena anterior decir cuáles de las siguientes matrices son regulares y cuáles no.
Apunta en tu cuaderno los resultados con las aclaraciones que consideres oportunas a cada caso. 2.
Observe, para n grande, cómo son las filas de las matrices regulares y de las no regulares.
Interprete este resultado.
3231
4341
2121
01
2121
10
2321
10
//
//
//////DCBA
03/23/1
3/23/10
3/203/1
;
5/45/10
000
2/12/10
;
100
4/34/10
7/37/37/1
;
010
4/14/12/1
100
;
02/12/1
010
4/14/12/1
EDCBA
VECTOR FIJO DE UNA MATRIZ DE TRANSICIÓN REGULAR
Para tratar este tema, es conveniente repasar la resolución de sistemas.
Vector fijo de probabilidad de orden 2
Se llama vector fijo de probabilidad de la matriz regular P de orden 2, al vector de
probabilidad
tal que verifica: vPv
. Es decir que tiene que cumplir:
),(),( xxPP
PPxx
11
2221
1211
Sus coordenadas se obtienen resolviendo la ecuación lineal en la variable x correspondiente, tras
hacer el producto de matrices. O bien utilizando la escena siguiente:
Ejercicios propuestos
),( xxv 1
1. Calcule el punto fijo de las matrices regulares de orden 2 de los apartados anteriores. Por
ejemplo para la matriz
2121
10
//P
resulta el vector fijo: (1/3,2/3)
A. Compruebe con las potencias de P que dicha cadena es regular, pues para cadenas no regulares
no hay punto fijo.
B. Una vez calculado el vector fijo, observe qué vector aparece en las sucesivas potencias de P
como vectores fila de esa potencia.
Vector fijo de probabilidad de orden 3
Se llama vector fijo de probabilidad de la matriz regular P de orden 3, al vector de
probabilidad
)1,,( yxyxv tal que verifica: vPv
. Es decir que tiene que cumplir:
)1,,()1,,(
333231
232221
131211
yxyx
ppp
ppp
ppp
yxyx
Sus coordenadas se obtienen resolviendo la ecuación lineal en la variable x correspondiente, tras
hacer el producto de matrices.
Ejercicios resueltos:
En una población de 10000 habitantes, 5000 no fuman, 2500 fuman uno o menos de un paquete
diario y 2500 fuman más de un paquete diario. En un mes hay un 5% de probabilidad de que un no
fumador comience a fumar un paquete diario, o menos, y un 2% de que un no fumador pase a
fumar más de un paquete diario. Para los que fuman un paquete, o menos, hay un 10% de
probabilidad de que dejen el tabaco, y un 10% de que pasen a fumar más de un paquete diario.
Entre los que fuman más de un paquete, hay un 5% de probabilidad de que dejen el tabaco y un
10% de que pasen a fumar un paquete, o menos. ¿Cuántos individuos habrá de cada clase el
próximo mes? ¿Y dentro de dos meses?
Solución:
El esquema para esta situación es el siguiente:
A partir del esquema, se puede construir la matriz de probabilidades de transición P y la matriz de
estado X (esta última con los datos del problema).
No fuman Fuman 1 paquete o menos Fuman más de 1 paquete Al estado
0,93 0,10 0,05 No fuman
0,05 0,80 0,10 Fuman 1 paq. o menos
0,02 0,10 0,85 Fuman más de 1 paquete
Ejercicios Propuestos I
1. Un psicólogo hace los supuestos siguientes que conciernen al comportamiento de ratas sujetas a
un régimen especial de alimentación. Para una prueba particular, 80% de las ratas que fueron para
la derecha en el experimento previo hicieron lo mismo en esta prueba, y 60% de aquellas que
fueron para la izquierda en el experimento previo, fueron para la derecha en esta prueba. Si 50%
van a la derecha en la primera prueba, ¿qué se podría predecir para la milésima prueba?
2. Un ascensor de un edificio con bajo y dos pisos realiza viajes de uno a otro piso (lleno o vacío
de ocupantes). El piso en el que termina el viaje n-ésimo del ascensor sigue una cadena de
Markov. Se sabe que la mitad de los viajes que parten del bajo se dirigen a cada uno de los otros
dos pisos, mientras que si un viaje comienza en el primer piso, sólo el 25 5 de las veces finaliza en
el segundo. Por último, si un trayecto comienza en el segundo piso, siempre termina en el bajo.
¿Cuál es la probabilidad de que, a largo plazo, el ascensor se encuentre en cada uno de los tres
pisos?
Ejercicios propuestos II
1. Calcule el punto fijo de las matrices regulares de orden 2 de los apartados anteriores. Por
ejemplo para la matriz
).,.,.(,,
//
//
//
39032029031
12
31
10
31
9
21021
53520
03231
es
A. Compruebe con las potencias de P que dicha cadena es regular, pues para cadenas no regulares
no hay punto fijo.
B. Una vez calculado el vector fijo observe qué vector aparece en las sucesivas potencias de P
como vectores fila de esa potencia.
2. Un psicólogo hace los supuestos siguientes que conciernen al comportamiento de ratas sujetas a
un régimen especial de alimentación. Para una prueba particular, 80% de las ratas que fueron para
la derecha en el experimento previo hicieron lo mismo en esta prueba, y 60% de aquellas que
fueron para la izquierda en el experimento previo, fueron para la derecha en esta prueba. Si 50%
van a la derecha en la primera prueba, ¿qué se podría predecir para la milésima prueba?
3. Un ascensor de un edificio con una planta baja y dos pisos realiza viajes de uno a otro piso
(lleno o vacío de ocupantes). El piso en el que termina el viaje n-ésimo del ascensor sigue una
cadena de Markov. Se sabe que la mitad de los viajes que parten del bajo se dirigen a cada uno de
los otros dos pisos, mientras que si un viaje comienza en el primer piso, sólo el 25.5% de las veces
finaliza en el segundo. Por último, si un trayecto comienza en el segundo piso, siempre termina en
el bajo. ¿Cuál es la probabilidad de que, a largo plazo, el ascensor se encuentre en cada uno de los
tres pisos?
4. La ilustración V I G O Muestra un anuncio luminoso.
Las letras que lo forman se encienden alternativamente según la siguiente regla: La iluminación de
una letra se mueve a la derecha con probabilidad 1/3 y hacia la izquierda con probabilidad 2/3.
Cuando está encendida una de las letras de los extremos en el paso siguiente se ilumina la letra
central adyacente. Calcular la probabilidad de que si está iluminada la letra G, se ilumine la letra I
después de tres pasos. Calcular la distribución de probabilidades absolutas después de cuatro
pasos.
5. Dadas las siguientes matrices, estúdiese si son matrices de transición regulares.
6. Una persona tiene constatado que si un día está resfriado está un 70% seguro de que no lo estará
al día siguiente, pero si un cierto día no está resfriado tiene un 60% de probabilidad de no estar
tampoco al día siguiente. A lo largo de los años, ¿con qué frecuencia estará resfriado?
7. Encontrar las distribuciones estacionarias correspondientes a las cadenas de Markov con las
matrices de transición siguientes:
8. Un estudiante va al instituto andando o en autobús. Cuando va andando un día, la probabilidad
de que al día siguiente coja el autobús es 0.6. La probabilidad de que vaya en autobús dos días
seguidos es 0.7 ¿Aproximadamente con qué frecuencia coge el autobús a lo largo de todo el curso?
A
B
C
1 2 1 2
3 4 1 4
1 2 1 4 1 4
0 0 1
1 2 1 2 0
1 8 3 8 1 2
0 1 2 1 2
3 4 1 4 0
/ / /
/ /
/ / /
/ /
/ /
A B C D
1
7
3
7
3
7
01
4
3
40 0 1
1 2 1 2
0 0
1 5 4 5
1 3 0 2 3
0 1 3 2 3
1 3 2 3 0
1 3 2 3 0
0 2 5 3 5
1 2 0 1 2
;
0
0
0
/ /
/ /
;
/ /
/ /
/ /
;
/ /
/ /
/ /
9. Escríbanse las siguientes matrices en forma canónica. Cuéntense los estados absorbentes y
transitorios en cada caso y compruébese la división en submatrices del ejemplo anterior.
SEMANA 16
DISTRIBUCION ESTACIONARIA
Como se ha comprobado en este último ejemplo, hay ocasiones en que las distribuciones absolutas
de la cadena parece que convergen, con el paso del tiempo, a una distribución particular, que no
dependen del tiempo. ¿Cuándo ocurre esto?
Cuando la matriz de transición P de un proceso de Markov es regular, observamos que conforme
aumentan las potencias de P, los vectores fila de esas matrices se estabilizan en unos valores
determinados hasta coincidir todas las filas y esos valores son precisamente los componentes del
vector fijo de P. Entonces
vPPP kk .)()( 0
Teorema:
Consideremos una cadena de Markov regular. La probabilidad de que un estado Ai suceda después
de un número grande de pruebas es igual a la componente i-ésima del vector fijo asociado.
Por tanto las probabilidades absolutas (DISTRIBUCIÓN ESTACIONARIA DE LA CADENA DE
MARKOV) de que ocurra un determinado estado son independientes de las condiciones iniciales
del sistema.
Ejemplo:
a
b)
c
)/ /
/ /
/ / /
)
/ / / /
/ /
1 2 1 2
0 1
1 4 0 3 4
0 1 0
1 5 2 5 2 51 7 2 7 3 7 1 7
1 3 2 3 0 0
0 0 1 0
0 0 0 1
Una central telefónica pude estar desocupada (estado 0), con una llamada (estado 1) o con una
llamada y otra en espera (estado 2) y es observada cada minuto, siguiendo estas observaciones una
cadena de Harkov homogénea con matriz de transición
Estado 0 Estado 1 Estado 2
Estado 0 0 2/3 1/3
Estado 1 3/8 1/8 1/2
Estado 2 1/2 1/2 0
¿Cómo se evaluaría la evolución de la central después de un tiempo suficientemente grande?
Solución:
Calculamos la distribución estacionaria: п = п . P
Considerando además que: п0 + п1 + п2 = 1
Da como resultado: п1 = 0.2777
П1 = 0.4166
П2 = 0.3055
Ejercicios propuestos
1. Una persona sabe que si un día tiene indigestión está un 70% seguro de que no la tendrá al día
siguiente, pero si un día no tiene indigestión, tiene un 60% de probabilidad de tampoco tenerla al
día siguiente. a lo largo de los años, ¿con qué frecuencia estará con indigestión?
Si calculas el vector fijo y las sucesivas potencias de P obtendrás que, aproximadamente el 36% de
los días la persona estará con indigestión.
2. La región de ventas de un vendedor la componen tres ciudades A, B y C. Nunca vende en la
misma ciudad en días seguidos. Si vende en la ciudad A, entonces al día siguiente vende en la
ciudad B. Sin embargo, si vende en una de las dos B o C, entonces al día siguiente está en doble
posibilidad tanto para vender en A como en la otra ciudad. A la larga con qué frecuencia (en %)
vende en cada ciudad?
Respuesta: 40% en A, 45% en B y 15% en C
3. Un agente comercial realiza su trabajo en tres ciudades gallegas: La Coruña, Ferrol y Santiago.
Para evitar desplazamientos innecesarios está todo el día en la misma ciudad y duerme en ella,
desplazándose a otra al día siguiente, si no tiene suficiente trabajo. Después de estar trabajando un
día en La Coruña, la probabilidad de tener que seguir trabajando en ella al día siguiente es de 0.4,
la de tener que viajar a Santiago es 0.4y la de tener que ir a Ferrol es de 0.2. si el viajante duerme
un día en Santiago, con probabilidad del 20% tendrá que seguir trabajando en la misma ciudad al
día siguiente, en el 60% de los casos viajará a La Coruña, mientras que irá a Ferrol con
probabilidad 0.2. Por último, si el agente comercial trabaja todo un día en Ferrol, permanecerá en
al misma ciudad, al día siguiente, con una probabilidad de 0.1, irá a Santiago con una probabilidad
de 0.3 y a La Coruña con probabilidad 0.6.
¿Cuáles son los porcentajes de días en los que el agente comercial está en cada una de las tres
ciudades?
4. Un estudio de audiencia demuestra que si una persona ve cierto culebrón de televisión una tarde
está un 30% segura de que también lo verá a la tarde siguiente, pero se non lo ve una tarde hay un
60% de posibilidades de que no lo vea tampoco a la tarde siguiente. ¿Qué frecuencia de audiencia
tendrá el culebrón?
CADENAS DE MARKOV ABSORVENTES
Los estados que pueden sucederse a sí mismos y, además, es posible alcanzar, por lo menos,
alguno de los restantes desde ellos se llaman estados transitorios.
Un estado tal que si el proceso entra en él permanecerá indefinidamente en este estado (ya que las
probabilidades de pasar a cualquiera de los otros son cero), se dice estado absorbente.
De una cadena de Markov que consta de estados transitorios y absorbentes se dice que es una
cadena absorbente de Markov.
Si una cadena de Markov contiene algún estado absorbente, la línea de la matriz de transición
correspondiente a las probabilidades de transición de dicho estado constará de un 1 en la diagonal
principal y ceros en los demás elementos. Será por lo tanto una matriz no regular.
Para poder estudiar las cadenas de Markov absorbentes es preciso reordenar la matriz de transición
de forma que las filas correspondientes a los estados absorbentes aparezcan en primer lugar. Así
ordenada se dirá que la matriz de transición está en la forma canónica.
Podemos dividir la matriz en forma canónica en cuatro submatrices. La primera es la matriz
unidad I, del orden correspondiente. La segunda , la matriz nula. La tercera contiene las
probabilidades de paso de estados transitorios a estados absorbentes. La cuarta contiene las
probabilidades de estados transitorios a estados transitorios.
Así se tiene que:
Una cadena de Markov absorbente contiene p estados transitorios y q estados absorbentes.
La matriz canónica del proceso presentará el aspecto siguiente:
I O
Q M
I: matriz identidad de dimensión q
O: matriz nula de dimensión qxp
Q: matriz de dimensión pxq que contiene las probabilidades de paso de estados transitorios a
absorbentes.
M: matriz pxp con las probabilidades de los estados transitorios a estados transitorios.
Se llama matriz fundamental de la cadena a la matriz resultado de la operación:
F=(I-M)-1
Teorema 5
Se verifica:
1. Supongamos que la cadena comienza en un estado transitorio ai. La probabilidad de que llegue a
un estado absorbente aj, vienen dada por el elemento de la fila i y la columna j de la matriz F.Q.
2. La suma de los elementos de la fila i de la matriz F nos proporciona la media del número de
veces que la cadena se mueve por estados transitorios antes de caer en un estado absorbente si
empieza en el estado transitorio ai.
3. El elemento fij de la matriz F representa la media del número de veces que la cadena está en el
estado transitorio aj, sabiendo que comenzó en el estado transitorio ai, antes de caer en un estado
absorbente.
Ejercicios propuestos
1. Escribe en la forma canónica las siguientes matrices, indicando el o los estados absorbentes y
los transitorios. Observa el diagrama correspondiente y ayúdate de las escenas siguientes
realizadas para matrices de orden 3
05253
010
31032
525251
010
43041
53520
010
31032
//
//
;
///
//
;
//
//
Hay un caso más semejante al 4º y al 5º y un caso sin transiciones. Piénsalo.
2. Conteste a cada una de las siguientes preguntas la primera matriz del ejercicio1º) que has
puesto antes en la forma canónica:
a) Si el proceso empieza en el estado a1, ¿cuántos pasos por término medio necesitamos para
alcanzar el estado a3?
b) Si el proceso empieza en el estado a1, ¿cuántos pasos por término medio necesitamos para
volver al mismo estado?
c) Si el proceso empieza en el estado a1, ¿cuántos pasos por término medio se precisan para caer
en uno de los estados absorbentes?
d) ¿En qué estado debemos comenzar el proceso para que tarde más en ser absorbido.?
e) Si el estado comienza en el estado a1, ¿será más probable que sea absorbido por el a2 o por el
a3, en el caso de ser ambos absorbentes?.(matriz tercera)
f) ¿Qué estado precisa más pasos del proceso por término medio antes de regresar otra vez a sí
mismo?
3. Dos jugadores A y B tienen dos billetes cada uno. Juegan con una moneda a "cara y cruz"
apostando un billete en cada lanzamiento hasta que uno de ellos se arruina. Calcular la
probabilidad de que A gane después de 4 jugadas y el número medio de lanzamientos (antes de
caer en estado absorbente (4), si se comenzó en el estado 2).
Solución:
Variable : nº de billetes de A. Espacio de estados E={ 0, 1, 2, 3, 4 }
Inicialmente A tiene 2, B tiene 2. Luego P(0) = (0,0,1,0,0)
Escribe la matriz de transición de orden 4. Calcula P4 y luego P(4)=P(0) .P4, comprueba que da (3/8, 0,
2/8, 0, 3/8 ).
Acaba la partida y gana A, tiene 4 y B tiene 0.
La solución pedida es el último número (A tiene 4 billetes): 3/8 la probabilidad de que A gane
después de 4 jugadas.
Para contestar la segunda parte, hay que utilizar la escena siguiente:
Llamando A=I-M, calculamos F=A-1
Y sumar los números de la fila 2 de F (solución: 4 lanzamientos)
4. Indicar la interpretación de cada elemento de F (Ejemplo 1.5: número medio de veces que tiene
1 billete si partió con 1 billete, antes de terminar la partida)
5. Indicar la interpretación dede la suma de las filas de F.
6. Interpretar los elementos de F.Q. Por ejemplo 0.75 (primer elemento de esa matriz F.Q)
representa la probabilidad de que llegue al estado absorbente 0 (quedarse sin dinero) si empezó
con 1 billete (estado no absorbente).
SEMANA 17
CADENAS DE MARKOV EN TIEMPO DISCRETO
Un proceso estocástico es una cadena de Markov en tiempo discreto si cumple con las siguientes
condiciones:
1. Los estados deben formar un conjunto numerable (caso contrario se hable de un proceso de
Markov).
2. Si X(t) es el evento (en el instante t el sistema se encuentra en estado i) se debe cumplir:
P {X(t) = i | X(t-1) = j, X(t-2) = k, ….} = P{X(t) = i | X(t-1) = j }
3. Si P {X(t) = i | X(t-1) = j} = P {X(1) = i | X(0) = j } para todo t, entonces se tiene una cadena
de Markov en tiempo discreto homogénea.
Ejemplo:
Supongamos una máquina con dos componentes electrónicos que se inspeccionan cada hora. Un
componente que está operativo en el instante n tiene una probabilidad p de fallar antes de la
próxima revisión. Un componente que está en reparación en el instante n tiene una probabilidad r
de estar operativo la próxima revisión. Se supone que las componentes fallan y se reparan
independientemente unas de otras. Plantear la cadena de Markov en tiempo discreto que modela el
número de componentes operativos.
Solución:
El tiempo toma valores 0,1,2,…. Y representa las sucesivas revisiones del equipo.
El espacio de estados esta formado por 0,1, 2. La matriz de transición es:
0 1 1
0 (1 - r)2 2r(1-r) r2
1 p(1 - r) pr + (1 – p)(1 – r) (1 – p)r
2 p2 2p(1 – p) (1 – p) 2
Habrá ocasiones en los que interese conocer la probabilidad de que la cadena esté ocupando el
estado i en el instante n, independientemente de la posición en estados anteriores. Así, partiendo de
las probabilidades absolutas se tiene que:
donde po nota la distribución inicial de la cadena.
Ejemplo:
Supóngase que el estado de una componente electrónica puede ser activa (A) o inactiva (I) y que la
observación de dicha componente en sucesivos instantes fijos de tiempo (cada día) forma una
cadena de Markov homogénea. Supóngase también que la matriz de transición es la siguiente:
A I
A 0.7 0.8
I 0.6 0.4
A. Si un día concreto está inactiva, ¿cuál es la probabilidad de que también esté inactiva al día
siguiente? Solución: 0.4
B. Si un día concreto está activa, ¿cuál es la probabilidad de que al día siguiente continúe activa?
Solución: 0.7
C. Si un día concreto está inactiva, ¿cuál es la probabilidad de que al día siguiente esté activa?
Solución: 0.6
D. Si un miércoles está activa, ¿cuál es la probabilidad de que el sábado esté activa?
Solución:
Como P3 = la respuesta es 0.667
E. Si un miércoles está inactiva, ¿cuál es la probabilidad de que el sábado este activa?
Solución: 0.666
Supóngase que la probabilidad de que un miércoles esté activa es 0.2 y que la probabilidad que
esté inactiva es 0.8: (Es decir, p(0) = (0.2, 0.8) )
F. Determínese la probabilidad de que esté inactiva el jueves
p(1) = p(0) P = (0.62, 0.38) entonces la respuesta es 0.38
G. Determínese la probabilidad de que esté inactiva el viernes
Como p(2) = p(0) P(2) = (0.662, 0.338), la respuesta es 0.338
H. Determínese la probabilidad de que esté inactiva el sábado
Dado que p(3) = p(0) P3 = (0.6662, 0.3338), esta probabilidad es 0.3338
CADENAS DE MARKOV EN TIEMPO CONTINUO
Se etiquetan los estados posibles del sistema 0,1,…,M. Se comienza en 0, y t³0. Sea la v.a.X(t´) el
estado del sistema en t´. Tomará un valor en 0£t´<t1 , después tomará otro valor en t1£t´<t2,…
Es interesante conocer el estado del proceso en t´=s+t(t unidades en el futuro). Será sencillo
conocerlo si el proceso tiene la propiedad markoviana:
P{X(s+t)=j/X(s)=i y X(r)=x(r)}= P{X(s+t)=j/X(s)=i} "i,j y "r³0, s>r y t>0.
0.667 0.333
0.666 0.334
P{X(s+t)=j/X(s)=i} es una probabilidad de transición. Si es independiente de s, se llamará
probabilidad de transición estacionaria.
Un proceso estocástico de tiempo continuo {X(t); t³0} es una cadena de Markov de tiempo
continuo si tiene la propiedad markoviana.
SEMANA 18
TEORIA ERGÓDICA DE CADENAS DE MARKOV
En matemáticas, un shift o transformación que preserva la medida T en un espacio de
probabilidad, se dice que es ergódico si un conjunto medible que es invariante bajo T, tiene
medida 0 ó 1. Un antiguo término para esta propiedad era métricamente transitivo.
Definición de ergódico
Considere el promedio en el tiempo de una función f de "buen comportamiento"(well-behaved).
Esta se define como el promedio (si existe) sobre iteraciones de T empezando en algún punto
inicial x0:
Considere también el promedio en el espacio de f, que se define como:
Donde μ es una medida en el espacio de probabilidad.
En general, el promedio en el tiempo y el promedio en el espacio no son necesariamente iguales.
Pero si la transformación es ergódica, y la medida es invariante, entonces el promedio en el tiempo
es igual al promedio en el espacio excepto quizá para un conjunto de medida 0. Éste es el famoso
Teorema ergódico en forma abstracta, elaborado por George David Birkhoff. El Teorema de
Weyl es un caso especial del Teorema ergódico, que se basa en la distribución de probabilidad en
el intervalo unitario [0,1].
ERGODICIDAD
La ergodicidad es una propiedad muy importante de algunos sistemas mecánicos que permite
justificar ciertos resultados de la mecánica estadística. Un sistema es ergódico si los únicos
conjuntos invariantes de medida no nula de la hipersuperficie de energía constante del espacio de
las fases es toda la hipersuperficie de energía constante.
Ergodicidad y teorema ergódico de Birkhoff
En los sistemas ergódicos es válido el teorema de Birkhoff que permite sustituir promedios
temporales del sistemas por un promedio espacial sobre una región del espacio de las fases. El
enunciado del teorema ergódico, debido a Birkhoff (1931).
Sea una transformación que preserva la medida en un espacio de medida
(X,Σ,μ). Uno puede considerar el "promedio temporal" de una función f suficientemente bien
comportada (más precisamente, ). Este "promedio temporal" se define como la
medida sobre las iteraciones de T empezando en cierto punto x y cuando existe es:
Si se considera además el "promedio espacial" de f, definido como:
donde μ es la medida de probabilidad del espacio.
Ecuaciones de Chapman-Kolmogorov
Si Pij (n) es la probabilidad condicional de que la variable aleatoria X, comenzando con el estado i
se encuentre en el estado j después de n pasos, entonces, las ecuaciones de Chapman-Kolmogorov
proporcionan un método para calcular estas probabilidades de transición en n pasos.