Upload
others
View
20
Download
0
Embed Size (px)
Citation preview
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-1
ESTADÍSTICA.-
CUALITATIVO OTRAS DEFINICIONES
Cuando la característica
observada no se puede contar ni
medir, se indica mediante
palabras y toma distintas
modalidades.
Ej.: sexo, asignatura preferida,
etc.
POBLACIÓN.- Es el colectivo de elementos al que se refiere el estudio
estadístico.
MUESTRA.- Es una parte de la población.
CARÁCTER ESTADÍSTICO TAMAÑO DE LA MUESTRA.- Es el número de elementos que forman la
muestra.
Es la propiedad o cualidad
que observamos en los
elementos de un colectivo.
Dicha propiedad o cualidad
puede ser de dos tipos:
TIPO DE MUESTREO.- Es el modo de elección de la muestra.
Solo toma valores puntuales.
Suelen ser números naturales.
Ej.: Edad 15, 16, 17, ....
CUANTITATIVO
Cuando la característica
observada se puede contar o
medir, se indica mediante
números.
También se llama variable
estadística. Ej.: Edad, estatura, etc.
VARIABLE DISCRETA
ESTADÍSTICA
Es la ciencia que
estudia los
fenómenos
colectivos,
mediante
la observación
numérica, el
análisis
matemático y la
interpretación
lógica,
investigando
especialmente sus
causas y sus leyes
empíricas.
Puede tomar valores de un intervalo.
Suelen ser números reales.
Ej.: Estaturas entre 160 y 170 cm.
VARIABLE CONTINUA
MEDIA.- Es
n
1i
i
n
1i
ii
f
xf
x
ESTADÍSTICA DESCRIPTIVA
Tiene por objeto la recogida,
recopilación y reducción de
datos, su organización en tablas
y gráficas y el cálculo de unos
valores que representan al
conjunto de datos.
CENTRALES MEDIANA de un conjunto ordenado de valores
de una variable es el valor, tal que la mitad de los
valores son iguales o inferiores a él, y la otra
mitad igual o superior (Me).
TIPOS
MODA es el valor de la variable con mayor
frecuencia (M0).
DE RECORRIDO es la diferencia entre el valor
mayor y el valor menor de una distribución.
TIPOS DE ESTADÍSTICA
Existen dos tipos de
estadísticas:
VALORES
DISPERSIÓN VARIANZA.- Es
n
1i
i
n
1i
2ii
2
f
)xx(f
DESVIACIÓN TÍPICA o DISPERSIÓN es la
raíz cuadrada de la varianza. Es decir .
ESTADÍSTICA INDUCTIVA
TIPOS DE FRECUENCIAS
Frecuencia absoluta (fi) del valor xi es el número de veces que
aparece dicho valor.
Frecuencia relativa (hi) del valor xi es el cociente entre la frecuencia
absoluta de dicho valor y el nº total de datos. Es decir N
fh i
i .
Frecuencia absoluta acumulada (Fi) de un valor xi es la suma de las
frecuencias absolutas de todos los valores anteriores a xi. Frecuencia relativa acumulada (Hi) de un valor xi es la suma de las
frecuencias relativas de todos los valores anteriores a xi. EJ.: Construye la tabla de frecuencias correspondiente a una clase donde
hay 5 alumnos con 0 suspensos, 4 con 1, 7 con 2, 6 con 3 y 8 con 4 ó más.
Tiene por objeto establecer
previsiones o conclusiones sobre
una población basándose en los
resultados obtenidos de una
muestra.
EJERCICIOS: 1, 2, 3, 4 y 21.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-2
TIPOS DE REPRESENTACIONES GRÁFICAS
También existen otros gráficos como PICTOGRAMA, CARTOGRAMA, PIRÁMIDE DE POBLACIÓN, etc.
EJERCICIOS: 5, 6, 11 y 12.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-3
CALCULO DE LA MEDIANA, MODA, CUARTILES Y PERCENTILES
MEDIANA.- Vamos a distinguir tres casos:
a) Cuando son pocos datos,.- Se ordenan los datos en orden creciente; si el número es impar se toma el valor central y si es par se toma la semisuma de los dos
datos centrales.
b) Cuando son muchos datos.- Construimos la tabla de frecuencias absolutas acumuladas. Se calcula N/2, y buscamos que volor de F i sobrepasa el valor N/2. La
mediana es el xi correspondiente a dicho Fi. Si coincide N/2 con Fi-1 la media es la semisuma de xi y xi-1.
c) Cuando son intervalos.- En primer lugar, buscamos la clase mediana. Después, a dicha clase se le aplica la expresión:
ervalointdelamplitudc
medianaclaseladeabsolutafrecuenciaf
medianaclaselaaanteriorclaseladeacumuladaabsolutafrecuenciaF
medianaclaseladeeriorinfextremoL
dondecf
F2
N
LM
i
i
1i
eriorinf
ii
1i
eriorinfe
MODA.- Veamos el caso más complicado que corresponde al caso de intervalos. Buscamos la clase modal y le aplicamos la expresión:
frecuenciamayordemodalclaselaaaplicaseformulaEsta
intervalodelamplitudc
modallaaposteriorclaseladelay
modalclaseladeabsolutafrecuencialaentrediferenciaD
modallaaanteriorclaseladelay
modalclaseladeabsolutafrecuencialaentrediferenciaD
modalclaseladeinferiorextremoL
dondecDD
DLM
i
2
1
inferior
i
21
1inferioro
CUARTILES.-
Son tres valores (Q1, Q2 y Q3) que dividen a la distribución en cuatro partes iguales.
Se calculan de forma idéntica a la Mediana pero en lugar de N/2 es N/4 para el Q1, 2 N/4 para Q2 y 3N/4 para Q3.
Si nos fijamos Me=Q2.
PERCENTILES.-
Son 99 valores (P1, P2, P3, ..., P99) que dividen a la distribución en 100 partes iguales.
Se calculan de forma idéntica a la Mediana pero en lugar de N/2 es N/100 para P1, 2N/100 para P2, ..., 99N/100 para P99.
Si nos fijamos Me=Q2=P50.
EJERCICIOS: 16, 19-b y 22.
SIMETRÍA Y ASIMETRÍA
Una distribución es SIMÉTRICA cuando coinciden los valores de la media, la mediana y la moda, es decir oe MMx .
Para ver la simetría de una distribución podemos usar su representación gráfica. La distribución simétrica por excelencia recibe el nombre de
DISTRIBUCIÓN NORMAL, y su gráfica se llama CAMPANA DE GAUSS (figura adjunta).
En la campana de Gauss, el valor máximo correspondiente a la media, siendo los valores centrales más frecuentes que los alejados, además se
cumple que: En )x,x( están el 68.2 % de los datos.
En )2x,2x( están el 95.5 % de los datos.
En )3x,3x( están el 99.7 % de los datos.
Una distribución es ASIMÉTRICA cuando no existe en ella simetría.
EJERCICIO: 25.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-4
PROBLEMAS DE ESTADÍSTICA.-
1.- En un instituto, en 1º de Humanidades y Ciencias Sociales hay un grupo de 20 alumnos cuyas edades son: 16, 16,
16, 16, 16, 16, 16, 16, 17, 16, 16, 16, 19, 18, 17, 18, 16, 16, 17 y 17. Construye la tabla con los cuatro tipos de
frecuencias que conoces.
2.- Las estaturas, en centímetros, de 20 alumnos de 1º son: 164, 175, 165, 170, 168, 157, 167, 172, 177, 160
168, 160, 164, 174, 170, 182, 161, 171, 173, 194.
Confeccionar la tabla con intervalos de amplitud 10 a partir de 155. Calcula las frecuencias.
3.- Se aplica un test de inteligencia general (cociente intelectual) a 40 alumnos de primero de Bachillerato de un
centro obteniendo los siguientes resultados:
106 136 81 110 95 92 99 106 81 95
110 103 88 81 81 99 110 114 128 103
103 84 95 136 95 88 106 121 106 114
117 92 85 125 95 110 132 95 103 81
Construye una tabla tomando intervalos de amplitud 10 comenzando por 80, y determina: a) Frecuencias absolutas,
relativas, absolutas acumuladas y relativas acumuladas. b) ¿Cuántos alumnos tienen un cociente intelectual por
debajo de 100? c) Si se consideran superdotados a partir de 130, ¿hay alguno en clase? d) ¿Qué porcentaje de
alumnos tiene de cociente intelectual 110 o más?
4.- El número de hermanos de 40 alumnos es: 3, 4, 2, 3, 4, 3, 4, 4, 4, 2, 3, 4, 4, 3, 4, 1, 2, 3, 5, 4,
2, 2, 2, 5, 3, 4, 4, 6, 2, 6, 4, 3, 2, 1, 2, 3, 2, 4, 3, 1.
¿Cuántos alumnos tienen 5 o más hermanos? ¿Cuántos 3 o menos?
5.- Las elecciones autonómicas de Andalucía del 12 de junio de 1994 arrojaron los siguientes resultados:
Censo Votantes
Almería 358.834 243.636
Cádiz 815.074 490.488
Córdoba 588.278 429.121
Granada 634.462 436.173
Huelva 342.787 214.608
Jaén 498.134 374.801
Málaga 888.952 570.837
Sevilla 1.263.031 866.381
Andalucía 5.389.552 3.626.045
Calcula: a) Porcentaje de votantes. b) Diagrama de barras para cada provincia del censo y votantes. c) Gráfico de
sectores de los votantes por provincia.
6.- En el diario El País de 23 de enero de 1995 aparece la siguiente información:
a) ¿En qué año la proporción de muertos por accidente fue menor? ¿Y de heridos por
accidente? b) ¿Cuál es la media de accidentes en estos nueve años? ¿Y de heridos?.
¿Y de muertos?
7.- Los resultados de la última jornada de fútbol de Primera División, temporada 1993-1994, fueron:
Albacete Balompié 1 - 1 Real Sociedad C.F.
F.C. Barcelona 5 - 2 Sevilla F.C.
Real Zaragoza C.D. 4 - 1 Real Madrid C.F.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-5
C. Atl. Osasuna 3 - 0 Sporting
Real Valladolid 0 - 0 R.C. Celta
Real C.D. La Coruña 0 - 0 Valencia C.F.
Real Oviedo 1 - 2 C.D. Logroñés
C. Atl. de Madrid 2 - 0 A.D. Rayo Vallecano
R. Racing Club 2 - 1 U.E. Lleida
Atl. Club Bilbao 3- 2 C.D. Tenerife
Considerando los goles metidos por partido, forma una tabla y determina la frecuencia absoluta, relativa, acumulada
absoluta y acumulada relativa.
8.- Con los datos de la tabla anterior, ¿cuál es la media de goles que mete cada equipo? ¿Y la moda? ¿Y la mediana?
9.- Con los datos anteriores forma un diagrama de barras y un polígono de frecuencias. Señala el valor de la
mediana. ¿Se trata de una distribución simétrica o asimétrica?
10.- (Selectividad. Granada, 1994). El siguiente diagrama de barras muestra las calificaciones obtenidas por
un grupo de 50 alumnos.
Construye el histograma correspondiente a las calificaciones numéricas, y calcula la calificación media teniendo en
cuenta el siguiente cuadro de equivalencias:
Suspenso
[0,5)
Aprobado
[5,7)
Notable
[7,9)
Sobresaliente
[9,10)
11.- Una clase de 1º de Bachillerato tiene 20 alumnos, de ellos 13 tienen 16 años, 3 tienen 17 años, 3 tienen 18
años y 1 tiene 19 años. Construye la tabla de frecuencias y calcula: media, moda, mediana, recorrido, varianza y
desviación típica.
12.- En la misma clase del ejercicio anterior se sabe que las alturas de los alumnos son:
Intervalos fi
[155,165) 6
[165,175) 10
[175,185) 3
[185,195) 1
Calcular lo mismo que en el ejercicio anterior.
13.- Al final de la temporada 1993-1994 los goles a favor y los goles en contra de los 20 equipos de Segunda
División fueron los siguientes:
Favor 59 66 56 50 66 58 41 59 47 30
Contra 25 38 36 32 39 41 35 51 41 40
20
14 12
4
0
10
20
30
Susp. Apro. Not. Sob.
Calificaciones
Nº
alu
mn
os
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-6
Favor 45 40 40 46 53 29 30 40 38 28
Contra 46 41 49 52 60 48 48 64 68 67
Calcula: a) Media de goles a favor. b) Media de goles en contra. c) ¿Dónde hay mayor dispersión, en goles a favor o
en goles en contra?
14.- Con los datos anteriores determina la asimetría de la distribución de goles a favor y de goles en contra
respecto a la mediana.
15.- Con los datos anteriores determina la moda en cada caso.
16.- Con los datos anteriores determina los cuartiles inferior y superior. En las distribuciones de goles a favor y
de goles en contra, ¿entre qué límites se encuentra el 50% central de datos?
17.- (Selectividad. Almería, 1994). En una población de 25 familias se ha observado la variable x = número de coches que tiene la familia, y se han obtenido los siguientes datos:
0, 1, 2, 3, 1, 0, 1, 1, 1, 4, 3, 2, 2, 1, 1, 2, 2, 1, 1,1, 2, 1, 3, 2, 1
Construye la tabla de frecuencias de la distribución de x. b) Construye el diagrama de barras y explica si es
simétrica la distribución. c) Calcula la moda, la media y la mediana.
18.- (Selectividad. Málaga, 1994). Los sueldos mensuales en una empresa son los siguientes: 1 director, 1.800 €
; 3 jefes, 1.500 € ; 6 encargados, 900 € y 9 operarios, 600 €. Calcula el sueldo medio, la moda y la mediana.
19.- (Selectividad. Jaén, 1994). Se ha pasado un test de 79 preguntas a 600 personas. El número de
respuestas correctas se refleja en la tabla siguiente:
Respuestas
correctas [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80)
Número 40 60 75 90 105 85 80 65
a) Haz un histograma con estos datos y calcula la media y desviación típica de respuestas correctas. b) Calcula la
mediana y el cuartil inferior. ¿Qué miden estos parámetros?
20.- Dos equipos de baloncesto tienen cada uno en su plantilla 15 jugadores con las siguientes edades:
A: 18, 20, 22, 23, 25, 25, 26, 26, 26, 26, 26, 26, 27, 27, 27
B: 20, 20, 21, 21, 21, 21, 22, 23, 23, 23, 24, 24, 25, 25, 27
Calcula para cada equipo: a) Edad media. b) Desviación media. c) Varianza. d) Desviación típica.
21.- (Selectividad. Extremadura, 1996). La tabla siguiente (que aparece incompleta) resume las calificaciones
obtenidas por los 80 alumnos de COU de cierto instituto.
Calificación Frec. absoluta Frec. relativa
Suspensos ... 0.375
Aprobados 20 ...
Notables 16 ...
Sobresaliente ... ...
Completa la tabla con las frecuencias absolutas y relativas que faltan.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-7
22.- (Selectividad. Jaén, 1994). Completa los datos que faltan en la siguiente tabla estadística, donde f, F y h representan, respectivamente, la frecuencia absoluta, acumulada y relativa.
xi fi Fi hi
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8
Calcula la media, la mediana, la moda, los cuartiles y algún percentil de esta distribución.
23.- Las calificaciones de dos amigos en las cinco evaluaciones de la asignatura de Inglés han sido:
A: 4, 7, 6, 4, 4 B: 3, 4, 5, 6, 7
¿Cuál tiene mayor media? b) ¿Cuál tiene mayor desviación típica? c) ¿Cuál tiene mayor coeficiente de variación?
24.- La siguiente tabla muestra el número de empresas según su número de trabajadores en 1990:
Nº de trabajadores Nº de
empresas
0-10 1207
10-20 888
20-50 1501
50-100 792
100-200 784
200-500 519
Se pide: a) ¿Cuál es la mediana y la desviación típica? b) ¿Entre qué valores se encuentra el 50% central de datos?
25.- De los 200 alumnos que responden a una prueba de 12 ítems, el 10% responde correctamente a 3 ítems, el
50% a 7, el 30% a 10 y el resto al total de ítems de la prueba. Calcula: a) Media aritmética, mediana y moda.
b) ¿Cuántos alumnos se encuentran en el intervalo )x,x( ?
26.- Procede como en los Investiga que tiene el libro en este capítulo y calcula x y de la siguiente distribución:
xi fi
2·108 1
6·108 2
10·108 3
14·108 4
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-8
DISTRIBUCIONES BIDIMENSIONALES.-
DEFINICIONES.-
Una distribución se denomina bidimensional o de dos variables cuando para cada elemento de una
población o muestra se consideran los valores correspondientes a dos características cuantitativas distintas.
Frecuencia absoluta bidimensional (fi).- Es el número de veces que aparece cada par de valores (xi,yi) de
las variables.
La suma de las frecuencias absolutas bidimensionales es igual al número total de elementos considerados:
f1+f2+f3+....fi = N
Frecuencia relativa bidimensional (hi).- Es el resultado de dividir la frecuencia absoluta bidimensional
por el número total de elementos considerados: N
fh i
i
PARÁMETROS.- Cada una de las variables xi ó yi se pueden tratar por separado como distribuciones
unidimensionales. Por tanto para cada una de ellas se pueden definir: la media yóx , la mediana, la moda, la
varianza 2y
2x ó , la desviación típica yx ó . Además vamos a definiremos dos nuevos parámetro:
CENTRO de GRAVEDAD de una distribución bidimensional, es el punto dado por )y,x( .
COVARIANZA que es un parámetro que relaciona las dos distribuciones yxN
yxf
ni
1i
iii
xy
EJEMPLOS de cálculo de parámetros:
1) Tabla simple:
8,750
390y82,2
50
141x 89,0...894,0
50
4056,0...556,0
50
38,15yx
436,08,782,250
1078xy
2) Tabla de doble entrada:
Perdidos (yi)
[0,5) [5,10) [10,15) [15,20)
Ganados
(xi)
[5,10) 1 4
[10,15) 4 2
[15,20) 4 3
[20,25) 1 1
xi yi fi fi·xi fi·yi xxi 2i )xx(
2
ii )xx(f yyi 2i )yy(
2
ii )yy(f iii yxf
1 10 1 1 10 -1,82 3,3124 3,3124 2,2 4,84 4,84 10
2 9 10 20 90 -0,82 0,6724 6,7240 1,2 1,44 14,4 180
3 8 20 60 160 0,18 0,0324 0,6480 0,2 0,04 0,8 480
3 7 16 48 112 0,18 0,0324 0,5184 -0,8 0,64 10,24 336
4 6 3 12 18 1,18 1,3924 4,1772 -1,8 3,24 9,72 72
50 141 390 15,3800 40 1078
En esta tabla se cuentan los partidos
ganados y perdidos por un equipo
durante una temporada:
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-9
Si trabajamos con las marcas de clases:
Marcas de clase: Perdidos (yi)
2,5 7,5 12,5 17,5
Ganados
(xi)
7,5 1 4
12,5 4 2
17,5 4 3
22,5 1 1
Pasamos la tabla a una normal:
Calculamos: 1420
280y14
20
280x
91,3...905,320
30577,4...769,4
20
455yx 111414
20
3700xy
NUBE DE PUNTOS. CORRELACIÓN.-
Nube de puntos.- Es la representación gráfica de las distribuciones bidimensionales. Cada punto tiene
por coordenadas el par de valores que toman las variables.
Correlación.- Es la teoría que estudia la relación o dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional.
Características de las correlaciones.-
1. La correlación es lineal o curvilínea según que el diagrama de puntos se condense en torno a una
línea recta o a una curva.
2. La correlación es positiva o directa cuando a medida que crece una variable la otra también crece.
La correlación es negativa o inversa cuando a medida que crece una variable la otra decrece.
La correlación es nula cuando no existe ninguna relación entre ambas variables; en este caso los
puntos del diagrama están esparcidos al azar, sin formar ninguna línea, y se dice que 1as variables
están incorreladas.
3. La correlación es de tipo funcional si existe una función que satisface todos los valores de la
distribución.
En caso contrario será tanto más fuerte o más débil, dependiendo de la mayor o menor tendencia de
los valores de distribución a satisfacer una determinada función.
ix iy fi fi·xi fi·yi xxi 2i )xx(
2
ii )xx(f yyi 2i )yy(
2
ii )yy(f iii yxf
7,5 12,5 1 7,5 12,5 -6,5 42,25 42,25 -1,5 2,25 2,25 93,75
7,5 17,5 4 30 70 -6,5 42,25 169 3,5 12,25 49 525
12,5 12,5 4 50 50 -1,5 2,25 9 -1,5 2,25 9 625
12,5 17,5 2 25 35 -1,5 2,25 4,5 3,5 12,25 24,5 437,5
17,5 12,5 4 70 50 3,5 12,25 49 -1,5 2,25 9 875
17,5 17,5 3 52,5 52,5 3,5 12,25 36,75 3,5 12,25 36,75 918,75
22,5 2,5 1 22,5 2,5 8,5 72,25 72,25 -11,5 132,25 132,25 56,25
22,5 7,5 1 22,5 7,5 8,5 72,25 72,25 -6,5 42,25 42,25 168,75
20 280 280 455 305 3700
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-10
A continuación representamos varios diagramas de dispersión, indicando la relación que existe entre las
variables X e Y:
COEFICIENTE DE CORRELACIÓN LINEAL.- El procedimiento más frecuente utilizado para asignar
valores a las distintas correlaciones es a partir del coeficiente de correlación de Pearson, que se define:
yx
xyr
El signo del coeficiente r viene dado por el signo de la covarianza, ya que las desviaciones típicas son
siempre positivas. Así pues, el signo de la covarianza decide el comportamiento de la correlación:
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
Se demuestra que el coeficiente de correlación lineal es un número real comprendido entre -1 y 1. Veamos
qué tipo de dependencia existe entre las variables X e y según el valor de r:
1.- Si r = -1, todos los valores de la variable bidimensional (X, Y) se encuentran situados sobre una recta;
en consecuencia, satisfacen la ecuación de una recta. Entonces se dice que entre las variables X e Y existe
una dependencia funcional.
2.- Si -1 < r < O, la correlación es negativa y será tanto más fuerte a medida que r se aproxima a -1, y
tanto más débil a medida que se aproxima a O. En este caso se dice que las variables X e Y están en
dependencia aleatoria.
3.- Si r = 0, no existe ningún tipo de relación entre las dos variables. En este caso se dice que las variables
X e Y son aleatoriamente independientes.
4.- Si 0 < r < 1, la correlación es positiva y será tanto más fuerte a medida que r se aproxima a 1 y tanto
más débil a medida que se aproxima a 0. En este caso se dice que las variables X e Y están en dependencia
aleatoria.
5.- Si r = 1, todos los valores de la variable bidimensional (X, Y) se encuentran situados sobre una recta; en
consecuencia, satisfacen la ecuación de una recta. En este caso se dice que entre las variables X e Y existe
una dependencia funcional.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-11
RECTAS DE REGRESIÓN. ESTIMACIÓN.-
En la mayoría de los fenómenos socioeconómicos la relación entre las variables es lineal. En otros casos,
cuando la nube de puntos tenga forma parabólica se tratará de una regresión cuadrática, y cuando los
puntos se ajusten a funciones exponenciales se tratará de una regresión exponencial. Nosotros nos
limitaremos al estudio de la regresión lineal.
Nos interesa encontrar la recta que mejor se ajuste a la nube de puntos, siempre que la dependencia sea
lineal. Para conseguirlo buscamos la recta que se encuentra a menos distancia de los puntos. El
procedimiento que utilizaremos se denomina el método de los mínimos cuadrados, se puede demostrar que
la recta que buscamos es:
Para estimar la y conocida x: )xx(yy2
x
xy
Para estimar la x conocida y: )yy(xx2
y
xy
EJEMPLO.- La siguiente tabla muestra las temperaturas medias en una ciudad española a lo largo del primer
semestre:
E F M A M J
Temperatura máxima (x) 16 17 19 19 21 25
Temperatura mínima (y) 7 10 12 13 15 19
a) Calcula el coeficiente de correlación lineal. b) ¿Qué tipo de relación existe entre las variables?.
c) Determina la recta de regresión de y sobre x. d) ¿Qué temperatura mínima cabe esperar cuando la máxima
sea de 20o?. ¿Y cuando sea de 38°?. e) ¿Qué temperatura máxima cabe esperar cuando la mínima sea de 14°?.
¿Y cuando sea de 0°?.
Solución.- Haciendo cálculos se obtiene: 77,1077,393,267,12y5,19x xyyx
a) El coeficiente de correlación es: 98,077,393,2
77,10r
yx
xy
b) La relación es directa al ser r > 0 y es una correlación fuerte (está próxima a 1).
c) La recta de regresión de Y sobre X es: 9,11x26,1y)5,19x(93,2
77,1067,12y
2
d) Para x = 20°: 3,139,112026,1y . Como r = 0,98, la estimación es fiable.
Sin embargo, para x = 38° no lo será, pues este valor está muy alejado del valor central.
e) Calculamos la recta de regresión de X sobre Y: 9,9y76,0x)67,12y(77,3
77,105,19x
2
Para y=14º: 51,2087,91476,087,9y76,0x . Como r = 0,98, la estimación es fiable.
Sin embargo, para y=0o no será fiable al estar este valor muy alejado del valor central.
EJERCICIOS: 6, 7 y 13. EJERCICIO: 15 (Presentar como un trabajo antes del examen).
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-12
DISTRIBUCIONES BIDIMENSIONALES.-
1.- Tomando los partidos ganados y los perdidos de la Liga 1997-1998 y utilizando intervalos de amplitud 5,
construye una tabla de doble entrada y calcula medias, desviaciones típicas y covarianza.
2.- Las temperaturas en la provincia de Murcia a lo largo de 1993, mes a mes, han sido:
Máxima 17 16 19 24 26 31 33 34 30 24 19 19
Mínima 3 7 7 9 13 17 20 21 16 12 9 6
Obtén la nube de puntos.
3.- Ajusta una recta a la nube de puntos anterior que pase por el punto de temperatura media.
4.- El número de muertos en accidentes de carretera en los años 1993 y 1994, según la Dirección General de
Tráfico, ha sido:
Enero Febrero Marzo Abril Mayo Junio
1993 386 298 384 397 365 388
1994 354 241 311 284 299 311
Julio Agosto Septiembre Octubre Noviembre Diciembre
1993 486 503 419 397 315 397
1994 434 471 373 328 296 377
Llamando x a los datos de 1993 e y a los de 1994, calcula: xyyx ,,,y,x .
5.- Con los datos del ejercicio anterior, calcula: a) Recta de regresión de y sobre x. b) Coeficiente de correlación
lineal.
6.- (Selectividad. Andalucía, 1997). La tabla adjunta representa una muestra de la que se conocen los siguientes
datos:
42yx3
1i
ii
, la Covarianza =2
x 3 4 5
y p 3 q
Calcula los valores p y q.
Solución
p=0 y q=6
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-13
7.- Aquí tienes cuatro nubes de puntos correspondientes a ciertas variables bidimensionales:
Indica aproximadamente su correlación: si está entre 5,0 , si es mayor de 0,5 o menor de -0,5. ¿Estará alguna
próxima a 1?
8.- Dada la siguiente distribución bidimensional:
xi 10 15 30 45 50
yi 125 140 150 175 225
Determina: xyyx ,,,y,x .
9.- Utilizando la nube de puntos, comprueba gráficamente el signo de la covarianza obtenida en el caso anterior.
10.- (Selectividad. Comunidad Valenciana, 1997). Las calificaciones obtenidas por ocho alumnos en
Matemáticas y Estadística han sido:
Matemáticas 2 4 6 5 6 8 9 10
Estadística 3 4,5 7 5,5 6 8,5 10 1
Halla el coeficiente de correlación entre ambas calificaciones para los siete primeros alumnos. Calcula también el
coeficiente de correlación entre las notas de las dos asignaturas para todos los alumnos. Justifica la diferencia
entre los resultados obtenidos.
11.- (Selectividad. Alicante, 1995). Una persona se somete a una dieta de adelgazamiento durante cinco
semanas. Su peso al término de cada una de esas semanas es:
Semana de dieta 1 2 3 4 5
Peso en kilos 88,5 87 84 82,5 79
a) Calcula el coeficiente de correlación lineal.
b) A partir del valor de la correlación lineal, ¿resultaría adecuado utilizar la recta de regresión para hacer
predicciones en la evaluación del peso a medida que se prolonga la dieta?
c) Ajusta la mencionada recta de regresión.
d) ¿Qué peso es de esperar que alcance esta persona si mantiene la dieta durante dos semanas más? ¿Y si prolonga
la dieta durante 25 semanas?.
12.- (Selectividad. Barcelona, 1994). La evolución de la venta de televisores de un país en los últimos años está
indicada en la siguiente tabla, donde la variable x indica los años y la variable y la venta de televisores en miles de
unidades.
xi 1980 1981 1982 1983 1984
yi 70 74 75 78 85
Calcula la medía y su desviación estándar.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-14
13.- (Selectividad. Valencia, 1994). La tabla expresa los gastos en electricidad y los ingresos anuales de 6
familias en un mes, en miles de pesetas. Estima el gasto en electricidad de una familia con ingresos de 250 y explica
el método utilizado.
Gasto de electricidad 2 3 5 9 10 19
Ingreso total 40 60 80 100 120 200
14.- La difusión de la prensa española, en miles, durante el período 1984-1992 para los diarios ABC y Marca arroja el siguiente volumen:
ABC Marca
1984 157,2 113,2
1985 218,7 112,2
1986 235,1 92,1
1987 247,2 143,8
1988 267,8 164,8
1989 280,4 199,6
1990 290,5 210,2
1991 292,6 259,0
1992 327,1 315,8
Ayudado de tu calculadora científica obtén el coeficiente de correlación.
15.- Las horas de sol en la provincia de Santander y en la provincia de Murcia a lo largo de 1993 han sido las
siguientes:
Santander Murcia
Enero 117 244
Febrero 142 127
Marzo 155 226
Abril 172 274
Mayo 198 295
Junio 169 350
Julio 223 340
Agosto 198 306
Septiembre 151 261
Octubre 124 204
Noviembre 120 146
Diciembre 62 218
a) Obtén la recta de regresión de y sobre x y el coeficiente de correlación lineal.
b) ¿A cuántas horas de sol en la provincia de Murcia equivalen 100 horas de sol en Santander?
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-15
16.- La nube de puntos que presentarnos pertenece a la tabla de un ejercicio anterior.
Una vez localizado el ejercicio, comprueba que los resultados se podían haber estimado a partir de la nube de
puntos.
17.- (Selectividad; País Vasco, 1993). La evolución del precio de la gasolina y el gasóleo en el período 1973 a
1985 viene en la tabla adjunta:
Fecha Gasolina Gasóleo
26-07-1973 13,5 7,40
02-03-1974 20 10,50
24-08-1976 28 14
03-07-1979 46 21
05-12-1980 61 34
09-01-1985 93 58
10-07-1985 93 62
11-12-1985 87 62
a) Calcula el coeficiente de correlación.
b) Interpreta el resultado.
c) ¿Qué dependencia existe entre las variables?
d) ¿Qué precio debería tener la gasolina si se desea bajar el precio del gasóleo a 50 ptas.?
18.- (Selectividad. Cantabria, 1993). La estadística de ingresos en determinadas empresas, en millones de
pesetas, y de empleados en miles, es la siguiente:
Ingresos 5,7 3,8 1,9 1 1
Empleados 16 29 17 6 9
a) Estudia la correlación existente entre ambas variables.
b) Determina la recta de regresión de ingresos en millones, sobre empleados, en miles. Organiza los cálculos
y explica el resultado obtenido, aunque para la realización de los mismos utilices calculadora.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-16
DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL.-
CÁLCULO DE PROBABILIDADES.-
EXPERIMENTOS (O SUCESOS) ALEATORIOS.- Son experimentos que repetidos en igualdad de condiciones
pueden presentar resultados distintos.
Ejemplo: Lanzamos dos dados y anotamos la suma de sus puntuaciones.
SUCESOS.-
Suceso elemental es cada uno de los resultados posibles que aparecen al realizar un experimento
aleatorio.
Ej.: Son sucesos elementales obtener 2, 3, 4, 5, etc.
Espacio muestral )E( es el conjunto formado por todos los sucesos elementales.
Ej.: E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Suceso es un subconjunto del espacio muestral. Ej.: Obtener un número impar = A = {3, 5, 7, 9, 11}.
Los sucesos pueden ser elementales (obtener un 5) o compuestos (como el suceso A).
Suceso contrario ( A ) de A es el que ocurre cuando no sucede A.
Ej.: No obtener un número impar = Obtener un número par = A = {2, 4, 6, 8, 10, 12}
Suceso seguro )E( es aquel que ocurre siempre. Ej.: Obtener puntuación comprendida entre 2 y 12
(incluidos).
Suceso imposible )( es aquel que no puede ocurrir. Ej.: Obtener un 13.
OPERACIONES CON SUCESOS.-
Suceso unión BA de dos sucesos A y B es el formado por todos los sucesos elementales de A y de
B. Sucede cuando ocurre A o B.
Suceso intersección BA de dos sucesos A y B es el formado por todos los sucesos elementales
comunes de A y de B. Sucede cuando ocurren A y B.
Ejemplo: Sigamos con nuestro ejemplo inicial, lanzamiento de dos dados y anotación de la suma de
sus puntuaciones.
Como hemos visto el espacio muestral es E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
Consideremos los sucesos: “Obtener múltiplo de 3” = A = {3, 6, 9, 12}
“Obtener número primo” = B = {2, 3, 5, 7, 11}
Veamos cómo se representan los sucesos antes definidos:
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-17
PROBABILIDAD.- Cuando se repite un experimento aleatorio muchas veces, la frecuencia relativa de un suceso A tiende a aproximarse a un valor fijo llamado probabilidad del suceso A.
Ley de Laplace.- Si suponemos que cada uno de los sucesos elementales tiene la misma probabilidad
(son equiprobables), podemos definir la probabilidad de que se dé un suceso S, como:
posiblescasosdenúmero
favorablescasosdenúmero)S(P
Ejemplo-1: En una baraja española de 40 cartas, ¿cuál es la probabilidad de que al extraer una
carta salga un AS?
10
1
40
4
cartasdetotalnúmero
ASESdenúmero)AS(P
Ejemplo-2: Se lanzan dos dados y se anota la suma de sus puntuaciones. Calcula las probabilidades
de los sucesos que se pueden dar.
Los sucesos que se pueden dar son los reflejados en la siguiente tabla de doble entrada:
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Luego las probabilidades son:
36
1)12(P.....
36
5)8(P
36
6)7(P
36
5)6(P
36
4)5(P
36
3)4(P
36
2)3(P
36
1)2(P
Consideraciones importantes.-
1) La probabilidad está comprendida entre 0 y 1, es decir 1)A(P0
2) La probabilidad del suceso seguro es la unidad, es decir 1)E(P
3) La probabilidad del suceso imposible es cero 0)(P
4) La probabilidad del suceso contrario es )A(P1)A(P
RECUERDA Frecuencia absoluta de un suceso es el número de veces que aparece cuando repetimos un experimento aleatorio. Frecuencia relativa de un suceso es igual a la frecuencia absoluta dividida por el número total de veces que repetimos un experimento aleatorio.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-18
SUCESOS COMPUESTOS.- Son aquellos sucesos que están formados por dos o más sucesos simples.
Ejemplo: “Lanzar dos dados y sumar sus puntuaciones”. Este suceso está formado por dos sucesos
simpes, “lanzar un dado” y “lanzar otro dado”.
Cuando hablamos de sucesos compuestos consistentes en la extracción sucesiva de varias cartas de una baraja,
bolas de una bolsa, etc. podemos distinguir dos tipos de experiencias compuestas:
Ejemplo: En una baraja española extraemos dos cartas. Calcula la probabilidad de que las dos cartas
sean AS, con reemplazamiento y sin reemplazamiento.
Con reemplazamiento:
01.01600
16
40
4
40
4)ASseaª2layASseaª1laque(P)AS2(P
Sin reemplazamiento:
00769.01560
12
39
3
40
4)ASseaª2layASseaª1laque(P)AS2(P
SUCESOS DEPENDIENTES E INDEPENDIENTES.- Decimos que dos o más sucesos son:
Ejemplo: Si volvemos al ejemplo anterior:
Con reemplazamiento. En este caso la segunda extracción es independiente de la primera ya
que al devolver la carta no influye en lo que ocurra en la segunda extracción, los sucesos son
independientes.
Sin reemplazamiento. Al hacerlo sin reemplazamiento, lo que ha ocurrido en la primera
extracción si influye en la segunda, son sucesos dependientes. Se dice que el segundo suceso
influye en el primero y se indica )AB(P .
EJERCICIOS: pág. 240 ejemplos resueltos y el 1, 2, 3 y 4 / pág. 241 ejemplos resueltos y el 5 / pág. 255 el 1, 2, 3 y 4.
Extracciones con reemplazamiento, son aquellas en las que después de cada extracción, el elemento
extraído se repone.
Extracciones sin reemplazamiento, son aquellas en las que después de cada extracción, el elemento
extraído no repone.
Extracciones sin reemplazamiento, son aquellas en las que después de cada extracción, el elemento extraído no repone.
Independientes cuando el resultado de cada una de ellas no dependen del resultado de las
demás. )B(P)A(P)BA(P
Dependientes cuando el resultado de cada una de ellas influye en las probabilidades de las
siguientes. )AB(P)A(P)BA(P
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-19
DISTRIBUCIONES DE PROBABILIDAD.-
Definición.- Es una función que asocia a cada valor de la variable aleatoria X del espacio muestral,
un número p(X) que coincide con el valor de la probabilidad de dicho suceso.
Ejemplo: Cuando lanzamos un dado, los sucesos elementales que se dan son 1, 2, 3, 4, 5 y 6, la
variable aleatoria X puede tomar los valores X=1, X=2, X=3, ...,X=6. Por otro lado, la distribución de
probabilidad es:
p (X=1) =1/6 p (X=2) =1/6 p (X=3) =1/6 p (X=4) =1/6 p (X=5) =1/6 p (X=6) =1/6
Este reparto de probabilidades se puede visualizar mediante un diagrama de barras:
Tipos de distribuciones de probabilidad.- Pueden ser de dos tipos:
DISTRIBUCIÓN DE VARIABLE ALEATORIA DISCRETA.- Formalmente podemos expresarla:
1psiendop)xX(PN
1i
iii
Ejemplo-1: “Número de caras al lanzar dos monedas”
Ejemplo-2: “Lanzamiento del dado”
Parámetros de la Distribución de variable discreta.- Si recordamos las expresiones de la media y
la varianza que estudiamos en Estadística, ahora las expresiones son similares:
xi 0 1 2
Pi 1/4 2/4 1/4
xi 1 2 3 4 5 6
Pi 1/6 1/6 1/6 1/6 1/6 1/6
Distribución de probabilidad de variable aleatoria discreta.- Cuando la variable aleatoria X solo toma
valores enteros. (Ej. Lanzamiento del dado: 1, 2, 3, …, 6).
Distribución de probabilidad de variable aleatoria continua.- Cuando la variable aleatoria X toma
valores reales. (Ej. Altura de los alumnos de una clase: 1´4 m., 1´68 m., etc.) -TEMA SIGUIENTE-
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-20
Media:
n
1i
i
n
1i
ii
f
xf
x
Ahora la
frecuencia es la
probabilidad y que
N
1i
i 1p
Esperanza matemática
N
1i
ii xp)X(E
Varianza: 2
n
1i
i
n
1i
2
ii
2 x
f
xf
Varianza
N
1i
22
ii2
)x(Exp)x(V
EJERCICIOS: pág. 245 el 1 ®, 3 y 4.
DISTRIBUCIÓN BINOMIAL.- Se da cuando el experimento aleatorio tiene dos posibles resultados el
suceso A y el suceso contrario de A.
Definición.- Es aquella cuya función de probabilidad viene dada por rnr
qpr
n)rX(P
, donde:
n es el de veces que se repite el experimento
r es el número de veces que se da el suceso A
p es la probabilidad de que se dé un suceso A
q es la probabilidad de que se dé el suceso contrario de A
Esperanza matemática y desviación típica.- En la distribución binomial son pn y qpn
Ejemplo: Lanzamos un dado cuatro veces. ¿Cuál es la probabilidad de que salga 4 veces el nº 6?, ¿y de que
salga 3 veces?, ¿y dos?
Es una distribución binomial B( 4, 1/6 ). Tenemos: n=nº de veces que lanzamos = 4; p= probabilidad de que
salga 6=1/6 y q=probabilidad de que no salga 6=5/6.
Probabilidad de salir 4 veces el 6 = 1296
1
6
11
6
11
6
5
6
1
4
4)4X(P
4404
Probabilidad de salir 3 veces el 6 = 324
5
1296
20
6
54
6
5
6
1
!1!3
!34
6
5
6
1
3
4)3X(P
4
313
Prob. salir 2 veces el 6= 216
25
6
25
6
256
6
5
6
16
6
5
6
1
!2!2
!234
6
5
6
1
2
4)2X(P
34
222222
¿Cuál es la probabilidad de que salga 6, al menos, en tres de los cuatro lanzamientos?
Es 1296
21
1296
1
1296
20)4X(P)3X(P)3X(P
EJERCICIOS: pág. 249 el 1 ® y 2 ®, 1 y 2 / pág. 255 el 11 y 13 / pág. 256 el 16, 17 y 24.
NOTA.-
es la
desviación
típica
(raíz
cuadrada
de la
varianza)
NÚMEROS COMBINATORIOS: )!rn(!r
!n
r
n
(“n sobre r”) . Propiedades importantes: 1
n
n
0
n
FACTORIAL DE UN NÚMERO: 123.....)2n()1n(n!n (“n factorial”) Propiedades importantes: 1!0
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y Probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-21
DISTRIBUCIONES DE VARIABLE CONTINUA.LA NORMAL-
DISTRIBUCIÓN DE VARIABLE ALEATORIA CONTINUA.- Veamos los conceptos más importantes:
Función de probabilidad o función de densidad f(x).- Una función f(x) es la función densidad de
una variable aleatoria continua X si 1dx)x(f
, siendo 0)x(f .
NOTA.- No hemos estudiado integrales, pero para hacernos una idea viene a ser como el sumatoria
en la variable discreta. Estudiaremos un caso particular, la distribución normal, en el que los
cálculos los haremos basándonos en tablas.
Ejemplo:
casosdemáslosen0
1x0six2)x(f
Función de distribución F(xi).- Ahora el concepto sigue siendo similar al caso discreto, se define:
a
dx)x(f)aX(P)a(F
DISTRIBUCIÓN NORMAL.-
Definición.- Es aquella cuya función de densidad viene dada por
2x
2
1
e2
1)x(f
, donde:
es la media
es la desviación típica
La distribución normal se expresa ),(N
Su gráfica es:
Función de distribución.- Es
a
dx)x(f)aX(P)a(F
Recordar que 1dx)x(f
(el área total debe ser 1)
uno)
Si intentásemos representar como antes, mediante un
diagrama de barras, aparecería una línea continua como en la
gráfica.
El área representa la probabilidad
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-22
TABLAS.- Para calcular los valores de esta función de distribución resulta algo difícil debido a las
integrales que aparecen, de ahí que se utilice la tabla de valores de la distribución N (0,1)
(Ver hoja 23).
Dos posibilidades:
Para una distribución N (0,1).
Ejemplo: Supongamos que las alturas de los alumnos de 2º de bachillerato siguen una
distribución normal N (0,1). a) ¿Cuál es la probabilidad de que un alumno de 2º de bachillerato
mida menos de 175 cm? b) ¿Qué proporción de alumnos miden entre 165 cm y 175 cm?
c) ¿Cuál es la probabilidad de que un alumno mida más de 185 cm?
a) Simplemente mirando en la tabla 9599,0)75,1X(P .
b) Es 0094,09505,09599,0)65,1X(P)75,1X(P)75,1X65,1(P .
c) Es 0322,09678,01)85,1X(P1)85,1x(P .
En nuestro ejemplo no tiene sentido una altura negativa, pero, olvidemos el ejemplo y
calculemos:
d) 0764,09236,01)43,1X(P1)43,1X(P)43,1X(P
e) 034,09066,09406,0)32,1X(P)56,1X(P)56,1X32,1(P)32,1X56,1(P
f) )37,0X(P)13,2X(P)37,0X(P)13,2X(P)13,2X37,0(P
6277,0)6443,01(9834,0)37,0X(P1)13,2X(P
Para pasar de una distribución N (µ,σ) a la N (0,1) hay que hacer un cambio de variable
llamado tipificación:
XZ
Ejemplo: Calcular )8X(P en la distribución N (5,3), usando la tabla de N (0,1)
Calculo 8413,0)1Z(P3
58ZP)8X(P
Ejercicios: pág. 263 el 1 / pág. 265 el 2.
Esperanza matemática y varianza.- Se puede demostrar que la esperanza matemática y la varianza de un
distribución binomial vienen dadas por:
pn)X(E
qpn)X(V2
Ejercicios: pág. 277 el 3, 5 y 6 (de la autoevaluación).
NOTA.- Hacer los dibujos para entenderlo mejor.
INSTITUTO DE ENSEÑANZA SECUNDARIA “LÓPEZ NEYRA” DEPARTAMENTO DE MATEMÁTICAS
(CÓRDOBA) Profesor: Fco. Javier del Rey Pulido
Estadística y probabilidad MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES (1º Bachillerato) HOJA-23