18
Práctica 7 (Tema 9) Cálculo de intervalos de confianza Esta práctica con la que se cierra el curso se dedica a la obtención de resultados finales. Una vez desarrolladas en prácticas anteriores la preparación y organización de los datos ahora se avanzan las líneas de análisis, en concreto la construcción de intervalos de confianza. En la discusión de estos resultados se avanzan cuestiones centrales para el análisis estadístico como es la relación entre variables, y que serán materia de otras asignaturas. Con la realización de esta práctica el alumno consigue su capacitación a nivel básico como técnico de análisis de datos de encuestas. 1 La construcción de intervalos de confianza de medias Para la realización de esta práctica volveremos a utilizar el estudio del CIS2927 del cual se ha venido preparando el fichero CIS2927.SAV. Pulsando directamente sobre el fichero, se nos abrirá la matriz de datos en PSPP. En primer lugar vamos a construir un intervalo de confianza para una variable de intervalo. Vamos a estudiar la valoración que reciben Mariano Rajoy y Alfredo Pérez Rubalcaba según el enunciado de la pregunta 17. En primer lugar para el cálculo de la media tenemos que descontar los valores 98 y 99 que corresponden a las opciones “no sabe” o “no contesta”. Para ello, podemos bien mediante el uso de menús o mediante comandos de sintaxis, recodificar las variables en variables distintas y declarar los valores desde 97 a 98 como valores perdidos (MISSING). Con comandos de sintaxis, escribiremos lo siguiente. COMPUTE 1712R=P1712. COMPUTE P1713R=P1713. MISSING VALUE P1712R P1713R (97,98,99). VARIABLE LABEL P1712R “Valoración Pérez Rubalcaba” /p1713R “Valoración Mariano Rajoy”. Si vemos el cuestionario, en la pregunta 17, Pérez Rubalcaba ocupa el puesto 12 y Mariano Rajoy el 13 de los 14 políticos preguntados. Si recordamos el fichero de sintaxis (ES2927.SPS) las variables de la pregunta 17 fueron denominadas en el comando DATA LIST en conjunto usando la expresión “TO” P1701 TO P1714 81-112 Dicha expresión genera 14 variables denominadas genéricamente P17xx, siendo xx un valor que va desde 01 -que se corresponde con el item referente a Álvarez Sostres (P1701, variable que ocupa las columnas 81 y 82)- hasta 14 -que se corresponde con Carlos Salvador (P1714, variable que ocupa las columnas 111 y 112)-. La valoración de Pérez Rubalcaba se encuentra en la variable P1712 y en la P1713 la de Mariano Rajoy.

Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Embed Size (px)

Citation preview

Page 1: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Práctica 7 (Tema 9)

Cálculo de intervalos de confianza

Esta práctica con la que se cierra el curso se dedica a la obtención de resultados finales. Una

vez desarrolladas en prácticas anteriores la preparación y organización de los datos ahora se

avanzan las líneas de análisis, en concreto la construcción de intervalos de confianza. En la

discusión de estos resultados se avanzan cuestiones centrales para el análisis estadístico como

es la relación entre variables, y que serán materia de otras asignaturas. Con la realización de

esta práctica el alumno consigue su capacitación a nivel básico como técnico de análisis de

datos de encuestas.

1 La construcción de intervalos de confianza de medias

Para la realización de esta práctica volveremos a utilizar el estudio del CIS2927 del cual se ha

venido preparando el fichero CIS2927.SAV. Pulsando directamente sobre el fichero, se nos

abrirá la matriz de datos en PSPP. En primer lugar vamos a construir un intervalo de confianza

para una variable de intervalo. Vamos a estudiar la valoración que reciben Mariano Rajoy y

Alfredo Pérez Rubalcaba según el enunciado de la pregunta 17. En primer lugar para el cálculo

de la media tenemos que descontar los valores 98 y 99 que corresponden a las opciones “no

sabe” o “no contesta”.

Para ello, podemos bien mediante el uso de menús o mediante comandos de sintaxis,

recodificar las variables en variables distintas y declarar los valores desde 97 a 98 como valores

perdidos (MISSING). Con comandos de sintaxis, escribiremos lo siguiente.

COMPUTE 1712R=P1712.

COMPUTE P1713R=P1713.

MISSING VALUE P1712R P1713R (97,98,99).

VARIABLE LABEL P1712R “Valoración Pérez Rubalcaba” /p1713R “Valoración

Mariano Rajoy”.

Si vemos el cuestionario, en la pregunta 17, Pérez Rubalcaba ocupa el puesto 12 y Mariano

Rajoy el 13 de los 14 políticos preguntados. Si recordamos el fichero de sintaxis (ES2927.SPS)

las variables de la pregunta 17 fueron denominadas en el comando DATA LIST en conjunto

usando la expresión “TO”

P1701 TO P1714 81-112

Dicha expresión genera 14 variables denominadas genéricamente P17xx, siendo xx un valor

que va desde 01 -que se corresponde con el item referente a Álvarez Sostres (P1701, variable

que ocupa las columnas 81 y 82)- hasta 14 -que se corresponde con Carlos Salvador (P1714,

variable que ocupa las columnas 111 y 112)-. La valoración de Pérez Rubalcaba se encuentra

en la variable P1712 y en la P1713 la de Mariano Rajoy.

Page 2: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Como es habitual con el comando COMPUTE hacemos una copia de la variable original, y en las

variables copiadas eliminamos los valores de no respuesta, mediante el comando, también

conocido MISSING VALUE. Con VARIABLE LABEL, etiquetamos las nuevas variables.

Una vez construidas las nuevas variables P1712R y P1713R (copia de las variables originales)

que contienen las valoraciones de Pérez Rubalcaba y de Mariano Rajoy respectivamente,

únicamente de quienes han hecho la valoración, podemos solicitar una distribución de

frecuencias, a la que añadiremos los estadísticos del error de la media –o error típico- y la

varianza: (Analizar; Estadística Descriptiva; Frecuencias)

La tabla de resultados se ofrece a continuación:

Page 3: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el
Page 4: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

a) Comparación entre variables

Como podemos observar por la distribución de frecuencias, no hay grandes diferencias en la

valoración de ambos políticos. Ambos tienen una media inferior a 5. La puntuación de Mariano

Rajoy es relativamente mayor (4,55) que la de Pérez Rubalcaba (4,25).

Las diferencias entre ambos se concentran en los extremos, una mayor proporción de “0” a

Pérez Rubalcaba sobre Mariano Rajoy, que baja la media del primero, y una relativa mayor

concentración de valoraciones en puntuaciones muy altas (9 y 10) a Mariano Rajoy que

incrementa la puntuación media.

Para construir un intervalo de la media necesitamos conocer el error típico, que para ambas

variables resulta muy parecido, y que viene denominado como Error Estándar1 de la Media, en

1 Mientras que en España se utiliza habitualmente el término “Error Típico” en algunas regiones de

Lationamérica emplean la expresión equivalente “Error Estándar”.

0%

5%

10%

15%

20%

25%

0 1 2 3 4 5 6 7 8 9 10

Valoración Pérez Rubalcaba

0%

5%

10%

15%

20%

25%

0 1 2 3 4 5 6 7 8 9 10

Valoración Mariano Rajoy

Page 5: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

ambos casos Err.Est.Media=0,06. El valor del error típico, como sabemos viene dado por el

cociente entre la varianza y el tamaño muestral:

Podemos comprobar estas cifras para la variable P1712R:

Y, para p1713R:

El intervalo de la media es el producto del error típico por el nivel de confianza.

Así para, un nivel de confianza del 95% (Z=1,96) las medias serán:

Error=Z Límite inferior

Límite superior

P1712R 1,96x0,06=0,12 4,25-0,12=4,13 4,25+0,12=4,37

P1713R 1,96x0,06=0,12 4,55-0,12=4,43 4,55+0,12=4,67

El estudio de los intervalos muestra que para un nivel de confianza del 95% hay diferencias de

valoración entre ambos líderes políticos. Los intervalos de confianza no se solapan. Mientras el

valor máximo para Pérez Rubalcaba sería un 4,37, el valor mínimo para Mariano Rajoy estaría

una décima por encima, en 4,47. No obstante, que haya diferencias estadísticamente

significativas no quiere decir que sustantivamente sean relevantes. Diferencia significativa

quiere decir que la diferencia observada en la muestra puede atribuirse al universo, otra

cuestión es la magnitud de la diferencia.

En realidad, un cuarto de punto de diferencia señala que hay más coincidencia que

discrepancia en la valoración de ambos políticos. Con el mismo nivel de confianza puede

0 1 2 3 4 5 6 7 8 9 10

Alfredo Pérez Rubalcaba

Mariano Rajoy

Page 6: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

afirmarse con que ambos líderes no superan el aprobado (5), las puntuaciones máximas de

valoración resultan inferiores a dicho valor.

Si el nivel de confianza aumenta, y calculamos los intervalos con un nivel de confianza del 99%

(Z=2,58), los intervalos de las medias crecen poco ya que el error típico es pequeño, y aunque

los límites llegan a coincidir en el punto 4,40, los intervalos no llegan a solaparse.

Error=Z Límite inferior

Límite superior

P1712R 2,58x0,06=0,15 4,25-0,15=4,10 4,25+0,15=4,40

P1713R 2,58x0,06=0,15 4,55-0,15=4,40 4,55+0,15=4,70

Si el nivel de confianza aumentara aún más, por ejemplo al 99,7% (Z=3), entonces los

intervalos de la media de ambos políticos solaparían parcialmente su recorrido.

Error=Z Límite inferior

Límite superior

P1712R 3x0,06=0,18 4,25-0,18=4,07 4,25+0,18=4,47

P1713R 3x0,06=0,18 4,55-0,18=4,37 4,55+0,18=4,75

En función de estos resultados podemos afirmar que la valoración de Mariano Rajoy es

superior a la de Pérez Rubalcaba con un nivel de significación del 1% (Nivel de Confianza del

99%). En cursos superiores de estadística se estudiaran los “p-valor” que son las

probabilidades con las que vamos a realizar afirmaciones estadísticas. Los intervalos nos

permiten estimar un valor en la población, sin embargo toda afirmación va ligada a un nivel de

confianza. Como veremos en el siguiente ejemplo, para el estudio de las diferencias resulta

menos engorroso ofrecer una probabilidad con la que podamos afirmar que hay o no

diferencias entre variables o entre grupos que estudiar el solapamiento de intervalos.

No obstante, nunca olvide que una diferencia estadística no tiene porqué tener relevancia

práctica. En el presente caso aunque uno de los políticas sea más valorado, ambos se quedan a

las puertas del aprobado, lectura ésta que sí tiene interés demoscópico.

b) Comparación entre grupos. Intervalo de la diferencia de medias.

Los intervalos de confianza además de servir para inferir valores poblacionales tienen interés

para valorar diferencias entre variables, como se acaba de hacer en el apartado anterior, y

también para estudiar las diferencias entre grupos distintos. Por ejemplo, podemos

preguntarnos si hay diferencias en cuanto a posición política entre hombres y mujeres. Son

más conservadoras las mujeres que los hombres, y los mayores que los jóvenes. La respuesta a

estas preguntas nos introduce en el análisis de la relación entre variables.

Comenzaremos comprobando el mito del mayor conservadurismo de las mujeres. Para ello en

primer lugar prepararemos la variable de la pregunta 27 para el análisis.

Page 7: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Los comandos de sintaxis para ello:

COMPUTE IDEO=P27.

MISSING VALUE IDEO (98,99).

VARIABLE LABEL IDEO “Autoubicación política”.

Es decir construimos una nueva variable IDEO que es copia de la P27.

Si desplegamos Analizar; Comparar Medias; Prueba T para muestras Independientes:

Seleccionamos la variable IDEO como variable de contraste y P29 –que es la variable que

contiene el sexo del entrevistado- la seleccionamos para Definir Grupos. Pulsando el botón

para Definir Grupos, indicamos que el primer grupo estará definido por el valor 1 (de la

variable P29 que corresponde con los hombres) el otro grupo lo será por el valor 2 (que

corresponde a las mujeres).

(Por defecto el contraste se realiza con un nivel de confianza del 95%, se puede variar dicho

valor pulsando en el botón “Opciones...”).

Page 8: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Los resultados aparecen con el siguiente aspecto:

P29 N Media Desviación Estándar Err.Est.Media

IDEO Hombre 1014 4,91 1,96 0,06

Mujer 1018 4,87 1,92 0,06

Prueba de Levene para la

igualdad de varianzas

Prueba T para la Igualdad de Medias

F Sign. t df Sign. (2 colas)

Diferencia Media

Err.Est. de la Diferencia

Intervalo de confianza 95% de la Diferencia

Inferior Superior

IDEO Se asume igualdad de varianzas

,56 ,45 0,45 2030,00 0,65 0,04 0,09 -0,13 0,21

Igualdad de varianzas no asumida

0,45 2028,67 0,65 0,04 0,09 -0,13 0,21

En primer lugar encontramos que los hombres están relativamente más a la derecha que las

mujeres. Ellos, en una escala de 1 a 10 en la que 1 es el polo de la izquierda y el 10 el de la

derecha, se sitúan en 4,91. Las mujeres, sin embargo, tienen una media más a la izquierda:

4,87. Quiere esto decir que son los hombres más conservadores que las mujeres. La diferencia

entre las medias de hombres y de mujeres es de 0,04.

Page 9: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Con los datos de la primera tabla podemos construir los intervalos de hombres y de mujeres, y

también el de la diferencia de medias, con los datos de la segunda tabla. Para deducir los

intervalos, multiplicamos el error típico (Err.Est.Media) por el nivel de confianza 95% (Z=1,96).

n Media Desviación Típica

Error típico

Límite inferior

Límite superior

Hombres 1014 4,91 1,96 √

4,79 5,03

Mujeres 1018 4,87 1,92

4,75 4,99

Como vemos, los intervalos se solapan ampliamente. Esto quiere decir que no podemos hablar

de diferencias significativas entre hombres y mujeres. De una forma más precisa podemos

llegar a la misma conclusión mediante el estudio del intervalo de la diferencia de medias.

Diferencia de medias

Error típico ( )

Límite inferior ( ) ( )

Límite superior ( ) ( )

4,91-4,87=0,04 0,09 -0,13 0,21

La parte final de la tabla nos ofrece el intervalo, con una confianza del 95%, del estadístico de

la diferencia de medias, como podemos observar varía desde -0,13 a 0,21. Es decir los

resultados nos indican que en la población la media de las mujeres puede ser mayor que la de

los hombres o viceversa. Es decir, que la media (de las diferencias) puede ser “0”, dado que

dicho valor está incluido dentro del intervalo. Por lo tanto, sólo podemos concluir que no

podemos suponer que haya diferencias entre hombres y mujeres en ubicación política. El mito

del conservadurismo femenino, puede ser un mito, pero desde luego no es una realidad de la

España de hoy.

El error típico de la diferencia de medias se calcula, cuando se suponen varianzas desiguales,

mediante la expresión:

( ) √

Page 10: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Observe que la tabla tiene dos líneas que dicen “se asume la igualdad de varianzas, o igualdad

de varianzas no asumida, y como podemos ver se ofrecen resultados para el intervalo en

función de dichas asunción. (En este caso los resultados son idénticos, pero generalmente

varían aunque ligeramente).

La tabla, además de los intervalos de confianza ofrece los resultados de dos test de hipótesis.

La interpretación de estos resultados se realizará en los cursos de estadística posteriores. En el

cuadro de texto se encuentra un comentario para el lector interesado en su significado.

En primer lugar se encuentra el test de Levene. Este test estadístico nos

indica si podemos suponer la igualdad o diferencia en las varianzas. (El error

típico de la diferencia de medias tiene formulaciones distintas en función de

la igualdad o desigualdad de varianzas de los grupos de contraste). En este

caso concreto nos dice que podemos admitir la igualdad de varianzas –

recuérdese que la desviación típica para hombres es 1,96 y para mujeres es

1,92, siendo la diferencia entre ambas pequeña-. (Cuando la columna sig. sea

mayor de 0,05 debemos considerar que las varianzas son iguales).

Después del test de Levene el programa nos ofrece un test de significación

de la diferencia de medias que nos indica si podemos considerar tal

diferencia en la población. El estadístico de la diferencia de medias sigue una

distribución “t de student”. En función del error típico se calcula cuál es la

distribución muestral de una diferencia 0, y se obtiene el valor t

correspondiente a la diferencia obtenida, es decir la distancia que la

diferencia observada tiene respecto a la hipotética situación en que no

hubiera diferencias, es decir hubiera igualdad. El valor “t” obtenido puede

interpretarse en términos de probabilidad, con el significado de cuál es la

probabilidad de que la diferencia observada proceda de una población donde

no haya diferencias. Este test se hace bajo los dos supuestos; el de igualdad

y el de desigualdad de varianzas. Como es habitual nos indica el valor del

estadístico t, los grados de libertad “d.f=degrees of freedom”, y la

significación estadística. En este caso como “Sig. (2 colas)” > 0,05 debemos

considerar que no hay diferencias entre las medias. Mediante la lectura del

intervalo, que incorpora el valor 0, ya habíamos obtenido esta misma

conclusión.

De hecho, la columna “Sig. (2 colas)” puede leerse la información que

proporcionan los intervalos en términos de probabilidad “p-valor”. La

diferencia en ubicación política por sexo tiene un nivel de confianza del 35%

(Nivel de confianza es: 1-Significación; 1-0,65=0,35) de que exista en el

universo (conjunto de la población española > 18 años). Como no llegamos al

95% de confianza no podemos aceptar que las diferencias observadas en la

muestra lo sean también en el conjunto de la población española.

Page 11: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Si bien hemos comprobado que hombres y mujeres no se diferencian políticamente vamos a

analizar si hay diferencias por edad. En concreto comprobaremos si los mayores de 65 años se

ubican de manera diferente que el resto de la población española.

Para ello utilizaremos la variable EDAD, que elaboramos en la práctica 3, que era una copia de

P30, habiendo eliminado el valor “99” (Ns.Nc.).

Volvemos a desplegar Analizar; Comparar Medias; Prueba T para muestras Independientes:

Introducimos IDEO como variable de contraste y EDAD para definir grupos. Pulsamos el botón

“Definir Grupos” y en este caso seleccionamos la casilla “Punto de corte”, allí escribimos el

valor 65. Es decir vamos a contrastar dos grupos el primero estará compuesto por quienes

tienen 65 años o más y el segundo por los menores de 65 años.

Los resultados:

P29 N Media Desviación Estándar Err.Est.Media

IDEO >=65 394 5,27 2,07 0,10

<65 1636 4,80 1,90 0,05

Page 12: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Prueba de Levene para la

igualdad de varianzas Prueba T para la Igualdad de Medias

F Sign. t df Sign. (2 colas)

Diferencia Media

Err.Est. de la Diferencia

Intervalo de confianza 95% de la Diferencia

Inferior Superior

IDEO Se asume igualdad de varianzas

7,31 0,01 -4,41 2028,00 0,00 -0,48 0,11 -0,70 -0,25

Igualdad de varianzas no asumida

-4,18 563,42 0,00 -0,48 0,11 -0,70 -0,25

Señalan en este caso que si que hay diferencias:

Intervalos de confianza para el 95% (Z=1,96)

n Media Desviación Típica

Error típico

Límite inferior

Límite superior

De 65 y más 394 5,27 2,07 0,10 5,07 5,47

De 18 a 64 1636 4,80 1,90 0,05 4,70 4,90

Los intervalos no se solapan, con un nivel de confianza del 95%, pero tampoco si aumentamos

el nivel de confianza al 99% (Z=2,58).

Intervalos de confianza para el 99% (Z=2,58)

n Media Desviación Típica

Error típico

Límite inferior

Límite superior

De 65 y más 394 5,27 2,07 0,10 5,01 5,53

De 18 a 64 1636 4,80 1,90 0,05 4,67 4,93

Intervalos de confianza para el 99,7% (Z=3)

n Media Desviación Típica

Error típico

Límite inferior

Límite superior

De 65 y más 394 5,27 2,07 0,10 4,97 5,57

De 18 a 64 1636 4,80 1,90 0,05 4,65 4,95

Como podemos observar con más de un 99,7% de nivel de confianza podemos afirmar que los

mayores se ubican políticamente de forma diferente. El intervalo de la diferencia de medias,

no incluye el “0” y si observamos la significación de t vemos que esta es muy elevada2.

Podemos señalar que los mayores son más conservadores que el resto de la sociedad.

2 En la columna Sig.(2 colas) vemos que se ofrece el valor 0,00. La interpretación no es que el nivel de

significación es 0, sino que el nivel de significación es menor que

. El nivel de confianza será por

tanto superior al 99,9%. Dado que los grados de libertad son mayores de 120, el valor de t podemos

Page 13: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Diferencia de medias

Error típico ( )

Límite inferior ( ) ( )

Límite superior ( ) ( )

-0,48 0,11 -0,70 -0,29

Otra cuestión distinta será la explicación de dichas diferencias. Puede ser por la edad, los

mayores se vuelven conservadores –explicación banal-, o puede ser efecto, no de la edad, sino

de la generación. En los nacidos en el entorno de la Guerra y Postguerra priman los valores

“materialistas3” sobre los “postmaterialistas” y por ello podrían tener un comportamiento más

conservador.

2 Intervalos de confianza para proporciones

En el análisis de encuestas sociales el estadístico más corriente y empleado es la proporción.

Sin embargo los programas de cálculo estadístico no ofrecen las mismas facilidades de cálculo

de errores típicos e intervalos que para medias.

Por ejemplo, queremos conocer el peso de las religiones no católicas en la población española,

según la información que nos ofrece la pregunta 32.

Desplegamos el menú: Analizar; Estadística Descriptiva; Frecuencias y seleccionamos P32. Los

resultados:

interpretarlo como Z, en este caso tendríamos que Z>4,1, es decir el valor obtenido está a más de cuatro unidades Z del caso en el que hubiera diferencias. 3 Véase sobre valores materialistas/postmaterialistas el estudio del profesor Ronald Inglehart (1991): “El

cambio cultural en las sociedades industriales avanzadas”. CIS.

Page 14: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

La tabla nos indica que el 2,78% de la muestra se consideran creyentes no católicos.

Observemos que además de la tabla de porcentajes, PSPP por defecto nos ofrece una tabla

con estadísticos. Sin embargo, dichos estadísticos no tienen sentido alguno. PSPP ha calculado

la media usando los valores de codificación –entre 1 y 9- como valores de las categorías. La

variable es una variable cualitativa y sus categorías no pueden relacionarse con ninguna

métrica.

Para conocer la proporción en el conjunto de los españoles mayores de 18 años vamos a

construir un intervalo de confianza. El error típico de la proporción tenemos que calcularlo

manualmente. Como sabemos:

El intervalo de los creyentes no católicos para el conjunto de la población española será:

Nivel de confianza Z

Inferior

Superior

95% 1,96 2,1% 3,4%

95,45% 2 2,1% 3,4%

99% 2,58 1,9% 3,6%

99,7% 3 1,8% 3,8%

Cuando los tamaños muestrales son grandes, como es en este caso, el error estadístico

máximo resulta muy reducido. Como puede comprobarse en la ficha técnica, para un nivel de

confianza del 95% los errores no superarán el 2% en esta encuesta. Para esta categoría –

creyentes no católicos, con el mismo nivel de confianza el error está en torno a 0,6%. Para

Page 15: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

esta encuesta, como regla general, podemos construir intervalos muy precisos para el

conjunto de la población sin necesidad de cálculos, simplemente sumando o restando un 2% al

porcentaje.

Cuando comparamos categorías en tablas cruzadas el estadístico que utilizamos es la

diferencia de proporciones. Dicho estadístico es sin duda el de mayor utilidad en el análisis de

encuestas sociales. Vamos a investigar otro mito: ¿son las mujeres más religiosas que los

hombres?

Para ello vamos a calcular la distribución de frecuencias de la P32 para hombres y para

mujeres y luego estudiar las diferencias. Ello lo vamos a realizar mediante una tabla de

contingencia. Desplegamos el menú: Analizar; Estadística Descriptiva; Tablas Cruzadas.

Como norma, en las tablas se coloca en la posición de filas la variable que queremos estudiar,

en este caso “religiosidad” (P32) y en columnas la variable que contiene los grupos de

comparación –en este caso sexo del entrevistado (P29)-.

Como podemos ver la ventana para tablas de contingencia (Cosstabs) nos ofrece varias

posibilidades. Por una parte están los estadísticos (En esta práctica resulta recomendable

desactivar todos, ya que serán estudiados en otros cursos), y por otra “Celdas...”. En el botón

Page 16: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

de celdas, seleccionaremos únicamente Recuento –que nos dará el número de casos “n” en

cada casilla- y Columna. Con esta característica estamos solicitando los porcentajes en la

dirección de la variable que forma los grupos de comparación. Es decir estamos haciendo 100 a

los hombres y 100 a las mujeres para poder comparar ambas distribuciones, con

independencia del número de hombres o de mujeres.

La lectura de la tabla parece confirmar la idea de que las mujeres son más religiosas. Podemos

observar que el 77,8% de las mujeres se declaran católicos, mientras que sólo lo hacen el 66%

de los hombres. Los hombres se concentran más en las categorías de “No Creyentes” y “Ateos”

que las mujeres.

El grupo de católicos mantiene una diferencia grande (77,8%-66%=11,8%). Si construimos el

intervalo del estadístico de la diferencia podemos señalar que en la población española hay

proporcionalmente más católicas que católicos.

Recordemos que el error típico de la diferencia de proporciones es:

Page 17: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

( ) √

El error estadístico para un nivel de confianza del 95% (Z=1,96) será: 1,96x2,1=4,1%. El

intervalo de la diferencia se encontrará entre el 7,7% t el 16%. (11,8%±4,1%). Es decir en la

población hay diferencias por sexo respecto a la proporción de católicos.

No obstante debe tenerse en cuenta que el hecho de que encontremos diferencias no quiere

decir que sean explicadas por dichas variables. En este caso, afirmamos que hay diferencias,

pero no llegamos a afirmar que las mujeres son más “religiosas que los hombres”. Dicha

afirmación debe sustentarse en la existencia de un cuerpo teórico que soporte dicha relación,

pero además resulta necesario comprobar que no existen variables que modifican, intervienen

o alteran la relación observada.

En el presente caso, del hecho de ser hombre o mujer no se desprende mayor o menor

religiosidad, el sexo se lleva en los genes pero no podemos decir lo mismo de las creencias.

Debemos considerar otras variables que incidan en esta relación. Por ejemplo, el efecto que

puede tener la educación diferenciada con la que han crecido distintas cohortes de hombres y

de mujeres. También deberíamos descartar el efecto que pueda tener la composición por edad

en la tabla; la muestra de mujeres tiene una edad media mayor que la de hombres, como

efecto de las diferencias en esperanza de vida.

No es objeto de este ejercicio resolver esta cuestión. Es objeto de los próximos cursos mostrar

las formas de análisis de relaciones entre variables. Únicamente se ofrece para el lector

curioso la siguiente tabla que relaciona religiosidad de hombres y de mujeres en función de su

posición en el hogar. Respuestas a la pregunta 36. Resulta muy ilustrativo observar que cuando

son ellos o ellas quienes son los mantenedores del hogar, no hay diferencias importantes en el

grado de “catolicismo” y cuando están ellos o ellas en posición subsidiaria las diferencias se

hacen máximas. Esta constatación nos lleva a considerar los estudios de género como

perspectiva teórica de interés para cuestionar el mito de la (mayor) religiosidad femenina.

Page 18: Práctica 7 (Tema 9) Cálculo de intervalos de confianza ejercicios_guia/Practica7.pdf · 1 La construcción de intervalos de confianza de medias ... Pulsando directamente sobre el

Relación entre posición religiosa (P32) en función de la posición en el hogar (P36, persona

que trae ingresos al hogar) por sexo del entrevistado/a

P29

Hombre Mujer

Recuento % del N de la columna Recuento

% del N de la columna

P36 La persona entrevistada P32 Católico/a 572 71,5% 299 76,5%

Creyente de otra religión 15 1,9% 10 2,6%

No creyente 125 15,6% 43 11,0%

Ateo/a 74 9,3% 30 7,7%

N.C. 14 1,8% 9 2,3%

Otra persona P32 Católico/a 168 54,7% 569 78,1%

Creyente de otra religión 18 5,9% 23 3,2%

No creyente 62 20,2% 85 11,7%

Ateo/a 50 16,3% 45 6,2%

N.C. 9 2,9% 7 1,0%

(NO LEER) El entrevistado y otro a partes iguales P32 Católico/a 55 57,9% 109 79,0%

Creyente de otra religión 0 0,0% 2 1,4%

No creyente 24 25,3% 19 13,8%

Ateo/a 13 13,7% 5 3,6%

N.C. 3 3,2% 3 2,2%

N.C. P32 Católico/a 3 37,5% 11 91,7%

Creyente de otra religión 1 12,5% 0 0,0%

No creyente 1 12,5% 1 8,3%

Ateo/a 2 25,0% 0 0,0%

N.C. 1 12,5% 0 0,0%