Analisis de Tablas de cia ( en Spss) Ejemplos

Embed Size (px)

Citation preview

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

Anlisis de Tablas de Contingencia 1. Introduccin Encienciassocialesesmuyfrecuenterecurriralatabulacin cruzadadelosdatoscuandoademsdedescribir(anlisisunivariable)nosinteresacomparar(anlisisbivariable).LasTablasde Contingencia resultan, especialmente indicadas, cuando disponemos de variables nominales o cualitativas, suponiendo que una de ellas depende de la otra (variable independiente y/o explicativa). La elaboracin de tablas de contingencia o tablas bivariablesnoseencuentraestandarizada,bastaconquestase leaeinterpretecorrectamente.Sinembargo,ydadoqueelprogramaestadsticoconelquepresentamoselcaptuloeselSPSS, convieneadvertirquestedisponeenlasfilaslavariabledependienteyenlascolumnaslavariableindependiente. Elintersenelanlisisdetablasdecontingenciaresideen resumirlainformacincontenidaenlatablamidiendolaasociacinentrelasdosvariablesqueformanlatablaynuncalarelacinentrelascategorasdelasvariables.Vamosaobtenerunoo variosnmeros(estadsticos)queresumenelcontenidoinformativorecogidaencadaunadelasceldasquesederivandelcruce delasvariables.Porltimo,yunavezdeterminadoelgradode asociacin entre las dos variables, nos resta valorar si sta es estadsticamente significativa,oloqueeslomismo,silaasociacinorelacinarrojadaporelestadsticoelegidoesatribublea unerrordemuestro(dicharelacinnoesgenuinadelapoblacin que estudiamos), no pudiendo generalizar los resultado obtenidos. Elcaptuloseestructuraentornoatrespuntos,asaber: 1.- Relacindeestadsticosdeasociacinparavariablesde tiponominal. 2.- Relacindeestadsticosdeasociacinparavariablesde tipoordinal. 3.- Eleccinyaplicacindeunapruebaparamtricadesignificacinestadstica.

Estadstica Informtica: casos y ejemplos con el SPSS

3

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

2. Cuadro de Dilogo de Tablas de Contingencia Parallevaracaboelanlisisdetablasdecontingenciaempezamosdefiniendolatablaconlasdosvariablesseleccionadas. 1er paso: Acceder al Cuadro de Dilogo de Tablas de ContingenciaseleccionandoEstadsticosDescriptivos:Tablasde ContingenciadelMenPrincipalAnalizar(figura 1). 2paso:Indicarlasdosvariablesquevanaformarlatabla de doble entrada recordando que: en las Filas situaremos a la dependiente (D8a GRADO DE PRCTICA RELIGIOSA de la queomitidolosNS/NC)yenlasColumnasalavariableindependiente(Rd3queeselESTADOCIVILrecodificadoendonde: 1sonlossolteros;2loscasados;3losdivorciados,separadosy vivenenpareja;4losviudos;y9losNS/NCqueasuvezhan sidoeliminados)(figura2). 3erpaso:Unavezqueyatenemosdefinidalarelacindelas dos variables que suponemos, a priori, asociadas, deberemos seleccionar las medidas de asociacin ms indicadas segn el niveldemedicindestas.Estaopcinseencuentracliqueando sobre el botn de comando Estadsticos..., situado en la parte inferiordelCuadrodedilogo.Unavezquehemosaccedidoal subcuadrodedilogo,aparecerntodaslasmedidasdeasociacindisponibles(figura 3). Enelejemploprcticoquerecogemosalfinaldelcaptulohemosseleccionadotodaslasmedidas deasociacinnominales.Lasventajaseinconvenientesdecada unodeestosestadsticosaparecenenlasiguienterelacin.

Figura 1

Figura 2

Figura 3

3. Estadsticos Nominales 1.- Phi: ElcoeficientePhinospermiteevaluarelgradodeasociacin entre dos variables, pero slo esta normalizada, es decir oscila entre0y1entablasde2X2.Entablasconotrascaractersticas tomavalores>1.Enestoscasoslorecomendableesutilizarel CoeficientedeContingencia. 2.- CoeficientedeContingencia: EstamedidaesunaextensindePhiparaelcasodetablas mayoresa2X2perotampocoesunamedidanormalizadapara

4

Estadstica Informtica: casos y ejemplos con el SPSS

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

estetipodetablaspuesoscilaentre0paraelcasodenoasociacinyCmax,valorquenuncaalcanzael1. 3.- VdeCramer: LaVdeCramerestambinunaextensindelcoeficientePhi peroenestecaso,yadiferenciadelCoeficientedeContingencia, siseencuentranormalizada.LaVdeCrameroscilaentre0y1 (valorescercanosa0indicannoasociacinylosprximosa1 fuerteasociacin).Elproblemadeesteestadsticoesquetiende asubestimarelgradodeasociacinentrelasvariables. 4.- Lambda: Esteestadsticocomparaelerrorcometidoenlaprediccin cuando nicamente se consideran los valores de la variable dependiente,yelerrorcometidoenlaprediccindestaapartir delconocimientodelosdelaindependiente. Su versin asimtrica se interpreta como la proporcin en quesereduceelerroralpredecirlosvaloresdeunadelasvariables (dependiente) a partir de los de la otra (independiente); mientras que la versin simtrica se interpreta como la proporcinenlaquesereduceelerroralpredecirlosvaloresdecualquieradelasdosvariablesapartirdelatabladecontingencia. Suclculoserealizaenbasealosvaloresmodales(frecuenciasmayoresenladistribucin),porloqueesunamedidaque sevemuyinfluidaporelsesgoenlasdistribucionesmarginales (sueleser0apesardequeexisteasociacinentrelasvariables). Tomavaloresentre0,enelcasodenoasociacin,y1,encaso defuerteasociacin. 5.- Coeficientedeincertidumbre: Esunamedidasemejantealaanteriorencuantoasuconcepcindelaasociacindelasvariables,enrelacinalacapacidadpredictivaylasdisminucindelerrordedichaprediccin.La diferenciaestribaensuclculoyaqueenestecasolaexpresin deestoscoeficientesdependedetodaladistribucinynoslo delosvaloresmodales,porloqueslotomaelvalor0encasos de total independencia. sta es su ventaja respecto a Lambda, peroesmsdifcildeinterpretar.Oscilaentre0y1.Suversin asimtrica se interpreta como la proporcin de incertidumbre reducidaalpredecirlosvaloresdeunavariableapartirdelosde la otra; mientras que la versin simtrica se interpreta como la proporcindeincertidumbrereducidaalpredecirlosvaloresde

Estadstica Informtica: casos y ejemplos con el SPSS

5

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

cualquiera de las dos variables mediante la tabla de contingencia. 6.- Kappa: Esunamedidaapropiadacuandosedeseacompararelcomportamiento de dos variables nominales medidas en la misma escala.Esdecir,enquemedidasedistribuyendelmismomodo onorespectoaunaterceravariable.Silasvariablesestnfuertementerelacionadasesporquetienenelmismocomportamiento, en caso contrario no. En definitiva, mide el grado de acuerdo entrelosvaloresdelasdosvariablesyoscilaentre-1y1.

4. Estadsticos Ordinales1.- Gamma: Gammaesunamedidadelgradoytipodeasociacinentre dosvariablescualitativasordinalesqueoscilaentre-1(amedida queaumentanlosvaloresdeunavariable,losdelaotradisminuyen)y1(amedidaqueaumentanlosvaloresdeunavariablelos delaotratambinaumentan)El0indicanoasociacin.Ladesventaja de esta medida es que alcanza tales valores aunque la asociacinnoseatotal,esdecir,tiendeaestarsobrestimada. 2.- DdeSomers: EsunaextensindeGamma,ysepresentaendosversiones: unasimtricayotraasimtrica.Aligualquestatieneelinconvenientedequepuedealcanzarlosvaloresde-1y1aunqueno existaasociacintotalentrelasvariables. 3.- Tau-b-deKendall: EsunaextensindeGammaperopresentalaventajadeque alcanzalosvalores-1y1(sloparatablascuadradas)ensituacionesdetotalasociacin. 4.- Tau-c-deKendall: Esunacorreccindelamedidaanteriordemodoquealcanzalosvalores-1y1inclusoentablasnocuadradas.Elproblema quepresentaesquetiendeasubestimarlaasociacinrealentre lasvariables. 5.- Riesgorelativo: EsunamedidasemejanteaOddratio(OR)siendosuprincipalinconveniente,denoextraersulogaritmo,quenoestnor-

6

Estadstica Informtica: casos y ejemplos con el SPSS

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

malizada.Deestemodo,silasvariablessonindependientes,su valores1. 5. Pruebas de significacin estadstica Enelsupuestocasoquelosestadsticosseleccionadosmanifestaran relacin y/o asociacin entre las variables, deberemos valorarsusignificacinestadstica.Aplicandoalgunadelaspruebasdesignificacinconlasquecontamos(sueleccindepender,nuevamente,deltipodemedicinconelquesepresentenlas variables de la tabla) demostraremos si la asociacin es una RelacinEspuria(exclusivadelamuestraseleccionada)o,delo contrario, una Relacin Genuina, y por ello, generalizable al conjuntodelapoblacin. 4paso:Unavezmarcadaslasmedidasy/oestadsticosde asociacin,enlamismaventanadeEstadsticosdelCuadrode dilogo de Tablas de Contingencia seleccionaremos la prueba Chi-cuadrado. 1.- Prueba Chi-cuadradodePearson: La prueba Chi-cuadrado la aplicamos para contrastar la HiptesisNula;H0=lasvariablesxeysonindependientes. Silasignificacinasociadaaesteestadsticoesmenorigual a 0.05 rechazamos la hiptesis de independencia. La base de clculodelaChi-cuadradosonlasdiferenciasentrelasfrecuenciasobservadasyesperadas. 2.-RazndeverosimilitudChi-cuadrado: LarazndeverosimilitudChi-cuadradoesunaalternativaal estadsticoChi-cuadradocuandoelobjetivoescontrastarlahiptesisdeindependenciaentrelasvariables.Ladiferenciaestribaen que en este caso se calcula el cociente entre las frecuencias observadasyesperadas.Enestecasotambinrechazaremosla hiptesisdeindependenciaentrelasvariablescuandolasignificacindeesteestadsticoseamenoroiguala0.05. La aplicacin de los dos estadsticos pueden llevarnos a la mismaconclusin.Sinembargo,yenaquelloscasosenlosque noseproduzcaestacoincidencia,elegiremoselestadsticocon unasignificacinmenor.

Estadstica Informtica: casos y ejemplos con el SPSS

7

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Figura 4

ParacontinuartrabajandocliqueamosalbotndeContinuar regresando al cuadro de dilogo principal de Tablas de Contingencia.Unavezenste,yconlafinalidadderecabarla mayorinformacinrelacionadaconlapruebaquevamosaaplicar,marcamoselbotndecomandodeCasillasoCeldassegn la versin de SPSS con la que estemos trabajando. Dentro de este cuadro de dilogo (figura 4), nos encontramos con tres apartados en los que debemos marcar las opciones que nos interesan;estoes,elegiremoslascifrasyporcentajesquedeseamosqueaparezcanencadacasilladelaTabladeResultadosdel anlisisdeContingencia. Elprimerodeellos,eslasFrecuencias,yeneste,seleccionamos los dos tipos de frecuencias: Observadas y Esperadas. El segundo, son los Porcentaje, y seleccionamos: Columnas y Total. Y en tercer lugar, los Residuos, y seleccionamos: No Tipificados y TipificadosCorregidos. Enlapresentacin delcaptuloadvertamosquelasmedidasdeasociacin susceptiblesdeseraplicadasreflejabanlarelacinentre lasvariablesynuncaentrelascategorasdestas.Pues bien, seleccionado los Residuos Corregidos podremos analizar la relacin entre las distintas categoras, de tal maneraquesielresiduotipificadoesgrande(envalores absolutos), las categoras correspondientes estarn relacionadas.Caberecordarquecuandolosresiduostipificadossonmayoresa1,96(95NiveldeConfianza)2,58 (99 Nivel de Confianza) son significativos e indican el tipo de relacin (segn el signo) que existe entre las categorasimplicadas. Por ltimo, y como previo paso a la salida definitiva del resultado derivado de las restricciones y peticiones a las que hemossometidoalanlisisdelasTablasdeContingencia(cuadro dedilogoTablasdeContingencia),deberemosespecificarcon quformatoqueremosquesepresenteelresultado. 5paso:LaeleccindelFormatodetablasderesultadosse encuentra en el ltimo botn de comando situado en la parte inferior del cuadro de dilogo principal. Una vez seleccionada esta opcin, deberemos decidir el orden con el que queremos

8

Estadstica Informtica: casos y ejemplos con el SPSS

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

quesenospresentenlosvaloresdelaescala,debiendodecidir entreensentidoascendente odescendente.

6. Neutralizacin Lalgicaqueacabamosdeexponerparavalorarlarelacin, asociacinydependenciaentredosvariables,puedesererrnea porelhechodequesepuedeestarproduciendounainteraccin entrelasvariables.Cuandosospechemosqueestacircunstancia se produce debemos analizar dicha interaccin en la tabla de contingencia.Paraello,elanlisisdescritodebeincluirloquese denomina neutralizacin o control de la variable. Esta tcnica sloesadecuadacuandoeltamaodelastablasyelnmerode categorasespequeo. Nospuedeinteresar,porejemplo,yunavezcomprobadala relacin entre ESTADO CIVIL y GRADO DE PRCTICA RELIGIOSA, valorar si esta dependencia se mantiene o se ve alterada al introducir una tercera variable, denominada en este caso,variabledecontrol.Dadoqueelanlisisyanoesexclusivamente bivariable, pasamos al anlisis multivariable de las TablasdeContingencia.Conelprocesoquedescribimosobtendremosuncriteriomsapartirdelcualvalorarsilarelacininicialesespuriaogenuina. Esteprocesoseiniciaunavezquehemosincluidounavariablemsenelanlisis.Sepuedenintroducirtantasvariablesde control como se consideren oportunas o se quieran contrastar. Paraellosuperpondremosendiferentescapaslasvariablesque queremoscontrolar.Siincluimosenlaprimeracapamsdeuna variable,cadaunadeellassecruzarindependientementeconel cruceindicadoarriba,obteniendotantascomprobacionescomo nmerodevariablesintroducidas. Lavariableseleccionadacomovariabledecontrollacolocaremos en la casilla Capa 1 de 1. En nuestro ejemplo ser la variableSEXO(d1)(figura 5).Enlasalidaderesultadosfinales, apareceelcoeficientedePearsonparacadacategoradelavariabledecontrol.Larelacinoriginalserunarelacingenuina,si dichocoeficiente,paracadaunadelacategorasdelavariablede control,tieneunasignificacinpordebajode0.05.Denoproducirseestacircunstancia,podemosconcluirenquelarelacin esespuria.

Figura 5

Estadstica Informtica: casos y ejemplos con el SPSS

9

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

7. Bibliografa Comentada Snchez Carrin, Juan Javier (1989): Anlisis de tablas de contingencia. Madrid, Centro de Investigaciones Sociolgicas, n105,171pgs. En este libro, de una forma clara y muy didctica, se exponen los principales argumentos ligados al anlisis de tablas de contingencia. Babbie,Earl(1999):The Basics of Social Research.Londres, WadsworthPublishingCompany(traducidoporJos Francisco JavierDvilaMartnez,Fundamentos de la investigacin social, Madrid,ThomsonLearning,2000,473pgs.). ste es otro manual, en este caso con carcter general, que de forma clara expone los principales elementos a considerar en la investigacin social. Acompaado de mltiples ejemplos, reales y ficticios, en los captulos 15 y 16 (Anlisis de datos y Estadsticas sociales, respectivamente) nos presenta al anlisis bivariado de la mano de las tablas de contingencia as como las principales medidas de asociacin y pruebas estadsticas de significacin segn el tipo de medicin de la variable. Miguel,Amandode(1997):Manual del perfecto socilogo. Madrid,Espasa,195pgs. En los captulos 5 y 6 (Cmo se lee una tabla y Cmo se construye un cuadro), tambin de una forma muy prctica y didctica se hace referencia a los requisitos a considerar a la hora de organizar los datos una vez concluido el trabajo de campo. Bisquerra,Rafael(1987):Introduccin a la estadstica aplicada a la investigacin educativa. Un enfoque informtico con los paquetes BMDP y SPSS. Barcelona, Promociones y PublicacionesUniversitarias,pp.135-140. En el captulo que el autor dedica a la exposicin de la prueba chi-cuadrado se recogen los aspectos a considerar en el proceso de neutralizacin.

10

Estadstica Informtica: casos y ejemplos con el SPSS

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

8. Resultados. Acontinuacinsepresentanlosresultadosobtenidosalaplicarelanlisisdetablasdecontingencia.Lastablasqueaparecen pretendenfacilitarnoselanlisisrespectoalaposiblerelacinque se produce entre estado civil y prctica religiosa. En concreto stasseestructuranentornoadosbloques,asaber: Enprimerlugar,yjuntoalaTabladeContingencia(cruce de las variables ESTADO CIVIL - PRCTICA RELIGIOSA)aparecenlaTablaquevaloralabondadde ajusteylaTablaquemide,apartirdelaseleccindeuna seriedeindicadores,laintensidaddelarelacinentrelas variables. Ensegundolugar,yconlafinalidaddevalorarsilarelacin descrita es espuria o genuina, se repite el anlisis pero introduciendo como variable de control el SEXO. LaTabladecontingenciaconelcrucedelastresvariablesylatablaconlapruebadechi-cuadrodancuentadel procesodeneutralizacinllevadoacabo.Secompletala informacinconlatablaqueindicalaintensidaddelas relaciones(medidasdeasociacin) Caberecordarquelafinalidaddeestatcnicaesladedetectarsiexisteonodependenciaentredosvariables.Nuncamidela relacinentrecategoras.Siestafueranuestraintencindeberemosrecurriralanlisisdecorrespondencias(vercaptulo3).

8.1. Resumen del procedimiento

Estadstica Informtica: casos y ejemplos con el SPSS

11

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

8.2. Tabla de contingencia

12

Estadstica Informtica. Casos y ejemplos con el SPSS

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

8.3. Bondad de Ajunte

8.4. Medidas de Asociacin

Estadstica Informtica: casos y ejemplos con el SPSS

13

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

8.5. Resumen del procedimiento. NEUTRALIZACIN

8.6. Tabla de Contingencia. NEUTRALIZACIN

(contina...)

14

Estadstica Informtica. Casos y ejemplos con el SPSS

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Captulo 1

Tabla de Contingencia. NEUTRALIZACIN (continuacin)

8.7. Bondad de Ajunste. NEUTRALIZACIN

Estadstica Informtica: casos y ejemplos con el SPSS

15

Captulo 1

A n l i s i s d e Ta b l a s d e C o n t i n g e n c i a

8.8. Medidas de Asociacin. NEUTRALIZACIN

16

Estadstica Informtica. Casos y ejemplos con el SPSS