View
183
Download
3
Category
Preview:
Citation preview
+Analisis de Datos
Cuantitativos
Dra. Michelle Mueses
Dra. Janet Fermina
Dra. Marlene Soriano
Dra. Yarineth de la Cruz
+Definicion
El Analisis Cuantitativo, usa la recoleccion de datos para probar
hipotesis con base en la medicion numera y el analisis estadistico,
para establecer patrones de comportamiento y probar teorias.
+Proceso de Investigacion Cuantitativa
Decidir el program a utilizar.
Explorar los datos obtenidos
en la recoleccion.
Analizar descriptivamente los
datos por variable.
Evaluar confiabilidad, validez
y objetividad.
Analizar la hipotesis.
Realizar analisis adicionales.
Preparar los resultados para
presentarlos.
+Que procedimiento se sigue para
analizar cuantitativamente los datos?
Analisis se lleva por
computadora.
Mediante matriz de datos
computarizado.
+Paso 1
Programa de computador.
Incluye dos partes:
Definicion de las variables
que explican los datos.
Matriz de datos.
Que procedimiento se sigue para
analizar los datos?
+Programas de analisis
Univ Chicago
+ utilizados/ Ingles
Contiene todos los analisis
estadisticos
Vista de variables con
definiciones de variables y
datos
Vista de datos (matriz de datos)
Bajo costo
Incluye un considerable # de
estadisticas
Tiene tutorial en linea
Sencillo de manejar
Satatistical Package for Social
Sciences (SPSS)Minitab
+
Universidad de Carolina del
Norte.
Muy poderoso.
Paquete completo para
computadoras personales que
contienen una variedad de
pruebas estadisticas.
Cualquier programa nos sirve.
Todos los mencionados son
excelentes opciones.
Sistema de analisis Estadistico Conclusion:
Otros pogramas de analisis
+Paso 2: Ejecutar el programa
SPSS y Minitab, ambos son faciles de usar.
Solicitar los analisis requeridos seleccionando las opciones
apropiadas.
Lo primero es verificar que el programa corra en nuestro
computador.
+Paso 3: Explorar los datos.
Iniciamos el analisis
1. Formulamos la pregunta de investigacion.
2. Visualizamos un alcance(exploratorio, descriptivo correlacionaly/o explicativo)
Establecemos nuestras hipotesis
Definimos las variables.
Elaboramos instrumento(conocemos que items miden quevariable y que nivel de medicion tiene nominal, ordinal, de intervalos o de razon)
Recolectamos los datos.
+
Variables de la matriz:
Columnas o items.
Variables de la investigacion:
Medidas que forman parte de la hipotesis o que se pretenden
describir.
Edad, Genero, inteligencia, durancion de un material.
Variables Compuesta
+Apunte 2
El analisis de los datos dependen de tres factores:
El nivel de medicion de las variables.
La manera como hayan formulado las hipotesis.
El interes del investigador.
+Que es una distribucion de
frecuencia?
Es un conjunto de puntuaciones ordenadas en sus respectivas
categorias.
+Otras maneras de presentar las
distribuciones de frecuencias?
Histogramas
Graficos circulares
Otros tipos de Graficos
+Poligonos de frecuencia
Relacionan las
puntuaciones con sus
respectivas
frecuencias, por
medio de graficas
utiles para escribir
datos.
• Curvas utiles para
describir los datos
+Medidas de Tendencia Central
Valores medios o centrales de
una distribucion que sirven para
ubicarla dentro de la escala de
Medicion
Las principales son:
Moda
Mediana
Media
Es la categoria o puntucion que
ocurre con mayor frecuencia.
Definicion Moda:
+
Es el valor que divide la
distribucion por la mitad.
Refleja la posicion intermedia
de la distribucion.
Es la tendencia central mas
utilizada y puede definirse
como el promedio aritmetico de
una distribucion.
Mediana Media
+Medidas de la Variabilidad :
son intervalos que indican la dispersion
de los datos en la escala de medición
Las mas utilizadas son: Rango, Desviación Estandar y Varianza.
El rango llamado recorrido, es la diferencia entre la puntuacion
mayor y la puntuación menor. Indica la extension total de los
datos en la escala .
El rango sera: 33-17 =16.
Mayor sera el rango, mayor sera la dispersion de los datos de una distribucion.
La desviasion estandar o tipica es promedio de desviacion de las puntuacionescon respecto a la media que se expresa en las unidades originales de medicionde las distribucion.
La desviacion estandar se interpreta como cuando se desvia, en proomedio de lamedia un conjunto de puntuaciones.
La Varianza es la desviacion estandar elevada al cuadrado y se
simboliza.
Se utiliza en analisis inferenciales .
Asimetria: estadistica que se usa para conocer cuanto se parece unadistribucion a la distribucion a la distribucion teorica llamada curva normalcontituyendo un indicador del lado de la curva en el que las frecuenciasse agrupan mas.
La Custosis: es un indicador de lo plano a picudo que es una curva .
Puntuacion Z: indica la direccion y el grado en que un valor individual sealeja de la unidades de desviacion estandar.
X: es la medida de la distribucion.
S : desviacion estandar de esta.
Z: es la puntuacion transformada en unidades de desviacionestandar.
Razones y tasas
Una Razon es la relacion entre dos categorias. Ejemplo:
Categorias Frecuencia
Masculino 60
Femenino 30 = 2
Tasa es la relacion entre el numero de casos de una categoria
y el numero total de observacion.
+Nivel de significancia
Se expresa en terminos de probabilidad (0.005 y 0.02) y la
distribucion muestral tambien como probabilidad.
Pues bien, para ver si existe o no confianza al generalizar
acudimos a la distribucion muestral, con una probabilidad
adecuada para la investigacion,
+Que hacemos para ver si nuestra hipotesis sobre
la media poblacional es aceptada o rechazada?
+Cuales son los supuestos o las
presuposiciones de la estadistica
parametrica?
Para realizar analisis parametricos debe partirse de los
siguientes supuestos:
La distribucion poblaciona de la variable dependiente es normal
El nivel de medicion de la variable dependiente es por intervalos o
razon.
Cuando dos o mas poblaciones son estudiadas, tiene una varianza
homogenea.
+Pruebas estadisticas parametricas
mas utilizadas:
Coeficiente de correlacion de Pearson y regresion lineal
Prueba t
Prueba de Contraste d ela diferencia de proporciones
Analisis de Varianza unidireccional
Analisis de varianza factorial
Analisis de covarianza
+Coeficiente de correlacion de
Pearson:
Prueba estadistica para
analizar la relacion entre dos
variables medidas en un nivel
por intervalos o de razon
Se simboliza: r
Se calcula atraves de las
puntuaciones obtenidas en una
muestra de dos variables.
+
Es un modelo matematico para
estimar el efecto de una
variable sobre otra.
Esta asociado con el
coeficiente r de Pearson.
Es una prubea estadistica para
evaluar si dos grupos difieren
entre si de manera significativa
respecto a sus medias.
Se simboliza con un t
Regresion lineal Prueba t
+
Análisis no paramétricos
Cuales son las presuposiciones de la
estadística no paramétrica?
Para realizar los análisis no paramétricos debe partirse de las
siguientes consideraciones:
La mayoría de los análisis no requieren de presupuestos acerca de
la forma de la distribución poblacional. Aceptan distribuciones no
normales.
Las variables no necesariamente tienen que estar medidas en un
nivel por intervalos de razón; pueden analizar datos nominales u
ordinales.
Cuales son los métodos o las pruebas
estadísticas no paramétricas mas
utilizados?
La chi cuadrada o χ²
Los coeficientes de correlación e independencia para tabulaciones
cruzadas.
Los coeficientes de correlación por rangos ordenados de Spearman
y Kendall.
Que es la chi cuadrada χ² ?
Es una prueba estadística para evaluar hipótesis acerca de la
relación de dos variables categóricas.
Nivel de medición de las variables: nominal u ordinal.
Procedimiento: Se calcula por medio de una tabla de
contingencia o tabulación cruzada, que un cuadro de dos
dimensiones, y cada dimensión contiene una variable.
χ²
Que son los coeficientes de correlación
e independencia para tabulaciones
cruzadas?
Adicionales a la chi cuadrada, existen otros coeficientes para evaluar si
las variables incluidas en la tabla de contingencia o tabulación cruzada
están correlacionadas.
Principales coeficientes para tablas de
contingencia.
Coeficiente Para cuadros de
contingencia…
Nivel de
medición de
ambas variables
Interpretación
Phi Φ 2x2 Nominal. Puede utilizarse con
variables ordinales reducidas
a dos categorías. SPSS lo
que muestra en cálculos para
datos nominales.
Tablas 2x2 varia de 0 a 1,
donde cero implica ausencia
de correlación entre las
variables; y uno, que hay
correlación perfecta entre las
variables.
En tablas más grandes, phi
puede ser mayor de 1.o, pero
la interpretación es compleja.
Por ello, se recomienda
limitar su uso a las tablas 2x2
Coeficiente de contingencia
C de Pearson
Cualquier tamaño.
De hecho es un ajuste de phi
para tablas con más de dos
categorías en las variables.
Incluso funciona mejor con
tablas de 5x5.
Nominal. Puede utilizarse con
variables ordinales reducidas
a dos categorías.
0 a 1, pero en tablas menores
a 5x5 , se acerca pero nunca
alcanza el uno.
Coeficiente Para cuadros de
contingencia…
Nivel de
medición de
ambas variables
Interpretación
V de Cramer (C) Cualquier tamaño Cualquier nivel de variables ,
pero siempre reducidas a
categorías.
SPSS lo muestra en cálculos
para datos nominales.
0-1, pero el uno solamente se
alcanza si amas variables
tienen el mismo número de
categorías(o marginales)
Goodman-kurskal Lambda o
sólo Lambda (λ)
Cualquier tamaño Cualquier nivel de variables,
pero siempre reducidas a
categorías. SPSS lo muestra
en cálculos para datos
nominales.
Fluctúa entre 0 y 1, asume
causalidad, lo que significa
que puede predecirse a la
variable dependiente definida
en la tabla como base de la
pendiente.
Coeficiente Para cuadros de
contingencia …
Nivel de medición de ambas
variables
Interpretación
Coeficiente de incertidumbre o
entropía o U de Theil
Cualquier tamaño Cualquier nivel de variables ,
pero siempre reducidas a
categorías.
SPSS lo muestra en cálculos
para datos nominales.
Fluctúa entre 0y 1, asume
causalidad, lo que significa
que puede predecirse a la
variable dependiente definida
en la tabla, sobre la base de la
pendiente.
Gamma de Goodman y
Kruskal
Cualquier tamaño Ordinal Varia de -1 a +1 (-1 es una
relación negativa , y +1 una
relación positiva perfecta).
Tau-a, Tau-b y Tau-c
(ta,tb,tc)
Cualquier tamaño Ordinal Varia de -1 a +1. Tau-a Tau-b
son asimétricas y Tau-c es
simétrica.
D de Somers Cualquier tamaño Ordinal Varia de -1 a+1.
Kappa Cualquier tamaño Datos categorizados por
intervalo.
Regularmente de 0 a 1.
Que otra aplicación tienen las tablas de
contingencia?
Tablas de contingencia , además de servir
para el cálculo de chi cuadrada y otros
coeficientes, son útiles para describir
conjuntamente dos o mas variables. Esto se
efectúa al convertir las frecuencias observada
relavas o porcentajes. En una tabulación
cruzada puede haber tres tipos de porcentajes
respecto de cada celda.
Porcentaje en relación con el total de frecuencias
observadas(¨N ¨o ¨n¨ de muestra).
Porcentaje en relación con el total marginal de la columna.
Porcentaje en relación con el total marginal del renglón.
Otros coeficientes de correlación
El Coeficiente de correlación de Pearson:
Es una estadística apropiada para variables medidas por
intervalos o razón y para relaciones lineales.
¿Qué son los coeficientes y la
correlación por rangos ordenados de
Spearman y Kendall?
Los coeficientes rho de Spearman y tau de Kendall, son medidas de
correlación para variables en un nivel de medición ordinal; los
individuos u objetos de la muestra pueden ordenarse por rangos.
¿ Que otros coeficientes existen?
Biserial(rb)
Biserial (rrb)
Biserial (rpb)
Tetrachoric
Paso 6: realizar análisis adicionales
Este paso implica ,que una vez realizados nuestros análisis , es
posible que decidamos realizar otros análisis extras o pruebas
extras para confirmar tendencias y evaluar los datos desde
diferentes ángulos. Por ejemplo, en una tabla de contingencia
calcular primero chi, Lambda, T de Cramer (C) y el coeficiente de
contingencia. O puede ser un ANOVA, efectuar los contrastes
posteriores que no se nos haya olvidado un análisis pertinente.
Paso 7: prepara los resultados para
presentarlos
Se recomienda:
Revisar cada resultado ----[análisis especifico----valores
resultantes(incluida la significancia)----tablas, diagramas, cuadros y
graficas].
Organizar los resultados (primero los descriptivos, por variable;
luego por resultados relativos a la confiabilidad y a validez;
posteriormente los inferenciales, que se pueden ordenar por
hipótesis o de acuerdo con su desarrollo).
Cotejar diferentes resulto: su congruencia y en caso de
inconsistencia lógica volverlos a revisar. Asimismo se debe evitar
la combinación de tablas, diagramas o graficas que repitan datos.
Por lo común, columnas o filas idénticas de datos no deben
aparecer en dos o mas tablas. Cuando este es el caso, debemos
elegir la tabla o elemento que ilustre o refleje mejor los resultados
y sea la opción que presente mayor claridad. Una buena pregunta
en este momento del proceso es: ¿qué valores, tablas,
diagramas, cuadros o graficas son necesarios ?, ¿Cuáles explican
mejor los resultados?
Priorizar la información más valiosa (que es gran parte del
resultado de la actividad anterior), sobre todo si se van a producir
reportes ejecutivos y otros más extensos.
Copiar y/o “formatear” la las tablas en el programa con el cual
se elaborará el reporte de la investigación (procesador de texto
o uno para presentaciones, como Word o Power Point).
Algunos programas como SPSS y Minitab permiten que se
transfieran los resultados (tablas),directamente a otro
programa (copiar y pegar ). Por ello, resulta conveniente usar
una versión del programa con el que se empleará para escribir
el reporte o elaborar la presentacion.
Volver a revisar los resultados.
Y, finalmente, elaborar el reporte de investigación.
+Bibliografia
Metodologia dela investigacion Cuarta edicion Dr. Roberto
Hernandez Sampieri capitulo 10
Gracias!!!
Recommended