42
Profesores: Jesús Varela Mallou Antonio Rial Boubeta Eduardo Picón Prado www.usc.es/psicom 1 ANÁLISIS MULTIVARIANTE Área de Metodología de las Ciencias del Comportamiento Facultad de Psicología Universidad de Santiago de Compostela Curso 2017-2018 Análisis Multivariante 2 1. Contextualización y Revisión General de las Técnicas Multivariantes 2. El Análisis Preliminar de los Datos 3. Análisis de Regresión Lineal Múltiple TEMARIO ASIGNATURA 4. Análisis de Regresión Logística 5. Análisis Conjunto 6. Análisis Clúster

tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Profesores: Jesús Varela MallouAntonio Rial BoubetaEduardo Picón Prado

www.usc.es/psicom

1

ANÁLISIS MULTIVARIANTE

Área de Metodología de las Ciencias del Comportamiento

Facultad de Psicología

Universidad de Santiago de Compostela

Curso 2017-2018

Análisis Multivariante 2

1. Contextualización y Revisión General de las Técnicas Multivariantes

2. El Análisis Preliminar de los Datos 3. Análisis de Regresión Lineal Múltiple

TEMARIO ASIGNATURA

4. Análisis de Regresión Logística5. Análisis Conjunto6. Análisis Clúster

Page 2: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

TEMA 1

CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS

MULTIVARIANTES

Análisis Multivariante

Análisis Multivariantes 4

1. Introducción2. El método científico

• Definición y características• Tres supuestos o principios• Marco conceptual para la investigación empírica

3. Importancia de lo Multivariante/ble• Qué es un Modelo

– Modelos Teóricos– Modelos Estadísticos

• Modelo Lineal4. Etapas de una investigación5. REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

• Qué son?• Razones de su expansión• Clasificación

6. Algunos ejemplos de Técnicas Multivariantes

Guión tema 1

Page 3: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

5

LIBRO DE TEXTO

ü Rial, A. y Varela, J. (2008). Algunas cuestiones previas. Estadística Prácticapara la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas 3-11.

ü Rial, A. y Varela, J. (2008). Introducción al Análisis Multivariante. EstadísticaPráctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo.Páginas 189-199.

MATERIAL DE APOYO

ü Ato, M., López, J. y Benavente, A. (2013). Un sistema de clasificación de losdiseños de investigación en psicología. Anales de Psicología, vol. 29, nº3,1038-1059.

ü Varela, J. y Rial, A. y Braña, T. (2015). Comprendiendo al Consumidor.Modelos Multivariantes. Unidad de Psicología del Consumidor y Usuario. USC.

http://www.divestadistica.es/es/predicciones.html (video)

LECTURAS COMPLEMENTARIAS para el Tema 1

Análisis Multivariante 6

v El psicólogo es un CIENTÍFICO SOCIAL, debe desligarse de lomeramente especulativo

vLa labor del científico social no es fácil!! Debe transformar lasespeculaciones, cábalas e hipótesis en verdades, eso sí, enverdades probables ….. (uso de la estadística)

v Para ello hay que proveerse de un MÉTODO o procedimiento deadquisición e incorporación de conocimientos

v Lo que define el territorio científico y lo distingue del no-científico noes el qué tipo de conocimiento, sino el cómo se obtiene

1. INTRODUCCIÓN

Page 4: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 7

2.1. Definición y Características

Ø Método Científico es el procedimiento mediante el cual podemosalcanzar un conocimiento riguroso y objetivo de la realidad (conjuntode reglas para investigar)

2. EL MÉTODO CIENTÍFICO

v DOS CARACTERÍSTICAS

Ø Carácter empírico: tiene como primer y último referente laexperiencia, la observación y el control

Ø Carácter replicable: todos los pasos seguidos hasta llegar a él sonsusceptibles de ser repetidos de forma idéntica (variables y escalas demedida utilizadas, diseño y análisis e interpretación)

8

PUNTOS BÁSICOS

Lo que define a una disciplina (conocimiento) como científica o no, essi utiliza el MÉTODO CIENTÍFICO para responder a sus problemasobjeto de estudio.

Los objetivos de la ciencia son:

DESCRIBIR, EXPLICAR, PREDECIR Y CONTROLAR

PLANTEAMIENTO DEL PROBLEMA

FORMULACIÓN DE HIPÓTESIS

CONTRASTACIÓN EMPÍRICA DE HIPÓTESIS

Page 5: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

9

2.2. Supuestos o principios

� La naturaleza es comprensible. Se estructura u organiza siguiendo algúntipo de leyes. Es posible detectar ciertas regularidades

� La naturaleza es universal y uniforme. Las regularidades tienen carácteruniversal pero en ciencias sociales existe una variabilidad intrínseca alcomportamiento humano que hace necesario el uso de la estadística paraelaborar modelos del comportamiento (variables aleatorias vs. deterministas)

� La naturaleza tiene una causalidad finita. Los agentes que pueden estaroriginando un determinado fenómeno son limitados, finitos. El principio deparsimonia nos lleva a elegir siempre la explicación más simple para darcuenta del problema

Análisis Multivariante

10

v Tres pilares Metodológicos integran todos los elementos de una Investigación, yque están íntimamente relacionados con las 4 formas de validez.

2.3. Marco conceptual para la investigación empírica

DISEÑO

ANÁLISISMEDIDA

Validez Interna

Validez conclusión Estadística

Validez Constructo

Validez Externa

Page 6: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

11

Un plan para integrar todos los elementos del estudio empírico, de manera que seanCREÍBLES, LIBRES DE SESGO Y GENERALIZABLESA partir de un problema, el DISEÑO se encarga de:

– Selección y asignación de los participantes (muestreo)– Control de las variables extrañas potenciales (procedimiento de control)

La calidad de un DISEÑO:– Validez Interna: La confianza a tener en la relación causa efecto de un estudio. Capacidad de

controlar el efecto de terceras variables que pueden ser causas alternativas a la causainvestigada.

– Validez Externa: Capacidad de generalizar los resultados a otros participantes, a otroscontextos y a otros momentos temporales. Por ejemplo, enviar cuestionarios a estudiantes elegidosal azar muestra más validez externa que uno donde se reparten a los asistentes a un curso.

El equilibrio óptimo entre “ambas” es uno de los objetivos más deseables de un buen diseñode investigación

– Los estudios manipulativos o experimentales priman la interna– Los descriptivos o correlacionales priman la externa

El primer pilar es el DISEÑO

Análisis Multivariante

Análisis Multivariante 12

La identificación, definición y medida de las variables– Medición: asignar números a objetos de acuerdo con unas

reglas o escalas, y que sirven de entrada para losprocedimientos del Análisis Estadístico

La validez relacionada con la medida es la Validez de Constructo o lacapacidad de definir y operativizar apropiadamente el constructo quedice medir

¿Cómo medir la fiabilidad del constructo?. Ej.: Correlación entre las puntuacionesobtenidas por los sujetos en dos formas paralelas, pasando el test dos veces (test-retest) o pasando dos mitades equivalentes. El alfa de Crombach mide el grado deconsistencia interna

El segundo pilar es la MEDIDA

Page 7: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

13

Consiste en la estimación de parámetros y prueba de hipótesisacerca del objetivo de investigación, con los procedimientosestadísticos más apropiados• Valorando aspectos como el tamaño del efecto y la significación práctica y clínica

de los resultados

El tipo de validez relacionada con el ANÁLISIS es la Validez de laConclusión Estadística o Potencia del Constraste (si el valor de laestimación se aproxima al de la población)

Validez Predictiva: a partir de las puntuaciones de un test se puedepredecir o pronosticar una variable de interés. Ej. En RRHH seintenta pronosticar el rendimiento laboral, el absentismo laboral, etc.

El tercer pilar es el ANÁLISIS

Análisis Multivariante

14

Una investigación puede ser perfecta en su concepción, pero seráinadecuada si no se utilizan adecuadamente los 3 pilares de la investigación(Diseño, Medida y Análisis)

El uso de técnicas estadísticas sofisticadas no mejoran los resultados si eldiseño es incorrecto o no se utilizaron medidas apropiadas

DISEÑO

ANÁLISISMEDIDA

Validez Interna

Validez conclusión Estadística

Fiabilidad y Validez

Constructo

Validez Externa

Análisis Multivariante

Page 8: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 15

Los investigadores del Comportamiento humano deben dotarse deherramientas estadísticas para analizar cómo distintas variables (Xi e Y)se combinan para explicar dicho comportamiento: Análisis Multivariante

Para su comprensión y análisis, la mejor forma de representar el conocimientoque poseemos de la realidad es la ELABORACIÓN de MODELOS

Su “relativa” uniformidad hace que dichos modelos, cuando se trata deexplicar el comportamiento humano, tengan que ser Modelos Estadísticos

Además, dado el carácter finito de la causalidad, el científico debeesforzarse siempre en proponer Modelos lo más parsimoniosos posibles

3. Importancia de lo MULTIVARIANTE

Análisis Multivariante 16

Una representación formal, estructurada y concisa de la realidad, quepermite conocer sus propiedades y las leyes que la rigen, posibilitandola realización de predicciones. TIPOS:

�Modelos icónicos. Son imágenes físicas, normalmentetridimensionales de algún objeto material (Ej: las maquetas)

�Modelos analógicos. Procesos pictóricos destinados a reproduciren otro medio la estructura del objeto o situación original (Ej.gráficas de los polímetros, del sueño…)

�Modelos teoréticos (informático y matemáticos). Una organizaciónde ideas que ayuda a explicar los fenómenos investigados. Sebasan en lenguajes especializados como el lenguaje matemáticoo la lógica de programación

3.1. ¿Qué es un MODELO?

Page 9: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 17

Los Modelos Teoréticos…

1. Modelos Informáticos. Son modelos expresados en unlenguaje de programación

2. Modelos Matemáticos. Son formulaciones matemáticasque permiten hacer predicciones en torno a ladistribución de los acontecimientos

Ø Los MODELOS ESTADÍSTICOS son un tipoconcreto de Modelos Matemáticos

Análisis Multivariante 18

Los MODELOS ESTADÍSTICOS…

§ Los MODELOS ESTADÍSTICOS contienen una partesistemática (S) y una parte aleatoria (A)

§Aunque existen multitud de formas de vincular estos doselementos del Modelo Estadístico, la más recurrida parareproducir el objeto de interés científico (Y), por susimplicidad, es la FORMA LINEAL, sumando amboscomponentes

Y S A= +

Page 10: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 19

3.2. MODELO LINEAL GENERAL

Y S A= +§ La parte aleatoria (A) se suele denominar término de

error y acostumbra a representarse por la letra E

§ La parte sistemática (S) se desglosa en varioscomponentes sistemáticos f(Xi), que representen elefecto simultáneo de diversas variables

( )Y f X E= +i

http://www.divestadistica.es/es/laboratorio_estadistico.html

Análisis Multivariante 20

Y = f (Xi )+ Ei

f(Xi) representa una combinación lineal de las variablesexplicativas:

f(Xi) = b1 X1 + b2 X2 + bi Xi

siendo b1, b2 y bi coeficientes que representan el peso, efecto oimportancia relativa de cada variable explicativa de Y

Y =β0 +β1X1 +β2X 2 +…+ E

Page 11: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 21

El investigador debe optar siempre por el modelomás simple y parsimonioso

El mayor reto en el desarrollo de unaINVESTIGACIÓN: con cuántas Xi nos quedamos?

En definitiva...

Yi =β0 +β1X1 +β2X 2 +…+ Ei

V.D V.I.s

http://www.divestadistica.es/es/predicciones.html

Análisis Multivariante 22

4. Etapas de una INVESTIGACIÓN1. Planteamiento del Problema2. Formulación de Objetivos y/o Hipótesis3. Diseño de investigación4. Elaboración de Cuestionario y procedimiento de

administración5. Diseño de la Muestra6. Selección de los Entrevistadores 7. Trabajo de Campo y Supervisión8. Codificación de preguntas y depuración de la

información

9. Análisis de los Datos (contraste de hipótesis, modelización, ….Análisis Multivariante)

10. Interpretación de resultados y Redacción del Informe de Resultados

Page 12: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

23

Etapa 1: Planteamiento del Problema

v Es una pregunta para la cual no tenemos respuesta, el punto departida de toda investigación científica

v Dejar de tratar problemas es dejar de investigarRequisitos:

• Resoluble• Contrastable empíricamente• Expresar una relación entre variables

Ø El problema condiciona los Métodos concretos y las técnicas particulares aemplear para llegar a una respuesta válida

Problema: Necesito incrementar las ventas de mi cartera de bebidas y refrescos en el canal HORECA

Etapa 2: Formulación de Objetivos y Planteamiento de Hipótesis• Proponer una posible explicación del problema exige pensar qué variables

pueden estar interviniendo. De ahí surgen los OBJETIVOS de lainvestigación

Para la formulación de los Objetivos hay que:

1. Establecer una relación entre dos o más variables2. Contrastable empíricamente mediante la estadística

Hipótesis nula e Hipótesis alternativaH0 : rXY = 0 H1 : rXY ≠ 0H0 : bi = 0 H1 : bi ≠ 0

Ventas (Yi ) = b1 oferta variada + b2 activación merchandising + b3 equipamiento frío

Objetivo: Yi : Entender el por qué de la variabilidad de las Ventas de refrescos

Identificación de Variables: stock variado de productos, comunicación de miMarca y Productos en el punto de venta y visibilidad de las bebidas en unexpositor en el punto de ventaHipótesis:

Page 13: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Ej.: Delimitar los objetivos nos ayuda a identificar lasvariables relevantes para el problema…

vProblema. Estudiar las Actitudes, Creencias y hábitos de uso de losjóvenes gallegos hacia internet

vObjetivos:§ Nivel de conocimiento y fuentes de información§ Actitudes y hábitos de uso de internet§ Brecha digital en el territorio gallego y posibles barreras o frenos§ Uso de diferentes herramientas en internet§ Uso y conocimiento de redes sociales y motivaciones§ Uso peligroso internet: webs apuestas, juegos…§ Papel de los padres en relación a internet

vPropuesta de Cuestionario (ver documento adjunto en moodle)

v INFORME de resultados

http://www.valedordopobo.gal/wp-content/uploads/2016/05/Adolescentes-e-Internet.-GAL.pdf

Trabajo voluntario sobre Objetivos, Variables y Técnicas de Análisis de los Datos

v Seleccionar un artículo o publicación de cualquier especialidad

ü describir el problema teórico que pretende resolverü Identificar el objetivo u objetivos de investigaciónü identificar las variables que utiliza para dar respuesta al problemaü Identificar qué técnica/s estadísticas utilizaü Incluir la cita según APA del artículo trabajado

ENTREGARLO EN UN PLAZO MÁXIMO DE 15 DÍAS, A PARTIR DE HOY

Page 14: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Modelos Multivariantes 27

El Diseño es un plan estructurado de acción. El plan a seguir por el investigador paraabordar los objetivos planteados, recoger lo datos y someter a contraste las hipótesis

� Aspectos a tener en cuenta: objetivos, naturaleza del problema y de las hipótesis,variables, unidades de muestreo, recogida de datos, etc.

� Debe especificar la estrategia científica de partida:

i Experimental (manipulación activa, control de variables, asignación aleatoria a grupos)i Cuasiexperimental (grupos naturales, ya existen por lo que no es posible aleatorizar el

tratamiento. Existe tratamiento, respuesta y una hipótesis, pero no asignación aleatoria de sujetos agrupos (tratamiento y control)

iSelectivo o de Encuesta (no experimental y correlacional. Muestreo)iObservacional (datos son situaciones naturales. Registro)iCualitativa (orientada al significado más que a su frecuencia. No busca representatividad)

Etapa 3: Diseño de la Investigación

Máximo control Mínimo control

Mínima naturalidad Máxima naturalidad

28

ü ¿Qué características se maximizan con cada una de lasestrategias o metodologías de investigación?

Experimento

Observación Realismo

Encuesta Representatividad

Cuasiexperimento Control

Cualitativa

Máximo control Mínimo control

Mínima naturalidad Máxima naturalidad

Page 15: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

29

üEmpareje las técnicas metodológicas de la columna de la izquierda conlas características de la derecha

Experimento Significado

Observación Situaciones naturales

Encuesta Control de variables extrañas yasignación aleatoria

Cuasiexperimento No asignación aleatoria grupos y sujetos

Cualitativa Muestra numerosa y representativa

30

üIndique qué características definen a la tradición experimental ycuáles a la tradición correlacional

Tradición experimental

Tradición correlacional

Diferencias entre grupos

Hipótesis de covariación

Búsqueda de leyes generales

Hipótesis causales

Descripción de la realidad

Page 16: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

31

ü Las variables elegidas deben permitirnos responder, como mínimo, a tresobjetivos:

• Estimar magnitudes• Describir a la población• Verificar las hipótesis planteadas

ü Formas de Administración: personal (hogar, centro trabajo, en la calle,comercios…), telefónico (con operador, CATI…), postal, internet, etc.

ü Utilizar diferentes tipos de preguntas (de escala, categóricas, abiertas, cerradas,múltiples, etc.) que permitan responder a diferentes tipos de objetivos con suscorrespondientes escalas de medida, y usar diferentes técnicas de análisis dedatos

Etapa 4: Elaboración del Cuestionario y procedimiento deadministración. Encuesta!

“Recomendaciones de toda la vida para diseñar una buena encuesta”

https://www.netquest.com/blog/es/blog/es/recomendaciones-de-toda-la-vida-para-disenar-una-buena-encuesta

§ ¿Por qué estudiar una Muestra, en lugar de toda la Población?– Coste y ahorro de Tiempo. Una muestra pequeña, cuidadosamente

seleccionada, puede darnos una información suficientemente próxima a larealidad

– Accesibilidad. Algunos elementos de la población pueden ser totalmenteinaccesibles. Ej. En algunas zonas rurales puede no haber datospluviométricos

§ Fases del Muestreo Estadístico:1. Definición e Identificación de la Población (target): determina quién puede o

no ser incluido en la muestra2. Determinación del error del marco de muestreo: Si queremos analizar las

pautas de consumo de una población de 10.000 habitantes y utilizamos laguía telefónica que incluye a 9.600 personas, nuestro error de marco demuestreo será del 4%; 1 - (N marco muestral / N población total);(9.600/10.000= 0.96; 1-0.96= 0,04). (qué sucede con las encuestas on-line??)

Etapa 5: Diseño de la Muestra

Page 17: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

3. Selección de las Técnicas de Muestreo: Si sabemos o no cuál es la probabilidad de cada elemento de la población de ser seleccionado para la muestra:

§ Probabilísticas: Muestreo Aleatorio Simple, M. Sistemático, Estratificado, Conglomerados

§ No probabilísticas: de conveniencia, de juicio, bola de nieve, por cuotas

4. Selección de número de informantes: Muestra representativa

§ Tamaño del Universo o Población: N=1000§ Margen de error: 5§ Nivel de Confianza 95

n=278Si encuestas a 278 personas, el 95% de las veces el dato que quieres saber en la población (parámetro), estará en el intervalo más menos 5% respecto al dato que observes en la encuesta muestral (estadístico).

§Fases del Muestreo Estadístico:1. Definición e Identificación de la Población (target)2. Determinación del error del marco de muestreo

§ Evitaremos sesgos en la administración del cuestionario si losentrevistadores trabajan de acuerdo con un protocolo que garantice lamáxima homogeneidad inter-entrevistadores

§ La importancia de un buen briefing o instrucciones

Etapa 6: Selección de los Entrevistadores y Pilotaje del Cuestionario

ü PRE-TEST DEL CUESTIONARIO o prueba piloto§ Si el orden es lógico, el lenguaje apropiado al target§ Probar con diferentes versiones de cuestionarios§ Estimar el porcentaje de no-respuesta§ Duración, etc.

Page 18: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

3 tareas clave:

1. Incidencias en la recogida de los datos: hablar con los jefes dezona y equipo para posibles incidencias

2. Comprobación de las rutas aleatorias: comprobación de lasunidades últimas del muestreo (completar cuotas)

3. Revisión de los cuestionarios: datos de identificación, %respuestas, codificación preguntas, omisión preguntas, calidadrespuestas, seguimiento preguntas filtro, amabilidad de laentrevista, etc.

Etapa 7: Trabajo de campo y supervisión

§ Categorización y codificación de preguntas abiertas y considerarposibles re-clasificaciones (ej. preguntas métricas en no métricas)

§ Creación fichero de datos y grabación: buscar inconsistencias,valores fuera de rango, respuestas de las preguntas filtro,transformación de variables, cuantificar la no-respuesta, etc……

tema 2: “Análisis preliminar o exploratorio de los datos”

Etapa 8: Codificación de preguntas y depuración de la información

Page 19: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

a) Conocer la distribución individual de cada una de las variablesü Variables nominales: frecuencias y % de cada categoríaü Variables ordinales: mediana, moda e histogramasü Variables métricas: la media o mediana si hay valores extremos, desviación

típica o varianza, simetría y curtosis

b) Análisis de las relaciones bivariantes o relaciones entre 2 variables.ü Pruebas paramétricas: comparación de medias (prueba t), correlación pearson

(r) y análisis de varianza (anova)ü Pruebas no paramétricas: comparación medias (Mann-Whitney), Correlación

Spearman (Tau Kendall), análisis de varianza (Kruskal Wallis) y Tablas decontingencia (Chi-cuadrado)

c) El Análisis Multivariante o Modelización. Analizar conjuntamente “n” o más de 2variables

à ver asesor estadístico del SPSS (en menú de ayuda)

Etapa 9: Análisis de Datos o uso de la Estadística

Modelos Multivariantes 38

En otras palabras…

La ESTADÍSTICA como un cuadro de herramientas o 3 niveles de análisis:

§ Nivel 1: DESCRIPTIVO-UNIVARIADO. Resumir e ilustrar lainformación contenida en una matriz de datos

§ Nivel 2: INFERENCIAL-BIVARIADO. Estimar parámetros, contrastarhipótesis, comparar el comportamiento de dos o más grupos o analizarla relación entre pares de variables

§ Nivel 3: MODELIZACIÓN-MULTIVARIANTE. Elaborar modelos,ecuaciones o funciones que permitan explicar unas variables a partirde otras o identificar variables latentes para resumir la información

Page 20: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

§ Presentación de los hallazgos de la investigación: Título, Resumen,Antecedentes y Objetivos, Metodología y Procedimiento (el proceso de lainvestigación, métodos y técnicas utilizadas…) así como la Discusión oConclusiones. Sin olvidarse de las referencias bibliográficas (oportunidadde replicación)

§ Los resultados deben integrarse en un marco teórico. Existe unatendencia a comunicar sólo los resultados que confirman la hipótesis

§ Código deontológico ESOMAR:. Antecedentes, Muestra (descripción universo, tamañomuestral, sustitución y distribución geográfica proyectada y conseguida, método deponderación, tasas de respuesta y posibles sesgos de la no respuesta, etc.), Recogida delos Datos (procedimiento del campo, personal, instrucciones, control de calidad,reclutamiento e incentivos, fecha, etc.) y Presentación de los Resultados (bases deporcentajes, margen error estadístico, medias significación de las diferencias, etc.)

Etapa 10: Redacción del Informe

Resumen etapas de una investigación mediante encuesta

Page 21: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Modelos Multivariantes 41

MATRICES

v Conjunto de números reales ordenados en filas y columnasv El lugar donde se recoge la información de una investigación

1......m

(Xij)

x11 x1n

xm1 xmn

Sujetos

Variables1 . . . . . . . . . . . . . . . .n

Alternativas de análisis bivariante según la naturaleza de las variables:

Ayuda o Guía para la toma de decisiones durante Análisis de los Datos (o uso de la Estadística)

NOMINAL ORDINAL MÉTRICA

NOMINAL Chi-cuadradoFisher (tablas 2x2)

Pruebas no -paramétricas Pruebas no-paramétricas

ORDINAL Chi-cuadradoFisher (tablas 2x2)

Existencia de Relación:Chi-cuadrado

Análisis de Correlación: Coeficiente de Spearman Coeficiente Tau de Kendall

Pruebas no-paramétricas

MÉTRICA Nominal dicotómica, la comparación de medias: la prueba t o Mann-Whitney

Nominal categórica: ANOVA o Kruskall-Wallis

Nominal como ficticia:Regresión

Análisis de Correlación:Pearson,

Si la métrica se transforma en Ordinal:Spearman, Tau de Kendall

Análisis de Correlación:Pearson

Pruebas paramétricas con muestras mayores de 50

Page 22: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariantes 43

1. Introducción2. El método científico

• Definición y características• Tres supuestos o principios• Marco conceptual para la investigación empírica

3. Importancia de lo Multivariante/ble• Qué es un Modelo

– Modelos Teóricos– Modelos Estadísticos

• Modelo Lineal4. Etapas de una investigación5. REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

• Qué son?• Razones de su expansión• Clasificación

6. Algunos ejemplos de Técnicas Multivariantes

Guión tema 1

Al finalizar este tema deberías de saber:

ü Qué técnica de análisis es la adecuada para responder a unadeterminada pregunta o hipótesis que te permita alcanzar losobjetivos de la investigación?

ü Dicho de otra manera, de QUÉ naturaleza deben ser lasvariables registradas para poder aplicar la Técnica Multivarianteelegida?

Análisis Multivariante 4444

La Complejidad de la conducta y de los fenómenos sociales en generalobliga a recoger gran cantidad de medidas. Se necesita una herramientaque ofrezca una visión conjunta e integrada de la realidad: El AnálisisMultivariante

– Surge como una forma de hacer comprensible una gran cantidad dedatos o MATRIZ que represente la realidad

– Útil porque permite descubrir estructuras, establecer relaciones entrevariables o contrastar hipótesis, reflejando los mecanismos que actúanpara determinar la conducta humana o el objeto de estudio

KENDALL en 1975: “una extensión del análisis univariable y bivariable alanálisis simultáneo de más de dos variables en un muestreo deobservaciones”

5. ANÁLISIS MULTIVARIANTE

Page 23: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 45

Sheth, 1968. Métodos estadísticos que se preocupan del análisis delas múltiples medidas que se han hecho sobre un cierto número deobjetos

Cuadras, 1991. Una rama de la estadística que estudia, interpreta yelabora el material estadístico sobre la base de un conjunto de n>2variables, que pueden ser de tipo cuantitativo, cualitativo o una mezclade ambos

Hair, 1998. Todos los métodos estadísticos que analizansimultáneamente medidas múltiples de cada individuo u objetosometido a investigación

5.1. DEFINICIÓN: Qué es?

Técnicas estadísticas que nos permiten analizar un conjuntode variables, así como poner a prueba distintos modelospara explicar las relaciones entre ellas

Análisis Multivariante 46

§ Necesidades de investigación. La complejidad de los fenómenos socialesrequiere un tratamiento de datos multidimensional

§ Desarrollo de la informática y los ordenadores. Posibilidad de realizar cálculoscomplejos en pocos segundos

§ Utilidad en numerosos campos: Marketing, Comportamiento, Economía,Meteorología, Biología, etc.

§ Proliferación de la investigación de mercados y los estudios de opinión. Elinternet de las cosas (Big Data)

§ Abundante bibliografía aplicada (artículos, manuales y series monográficas)

5.2. RAZONES DE LA EXPANSIÓN

Page 24: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

47

En función de los objetivos de la investigación:

a. Descriptivos: Acercamiento a la realidad sin hipótesis previas. Todas lasvariables tienen el mismo status, unas no dependen de las otras

§ Su objetivo puede ser REDUCIR la dimensionalidad de la matriz obteniendo unnúmero menor de VARIABLES no observables o factores (ej. Análisis Factorial)

§ Se usa para CLASIFICAR los SUJETOS en grupos homogéneos (ej. An.Cluster)

b. Explicativos o Predictivos. Su fin es explicar la realidad. Ayudan a comprendery explicar un fenómeno. Se parte de una situación a predecir (VD) y de un grupode variables intervinientes o criterio (VI), cuya influencia se desea mantener bajocontrol y observar su efecto (ej. Regresión Múltiple)

Técnicas de Independencia y Dependencia (Sheth, 1971)

5.3. CLASIFICACIÓN

48

§ Se acercan a la realidad sin hipótesisespecíficas y tratan de describir la realidadagrupando la información relevante: TécnicasDescriptivas o Reductivas

§ Análisis Factorial, Análisis deConglomerados, EscalamientoMultidimensional

§ Detectan las relaciones de dependenciaentre una (o varias) V.D y una (o varias) V.I.elaborando una hipótesis que se intentavalidar empíricamente: Técnicas Explicativaso Predictivas

§ Análisis de Regresión, Medición Conjunta,Análisis Discriminante, Análisis deVarianza

Clasificación de las técnicas Multivariantes según la relación entre las variables (Sheth, 1971)

¿Algunas de las variables son

dependientes de otras?

NO SÍ

Reciben el nombre de Técnicas de

Interdependencia

Reciben el nombre de Técnicas de Dependencia

… Una u otra técnica en función de la escala de medida de cada variable. Variables cuantitativas(métricas) y cualitativos (no-métricas). ¿Cuáles son las propiedades de los datos?

Page 25: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Modelos Multivariantes 49

4. Análisis Conjunto

Modelos Multivariantes 50

Hay que ser capaz de reproducirlo sin mirar !!!

Page 26: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Modelos Multivariantes 51

6. Algunos ejemplos de Técnicas Multivariantes….

- Análisis Factorial de Componentes Principales

- Análisis de Correspondencias

- Regresión Lineal Múltiple

- Análisis Discriminante

- Regresión No Lineal o Logística

- Análisis Conjunto

Page 27: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

53

§ Análisis Factorial de Componentes Principales

§ Análisis de Correspondencias§ Análisis de Conglomerados

§ Escalamiento Multidimensional

§ Análisis de Regresión Lineal Múltiple

§ Análisis Discriminante§ Regresión No Lineal o Logística

§ Análisis Conjunto

¿Algunas de las variables son dependientes de

otras?

NO SÍ

Reciben el nombre de Técnicas de

Interdependencia

Reciben el nombre de Técnicas de Dependencia

6. Algunos ejemplos de Técnicas Multivariantes….

Análisis Multivariante 54

OBJETIVO: Reducción de variables (métricas). A partir de la relación entrevariables observadas identificar un número menor de variables latentes oFACTORES que resultan después de eliminar las redundancias existentes entreel conjunto inicial de variables observadas

EJEMPLO: Agrupar ítems de una escala y etiquetarlos bajo una mismadimensión o factor de evaluación

CONDICIÓN: Variables cuantitativas

§ Exploratorio (AFE): Componentes Principales§ Confirmatorio (AFC): LISREL, AMOS

ANÁLISIS FACTORIAL DE COMPONENTES PRINCIPALES

Page 28: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

55

Ejemplo de cómo desarrollar un Producto: “una espuma de afeitar”

§ Conocemos la formulación química del Producto pero NO las características que valora elconsumidor, ni tampoco cómo las estructura o agrupa (Mapa Perceptual).

§ Este tipo de estudios empíricos son fundamental para orientar, con un briefring, el trabajo de lostécnicos de laboratorio de manera que hagan corresponder su fórmula o características físicas conlas necesidades del consumidor

§ A partir de un cualitativo identificamos 20 VARIABLES a tener en cuenta (Cuestionario de 20 ítems)

Le rogamos indique sus preferencias marcando el valor 1 si no está NADA DE ACUERDO y 5 si está TOTALMENTE DE ACUERDO, con las siguientes afirmaciones:

1. La espuma debe de crecer en la mano al salir del bote2. La espuma debe adherirse a la piel de la cara al ponerla con la mano3. La espuma debe salir toda del bote4. La espuma no debe irse sola de la cara5. La cuchilla debe deslizarse con facilidad6. Al aclarar la cuchilla la espuma debe de salir bien y tb. del lavabo7. La piel debe quedar suave al limpiarse la espuma después del afeitado8. La espuma me gusta de color blanco9. La espuma me gusta de color blanco azulado10. La espuma me gusta de color blanca con sombras verdes11. La espuma me gusta cremosa12. La espuma me gusta ligera13. La espuma me gusta hueca14. La espuma me gusta fluida15. La espuma me gusta que sea seca16. La espuma me gusta que moje la piel17. La espuma me gusta que deje perfume al aclararme la cara18. La espuma me gusta que quede sin olor19. La espuma me gusta que refresque20. No me importaría pagar un porcentaje más del precio actual si la espuma fuese cicatrizante

MATRIZ Xn20

Sujeto X1 X2 X3 ….................X201 2 4 5 42 1 3 5 33 …..........

n 2 4 3 5

Análisis Multivariante 56

MATRIZ DE CORRELACIONES ENTRE VARIABLES (20 X 20)

ANÁLISIS FACTORIAL DE COMPONENTES PRINCIPALES, APLICADO AL DESARROLLO DE COSMÉTICOS

Matriz de Correlaciones entre Variables X20 x X20

X1 X2 X3 X4……….. ……………….. X20X1 1.0000X2 .23 1.0000X3X45678910111213141516171819X20 -.43 1.0000

Kaiser-Meyer-Olkin Measure of Sampling Adequacy: 0.123

Bartlet Test Sphericity: 265,931, Significance: 0.00023

Page 29: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 57

EXTRACCIÓN DE FACTORES (13 VARIABLES X 5 FACTORES)

Perfumado y seco

Comportamiento: espuma fluida y hueca con limpieza lavabo

Cosmético: piel suave y cremosidad

Aspecto físico espuma: color blanco y crecimiento

ESTOS 5 FACTORES, TAMBIÉN PODRÍAN SER INTERPRETADOS COMO “MOTIVADORES”. Se trata de ejes o atributos que estructuran la percepción del mercado y, por lo tanto, que el producto debería de poseer para aproximarnos a la espuma de afeitar ideal, desde el punto de vista del mercado.

Uso: adherencia piel, permanencia

Análisis Multivariante 58

ANÁLISIS DE CORRESPONDENCIASOBJETIVO: Reducción de variables (no métricas). A partir de la relación entrevariables observadas identificar DIMENSIONES o variables latentes. Profundizaen las relaciones que se establecen entre dos o más variables categóricas

EJEMPLO: A partir de un conjunto de características identificar las dimensionessubyacentes y representarlas en un Mapa Perceptual de Imagen yPosicionamiento

CONDICIÓN: Variables cualitativas. SIMPLE (entre las categorías de dosvariables) o MÚLTIPLE (más de dos variables)

§ Un subtipo de Análisis Factorial, ideal para datos de asociación (recogida dedatos muy fácil y rápida) (ver siguiente ejemplo)

§ Muy utilizado en Ciencias Sociales y de la Salud

Page 30: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 59

Ejemplo de Datos de Asociación para conocer con qué características se asocian las diferentes Marcas. Estudios para conocer la Personalidad de las Marcas

Mo-derna

Ami-gable

Soli-daria

Juvenil Interna-cional

Ele-gante

Con-Fiable

Crea-Tiva

Econó-Mica

Diver-Tida

Clásica Dife-rente

Levi´s

Lois

Benetton

Zara

Opel

Volkswagen

Seat

Audi

Coca-Cola

Kas

Pepsi Cola

La Casera

Mo-derna

Ami-gable

Soli-daria

Juvenil Interna-cional

Ele-gante

Con-Fiable

Crea-Tiva

Econó-Mica

Diver-Tida

Clásica Dife-rente

Yo

A continuación, ¿Qué principales características asocias a tu persona ? Dando lugar a una Matriz de orden: (13 Marcas x 12 Características)

60

MATRIZ DE ENTRADA: Datos de Asociación entre Marcas x Adjetivos

TABLA DE CONTINGENCIA. NÚMERO DE ASOCIACIONES REGISTRADAS ENTRE LAS DIFERENTES MARCAS i Y LOS ATRIBUTOS j (Matriz orden 13x12)

---Análisis Factorial de Correspondencias---

Mo-derna

Ami-gable

Soli-daria

Juvenil Interna-cional

Ele-gante

Con-Fiable

Crea-Tiva

Econó-Mica

Diver-Tida

Clásica Dife-rente

Levi´s 56 13 4 51 74 8 31 26 0 10 20 13

Lois 31 9 5 58 17 4 11 17 18 21 13 21

Benetton 35 25 59 31 61 21 9 38 10 17 13 25

Zara 52 23 6 45 29 30 16 18 65 12 15 5

Opel 12 4 3 14 40 23 23 8 29 2 25 3

Volkswagen 27 1 5 15 56 29 47 21 9 4 24 9

Seat 18 19 4 27 22 8 19 16 50 12 22 6

Audi 35 0 2 6 56 64 55 16 3 1 44 12

Coca-Cola 32 41 23 50 81 7 19 35 19 31 35 16

Kas 19 25 12 36 10 1 9 16 32 23 13 14

Pepsi Cola 31 19 25 38 49 3 11 13 26 21 13 22

La Casera 3 19 7 5 3 1 16 9 37 9 53 28

Yo 44 59 28 55 20 24 37 30 33 49 19 28

Page 31: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

61

Análisis Factorial de Correspondencias.REPRESENTACIÓN CONJUNTA DE MARCAS Y CARACTERÍSTICAS

62

MAPAS DE POSICIONAMIENTO: para conocer la posición que ocupan en la mente del consumidor

• Marquemos el lugar donde estamos: Posicionamiento actual

• Marquemos el lugar donde nos gustaría estar: Posicionamiento deseado

• ¿Qué tenemos que hacer para llegar hasta el lugar deseado?: Una Estrategia de Marketing

• Modificar las características del producto (product)

• Cambiar la comunicación (promotion)

• Cambiar la distribución (place)

• Tocar el precio (price)

Page 32: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

63

MAPAS DE POSICIONAMIENTO: para conocer la posición que ocupan en la mente del consumidor

• Dónde colocarías a…..

Análisis Multivariante 64

OBJETIVO: Identificar grupos homogéneos de sujetos u objetos a partir de supuntuación en una serie de variables. Estos grupos, a su vez, deben de ser muydiferentes entre sí. Alta homogeneidad interna y elevada heterogeneidad entrelos grupos

EJEMPLO: identificar segmentos de jóvenes en función de sus hábitos deconsumo. Es decir, permite clasificar una población en el menor número posiblede grupos mutuamente exclusivos y exhaustivos, basándose en la similitudentre los casos

CONDICIÓN: Variables medidas en la misma escala

§ También llamado Cluster Analysis§ Técnica de Clasificación§ Los grupos no son conocidos a priori

ANÁLISIS DE CONGLOMERADOS (cluster)

Page 33: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 65

OBJETIVO: Utilizar las proximidades entre objetos para realizar unarepresentación espacial de los mismos, identificando las dimensionessubyacentes

EJEMPLO: Representación espacial de las similitudes entre las distintasmarcas de cerveza en Galicia, con el fin de conocer el posicionamientorelativo de cada una de ellas

CONDICIÓN: Gran versatilidad en la recogida de datos (distintos tipos detareas)

§ Gran Utilidad en MKT e investigación social§ Transforma los juicios de los consumidores, respecto a similitudes o

preferencias, en distancias representadas en un espaciomultidimensional

ESCALAMIENTO MULTIDIMENSIONAL

66

§ Análisis Factorial de Componentes Principales

§ Análisis de Correspondencias§ Análisis de Conglomerados

§ Escalamiento Multidimensional

§ Análisis de Regresión Lineal Múltiple

§ Análisis Discriminante§ Regresión No Lineal o Logística

§ Análisis Conjunto

¿Algunas de las variables son dependientes de

otras?

NO SÍ

Reciben el nombre de Técnicas de

Interdependencia

Reciben el nombre de Técnicas de Dependencia

Algunos ejemplos de Técnicas Multivariantes….

Page 34: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

67

OBJETIVO: Explicar o predecir una Variable Criterio (VD) a partir deuna o varias Variables Predictoras (VI)

Y’ = a + b1X1 + b2X2+…+ bnXn

(métrica) (…..métricas….)EJEMPLO:§ Predecir la audiencia de un canal de T.V. (Y) en función de la inversión en

publicidad en Euros (X1), minutos de emisión deportiva (X2), minutos deinformativos (X3), etc.

§ Si para 20 pizzerías conocemos varias VI, tales como el precio de la “pizzafamiliar” y el esfuerzo de publicidad mediante “reparto de buzoneo durante lasemana”, queremos explicar y conocer la VD o su “posible influencia en elincremento de las ventas”

CONDICIÓN: Predictores y Criterio cuantitativos§ Simple o Múltiple§ Caso especial: predictores categóricos (Regresión con variables

ficticias: DUMMY)

REGRESIÓN LINEAL MÚLTIPLE

Análisis Multivariante 68

Las relaciones entre un conjunto de variables con el objeto deentender su covariación

• Tratando de conocer la influencia que una serie de V.I. ejercensobre la V.D.

Busca predecir los cambios en la V.D. cuantitativa en función delos cambios en varias V.I. Cuantitativas

• Esta relación no implica que una sea causa de otras. Loscoeficientes calculados sólo aportan información sobre elgrado en que varias variables covarían o están asociadas.

En el Análisis de Regresión se estudian…

Page 35: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 69

1. Comprender los determinantes de la esperanza de vida de las mujeres endiferentes países:

a. Qué variables influyen en la esperanza de vida, cuáles no y, de las que influyencuáles son importantes estimando su peso diferencialPor ejemplo:

ü V.D. : Esperanza de vida de la mujerü V.I.:

§Porcentaje de población que vive en áreas urbanas§Número de médicos por cada 10.000 habitantes§Número de camas hospitalarias por cada 10.000 habitantes§Producto interior bruto per cápita en euros§Aparatos de radio por cada 100 habitantes

2. Predecir el gasto en cine de una persona a partir de sus ingresos, numero de hijos,años de estudios, etc.

Otros ejemplos …

70

OBJETIVO: Identificar funciones discriminantes capaces de separar dos o másgrupos de individuos según sus puntuaciones en una serie de variables.

v Qué V.I. discriminan a los sujetos de los diferentes grupos establecidos apriori en la V.D. Es una Técnica de clasificación.

Regresión Lineal: métrica … ___________ métricas__________________

Y = X1 + X2 + X3 + ... + Xk

(no métrica) (…métricas…)categórica cuantitativa

Obtener una función discriminante del tipo:Zjk = a + W1X1+ W2X2 + ... + WkXk

EJEMPLO de Variables Dependientes no-métricas:§ Predecir el voto (partido) a partir de los ingresos económicos, la edad…§ Comprender si un niño puede desarrollar un cuadro depresivo o no§ Estimar si un nuevo producto tendrá éxito en el mercado considerando la inversión

en publicidad, precio, ….

ANÁLISIS DISCRIMINANTE

Page 36: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 71

EJEMPLO: Analizar la morosidad en las entidades bancarias determinandoel nivel de riesgo en el comportamiento de pago de los clientes,identificando clientes solventes de aquellos otros que pueden sermorosos

V.D.: ser solvente o ser moroso Yi

V.I.:§ Variables relativas a la operación: X1 importe solicitado, X2 duración o plazo, X3

cantidad adelantada a final de año, X4 número de operaciones activas, X5 impagosprevios en otros productos

§ Variables del perfil del solicitante: X6 edad, X7 cuotas mensuales, X8 antigüedad enel trabajo

ANÁLISIS DISCRIMINANTE

1. La V.D. si tiene dos categorías es Simple, más de dos: Múltiple2. Las V.Is. o Predictoras deben ser cuantitativas o métricas

Análisis Multivariante 72

OBJETIVO: Pronosticar la pertenencia de los sujetos a un grupo de la VD nométrica o categórica, a partir de sus puntuaciones en una serie de variablespredictoras o VI (métricas o no métricas). Estimar la probabilidad de que seproduzca un evento.

EJEMPLO: Predecir si un alumno va a aprobar o no, en función de las horasde estudio X1, frecuencia de asistencia a clase X2, estatus socioeconómico X3

Y = X1 + X2 + X3 + ... + Xn(no-métrica) (…métricas o no-métricas…)

CONDICIÓN:§ VD categórica. Debe poseer dos categorías (0,1)§ VI o explicativas no tienen restricción. Pueden ser cuantitativas

(continuas o discretas) y categóricas (con 2 o más modalidades)

REGRESIÓN LOGÍSTICA

Page 37: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 7373

Caso particular de la Regresión Múltiple en el que la V.D. es cualitativa(no-métrica), y las V.I. pueden ser cuantitativas o cualitativas (no-métricas)

Ventaja de esta técnica: tiene pocas restricciones sobre la distribución delas V.I., estando más libre de supuestos restrictivos que la RegresiónMúltiple y el Análisis Discriminante

El principal objetivo es la predicción… pero ahora la V.D. es discreta (0,1).Y la interpretación es en términos de probabilidad

Es útil cuando queremos saber si ciertas características psico-sociodemográficas (estado civil, ingresos, nacionalismo, creenciasreligiosas, nivel de estudios, etc.) contribuyen a que sea más probableque un individuo compre un determinado coche, sea diagnosticado conuna depresión, tenga fracaso escolar, etc.

Análisis Multivariante 74

OBJETIVO: Entender cómo conforman los individuos sus preferencias hacia losobjetos o estímulos, estimando la importancia relativa que le conceden a cada unode los atributos o características de éste

Y = X1 + X2 + X3 + ... + Xn(no métrica) (…Categóricas. Atributos con niveles…)

ordinal - preferencias

Ø CONDICIÓN: VD ordinal y VI categórica (atributos)

§ Muy utilizado en Ciencias Sociales (diseño de nuevos productos, test de envases,elasticidad del precio, Identificación del producto ideal, segmentación de mercados,simulaciones, investigar el triaje en un Servicios de Urgencias)

§ EJEMPLO:ü Explicar las preferencias de las amas de casa hacia las diferentes

opciones de LECHE envasada (envase, marca, tapón, precio,procedencia….)

ANÁLISIS CONJUNTO

Page 38: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 7575

EJEMPLO desarrollo de un nuevo modelo de automóvil:

§ Dudamos entre tres niveles de potencia (60cv, 100cv, 125cv)… (3 niveles)§ Una carrocería de tres o cinco puertas… (2 niveles)§ Instalación de una serie de extras en el modelo más bajo de gama.. (2)§ Tipo de motor (eléctrico, híbrido) (2)§ Tres precios distintos…(3)

TAREA EXPERIMENTAL: Se solicita la opinión de un grupo de consumidores quedeberán de valorar 72 productos resultantes de la combinación de suscaracterísticas objeto de análisis (3x2x2x2x3)

RESULTADOS: El investigador es capaz de descubrir y estimar la importancia detodos los atributos y sus respectivos niveles, a pesar de que en la tareaexperimental, los usuarios valoran únicamente los perfiles completos de unospocos productos globalmente percibidos

7676

El principio básico consiste en descomponer PREFERENCIAS manifestadas sobre losProductos Globales o perfiles completos, en UTILIDADES o IMPORTANCIAS poratributo (y nivel)

Ø Las Fases para llevar a cabo un Análisis Conjunto son:

1) Identificación y Selección de los atributos relevantes para esa categoría deproducto o servicio (Focus group). Ej. Para una botella de agua podemos definirel diseño y color del envase, el tapón, el precio, la marca, el material…

2) Definición de niveles u opciones para cada atributo. Para el atributo tapónpodemos pensar en rosca, click, ….

3) Construcción de los Perfiles Completos a partir de la combinación óptima deniveles de atributos para que puedan ser valorados empíricamente (preferencias)

4) Estimación de las utilidades e importancias mediante el algoritmo CONJOINT delSPSS, y así conocer el producto ideal que maximiza la preferencia de losconsumidores. También previsión de la demanda

Y CÓMO SE HACE…?

Page 39: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 77

OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre unevento, el RIESGO de…

EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de pacientesde una determinada patología en función del tratamiento recibido, edad, etc.

CONDICIÓN (3 variables diferentes):

üDE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa)üDE CENSURA: Si ha ocurrido o no el evento (dicotómica)üEXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, …)

ANÁLISIS DE SUPERVIVENCIA

Análisis Multivariante 78

OBJETIVO: Determinar e qué medida una VD está influenciada por una o varias VI.Comprobar si existe un efecto significativo de un “Tratamiento”

EJEMPLO: Comprobar si existe un efecto significativo del consumo de alcoholsobre el rendimiento atencional

CONDICIÓN: VI categórica (factores) y VD cuantitativa

§ Ideal para los diseños experimentales y cuasiexperimentales§ Una o varias VÍAS (VI): ONEWAY ó ANOVA (Diseños de dos o más factores)

MANOVA para múltiples VD. (Análisis Multivariante de la Varianza)

ANÁLISIS DE VARIANZA

Page 40: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 79

Y’= a + b1X1 + b2X2 +…+ bnXn

Regresión Lineal Múltiple V.D.: métrica-cuantitativaV.I.: métricas-cuantitativas

Análisis Discriminante V.D.: no métrica-cualitativaV.I.: métricas-cuantitativas

Regresión Logística V.D.: no métrica-cualitativa. Categórica 0, 1V.I.: sin restricciones. Cuali o Cuantitativas

Análisis Conjunto V.D.: no-métrica. Ordinal de preferenciaV.I.: métricas o no-métricas. Atributos

Análisis de Supervivencia V.D.: variable respuesta o tiempo transcurridovariable censura: si ocurrió o no el evento

V.I.: sin restricciones. Cuali o CuantitativasAnálisis de Varianza V.D.: métrica-cuantitativa

V.I.: no-métricas. Cualitativa categórica (factores)

Análisis Multivariante 80

PELIGROS:§ Fácil estimación y difícil interpretación§ Incluir demasiadas variables (vs. parsimonia)§ Olvido de la teoría (modelizar por modelizar)

PROBLEMAS:§ Incumplimiento de Supuestos§ Requiere un tamaño muestral elevado§ Casos anómalos§ Relevancia conceptual y significación estadística

ANÁLISIS MULTIVARIANTE

Page 41: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

Análisis Multivariante 81

Modelización de datos estructurados. Gestión de Bases de datos

Todo tiende a estar interconectado proporcionando datos

82

Page 42: tema 1 pdf 2017-18TEMA 1 CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES Análisis Multivariante Análisis Multivariantes 4 1.Introducción 2.Elmétodocientífico

BIG DATA, para su análisis y comprensión

83Big Data, qué es?

https://www.slideshare.net/pisitoenmadrid/introduccin-al-big-data