Escalamiento Multidimensional

  • View
    257

  • Download
    0

Embed Size (px)

DESCRIPTION

matematicas

Text of Escalamiento Multidimensional

  • 1ESCALAMIENTO MULTIDIMENSIONAL

    1. INTRODUCCIN.

    El escalamiento multidimensional, ms conocido como MultiDimensional Scaling (MDS),tiene sus orgenes a principios de siglo XX en el campo de la Psicologa. Surge cuando sepretenda estudiar la relacin que exista entre la intensidad fsica de ciertos estmulos consu intensidad subjetiva.

    El MDS es una tcnica de representacin espacial que trata de visualizar sobre un mapa unconjunto de estmulos (firmas, productos, candidatos polticos, ideas u otros artculos) cuyaposicin relativa se desea analizar. El propsito del MDS es transformar los juicios desimilitud o preferencia llevados a cabo por una serie de individuos sobre un conjunto deobjetos o estmulos en distancias susceptibles de ser representadas en un espaciomultidimensional. El MDS est basado en la comparacin de objetos o de estmulos, deforma que si un individuo juzga a los objetos A y B como los ms similares entonces lastcnicas de MDS colocarn a los objetos A y B en el grfico de forma que la distancia entreellos sea ms pequea que la distancia entre cualquier otro par de objetos.

    As, por ejemplo, imaginemos que estamos interesados en conocer las preferencias de unamuestra de consumidores por cinco productos de limpieza que llamaremos A, B, C, D y E.Un modelo de escalamiento unidimensional nos proporcionara una escala sobre la quesituar estos cinco productos, de tal modo que sus posiciones sobre la misma representaranuna medida de preferencia que suscitan en los consumidores:

    A C B E D

  • 2El escalamiento unidimensional ha situado los cinco productos de limpieza sobre una escalaque va de izquierda (menos preferido) a derecha (ms preferido). La informacin que nosproporciona esta escala es muy importante para la valoracin de los cinco productos. As,vemos que el producto A es el menos preferido por los consumidores, seguido, a bastantedistancia por el producto C. Por su parte, el producto B se encuentra en una posicinintermedia de preferencia. Finalmente, los productos E y D son los ms preferidos, aunqueel producto D muestra una ligera ventaja sobre el E.

    Si analizamos los factores que utilizan los consumidores para evaluar los productos delimpieza (eficacia y precio), la representacin que obtenemos es bastante distinta de lainicial. Ahora los productos estn representados simultneamente sobre dos escalas: elgrado de eficacia y el precio. Si atendemos a la eficacia, A y B son los ms ineficaces,mientras que C y D tienen un grado alto de eficacia, siendo E el ms eficaz de todos. Porprecios, A y C son los productos ms caros, mientras que B y E tienen un precio similar yms barato que los dos anteriores, siendo D el mejor en esta caracterstica.

    La posibilidad de tener en cuenta ms de una dimensin supone un avance de capitalimportancia para la teora del escalamiento. En definitiva, el MDS es una tcnica

    A C

    D

    E

    Caro

    Barato

    Ineficaz Eficaz

    B

  • 3multivariante que crea un grfico aproximado a partir de las similitudes o preferencias deun conjunto de objetos.

    En la actualidad, el MDS puede ser apto para gran cantidad de tipos diferentes de datos deentrada (tablas de contingencia, matrices de proximidad, datos de perfil, correlaciones,etc.).

    El MDS puede ayudar a determinar:

    qu dimensiones utilizan los encuestados a la hora de evaluar a los objetos. cuntas dimensiones utilizan.

    la importancia relativa de cada dimensin.

    cmo se relacionan perceptualmente los objetos.

    Existen otras tcnicas multivariantes, como son el anlisis factorial y el anlisis cluster, que

    persiguen objetivos muy similares al MDS pero que difieren en una serie de aspectos. Sinembargo, la utilizacin de alguna de estas tcnicas no supone que no se pueda utilizar elescalamiento multidimensional, sino que esta ltima tcnica puede servir como alternativao bien como complemento a las otras tcnicas multivariantes.

    2. EL MODELO GENERAL DE ESCALAMIENTOMULTIDIMENSIONAL.

    Los datos que se utilizan como entrada para los anlisis MDS son las proximidades ( ij )existentes entre los objetos, tal y como han sido juzgadas por un sujeto o por una muestrade sujetos. El MDS representa estas proximidades de forma que aparezcan como distancias( ijd ) entre los objetos en un espacio de varias dimensiones. La relacin entre proximidadesy distancias se establece mediante una transformacin o funcin de representacin (f), quepermite obtener la distancia ( ijd ) a partir de la proximidad ( ij ).

    ( )ijij fd

  • 4Las proximidades pueden representarse a partir de la matriz cuadrada de n x n donde n

    es el nmero de objetos. As, cada elemento ij de la matriz representa la proximidadentre el objeto i y el objeto j. La matriz ser una matriz simtrica, esto es, jiij = .

    =

    nnnn

    n

    n

    21

    22221

    11211

    No obstante, esta matriz de proximidades es de difcil interpretacin, por lo que a travs del

    anlisis MDS transformamos los datos que sta nos proporciona en otra matriz1 nxmX ,

    donde n, al igual que antes, es el nmero de objetos, mientras que m es el nmero dedimensiones en el que se evala cada uno de los objetos. As, cada valor ijx representa lacoordenada del objeto i en la dimensin j.

    =

    nmnn

    m

    m

    xxx

    xxx

    xxx

    X

    21

    22221

    11211

    A partir de esta matriz X es posible calcular la distancia existente entre dos objetoscualesquiera i y j, simplemente aplicando la frmula general de la distancia:

    ( ) pma

    pjaiaij xxd

    1

    1

    =

    =

    donde ijd es la distancia entre los estmulos i y j, iax y jax son, respectivamente, lascoordenadas de los estmulos i y j en la dimensin a-sima, y p es un valor que puede

    1 Ms adelante veremos el procedimiento para obtener esta matriz.

  • 5oscilar entre 1 e infinito (para el caso de la distancia eucldea, p valdr 2). A partir de estasdistancias dij construimos la matriz cuadrada de distancias D entre n estmulos:

    =

    nnnn

    n

    n

    ddd

    dddddd

    D

    21

    22221

    11211

    La matriz de distancias D as obtenidas a partir de la matriz X, ser similar a la de

    proximidades . Tambin ser una matriz simtrica. De hecho, la solucin proporcionada

    por el anlisis MDS debe ser tal que haya la mxima correspondencia entre la matriz de

    proximidades de partida y la matriz de distancias obtenidas D. Existen varias medidas

    que nos informan sobre la bondad del modelo MDS.

    3. OBTENCIN DE DATOS DE PROXIMIDAD

    Las proximidades son estimaciones del grado de parecido o diferencias entre los distintospares de los n objetos considerados en el anlisis MDS. Existen diversas maneras degenerar estos valores, aunque las dos maneras tpicas son

    (1) preguntar a los sujetos acerca de la proximidad (similaridad) entre todos los paresde objetos

    (2) pedir a los sujetos que clasifiquen los objetos sobre la base de descriptores talescomo adjetivos.

    De la primera manera se obtienen las llamadas similaridades directas, mientras que de lasegunda manera se tienen las similaridades derivadas.

  • 6Similaridades directas

    El trmino similaridad directa se refiere al caso en el que a los sujetos se les presentan paresde objetos y se les pide que emitan un juicio de su similaridad (proximidad). Los juicios desimilaridad se pueden obtener de maneras muy diferentes:

    - Hacer una marca sobre una recta.- Estimacin de la magnitud directa.- Colocar o clasificar.

    - Ordenar parejas.- Ternas.

    - Determinar el orden de los rangos.

    Ntese que la dificultad de la recoleccin de datos de similaridad est determinada por elnmero de objetos considerados. Si el nmero de objetos es grande, el nmero decomparaciones ser todava ms grande. Aunque para evitar tener que recoger un nmerodemasiado grande de juicios se pudiera limitar el nmero de objetos, es deseable incluirtantos objetos como prcticamente sea posible. El uso de un nmero muy pequeo deobjetos hace que las soluciones en pocas dimensiones sean inestables. Algunos autoresrecomiendan tener de 9 a 12 objetos para soluciones bidimensionales y de 13 a 18 objetospara soluciones tridimensionales.

    Similaridades derivadas

    En este caso los datos de similaridades se construyen o derivan de los rangos que lossujetos dan a cada objeto segn un conjunto de descriptores verbales (por ejemplo,adjetivos). Hay que sealar que los descriptores verbales son altamente subjetivos ytambin, a menudo, conceptualmente incompletos, puesto que es bastante improbable quetodas las dimensiones relevantes contenidas en las diferencias entre los estmulos puedanlograrse usando adjetivos que las describan.

  • 7Tpicamente, se le pide a cada sujeto que indique la magnitud en que cada adjetivo describeel objeto que est siendo evaluado, asignando, digamos un nmero entre 1 (describe elobjeto muy bien) y 100 (no describe en nada el objeto). Por ejemplo, se pudieran usar lassiguientes frases adjetivas para evaluar marcas de caf: sabor fuerte, para personassociables, imprescindible despus de comer, bajo en cafena, un lindo envase, etc.

    El uso de datos de adjetivos con rangos supone que el conjunto de frases adjetivasseleccionadas brinda conceptualmente una lista completa de descriptores verbales que danrazn de las principales causas de las diferencias entre estmulos. Una prcticarecomendada es hacer entrevistas, previas al experimento, a grupos de personas tpicas paraidentificar las dimensiones importantes de la comparacin.

    Una variante del mtodo anterior, conocida con el nombre de bipolar, es pedirle al sujetoque le ponga un valor, generalmente en una escala de -10 a 10, a cada estmulo conrespecto a un nmero de atributos. Esto resulta en un arreglo de tres entradas de los datos:estmulo, atributo y sujeto y tien