Definición de grupos: clasificación

  • View
    42

  • Download
    8

Embed Size (px)

DESCRIPTION

Definición de grupos: clasificación. Capítulos 10 y 11 de McCune y Grace 2002. Clasificar. Proceso natural humano para interpretar el mundo Pero estamos acostumbrados a sólo observar pocas dimensiones - PowerPoint PPT Presentation

Text of Definición de grupos: clasificación

  • Definicin de grupos: clasificacinCaptulos 10 y 11 de McCune y Grace 2002

  • Clasificar Proceso natural humano para interpretar el mundoPero estamos acostumbrados a slo observar pocas dimensionesMs complejo cuando intentamos clasificar objetos de muchas dimensiones como los datos de composicin

  • Opciones generalesClasificacin jerrquica o no-jerrquicaClasificacin polittica o monotticaClasificacin aglomerativa o divisiva

  • Clasificacin jerrquica aglomerativaPasos:Calcular la matriz de distancias (o similaridades)Unir 2 elementos de acuerdo a algn criterio de distancia mnimaCombinar los atributos de las entidades en ambos gruposUnir los prximos 2 grupos, etc.Los resultados se pueden presentar en un dendrograma

  • EjemploMtodo de enlace sencillo (o de vecino ms cercano)

  • Matriz de similaridades

  • Subgrfica conectada

  • Dendrograma

  • Dendrogramas

  • Dendrogramas La escala en el dendrograma se puede expresar por:Similaridad segn la medida utilizada

    Funcin objetiva:

    % de informacin restante:

  • Dnde podar el dendrograma?Los criterios dependen de los objetivosHomogeneidad dentro de gruposNmero de grupos vs nmero de elementosPocos grupos pueden ser muy heterogneosMuchos grupos derrotan el propsito de clasificar

  • Tres mtodos de enlace recomendados para datos de comunidadesUPGMA, Ward y Beta flexible

  • UPGMA: Unweighted Pair-Group Mathematical Average

  • UPGMA

  • Enlace sencillo vs. UPGMA

  • Mtodo de Ward

  • Mtodo de Ward

  • Mtodo de Beta flexible

  • UPGMA, Ward o Beta flexible?UPGMA:Bastante conservador de espacioPero tiende al encadenamientoWard:Conservador de espacioPero incompatible con distancias por proporcin Beta flexible:Encadenamiento es alto cuando beta se acerca a +1Contrae el espacio cuando beta se acerca a -1Resultados ms aceptables cuando beta ~ -0.25

  • Ventajas y desventajas de clasificacin jerrquica aglomerativaEl resultado en multiniveles puede sugerir relaciones entre gruposPuede haber agrupaciones incorrectas porque las fusiones subsiguientes dependern de las anteriores.Para datos bien heterogneos puede ser conveniente subdividir en grupos ms manejables y luego analizar con ordenaciones.

  • Mtodos no jerrquicosEste tipo de clasificacin asigna las unidades en un nmero de grupos que uno decida inicialmente.Bien til cuando el conjunto de datos es bien grande.

  • Evaluacin de la calidad de la clasificacinGrado de encadenamiento Interpretabilidad Comparacin con algn atributo independiente

  • Grado de encadenamiento

  • Interpretabilidad Hace sentido el dendrograma?Son los grupos el resultado de algn proceso biolgico interesante?

  • Comparar con atributo independienteSon los miembros de un grupo similares segn los valores de alguna variable (no incluida en los datos analizados) pero distintos en esa variable a los miembros de otros grupos?

  • Qu informar?Medida de distancia utilizadaMtodo de enlazarSi se buscaron elementos clasificados errneamente, cmo se hizo y cmo se corrigieron.Dendrograma y cul medida se utiliz en la escalaCriterios para podar el dendrograma (mencionar la cantidad de informacin retenida a ese nivel).

  • EjercicioGenerar una clasificacin manualmente por enlace sencillo con los datos de Oak_t_6x5rComparar con UPGMA, Ward y Beta flexible