Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
Análisis de la variación intraespecífica
Análisis mulitvariado Técnicas de Agrupamientos Método del ligamiento promedio no ponderado
(UPGMA: Unweighted pair group method)
Técnicas de ordenación Análisis de Componentes principales Análisis de Coordenadas principales
Morfometría geométrica
Análisis multivariado
-Las técnicas multivariadas permiten establecer relaciones de similitud global (o fenéticas) entre unidades de estudio, sobre la base de la evidencia que brindan sus caracteres -A partir de los resultados de estas técnicas (e.g. un fenograma), el especialista podrá adoptar decisiones taxonómicas con respecto a las especies y las variaciones infraespecíficas.
Pasos de Aplicación de Técnicas de Agrupamientos: construcción de fenogramas
Elección de las OTU a estudiar Selección y registro de caracteres Construcción de una matriz de datos de OTU por caracteres. Cálculo de un coeficiente de similitud (o disimilitud) entre cada
par posible de OTU Construcción de una matriz de similitud (o disimilitud) entre
OTU Obtención del fenograma entre OTU Medida de la distorsión del fenograma Descripción del fenograma e interpretación de resultados
-Elección de OTU (Operational Taxonomic Units)
-Selección y registro de caracteres -Construcción de una matriz de datos
-Selección y registro de caracteres -Construcción de una matriz de datos
-Cálculo de un coeficiente de similitud entre cada para posible de OTU
Coeficientes de correlación
Coeficientes de distancia
Aplicación de un coeficiente de similitud
n Manhattan Distance Σ [ Xij-Xik] i=1
Jaccard __a___ a+b+c
Simple Matching a + d a+b +c +d
Construcción de una matriz de similitud
Pasos sucesivos de un analisis de agrupamientos
UPGMA
Pasos sucesivos de un análisis de agrupamientos UPGMA (Unweighted pair group method)
a. Selección de las OTUs más similares, menor distancia en la Matriz de similitud de distancia b. Agrupamiento de las OTUs (DF) en el fenograma según la distancia establecida en la matriz de similitud (=1)
1
c.2. Elección de las OTUs más similares (CE), menor distancia en la Matriz derivada (=2) d. Agrupamiento de las OTUs (CE) en el fenograma según la distancia establecida en la matriz derivada (=2)
2
c.1. Construcción de la matriz derivada. Calcular la distancia DF con las demás OTU. Calcular el promedio DF-A= D-A (3) + F-A (2) % 2 = 2.5 DF-B=D-B (2) + F-B (3) % 2= 2.5 DF-C= D-C (3) + F-C (4) %2 = 3.5
Matriz original
Matriz derivada
e. Elección de las OTUs/grupo más similares (ADF) , menor distancia en la Matriz derivada f. Agrupamiento de las OTUs A con DF en el fenograma según la distancia establecida en la matriz derivada (2.25)
2.5
Matriz de distancia original
Matriz derivada
e.1. Cálculo de la matriz derivada. (4x4 OTU). Ingresa CE como núcleo y se calculan las distancias. Calcular los promedios de CE con las restantes OTU volviendo a la matriz original: CE-A= C-A (4) + E-A (4) % 2 = 4 CE-B= C-B (3) + B-E (6) %2 = 4.5 CE-DF= C-D (3)+ C-F (4) + E-D (5) + E-F (5) % 4= 4.25
g.2. Elección de las OTUs/grupo más similares (B-ADF), menor distancia en la Matriz derivada h. Agrupamiento de las OTUs B con el grupo ADF en el fenograma según la distancia establecida en la matriz derivada (=3)
3
g.1. Cálculo de la matriz derivada. (3x3 OTU). Ingresa ADF como núcleo. Calcular el valor de distancia de ADF con las restantes OTU volviendo a la matriz original, como en los pasos anteriores
Pasos sucesivos de un análisis de agrupamientos
i.1. Cálculo de la matriz derivada. i.2. Elección de las OTUs/grupo más similares, menor distancia en la Matriz derivada j. Agrupamiento de las OTUs en el fenograma según la distancia establecida en la matriz derivada
4.25
UPGMA sobre datos de machos en un análisis de agrupamientos del género Elasmoderus (Orthoptera)
Desventajas de las técnicas de agrupamientos
Siempre aparecen grupos delimitados, aun cuando éstos no se ajusten a la estructura de los datos.
Mediante estas técnicas no se puede evaluar la similitud homóloga.
Sin embargo, dado que los algoritmos propuestos por la Cladística operan sobre datos discretos, las técnicas de agrupamientos, al igual que los árboles basados en distancias, constituyen herramientas útiles para el análisis de datos continuos frecuentemente utilizados para el estudio de la variación infraespecífica mediante marcadores moleculares.
Análisis de Componentes Principales
Proyectan y representan las unidades de estudio como puntos en un espacio bi o tridimensional. La mayor similitud entre las unidades se expresa por una mayor proximidad entre las mismas
Diagrama de Flujo Simplificado de PCA y PCC
MATRIZ BASICA DE DATOS
Estandarización de la matriz
Los datos quedan expresados en la misma unidad de medida, el centroide de la totalidad de datos es cero
El primer eje o Componente Ppal I: linea que atraviesa el centroide, minimizando la distancia cuadratica de cada punto a esta linea. Atraviesa la maxima variabilidad presente en los datos.
El segundo eje o Componente Ppal II, tambien atraviesa el centroide, y tambien pasa atraves de la maxima variabilidad presente en los datos, pero con la condicion de que no puede estar correlacionado con el Eje I o Componente Ppal I (deben estar angulo recto o ser ortogonales)
4.0 4.5 5.0 5.5 6.02
3
4
5
1er Componente Principal, I
2nd Principal Component, II
Eigenvalores
4.0 4.5 5.0 5.5 6.02
3
4
5λ1
λ2
4.0 4.5 5.0 5.5 6.02
3
4
5
xi2
xi1
yi,1 yi,2
4.0 4.5 5.0 5.5 6.02
3
4
5
Si rotamos el gráfico de tal forma que el Eje I sea el Eje X, y el Eje II el Eje Y…
I
II
4.0
4.5
5.0
5.5
6
2
3
4
5Si rotamos el gráfico de tal forma que el Eje I sea el Eje X, y el Eje II el Eje Y…
I
II
Análisis de Componentes Principales
Si rotamos el gráfico de tal forma que el Eje I sea el Eje X, y el Eje II el Eje Y…
Como se determina cuantos ejes se plotearán o cuáles son importantes de analizar?
Cada eje tiene un eigen valor (latent root) Los eigen valores para los tres primeros ejes son PCA Axis I: 1.8907
PCA Axis II: 0.9951 PCA Axis III: 0.1142
Estos estan relacionados con la variabilidad expresada por cada eje (Axis). La suma de los eigenvalores es = 3 (= al Nro. de variables). En gral. se expresa como porcentaje
PCA Axis I: 63% PCA Axis 2: 33% PCA Axis 3: 4%
Cómo sabemos que carácter contribuye con cual eje
o componente principal?
Eigen vectores
La contribución de cada carácter a cada componente principal está expresada por el eigen vector
Pasos del Análisis de Componentes Principales, aplicando un coeficiente de correlación
Elección de las OTU a estudiar Selección de los caracteres Registro de los mismos y codificación en el caso que resulte
necesario Construcción de una matriz de datos de OTU por caracteres Estandarización de la MBD original por caracteres Obtención de una matriz de correlación entre caracteres Cálculo de eigen-vectores y eigen-valores Proyección de las OTU en un gráfico delimitado por los
componentes Visualización de los resultados en un gráfico bi o tridimensional
Análisis de los Componentes Principales
Análisis de Coordenadas Principales
Elección de las OTU a estudiar Selección de los caracteres Registro de los mismos y codificación en el caso que resulte
necesario Construcción de una matriz de datos de OTU por caracteres Obtención de una matriz de distancia entre OTU Centrado de la matriz de distancia Cálculo de eigen-vectores y eigen-valores a partir de la matriz de
obtenida en el paso anterior Proyección de las OTU en un gráfico delimitado por las
coordenadas Visualización de los resultados en un gráfico bi o tridimensional
ANÁLISIS MORFOMÉTRICO Y DELIMITACIÓN
TAXONÓMICA DE ESPECIES POLIMÓRFICAS EN EL GÉNERO DIPONTHUS
303 ejemplares
(197 machos y 106 hembras).
Materiales examinados
D. permistus
D. argentinus
D. pycnostictus
D. communis
D. pictus
D. schulzi
Morfo marrón-verdoso
Análisis de
agrupamientos
Hembras
D. pycnostictus
5 grupos
Algoritmo UPGMA (“unweighted pair-group average method”) y coeficiente de similitud general de Gower. PAST v. 2.17b (Hammer et al., 2001).
Machos
7 grupos
Análisis de Componentes
Principales (ACP)
Machos
Hembras
Componentes I y II (38,11 %): Caracteres cromáticos
Componentes I y II (35,75 %): Caracteres morfométricos
Coeficiente de correlación de Pearson XLSTAT v. 2008 7.03
D. pycnostictus
D. argentinus
• D. permistus n. syn.
• D. communis n. syn.
• D. pictus n. syn.
• D. schulzi n. syn. • Morfo marrón-verdoso
Morfos de coloración
Delimitación de especies
Especies válidas:
Variación geográfica de la coloración
D. permistus (A); D. argentinus (B); D. schulzi (E); D. pictus (G); morfo de color marrón verdoso (F).
Proporciones de los grupos entre las regiones biogeográficas no fueron significativamente diferentes (F4,20= 1,85; p= 0,159).
Cada especie nominal mostró mayores proporciones en determinadas áreas
Análisis de ANOVA de dos vías. Statgraphics Centurion XVII. Test de Levene (p>0.05).
• No hubo correlación entre caracteres y latitud o longitud.
Análisis de correlación entre caracteres morfométricos-
cromáticos y la distribución geográfica
• Correlación débil aunque significativa entre los componentes de ACP (CI-machos; CI y II- hembras) con la latitud.
Coeficiente de correlación de Pearson (r). Statgraphics Centurion XVII.
• Variación en color del cuerpo a lo largo del rango de distribución sin
gradiente de coloración evidente, con distintos morfos presentes en una
misma población.
• La variabilidad del tamaño de hembras tiende a aumentar con la
latitud.
Polimorfismo en Diponthus argentinus
Morfometría geométrica Cuantificación de la forma
Tradicionalmente las variables usadas en la morfometría convencional son distancias lineales . � Sin embargo, tales medidas, por lo general, dan información incompleta de la forma de la estructura
Morfometría Geométrica
La morfometría comprende la descripción, análisis e interpretación cuantitativa de la forma y del cambio morfológico en Biología. Se considera que es el estudio de variación de la forma y su covariación con otras variables
La morfometría geométrica abstrae la forma de los organismos como un conjunto de datos de coordenadas en dos o tres dimensiones.
Tipos de datos Caracteres cuantitativos que son transformados en
distancias (=análisis morfométricos tradicionales) Coordenadas de Landmarks Coordenadas registradas a partir de un contorno (outline
coordinates)
Morfometría geométrica Cuantificación de la forma Historia y Métodos
Galton (1822-1911), científico Británico, realizó una clasificación de los perfiles humanos. Midió distancias entre “puntos cardinales” de la cara y los tradujo en un lenguaje geométrico para poder “clasificar” perfiles
Bookstein (1994) inspirado en los trabajos de Galton desarrolló un métodos para cuantificar la forma biológica y sus cambios, y acuñó el término morfometría geométrica
Morfometría geométrica Cuantificación de la forma
• La morfometría geométrica (Descripción y comparación numérica de las formas) tiene base en el estudio de la forma de los objetos a partir de puntos de referencia o “landmarks”.
•La relación espacial entre los landmarks en 2D o en 3D, lo que permite la reconstrucción más ajustada de la forma y el tamaño de los especímenes estudiados.
Los landmark definen la forma. Los tipos de landmarks son � Tipo 1: En intersecciones de tejidos o puntos anatómicos discretos. � Tipo 2: En puntos de máxima curvatura o puntas de estructuras. � Tipo 3: Definidos por constructos matemáticos extrínsecos al objeto, extremos de la estructura, o centro de estructuras
Morfometría geométrica Cuantificación de la forma
Morfometría geométrica Cuantificación de la forma
PROCEDIMIENTO: Relación espacial de los landmarks
2D
3D
Morfometría geométrica Cuantificación de la forma
Morfometría geométrica Cuantificación de la forma
Morfometría geométrica Cuantificación de la forma
Morfología de las hojas: Quercus frainetto, Q. robur, Q. petraea & Q. pubescens
Landmarks y grillas de deformación
b. Grilla de deformacion de Pygocentrus cariba .
c. Grilla de deformación de Pygopristis denticulata
d. Grilla de deformación de Pygocentrus natterei
a. Landmarks en Pygopristis denticulata
Morfometría geométrica Cuantificación de la forma
Morfometría geométrica Cuantificación de la forma Resumen
Relaciones geométricas entre los picos de los pinzones de Darwin.
Campàs O et al. PNAS 2010;107:3356-3360
(A) Ejemplo de digitización del perfil del pico
v
(B) Compraraciónde a pares de la forma del picoshapes (C) Separación en grupos