80
GENÉTICA GEOGRÁFICA: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Estatistica Espacial em Genética de Populações e da Paisagem Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA & SÍNTESE Departamento de Ecologia, ICB, Universidade Federal de Goiás, Brasil ([email protected])

GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Embed Size (px)

Citation preview

Page 1: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

GENÉTICA GEOGRÁFICA: GENÉTICA GEOGRÁFICA:

Estatistica Espacial em Genética de Populações e Estatistica Espacial em Genética de Populações e da Paisagemda Paisagem

JOSÉ ALEXANDRE FELIZOLA DINIZ FILHOJOSÉ ALEXANDRE FELIZOLA DINIZ FILHOLABORATORIO DE ECOLOGIA TEÓRICA & SÍNTESE

Departamento de Ecologia, ICB,Universidade Federal de Goiás, Brasil

([email protected])

Page 2: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Analise de Dados em Genética Geográfica

Espacialmente explícitas

Análises Espacialmente

Implícitas

Page 3: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

COMPONENTE ESPACIAL

Geografia

Economia

Geologia

Sociologia

Ecologia

Demografia

Genetica

Epidemiologia

Page 4: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

DADOS ESPACIAIS

Superfícies

Padrão de pontos

Page 5: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 -0.02

Interpolação...

DADOS

SUPERFICIE-‘Real’ ?

- Processos ?

Page 6: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Dados em pontos de amostragem

Unidade espacial de análise

Page 7: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Visualização

‘Paisagem’

superficies

Page 8: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Descrever a relação espacial entre as observações, com base nas

coordenadas X, Y

Matriz W(conectividade, adjacência ou

‘peso’ da ligação entre unidades espaciais)

CONEXÕES ENTRE UNIDADES ESPACIAIS

Page 9: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Matriz W(Estrutura espacial)

distância

Adjacências

Conectividade (rede)

Page 10: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Distância Geográfica (espacial) entre as unidades amostrais

Longitude (X)

Lat

itu

de

(Y)

Distância i, j

i

j

})(){( 22jijiij yyxxd

(distância física verdadeira)

Page 11: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

A

B

Distância esférica (em arco)

Distância em corda

A questão das distâncias esféricas ou

geodésicas

Latitude

Longitude

)]cos(coscossinarccos[sin6371

180

6371*

212121

km

km

D

ED

Page 12: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

1) Funções das distâncias espaciais

- Wij = 1 / dij

- Wij = 1 / dij2

- Wij = e (- dij

)

2) Estabelecer distância de truncamento (dT)

W

Distância

Relação funcional entre W e D

Page 13: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

A B C D E FA 0B 1 0C 1.2 1.2 0D 4 4 4 0E 4 4 4 1.5 0F 4 4 4 1.5 1 0

A B C D E FA 0B 1 0C 1 1 0D 0 0 0 0E 0 0 0 1 0F 0 0 0 1 1 0

dT = 2

Matriz de distâncias geográficas

(km)

Matriz W

Page 14: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

3

2

1

6

7

4

5

8

Redes de conexão

Rede de Gabriel - este é um dentre os vários critérios possíveis para estabelecer redes...

Barreira geográfica...

Page 15: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Modelos de conexão

Page 16: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Matriz W de conexão com base nas ligações da rede

1 2 3 4 5 6 7 81 x2 1 x3 0 1 x4 0 0 0 x5 0 0 0 1 x6 1 0 0 0 0 x7 0 0 0 1 0 1 x8 0 0 0 0 0 0 1 x

Page 17: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

1. Posição dos pontos

Page 18: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

2. Rede de conexão

Page 19: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

3. Bi-setores perpendiculares

Page 20: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

4. Polígonos de Thiessen (regiões)A B

C D E

AA BB CC DD EE

AA 00

BB 11 00

CC 11 00 00

DD 11 11 11 00

EE 00 11 00 11 00Matriz W de adjacência entre as regiões

Page 21: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Torre (Rook)

Rainha (Queen)

Bispo (Bishop)

Unidades geopolíticas em Goiás - Brasil

Page 22: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Topologias alternativas e conexões

Page 23: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

- Temos agora uma matriz de distâncias geográficas ou “pesos” ligando as populações, então...

Como podemos associar essas matrizes geográficas com as distancias genéticas discutidas anteriormente (Nei, FST, etc)?

Page 24: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

TESTE DE MANTEL

Nathan Mantel (1919 - 2002)

Mantel, N. (1967). Detection of disease clustering and a generalized regression approach. Cancer Research 27 (2P1): 209-220.

SND = [Z – E(Z)] / VAR(Z)1/2

Mielke (Biometrics 34: 277-282, 1978)

PERMUTAÇÃO (ou aleatorização)

Page 25: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 26: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Sokal 1979

Peter Smouse

Page 27: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

1987 1992 1997 2002 2007 2012YEAR

0

50

100

150

Nu

mb

er

of

pa

pe

rs

Web of Science => Mantel AND genet*

Page 28: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

TESTE DE MANTEL

p variables

n

n

n

n

i

n

jijij GEOGENZ

1 1

*GEOGEN

Similarity/Dissimilarity (Nei distances, Identity, FST Rogers, Jaccard, Euclidian,

etc)

Distancias geográficas

Page 29: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

GEN A B C D E

A 0

B 0.0961 0

C 0.1595 0.0647 0

D 0.1542 0.0942 0.1019 0

E 0.0277 0.0859 0.1427 0.1518 0

GEO A B C D E

A 0

B 6 0

C 15 2 0

D 12 9 11 0

E 1 8 18 13 0

produto A B C D E

A 0

B 0.5766 0

C 2.3925 0.1294 0

D 1.8504 0.8478 1.1209 0

E 0.0277 0.6872 2.5686 1.9734 0

Mantel Z 12.175

n

i

n

jijij GEOGENZ

1 1

*

Distancias genéticas (Nei)

Distancias geográficas (km)

(Ou 2* soma, se quiser considerar o outro lado da matriz)

Page 30: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

n

n

GEOGEN

-Esse valor de Z depende do numero de elementos a serem somados e do proprio valor em GEN e em GEO;

-O que o Mantel fez foi derivar uma formula para o valor esperado e para a variancia (erro) dessa somatoria, de modo que

SND = Z – E(Z) / erro(Z)

pode ser testada por um desvio normalizado da distribuição normal (standard normal deviate). Mas Mielke mostrou que só funciona bem em alguns casos...

n

i

n

jijij GEOGENZ

1 1

*

Page 31: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

n

i

n

jijij GEOGENZ

1 1

*

Sendo X igual a GEO e Y igual a GEN...

O Z de Mantel é uma parte do coeficiente de correlação de Pearson entre as matrizes;

A correlação r entre as matrizes é uma teste Z de Mantel “padronizado” quando as matrizes são normalizadas (média 0 e sd = 1)

Mas é diferente correlacionar um vetor Y e X e matrizes de distancias euclidianas entre X e Y

Page 32: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

1 2 3 4 51 0,00002 0,0961 0,00003 0,1595 0,0647 0,00004 0,1542 0,0942 0,1019 0,00005 0,0277 0,0859 0,1428 0,1518 0,0000

Genetic0.09610.15950.15420.02770.06470.09420.08590.10190.14280.1518

Geo (km)6 15 121298111813

Pearson r = 0.903

Mas como testar essa correlação?

Page 33: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Teste de aleatorização

n

n

GEOGEN

n

i

n

jijij GEOGENZ

1 1

*

-Embaralhar linhas e colunas;

-Recalcular o Z;

-Repetir 1000 vezes ou mais;

-Contar quantas vezes o Z observado foi maior do que os 1000 valores de Z (isso é o valor de P, ou erro tipo I)

Page 34: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Note-se que não é a mesma coisa embaralhar os elementos da matriz e as linhas e colunas;

Page 35: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

-Sob essas aleatorizações (permutações), a média e a variância são constantes, de modo que isso não afeta a estandardização do Z para a correlação de Pearson entre as matrizes

Constantes sob a permutação de linhas e colunas

Page 36: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Quantas permutações?

Depende:

-Do n (para o máximo)

-Do P-valor desejado (para o mínimo)

Page 37: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 38: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 39: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 40: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 41: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Para as 25 populações de “Baru”

r = 0.487

Elevando-se o r ao quadrado, tem-se que cerca de 23.7% da variação nas distancias geneticas pode ser explicadas pelas distâncias geográficas

Page 42: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

-0.35-0.25

-0.15-0.05

0.050.15

0.250.35

0.450.55

Mantel correlation

0

100

200

300

400P

erm

uta

ti on

s

0.259-0.192

2.5% da área2.5% da área

95% da área

Page 43: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

-0.35-0.25

-0.15-0.05

0.050.15

0.250.35

0.450.55

Mantel correlation

0

100

200

300

400P

erm

uta

ti on

s

- O valor observado de r = 0.487 é maior dos que os 4999 valores aleatorizados, de modo que a probabilidade encontrar esse valor ao acaso é 1/5000;

-Separando-se os 125 valores maiores e os 125 valores menores (5%), tem-se os limites de 0.259 e -0.192 (esse é o intervalo de confiança não paramétrico a 95%).

-O IC95 paramétrico está entre -0.236 e 0.235.

Page 44: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Teste de Mantel e “Isolamento-por-distancia” (IBD)

Page 45: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Interpretar Mantel e IBD conjuntamente requer modificações (não é só a correlação, mas sim transformar FST/(1-FST) e log (distancias)

Page 46: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

r²: 0.196 y = 5.672 + 1.314*x

lnDIST76.565.554.543.532.52

fstr

_qua

d1.2

1.1

1

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0

-0.1

-0.2

-0.3

Page 47: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

http://ibdws.sdsu.edu/~ibdws/

Page 48: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Pierre Legendre

Marie Jose Fortin

Page 49: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

EXPANSÕES DO TESTE DE MANTEL

Correlograma de Mantel

Mantel parcial (correlação parcial e regressão parcial)

Page 50: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

A B C D E FA 0B 1 0C 1.2 1.2 0D 4 4 4 0E 4 4 4 1.5 0F 4 4 4 1.5 1 0

A B C D E FA 0B 1 0C 1 1 0D 0 0 0 0E 0 0 0 1 0

A B C D E FA 0B 0 0C 0 0 0D 1 1 1 0E 1 1 1 0 0F 1 1 1 0 0 0

Distâncias entre 0 e 2

Distâncias > 2

W1 W2

Calculo do Z ou r de Mantel Calculo do Z ou r de Mantel

Page 51: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

1 2 3 4 51 0,00002 0,0961 0,00003 0,1595 0,0647 0,00004 0,1542 0,0942 0,1019 0,00005 0,0277 0,0859 0,1428 0,1518 0,0000

W1

W2

W3

W4

YX

XYj

jj

jI

IDN ln

0 – 100 km

100 – 200 km

200 – 300 km

300 – 400 km

W matrices

MANTEL CORRELOGRAM

Page 52: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 53: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

A matriz de distâncias geográficas (simétrica e com n (n-1) / 2 observações) pode ser desdobrada em diversas matrizes de conectividade Wk, cada uma delas ligando pares sucessivos e exclusivos de locais de coleta distantes uns dos outros por um intervalo crescente.

Questões:

- Número de classes?

n = 20 k = 4 ou 5 classes

- Regra de Sturge – No. de classes = 1 + 3.3log10[(n*n-1)/2] (n = 20 8 classes)

- Como dividir a matriz de distâncias e criar as matrizes W ?

Page 54: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Como dividir a matriz de distâncias?

1) Classes de distâncias iguais (mesmo intervalo);Ex.: 0-100; 100-200; 200-300 km; etc

2) Número aproximadamente igual de conexões (W) (I de Moran mais comparáveis e mais estáveis...);

W (Ik ) = [ n (n-1) ] / k

onde k é o número de classes

Ex: classes irregulares - 0-100; 100-250; 250-500; 500-980 km

Page 55: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

TESTE GLOBAL DO CORRELOGRAMA – critérios de Bonferroni

Para estabelecer a significância total do correlograma mantendo-se a Probabilidade de Erro Tipo I a um nível de 5 % (por exemplo), é necessário utilizar o critério de Bonferroni: 1) Testar a significância de cada um dos índices I a um nível de 0,05/k. Assim, o correlograma como um todo será significativo se pelo menos um dos valores de I for significativo a 0,05/k.

2) Usar o critério de Bonferroni sequencial:

r(1) = 0.05/1 r(2) = 0.05/2r(3) = 0.05/3...r(k) = 0.05/k

Page 56: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Importante:

Note-se que a matriz W é uma matriz de similaridade, no qual o valor alto (no caso 1) indica que as populações estão LIGADAS, ou seja, estão juntas. Por outro lado, as matrizes de FST ou Nei etc, são matrizes de distância, no qual o valor alto indica diferença!

Então, no caso de comparar uma matriz de SIMILARIDADE qualquer e uma matriz de DISTANCIA, o Mantel dará uma correlação negativa quando houver de fato uma “relação” positiva entre as matrizes (dependendo do software, pode ser preciso inverter o sinal do Mantel). Por exemplo, se ao invés de usar distância geográfica utilizar 1/D2, o Mantel dará uma forte relação “NEGATIVA”

Page 57: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 58: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 59: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 60: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

A B C D E FA 0B 0.1 0C 0.2 0.3 0D 0.5 0.4 0.3 0E 0.6 0.5 0.5 0.2 0F 0.7 0.6 0.9 0.3 0.1 0

A B C D E FA 0B 1 0C 1 1 0D 0 0 0 0E 0 0 0 1 0

A B C D E FA 0B 0 0C 0 0 0D 1 1 1 0E 1 1 1 0 0F 1 1 1 0 0 0

W1

W2

Médias das distâncias genéticas entre populações próximas

Populações geograficamente

distantes

Populações geograficamente

próximas

Médias das distâncias genéticas entre populações distantes = 0.2

Distâncias genéticas

Page 61: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

A B C D E FA 0B 0.1 0C 0.2 0.3 0D 0.4 0.4 0.4 0E 0.6 0.4 0.5 0.2 0F 0.6 0.5 0.7 0.3 0.1 0

A B C D E FA 0B 1 0C 1 1 0D 0 0 0 0E 0 0 0 1 0

A B C D E FA 0B 0 0C 0 0 0D 1 1 1 0E 1 1 1 0 0F 1 1 1 0 0 0

W1 W2

Médias das distâncias genéticas entre populações próximas

Populações geograficamente

distantes

Populações geograficamente

próximas

Médias das distâncias genéticas entre populações distantes = = 0.2 = 0.5

Distâncias genéticas

Page 62: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

0.2

0.5

Classe de Distância Geográfica W1 W2

“Distanciograma” ou “Distograma”

Page 63: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

0 80 160 240

Distância Geográfica (km)

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

0.16

0.18

Dis

tânc

ia d

e N

EI

méd

ia

Page 64: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Figura 4. Distograma (Tanimoto) construído a partir das distâncias genéticas médias entre 32 plantas (Dipteryx alata), coletadas em Icém - SP, distribuídas em nove classes de distâncias geográficas.

0.2

0.3

0.4

0.5

0.6

872 1745 2618 3490 4362 5235 6108 6980 7852

Observado

Média/ausência de autocorrelação

Limite superior das classes de distância (m)

Dis

tân

cia

de

Tan

imo

to

Limite inferior do intervalo de confiança (95%)

Limite superior do intervalo de confiança (95%)

+

+

+0.2

0.3

0.4

0.5

0.6

872 1745 2618 3490 4362 5235 6108 6980 7852

Limite superior das classes de distância (m)

Dis

tân

cia

de

Tan

imo

to

ç

Output SGS

Page 65: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

O uso do teste de Mantel a partir de uma matriz binária W de conexão abre a possibilidade de utilizar o Mantel para testar qualquer efeito de variação entre as localidades

Funciona assim como uma Analise de Variancia não-paramétrica multivariada (AMOVA), na qual o teste (hipotese nula) é que as distâncias entre os grupos são iguais às distancias dentro dos grupos. A idéia é que 1 indica que as populações estão no mesmo grupo e zero o que estão em grupos diferentes

Page 66: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

TESTE DE MANTEL PARCIAL

Correlações parciais

-Correlação parcial de 1a. Ordem (ou ordens superiores)-Correlação entre as variáveis 1 e 2 mantendo `fixo` o efeito da

variável 3 (r12.3) (controle estatístico)

223

213

2313123.12

11 rr

rrrr

Page 67: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Causa e Correlação

“This view is summed up in the mantra that is learnedt by almost every student who has ever taken an elementary couse in statistics: correlation does not imply causation. In fact, with few exceptions, correlation does imply causation...A more accurate sound bite for introductory statistics would be that a simple correlation implies an unresolved causal structure...” (Pat Shipley, 2000)

-Dados experimentais versus dados observacionais

-Controle Estatístico versus Controle Físico

Page 68: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Definições de ‘causa’ e ‘causalidade’

Conceitos operacionais: o que seriam relações causais?AXIOMAS:

1. Relações transitivas – se o evento A causa o evento B, que por sua vez causa o evento C, então A causa C;

2. As relações devem ser locais (condição Markoviana) – se A causa C apenas por meio de B, então a influência de A sobre C é bloqueada se o evento B é impedido de responder a A;

3. As relações devem ser irreflexivas – um evento não causa a ele mesmo (exceto em ‘loops’ temporais);

4. As relações devem ser assimétricas – se A causa B, então B não ser a causa de A simultaneamente.

Aristóteles

Page 69: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 70: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

AET(b)

Riqueza (c)

Latitude(a)

Correlações...

0.889 0.776

0.737

Page 71: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

223

213

2313123.12

11 rr

rrrr

74388.0737.01776.01

737.0776.0889.022

/.

lataetriqr

AET

(b)

Riqueza (c)

Latitude

(a)

Correlações...

0.889 0.776

0.737

0.889 0.744

Page 72: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 73: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 74: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Fenótipo(b)

Genetica(c)

Geografia(a)

0.585 0.286 0.720 0.582

0.584 0.289

Page 75: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 76: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

TESTE DE MANTEL E REGRESSÃO PARCIAL

A idéia central é ‘desdobrar’ a variação em diferentes componentes:

a = componente “puro”de variação em Y definido somente por X (história,

ambiente, etc);

b = componente de variação da sobreposição entre X e espaço;

c = componente “puro” de variação espacial;

d = resíduo

Page 77: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

a = componente de variação em Y definido somente por X;

b = componente de variação da sobreposição X e espaço;

c = componente de variação espacial;

d = resíduo

Para realizar o desdobramento, são necessários os coeficientes de

determinação (R2) de 3 modelos:

1) Mantel com as variáveis preditoras (X) (R2A) (a + b);

2) Mantel geográfico (R2G) (b + c);

3) Mantel geográfica + preditoras (R2T) (a + b + c)

A fração residual é dada por 1 – R2T. A fração ‘b’ (sobreposição) é dada por

b = R2A + R2

G - R2T

De modo que...

a = R2A - b

c = R2G – b

Page 78: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 79: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &
Page 80: GENÉTICA GEOGRÁFICA: Estatistica Espacial em Genética de Populações e da Paisagem JOSÉ ALEXANDRE FELIZOLA DINIZ FILHO LABORATORIO DE ECOLOGIA TEÓRICA &

Dist.Genéticas

“Isolamento”

Dist.Geograficas

Regressão parcial

Total: 64.7%

IBD: 4%

Barriers: 9%

Overlap: 51.7%