CADEIAS DE MARKOV E ASSOCIAÇÃO CRUZADA APLICADAS …LISE DO EFEITO... · CADEIAS DE MARKOV E ASSOCIAÇÃO CRUZADA APLICADAS AO ESTUDO DO EFEITO ANTRÓPICO EM CETÁCEOS Diana G

CADEIAS DE MARKOV E ASSOCIAÇÃO CRUZADA APLICADAS AO ESTUDO DO EFEITO ANTRÓPICO EM CETÁCEOS

Diana G. Lunardi1, Paulo S. Lucio2*, André Gustavo C. Pereira2,

Francisco Moisés C. de Medeiros2, Renata G. Ferreira1

1PPG em Psicobiologia - Centro de Biociências - Universidade Federal do Rio Grande do Norte 2PPG em Matemática Aplicada e Estatística - Universidade Federal do Rio Grande do Norte

Campus de Natal – RN RESUMO: A análise de dados em sequência ou em Cadeia que incluam levantamentos comportamentais ao longo do tempo definido por propriedades ou estados, são muito comuns em ciências biológicas. O objetivo do uso de Cadeias de Markov neste estudo foi avaliar os efeitos do turismo de observação no comportamento do boto-cinza, Sotalia guianensis, uma espécie comum no litoral do Brasil. As observações foram realizadas a partir de um mirante localizado a 25m acima do nível do mar, na enseada do Madeiro-RN, entre dezembro de 2007 e fevereiro de 2009 e entre 6h e 16h. O estado comportamental predominante da agregação focal foi registrado a cada 2min e definido como mutuamente exclusivo. Foram observadas 658 agregações de golfinhos em 176 dias de amostragem, totalizando 1.223h de esforço. Na ausência de embarcação (controle), foram registradas 5.637 transições, enquanto na presença (impacto) foram registradas 21.658 transições entre estados comportamentais. A estatística de teste, uma aproximação do qui-quadrado de Pearson, foi utilizada para averiguar a propriedade markoviana. Neste estudo, rejeitou-se a hipótese nula de que os eventos ocorrem de forma independente e, portanto, assumiu-se uma Cadeia de Markov de primeira ordem, caracterizado por um processo estacionário. A partir da análise de associação cruzada, não foram detectadas diferenças significativas entre as cadeias controle e impacto. Contudo, de acordo com a distribuição das probabilidades estacionárias de ambas as cadeias, foram registrados aumentos de probabilidade para o deslocamento e diminuições para o repouso, o forrageio e a socialização, sinalizando uma previsão de alteração no orçamento das atividades dos botos-cinza a longo prazo. ABSTRACT: Analysis of data in sequence or chain that include behavioral sampling over time defined by properties or states, are very common in biological sciences. The purpose of the use of Markov chains in this study was to evaluate the effects of whale watching in the behavior of Guiana dolphin, Sotalia guianensis, a species common on the coast of Brazil. Systematic observations of Guiana dolphin were made from an observatory located in cliffs about 25m above sea level at Madeiro Bay, from December 2007 to February 2009 and between 6h and 16h. The predominant behavioral state of the focal aggregation was recorded every 2 minutes and defined as mutually exclusive. We observed 658 aggregations of dolphins in 176 days of sampling, totalizing 1,223h of effort. We recorded 5,637 transitions between behavioral states in the absence of vessel (control) and 21,658 transitions in the presence of these (impact). The statistic of test, an approximation of chi-square test was used to investigate the property of Markov. In this study we rejected the null hypothesis that the events occur independently and therefore we have assumed a Markov chain of first order, characterized by a stationary process. From the analysis of cross-association, there were no significant differences between control and impact chains. However, according with the stationary distribution of probabilities of both chains, we recorded a increase of probability for traveling and decreases for resting, foraging and socializing, signaling a prevision of change in the time budget of Guiana dolphins in long-term. Palavras-chave: probabilidades de transição, processo estacionário, sequência comportamental, Sotalia

guianensis, turismo de observação.

* Corresponding author: Departamento de Estatística – CCET – UFRN– Lagoa Nova - 59078-970 - Natal – RN.

INTRODUÇÃO

Efeitos de processos antrópicos no comportamento animal são aqueles derivados de atividades

humanas. Em geral, padrões comportamentais observados em áreas com efeitos antrópicos

diferem daqueles que ocorrem em ambientes naturais, sem influência humana. A análise de dados

em sequência ou em cadeia que incluam levantamentos comportamentais ao longo do tempo,

definido por propriedades ou estados, são muito comuns em Ciências Biológicas (e.g., Nowacek,

2002; Lusseau, 2003; Williams et al., 2006). As técnicas usuais para examiná-los fazem parte dos

conceitos fundamentais de Processos Estocásticos. Dentro deste contexto, propõe-se, neste

ensaio, o estudo de alguns parâmetros associados ao comportamento de cetáceos ao longo de

perfis longitudinais (sequencialmente selecionados) com vias à identificação de um padrão de

comportamento e verificação de impactos causados por barcos de turismo na região sob estudo.

Desta forma, o enfoque de Cadeias de Markov é uma metodologia estrutural para a caracterização

de comportamentos animais ao longo de uma escala de tempo discreta – no nosso caso, sendo

utilizado para avaliar se o efeito antrópico interfere no padrão comportamental de cetáceos. A

espécie em estudo é o boto-cinza, Sotalia guianensis, um golfinho que frequenta as enseadas da

região de Pipa no Rio Grande do Norte (RN), principalmente para forrageio (busca por alimento)

e alimentação.

A aplicação de modelos matemáticos em biologia geralmente é dificultada pelo

pressuposto de casualidade em modelos que invocam eventos totalmente independentes ou, em

outro extremo, pela exigência nos modelos determinísticos clássicos de que os eventos estejam

condicionados a variáveis específicas, predeterminadas e perfeitamente conhecidas. O modelo de

Cadeias de Markov, ocupando justamente uma posição intermediária nesse espectro de modelos

dinâmicos, presta-se com mais propriedade a ser utilizado na tentativa de explicação de processos

biológicos. Além disso, se aos valores obtidos por meio das Cadeias de Markov forem aplicados

métodos inferenciais, os resultados, quando comparados, permitirão com grande facilidade

verificar se os processos estudados apresentam alguma equivalência.

O objetivo do uso de Cadeia de Markov neste estudo é comparar probabilidades de

transição comportamental do boto-cinza na enseada do Madeiro (Pipa-RN) em duas condições:

na presença de embarcação de turismo e na ausência desta. Cinco estados comportamentais foram

avaliados: Forrageio (FO), Alimentação (FE), Deslocamento (TR), Socialização (SO) e Repouso

(RE). Os registros comportamentais tiveram duração de 2 minutos, ou seja, em 10 minutos pode

ter sido registrada a seguinte sequência: FO–FO–SO–FO–FE. Queremos saber se a presença dos

barcos na enseada afeta o padrão comportamental dos animais. Assim, foram observados 658

grupos de golfinhos em 176 dias de amostragem. Nas condições: 1. ausência de embarcação

(controle), quando foram registradas 5.637 transições; 2. presença de embarcação (impacto),

foram registradas um total de 21.658 transições entre estados comportamentais.

DADOS EXPERIMENTAIS

A área de estudo está localizada em uma unidade de conservação de uso sustentável denominada

REFAUTS (Reserva de Fauna Costeira de Tibau do Sul, Decreto Municipal nº 14, 17.03.2006),

na costa sul do estado do Rio Grande do Norte, com aproximadamente 536.000ha. A região é

caracterizada por duas estações do ano fortemente marcadas, uma seca (setembro a janeiro) e

outra chuvosa (fevereiro a agosto), apresentando pluviosidade média anual de aproximadamente

1500mm (EMPARN 2009). O boto-cinza é uma das menores espécies da família Delphinidae,

possuindo ampla distribuição ao longo da costa atlântica tropical e subtropical da América do Sul

e Central (Borobia et al., 1991; Flores, 1999; Carr e Bonde, 2000). É uma espécie gregária e pode

ser observada diariamente na Praia de Pipa, RN.

Foram realizadas observações sistemáticas do boto-cinza a partir de um mirante

localizado na enseada do Madeiro, a aproximadamente 25m do nível do mar, com o intuito de

inferir sobre o padrão comportamental dos animais não interferindo nos mesmos. As amostragens

ocorreram entre dezembro de 2007 e fevereiro de 2009, entre 6h e 16h, em condições favoráveis

de observação, com o auxílio de um binóculo Bushnell (7x50), um palmtop e um cronômetro. A

atividade predominante da maioria dos membros do grupo foi adaptada de outros autores (Mann

and Smuts 1999; Lusseau 2003; Tosi e Ferreira; 2008) e classificada via grupo focal (Altmann,

1974; Mann, 1999) em um dos cinco estados: Forrageio: caracterizado por uma natação não-

direcional no interior da enseada. Este contexto é frequentemente intercalado por contextos de

alimentação. Alimentação: caracterizado por eventos de perseguição, bote, manipulação e/ou

ingestão da presa. Os indivíduos do grupo podem se mover em várias direções, sem cooperação

aparente, ou podem ainda encurralar as presas, direcionando-as para águas rasas. Deslocamento:

natação caracterizada pelo movimento uniforme e direcional, resultante da mudança de posição

do animal de uma área a outra. Socialização: caracterizado por altos níveis de atividade e intenso

contato físico entre os indivíduos. Neste contexto os animais podem permanecer mais tempo na

superfície. Repouso: deslocamento lento ou ausência de deslocamento, com sincronização, na

maioria das vezes, de intervalos entre mergulhos.

O estado comportamental predominante da agregação focal foi registrado a cada 2min e

definido como mutuamente exclusivo. Os registros comportamentais das agregações foram

registrados em sequência, até o momento em que os animais deixaram a enseada ou saíram do

campo de visão do observador. Denominamos agregação um grupo de golfinhos observados em

aparente associação, movendo-se na mesma direção e frequentemente, mas nem sempre,

engajados na mesma atividade (Shane, 1990). Os registros comportamentais foram classificados

em duas condições: controle (ausência de embarcação) e impacto (presença de embarcação).

Assumindo uma posição bastante conservadora quanto ao grau de influência das embarcações

sobre as agregações, nós adicionamos à cadeia controle apenas registros comportamentais de

agregações observadas na ausência de embarcação durante todo o período de observação. Por

outro lado, à cadeia impacto foram adicionados registros comportamentais provenientes de

agregações observadas por pelo menos 2min (um registro) na presença de embarcação.

Foram observadas 658 agregações de golfinhos em 176 dias de amostragem, totalizando

1.223 horas de esforço. Deste total, os botos-cinza estiveram presentes em 933 horas (76%). Na

condição (i) ausência de embarcação (denominada controle), foram registradas 5.637 transições,

enquanto na condição (ii) presença de embarcação (denominada impacto), foram registradas

21.658 transições entre estados comportamentais.

PROCESSOS DE MARKOV DE PRIMEIRA ORDEM

Um processo estocástico unidimensional é uma coleção de variáveis aleatórias, todas definidas

em um mesmo espaço de probabilidades com valores definidos em Z = Z(x), x∈Ω. Uma

função aleatória ou uma realização de um processo estocástico unidimensional, é uma

determinação, para cada x∈Ω, de um valor possível de Z(x), onde Ω é chamado conjunto de

índices - quando Ω for não-enumerável, dizemos que o processo é a tempo contínuo e quando

enumerável dizemos que o processo é a tempo discreto. O conjunto S sobre o qual o processo

assume valores é denominado espaço de estados. No nosso problema o tempo é discreto e o

espaço de estados são discretos.

Um processo estocástico unidimensional Z = Z(x), x∈Ω, é um Processo de Markov de

primeira ordem se para qualquer escolha de x∈ℜ , tem-se que:

),)(|],()(())(,...,)(,)(|],()(( 122111 nnnnnn zxZbaxZPzxZzxZzxZbaxZP =∈====∈ ++

onde nxxx <<< ...21 . Um processo de Markov com espaço de estados discretos é dito uma

Cadeia de Markov.

Uma Cadeia de Markov com parâmetro temporal discreto nZ é um processo estocástico

markoviano cujo espaço de estados é um conjunto finito ou enumerável, e para o qual

0,1,2,...S = . Assim, )|( 11, iZjZPP nn

nn

ij === +

+ , que se denotará apenas por 1, +nn

ijP . A

quantidade 1, +nn

ijP é dita probabilidade de transição do estado “i” na posição (n) para o estado “j”

na posição (n+1). Quando 1, +nn

ijP não depende de n, ou seja, do tempo em que a transição é feita,

a cadeia possui a propriedade de probabilidade de transição estacionária e a cadeia é chamada de

homogênea ou estacionária. Neste caso, denotamos 1, +nn

ijP simplesmente por:

)|( 1 iZjZPP nnij === + .

As Cadeias de Markov homogêneas consideram sequências ou cadeias de estados em que

a transição de um estado para outro, dentro de um intervalo, depende de estados prévios, de tal

forma que as probabilidades associadas às transições entre os estados sejam estacionárias, isto é,

não dependem da posição. Neste sentido, pode-se afirmar que muitos processos biológicos

comportamentais possuem a propriedade markoviana, que se traduz pela influência de eventos

prévios em eventos subsequentes. Por este motivo, o método das Cadeias de Markov foi

selecionado como ferramenta para análise dos dados de natureza sequencial, provenientes deste

estudo, por julgá-lo de grande aplicação para o entendimento dos fenômenos comportamentais da

espécie aqui analisada.

O grau de dependência de um estado em relação à estados prévios nos informa a ordem da

cadeia. Desta forma, se existe um padrão de dependência apenas em relação ao estado

imediatamente anterior, a cadeia é classificada como de primeira ordem, se dois estados

imediatamente anteriores estão associados, a cadeia é dita de segunda ordem e envolve uma

unidade temporal. No entanto se os dois estados, que estão associados, não são imediatamente

precedentes, a cadeia possui ordem superior à segunda e os intervalos envolvidos podem ser

maiores que uma unidade temporal.

Para aplicarmos o método das Cadeias de Markov à nossa pesquisa, são necessárias

algumas definições prévias, adequando a teoria acima exposta ao nosso estudo. Assim, doravante,

um processo estocástico será traduzido como a sequência do comportamento animal,

caracterizado pela predominância comportamental. Os estados da cadeia serão os cinco (5)

estágios comportamentais: Forrageio (FO), Alimentação (FE), Deslocamento (TR), Socialização

(SO) e Repouso (RE). O espaço de estados será discreto e finito, devendo ser classificado

segundo o comportamento.

As Cadeias de Markov de primeira ordem e dependência simples são amplamente

utilizadas na ecologia para prever sucessão ecológica e clímax - tendo em vista sua relativa

facilidade de aplicação - mas na ecologia comportamental há poucos trabalhos que as associam

na abordagem de processos relacionados ao comportamento animal. No entanto, é comum

sequências comportamentais exibirem superposição de ciclos maiores (comportamentos sazonais)

sobre ciclos menores (comportamentos intra-sazonais), situações estas, que podem ser

representadas por matrizes markovianas de alta ordem, cuja estruturação e abordagem

matemática são tanto mais complexas quanto maior o grau de dependência revelado pelo

processo markoviano.

As matrizes de probabilidade de transições constituem uma forma simples e prática de

apresentação das Cadeias de Markov. O cálculo das probabilidades de transições baseia-se na

frequência de ocorrência de transições de um estágio para outro, observadas na representação do

processo considerado, isto é, na matriz de registros ou de frequências de transições. A verificação

da propriedade markoviana no processo é feita geralmente por meio da matriz de transições dos

parâmetros comportamentais onde os estágios envolvidos no processo correspondem ao

comportamento que compõe a sequência estudada.

A partir das matrizes de transições comportamentais, objetiva-se representar os diferentes

padrões por meio da sucessão de comportamentos, buscando uma sequência comportamental

específica a determinado contexto. Desta forma, as diversas composições ou associações

comportamentais de um ou diferentes grupos podem ser representadas por diferentes matrizes

markovianas. Considerando as observações feitas acima e a partir dos resultados obtidos na

matriz de frequências de transições (Mf) passamos então ao cálculo da matriz de probabilidades

de transição (Mp), que deve ser obtida a partir da correspondente matriz de registros, dividindo-se

cada elemento (nij) da i-ésima linha pelo total desta linha, ou seja, i

ij

ijn

np =ˆ , onde nij é o número

de vezes em que ocorre transição do estado “i” para o estado “j” e in é a frequência total de

transições do estado “i” para um qualquer dos outros estados.

Após o cálculo da matriz de probabilidades de transições (Mp) – Apêndice A1.1, o

próximo passo é a realização de um teste estatístico de hipóteses para a verificação da

propriedade markoviana relativa ao processo de comportamento animal. Foram também feitos

testes para proporções com relação ao número de “visitas” a cada estado – Apêndice A1.2,

quando se corroboram as diferentes probabilidades e se detectam os estados prevalentes em

termos das frequências. Não obstante, atenta-se ao fato de que a estruturação de uma sucessão de

eventos em uma matriz de probabilidades de transições não significa, necessariamente, que o

processo original seja um processo markoviano. É evidente, pois, que a aplicação do modelo

markoviano às sequências comportamentais categorizadas necessita da verificação da

propriedade markoviana. Para tanto, as suposições do teste são:

1. as matrizes devem ser tabuladas segundo intervalos fixos - o experimento foi realizado

em intervalos fixos, a cada 2 minutos foi registrado o comportamento predominante

da agregação;

2. a matriz de probabilidade de transições deve ser estacionária - Apêndice A2.

PROCESSOS DE MARKOV ESTACIONÁRIO

Para um espaço de estados discretos, as integrações na probabilidade de transição de k passos são

somatórios, e podem ser calculados como a k-ésima potência da matriz de transição. Isto é, se P

for a matriz de transição em um passo, então kP é a matriz de transição para a transição em k

passos. A distribuição estacionária π é o vetor que satisfaz à equação tππP = , onde t

π é o

vetor transposto de π . Em outras palavras, a distribuição estacionária π é o autovetor à esquerda

da matriz de transição, associado ao autovalor 1. Como consequencia, nem a existência nem a

unicidade de distribuição estacionária é garantida para uma matriz de transição qualquer P .

Contudo, se P for irredutível e aperiódica, então existe uma distribuição estacionária π . Além

disso, kP converge para uma matriz na qual cada linha é a distribuição estacionária Tπ , que é

dada por tk

kπP 1lim =

∞→ (Markov, 1906 in Howard, 1971) onde 1 é o vetor coluna com todas as

entradas iguais a 1. Isto é estabelecido pelo Teorema de Perron-Frobenius. Isto significa que se

nós simularmos ou observarmos um passeio aleatório com matriz de transição P , então a

probabilidade de longo prazo de que um indivíduo que realiza este passeio esteja em um certo

estado é independente do estado em que o passeio começou, e é definida pela distribuição

estacionária. O passeio aleatório "ignora" o passado. Em suma, Cadeias de Markov são o passo

seguinte depois dos processos sem memória (isto é, uma sequência de variáveis aleatórias

independentes distribuidas uniformemente). Uma matriz de transição que é positiva (isto é, todos

os elementos da matriz são positivos) é irredutível e aperiódica. Uma matriz é uma matriz

estocástica se e somente se é uma matriz de probabilidades de transição de uma Cadeia de

Markov.

Ao compararmos a distribuição das probabilidades estacionárias obtidas na ausência e na

presença de embarcação - Apêndice A2, detectamos reduções de até 33% para o repouso (de 0.03

para 0.02), 14% para a socialização (de 0.07 para 0.06) e 8% para o forrageio (de 0.73 para 0.67).

A probabilidade estacionária do deslocamento sofreu um aumento de 73% (de 0.03 para 0.1), e

da alimentação se manteve constante (0.13). Em um estudo realizado na região de Doubtful

Sound na Nova Zelândia, Lusseau (2003) investigou os efeitos do turismo no padrão

comportamental do golfinho nariz-de-garrafa, Tursiops truncatus, e obteve um padrão bastante

semelhante, com reduções na distribuição das probabilidades estacionárias para o repouso e a

socialização e aumento para o deslocamento. Essas previsões de alteração no orçamento de

atividade dos animais, mantendo-se o efeito das embarcações constante, podem trazer alguns

prejuízos, como alterações no risco de predação, baseado na redução do tempo gasto em repouso

e aumento do gasto energético com deslocamento ou alterações nas taxas de natalidade e

sobrevivência dos filhotes, comumente relacionadas à redução da socialização (cf., Lusseau 2003;

Lusseau e Higham, 2003).

A ESTATÍSTICA DE TESTE – PROCESSO DE MARKOV DE PRIMEIRA ORDEM

O objetivo do teste estatístico de hipóteses é fornecer ferramentas que nos permitam validar ou

rejeitar uma hipótese através dos resultados da amostra. O teste, aqui apresentado, é uma

aproximação do teste qui-quadrado ( 2χ ) onde estaremos investigando a hipótese nula de que as

observações, em pontos sucessivos no espaço unidimensional, segundo uma certa orientação

determinada sob um linha, sejam estatisticamente independentes versus a hipótese alternativa de

que as observações provenham de uma Cadeia de Markov de primeira ordem. Desta forma, a

propriedade markoviana da sequência é verificada mediante o uso de matrizes tabuladas segundo

mudanças do perfil comportamental. Deve-se enfatizar que a estatística de teste aqui apresentada

aplica-se somente a matrizes nas quais todos os elementos são positivos e diferentes de zero. As

limitações estatísticas impostas por elementos nulos podem ser superadas pela omissão de um

grau de liberdade para cada zero. Assim, as hipóteses são definidas como se segue:

H0: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo é a mesma de

ser seguido por outro comportamento qualquer, ou seja, no processo sequencial os vários

comportamentos categorizados em tempos discretizados independem uns dos outros.

H1: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo é diferente de

ser seguido por outro comportamento qualquer, ou seja, no processo sequencial os vários

comportamentos categorizados em tempos discretizados dependem daquele

imediatamente anterior.

A estatística de teste é assim definida, segundo (Anderson e Goodman, 1956):

∑=

=−

m

ji j

ij

ijp

pn

1, ˆ

ˆlog2)λlog(2 .

Esta estatística de teste, para averiguar a propriedade markoviana, segue uma distribuição qui-

quadrado 2)12( −m graus de liberdade ( 2

)1( 2χ~)λlog(2m-

− ), onde m é o número de estágios

categorizados, nij é a frequência de transições, ijp é a probabilidade de transições e pj é a

probabilidade total. Desta forma, rejeita-se a hipótese de que os eventos ocorrem de forma

independente (H0) se o valor calculado para )λlog(2− exceder o valor tabelado da 21χ m- a um

nível de significânciaα preestabelecido. Em nosso estudo, o valor tabelado (quantil da

distribuião qui-quadrado) é obtido a partir da qui-quadrado com 16 graus de liberdade e nível de

significância de 5%. De acordo com a região de rejeição especificada através do nível de

significância, rejeita-se a hipótese nula (H0) se nos baseamos no experimento realizado e nos

dados apresentados – Apêndica A3.

Embora os processos markovianos possam abranger desde as relativamente simples e

regulares Cadeias de Markov de primeira ordem até modelos complexos com memórias que se

estendem por dois ou mais intervalos no espaço, o teste aqui abordado encontra aplicação apenas

para o caso de verificação da propriedade markoviana com memória de um passo. Anderson e

Goodman (1956) apresentam outros testes que são aplicáveis às cadeias de ordem mais elevadas.

Assim, foram também implementados testes onde investigou-se a hipótese de que as observações,

em pontos sucessivos, no espaço unidimensional, fossem provenientes de uma Cadeia de Markov

de segunda ordem. Sem perda de informação, as hipóteses são definidas como se segue:

H0: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo e pelo (j+1)-

ésimo é a mesma de ser seguido por dois outros comportamentos quaisquer, ou seja,

vários comportamentos categorizados em tempos discretizados independem daqueles dois

imediatamente anteriores.

H1: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo e pelo (j+1)-

ésimo é diferente de ser seguido por dois outros quaisquer, ou seja, vários

comportamentos categorizados em tempos discretizados dependem daqueles dois

imediatamente anteriores.

Este teste resultou em p-valores muito altos, rejeitando-se, desta forma, a hipótese de que o

processo não seja somente de gênese de primeira ordem. Além de se estudar a ordem da Cadeia

de Markov, levou-se também em conta as variações sazonais inerentes ao processo sob estudo.

O EFEITO SAZONAL

Para a análise das transições comportamentais de boto-cinza é necessário que a probabilidade de

ocorrência permaneça a mesma ao longo do tempo. Com o intuito de avaliar a estabilidade das

transições ao longo do período de estudo, nós criamos uma tabela de contingência com três

dimensões para a cadeia controle: 2 estações (seca e chuvosa) x 5 comportamentos precedentes x

5 comportamentos sucessórios. O período referente a cada estação do ano foi determinado a partir

do índice médio pluviométrico dos últimos 10 anos para a cidade de Natal, RN. Meses com

médias pluviométricas abaixo de 100mm (setembro a janeiro) foram classificados em estação

seca, enquanto meses com médias superiores a 100mm (fevereiro a agosto), foram classificados

em estação chuvosa. Se a probabilidade de transição comportamental se mantiver estável ao

longo do tempo, o efeito da estação não influenciará as probabilidades de transição. Para testar a

independência das transições comportamentais da estação, nós conduzimos um teste de qui-

quadrado relativo à tabela de contingência de três dimensões. Para detectar o efeito do tempo nas

transições, nós comparamos o modelo saturado (estação x comportamento precedente x

comportamento sucessório) ao modelo de duas dimensões (comportamento precedente x

comportamento sucessório) – Apêndice A4.1.

Apesar de sabermos que seria necessário fazer a análise do efeito sazonal apenas para a

cadeia controle, uma vez que esta corresponde ao estado natural dos animais - ela é o nosso ponto

de partida para todas as predições, realizamos também a análise para a cadeia impacto

simplesmente a título de verificação – Apêndice A4.2.

ASSOCIAÇÃO CRUZADA

O método da Associação Cruzada é aqui apresentado com o intuito de se atingir o segundo

objetivo do estudo, isto é, comparar os perfis quanto às sequências comportamentais do boto-

cinza - observados na presença de embarcações e na ausência destas. Este método é usado para

comparação de duas sequências que contêm somente dados nominais, onde o uso do método

convencional da correlação cruzada não é apropriado. O método proposto sugere que a cada

posição correspondente, uma vez conservada a forma da sequência, o número de

correspondências e o número total de comparações sejam considerados. Assim, a razão simples:

ênciascorrespondnúmero de scomparaçõenúmero de

RS =

é calculada e pode ser usada como um índice de similaridade de duas sequências nas posições

sobrepostas. A significância da razão simples (Rs) será determinada através de um teste qui-

quadrado, assim estaremos testando o nível de similaridade entre as duas sequências em estudo:

1. controle e 2. impacto. Para realizar tal teste é necessário determinar o número de

correspondências e o número de não correspondências nas sequências sobrepostas. Precisamos,

também, da probabilidade de ocorrência de um número dado de correspondências entre duas

sequências totalmente aleatórias - Apêndice A5. Existem 5=m possíveis categorias (estados

comportamentais categorizados de cetáceos) nas quais as observações podem ser classificadas. Se

denotarmos por ckX o número de observações no k-ésimo estado (estágio) da sequência

“controle”, então o número total de observações nesta sequência será dado por: ∑=

=

=5

1

m

k

ckc Xn . De

forma análoga, o número total de observações da sequência “impacto” será dado por:

∑=

=

=5

1

m

k

iki Xn onde ikX é o número de observações no k-ésimo estado da sequência “impacto”.

Assim, para se determinar a probabilidade de as observações de duas sequências sejam

correspondentes, deve-se encontrar a soma dos produtos de cada uma das 5=m categorias nas

duas séries e determinar a razão pelo produto dos totais, isto é,

ic

m

k

ikck

nn

XX

p.

.5

1∑

=

== .

Assim, as hipóteses a serem testadas consistem em:

H0: o índice de similaridade entre as duas sequências não é significativo, ou seja, o

número de correspondências entre as duas sucessões é menor que o esperado em duas

sequências aleatórias de composições equivalentes.

H1: o índice de similaridade entre as duas sequências é significativo, ou seja, o número

de correspondências entre as duas sucessões é maior que o esperado em duas sequências

aleatórias de composições equivalentes.

A estatística de teste é dada pela qui-quadrado de Pearson:

( ) 22

1

22 χ~∑

=

−=

i i

ii

E

EOX , onde

O1 = número observado de correspondências, O2 = número observado de não – correspondências,

E1 = número esperado de correspondências e E2 = número esperado de não – correspondências.

CONSIDERAÇÕES FINAIS

De acordo com os resultados apresentados, podemos concluir que as sequências comportamentais

apresentam a característica markoviana de dependência de primeira ordem, dando consistência às

suposições do modelo estrutural.

Segundo o que nos fornecem as associações cruzadas, podemos concluir que os perfis sob

estudo – controle e impacto - são similares. Desta forma, bastaria um estudo exaustivo de um

destes para poder-se concluir sobre o fenômeno regionalizado – inserção da filosofia contida em

Cadeias de Markov Ocultas em trabalhos futuros. Contudo, vale lembrar que os resultados

obtidos podem ter sido influenciados pelo processo mais conservador de tratamento de dados.

Como foram inseridos na cadeia impacto dados originados de agregações com apenas um ou

poucos registros comportamentais na presença de embarcação, este aspecto pode estar

mascarando um maior efeito das embarcações sobre o comportamento dos animais.

Os métodos de Cadeias Markovianas e Associação Cruzada mostram-se importantes

ferramentas no auxílio ao estudo do padrão comportamental de espécies animais, especialmente

no que refere à estimação de previsões futuras quanto ao efeito antrópico e a viabilidade das

atividades turísticas para observação de animais.

BIBLIOGRAFIA

Altmann, J. 1974. Observational study of behavior: Sampling methods. Behaviour

49:227−267.

Anderson, T. W. e Goodman, L. A. (1956) “Statistical Inference About Markov Chains”,

Annals Mathematical Statistics, Vol. 18, p. 89 – 110.

Borobia, M., Siciliano, S., Lodi, L. e W. Hoek. 1991. Distribution of the South American

dolphin Sotalia fluviatilis. Canadian Journal of Zoology 69:1025–1039.

Carr, T. e R. K. Bonde. 2000. Tucuxi (Sotalia fluviatilis) occurs in Nicaragua, 800 km

north of its previously known range. Marine Mammal Science 16:447–452.

Dudewicz, E. J. e Mishra, S. N. (1988) “Modern Mathematical Statistics”. John Willey &

Sons, New York.

EMPARN, Empresa de Pesquisa Agropecuária do Rio Grande do Norte. 2009.

Meteorologia. http://www.emparn.rn.gov.br/links/meteorologia/meteorologia.asp. Data de

acesso: 10 de julho de 2009.

Flores, P. A. C. 1999. Preliminary results of a photoidentification study of the marine

tucuxi, sotalia fluviatilis, in southern Brazil. Marine Mammal Science 15:840−847.

Higham J.E.S. e Lusseau D. 2004. Ecological impacts and management of tourist

engagements with cetaceans. In: Environmental Impacts of Ecotourism (R. Buckley ed.), pp. 173-

188. CAB International Publishing: Wallingford.

Lusseau, D. e Higham, J. E. S. 2004. Managing the impacts of dolphin-based tourism

through the definition of critical habitats: the case of bottlenose dolphins (Tursiops spp.) in

Doubtful Sound, New Zealand. Tourism Management 25:657–667.

Lusseau D. 2004. The hidden cost of tourism: Effects of interactions with tour boats on

the behavioural budget of two populations of bottlenose dolphins in Fiordland, New Zealand.

Ecology and Society 9(1): 2 [online] formerly Conservation Ecology URL:

http://www.ecologyandsociety.org/vol9/iss1/art2

Lusseau D. 2003. The effects of tour boats on the behavior of bottlenose dolphins: Using

Markov chains to model anthropogenic impacts. Conservation Biology 17(6): 1785-1793.

Lusseau D. e Higham J.E.S. 2003. Managing the impacts of dolphin-based tourism

through the definition of critical habitats: the case of Doubtful Sound, New Zealand Tourism

Management 25(6): 657-667.

Mann, J. e Smuts, B.1999. Behavioral development in wild bottlenose dolphin newborns

(Tursiops sp.). Behaviour 136:529−566.

Mann, J. 1999. Behavioral sampling methods for cetaceans: a review and critique. Marine

Mammal Science 15:102−122.

Markov, A.A. 1971. Extension of the limit theorems of probability theory to a sum of

variables connected in a chain. Reprinted in Appendix B of: (Rasprostranenie zakona bol'shih

chisel na velichiny, zavisyaschie drug ot druga. Izvestiya Fiziko-matematicheskogo obschestva

pri Kazanskom universitete, 2-ya seriya, tom 15, pp. 135-156, 1906.), R. Howard. Dynamic

Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons.

Nowacek, D. P. 2002. Sequential foraging behaviour of bottlenose dolphins, Tursiops

truncatus, in Sarasota Bay, FL. Behaviour 139:1125−1145.

R Development Core Team (2009). R: A language and environment for statistical

computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL

http://www.R-project.org.

Shane, S. H. 1990. Behaviour and ecology of the bottlenose dolphin at Sanibel Island,

Florida. Pages 245−266 in S. Leatherwood and R. R. Reeves, eds. The bottlenose dolphin.

Academic Press, San Diego, USA.

Tosi, C. H. e Ferreira, R. G. 2008. Behavior of estuarine dolphin, Sotalia guianensis

(Cetacea, Delphinidae), in controlled boat traffic situation at southern coast of Rio Grande do

Norte, Brazil. Biodiversity and Conservation 18:67−78.

Williams, R., Lusseau, D. e Hammond. P. S. 2006. Estimating relative energetic costs of

human disturbance to killer whales (Orcinus orca). Biological Conservation 133:301−311.

APÊNCICE A: TUTORIAL EM R A1.1: # Matriz de transição - Processo Estacionário (invariável):

# Primeiro criamos a matriz de transição de uma Cadeia de Markov com os cinco estados:

# fo foraging forrageio

# fe feeding alimentação

# tr traveling deslocamento

# so socializing socialização

# re resting repouso

# A matriz controle contém o número de transições de um comportamento ao outro na ausência de

# barcos:

# fo fe tr so re tot

# fo 3400 506 66 135 32 4139

# fe 478 191 48 30 2 749

# tr 67 23 54 5 2 151

# so 141 24 8 232 1 406

# re 33 4 3 0 152 192

# tot 4119 748 179 402 189 5637

pi.control=matrix(c(3400/4139,506/4139,66/4139,135/4139,32/4139,478/749,191/749,48/749,30/749,2/7

49,67/151,23/151,54/151,5/151,2/151,141/406,24/406,8/406,232/406,1/406,33/192,4/192,3/192,0/192,1

52/192),ncol=5,nrow=5,byrow=T)

[,1] [,2] [,3] [,4] [,5]

[1,] 0.8214545 0.12225175 0.01594588 0.03261657 0.007731336

[2,] 0.6381842 0.25500668 0.06408545 0.04005340 0.002670227

[3,] 0.4437086 0.15231788 0.35761589 0.03311258 0.013245033

[4,] 0.3472906 0.05911330 0.01970443 0.57142857 0.002463054

[5,] 0.1718750 0.02083333 0.01562500 0.00000000 0.791666667

# A matriz impacto contém o número de transições de um comportamento ao outro na presença de

# barcos:

# fo fe tr so re tot

# fo 12039 1794 492 405 73 14803

# fe 1695 908 194 99 7 2903

# tr 509 101 1484 75 4 2173

# so 393 84 101 746 2 1326

# re 80 1 8 2 362 453

# tot 14716 2888 2279 1327 448 21658

# Dados de sequência comportamental registrados de dezembro de 2007 a fevereiro de 2009.

pi.impact=matrix(c(12039/14803,1794/14803,492/14803,405/14803,73/14803,1695/2903,908/2903,194/290

3,99/2903,7/2903,509/2173,101/2173,1484/2173,75/2173,4/217,393/1326,84/1326,101/1326,746/1326,2/1

326,80/453,1/453,8/453,2/453,362/453), ncol=5,nrow=5,byrow=T)

[,1] [,2] [,3] [,4] [,5]

[1,] 0.8132811 0.121191650 0.03323651 0.027359319 0.004931433

[2,] 0.5838787 0.312779883 0.06682742 0.034102652 0.002411299

[3,] 0.2342384 0.046479521 0.68292683 0.034514496 0.018433180

[4,] 0.2963801 0.063348416 0.07616893 0.562594268 0.001508296

[5,] 0.1766004 0.002207506 0.01766004 0.004415011 0.799116998

A1.2 # Test of Equal Proportions that can be used for testing the null that the proportions in several

# groups are the same.

# CONTROL: 5-sample test for equality of proportions without continuity correction.

# alternative hypothesis: two.sided.

total.control<-c(4119,748,179,402,189)

fo.control<-c(3400,506,66,135,32)

prop.test(fo.control,total.control)

# Results:

data: fo.control out of total.control

X-squared = 947.1134, df = 4, p-value < 2.2e-16

sample estimates:

prop 1 prop 2 prop 3 prop 4 prop 5

0.8254431 0.6764706 0.3687151 0.3358209 0.1693122

fe.control<-c(478,191,48,30,2)

prop.test(fe.control,total.control)

# Results:

data: fe.control out of total.control


sample estimates:


0.11604758 0.25534759 0.26815642 0.07462687 0.01058201

tr.control<-c(67,23,54,5,2)

prop.test(tr.control,total.control)

# Results:

data: tr.control out of total.control


sample estimates:


0.01626608 0.03074866 0.30167598 0.01243781 0.01058201

so.control<-c(141,24,8,232,1)

prop.test(so.control,total.control)

# Results:

data: so.control out of total.control


sample estimates:


0.034231610 0.032085561 0.044692737 0.577114428 0.005291005

re.control<-c(33,4,3,0,152)

prop.test(re.control,total.control)

data: re.control out of total.control


sample estimates:


0.008011653 0.005347594 0.016759777 0.000000000 0.804232804

# Test of Equal Proportions that can be used for testing the null that the proportions in several

# groups are the same.

# IMPACT: 5-sample test for equality of proportions without continuity correction.

# alternative hypothesis: two.sided.

total.impact<-c(14716,2888,2279,1327,448)

fo.impact<-c(12039,1794,492,405,73)

prop.test(fo.impact,total.impact)

# Results:

data: fo.impact out of total.impact


alternative hypothesis: two.sided

sample estimates:


0.8180892 0.6211911 0.2158842 0.3051997 0.1629464

fe.impact<-c(1695,908,194,99,7)

prop.test(fe.impact,total.impact)

# Results:

data: fe.impact out of total.impact



sample estimates:


0.11518076 0.31440443 0.08512505 0.07460437 0.01562500

tr.impact<-c(509 101 1484 75 4)

total.impact<-c(4119,748,179,402,189)

prop.test(tr.impact,total.impact)

# Results:

data: tr.impact out of total.impact


sample estimates:


0.01626608 0.03074866 0.30167598 0.01243781 0.01058201

so.impact<-c(393,84 ,101,746,2)

prop.test(so.impact,total.impact)

# Results:

data: so.impact out of total.impact



sample estimates:


0.026705627 0.029085873 0.044317683 0.562170309 0.004464286

re.impact<-c(80,1,8 ,2,362)

prop.test(re.impact,total.impact)

data: re.impact out of total.impact



sample estimates:


0.0054362599 0.0003462604 0.0035103115 0.0015071590 0.8080357143

A2: # Condição 1. O experimento foi realizado em intervalos fixos, a cada 2 minutos foi registrado o

# comportamento predominante da agregação.

# Condição 2: Processo Estacionário (invariável):

# Suponha que a Cadeia de Markov sempre se inicia segundo uma determinada lei original:

mu.control=c(1.0,0.0,0.0,0.0,0.0)

mu.impact=c(1.0,0.0,0.0,0.0,0.0)

# Então é possível calcular a distribuição marginal do segundo estado desta Cadeia de Markov:

mu.control=mu.control%*%pi.control; print(mu.control)

[,1] [,2] [,3] [,4] [,5]

[1,] 0.8214545 0.1222518 0.01594588 0.03261657 0.007731336

mu.impact=mu.impact%*%mu.impact; print(mu.impact)

[,1] [,2] [,3] [,4] [,5]

[1,] 0.8132811 0.1211917 0.03323651 0.02735932 0.004931433

# Sabe-se que a velocidade de convergência das marginais é determinada pelos autovalores e

# autovetores da matriz de transição. Pode-se facilmente obter essa quantidade através do

# comando:

eigen(t(pi.control))

$values

[1] 1.0000000 0.7852832 0.5369917 0.3487316 0.1261658

$vectors

[,1] [,2] [,3] [,4] [,5]

[1,] -0.97737250 -0.56762076 -0.63600722 -0.744126010 0.600387800

[2,] -0.17849003 -0.11547564 -0.12363435 0.097416815 -0.780384571

[3,] -0.04600636 -0.01405034 -0.01584248 0.660822751 0.174080708

[4,] -0.09461915 -0.11037534 0.76142011 -0.006792107 0.013273519

[5,] -0.04260198 0.80752209 0.01406394 -0.007321448 -0.007357457

eigen(t(pi.impact))

$values

[1] 1.0000000 0.7954745 0.6456378 0.5319797 0.1976071

$vectors

[,1] [,2] [,3] [,4] [,5]

[1,] 0.96375332 -0.47835589 -0.65997779 -0.476139110 -0.673272207

[2,] 0.18925208 -0.14128846 -0.12997499 -0.082320169 0.737335564

[3,] 0.16367184 -0.14772262 0.73889623 -0.278357063 -0.053417547

[4,] 0.08823550 -0.08266682 0.03703482 0.830052124 -0.013406881

[5,] 0.02809295 0.85003379 0.01402174 0.006764218 0.002761071

# O maior autovalor da matriz é, obviamente, 1.0, que é uma propriedade de matrizes estocástica,

# e o segundo autovalor nos informa sobre a velocidade de convergência:

(nu.control=eigen(t(pi.control))$values[2])

[1] 0.7852832

(nu.impact=eigen(t(pi.impact))$values[2])

[1] 0.7954745

# E para a estacionariedade (obtenção da distribuição estacionária), é necessário normalizar um

# autovetor associado ao primeiro autovalor:

v.control=eigen(t(pi.control))$vectors[,1]

(v.control=v.control/sum(v.control))

[1] 0.72987812 0.13329203 0.03435643 0.07065929 0.03181413

v.impact=eigen(t(pi.impact))$vectors[,1]

(v.impact=v.impact/sum(v.impact))

[1] 0.67253977 0.13206653 0.11421576 0.06157373 0.01960421

A3: nij.control=matrix(c(3400,506,66,135,32,478,191,48,30,2,67,23,54,5,2,141,24,8,232,1,33,4,3,0,152)

, ncol=5,nrow=5,byrow=T)

ni.control=c(4139,749,151,406,192)

pijhat.control=matrix(c(3400/4139,506/4139,66/4139,135/4139,32/4139,478/749,191/749,48/749,30/74,

2/749,67/151,23/151,54/151,5/151,2/151,141/406,24/406,8/406,232/406,1/406,33/192,4/192,3/192,0/19

2,152/192),ncol=5,nrow=5,byrow=T)

p.control=c(4119/5637,748/5637,179/5637,402/5637,189/5637)

lambda.control<-c(0,0,0,0,0)

for (i in 1:5)

est.control<-0

for (j in 1:5)

est.control<-est.control+(ni.control[i]*((pijhat.control[i,j]-

p.control[j])^2)/p.control[j])

lambda.control[i]<-est.control

lambda.control # [1] 251.6899 1311.4306 527.3403 1535.7117 3406.8558

qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623

sum((lambda.control)) # [1] 7033.028

qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795

nij.impact=matrix(c(12039,1794,492,405,73,1695,908,194,99,7,509,101,1484,75,4,393,84,101,746,2,80

,1,8,2,362),ncol=5,nrow=5,byrow=T)

ni.impact=c(14803,2903,2173,1326,453)

pijhat.impact=matrix(c(12039/14803,1794/14803,492/14803,405/14803,73/14803,1695/2903,908/2903,194

/2903,99/2903,7/2903,509/2173,101/2173,1484/2173,75/2173,4/2173,393/1326,84/1326,101/1326,746/132

6,2/1326,80/453,1/453,8/453,2/453,362/453),ncol=5,nrow=5,byrow=T)

p.impact=c(15035/22095,2929/22095,2334/22095,1343/22095,454/22095)

lambda.impact<-c(0,0,0,0,0)

for (i in 1:5)

est.impact<-0

for (j in 1:5)

est.impact<-est.impact+(ni.impact[i]*((pijhat.impact[i,j]-

p.impact[j])^2)/p.impact[j])

lambda.impact[i]<-est.impact

lambda.impact # [1] 1580.4188 872.8863 7674.6048 5863.1029 13647.7844

qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623

sum((lambda.impact)) # [1] 29638.8

qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795

A4.1: # CONTROLE:

# fo fe tr so re total

# est_seca fo 1676 320 37 62 11 2106

# fe 303 142 38 17 1 501

# tr 37 21 22 2 1 83

# so 68 13 2 103 0 186

# re 11 2 2 0 36 51

# total 2095 498 101 184 49 2927

pi.control.dry=matrix(c(1676/2106,320/2106,37/2106,62/2106,11/2106,303/501,142/501,38/501,17/501,

1/501,37/83,21/83,22/83,2/83,1/83,68/186,13/186,2/186,103/186,0/186,11/51,2/51,2/51,0/51,36/51),

ncol=5,nrow=5,byrow=T)

mu.control.dry=c(1.0,0.0,0.0,0.0,0.0); print(mu.control.dry)

mu.control.dry=mu.control.dry%*%pi.control.dry; print(mu.control.dry)

eigen(t(pi.control.dry))

nu.control=eigen(t(pi.control.dry))$values[2]

v.control.dry=eigen(t(pi.control.dry))$vectors[,1]

v.control.dry=v.control.dry/sum(v.control.dry)

v.control.dry

#[1] 0.71467402 0.17133325 0.03649488 0.06214839 0.01534945

nij.control.dry=matrix(c(1676,320,37,62,11,303,142,38,17,1,37,21,22,2,1,68,13,2,103,0,11,2,2,0,36

), ncol=5,nrow=5,byrow=T)

ni.control.dry=c(2106,501,83,186,51)

pijhat.control.dry=matrix(c(1676/2106,320/2106,37/2106,62/2106,11/2106,303/501,142/501,38/501,17/

501,1/501,37/83,21/83,22/83,2/83,1/83,68/186,13/186,2/186,103/186,0/186,11/51,2/51,2/51,0/51,36/5

1),ncol=5,nrow=5,byrow=T)

p.control.dry=c(2194/3698,863/3698,347/3698,242/3698,52/3698)

lambda.control.dry<-c(0,0,0,0,0)

for (i in 1:5)

est.control.dry<-0

for (j in 1:5)

est.control.dry<-est.control.dry+(ni.control.dry[i]*((pijhat.control.dry[i,j]-

p.control.dry[j])^2)/p.control.dry[j])

lambda.control.dry[i]<-est.control.dry

lambda.control.dry # [1] 389.37970 20.00703 31.30629 731.61625 1761.33830

qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623

sum(lambda.control.dry) # [1] 2933.648

qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795


# est_chuvosa fo 1723 186 29 73 21 2032

# fe 175 49 10 13 1 248

# tr 29 2 32 3 1 67

# so 73 11 6 129 1 220

# re 22 2 1 0 116 141

# total 2022 250 78 218 140 2708

pi.control.wet=matrix(c(1723/2032,186/2032,29/2032,73/2032,21/2032,175/248,49/248,10/248,13/248,1

/248,29/67,2/67,32/67,3/67,1/67,73/220,11/220,6/220,129/220,1/220,22/141,2/141,1/141,0/141,116/14

1),ncol=5,nrow=5,byrow=T)

mu.control.wet=c(1.0,0.0,0.0,0.0,0.0); print(mu.control.wet)

mu.control.wet=mu.control.wet%*%pi.control.wet; print(mu.control.wet)

eigen(t(pi.control.wet))

nu.control=eigen(t(pi.control.wet))$values[2]

v.control.wet=eigen(t(pi.control.wet))$vectors[,1]

v.control.wet=v.control.wet/sum(v.control.wet)

v.control.wet

#[1] 0.74535958 0.09209741 0.03232692 0.07990678 0.05030932

nij.control.wet=matrix(c(1723,186,29,73,21,175,49,10,13,1,29,2,32,3,1,73,11,6,129,1,22,2,1,0,116)

,ncol=5,nrow=5,byrow=T)

ni.control.wet=c(2032,248,67,220,141)

pijhat.control.wet=matrix(c(1723/2032,186/2032,29/2032,73/2032,21/2032,175/248,49/248,10/248,13/2

48,1/248,29/67,2/67,32/67,3/67,1/67,73/220,11/220,6/220,129/220,1/220,22/141,2/141,1/141,0/141,11

6/141),ncol=5,nrow=5,byrow=T)

p.control.wet=c(2094/3757,705/3757,452/3757,364/3757,142/3757)

lambda.control.wet<-c(0,0,0,0,0)

for (i in 1:5)

est.control.wet<-0

for (j in 1:5)

est.control.wet<-est.control.wet+(ni.control.wet[i]*((pijhat.control.wet[i,j]-

p.control.wet[j])^2)/p.control.wet[j])

lambda.control.wet[i]<-est.control.wet

lambda.control.wet # [1] 716.24890 35.64381 84.65673 608.59342 2390.30103

qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623

sum(lambda.control.wet) # [1] 3835.444

qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795

A4.2: # IMPACTO:


# est_seca fo 5440 938 169 146 19 6712

# fe 902 562 71 52 2 1589

# tr 172 38 387 24 0 621

# so 149 37 34 247 1 468

# re 24 0 0 0 47 71

# total 6687 1575 661 469 69 9461

pi.impact.dry=matrix(c(5440/6712,938/6712,169/6712,146/6712,19/6712,902/1589,562/1589,71/1589,52/

1589,2/1589,172/621,38/621,387/621,24/621,0/621,149/468,37/468,34/468,247/468,1/468,24/71,0/71,0/

71,0/71,47/71),ncol=5,nrow=5,byrow=T)

mu.impact.dry=c(1.0,0.0,0.0,0.0,0.0); print(mu.impact.dry)

mu.impact.dry=mu.impact.dry%*%pi.impact.dry; print(mu.impact.dry)

eigen(t(pi.impact.dry))

nu.impact=eigen(t(pi.impact.dry))$values[2]

v.impact.dry=eigen(t(pi.impact.dry))$vectors[,1]

v.impact.dry=v.impact.dry/sum(v.impact.dry)

v.impact.dry

#[1] 0.701956091 0.165104078 0.076124362 0.050006206 0.006809262

nij.impact.dry=matrix(c(5440,938,169,146,19,902,562,71,52,2,172,38,387,24,0,149,37,34,247,1,24,0,

0,0,47),ncol=5,nrow=5,byrow=T)

ni.impact.dry=c(6712,1589,621,468,71)

pijhat.impact.dry=matrix(c(5440/6712,938/6712,169/6712,146/6712,19/6712,902/1589,562/1589,71/1589

,52/1589,2/1589,172/621,38/621,387/621,24/621,0/621,149/468,37/468,34/468,247/468,1/468,24/71,0/7

1,0/71,0/71,47/71),ncol=5,nrow=5,byrow=T)

p.impact.dry=c(6835/11479,2812/11479,1217/11479,543/11479,72/11479)

lambda.impact.dry<-c(0,0,0,0,0)

for (i in 1:5)

est.impact.dry<-0

for (j in 1:5)

est.impact.dry<-est.impact.dry+(ni.impact.dry[i]*((pijhat.impact.dry[i,j]-

p.impact.dry[j])^2)/p.impact.dry[j])

lambda.impact.dry[i]<-est.impact.dry

lambda.impact.dry # [1] 389.37970 20.00703 31.30629 731.61625 1761.33830

qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623

sum(lambda.impact.dry) # [1] 2933.648

qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795


# est_chuvosa fo 6599 856 323 259 54 8091

# fe 793 346 123 47 5 1314

# tr 337 63 1097 51 4 1552

# so 244 47 67 499 1 858

# re 56 1 8 2 315 382

# total 8029 1313 1618 858 379 12197

pi.impact.wet=matrix(c(6599/8091,856/8091,323/8091,259/8091,54/8091,793/1314,346/1314,123/1314,47

/1314,5/1314,337/1552,63/1552,1097/1552,51/1552,4/1552,244/858,47/858,67/858,499/858,1/858,56/382

,1/382,8/382,2/382,379/382),ncol=5,nrow=5,byrow=T)

mu.impact.wet=c(1.0,0.0,0.0,0.0,0.0); print(mu.impact.wet)

mu.impact.wet=mu.impact.wet%*%pi.impact.wet; print(mu.impact.wet)

eigen(t(pi.impact.wet))

nu.impact=eigen(t(pi.impact.wet))$values[2]

v.impact.wet=eigen(t(pi.impact.wet))$vectors[,1]

v.impact.wet=v.impact.wet/sum(v.impact.wet)

v.impact.wet

#[1] 0.57928550 0.09202518 0.12437170 0.06027865 0.14403898

nij.impact.wet=matrix(c(6599,856,323,259,54,793,346,123,47,5,337,63,1097,51,4,244,47,67,499,1,56,

1,8,2,379),ncol=5,nrow=5,byrow=T)

ni.impact.wet=c(8091,1314,1552,858,382)

pijhat.impact.wet=matrix(c(6599/8091,856/8091,323/8091,259/8091,54/8091,793/1314,346/1314,123/131

4,47/1314,5/1314,337/1552,63/1552,1097/1552,51/1552,4/1552,244/858,47/858,67/858,499/858,1/858,56

/382,1/382,8/382,2/382,379/382),ncol=5,nrow=5,byrow=T)

p.impact.wet=c(8200/16998,4248/16998,2914/16998,1254/16998,382/16998)

lambda.impact.wet<-c(0,0,0,0,0)

for (i in 1:5)

est.impact.wet<-0

for (j in 1:5)

est.impact.wet<-est.impact.wet+(ni.impact.wet[i]*((pijhat.impact.wet[i,j]-

p.impact.wet[j])^2)/p.impact.wet[j])

lambda.impact.wet[i]<-est.impact.wet

lambda.impact.wet # [1] 389.37970 20.00703 31.30629 731.61625 1761.33830

qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623

sum(lambda.impact.wet) # [1] 2933.648

qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795

A5: # CONTROLE: total de 5856 observações – Xc1=4288 observações do estado 1, Xc2=1568 observações do

# estado 2, Xc3=799 observações do estado 3, Xc4=606 observações do estado 4 e Xc5=194

# observações do estado 5.

#

# IMPACTO: total de 22095 observações – Xi1=15035 observações do estado 1, Xc2=7060 observações

# do estado 2, Xi3=4131 observações do estado 3, Xi4=1797 observações do estado 4 e Xi5=454

# observações do estado 5.

# PROBABILIDADE: sum(Xc1*Xi1, Xc2*Xc2, Xc3*Xi3, Xc4*Xi4, Xc5*Xi5)

cross.sum <- sum(4288*15035,1568*7060,799*4131,606*1797,194*454)

cross.prob <- cross.sum/(5856*22095) [1] 0.6184321

# Correspondências entre as cadeias controle e impacto: fixou-se o mesmo tamanho para as duas

# sequências: Total=5719 observações pareadas.

# Número observado de correspondências: [1] 3029

1<->1: 2780; 2<->2: 200; 3<->3: 29; 4<->4: 5; 5<->5: 15

# Número observado de não-correspondências: [1] 2690

1->2: 587; 1->3: 606; 1->4: 112; 1->5: 106;

2->1: 596; 2->3: 108; 2->4: 21; 2->5: 21;

3->1: 136; 3->2: 16; 3->4: 4; 3->5: 4;

4->1: 250; 4->2: 44; 4->3: 88; 4->5: 15;

5->1: 129; 5->2: 26; 5->3: 16; 5->4: 5.

# Número esperado de correspondências: (5/25)*Total [1] 1143.8

# Número esperado de não-correspondências: (20/25)*Total [1] 4575.2

VALOR CALCULADO: x2 <- (3029-1143.8)^2/1143.8+(2690-4575.2)^2/4575.2 [1] 3883.96

VALOR TABELADO: > qchisq(0.95, df=1) [1] 3.841459

Documents

CADEIAS DE MARKOV E ASSOCIAÇÃO CRUZADA APLICADAS …LISE DO EFEITO... · CADEIAS DE MARKOV E ASSOCIAÇÃO CRUZADA APLICADAS AO ESTUDO DO EFEITO ANTRÓPICO EM CETÁCEOS Diana G