Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
CADEIAS DE MARKOV E ASSOCIAÇÃO CRUZADA APLICADAS AO ESTUDO DO EFEITO ANTRÓPICO EM CETÁCEOS
Diana G. Lunardi1, Paulo S. Lucio2*, André Gustavo C. Pereira2,
Francisco Moisés C. de Medeiros2, Renata G. Ferreira1
1PPG em Psicobiologia - Centro de Biociências - Universidade Federal do Rio Grande do Norte 2PPG em Matemática Aplicada e Estatística - Universidade Federal do Rio Grande do Norte
Campus de Natal – RN RESUMO: A análise de dados em sequência ou em Cadeia que incluam levantamentos comportamentais ao longo do tempo definido por propriedades ou estados, são muito comuns em ciências biológicas. O objetivo do uso de Cadeias de Markov neste estudo foi avaliar os efeitos do turismo de observação no comportamento do boto-cinza, Sotalia guianensis, uma espécie comum no litoral do Brasil. As observações foram realizadas a partir de um mirante localizado a 25m acima do nível do mar, na enseada do Madeiro-RN, entre dezembro de 2007 e fevereiro de 2009 e entre 6h e 16h. O estado comportamental predominante da agregação focal foi registrado a cada 2min e definido como mutuamente exclusivo. Foram observadas 658 agregações de golfinhos em 176 dias de amostragem, totalizando 1.223h de esforço. Na ausência de embarcação (controle), foram registradas 5.637 transições, enquanto na presença (impacto) foram registradas 21.658 transições entre estados comportamentais. A estatística de teste, uma aproximação do qui-quadrado de Pearson, foi utilizada para averiguar a propriedade markoviana. Neste estudo, rejeitou-se a hipótese nula de que os eventos ocorrem de forma independente e, portanto, assumiu-se uma Cadeia de Markov de primeira ordem, caracterizado por um processo estacionário. A partir da análise de associação cruzada, não foram detectadas diferenças significativas entre as cadeias controle e impacto. Contudo, de acordo com a distribuição das probabilidades estacionárias de ambas as cadeias, foram registrados aumentos de probabilidade para o deslocamento e diminuições para o repouso, o forrageio e a socialização, sinalizando uma previsão de alteração no orçamento das atividades dos botos-cinza a longo prazo. ABSTRACT: Analysis of data in sequence or chain that include behavioral sampling over time defined by properties or states, are very common in biological sciences. The purpose of the use of Markov chains in this study was to evaluate the effects of whale watching in the behavior of Guiana dolphin, Sotalia guianensis, a species common on the coast of Brazil. Systematic observations of Guiana dolphin were made from an observatory located in cliffs about 25m above sea level at Madeiro Bay, from December 2007 to February 2009 and between 6h and 16h. The predominant behavioral state of the focal aggregation was recorded every 2 minutes and defined as mutually exclusive. We observed 658 aggregations of dolphins in 176 days of sampling, totalizing 1,223h of effort. We recorded 5,637 transitions between behavioral states in the absence of vessel (control) and 21,658 transitions in the presence of these (impact). The statistic of test, an approximation of chi-square test was used to investigate the property of Markov. In this study we rejected the null hypothesis that the events occur independently and therefore we have assumed a Markov chain of first order, characterized by a stationary process. From the analysis of cross-association, there were no significant differences between control and impact chains. However, according with the stationary distribution of probabilities of both chains, we recorded a increase of probability for traveling and decreases for resting, foraging and socializing, signaling a prevision of change in the time budget of Guiana dolphins in long-term. Palavras-chave: probabilidades de transição, processo estacionário, sequência comportamental, Sotalia
guianensis, turismo de observação.
* Corresponding author: Departamento de Estatística – CCET – UFRN– Lagoa Nova - 59078-970 - Natal – RN.
INTRODUÇÃO
Efeitos de processos antrópicos no comportamento animal são aqueles derivados de atividades
humanas. Em geral, padrões comportamentais observados em áreas com efeitos antrópicos
diferem daqueles que ocorrem em ambientes naturais, sem influência humana. A análise de dados
em sequência ou em cadeia que incluam levantamentos comportamentais ao longo do tempo,
definido por propriedades ou estados, são muito comuns em Ciências Biológicas (e.g., Nowacek,
2002; Lusseau, 2003; Williams et al., 2006). As técnicas usuais para examiná-los fazem parte dos
conceitos fundamentais de Processos Estocásticos. Dentro deste contexto, propõe-se, neste
ensaio, o estudo de alguns parâmetros associados ao comportamento de cetáceos ao longo de
perfis longitudinais (sequencialmente selecionados) com vias à identificação de um padrão de
comportamento e verificação de impactos causados por barcos de turismo na região sob estudo.
Desta forma, o enfoque de Cadeias de Markov é uma metodologia estrutural para a caracterização
de comportamentos animais ao longo de uma escala de tempo discreta – no nosso caso, sendo
utilizado para avaliar se o efeito antrópico interfere no padrão comportamental de cetáceos. A
espécie em estudo é o boto-cinza, Sotalia guianensis, um golfinho que frequenta as enseadas da
região de Pipa no Rio Grande do Norte (RN), principalmente para forrageio (busca por alimento)
e alimentação.
A aplicação de modelos matemáticos em biologia geralmente é dificultada pelo
pressuposto de casualidade em modelos que invocam eventos totalmente independentes ou, em
outro extremo, pela exigência nos modelos determinísticos clássicos de que os eventos estejam
condicionados a variáveis específicas, predeterminadas e perfeitamente conhecidas. O modelo de
Cadeias de Markov, ocupando justamente uma posição intermediária nesse espectro de modelos
dinâmicos, presta-se com mais propriedade a ser utilizado na tentativa de explicação de processos
biológicos. Além disso, se aos valores obtidos por meio das Cadeias de Markov forem aplicados
métodos inferenciais, os resultados, quando comparados, permitirão com grande facilidade
verificar se os processos estudados apresentam alguma equivalência.
O objetivo do uso de Cadeia de Markov neste estudo é comparar probabilidades de
transição comportamental do boto-cinza na enseada do Madeiro (Pipa-RN) em duas condições:
na presença de embarcação de turismo e na ausência desta. Cinco estados comportamentais foram
avaliados: Forrageio (FO), Alimentação (FE), Deslocamento (TR), Socialização (SO) e Repouso
(RE). Os registros comportamentais tiveram duração de 2 minutos, ou seja, em 10 minutos pode
ter sido registrada a seguinte sequência: FO–FO–SO–FO–FE. Queremos saber se a presença dos
barcos na enseada afeta o padrão comportamental dos animais. Assim, foram observados 658
grupos de golfinhos em 176 dias de amostragem. Nas condições: 1. ausência de embarcação
(controle), quando foram registradas 5.637 transições; 2. presença de embarcação (impacto),
foram registradas um total de 21.658 transições entre estados comportamentais.
DADOS EXPERIMENTAIS
A área de estudo está localizada em uma unidade de conservação de uso sustentável denominada
REFAUTS (Reserva de Fauna Costeira de Tibau do Sul, Decreto Municipal nº 14, 17.03.2006),
na costa sul do estado do Rio Grande do Norte, com aproximadamente 536.000ha. A região é
caracterizada por duas estações do ano fortemente marcadas, uma seca (setembro a janeiro) e
outra chuvosa (fevereiro a agosto), apresentando pluviosidade média anual de aproximadamente
1500mm (EMPARN 2009). O boto-cinza é uma das menores espécies da família Delphinidae,
possuindo ampla distribuição ao longo da costa atlântica tropical e subtropical da América do Sul
e Central (Borobia et al., 1991; Flores, 1999; Carr e Bonde, 2000). É uma espécie gregária e pode
ser observada diariamente na Praia de Pipa, RN.
Foram realizadas observações sistemáticas do boto-cinza a partir de um mirante
localizado na enseada do Madeiro, a aproximadamente 25m do nível do mar, com o intuito de
inferir sobre o padrão comportamental dos animais não interferindo nos mesmos. As amostragens
ocorreram entre dezembro de 2007 e fevereiro de 2009, entre 6h e 16h, em condições favoráveis
de observação, com o auxílio de um binóculo Bushnell (7x50), um palmtop e um cronômetro. A
atividade predominante da maioria dos membros do grupo foi adaptada de outros autores (Mann
and Smuts 1999; Lusseau 2003; Tosi e Ferreira; 2008) e classificada via grupo focal (Altmann,
1974; Mann, 1999) em um dos cinco estados: Forrageio: caracterizado por uma natação não-
direcional no interior da enseada. Este contexto é frequentemente intercalado por contextos de
alimentação. Alimentação: caracterizado por eventos de perseguição, bote, manipulação e/ou
ingestão da presa. Os indivíduos do grupo podem se mover em várias direções, sem cooperação
aparente, ou podem ainda encurralar as presas, direcionando-as para águas rasas. Deslocamento:
natação caracterizada pelo movimento uniforme e direcional, resultante da mudança de posição
do animal de uma área a outra. Socialização: caracterizado por altos níveis de atividade e intenso
contato físico entre os indivíduos. Neste contexto os animais podem permanecer mais tempo na
superfície. Repouso: deslocamento lento ou ausência de deslocamento, com sincronização, na
maioria das vezes, de intervalos entre mergulhos.
O estado comportamental predominante da agregação focal foi registrado a cada 2min e
definido como mutuamente exclusivo. Os registros comportamentais das agregações foram
registrados em sequência, até o momento em que os animais deixaram a enseada ou saíram do
campo de visão do observador. Denominamos agregação um grupo de golfinhos observados em
aparente associação, movendo-se na mesma direção e frequentemente, mas nem sempre,
engajados na mesma atividade (Shane, 1990). Os registros comportamentais foram classificados
em duas condições: controle (ausência de embarcação) e impacto (presença de embarcação).
Assumindo uma posição bastante conservadora quanto ao grau de influência das embarcações
sobre as agregações, nós adicionamos à cadeia controle apenas registros comportamentais de
agregações observadas na ausência de embarcação durante todo o período de observação. Por
outro lado, à cadeia impacto foram adicionados registros comportamentais provenientes de
agregações observadas por pelo menos 2min (um registro) na presença de embarcação.
Foram observadas 658 agregações de golfinhos em 176 dias de amostragem, totalizando
1.223 horas de esforço. Deste total, os botos-cinza estiveram presentes em 933 horas (76%). Na
condição (i) ausência de embarcação (denominada controle), foram registradas 5.637 transições,
enquanto na condição (ii) presença de embarcação (denominada impacto), foram registradas
21.658 transições entre estados comportamentais.
PROCESSOS DE MARKOV DE PRIMEIRA ORDEM
Um processo estocástico unidimensional é uma coleção de variáveis aleatórias, todas definidas
em um mesmo espaço de probabilidades com valores definidos em Z = Z(x), x∈Ω. Uma
função aleatória ou uma realização de um processo estocástico unidimensional, é uma
determinação, para cada x∈Ω, de um valor possível de Z(x), onde Ω é chamado conjunto de
índices - quando Ω for não-enumerável, dizemos que o processo é a tempo contínuo e quando
enumerável dizemos que o processo é a tempo discreto. O conjunto S sobre o qual o processo
assume valores é denominado espaço de estados. No nosso problema o tempo é discreto e o
espaço de estados são discretos.
Um processo estocástico unidimensional Z = Z(x), x∈Ω, é um Processo de Markov de
primeira ordem se para qualquer escolha de x∈ℜ , tem-se que:
),)(|],()(())(,...,)(,)(|],()(( 122111 nnnnnn zxZbaxZPzxZzxZzxZbaxZP =∈====∈ ++
onde nxxx <<< ...21 . Um processo de Markov com espaço de estados discretos é dito uma
Cadeia de Markov.
Uma Cadeia de Markov com parâmetro temporal discreto nZ é um processo estocástico
markoviano cujo espaço de estados é um conjunto finito ou enumerável, e para o qual
0,1,2,...S = . Assim, )|( 11, iZjZPP nn
nn
ij === +
+ , que se denotará apenas por 1, +nn
ijP . A
quantidade 1, +nn
ijP é dita probabilidade de transição do estado “i” na posição (n) para o estado “j”
na posição (n+1). Quando 1, +nn
ijP não depende de n, ou seja, do tempo em que a transição é feita,
a cadeia possui a propriedade de probabilidade de transição estacionária e a cadeia é chamada de
homogênea ou estacionária. Neste caso, denotamos 1, +nn
ijP simplesmente por:
)|( 1 iZjZPP nnij === + .
As Cadeias de Markov homogêneas consideram sequências ou cadeias de estados em que
a transição de um estado para outro, dentro de um intervalo, depende de estados prévios, de tal
forma que as probabilidades associadas às transições entre os estados sejam estacionárias, isto é,
não dependem da posição. Neste sentido, pode-se afirmar que muitos processos biológicos
comportamentais possuem a propriedade markoviana, que se traduz pela influência de eventos
prévios em eventos subsequentes. Por este motivo, o método das Cadeias de Markov foi
selecionado como ferramenta para análise dos dados de natureza sequencial, provenientes deste
estudo, por julgá-lo de grande aplicação para o entendimento dos fenômenos comportamentais da
espécie aqui analisada.
O grau de dependência de um estado em relação à estados prévios nos informa a ordem da
cadeia. Desta forma, se existe um padrão de dependência apenas em relação ao estado
imediatamente anterior, a cadeia é classificada como de primeira ordem, se dois estados
imediatamente anteriores estão associados, a cadeia é dita de segunda ordem e envolve uma
unidade temporal. No entanto se os dois estados, que estão associados, não são imediatamente
precedentes, a cadeia possui ordem superior à segunda e os intervalos envolvidos podem ser
maiores que uma unidade temporal.
Para aplicarmos o método das Cadeias de Markov à nossa pesquisa, são necessárias
algumas definições prévias, adequando a teoria acima exposta ao nosso estudo. Assim, doravante,
um processo estocástico será traduzido como a sequência do comportamento animal,
caracterizado pela predominância comportamental. Os estados da cadeia serão os cinco (5)
estágios comportamentais: Forrageio (FO), Alimentação (FE), Deslocamento (TR), Socialização
(SO) e Repouso (RE). O espaço de estados será discreto e finito, devendo ser classificado
segundo o comportamento.
As Cadeias de Markov de primeira ordem e dependência simples são amplamente
utilizadas na ecologia para prever sucessão ecológica e clímax - tendo em vista sua relativa
facilidade de aplicação - mas na ecologia comportamental há poucos trabalhos que as associam
na abordagem de processos relacionados ao comportamento animal. No entanto, é comum
sequências comportamentais exibirem superposição de ciclos maiores (comportamentos sazonais)
sobre ciclos menores (comportamentos intra-sazonais), situações estas, que podem ser
representadas por matrizes markovianas de alta ordem, cuja estruturação e abordagem
matemática são tanto mais complexas quanto maior o grau de dependência revelado pelo
processo markoviano.
As matrizes de probabilidade de transições constituem uma forma simples e prática de
apresentação das Cadeias de Markov. O cálculo das probabilidades de transições baseia-se na
frequência de ocorrência de transições de um estágio para outro, observadas na representação do
processo considerado, isto é, na matriz de registros ou de frequências de transições. A verificação
da propriedade markoviana no processo é feita geralmente por meio da matriz de transições dos
parâmetros comportamentais onde os estágios envolvidos no processo correspondem ao
comportamento que compõe a sequência estudada.
A partir das matrizes de transições comportamentais, objetiva-se representar os diferentes
padrões por meio da sucessão de comportamentos, buscando uma sequência comportamental
específica a determinado contexto. Desta forma, as diversas composições ou associações
comportamentais de um ou diferentes grupos podem ser representadas por diferentes matrizes
markovianas. Considerando as observações feitas acima e a partir dos resultados obtidos na
matriz de frequências de transições (Mf) passamos então ao cálculo da matriz de probabilidades
de transição (Mp), que deve ser obtida a partir da correspondente matriz de registros, dividindo-se
cada elemento (nij) da i-ésima linha pelo total desta linha, ou seja, i
ij
ijn
np =ˆ , onde nij é o número
de vezes em que ocorre transição do estado “i” para o estado “j” e in é a frequência total de
transições do estado “i” para um qualquer dos outros estados.
Após o cálculo da matriz de probabilidades de transições (Mp) – Apêndice A1.1, o
próximo passo é a realização de um teste estatístico de hipóteses para a verificação da
propriedade markoviana relativa ao processo de comportamento animal. Foram também feitos
testes para proporções com relação ao número de “visitas” a cada estado – Apêndice A1.2,
quando se corroboram as diferentes probabilidades e se detectam os estados prevalentes em
termos das frequências. Não obstante, atenta-se ao fato de que a estruturação de uma sucessão de
eventos em uma matriz de probabilidades de transições não significa, necessariamente, que o
processo original seja um processo markoviano. É evidente, pois, que a aplicação do modelo
markoviano às sequências comportamentais categorizadas necessita da verificação da
propriedade markoviana. Para tanto, as suposições do teste são:
1. as matrizes devem ser tabuladas segundo intervalos fixos - o experimento foi realizado
em intervalos fixos, a cada 2 minutos foi registrado o comportamento predominante
da agregação;
2. a matriz de probabilidade de transições deve ser estacionária - Apêndice A2.
PROCESSOS DE MARKOV ESTACIONÁRIO
Para um espaço de estados discretos, as integrações na probabilidade de transição de k passos são
somatórios, e podem ser calculados como a k-ésima potência da matriz de transição. Isto é, se P
for a matriz de transição em um passo, então kP é a matriz de transição para a transição em k
passos. A distribuição estacionária π é o vetor que satisfaz à equação tππP = , onde t
π é o
vetor transposto de π . Em outras palavras, a distribuição estacionária π é o autovetor à esquerda
da matriz de transição, associado ao autovalor 1. Como consequencia, nem a existência nem a
unicidade de distribuição estacionária é garantida para uma matriz de transição qualquer P .
Contudo, se P for irredutível e aperiódica, então existe uma distribuição estacionária π . Além
disso, kP converge para uma matriz na qual cada linha é a distribuição estacionária Tπ , que é
dada por tk
kπP 1lim =
∞→ (Markov, 1906 in Howard, 1971) onde 1 é o vetor coluna com todas as
entradas iguais a 1. Isto é estabelecido pelo Teorema de Perron-Frobenius. Isto significa que se
nós simularmos ou observarmos um passeio aleatório com matriz de transição P , então a
probabilidade de longo prazo de que um indivíduo que realiza este passeio esteja em um certo
estado é independente do estado em que o passeio começou, e é definida pela distribuição
estacionária. O passeio aleatório "ignora" o passado. Em suma, Cadeias de Markov são o passo
seguinte depois dos processos sem memória (isto é, uma sequência de variáveis aleatórias
independentes distribuidas uniformemente). Uma matriz de transição que é positiva (isto é, todos
os elementos da matriz são positivos) é irredutível e aperiódica. Uma matriz é uma matriz
estocástica se e somente se é uma matriz de probabilidades de transição de uma Cadeia de
Markov.
Ao compararmos a distribuição das probabilidades estacionárias obtidas na ausência e na
presença de embarcação - Apêndice A2, detectamos reduções de até 33% para o repouso (de 0.03
para 0.02), 14% para a socialização (de 0.07 para 0.06) e 8% para o forrageio (de 0.73 para 0.67).
A probabilidade estacionária do deslocamento sofreu um aumento de 73% (de 0.03 para 0.1), e
da alimentação se manteve constante (0.13). Em um estudo realizado na região de Doubtful
Sound na Nova Zelândia, Lusseau (2003) investigou os efeitos do turismo no padrão
comportamental do golfinho nariz-de-garrafa, Tursiops truncatus, e obteve um padrão bastante
semelhante, com reduções na distribuição das probabilidades estacionárias para o repouso e a
socialização e aumento para o deslocamento. Essas previsões de alteração no orçamento de
atividade dos animais, mantendo-se o efeito das embarcações constante, podem trazer alguns
prejuízos, como alterações no risco de predação, baseado na redução do tempo gasto em repouso
e aumento do gasto energético com deslocamento ou alterações nas taxas de natalidade e
sobrevivência dos filhotes, comumente relacionadas à redução da socialização (cf., Lusseau 2003;
Lusseau e Higham, 2003).
A ESTATÍSTICA DE TESTE – PROCESSO DE MARKOV DE PRIMEIRA ORDEM
O objetivo do teste estatístico de hipóteses é fornecer ferramentas que nos permitam validar ou
rejeitar uma hipótese através dos resultados da amostra. O teste, aqui apresentado, é uma
aproximação do teste qui-quadrado ( 2χ ) onde estaremos investigando a hipótese nula de que as
observações, em pontos sucessivos no espaço unidimensional, segundo uma certa orientação
determinada sob um linha, sejam estatisticamente independentes versus a hipótese alternativa de
que as observações provenham de uma Cadeia de Markov de primeira ordem. Desta forma, a
propriedade markoviana da sequência é verificada mediante o uso de matrizes tabuladas segundo
mudanças do perfil comportamental. Deve-se enfatizar que a estatística de teste aqui apresentada
aplica-se somente a matrizes nas quais todos os elementos são positivos e diferentes de zero. As
limitações estatísticas impostas por elementos nulos podem ser superadas pela omissão de um
grau de liberdade para cada zero. Assim, as hipóteses são definidas como se segue:
H0: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo é a mesma de
ser seguido por outro comportamento qualquer, ou seja, no processo sequencial os vários
comportamentos categorizados em tempos discretizados independem uns dos outros.
H1: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo é diferente de
ser seguido por outro comportamento qualquer, ou seja, no processo sequencial os vários
comportamentos categorizados em tempos discretizados dependem daquele
imediatamente anterior.
A estatística de teste é assim definida, segundo (Anderson e Goodman, 1956):
∑=
=−
m
ji j
ij
ijp
pn
1, ˆ
ˆlog2)λlog(2 .
Esta estatística de teste, para averiguar a propriedade markoviana, segue uma distribuição qui-
quadrado 2)12( −m graus de liberdade ( 2
)1( 2χ~)λlog(2m-
− ), onde m é o número de estágios
categorizados, nij é a frequência de transições, ijp é a probabilidade de transições e pj é a
probabilidade total. Desta forma, rejeita-se a hipótese de que os eventos ocorrem de forma
independente (H0) se o valor calculado para )λlog(2− exceder o valor tabelado da 21χ m- a um
nível de significânciaα preestabelecido. Em nosso estudo, o valor tabelado (quantil da
distribuião qui-quadrado) é obtido a partir da qui-quadrado com 16 graus de liberdade e nível de
significância de 5%. De acordo com a região de rejeição especificada através do nível de
significância, rejeita-se a hipótese nula (H0) se nos baseamos no experimento realizado e nos
dados apresentados – Apêndica A3.
Embora os processos markovianos possam abranger desde as relativamente simples e
regulares Cadeias de Markov de primeira ordem até modelos complexos com memórias que se
estendem por dois ou mais intervalos no espaço, o teste aqui abordado encontra aplicação apenas
para o caso de verificação da propriedade markoviana com memória de um passo. Anderson e
Goodman (1956) apresentam outros testes que são aplicáveis às cadeias de ordem mais elevadas.
Assim, foram também implementados testes onde investigou-se a hipótese de que as observações,
em pontos sucessivos, no espaço unidimensional, fossem provenientes de uma Cadeia de Markov
de segunda ordem. Sem perda de informação, as hipóteses são definidas como se segue:
H0: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo e pelo (j+1)-
ésimo é a mesma de ser seguido por dois outros comportamentos quaisquer, ou seja,
vários comportamentos categorizados em tempos discretizados independem daqueles dois
imediatamente anteriores.
H1: A probabilidade do (i)-ésimo comportamento ser seguido pelo (j)-ésimo e pelo (j+1)-
ésimo é diferente de ser seguido por dois outros quaisquer, ou seja, vários
comportamentos categorizados em tempos discretizados dependem daqueles dois
imediatamente anteriores.
Este teste resultou em p-valores muito altos, rejeitando-se, desta forma, a hipótese de que o
processo não seja somente de gênese de primeira ordem. Além de se estudar a ordem da Cadeia
de Markov, levou-se também em conta as variações sazonais inerentes ao processo sob estudo.
O EFEITO SAZONAL
Para a análise das transições comportamentais de boto-cinza é necessário que a probabilidade de
ocorrência permaneça a mesma ao longo do tempo. Com o intuito de avaliar a estabilidade das
transições ao longo do período de estudo, nós criamos uma tabela de contingência com três
dimensões para a cadeia controle: 2 estações (seca e chuvosa) x 5 comportamentos precedentes x
5 comportamentos sucessórios. O período referente a cada estação do ano foi determinado a partir
do índice médio pluviométrico dos últimos 10 anos para a cidade de Natal, RN. Meses com
médias pluviométricas abaixo de 100mm (setembro a janeiro) foram classificados em estação
seca, enquanto meses com médias superiores a 100mm (fevereiro a agosto), foram classificados
em estação chuvosa. Se a probabilidade de transição comportamental se mantiver estável ao
longo do tempo, o efeito da estação não influenciará as probabilidades de transição. Para testar a
independência das transições comportamentais da estação, nós conduzimos um teste de qui-
quadrado relativo à tabela de contingência de três dimensões. Para detectar o efeito do tempo nas
transições, nós comparamos o modelo saturado (estação x comportamento precedente x
comportamento sucessório) ao modelo de duas dimensões (comportamento precedente x
comportamento sucessório) – Apêndice A4.1.
Apesar de sabermos que seria necessário fazer a análise do efeito sazonal apenas para a
cadeia controle, uma vez que esta corresponde ao estado natural dos animais - ela é o nosso ponto
de partida para todas as predições, realizamos também a análise para a cadeia impacto
simplesmente a título de verificação – Apêndice A4.2.
ASSOCIAÇÃO CRUZADA
O método da Associação Cruzada é aqui apresentado com o intuito de se atingir o segundo
objetivo do estudo, isto é, comparar os perfis quanto às sequências comportamentais do boto-
cinza - observados na presença de embarcações e na ausência destas. Este método é usado para
comparação de duas sequências que contêm somente dados nominais, onde o uso do método
convencional da correlação cruzada não é apropriado. O método proposto sugere que a cada
posição correspondente, uma vez conservada a forma da sequência, o número de
correspondências e o número total de comparações sejam considerados. Assim, a razão simples:
ênciascorrespondnúmero de scomparaçõenúmero de
RS =
é calculada e pode ser usada como um índice de similaridade de duas sequências nas posições
sobrepostas. A significância da razão simples (Rs) será determinada através de um teste qui-
quadrado, assim estaremos testando o nível de similaridade entre as duas sequências em estudo:
1. controle e 2. impacto. Para realizar tal teste é necessário determinar o número de
correspondências e o número de não correspondências nas sequências sobrepostas. Precisamos,
também, da probabilidade de ocorrência de um número dado de correspondências entre duas
sequências totalmente aleatórias - Apêndice A5. Existem 5=m possíveis categorias (estados
comportamentais categorizados de cetáceos) nas quais as observações podem ser classificadas. Se
denotarmos por ckX o número de observações no k-ésimo estado (estágio) da sequência
“controle”, então o número total de observações nesta sequência será dado por: ∑=
=
=5
1
m
k
ckc Xn . De
forma análoga, o número total de observações da sequência “impacto” será dado por:
∑=
=
=5
1
m
k
iki Xn onde ikX é o número de observações no k-ésimo estado da sequência “impacto”.
Assim, para se determinar a probabilidade de as observações de duas sequências sejam
correspondentes, deve-se encontrar a soma dos produtos de cada uma das 5=m categorias nas
duas séries e determinar a razão pelo produto dos totais, isto é,
ic
m
k
ikck
nn
XX
p.
.5
1∑
=
== .
Assim, as hipóteses a serem testadas consistem em:
H0: o índice de similaridade entre as duas sequências não é significativo, ou seja, o
número de correspondências entre as duas sucessões é menor que o esperado em duas
sequências aleatórias de composições equivalentes.
H1: o índice de similaridade entre as duas sequências é significativo, ou seja, o número
de correspondências entre as duas sucessões é maior que o esperado em duas sequências
aleatórias de composições equivalentes.
A estatística de teste é dada pela qui-quadrado de Pearson:
( ) 22
1
22 χ~∑
=
−=
i i
ii
E
EOX , onde
O1 = número observado de correspondências, O2 = número observado de não – correspondências,
E1 = número esperado de correspondências e E2 = número esperado de não – correspondências.
CONSIDERAÇÕES FINAIS
De acordo com os resultados apresentados, podemos concluir que as sequências comportamentais
apresentam a característica markoviana de dependência de primeira ordem, dando consistência às
suposições do modelo estrutural.
Segundo o que nos fornecem as associações cruzadas, podemos concluir que os perfis sob
estudo – controle e impacto - são similares. Desta forma, bastaria um estudo exaustivo de um
destes para poder-se concluir sobre o fenômeno regionalizado – inserção da filosofia contida em
Cadeias de Markov Ocultas em trabalhos futuros. Contudo, vale lembrar que os resultados
obtidos podem ter sido influenciados pelo processo mais conservador de tratamento de dados.
Como foram inseridos na cadeia impacto dados originados de agregações com apenas um ou
poucos registros comportamentais na presença de embarcação, este aspecto pode estar
mascarando um maior efeito das embarcações sobre o comportamento dos animais.
Os métodos de Cadeias Markovianas e Associação Cruzada mostram-se importantes
ferramentas no auxílio ao estudo do padrão comportamental de espécies animais, especialmente
no que refere à estimação de previsões futuras quanto ao efeito antrópico e a viabilidade das
atividades turísticas para observação de animais.
BIBLIOGRAFIA
Altmann, J. 1974. Observational study of behavior: Sampling methods. Behaviour
49:227−267.
Anderson, T. W. e Goodman, L. A. (1956) “Statistical Inference About Markov Chains”,
Annals Mathematical Statistics, Vol. 18, p. 89 – 110.
Borobia, M., Siciliano, S., Lodi, L. e W. Hoek. 1991. Distribution of the South American
dolphin Sotalia fluviatilis. Canadian Journal of Zoology 69:1025–1039.
Carr, T. e R. K. Bonde. 2000. Tucuxi (Sotalia fluviatilis) occurs in Nicaragua, 800 km
north of its previously known range. Marine Mammal Science 16:447–452.
Dudewicz, E. J. e Mishra, S. N. (1988) “Modern Mathematical Statistics”. John Willey &
Sons, New York.
EMPARN, Empresa de Pesquisa Agropecuária do Rio Grande do Norte. 2009.
Meteorologia. http://www.emparn.rn.gov.br/links/meteorologia/meteorologia.asp. Data de
acesso: 10 de julho de 2009.
Flores, P. A. C. 1999. Preliminary results of a photoidentification study of the marine
tucuxi, sotalia fluviatilis, in southern Brazil. Marine Mammal Science 15:840−847.
Higham J.E.S. e Lusseau D. 2004. Ecological impacts and management of tourist
engagements with cetaceans. In: Environmental Impacts of Ecotourism (R. Buckley ed.), pp. 173-
188. CAB International Publishing: Wallingford.
Lusseau, D. e Higham, J. E. S. 2004. Managing the impacts of dolphin-based tourism
through the definition of critical habitats: the case of bottlenose dolphins (Tursiops spp.) in
Doubtful Sound, New Zealand. Tourism Management 25:657–667.
Lusseau D. 2004. The hidden cost of tourism: Effects of interactions with tour boats on
the behavioural budget of two populations of bottlenose dolphins in Fiordland, New Zealand.
Ecology and Society 9(1): 2 [online] formerly Conservation Ecology URL:
http://www.ecologyandsociety.org/vol9/iss1/art2
Lusseau D. 2003. The effects of tour boats on the behavior of bottlenose dolphins: Using
Markov chains to model anthropogenic impacts. Conservation Biology 17(6): 1785-1793.
Lusseau D. e Higham J.E.S. 2003. Managing the impacts of dolphin-based tourism
through the definition of critical habitats: the case of Doubtful Sound, New Zealand Tourism
Management 25(6): 657-667.
Mann, J. e Smuts, B.1999. Behavioral development in wild bottlenose dolphin newborns
(Tursiops sp.). Behaviour 136:529−566.
Mann, J. 1999. Behavioral sampling methods for cetaceans: a review and critique. Marine
Mammal Science 15:102−122.
Markov, A.A. 1971. Extension of the limit theorems of probability theory to a sum of
variables connected in a chain. Reprinted in Appendix B of: (Rasprostranenie zakona bol'shih
chisel na velichiny, zavisyaschie drug ot druga. Izvestiya Fiziko-matematicheskogo obschestva
pri Kazanskom universitete, 2-ya seriya, tom 15, pp. 135-156, 1906.), R. Howard. Dynamic
Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons.
Nowacek, D. P. 2002. Sequential foraging behaviour of bottlenose dolphins, Tursiops
truncatus, in Sarasota Bay, FL. Behaviour 139:1125−1145.
R Development Core Team (2009). R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL
http://www.R-project.org.
Shane, S. H. 1990. Behaviour and ecology of the bottlenose dolphin at Sanibel Island,
Florida. Pages 245−266 in S. Leatherwood and R. R. Reeves, eds. The bottlenose dolphin.
Academic Press, San Diego, USA.
Tosi, C. H. e Ferreira, R. G. 2008. Behavior of estuarine dolphin, Sotalia guianensis
(Cetacea, Delphinidae), in controlled boat traffic situation at southern coast of Rio Grande do
Norte, Brazil. Biodiversity and Conservation 18:67−78.
Williams, R., Lusseau, D. e Hammond. P. S. 2006. Estimating relative energetic costs of
human disturbance to killer whales (Orcinus orca). Biological Conservation 133:301−311.
APÊNCICE A: TUTORIAL EM R A1.1: # Matriz de transição - Processo Estacionário (invariável):
# Primeiro criamos a matriz de transição de uma Cadeia de Markov com os cinco estados:
# fo foraging forrageio
# fe feeding alimentação
# tr traveling deslocamento
# so socializing socialização
# re resting repouso
# A matriz controle contém o número de transições de um comportamento ao outro na ausência de
# barcos:
# fo fe tr so re tot
# fo 3400 506 66 135 32 4139
# fe 478 191 48 30 2 749
# tr 67 23 54 5 2 151
# so 141 24 8 232 1 406
# re 33 4 3 0 152 192
# tot 4119 748 179 402 189 5637
pi.control=matrix(c(3400/4139,506/4139,66/4139,135/4139,32/4139,478/749,191/749,48/749,30/749,2/7
49,67/151,23/151,54/151,5/151,2/151,141/406,24/406,8/406,232/406,1/406,33/192,4/192,3/192,0/192,1
52/192),ncol=5,nrow=5,byrow=T)
[,1] [,2] [,3] [,4] [,5]
[1,] 0.8214545 0.12225175 0.01594588 0.03261657 0.007731336
[2,] 0.6381842 0.25500668 0.06408545 0.04005340 0.002670227
[3,] 0.4437086 0.15231788 0.35761589 0.03311258 0.013245033
[4,] 0.3472906 0.05911330 0.01970443 0.57142857 0.002463054
[5,] 0.1718750 0.02083333 0.01562500 0.00000000 0.791666667
# A matriz impacto contém o número de transições de um comportamento ao outro na presença de
# barcos:
# fo fe tr so re tot
# fo 12039 1794 492 405 73 14803
# fe 1695 908 194 99 7 2903
# tr 509 101 1484 75 4 2173
# so 393 84 101 746 2 1326
# re 80 1 8 2 362 453
# tot 14716 2888 2279 1327 448 21658
# Dados de sequência comportamental registrados de dezembro de 2007 a fevereiro de 2009.
pi.impact=matrix(c(12039/14803,1794/14803,492/14803,405/14803,73/14803,1695/2903,908/2903,194/290
3,99/2903,7/2903,509/2173,101/2173,1484/2173,75/2173,4/217,393/1326,84/1326,101/1326,746/1326,2/1
326,80/453,1/453,8/453,2/453,362/453), ncol=5,nrow=5,byrow=T)
[,1] [,2] [,3] [,4] [,5]
[1,] 0.8132811 0.121191650 0.03323651 0.027359319 0.004931433
[2,] 0.5838787 0.312779883 0.06682742 0.034102652 0.002411299
[3,] 0.2342384 0.046479521 0.68292683 0.034514496 0.018433180
[4,] 0.2963801 0.063348416 0.07616893 0.562594268 0.001508296
[5,] 0.1766004 0.002207506 0.01766004 0.004415011 0.799116998
A1.2 # Test of Equal Proportions that can be used for testing the null that the proportions in several
# groups are the same.
# CONTROL: 5-sample test for equality of proportions without continuity correction.
# alternative hypothesis: two.sided.
total.control<-c(4119,748,179,402,189)
fo.control<-c(3400,506,66,135,32)
prop.test(fo.control,total.control)
# Results:
data: fo.control out of total.control
X-squared = 947.1134, df = 4, p-value < 2.2e-16
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.8254431 0.6764706 0.3687151 0.3358209 0.1693122
fe.control<-c(478,191,48,30,2)
prop.test(fe.control,total.control)
# Results:
data: fe.control out of total.control
X-squared = 172.3044, df = 4, p-value < 2.2e-16
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.11604758 0.25534759 0.26815642 0.07462687 0.01058201
tr.control<-c(67,23,54,5,2)
prop.test(tr.control,total.control)
# Results:
data: tr.control out of total.control
X-squared = 541.8551, df = 4, p-value < 2.2e-16
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.01626608 0.03074866 0.30167598 0.01243781 0.01058201
so.control<-c(141,24,8,232,1)
prop.test(so.control,total.control)
# Results:
data: so.control out of total.control
X-squared = 1654.905, df = 4, p-value < 2.2e-16
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.034231610 0.032085561 0.044692737 0.577114428 0.005291005
re.control<-c(33,4,3,0,152)
prop.test(re.control,total.control)
data: re.control out of total.control
X-squared = 3526.987, df = 4, p-value < 2.2e-16
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.008011653 0.005347594 0.016759777 0.000000000 0.804232804
# Test of Equal Proportions that can be used for testing the null that the proportions in several
# groups are the same.
# IMPACT: 5-sample test for equality of proportions without continuity correction.
# alternative hypothesis: two.sided.
total.impact<-c(14716,2888,2279,1327,448)
fo.impact<-c(12039,1794,492,405,73)
prop.test(fo.impact,total.impact)
# Results:
data: fo.impact out of total.impact
X-squared = 5026.646, df = 4, p-value < 2.2e-16
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.8180892 0.6211911 0.2158842 0.3051997 0.1629464
fe.impact<-c(1695,908,194,99,7)
prop.test(fe.impact,total.impact)
# Results:
data: fe.impact out of total.impact
X-squared = 995.9948, df = 4, p-value < 2.2e-16
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.11518076 0.31440443 0.08512505 0.07460437 0.01562500
tr.impact<-c(509 101 1484 75 4)
total.impact<-c(4119,748,179,402,189)
prop.test(tr.impact,total.impact)
# Results:
data: tr.impact out of total.impact
X-squared = 541.8551, df = 4, p-value < 2.2e-16
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.01626608 0.03074866 0.30167598 0.01243781 0.01058201
so.impact<-c(393,84 ,101,746,2)
prop.test(so.impact,total.impact)
# Results:
data: so.impact out of total.impact
X-squared = 6187.254, df = 4, p-value < 2.2e-16
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.026705627 0.029085873 0.044317683 0.562170309 0.004464286
re.impact<-c(80,1,8 ,2,362)
prop.test(re.impact,total.impact)
data: re.impact out of total.impact
X-squared = 13843.75, df = 4, p-value < 2.2e-16
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3 prop 4 prop 5
0.0054362599 0.0003462604 0.0035103115 0.0015071590 0.8080357143
A2: # Condição 1. O experimento foi realizado em intervalos fixos, a cada 2 minutos foi registrado o
# comportamento predominante da agregação.
# Condição 2: Processo Estacionário (invariável):
# Suponha que a Cadeia de Markov sempre se inicia segundo uma determinada lei original:
mu.control=c(1.0,0.0,0.0,0.0,0.0)
mu.impact=c(1.0,0.0,0.0,0.0,0.0)
# Então é possível calcular a distribuição marginal do segundo estado desta Cadeia de Markov:
mu.control=mu.control%*%pi.control; print(mu.control)
[,1] [,2] [,3] [,4] [,5]
[1,] 0.8214545 0.1222518 0.01594588 0.03261657 0.007731336
mu.impact=mu.impact%*%mu.impact; print(mu.impact)
[,1] [,2] [,3] [,4] [,5]
[1,] 0.8132811 0.1211917 0.03323651 0.02735932 0.004931433
# Sabe-se que a velocidade de convergência das marginais é determinada pelos autovalores e
# autovetores da matriz de transição. Pode-se facilmente obter essa quantidade através do
# comando:
eigen(t(pi.control))
$values
[1] 1.0000000 0.7852832 0.5369917 0.3487316 0.1261658
$vectors
[,1] [,2] [,3] [,4] [,5]
[1,] -0.97737250 -0.56762076 -0.63600722 -0.744126010 0.600387800
[2,] -0.17849003 -0.11547564 -0.12363435 0.097416815 -0.780384571
[3,] -0.04600636 -0.01405034 -0.01584248 0.660822751 0.174080708
[4,] -0.09461915 -0.11037534 0.76142011 -0.006792107 0.013273519
[5,] -0.04260198 0.80752209 0.01406394 -0.007321448 -0.007357457
eigen(t(pi.impact))
$values
[1] 1.0000000 0.7954745 0.6456378 0.5319797 0.1976071
$vectors
[,1] [,2] [,3] [,4] [,5]
[1,] 0.96375332 -0.47835589 -0.65997779 -0.476139110 -0.673272207
[2,] 0.18925208 -0.14128846 -0.12997499 -0.082320169 0.737335564
[3,] 0.16367184 -0.14772262 0.73889623 -0.278357063 -0.053417547
[4,] 0.08823550 -0.08266682 0.03703482 0.830052124 -0.013406881
[5,] 0.02809295 0.85003379 0.01402174 0.006764218 0.002761071
# O maior autovalor da matriz é, obviamente, 1.0, que é uma propriedade de matrizes estocástica,
# e o segundo autovalor nos informa sobre a velocidade de convergência:
(nu.control=eigen(t(pi.control))$values[2])
[1] 0.7852832
(nu.impact=eigen(t(pi.impact))$values[2])
[1] 0.7954745
# E para a estacionariedade (obtenção da distribuição estacionária), é necessário normalizar um
# autovetor associado ao primeiro autovalor:
v.control=eigen(t(pi.control))$vectors[,1]
(v.control=v.control/sum(v.control))
[1] 0.72987812 0.13329203 0.03435643 0.07065929 0.03181413
v.impact=eigen(t(pi.impact))$vectors[,1]
(v.impact=v.impact/sum(v.impact))
[1] 0.67253977 0.13206653 0.11421576 0.06157373 0.01960421
A3: nij.control=matrix(c(3400,506,66,135,32,478,191,48,30,2,67,23,54,5,2,141,24,8,232,1,33,4,3,0,152)
, ncol=5,nrow=5,byrow=T)
ni.control=c(4139,749,151,406,192)
pijhat.control=matrix(c(3400/4139,506/4139,66/4139,135/4139,32/4139,478/749,191/749,48/749,30/74,
2/749,67/151,23/151,54/151,5/151,2/151,141/406,24/406,8/406,232/406,1/406,33/192,4/192,3/192,0/19
2,152/192),ncol=5,nrow=5,byrow=T)
p.control=c(4119/5637,748/5637,179/5637,402/5637,189/5637)
lambda.control<-c(0,0,0,0,0)
for (i in 1:5)
est.control<-0
for (j in 1:5)
est.control<-est.control+(ni.control[i]*((pijhat.control[i,j]-
p.control[j])^2)/p.control[j])
lambda.control[i]<-est.control
lambda.control # [1] 251.6899 1311.4306 527.3403 1535.7117 3406.8558
qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623
sum((lambda.control)) # [1] 7033.028
qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795
nij.impact=matrix(c(12039,1794,492,405,73,1695,908,194,99,7,509,101,1484,75,4,393,84,101,746,2,80
,1,8,2,362),ncol=5,nrow=5,byrow=T)
ni.impact=c(14803,2903,2173,1326,453)
pijhat.impact=matrix(c(12039/14803,1794/14803,492/14803,405/14803,73/14803,1695/2903,908/2903,194
/2903,99/2903,7/2903,509/2173,101/2173,1484/2173,75/2173,4/2173,393/1326,84/1326,101/1326,746/132
6,2/1326,80/453,1/453,8/453,2/453,362/453),ncol=5,nrow=5,byrow=T)
p.impact=c(15035/22095,2929/22095,2334/22095,1343/22095,454/22095)
lambda.impact<-c(0,0,0,0,0)
for (i in 1:5)
est.impact<-0
for (j in 1:5)
est.impact<-est.impact+(ni.impact[i]*((pijhat.impact[i,j]-
p.impact[j])^2)/p.impact[j])
lambda.impact[i]<-est.impact
lambda.impact # [1] 1580.4188 872.8863 7674.6048 5863.1029 13647.7844
qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623
sum((lambda.impact)) # [1] 29638.8
qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795
A4.1: # CONTROLE:
# fo fe tr so re total
# est_seca fo 1676 320 37 62 11 2106
# fe 303 142 38 17 1 501
# tr 37 21 22 2 1 83
# so 68 13 2 103 0 186
# re 11 2 2 0 36 51
# total 2095 498 101 184 49 2927
pi.control.dry=matrix(c(1676/2106,320/2106,37/2106,62/2106,11/2106,303/501,142/501,38/501,17/501,
1/501,37/83,21/83,22/83,2/83,1/83,68/186,13/186,2/186,103/186,0/186,11/51,2/51,2/51,0/51,36/51),
ncol=5,nrow=5,byrow=T)
mu.control.dry=c(1.0,0.0,0.0,0.0,0.0); print(mu.control.dry)
mu.control.dry=mu.control.dry%*%pi.control.dry; print(mu.control.dry)
eigen(t(pi.control.dry))
nu.control=eigen(t(pi.control.dry))$values[2]
v.control.dry=eigen(t(pi.control.dry))$vectors[,1]
v.control.dry=v.control.dry/sum(v.control.dry)
v.control.dry
#[1] 0.71467402 0.17133325 0.03649488 0.06214839 0.01534945
nij.control.dry=matrix(c(1676,320,37,62,11,303,142,38,17,1,37,21,22,2,1,68,13,2,103,0,11,2,2,0,36
), ncol=5,nrow=5,byrow=T)
ni.control.dry=c(2106,501,83,186,51)
pijhat.control.dry=matrix(c(1676/2106,320/2106,37/2106,62/2106,11/2106,303/501,142/501,38/501,17/
501,1/501,37/83,21/83,22/83,2/83,1/83,68/186,13/186,2/186,103/186,0/186,11/51,2/51,2/51,0/51,36/5
1),ncol=5,nrow=5,byrow=T)
p.control.dry=c(2194/3698,863/3698,347/3698,242/3698,52/3698)
lambda.control.dry<-c(0,0,0,0,0)
for (i in 1:5)
est.control.dry<-0
for (j in 1:5)
est.control.dry<-est.control.dry+(ni.control.dry[i]*((pijhat.control.dry[i,j]-
p.control.dry[j])^2)/p.control.dry[j])
lambda.control.dry[i]<-est.control.dry
lambda.control.dry # [1] 389.37970 20.00703 31.30629 731.61625 1761.33830
qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623
sum(lambda.control.dry) # [1] 2933.648
qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795
# fo fe tr so re total
# est_chuvosa fo 1723 186 29 73 21 2032
# fe 175 49 10 13 1 248
# tr 29 2 32 3 1 67
# so 73 11 6 129 1 220
# re 22 2 1 0 116 141
# total 2022 250 78 218 140 2708
pi.control.wet=matrix(c(1723/2032,186/2032,29/2032,73/2032,21/2032,175/248,49/248,10/248,13/248,1
/248,29/67,2/67,32/67,3/67,1/67,73/220,11/220,6/220,129/220,1/220,22/141,2/141,1/141,0/141,116/14
1),ncol=5,nrow=5,byrow=T)
mu.control.wet=c(1.0,0.0,0.0,0.0,0.0); print(mu.control.wet)
mu.control.wet=mu.control.wet%*%pi.control.wet; print(mu.control.wet)
eigen(t(pi.control.wet))
nu.control=eigen(t(pi.control.wet))$values[2]
v.control.wet=eigen(t(pi.control.wet))$vectors[,1]
v.control.wet=v.control.wet/sum(v.control.wet)
v.control.wet
#[1] 0.74535958 0.09209741 0.03232692 0.07990678 0.05030932
nij.control.wet=matrix(c(1723,186,29,73,21,175,49,10,13,1,29,2,32,3,1,73,11,6,129,1,22,2,1,0,116)
,ncol=5,nrow=5,byrow=T)
ni.control.wet=c(2032,248,67,220,141)
pijhat.control.wet=matrix(c(1723/2032,186/2032,29/2032,73/2032,21/2032,175/248,49/248,10/248,13/2
48,1/248,29/67,2/67,32/67,3/67,1/67,73/220,11/220,6/220,129/220,1/220,22/141,2/141,1/141,0/141,11
6/141),ncol=5,nrow=5,byrow=T)
p.control.wet=c(2094/3757,705/3757,452/3757,364/3757,142/3757)
lambda.control.wet<-c(0,0,0,0,0)
for (i in 1:5)
est.control.wet<-0
for (j in 1:5)
est.control.wet<-est.control.wet+(ni.control.wet[i]*((pijhat.control.wet[i,j]-
p.control.wet[j])^2)/p.control.wet[j])
lambda.control.wet[i]<-est.control.wet
lambda.control.wet # [1] 716.24890 35.64381 84.65673 608.59342 2390.30103
qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623
sum(lambda.control.wet) # [1] 3835.444
qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795
A4.2: # IMPACTO:
# fo fe tr so re total
# est_seca fo 5440 938 169 146 19 6712
# fe 902 562 71 52 2 1589
# tr 172 38 387 24 0 621
# so 149 37 34 247 1 468
# re 24 0 0 0 47 71
# total 6687 1575 661 469 69 9461
pi.impact.dry=matrix(c(5440/6712,938/6712,169/6712,146/6712,19/6712,902/1589,562/1589,71/1589,52/
1589,2/1589,172/621,38/621,387/621,24/621,0/621,149/468,37/468,34/468,247/468,1/468,24/71,0/71,0/
71,0/71,47/71),ncol=5,nrow=5,byrow=T)
mu.impact.dry=c(1.0,0.0,0.0,0.0,0.0); print(mu.impact.dry)
mu.impact.dry=mu.impact.dry%*%pi.impact.dry; print(mu.impact.dry)
eigen(t(pi.impact.dry))
nu.impact=eigen(t(pi.impact.dry))$values[2]
v.impact.dry=eigen(t(pi.impact.dry))$vectors[,1]
v.impact.dry=v.impact.dry/sum(v.impact.dry)
v.impact.dry
#[1] 0.701956091 0.165104078 0.076124362 0.050006206 0.006809262
nij.impact.dry=matrix(c(5440,938,169,146,19,902,562,71,52,2,172,38,387,24,0,149,37,34,247,1,24,0,
0,0,47),ncol=5,nrow=5,byrow=T)
ni.impact.dry=c(6712,1589,621,468,71)
pijhat.impact.dry=matrix(c(5440/6712,938/6712,169/6712,146/6712,19/6712,902/1589,562/1589,71/1589
,52/1589,2/1589,172/621,38/621,387/621,24/621,0/621,149/468,37/468,34/468,247/468,1/468,24/71,0/7
1,0/71,0/71,47/71),ncol=5,nrow=5,byrow=T)
p.impact.dry=c(6835/11479,2812/11479,1217/11479,543/11479,72/11479)
lambda.impact.dry<-c(0,0,0,0,0)
for (i in 1:5)
est.impact.dry<-0
for (j in 1:5)
est.impact.dry<-est.impact.dry+(ni.impact.dry[i]*((pijhat.impact.dry[i,j]-
p.impact.dry[j])^2)/p.impact.dry[j])
lambda.impact.dry[i]<-est.impact.dry
lambda.impact.dry # [1] 389.37970 20.00703 31.30629 731.61625 1761.33830
qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623
sum(lambda.impact.dry) # [1] 2933.648
qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795
# fo fe tr so re total
# est_chuvosa fo 6599 856 323 259 54 8091
# fe 793 346 123 47 5 1314
# tr 337 63 1097 51 4 1552
# so 244 47 67 499 1 858
# re 56 1 8 2 315 382
# total 8029 1313 1618 858 379 12197
pi.impact.wet=matrix(c(6599/8091,856/8091,323/8091,259/8091,54/8091,793/1314,346/1314,123/1314,47
/1314,5/1314,337/1552,63/1552,1097/1552,51/1552,4/1552,244/858,47/858,67/858,499/858,1/858,56/382
,1/382,8/382,2/382,379/382),ncol=5,nrow=5,byrow=T)
mu.impact.wet=c(1.0,0.0,0.0,0.0,0.0); print(mu.impact.wet)
mu.impact.wet=mu.impact.wet%*%pi.impact.wet; print(mu.impact.wet)
eigen(t(pi.impact.wet))
nu.impact=eigen(t(pi.impact.wet))$values[2]
v.impact.wet=eigen(t(pi.impact.wet))$vectors[,1]
v.impact.wet=v.impact.wet/sum(v.impact.wet)
v.impact.wet
#[1] 0.57928550 0.09202518 0.12437170 0.06027865 0.14403898
nij.impact.wet=matrix(c(6599,856,323,259,54,793,346,123,47,5,337,63,1097,51,4,244,47,67,499,1,56,
1,8,2,379),ncol=5,nrow=5,byrow=T)
ni.impact.wet=c(8091,1314,1552,858,382)
pijhat.impact.wet=matrix(c(6599/8091,856/8091,323/8091,259/8091,54/8091,793/1314,346/1314,123/131
4,47/1314,5/1314,337/1552,63/1552,1097/1552,51/1552,4/1552,244/858,47/858,67/858,499/858,1/858,56
/382,1/382,8/382,2/382,379/382),ncol=5,nrow=5,byrow=T)
p.impact.wet=c(8200/16998,4248/16998,2914/16998,1254/16998,382/16998)
lambda.impact.wet<-c(0,0,0,0,0)
for (i in 1:5)
est.impact.wet<-0
for (j in 1:5)
est.impact.wet<-est.impact.wet+(ni.impact.wet[i]*((pijhat.impact.wet[i,j]-
p.impact.wet[j])^2)/p.impact.wet[j])
lambda.impact.wet[i]<-est.impact.wet
lambda.impact.wet # [1] 389.37970 20.00703 31.30629 731.61625 1761.33830
qchisq(0.95, df=(5-1)*(5-1)) # [1] 26.29623
sum(lambda.impact.wet) # [1] 2933.648
qchisq(0.95, df=5*(5-1)*(5-1)) # [1] 101.8795
A5: # CONTROLE: total de 5856 observações – Xc1=4288 observações do estado 1, Xc2=1568 observações do
# estado 2, Xc3=799 observações do estado 3, Xc4=606 observações do estado 4 e Xc5=194
# observações do estado 5.
#
# IMPACTO: total de 22095 observações – Xi1=15035 observações do estado 1, Xc2=7060 observações
# do estado 2, Xi3=4131 observações do estado 3, Xi4=1797 observações do estado 4 e Xi5=454
# observações do estado 5.
# PROBABILIDADE: sum(Xc1*Xi1, Xc2*Xc2, Xc3*Xi3, Xc4*Xi4, Xc5*Xi5)
cross.sum <- sum(4288*15035,1568*7060,799*4131,606*1797,194*454)
cross.prob <- cross.sum/(5856*22095) [1] 0.6184321
# Correspondências entre as cadeias controle e impacto: fixou-se o mesmo tamanho para as duas
# sequências: Total=5719 observações pareadas.
# Número observado de correspondências: [1] 3029
1<->1: 2780; 2<->2: 200; 3<->3: 29; 4<->4: 5; 5<->5: 15
# Número observado de não-correspondências: [1] 2690
1->2: 587; 1->3: 606; 1->4: 112; 1->5: 106;
2->1: 596; 2->3: 108; 2->4: 21; 2->5: 21;
3->1: 136; 3->2: 16; 3->4: 4; 3->5: 4;
4->1: 250; 4->2: 44; 4->3: 88; 4->5: 15;
5->1: 129; 5->2: 26; 5->3: 16; 5->4: 5.
# Número esperado de correspondências: (5/25)*Total [1] 1143.8
# Número esperado de não-correspondências: (20/25)*Total [1] 4575.2
VALOR CALCULADO: x2 <- (3029-1143.8)^2/1143.8+(2690-4575.2)^2/4575.2 [1] 3883.96
VALOR TABELADO: > qchisq(0.95, df=1) [1] 3.841459