UNIVERSIDADE ESTUDUAL DO OESTE DO PARAN CAMPUS CASCAVEL
CENTRO DE CINCIAS EXATAS E TECNOLGICAS
PROGRAMA DE PS-GRADUAO EM ENGENHARIA AGRCOLA:
ENGENHARIA DE SISTEMAS AGROINDUSTRIAIS E TECNOLOGIA DA PRODUO
AGRCOLA
ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES
AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA
REGIO OESTE DO ESTADO DO PARAN
EVERTON COIMBRA DE ARAJO
Cascavel Paran Brasil
Dezembro 2012
EVERTON COIMBRA DE ARAJO
ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES
AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA
REGIO OESTE DO ESTADO DO PARAN
Tese apresentada ao Programa de Ps-
Graduao em Engenharia Agrcola em
cumprimento parcial aos requisitos para
obteno do ttulo de Doutor em Engenharia
Agrcola, rea de concentrao em Engenharia
de Sistemas Agroindustriais e Tecnologia da
Produo Agrcola, da Universidade Estadual
do Oeste do Paran, campus Cascavel.
Orientador: Prof. Dr. Miguel Angel Uribe Opazo
Coorientador: Prof. Dr. Jerry Adriani Johann
Cascavel Paran Brasil
Dezembro 2012
Reviso de portugus, ingls e normas realizadas em 10 de janeiro de 2013 por Dhandara Soares de Lima.
EVERTON COIMBRA DE ARAJO
Dados Internacionais de Catalogao-na-Publicao (CIP)
Biblioteca Central do Campus de Cascavel Unioeste
Ficha catalogrfica elaborada por Jeanine da Silva Barros CRB-9/1362
C633a
Coimbra, Everton
Anlise da produtividade da soja associada a fatores agrometeorolgicos, por meio de estatstica espacial de rea na Regio Oeste do Estado do Paran. / Cascavel, PR: UNIOESTE, 2012.
116 f. ; 30 cm.
Orientador: Prof. Dr. Miguel Angel Uribe Opazo Co-orientador: Prof. Dr. Jerry Adriani Johann Tese (Doutorado) Universidade Estadual do Oeste do Paran. Programa de Ps-Graduao Stricto Sensu em Engenharia Agrcola,
Centro de Cincias Exatas e Tecnolgicas. Bibliografia.
1. Autocorrelao espacial. 2. Similaridade espacial. 3. Regresso
espacial. I. Universidade Estadual do Oeste do Paran. II. Ttulo. CDD 21. ed. 631.86
EVERTON COIMBRA DE ARAJO
Anlise da produtividade da soja associada a fatores agrometeorolgicos, por meio
de estatstica espacial de rea, na regio oeste do estado do Paran
Tese apresentada ao Programa de Ps-Graduao stricto-sensu em Engenharia Agrcola
em cumprimento parcial aos requisitos para obteno do ttulo de Doutor em Engenharia
Agrcola, rea de concentrao em Engenharia de Sistemas Agroindustriais e Tecnologia da
Produo Agrcola, da Universidade Estadual do Oeste do Paran, campus Cascavel,
apresentada seguinte banca examinadora:
Orientador: Prof. Dr. Miguel Angel Uribe Opazo
Centro de Cincias Exatas e Tecnolgicas, UNIOESTE
Coorientador: Prof. Dr. Jerry Adriani Johann
Centro de Cincias Exatas e Tecnolgicas, UNIOESTE
Banca 1: Prof. Dr. Rubens Augusto Camargo Lamparelli
UNICAMP, Ncleo Interdisciplinar de Planejamento Energtico
Banca 2: Profa. Dra. Luciana Pagliosa Carvalho Guedes
Centro de Cincias Exatas e Tecnolgicas, UNIOESTE
Banca 3: Prof. Dr. Adair Santa Catarina
Centro de Cincias Exatas e Tecnolgicas, UNIOESTE
Banca 4: Profa. Dra. Rosangela Aparecida Botinha Assumpo
Universidade Tecnolgica Federal do Paran Campus Dois Vizinhos
Cascavel Paran Brasil
Dezembro 2012
ii
BIOGRAFIA
Everton Coimbra de Arajo, graduado em Tecnologia em Processamento de Dados pelo
CESUFOZ em 2000; especialista em Projeto e Desenvolvimento de Sistemas Baseados em
Objetos para Internet pela UTFPR em 2006; e Mestre em Cincia da Computao pela
UFSC em 2002. Ingressou no ano de 2009 no Programa de Ps-Graduao em Engenharia
Agrcola Engenharia de Sistemas Agroindustriais/Tecnologia da Produo Agrcola, sob a
orientao do Prof. Dr. Miguel Angel Uribe-Opazo, estudando o tema: Estatstica Espacial
de rea na Produtividade da Soja e Fatores Agrometeorolgicos na Regio Oeste do Estado
do Paran.
iii
Agradecimentos
Agradeo a todos que acompanharam mais esta etapa de minha vida pessoal e
profissional e, de alguma maneira, me auxiliaram.
Agradeo com um carinho especial meu Orientador, Prof. Dr. Miguel Angel Uribe-
Opazo, que deu a mim a oportunidade e a confiana para ingressar no programa de Ps-
Graduao em Engenharia Agrcola (PGEAGRI) da UNIOESTE, campus de Cascavel, e que
me propiciou grandes aprendizados, no s na vida acadmica, mas tambm na pessoal,
estando sempre presente nos momentos em que precisei de apoio.
Agradeo ao Prof. Dr. Jerry Adriani Johann, meu coorientador, pela importante
orientao durante o desenvolvimento da tese.
Obrigado.
iv
ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES
AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA
REGIO OESTE DO ESTADO DO PARAN
RESUMO
Este trabalho apresenta mtodos para serem aplicados na estatstica espacial de rea na
produtividade da soja e fatores agrometeorolgicos na regio oeste do estado do Paran.
Os dados utilizados esto relacionados aos anos-safra de 2000/2001 a 2007/2008, sendo as
variveis: produtividade da soja (t ha-1) e agrometeorolgicas, tais como precipitao pluvial
(mm), temperatura mdia (oC) e radiao solar global mdia (W m-2). Em uma primeira fase
foram utilizados ndices de autocorrelao espacial (Moran Global e Local) e apresentados
modelos de regresso espacial mltipla, com avaliaes de desempenho. A estimativa dos
parmetros dos modelos ajustados se deu pelo uso do mtodo de Mxima Verossimilhana
e a avaliao do desempenho dos modelos foi realizada com base no coeficiente de
determinao (R2), no mximo valor do logaritmo da funo do mximo valor do logaritmo da
funo verossimilhana e no critrio de informao bayesiano de Schwarz. Em uma
segunda etapa foram realizadas anlises de agrupamento espacial por meio da estatstica
multivariada, buscando identificar associaes no mesmo conjunto de variveis, porm com
um nmero maior de anos-safra. Finalmente, os dados de um ano-safra foram aplicados em
uma abordagem baseada em agrupamento difuso, por meio do algoritmo Fuzzy c-Means,
tendo a similaridade medida pela definio de um ndice com este objetivo. O estudo da
primeira fase permitiu verificar a correlao e a autocorrelao espacial entre a
produtividade da soja e os elementos agrometeorolgicos, por meio da anlise espacial de
rea, usando tcnicas como o ndice I de Moran Global e Local uni e bivariado e os testes
de significncia. Foi possvel demonstrar que, por meio dos indicadores de desempenho
utilizados, os modelos SAR e CAR ofereceram melhores resultados em relao ao modelo
de regresso mltipla clssica. Na segunda fase, foi possvel apresentar a formao de
grupos de municpios utilizando as similaridades das variveis em anlise. A anlise de
agrupamento foi um instrumento til para uma melhor gesto das atividades de produo da
agricultura, em funo de que, com o agrupamento, foi possvel se estabelecer similaridades
que proporcionem parmetros para uma melhor gesto dos processos de produo que
traga, quantitativa e qualitativamente, resultados almejados pelo agricultor. Na etapa final,
por meio do algoritmo Fuzzy c-Means, foi possvel a formao de grupos de municpios
similares produtividade de soja, utilizando o Mtodo de Deciso pelo Maior Grau de
Pertinncia (MDMGP) e o Mtodo de Deciso pelo Limiar (MDL ). Posteriormente, a
identificao do nmero adequado de agrupamentos foi obtida utilizando a Entropia de
Partio Modificada. Para mensurar o nvel de similaridade de cada agrupamento, foi criado
e utilizado um ndice de Similaridade de Clusters (ISCl), que considera o grau de pertinncia
de cada municpio dentro do agrupamento a que pertence. Dentro das perspectivas deste
estudo, o mtodo empregado se mostrou adequado, permitindo identificar agrupamentos de
municpios com graus de similaridades da ordem de 60 a 78%.
Palavras-chave: Autocorrelao espacial, Similaridade espacial, Regresso espacial
v
ANLISE DA PRODUTIVIDADE DA SOJA ASSOCIADA A FATORES
AGROMETEOROLGICOS, POR MEIO DE ESTATSTICA ESPACIAL DE REA, NA
REGIO OESTE DO ESTADO DO PARAN
ABSTRACT
This paper aimed to present methods to be applied in the area of spatial statistics on
soybean yield and agrometeorological factors in Western Paran state. The data used,
related to crop years from 2000/2001 to 2007/2008, are the following variables: soybean
yield (t ha-1) and agrometeorological factors, such as rainfall (mm), average temperature (oC)
and solar global radiation average (W m-2). In the first phase,it was used indices of spatial
autocorrelation (Moran Global and Local) and presented multiple spatial regression models,
with performance evaluations. The estimation of parameters occurred when using the
Maximum Likelihood method and the performance evaluation of the models was based on
the coefficient of determination (R2), the maximum value of the function of the logarithm of
the maximum value of the likelihood function logarithm and the Bayesian information criterion
of Schwarz. In a second step, cluster analysis was performed using spatial statistical
multivariate associations, seeking to identify the same set of variables, but with a larger
number of crop years. Finally, the data from one crop year were utilized in an approach
based on fuzzy clustering, through the Fuzzy C-Means algorithm and the similarity measure
by defining an index for this purpose. The first phase of the study showed the correlation
between spatial autocorrelation and soybean yield and agrometeorological elements, through
the analysis of spatial area, using techniques such as index Global Moran's I and Local
univariate and bivariate and significance tests. It was possible to demonstrate, through the
performance indicators used, that the SAR and CAR models offered better results than the
classical multiple regression model. In the second phase, it was possible to present the
formation of groups of cities using the similarities of the variables under analysis. Cluster
analysis is a useful tool for better management of production activities in agriculture, since,
with the grouping, it was possible to establish similarities parameters that provide better
management of production processes that bring quantitative and qualitatively better, results
sought by the farmer. In the final step, through the use of Fuzzy C-Means algorithm, it was
possible to form groups of cities of similar soybean yield using the method of decision by the
Higher Degree of Relevance (MDMGP) and Method of Decision Threshold by ( CDM).
Subsequently, identification of the adequate number of clusters was obtained using modified
partition entropy. To measure the degree of similarity of each cluster, a Cluster Similarity
Index (ISCl) was designed and used, which considers the degree of relevance of each city
within the group to which it belongs. Within the perspective of this study, the method used
was adequate, allowing to identify clusters of cities with degrees of similarities in the order of
60 to 78%.
KEY WORDS: Spatial autocorrelation, spatial similarity, similarity index.
vi
SUMRIO
INTRODUO ..................................................................................................................... 12
1 ANLISE ESPACIAL DA PRODUTIVIDADE DA SOJA E DOS DADOS
AGROMETEOROLGICOS ................................................................................................ 15
1.1 A cultura da soja .................................................................................................... 15
1.2 Dados agrometeorolgicos .................................................................................... 20
1. 2. 1 Temperatura do ar .......................................................................................... 17
1. 2. 2 Precipitao pluvial ......................................................................................... 18
1. 2. 3 Radiao Solar Global .................................................................................... 18
1.3 Geoprocessamento ............................................................................................... 19
1. 3. 1 Sistemas de Informaes Geogrficas (SIG) .................................................. 19
1.3.1.1 reas de Aplicao do SIG........................................................................ 25
1.4 Anlise espacial ..................................................................................................... 21
1. 4. 1 Anlise Exploratria de Dados Espaciais (AEDE) ........................................... 23
1. 4. 2 Matriz de proximidade espacial....................................................................... 24
1. 4. 3 Vetor dos desvios e vetor de mdias ponderadas .......................................... 30
1. 4. 4 Dependncia Espacial .................................................................................... 27
1. 4. 5 Estatstica Espacial de rea ........................................................................... 29
1. 4. 6 Anlise de variveis espaciais de reas ......................................................... 30
1.5 Autocorrelao espacial......................................................................................... 31
1. 5. 1 Autocorrelao espacial global univariada ...................................................... 32
1. 5. 2 Autocorrelao espacial global multivariada ................................................... 33
1. 5. 3 Autocorrelao espacial local ......................................................................... 34
1. 5. 4 Indicadores Locais de Associao Espacial (LISA) Univariado ....................... 34
1. 5. 5 Indicadores Locais de Associao Espacial (LISA) Multivariado ..................... 35
1. 5. 6 Anlise Grfica da Autocorrelao Espacial ................................................... 39
1.6 reas de influncia ................................................................................................ 38
1.7 Modelagem espacial .............................................................................................. 40
1. 7. 1 Modelos de regresso espacial ...................................................................... 42
1.7.1.1 Regresso linear espacial......................................................................... 47
1.7.1.2 SAR (Spatial Auto Regressive Model) ou Spatial Lag Model.................... 47
1.7.1.3 CAR (Conditional Auto Regressive Model) ou Spatial Error Model.......... 47
1.8 Estatstica multivariada .......................................................................................... 44
1. 8. 1 Anlise de Agrupamentos (AA) ....................................................................... 50
1. 8. 2 Dendograma ................................................................................................... 47
vii
1. 8. 3 ndice RMSSTD e RS ..................................................................................... 48
1.9 Conjuntos fuzzy como modeladores de incerteza .................................................. 49
1. 9. 1 Conceito de Fuzzy C-means ........................................................................... 51
1.9.1.1 Similaridade.................................................................................................... 51
1. 9. 2 Medindo a Validade do Agrupamento ............................................................. 52
1.9.2.1 Fuzziness Performance Index (FPI)............................................................... 53
1.9.2.2 Modified Partition Entropy (MPE)................................................................... 54
1.9.2.3 Compactness and Separation (CS)............................................................... 54
1.9.2.4 Inter Class Contrast (ICC)............................................................................. 55
1.10 REFERNCIAS ..................................................................................................... 56
2 MODELO DE REGRESSO ESPACIAL PARA ESTIMATIVA DA PRODUTIVIDADE DA
SOJA ASSOCIADA A VARIVEIS AGROMETEOROLGICAS NA REGIO OESTE DO
ESTADO DO PARAN ........................................................................................................ 64
2.1 INTRODUO ...................................................................................................... 65
2.2 MATERIAIS E MTODOS ..................................................................................... 66
2.3 RESULTADOS E DISCUSSO ............................................................................. 71
2.4 CONCLUSES ..................................................................................................... 78
2.5 AGRADECIMENTOS ............................................................................................. 78
2.6 REFERNCIAS ..................................................................................................... 79
3 ANLISE DE AGRUPAMENTO DA VARIABILIDADE ESPACIAL DA PRODUTIVIDADE
DA SOJA E VARIVEIS AGROMETEOROLGICAS NA REGIO OESTE DO PARAN .. 82
3.1 INTRODUO ...................................................................................................... 82
3.2 MATERIAL E MTODOS ...................................................................................... 83
3.3 RESULTADOS E DISCUSSO ............................................................................. 88
3.4 CONCLUSES ..................................................................................................... 96
3.5 AGRADECIMENTOS ............................................................................................. 96
3.6 REFERNCIAS ..................................................................................................... 96
4 CLASSIFICAO DE REAS ASSOCIADAS PRODUTIVIDADE DA SOJA E
VARIVEIS AGROMETEOROLGICAS POR MEIO DE AGRUPAMENTO FUZZY ........... 99
4.1 INTRODUO ...................................................................................................... 99
4.2 MATERIAIS E MTODOS ................................................................................... 101
4.3 RESULTADOS E DISCUSSO ........................................................................... 104
4.4 CONCLUSO ...................................................................................................... 108
4.5 REFERNCIAS ................................................................................................... 109
CONSIDERAES FINAIS ............................................................................................... 112
viii
Lista de Tabelas
Tabela 1 Mapa Box Map. ..................................................................................................... 36
Tabela 2 ndice I de Moran Global de autocorrelao espacial para as variveis em estudo.
............................................................................................................................................ 71
Tabela 3 ndice I de Moran Bivariado e nvel descritivo (p-valor). ........................................ 74
Tabela 4 Resumo de modelos ajustados e da anlise com os parmetros obtidos para o
Modelo SAR. ....................................................................................................................... 75
Tabela 5 Resumo de modelos ajustados e da anlise com os parmetros obtidos para o
Modelo CAR. ....................................................................................................................... 76
Tabela 6 Resumo de modelos ajustados e da anlise com os parmetros obtidos para o
Modelo de Regresso Mltipla Clssica. ............................................................................. 78
Tabela 7 Processo de agrupamento por similaridade e distncia euclidiana dos municpios
da rea em estudo, considerando as variveis Prod, Prec, TMed, Rs, LISA. ....................... 89
Tabela 8 Processo de agrupamento por similaridade e distncia dos municpios da rea em
estudo para os anos-safra de 2000/2001 a 2007/2008. ....................................................... 94
Tabela 9 Estatsticas descritivas das variveis e de seus respectivos valores padronizados
no ano-safra de 2007/2008. ............................................................................................... 104
Tabela 10 Graus de incluso entre os agrupamentos estabelecidos pelo mtodo MDMGP
.......................................................................................................................................... 105
Tabela 11 Distribuio dos municpios nos agrupamentos de acordo com os mtodos de
pertinncia MDMGP e MDL ............................................................................................. 105
Tabela 12 Estatsticas para as variveis do estudo em cada agrupamento da regio de
estudo ................................................................................................................................ 107
ix
Lista de Figuras
Figura 1 Mapa de John Snow (1855) mostrando os locais de ocorrncia de epidemia de clera em
Londres em 1854 (CMARA; MONTEIRO, 2004)......................................................................................... 22
Figura 2 Mapa do estado de Roraima com diviso por municpios ............................................................ 25
Figura 3 Matriz de vizinhana para os municpios do estado de Roraima ................................................ 25
Figura 4 Matriz de proximidade espacial de primeira ordem, normalizada pelas linhas ......................... 26
Figura 5 Representao dos tipos de contiguidade entre reas. (a) Contiguidade Queen (rainha), (b)
Contiguidade Rook (torre) e (c) Contiguidade Bishop (bispo) ..................................................................... 26
Figura 6 Padres de distribuio espacial de pontos ................................................................................... 28
Figura 7 Valores de Produtividade para os dados da safra de 2001/2002, em 48 municpios da regio
oeste do estado do Paran agrupados pela mdia estadual ....................................................................... 30
Figura 8 Matriz de Diagramas de Disperso de Moran apresentado por Anselin et al. (2004) .............. 33
Figura 9 Estrutura do diagrama de disperso de Moran onde W_Varivel caracteriza a varivel de
interesse defasada espacialmente................................................................................................................... 36
Figura 10 Mapas para uma anlise grfica da autocorrelao espacial .................................................... 37
Figura 11 Determinao de reas de influncia pelo mtodo de Thiessen ............................................... 39
Figura 12 Exemplo de juno espacial ............................................................................................................. 40
Figura 13 Dendogramas .................................................................................................................................... 47
Figura 14 Trajetria dos ndices RMSSTD (a) e RS (b) em funo do aumento do nmero de clusters
(grupos) ................................................................................................................................................................ 48
Figura 15 Exemplo de similaridades ................................................................................................................ 52
Figura 16 Regio Oeste do Paran, com destaque para os municpios com estaes meteorolgicas:
(2) Assis Chateaubriand, (8) Cascavel, (15) Foz do Iguau, (16) Guara, (32) Palotina, (36) Santa
Helena, (41) So Miguel do Iguau, e (45) Toledo. ...................................................................................... 66
Figura 17 Mapa de espalhamento de Moran Global para a varivel Produtividade da Soja. ................. 72
Figura 18 Indicador local de autocorrelao espacial (LISA) para a varivel Produtividade de Soja. .. 73
Figura 19 Mapa de espalhamento de Moran local para a varivel Produtividade da soja. ..................... 74
Figura 20 Mapa de espalhamento de Moran local para os resduos padronizados do modelo SAR. ... 76
Figura 21 Mapa dos resduos padronizados da regresso espacial gerada pelo modelo Spatial Error,
considerando o mtodo do desvio-padro. .................................................................................................... 77
Figura 22 Mapa de localizao da regio oeste do estado do Paran. ..................................................... 84
x
Figura 23 Regio oeste do Paran, com destaque para os municpios com estaes meteorolgicas.
............................................................................................................................................................................... 84
Figura 24 Grfico de estimao do nmero timo de clusters para os anos-safra em estudo por meio
das estatsticas RMSSTD e RS ........................................................................................................................ 88
Figura 25 Dendogramas gerados com as variveis produtividade da soja (t ha-1
), precipitao pluvial
(mm), temperatura mdia do ar (C), radiao solar global mdia (W m-2) e ndice LISA para os 48
municpios da rea de estudo em oito anos. .................................................................................................. 90
Figura 26 Mapa temtico de anlise dos agrupamentos dos municpios da pesquisa com base no
ndice de similaridade, considerando as variveis na Produtividade da soja (t ha-1
), Precipitao
pluvial (mm), Temperatura Mdia do ar (C), Radiao Solar Global Mdia (W m-2
) e ndice LISA
Univariado. ........................................................................................................................................................... 92
Figura 27 Grfico de estimao do nmero timo de clusters para todas as safras em estudo, como
um nico conjunto, por meio das estatsticas RMSSTDe RS. ..................................................................... 93
Figura 28 Mapa temtico e dendograma de anlise dos agrupamentos dos municpios da pesquisa
com base no ndice de similaridade considerando as variveis na produtividade da soja (t ha-1
),
precipitao pluvial (mm), temperatura mdia do ar (C), radiao solar global mdia (W m-2
) e ndice
LISA univariado, para todos os anos-safra em estudo. ................................................................................ 94
Figura 29 Regio oeste do Paran com destaque para os municpios com estaes meteorolgicas
............................................................................................................................................................................. 101
Figura 30 Distribuio dos agrupamentos impostos pelo FCM decorrente dos mtodos: MDMGP(a),
MDL 0,5 (b), MDL 0,65 (c) e MDL 0,8 (d) .............................................................................................. 106
Figura 31 Mapa temtico da produtividade da soja..................................................................................... 108
xi
Lista de Siglas
AEDE Anlise Exploratria de Dados Espaciais
CAR Conditional Auto Regressive Model
CS Compactness and Separation
EEA Estatstica Espacial de rea
FCM Fuzzy c-Means
FPI Fuzziness Performance Index
ICC Inter Class Contrast
LISA Local Indicator of Spatial Association
MPE Modified Partition Entropy
MQO Mnimos Quadrados Ordinrios
PIB Produto Interno Bruto
RMSSTD Root Mean Square Standard Deviation
RS R-Square
SAR Spatial Auto Regressive Model
SIG Sistemas de Informao Geogrfica
12
INTRODUO
De acordo com Guimares e Alvarez (2011), nas transformaes tcnico-produtivas
da agricultura brasileira, iniciadas na dcada de 1960, a soja tem se destacado como o
principal produto do agronegcio, trazendo ao pas, desde 1976, a posio de segundo
maior produtor mundial, sendo superado apenas pelos Estados Unidos. Em 2010, o Brasil
respondeu por 26,2% da produo mundial de soja (CONAB, 2010), que correspondeu a
67,5 milhes de toneladas de soja, cultivada em uma rea de 24,2 milhes de hectares
(rea equivalente ao territrio do Reino Unido) (CONAB, 2010). Em termos comerciais, a
soja foi responsvel por cerca de 9% das exportaes brasileiras, perfazendo R$ 17,5
bilhes. Em relao ao PIB do agronegcio desse mesmo ano, a commodity respondeu por
5,6% de um total de R$ 821,8 bilhes, que correspondeu a uma participao de 1,25% do
PIB nacional (BRASIL, 2012; CEPEA, 2012).
Em relao aos estados produtores, Guimares e Alvarez (2011) destacam que o
Paran, de 1960 at o final da dcada de 1990, foi o principal estado produtor do pas, tanto
em rea cultivada quanto em volume produzido, sendo esse estado responsvel, ainda em
2010, por 21% da soja colhida no Brasil. Os autores ressaltam, entretanto, que em
decorrncia da expanso agrcola em direo ao Cerrado, na dcada de 1980, o Paran
perdeu a liderana produtiva para Mato Grosso, que responde atualmente por cerca de 27%
da produo brasileira (CONAB, 2010).
A gerao de informaes relacionadas aos cultivos agrcolas, como rea cultivada,
produo e rendimento de gros, um dos objetivos das estimativas de safras. Aliado a
essas estimativas, o conhecimento de sua distribuio no espao geogrfico se torna uma
informao importante para o planejamento, a logstica e a segurana alimentar, alm da
extrema relevncia para a formao de preos (FIGUEIREDO, 2005; ASSAD et al., 2007).
A precipitao pluvial, a radiao solar global e a temperatura mdia so elementos
agrometeorolgicos limitantes e o conhecimento das ocorrncias deles dentro do ciclo das
culturas permite entender a importncia deles em estimativas de safra (CARGNELUTTI
FILHO et al., 2009). O emprego de mtodos estatsticos multidimensionais torna-se,
portanto, uma tcnica fundamental na anlise dessas inter-relaes, j que considerada
tambm a localizao dos dados.
Modelos que empregam variveis agrometeorolgicas geralmente integram o
acmulo (ou a perda) de biomassa das culturas ao longo do tempo, utilizando informaes
de dados pontuais de estaes meteorolgicas de superfcie. Ento, faz-se necessrio
interpolar os dados para obteno dos resultados, por exemplo, em escalas regionais,
estaduais e outras. Posteriormente os resultados podem ser classificados ou agrupados por
unidades de rea e apresentados na forma de mapas (ROMANI et al., 2003).
13
Os Sistemas de Informao Geogrfica (SIG) facilitam e contribuem no processo de
anlise dos dados, pois fornecem recursos para visualizao, manipulao, armazenamento
e processamentos de variveis georreferenciadas. Quando utilizadas em conjunto com SIG,
tcnicas estatsticas para anlise de dados espaciais de reas podem ser desenvolvidas,
permitindo e subsidiando a Anlise Espacial de rea (ZIBORDI et al., 2006).
Uma vez que Estatstica Espacial de rea (EEA) faz uso das coordenadas
espaciais no processo de coleta, descrio e anlise dos dados, esta tcnica concentra seu
interesse nos processos que ocorrem no espao e buscam, por meio do emprego de seus
mtodos, descrever e analisar o comportamento desses processos. As reas (com
contagens) utilizadas na EEA representam dados agregados (polgonos), como os
municpios deste estudo. A apresentao usual desses dados se faz pelo uso de mapas
temticos, com cores destacando o padro espacial do fenmeno em estudo. A anlise
espacial de rea busca por um modelo inferencial que incorpore explicitamente as relaes
espaciais constituintes deste fenmeno, objetivando identificar padres de dependncia
espacial das variveis em estudo.
Desta maneira, este mtodo busca descrever a distribuio espacial, os padres de
associao espacial (spatial clusters), verificar a existncia de diferentes regimes espaciais
ou outras formas de instabilidade espacial, alm de identificar observaes atpicas. Esta
situao pode tambm ser subsidiada por meio da anlise de agrupamento (cluster
analysis), uma tcnica oferecida pela anlise multivariada, que identifica grupos, com
propriedades homogneas entre os elementos amostrais, em objetos de dados
multivariados.
Outra tcnica para anlise de agrupamentos a teoria de conjuntos nebulosos,
conhecida como teoria dos conjuntos fuzzy, que se mostra boa para modelar a relao entre
a produtividade da soja e as variveis agrometeorolgicas, pois tem sido utilizada por se
basear na caracterizao de classes que no possuem limites rgidos entre si.
O objetivo geral deste trabalho foi estudar tcnicas de Estatstica Espacial de rea
nas formas Univariada e Multivariada no estudo da produtividade da soja (t ha-1) na regio
oeste do estado do Paran, da safra 2000/2001 at a safra 2007/2008, associadas aos
fatores agrometeorolgicos: precipitao pluvial (mm), temperatura mdia do ar (oC) e
radiao solar global (W m-2).
Esta tese est organizada em quatro captulos. O primeiro captulo apresenta um
levantamento bibliogrfico sobre as metodologias adotadas. No segundo, objetivou-se
analisar espacialmente, para os anos-safras 2005/2006 a 2007/2008, a produtividade da
soja e as variveis agrometeorolgicas, por meio dos ndices de correlao e autocorrelao
espacial (ndices de Moran Global e Moran Local (LISA) uni e bivariado) e seus testes de
significncia e gerar modelos de regresso espacial mltipla autorregressivos (SAR) e
modelos de erro espacial (CAR) entre as variveis estudadas. O terceiro captulo buscou
14
realizar uma anlise de agrupamento da variabilidade espacial da produtividade da soja e de
variveis agrometeorolgicas e do ndice de Moran Local univariado para a produtividade da
soja (LISA). Finalizando, no quarto captulo foram classificadas, por meio da tcnica fuzzy
para agrupamentos, reas associadas produtividade da soja (t ha-1) na regio oeste do
estado do Paran, considerando as variveis agrometeorolgicas.
15
1 ANLISE ESPACIAL DA PRODUTIVIDADE DA SOJA E DOS DADOS
AGROMETEOROLGICOS
1.1 A cultura da soja
De acordo com Klosowski (1997), devido farta aplicabilidade de seus produtos e
da facilidade de seu cultivo, a soja extremamente importante para a humanidade, o que
vem motivando sua expanso no Brasil. cultivada h mais de cinco mil anos no Oriente,
especialmente na China, regio caracterizada por clima temperado. No Ocidente, tornou-se
conhecida no sculo XX, por meio de sua explorao comercial nos Estados Unidos. Na
Europa, segundo Costa (1996) e Embrapa (2006), a soja foi introduzida na metade do
sculo XVIII pelos holandeses; entretanto, s depois de 1914 que comeou a despertar
interesse nos meios agronmicos.
Na Amrica do Sul, de acordo com Freire e Vernetti (1999), a soja foi introduzida
inicialmente na Argentina (final do sculo XIX). No Brasil, foi cultivada por imigrantes
japoneses, primeiramente no estado de So Paulo e em seguida nos estados de Minas
Gerais, Paran, Santa Catarina e Rio Grande do Sul (tambm pelos japoneses). Em termos
de produo espacial, a cultura da soja vem ampliando sua rea, com destaque para a
Regio Sul e a Centro-Oeste, embora as fronteiras agrcolas tenham avanado muito nas
ltimas dcadas (YOKOO; SILVEIRA, 2006).
Yokoo e Silveira (2006) ressaltam que a demanda por informaes concretas e
eficientes sobre o desenvolvimento das culturas agrcolas ao longo de seus ciclos vem
aumentando constantemente. Esse aumento se deve tanto por razes que implicam o
aumento da produtividade como por questes de ordem econmica e ambiental, pois,
ressaltamos autores, a soja tem estado entre os cultivos mais representativos na pauta do
mercado externo.
No cenrio paranaense, Freire e Vernetti (1999) comentam que a cultura da soja
obteve destaque em meados da dcada de 1950, pois at ento sua pequena produo era
destinada ao consumo domstico e alimentao de sunos. Na Regio Sul do estado e em
pequenas reas, afirmam os autores, era utilizada como alternativa ao lado do arroz
sequeiro. A cultura da soja, at os anos 1950, no figurava como cultivo comercial para as
regies norte, noroeste, oeste e sudoeste do Paran. O que a impulsionou foi a grande
geada de 1953, que destruiu parte dos cafezais das regies norte e noroeste do estado, o
que forou a maioria dos agricultores ao cultivo de cereais, intercalando com a cultura do
caf.
De acordo com a Embrapa (2005), foi na regio sul do estado do Paran,
particularmente nos Campos Gerais, que houve um maior desenvolvimento da cultura da
16
soja. Na regio sudoeste do estado, inicialmente a soja era plantada em pequenas
propriedades. O oeste do Paran, em razo da fertilidade das terras, do seu baixo preo e
das condies de clima propcias, foi alvo de interesse de agricultores sulistas no final da
dcada de 1960 (YOKOO; SILVEIRA, 2006).
Yokoo e Silveira (2006) ressaltam que a partir de 1965 foi constatado grande
aumento da rea cultivada com a soja no Paran, dada a facilidade de comercializao. At
esse perodo, a tecnologia de cultivo vinha principalmente do Rio Grande do Sul e de So
Paulo, pois no Paran a pesquisa com a soja se restringia a alguns experimentos de
variedades e de pocas de semeadura realizados pela Secretaria da Agricultura e pelo
instituto de pesquisas IRI. Foi a partir da dcada de 1970 que essa cultura adquiriu maior
expressividade, acentuando-se a partir de 1975 (KASTER et al., 1989; ALMEIDA et al.,
1999).
Na regio oeste do estado do Paran, acultura da soja tem importncia social e
econmica pela elevada produtividade e pela extenso da rea cultivada, constituindo-se
em uma das principais regies produtoras do estado (DERAL/SEAB, 2000; ROESE et al.,
2001). Ayoade (1986) ressalta que o cultivo da soja ocorre nas estaes de
primavera/vero.
1.2 Dados agrometeorolgicos
Uma observao meteorolgica de superfcie consiste na medio ou determinao
de todos os elementos que, em seu conjunto, representem as condies meteorolgicas em
um dado momento e em um determinado lugar, utilizando-se de instrumental adequado e
valendo-se do sentido da viso. As observaes realizadas de maneira sistemtica,
uniforme, ininterrupta e em horas estabelecidas permitem conhecer as caractersticas e
variaes dos elementos atmosfricos. Esses elementos constituem os dados bsicos para
informar o tempo que est ocorrendo nas diferentes estaes meteorolgicas (INMET,
1999).
De acordo com Vianello e Alves (2001), os dados agrometeorolgicos, como
temperatura mdia do ar, precipitao pluvial e radiao solar, podem ser obtidos mediante
leituras ou registros contnuos, diretamente dos instrumentos. As observaes
meteorolgicas so realizadas em estaes meteorolgicas, que so locais tecnicamente
escolhidos e preparados para tais fins. Em relao aos elementos do clima, os autores os
definem como grandezas meteorolgicas que comunicam ao meio atmosfrico suas
propriedades e caractersticas peculiares. Os principais elementos, pertinentes a este
estudo, so: temperatura do ar, precipitao pluvial e radiao solar.
Segundo Carmo Neto et al. (2011), a agricultura a atividade econmica que
apresenta maior dependncia das condies climticas, as quais so consideradas como
17
um dos principais fatores responsveis pelas oscilaes nas produes das culturas. As
variveis climticas influenciam todo o ciclo fenolgico das plantas e tambm determinam a
produo e a produtividade das culturas.
Yokoo e Silveira (2006) ressaltam que se torna cada vez mais fcil identificar,
dentro do ano e das regies, por meio das previses agrometeorolgicas e com o apoio de
anlises de sries histricas de dados agrometeorolgicos, quais pocas so mais
adequadas para o cultivo de cada cultivar. Conforme Mota (2002), a previso
agrometeorolgica trata da avaliao do estado presente e futuro das culturas, inclusive das
datas do desenvolvimento e da produtividade da colheita (quantidade e qualidade), assim
como outros fatores que afetam a produo, como a densidade da semeadura e a escolha
das reas a serem plantadas. O autor ainda ressalta que esse processo diferente das
previses meteorolgicas para a agricultura, pois esta trata das previses dos elementos
meteorolgicos que afetam as atividades agrcolas, como, por exemplo, previses para
fumigao e para estimar a probabilidade de ocorrncia de condies potencialmente
perigosas (geada, incndio, granizo e chuva forte).
1. 2. 1 Temperatura do ar
Silva (2008) afirma que, como a maioria dos gases, o ar no um bom condutor de
calor e tarda muito a alcanar o equilbrio trmico com os demais corpos com os quais se
acha em contato. A autora ressalta que nas camadas de ar adjacentes ao solo que se
verificam as variaes mais rpidas dos valores de temperatura do ar e a partir de
determinada altitude (correspondente superfcie de 850 hPa) que se verifica um
decrscimo mais ou menos regular. lembrado ainda pela autora que a distribuio de
temperatura no planeta influenciada por diversos fatores, tais como a latitude, a
distribuio dos continentes e mares, as correntes martimas, os ventos predominantes e
pela ao das massas de ar.
De acordo com Silva (2008), a temperatura do ar controlada principalmente pela
radiao solar e sua distribuio depende da latitude. A autora ressalta que cidades na
mesma latitude esto mesma distncia do equador e tendem a ter a mesma temperatura,
mas a temperatura depende de outros fatores tambm, como a altitude. A oscilao diurna
da temperatura, conforme afirmao da mesma autora, varia notavelmente de amplitude
segundo as condies locais e a poca do ano, de tal maneira que se considera a referida
amplitude como um dos ndices climatolgicos mais significativos.
Segundo Caramori (2003), entre os elementos meteorolgicos que mais afetam a
produtividade agrcola no mundo destacam-se a temperatura e a precipitao. A
temperatura, de acordo com o autor, de tal maneira limitante aos cultivos que a
distribuio geogrfica das espcies vegetais no globo est confinada aos limites trmicos
18
tolerados por cada espcie ou variedade. Por outro lado, afirma o autor, a disponibilidade
hdrica o fator que mais causa frustraes de safra em todo o mundo.
1. 2. 2 Precipitao pluvial
A precipitao definida como conjunto de partculas lquidas ou slidas que caem
das nuvens (chuva, chuvisco, granizo e neve), conjunto de partculas em suspenso na
atmosfera (nevoeiro e bruma) e como partculas que se depositam (geada e orvalho)
(INMET, 1999). Para as condies climticas do Brasil, a chuva a precipitao mais
significativa em termos de volume. o elemento alimentador da fase terrestre do ciclo
hidrolgico e constitui, portanto, fator importante para os processos de escoamento
superficial direto, infiltrao, evaporao, evapotranspirao, recarga de aquferos e vazo
dos rios. A precipitao sempre equilibra a evaporao em termos globais, a fim de manter
harmnico o equilbrio hidrolgico (SILVA, 2008).
A chuva, por sua grande variabilidade em termos espacial e temporal, constitui-se
em um dos elementos climticos de maior importncia para a agricultura, por sua grande
influncia em todos os estgios do desenvolvimento das plantas (VILHENA et al., 2009). O
excesso ou a deficincia hdrica em determinados subperodos de desenvolvimento dos
cultivos agrcolas pode acarretar prejuzos, em termos de produtividade e de economia,
sendo, portanto, de grande importncia os estudos voltados para a avaliao da influncia
dos regimes pluviomtricos na produo agrcola (SILVA et al., 2011).
1. 2. 3 Radiao Solar Global
A radiao solar incidente no topo da atmosfera terrestre varia basicamente com a
latitude e o tempo, a qual, ao atravessar a atmosfera, interage com seus constituintes. Parte
dessa radiao que espalhada em outras direes especfica da radiao solar difusa; a
outra parte, que chega diretamente superfcie do solo, denominada de radiao solar
direta. Somando a radiao difusa com a direta obtm-se a radiao solar global (SILVA et
al., 2009).
Ayoade (1986) considera que a radiao solar a energia que aciona o sistema
agrcola, determinando as caractersticas trmicas do ambiente, especialmente as
temperaturas do ar e do solo. Determina tambm a durao do dia, ou seja, o
fotoperiodismo (resposta dos vegetais luminosidade). O autor ainda complementa que, se
no houver radiao suficiente, o sistema radicular da planta no se desenvolve
completamente.
19
1.3 Geoprocessamento
A obteno de informaes sobre a distribuio geogrfica de fenmenos e objetos
parte importante das atividades de organizao da sociedade. Antes contidas em mapas e
documentos em papel impresso, o desenvolvimento da Informtica, na segunda metade do
sculo XX, possibilitou armazenar e representar tais informaes em ambiente
computacional, culminando no advento da prtica do Geoprocessamento, tido como: [...]
um ramo do processamento de dados que opera transformaes nos dados contidos em
uma base de dados referenciada territorialmente (geocodificada), usando recursos
analticos, grficos e lgicos, para a obteno e apresentao das transformaes
desejadas (SILVA, 1992).
Renem-se hardware, software, base de dados, metodologias e operador, que
analogicamente correspondem s ferramentas materiais e virtuais de trabalho, matria-
prima, s tcnicas do ofcio e ao trabalhador. Com os componentes tcnicos de suporte
material (hardware) e os programas de manipulao de dados no suporte lgico (software),
trabalhar com Geoprocessamento significa utilizar computadores como instrumentos de
manuseio de dados para representao digital do espao geogrfico (DOMINGUES;
FRANOSO, 2008). O conjunto de dados cujo significado contm associaes ou relaes
de natureza espacial formam uma informao geogrfica (GONALVES, 2008), dispostas
em planilhas alfanumricas, matrizes e representaes grficas vetoriais. Para que essas
informaes sejam submetidas ao processamento computacional, a cada tipo de informao
associado um valor numa escala de medida ou referncia, o que insere a representao
dos fenmenos geogrficos na lgica dos sistemas de informao (MATIAS, 2002).
Vrias so as Cincias que se beneficiam de seus resultados, como a Agronomia e
o Urbanismo. Transpondo limites cientficos disciplinares por meio dos trabalhos de
localizao dos fenmenos e equacionamento e esclarecimento das condies espaciais, o
Geoprocessamento :
[...] uma tecnologia transdisciplinar que, atravs da axiomtica da localizao e do processamento de dados geogrficos, integra vrias disciplinas, equipamentos, programas, processos, entidades, dados, metodologias e pessoas para coleta, tratamento, anlise e apresentao de informaes associadas a mapas digitais georreferenciados. (ROCHA, 2002, p.210)
1. 3. 1 Sistemas de Informaes Geogrficas (SIG)
O termo Sistemas de Informao Geogrfica (SIG) aplicado em sistemas que
realizam o tratamento computacional de dados geogrficos e armazenam a geometria e os
atributos dos dados que esto georreferenciados, isto , localizados na superfcie terrestre e
representados numa projeo cartogrfica (DRUCK et al., 2004). A principal diferena de um
20
SIG para um sistema de informao convencional sua capacidade de armazenar tanto os
atributos descritivos como as geometrias dos diferentes tipos de dados geogrficos (NALON
et al., 2011).
Desde sua concepo inicial, mais simplista e voltada para o projeto e para a
construo de mapas, os SIG tm incorporado uma crescente variedade de funes. Em
especial, apresentam mecanismos sofisticados para manipulao e anlise espacial de
dados, permitindo uma visualizao bem mais intuitiva dos dados do que a obtida por meio
de relatrios e grficos convencionais (SILVA et al., 2009).
Pinheiro e Silva (2009) dividem a evoluo dos SIG em trs fases: manipulao e
visualizao de banco de dados (primeira fase), operaes analticas de dados no-grficos
e estrutura organizacionais (segunda fase) e anlise espacial (terceira fase).
Iniciada na dcada de 1950, a primeira fase marcada pela necessidade de
armazenar, organizar, processar e visualizar dados, originando os SIG baseados na
manipulao e visualizao de dados. Na segunda fase, o aumento da capacidade de
processamento e de memria dos computadores possibilitou novas concepes e a
popularizao dos SIG, conforme Teixeira et al. (1995). Nesta fase, as operaes analticas
so enfatizadas por meio de modelos matemticos. A terceira fase, dcada de 1980, foi
marcada pela reduo de recursos para a pesquisa cientfica enquanto havia um
crescimento do setor industrial e comercial dos SIG. Nesta fase, o potencial dos SIG foi mais
explorado, combinando atributos no-geogrficos com as relaes topolgicas dos objetos
geogrficos para efetuar anlises espaciais sobre dados georreferenciados
(PINHEIRO;SILVA, 2009). Os SIG tambm podem ser considerados como um tipo de
Sistema de Informao, que envolve de maneira sistmica e interativa um Banco de Dados,
Tecnologia e Pessoal, sendo capaz de realizar Anlises Espaciais, armazenar, manipular,
visualizar e operar dados georreferenciados para a obteno de novas informaes.
Conforme Miranda (2005), a abordagem mais adequada para a definio de SIG
a que enfatiza a importncia da anlise espacial e da modelagem que pode ser realizada, na
qual o SIG visto mais como uma cincia de informao espacial do que uma tecnologia.
As definies de SIG refletem, cada uma sua maneira, a multiplicidade de usos e vises
possveis dessa tecnologia e apontam para uma perspectiva interdisciplinar de sua
utilizao. A partir desses conceitos, possvel indicar duas importantes caractersticas de
SIG. Primeiro, tais sistemas possibilitam a integrao, em uma nica base de dados, de
informaes geogrficas provenientes de fontes diversas, como dados cartogrficos, dados
de censo e cadastro urbano e rural, imagens de satlite e modelos numricos de terreno.
Segundo, SIG oferecem mecanismos para recuperar, manipular e visualizar esses dados,
por meio de algoritmos de manipulao e anlise (CAMARA et al., 1996).
Desta maneira, o SIG pode ser entendido como ferramenta computacional para o
geoprocessamento, que permite realizar anlises complexas, ao integrar dados de diversas
21
fontes (fotos areas, imagens de satlite, cartas topogrficas, imagens vetoriais e dados
cadastrais das regies observadas) e criar bancos de dados georreferenciados (CMARA et
al., 2001).
1. 3. 1. 1 reas de Aplicao do SIG
Oliveira (1997) apresenta uma relao das diversas reas de aplicao de SIG,
divididas em cinco grupos principais:
ocupao humana;
uso da terra;
uso de recursos naturais;
meio ambiente; e
atividades econmicas.
Segundo Oliveira (1997), a noo de anlise espacial num SIG baseia-se na ideia
da integrao de dados espaciais e de atributos alfanumricos, traduzindo-se numa srie de
funes relacionadas com a seleo, a pesquisa e a modelagem de dados.
1.4 Anlise espacial
A compreenso da distribuio espacial de dados oriundos de fenmenos ocorridos
no espao para a elucidao de questes centrais em diversas reas do conhecimento seja
em ambiente, em sade, em geologia, em agronomia, entre outras, constitui um grande
desafio. A ideia central incorporar o espao anlise que se deseja fazer (SANTOS et al.,
2004).
Bailey (1994) define a anlise espacial como uma ferramenta que possibilita
manipular dados espaciais de diferentes formas e extrair conhecimento adicional como
resposta, incluindo funes bsicas como consulta de informaes espaciais dentro de
reas de interesse definidas, manipulao de mapas e produo de alguns breves sumrios
estatsticos dessa informao, incorporando tambm funes como a investigao de
padres e relacionamentos dos dados na regio de interesse, buscando, assim, um melhor
entendimento do fenmeno e a possibilidade de se fazer predies.
Um exemplo pioneiro do uso da anlise espacial de rea, ao qual intuitivamente se
incorporou a categoria espao s anlises dos eventos, foi realizado no sculo XIX por John
Snow. Em 1854, ocorria em Londres uma das vrias epidemias de clera trazidas das
ndias. Pouco se sabia ento sobre os mecanismos causais da doena. Uns achavam que
estava relacionado aos gases e odores, concentrados nas regies baixas e pantanosas da
cidade, e outros ingesto de gua insalubre. Um mapa localizava a residncia dos bitos
ocasionados pela doena (representado por pontos) e as bombas de gua que abasteciam
22
a cidade (representado por cruzes), permitindo visualizar claramente o epicentro da
epidemia (Figura 1). Estudos posteriores confirmaram essa hiptese, corroborada por outras
informaes, tais como a localizao do ponto de captao de gua desta bomba jusante
da cidade em local onde a concentrao de dejetos, inclusive de pacientes colricos, era
mxima. Essa uma situao tpica em que a relao espacial entre os dados contribuiu
significativamente para o avano na compreenso do fenmeno, sendo um dos primeiros
exemplos da anlise espacial (CMARA et al., 2002).
Figura 1 Mapa de John Snow (1855) mostrando os locais de ocorrncia de epidemia de clera em Londres em 1854 (CMARA; MONTEIRO, 2004).
Para Meneses (2003), a anlise espacial apresenta duas vertentes principais:
estatstica espacial e geocomputao. A primeira gera modelos matemticos de distribuio
e correlao, os quais incorporam propriedades de significncia e incerteza, resultantes da
dimenso espacial. J a geocomputao usa tcnicas de redes neurais, busca heurstica e
autmatos celulares para explorar grandes bases de dados e gerar resultados empricos
(no-exatos) melhores que as tcnicas convencionais, mas com ampla aplicabilidade
prtica. Esses instrumentos de anlise espacial proporcionam maior confiabilidade aos
resultados de investigaes sobre a realidade modelada (CMARA, 2001).
Segundo Cmara et al. (2002), as tcnicas subsidiadas pela estatstica espacial de
rea permitem descrever a distribuio das variveis de estudo, identificar observaes
atpicas no s em relao ao tipo de distribuio, mas tambm em relao aos vizinhos e
buscar a existncia de padres na distribuio espacial. Por meio desses procedimentos,
possvel estabelecer hipteses sobre as observaes, de maneira a selecionar o modelo
inferencial melhor suportado pelos dados.
A localizao espacial dos dados pode ser representada de forma regular ou
irregular e seus ndices podem ser definidos a partir de uma rea no espao, ora fixados
23
contveis (LI, 2007). Os dados podem ser classificados seguindo outra denominao: dados
de processos pontuais e dados de reas. Esses dados guardam, respectivamente, forte
relao com os dados ambientais e socioeconmicos. Para Cressie (1993), os dados de
superfcie contnua so ainda denominados, respectivamente, de Geostatistical data (dados
contnuos no espao) e os dados de rea Lattice data (dados agrupados em reas). O
primeiro grupo se refere a dados contnuos, como uma amostra de uma distribuio
contnua. O segundo grupo consiste em uma coleo fixa de localizaes espaciais
discretas (pontos ou polgonos).
1. 4. 1 Anlise Exploratria de Dados Espaciais (AEDE)
A anlise de dados espaciais pode ser empreendida sempre que as informaes
estiverem espacialmente localizadas e quando for preciso levar em conta, explicitamente, a
importncia do arranjo espacial dos fenmenos na anlise ou na interpretao de resultados
desejados (BAILEY; GATTREL, 1995).
O objetivo da anlise espacial aprofundar a compreenso do processo, avaliar
evidncias de hipteses a ele relacionadas ou, ainda, tentar prever valores em reas onde
as observaes no esto disponveis (BAILEY; GATTREL, 1995). Como salientaram os
autores, basicamente pode-se distinguir entre os vrios mtodos aqueles que:
so essencialmente voltados visualizao dos dados espaciais;
so exploratrios, investigando e resumindo relaes e padres mapeados; e
contam com a especificao de um modelo estatstico e a estimao de
parmetros.
A visualizao grfica uma etapa fundamental da anlise espacial. Por meio dela
possvel identificar padres espaciais nos dados, gerando hipteses testveis, bem como
avaliar o ajuste de modelos propostos ou, ainda, a validade das previses resultantes. De
fato, h uma srie de questes que podero justificar uma visualizao criteriosa dos dados,
tais como (CARDOSO et al., 2011):
H variveis com valores extremos (muito altos ou muito baixos)?
As observaes se dividem em grupos distintos?
Existem associaes entre as variveis?
As questes anteriores podem ser respondidas com o auxlio de mtodos grficos
ou estatsticas descritivas. Essas tcnicas so conhecidas como Anlise Exploratria de
Dados Espaciais, podendo ser classificadas em Univariadas ou Multivariadas, dependendo
do nmero de variveis envolvidas. Dentre as tcnicas univariadas, destacam-se os
histogramas, os mapas, as estimativas de densidade e boxplots, enquanto entre as tcnicas
24
multivariadas podero ser empregadas matrizes de disperso, grficos ligados aos mapas
(linked plots) e grficos de coordenadas paralelas, por exemplo (LIMA, 2010).
A anlise exploratria uma ferramenta utilizada na caracterizao do arranjo
espacial dos eventos. Os indicadores da anlise exploratria buscam avaliar no apenas a
posio absoluta dos eventos, mas tambm identificam a sua distribuio relativa, de
maneira a buscar padres de associaes espaciais (clusters espaciais), regimes espaciais
ou outras formas de instabilidade espacial (no-estacionaridade). A anlise consiste na
observao de algum tipo de padro sistemtico ou se esto distribudos aleatoriamente no
espao (MONTENEGRO, 2008). De acordo com Messner et al. (1999), a AEDE um
conjunto de tcnicas de anlise estatstica de informao geogrfica.
A AEDE contribui para indicar uma apropriada modelagem economtrica espacial,
ao permitir a identificao de localidades atpicas (outliers espaciais). A partir desse mtodo,
possvel extrair medidas de autocorrelao espacial e local, investigando a influncia dos
efeitos espaciais por intermdio de instrumentos quantitativos e no somente pela
inspeo visual de mapas (MONTENEGRO, 2008).
Os mtodos convencionais, como regresses mltiplas, no so formas
apropriadas de lidar com dados georreferenciados, visto que no so confiveis para
detectar agrupamentos e padres espaciais significativos. Dessa maneira, a AEDE deve ser
a primeira etapa para revelar padres espaciais, que devero anteceder quaisquer modelos
espaciais (ANSELIN; BERA, 1988).
Anselin e Bera (1998) assumem que difcil diferenciar autocorrelao espacial de
heterogeneidade espacial. Os autores argumentam que em uma cross-section os dois
problemas podem ser equivalentes do ponto de vista da observao, gerando dificuldades
em determinar se o problema ocasionado pela heterocedasticidade ou pela autocorrelao
espacial. Cross-sectional data ou cross section (de uma populao de estudo) em estatstica
e econometria um tipo de dado unidimensional definido. Cross-sectional data refere-se aos
dados coletados atravs da observao de muitos assuntos (como indivduos, empresas ou
pases/regies) no mesmo ponto do tempo ou sem levar em conta as diferenas de tempo.
A anlise dos dados cross-sectional geralmente consiste em comparar as diferenas entre
os sujeitos.
1. 4. 2 Matriz de proximidade espacial
Um procedimento necessrio para a anlise de dados de rea a construo de
uma matriz de vizinhana, tambm conhecida como matriz de distncia, matriz de
conectividade ou matriz de proximidade. Essa matriz de conectividade indica a relao
espacial de cada rea com as demais, podendo ser composta, por exemplo, apenas pela
25
lista de vizinhos de cada municpio; ou a distncia entre municpios ligados por estradas; ou
a conectividade ponderada pelo comprimento da fronteira comum (BRASIL, 2006).
A Figura 2 apresenta os municpios do estado de Roraima, a partir dos quais foi
construda uma matriz baseada na vizinhana, por meio da atribuio de valores: 1 para os
municpios que possuem fronteiras em comum, e 0 para os municpios que no
compartilham fronteiras (BRASIL, 2006). A matriz de vizinhana referente ao mapa da
Figura 2 pode ser vista na Figura 3. Observe, por exemplo, que a capital Boa Vista tem sete
vizinhos e que o municpio de Uiramut, no extremo norte, tem apenas dois vizinhos.
Figura 2 Mapa do estado de Roraima com diviso por municpios
Figura 3 Matriz de vizinhana para os municpios do estado de Roraima
De acordo com Cmara et al. (2002), a matriz de vizinhana, tambm chamada de
proximidade espacial W, uma ferramenta bsica para estimar a variabilidade espacial de
dados de reas. Como demonstrado graficamente pelas Figuras 4 e 5, dado um conjunto de
n reas {A1,..,An}, constri-se a matriz W, n x n, onde cada um dos elementos wij representa
uma medida de proximidade entre Ai e Aj. Essa medida de proximidade pode ser calculada
a partir de um dos seguintes critrios:
wij = 1, se o centroide de Ai est a uma determinada distncia de Aj; caso
contrrio wij = 0; para i j = 1, 2,..., n;
wij = 1, se Ai compartilha um lado comum com Aj, caso contrrio wij = 0; para i j
= 1, 2,..., n;
wij= lij/li, sendo lij o comprimento da fronteira entre Ai e Aj e li o permetro de Ai;
para i j = 1, 2,..., n.
Como a matriz de proximidade utilizada em clculos de indicadores na fase de
anlise exploratria, muito til normalizar suas linhas, para que a soma dos pesos de cada
linha seja igual a 1. Isso simplifica muito vrios clculos de ndices de autocorrelao
espacial. A Figura 4 ilustra um exemplo simples de matriz de proximidade espacial
normalizada, em que os valores dos elementos da matriz refletem o critrio de adjacncia.
26
A B C D E
A 0 1 0 0 0
B 0.25 0 0.25 0.25 0.25
C 0 1 0 0 0
D 0 0.5 0 0 0.5
E 0 0.5 0 0.5 0
Figura 4 Matriz de proximidade espacial de primeira ordem, normalizada pelas linhas
importante convencionar as formas de vizinhana quando se utiliza matrizes de
proximidade espacial que considerem a contiguidade. Desta maneira, os critrios baseiam-
se em movimentos de peas presentes no jogo de xadrez, tais como a rainha (Queen), a
torre (Rook) e o bispo (Bishop) (LESAGE, 1999; RODRIGUES et al., 2009). A Figura 5
apresenta esses critrios para identificar os vizinhos da rea J.
A B C D
E F G H
I J K L
M N O P
(a)
A B C D
E F G H
I J K L
M N O P
(b)
A B C D
E F G H
I J K L
M N O P
(c)
Figura 5 Representao dos tipos de contiguidade entre reas. (a) Contiguidade Queen (rainha), (b) Contiguidade Rook (torre) e (c) Contiguidade Bishop (bispo)
A Figura 5a demostra a adoo do critrio Queen, em que todas as reas que
tiverem interseco no-nula com a rea J sero vizinhas de J. Na Figura 5b apresenta-se o
critrio Rook, que tem como vizinhos apenas os que tiverem um lado em comum da rea J.
J a Figura 5c representa o critrio Bishop, que relaciona como vizinhos da rea J apenas
as reas que se localizam nas diagonais.
A ideia da matriz de proximidade espacial pode ser generalizada para vizinhos dos
vizinhos, e isso caracteriza a ordem da matriz. Considerando o critrio de vizinhana Rook e
uma matriz de ordem 2 na Figura 5b, os vizinhos de F, I, N e K tambm seriam
considerados vizinhos de J.
1. 4. 3 Vetor dos desvios e vetor de mdias ponderadas
Sabe-se que a cada rea i est associado um nmero real (xi), que representa o
valor do atributo na rea i. Para o clculo do vetor de desvios Z, calculada, primeiramente,
a mdia () dos valores dos atributos, considerando as n reas. Cada elemento i de Z,
denominado zi, obtido subtraindo-se o valor da mdia, do valor do atributo correspondente,
ou seja, zi = xi - , para i = 1,..., n. Em caso de no ter a mdia populacional considera-se a
mdia amostral x (ANSELIN, 1996).
27
O vetor de mdias ponderadas (Wz) obtido pela multiplicao do vetor transposto
dos desvios, pela matriz de proximidade espacial com linhas normalizadas, onde cada
elemento de uma linha i qualquer, originariamente com valor 1, dividido pelo nmero de
elementos no-nulos da mesma linha. Desta maneira, como resultado, cada elemento Wzi,
contm um valor correspondente mdia dos desvios dos vizinhos da rea i, caracterizando
uma mdia mvel espacial.
Com a definio do vetor de mdias ponderadas, pode-se estabelecer outro mapa
em uma anlise exploratria, simplesmente calculando a mdia mvel espacial dos atributos
estudados. Segundo Druck et al. (2004), o clculo de uma mdia mvel espacial uma
maneira de explorar a variao da tendncia espacial dos dados, pois a operao tende a
produzir uma superfcie com menor flutuao que os dados originais.
1. 4. 4 Dependncia Espacial
Um conceito-chave na compreenso e anlise dos fenmenos espaciais a
dependncia espacial. Essa noo parte da primeira lei da geografia: Todas as coisas so
parecidas, mas coisas mais prximas se parecem mais que coisas mais distantes
(TOBLER, 1979). Pode-se afirmar que a maior parte das ocorrncias, sejam estas naturais
ou sociais, apresentam entre si uma relao que depende da distncia. Esse princpio quer
dizer que, se encontrarmos poluio num trecho de um lago, provvel que locais prximos
a esta amostra tambm estejam poludos. Ou que, se a presena de uma rvore adulta inibe
o desenvolvimento de outras, esta inibio diminui com a distncia e, aps determinado raio,
outras rvores grandes sero encontradas (CMARA et al., 2004).
A dependncia espacial, ou autocorrelao espacial, refere-se correlao entre o
mesmo atributo em dois locais ou em dois perodos de tempo. Na ausncia de dependncia
espacial, a proximidade das duas localidades no influencia o comportamento conjunto de
atributos observados. Quando h dependncia espacial (autocorrelao espacial positiva ou
negativa), ento as observaes mais prximas so mais semelhantes do que as
observaes distantes (LI, 2007).
Aps a obteno de dados espaciais, a primeira questo que surge se existe
algum padro espacial, ou seja, esses locais ou pequenas reas que so prximas umas
das outras tendem a se comportar da mesma forma que aqueles mais distantes uns dos
outros? A questo pode ser colocada como um teste, onde, se houver dependncia espacial
nos dados, ento se deseja medi-la e estima-la (CMARA et al., 2004).
De acordo com Anselin (1988), a dependncia espacial se manifesta pela falta de
independncia que geralmente est presente entre as observaes cross-section. Segundo
Chasco (2003), primeira vista, a dependncia espacial pode parecer similar mais
conhecida dependncia presente nos testes economtricos de correlao de sries, nos
28
modelos de distribuio de atrasos e em outras anlises de sries temporais. No entanto,
essa semelhana apenas real em parte, devido natureza multidirecional da dependncia
no espao que, frente clara situao unidirecional do tempo, faz necessrio o uso de uma
estrutura metodolgica diferente.
Segundo Lesage (1998), a presena de dependncia espacial significa que uma
observao est associada a uma localizao i depende de observaes nas localizaes j,
sendo que i j. ( ) . Anselin (1988) baseou a dependncia espacial por
meio da noo de contiguidade binria entre as unidades espaciais, ou seja, a estrutura dos
vizinhos era expressa a partir dos valores binrios, 0 e 1. Dessa maneira, se duas unidades
espaciais tm uma fronteira comum, ento tais unidades so consideradas contguas e
recebem o valor um. Contrariamente, as unidades no-vizinhas recebem o valor zero para
classific-las. Isso implica afirmar que, conforme Lesage (1998), observaes que esto
mais prximas uma das outras devem refletir um maior grau de dependncia espacial do
que as mais distantes. Consequentemente, o poder da dependncia espacial entre as
observaes deve declinar com a distncia entre elas. Quanto dependncia espacial, as
unidades vizinhas devem apresentar um maior grau de dependncia espacial do que as
unidades localizadas distantes. (LESAGE, 1998).
Dados espaciais no formam um conjunto de amostras independentes. Uma
importante diferena em relao a dados sem essa peculiaridade que cada observao
no traz uma informao independente, e o conjunto de todas as observaes utilizado
integralmente para descrever o padro do fenmeno estudado (BRASIL, 2006).
Duas questes estatsticas devem levar em considerao a presena de
dependncia espacial: a identificao de padres espaciais e a anlise do efeito de
algum fator de risco sobre um desfecho para a localizao geogrfica. Para a identificao
de padres espaciais, preciso estimar a presena, forma e intensidade da dependncia
espacial (BRASIL, 2006).
Espacialmente aleatria qualquer ocorrncia cuja distribuio espacial no
apresente qualquer padro espacial detectvel. Na Figura 6a os pontos esto distribudos
aleatoriamente, na Figura 6b esto aglomerados (clusterizados) e na Figura 6c distribudos
de forma regular, ou seja, no-aleatria (BRASIL, 2006).
(a) (b) (c)
Figura 6 Padres de distribuio espacial de pontos
29
1. 4. 5 Estatstica Espacial de reas
A necessidade de quantificao da dependncia espacial presente em um conjunto
de geodados levou ao desenvolvimento da chamada estatstica espacial. Segundo Anselin
(1992), [...] a caracterstica que distingue a anlise estatstica dos dados espaciais que
seu foco principal est em inquirir padres espaciais de lugares e valores, a associao
espacial entre eles e a variao sistemtica do fenmeno por localizao.
As tcnicas de estatstica espacial distinguem-se das demais tcnicas empregadas
em anlise estatstica por considerar explicitamente as coordenadas dos dados no processo
de coleta, descrio ou anlise dos dados. Utiliza-se o termo autocorrelao espacial para
diferenciar da correlao da estatstica convencional, tendo em vista que nessa a correlao
obtida a partir de duas variveis diferentes, sem referncia a sua posio no espao; no
caso da autocorrelao, empregam-se no clculo os valores de uma mesma varivel em
duas posies diferentes (ROCHA, 2004).
A anlise de dados espaciais de rea est associada a mtodos utilizados quando
a localizao est associada a reas delimitadas por polgonos, o que ocorre com muita
frequncia quando se lida com eventos agregados por municpios, bairros ou setores
censitrios, em que no se dispe da localizao exata dos eventos, mas de um nico valor
por rea (DRUCK et al., 2004). Esses mtodos podem ser divididos entre: mtodos que
esto relacionados visualizao dos dados, mtodos chamados exploratrios e aqueles
centralizados na especificao do modelo estatstico e na estimativa de parmetros
(AVELAR, 2008).
Para uma anlise da distribuio espacial, levando em conta a localizao das
amostras, necessrio aplicar tcnicas da estatstica espacial para analisar dados que
podem ser classificados em eventos de padres espaciais, superfcies contnuas ou reas
com contagens (CRESSIE, 1993). Uma das tcnicas para a rea de contagens o ndice
global de Moran (GETIS; ORD, 1992; BAILEY;GATRELL, 1995).
Com base na coleta sistemtica de informaes quantitativas, os objetivos da
estatstica espacial so: descrio cuidadosa e precisa de eventos no espao geogrfico
(incluindo a descrio de padres); explorao sistemtica do padro de eventos e de sua
associao no espao, com o objetivo de ganhar o melhor entendimento dos processos que
podem ser responsveis pela distribuio observada, e melhora da habilidade de predizer e
controlar eventos que possam ocorrer nos espaos geogrficos (AVELAR, 2008). Assuno
et al. (2001a) afirmam que a caracterstica fundamental da estatstica espacial, que se
diferencia da estatstica clssica, o uso explcito da referncia geogrfica no modelo, isto
, o uso explcito das coordenadas espaciais no processo de coleta, descrio e anlise dos
dados. Assim, o interesse est centrado nos processos que ocorrem no espao e os
mtodos empregados buscam descrever e analisar o comportamento desses processos.
30
Essa caracterstica faz com que estudos sobre o assunto exibam comportamento complexo,
para serem analisados por mtodos tradicionais de estatstica (ASSUNO, 2001).
Uma vez que a estatstica espacial de rea faz uso da referncia geogrfica no
modelo, isto , das coordenadas espaciais no processo de coleta, descrio e anlise dos
dados, seu interesse est centrado nos processos que ocorrem no espao e os mtodos
empregados buscam descrever e analisar o comportamento desses processos
(ASSUNO, 2001b).
A forma usual de apresentao de dados agregados por reas o uso de mapas
de diferentes tonalidades de cores com o padro espacial do fenmeno (CMARA et al.,
2002). A Figura 7 exibe a distribuio espacial da produtividade da soja para 48 municpios
da regio oeste do estado do Paran, para os dados da safra 2001/2002. Verifica-se que
91,66% dos 48 municpios estudados, para os dados da safra de 2001/2002 esto acima da
mdia estadual (2.766 kg ha-1), segundo os dados da Conab (2010). Para a mdia nacional
(2.407 kg ha-1), verifica-se que 100% dos municpios estudados tiveram uma produtividade
maior.
Figura 7 Valores de Produtividade para os dados da safra de 2001/2002, em 48 municpios da regio oeste do estado do Paran agrupados pela mdia estadual.
1. 4. 6 Anlise de variveis espaciais de reas
Uma das tcnicas mais utilizadas no estudo de fenmenos de reas a Anlise de
Autocorrelao Espacial (CARVALHO, 1997). Essa tcnica permite identificar a estrutura de
correlao espacial que melhor descreve o padro de distribuio dos dados. A ideia bsica
estimar a magnitude da Autocorrelao Espacial entre as reas, evidenciando como os
valores esto correlacionados no espao (ANSELIN, 2002).
Neste caso, as tcnicas so utilizadas para estimar quanto do valor observado de
um atributo numa regio dependente dos valores dessa mesma varivel nas localizaes
31
vizinhas. Enquadram-se nessa categoria o ndice Global de Moran (TEXEIRA; BERTELLA,
2010).
Os indicadores globais de autocorrelao espacial, como o ndice de Moran,
fornecem um nico valor como medida da associao espacial para todo o conjunto de
dados, o que til na caracterizao da regio de estudo como um todo. No entanto,
quando se lida com um grande nmero de reas, muito provvel que ocorram diferentes
regimes de associao espacial e que apaream locais em que a dependncia espacial
ainda mais pronunciada (CMARA et al., 2002).
Por meio das anlises locais ou modelagens locais, busca-se testar a presena
de diferenas espaciais ao invs de assumir que estas no existem. Essas anlises
desagregam as estatsticas globais segundo seus constituintes locais, concentrando-se mais
nas excees locais do que na busca por regularidades globais (FOTHERINGHAM et al.,
2000).
Entre as tcnicas univariadas aplicadas anlise local existem as abordagens
grficas e aquelas voltadas para o desenvolvimento formal de estatsticas univariadas
locais. Entre as abordagens grficas busca-se, prioritariamente, identificar excees locais
s tendncias gerais na distribuio dos dados e nas relaes entre variveis. Trabalha-se,
neste sentido, com o auxlio de histogramas, grficos de disperso e grficos em trs
dimenses (MELO;HEPP, 2008).
As tcnicas grficas mais complexas para demonstrar relaes locais em bancos
de dados univariados incluem o Spatial Lagged Scatterplot, o Variogram Cloud Plot e o
Moran Scatterplot. Destaca-se, nesta lista, o Moran Scatterplot, que, alm de permitir a
identificao de grupos de valores, tambm permite a identificao de valores extremos na
distribuio e apresenta uma visualizao do nvel de autocorrelao espacial existente
(SALAME, 2008).
1.5 Autocorrelao espacial
A estrutura de dependncia entre os valores observados nas vrias reas do
fenmeno em estudo analisada pela funo de autocorrelao espacial. Autocorrelao,
como o prprio nome indica, mede a correlao da prpria varivel, e, sendo espacial, no
espao. A correlao de uma varivel com ela mesma, medida no mesmo local, ser
sempre 1 (UM). Entretanto, a correlao de uma varivel com ela mesma, porm medida
nas reas vizinhas, ter um valor que varia entre -1 e 1 (como qualquer medida de
correlao). Quanto mais prximo de 1 (UM), maior a semelhana entre vizinhos. O valor 0
(zero) indica inexistncia de correlao, e valores negativos indicam dessemelhana
(CMARA et al., 2002).
32
1. 5. 1 Autocorrelao espacial global univariada
A autocorrelao espacial global pode ser calculada por meio da estatstica I de
Moran (BAILEY; GATRELL, 1995), a qual permite analisar se os dados so aleatoriamente
distribudos no espao, ou seja, se a varivel sob anlise est autocorrelacionada
espacialmente.
Segundo Cressie (1993), formalmente, a estatstica I de Moran pode ser expressa
pela equao (1).
n
i
i
n
i
n
j
ijji
zS
wzzn
I
1
2
0
1 1 Eq.(1)
em que n o tamanho da amostra; )( xxz ii e )( xxz jj so as variveis das
populaes i e j centradas na mdia; wij o elemento da matriz quadrada e simtrica W, n x
n, a qual expressa a relao espacial entre as n populaes, e S0 o somatrio dos
elementos wij da matriz simtrica de pesos espaciais W.
Tendo como exemplo a produtividade de soja, a indicao de autocorrelao
espacial positiva revela que h similaridade entre os municpios, ou seja, municpios com
alta produtividade tendem a estarem rodeados por municpios vizinhos que tambm
apresentam alta produtividade ou municpios com baixa produtividade rodeados por vizinhos
que possuem baixa produtividade. Por outro lado, a autocorrelao espacial negativa indica
que existe uma dissimilaridade entre os valores do atributo estudado e da localizao
espacial deste atributo. Assim, nesse exemplo, municpios com baixa produtividade esto
rodeados por municpios que apresentam alta produtividade ou municpios com alta
produtividade rodeados por vizinhos que apresentam baixos valores desta varivel de
interesse.
De acordo com Jing e Cai (2009), um aspecto interessante na estatstica I de Moran
que possvel a visualizao como sendo uma inclinao em um grfico de disperso da
varivel espacialmente defasada (Wx) sobre a varivel original (x), ou o chamado Moran
Scatter plot. Isso fornece uma maneira fcil de categorizar a natureza da autocorrelao
espacial em quatro tipos, correspondentes aos clusters espaciais e outliers espaciais.
A estimativa da significncia do ndice de Moran, de acordo com Kampel et al.
(2000) e Cmara et al. (2002), pode ser abordada de duas maneiras: a primeira associa o
ndice a uma distribuio estatstica, onde geralmente considera a varivel como sendo uma
distribuio normal padro, cuja significncia obtida por comparao direta do valor de Z
com o valor da probabilidade tabelada; a segunda abordagem um teste de
pseudossignificncia que gera diferentes permutaes dos valores de atributos associados
s zonas, onde cada permutao produz um novo arranjo espacial dos valores
33
redistribudos entre as reas, sendo a sua significncia obtida a partir de uma distribuio
emprica I de Moran. Se o valor do ndice I de Moran medido corresponder a um extremo
da distribuio simulada, ento se trata de um evento com significncia estatstica.
1. 5. 2 Autocorrelao espacial global multivariada
A autocorrelao espacial global verifica a existncia de um padro de associao
espacial entre duas variveis. O objetivo revelar se os valores da varivel observada em
uma dada regio guardam uma relao com os valores de outra varivel observada em
regies vizinhas. Isso significa que a estatstica I de Moran (Equao 2) pode ser calculada
para duas variveis em estudo.
n
i
i
n
i
n
j
jiji
n
i
n
j
ij
yx
xx
yywxx
w
nI
1
2
1 1
1 1
)(
)()(
Eq. (2)
A interpretao para o I de Moran multivariado pode ser descrita da mesma
maneira que a estatstica I de Moran univariada, caso o valor do Iyx de Moran multivariado
for positivo, municpios que apresentam valores elevados (y) esto rodeados por municpios
vizinhos que apresentam nvel (x) alto. De outra forma, municpios com baixos valores de (y)
so vizinhos de outros com baixo nvel de (x) (FERRARIO et al., 2009).
Para uma anlise multivariada, com mais de duas variveis em estudo, faz-se uso
da Matriz de Diagramas de Disperso de Moran (Morans Scatterplot Matrix). Nesta matriz,
os eixos inferiores so as variveis em estudo (todas normalizadas), nos eixos verticais
esto as variveis espacialmente defasadas (com os lags espaciais aplicados s variveis
normalizadas). Essa ferramenta permite uma viso do padro espacial de cada varivel com
ela prpria, bem como a defasagem espacial com as outras variveis (ANSELIN et al.,
2004). A Figura 8 apresenta uma matriz de diagramas de disperso de Moran.
Figura 8 Matriz de Diagramas de Disperso de Moran apresentado por Anselin et al. (2004)
34
1. 5. 3 Autocorrelao espacial local
O objetivo da autocorrelao espacial captar padres de associao local
(clusters ou outliers espaciais). Embora seja capaz de apontar a tendncia geral de
agrupamento dos dados, o I de Moran uma medida global e por isso no revela padres
locais de associao espacial, quer dizer, so geralmente ocultados pelas estatsticas de
autocorrelao global.
OI de Moran pode no identificar clusters locais importantes em uma regio global,
quer sejam clusters positivos ou clusters negativos. A autocorrelao local pode ser
calculada pela estatstica I de Moran local, tambm conhecido como Local Indicator of
Spatial Association (LISA) (ANSELIN, 1995).
1. 5. 4 Indicadores Locais de Associao Espacial (LISA) Univariado
Segundo Anselin (1995), um Local Indicator of Spatial Association (LISA) ser
qualquer estatstica que satisfaa a dois critrios:
a) um indicador LISA deve possuir para cada observao, uma indicao de
clusters espaciais significantes de valores similares em torno da observao
(regio, por exemplo);
b) o somatrio dos LISAs para todas as regies proporcional ao indicador de
autocorrelao espacial global.
Segundo Le Gallo e Erthur (2003), a estatstica LISA, baseada no I de Moran local
para a varivel x, no perodo t, Xt=(x1,..xn)t, pode ser especificada da seguinte forma:
n
j
ttjij
tti
ti xwx
I1
,2
0
,
, )(
Eq. (3)
sendo 20 a varincia dos dados populacionais, com
n
x tti
n
i
2
,
12
0
)(
Eq. (4)
Na qual xi,t a observao de uma varivel de interesse na regio i para o perodo
(ano por exemplo) t (ou espao t), a mdia das observaes entre as regies no perodo
t para a qual o somatrio em relao a j tal que somente os valores vizinhos diretos de j
so includos no clculo da estatstica.
A estatstica pode ser interpretada da seguinte maneira:
valores positivos de Ii,t significam que existem clusters espaciais com valores
similares (alto ou baixo);
valores negativos significam que existem clusters espaciais com valores
diferentes entre as regies e seus vizinhos.
35
De acordo com Anselin (1995), a estatstica LISA utilizada tambm para medir a
hiptese de ausncia de associao espacial local. importante salientar que, assim como
a distribuio para as estatsticas globais, a distribuio genrica para a estatstica LISA
tambm de difcil apurao. Portanto, para solucionar tal problema, deve-se trabalhar com
resultados assintticos. Logo, a alternativa a utilizao de uma aleatorizao que permita
auferir pseudonveis de significncia.
Rusche (2009) ressalta que a estatstica local de Moran pode ser utilizada para uma
avaliao inicial da estrutura local dos regimes espaciais, uma v