Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
IBSN: 978-85-7282-778-2 Página 1
PREENCHIMENTO DE FALHAS EM DADOS DE
TEMPERATURA MÉDIA MÁXIMA DO AR: ESTUDO PARA A
ESTAÇÃO DE LAVRAS-MG
Thiago Alves de Oliveira (a), Camila de Moraes Gomes Tavares (b), Michaela
Campos e Silva (c), Victor Samuel Bernardes de Paula (d), Fabio Sanches (e), Cássia de
Castro Martins Ferreira (f),
(a) Mestrando do Programa de Pós-Graduação em Geografia-PPGEO- UFJF, Laboratório de
Climatologia e Análise Ambiental, Instituto de Ciências Humanas-ICH- Universidade Federal de Juiz de
Fora; Email: [email protected] (b) ) Mestranda do Programa de Pós-Graduação em Geografia-PPGEO- UFJF, Laboratório de
Climatologia e Análise Ambiental, Instituto de Ciências Humanas-ICH- Universidade Federal de Juiz de
Fora; Email: [email protected] (c) Graduanda do curso de Geografia, Laboratório de Climatologia e Análise Ambiental (Bolsista),
Departamento de Geociências, Instituto de Ciências Humanas-ICH- Universidade Federal de Juiz de
Fora; Email: [email protected] (d) Graduando do curso de Geografia, Laboratório de Climatologia e Análise Ambiental (Bolsista),
Departamento de Geociências, Instituto de Ciências Humanas-ICH- Universidade Federal de Juiz de
Fora; Email: [email protected] (e) Prof. Dr. do Departamento de Geociências, Instituto de Ciências Humanas-ICH- Universidade
Federal de Juiz de Fora; Laboratório de Climatologia e Análise Ambiental Email:
[email protected] (f) Profa. Dra. do Departamento de Geociências, Instituto de Ciências Humanas-ICH- Universidade
Federal de Juiz de Fora; Laboratório de Climatologia e Análise Ambiental (Coordenadora), Email:
Eixo: A Climatologia no contexto dos estudos da paisagem e socioambientais
Resumo/
O presente trabalho objetivou avaliar duas técnicas de preenchimento de falha em dados meteorológicos,
tendo como base os dados da estação meteorológica do INMET em Lavras-MG e como estação de apoio
foram utilizados os dados de São Lourenço e Lambari-MG. A metodologia consistiu no preenchimento
de falhas simuladas em nove anos da série, a partir das técnicas de regressão linear simples e a ponderação
regional, posteriormente os dados estimados foram comparados com os observados a partir do teste t de
Student. Os resultados demonstraram que a ponderação regional teve um desempenho superior no
preenchimento da falhas, sendo que em todos os meses os dados estimados são semelhantes
IBSN: 978-85-7282-778-2 Página 2
estatisticamente aos observados a partir do teste t de Student, já a regressão linear teve um comportamento
pior no preenchimento.
Palavras chave: técnicas estatísticas, regressão linear, ponderação regional, séries temporais
1. Introdução
Muito se tem discutido ao longo dos últimos anos a respeito das mudanças climáticas
globais. Dentro dessa perspectiva, se fazem importantes as análises de séries temporais com o
intuito de verificar tendências ou mudanças no comportamento dos elementos climáticos
(BACK, 2001; FOLHES E FISCH, 2006; BLAIN, 2010; FANTE e SANT’ANNA NETO,
2013; SANCHES et. al. 2015; 2017; REBOITA et al, 2018).
Folhes e Fisch (2006) analisando os dados de precipitação e temperatura do ar para o
município de Taubaté-SP, a partir do Teste de Mann-Kendall destacam que para a temperatura
média máxima e média mínima anual não há tendência de aumento ou diminuição da
temperatura do ar, para a confiança de 95%.
Blain (2010) discute a partir de 8 séries de temperatura máxima média anual do ar,
utilizando testes não paramétricos com o de Mann-Kendall no estado de São Paulo. Aponta que
Pindorama e Ubatuba apresentam aumento na temperatura média máxima do ar nos últimos
anos. As cidades de Campinas e Piracicaba revelaram um deslocamento no conjunto de dados
em direção aos valores mais elevados, a partir de um teste de probabilidade.
Reboita et al (2018) analisando a partir de modelagens os dados de precipitação e
temperatura média do ar para Minas Gerais, destacam que para os modelos analisados houve
um aumento da temperatura média no estado, entre 2 e 5°C entre os dados de 1980- 2005 (clima
presente) e 2070- 2095 (clima futuro).
Análises associadas a extremos de temperatura do ar, ondas de calor, tendências de
aquecimento necessitam de boas séries de dados de temperatura, para que os resultados sejam
satisfatórios (FANTE e SANT’ANNA NETO, 2016), no entanto as coletas de dados de
temperatura do ar ainda são bastante deficitárias no território brasileiro se comparada à rede de
coleta de dados de precipitação, a qual possui um número maior de estações.
IBSN: 978-85-7282-778-2 Página 3
Para a análise de séries temporais, Fante e Sant’Anna Neto (2013) destacam que a
escassez de dados em função de uma rede de observação meteorológica limitada, bem como a
presença de falhas nas bases de dados de estações ativas, levaram a uma busca por parte de
pesquisadores por técnicas geoestatísticas que possibilitassem o preenchimento de falhas em
série de dados meteorológicos.
Diversas são as técnicas utilizadas para o preenchimento de falhas, segundo Bier e
Ferraz (2017, p. 215) estas vão “desde técnicas simples como o cálculo da média aritmética
entre dados oriundos de estações vizinhas, até métodos mais apurados, como redes neurais, as
quais são caracterizadas por algoritmos computacionais robustos”.
Estes mesmos autores (BIER e FERRAZ, 2017) avaliaram 6 técnicas de preenchimento
para os dados de temperatura média compensada e de precipitação para estações localizadas no
Rio Grande do Sul, sendo utilizadas a média aritmética, regressão linear múltipla, ponderação
regional, interpolação do inverso da distância, método da razão normal e o método tradicional
do Reino Unido. Apontam que a Ponderação Regional, Regressão linear múltipla e o método
do Reino Unido apresentaram os melhores resultados.
Fante e Sant’Anna Neto (2013; 2016) ao avaliar a regressão linear simples e a
ponderação como técnicas de preenchimento de falhas para a temperatura média máxima e
média mínima do ar em estações do estado de São Paulo apontam que, para o preenchimento
da temperatura média máxima, a regressão linear teve um desempenho inferior, chegando a até
2,3°C de diferença do valor real, enquanto que a ponderação regional não ultrapassou a
diferença de 0,9°C.
Nesse sentido, o objetivo do trabalho é avaliar duas técnicas de preenchimento de falhas,
a ponderação regional e a regressão linear simples, com o intuito de apontar qual a técnica
estima de maneira mais satisfatória os dados observados.
2. Caracterização da área de estudo
A estação cujo os dados foram preenchidos encontra-se no município de Lavras-MG,
no Campo das Vertentes, enquanto as estações de apoio encontram-se no sul do estado de Minas
Gerais, nos municípios de São Lourenço e Lambari. Segundo Oliveira et al (2018) a região Sul
IBSN: 978-85-7282-778-2 Página 4
do estado tem a sua dinâmica climática influenciada pela topografia, estando localizados no
contexto da Serra da Mantiqueira, (FIGURA 01), localizadas na grande bacia do Rio Grande
(Tabela I).
Tabela I: Estações do Inmet utilizadas no trabalho
Município Altitude Bacia hidrográfica
Lavras 919m Rio Grande
Lambari 878m Rio Grande
São Lourenço 953m Rio Grande
Figura 01: Localização das estações utilizadas no trabalho.
Oliveira et al (2018) e Reboita et al (2015) apontam que o clima na região se comporta
como uma monção, com duas estações bem definidas, uma estação mais quente e chuvosa que
vai de outubro a março, e uma estação fria e seca que vai de abril a setembro.
No verão, o ar quente e úmido é transportado para essa região pelos ventos do
setor oeste do Anticiclone Subtropical do Atlântico Sul (ASAS) e pelo jato de
baixos níveis a leste dos Andes (JBN). Esse último transporta ar quente e
úmido de origem tropical para os subtrópicos. A interação do escoamento
propiciado pelo ASAS e pelo JBN com a convecção local são fatores que
IBSN: 978-85-7282-778-2 Página 5
podem contribuir para a formação da Zona de Convergência do Atlântico Sul
(ZCAS). (OLIVEIRA, 2015, p. 759).
Nos períodos de Inverno,
Os sistemas atmosféricos migram para norte. Desta maneira, a convecção
enfraquece na região do Trópico de Capricórnio, o ASAS torna-se mais
intenso e expandido para oeste de forma que parte do seu setor oeste se
localiza sobre o sudeste e sul do Brasil.” (REBOITA, 2015, p. 208).
Além disso, na porção onde se localizam as estações, a topografia acidentada repercute
na variabilidade anual dos elementos climáticos, pois a “a presença de vales e montanhas
contribui para o desenvolvimento de circulações de mesoescala, tais como as brisas de vale e
de montanha” (OLIVEIRA, 2018, p. 759).
3. Materiais e métodos
A metodologia realizou-se em 5 etapas.
A primeira etapa consistiu no levantamento dos dados de temperatura média máxima
mensal para os municípios de Lavras, Lambari e São Lourenço-MG. Estes dados encontram-se
disponíveis junto ao Banco de Dados Meteorológicos para Ensino e Pesquisa - BDMEP
(http://www.inmet.gov.br/portal/index.php?r=bdmep/bdmep) localizado no site do Instituto
Nacional de Meteorologia - INMET (www.inmet.gov.br/portal/).
A partir do levantamento dos dados das estações de apoio (Lambari e São Lourenço),
na segunda fase do trabalho, estes conjuntos de dados foram testados a partir da correlação
linear de Pearson com os dados da estação de Lavras, buscando verificar a intensidade das
relações entre os conjuntos.
Na terceira fase foram utilizadas duas técnicas de preenchimento para os dados: a
regressão linear simples e a ponderação regional. A regressão linear consiste na extração da
equação de regressão (𝑦 = 𝑎𝑥 − 𝐵) a partir dos dados das estações de apoio, no caso Lambari
e São Lourenço. Os dados foram preenchidos a partir da regressão com as estações de apoio,
com o intuito de analisar o desempenho individual das mesmas.
IBSN: 978-85-7282-778-2 Página 6
Para o preenchimento por ponderação regional “as falhas de um posto são preenchidas
através de uma ponderação com base em postos vizinhos” (ALEXANDRE, 2009, p.23). Sendo
que o método pode ser aplicado a partir da equação 1:
𝑌 = 𝑌𝑚é𝑑/𝑛(𝑋1
𝑋𝑚1+
𝑋2
𝑋𝑚2+
𝑋𝑛
𝑋𝑛𝑚𝑒𝑑) (Equação 1)
Onde: Y é o valor a ser preenchido; Ymed é a média dos dados ao longo da série para o
mês que o preenchimento será realizado; n é o número de estações de apoio utilizadas; X1, X2,
Xn são os dados mensais correspondentes ao período de preenchimento, observados nas
estações de apoio; Xm1, Xm2, Xnmed: são os dados médios referentes aos meses de
preenchimento nas estações de apoio. Nesse caso a ponderação foi realizada com as duas
estações de apoio, Lambari e São Lourenço.
A partir das técnicas utilizadas, na quarta fase, foram simuladas falhas para que os testes
fossem avaliados, nesse sentido foram selecionados 9 anos da série, 1996, 1999, 2000, 2001,
2003, 2004, 2005, 2007, 2008, estes foram escolhidos pelo fato de que as três estações utilizadas
tinham seus dados observados e sem falhas.
Na quinta fase os dados mensalmente estimados pelas técnicas foram avaliados
estatisticamente pelo teste t de Student, com o intuito de verificar se os mesmos se comportavam
de maneira semelhante aos observados. O Teste t é um teste de hipóteses, no qual duas amostras
(dados observados e dados estimados) foram avaliados em função da sua homogeneidade, para
isso estabeleceu-se um nível de significância de 0,05 (95%). O teste foi calculado mensalmente
para as amostras a partir do software Excel 2013.
4. Resultados e discussão
A primeira avaliação dos dados, partiu da análise de correlação entre as estações de
apoio (São Lourenço e Lambari) e a estação de Lavras. É possível notar a partir da figura 02
que as duas estações utilizadas apresentam um comportamento similar quando correlacionadas
com os dados de Lavras.
IBSN: 978-85-7282-778-2 Página 7
Quando avaliada a correlação ponto a ponto, ou seja, seguindo a própria ordem
cronológica dos dados, tanto Lambari quanto São Lourenço obtém um coeficiente de
determinação R²= 0,88) e uma correlação de Pearson de 0,93. Já na correlação de conjunto,
quando os dados são ordenados do menor para o maior, ambas as estações demonstram uma
elevada correlação com a estação de Lavras (R²=0,99, bem como a correlação de Pearson -
r=0,99), demonstrando que o comportamento dos dados entre essas três estações seguiu uma
dinâmica bem próxima ao longo do período.
A partir das falhas criadas para os 9 anos da série foi possível extrair o erro médio
mensal de cada técnica de preenchimento. A tabela II apresenta a média mensal de erro para os
9 anos testados, sendo que a ponderação regional obteve o melhor desempenho, pois em média
não ultrapassa 0,5°C em nenhum dos meses do ano, Já as outras duas regressões, com a estação
de Lambari (Regressão 1) e a estação de São Lourenço (Regressão 2) apresentaram erros
maiores no preenchimento.
IBSN: 978-85-7282-778-2 Página 8
Figura 02: Gráficos de correlação ponto a ponto e do conjunto de dados entre Lavras e as estações de
apoio.
Tabela II: Média mensal dos resíduos entre os dados estimados por cada técnica e os valores
observados. Regressão 1: Regressão linear entre os dados de Lavras e Lambari; Regressão 2: Regressão Linear
entre os dados de Lavras e São Lourenço.
A regressão 1 (com os dados de Lambari) foi a que apresentou o pior desempenho dentre
os conjuntos de dados utilizados. Nos meses mais quentes do ano o erro ultrapassou os 2°C em
média. Já a regressão 2 (com os dados de São Lourenço) teve um desempenho intermediário,
sendo que os erros médios mensais não ultrapassaram 1°C, no entanto foram maiores que os
estimados pela ponderação regional.
Na tabela III estão os dados da soma anual dos módulos dos resíduos, corroborando com
as médias mensais, destaca a Ponderação regional com o menor erro em todos os anos, seguida
pela regressão com os dados de São Lourenço (Regressão 2) e com a estimativa mais
equivocada os dados da regressão com os dados de Lambari (Regressão 1).
Tabela III: Soma anual dos resíduos entre os dados estimados por cada técnica e os valores observados.
Regressão 1: Regressão linear entre os dados de Lavras e Lambari; Regressão 2: Regressão Linear entre os dados
de Lavras e São Lourenço.
Jan. Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
P. Regional 0,4 0,4 0,4 0,3 0,4 0,4 0,3 0,5 0,4 0,3 0,5 0,5
Regressão 1 2,6 2,7 2,2 2,1 0,9 0,4 0,4 1,3 1,7 2,1 2,7 3,0
Regressão 2 0,5 0,5 0,4 0,6 0,9 0,9 0,8 0,9 0,6 0,5 0,6 0,3
Média mensal dos resíduos (°C)
P. Regional Regressão 1 Regressão 2
1996 5,1 18,0 6,5
1999 3,8 21,2 6,6
2000 4,0 21,6 6,2
2001 5,1 24,3 5,6
2003 4,2 23,0 4,9
2004 4,7 20,1 9,4
2005 4,1 27,6 9,2
2007 4,0 20,6 6,3
2008 7,8 21,3 13,7
Soma anual dos resíduos (°C)
IBSN: 978-85-7282-778-2 Página 9
Como forma de exemplificar o preenchimento das falhas analisadas tem-se as figura 03,
04 e 05 nas quais foram plotados os dados observados e as estimativas para os anos de 2003,
2004 e 2005. É possível identificar como o preenchimento de falhas pela ponderação regional
se aproxima dos dados observados nos 3 anos apresentados. Além disso, nota-se que os dados
estimados pela regressão 1 (com os dados de Lambari), em boa parte desse período,
superestimaram os dados de Lavras.
Para o ano de 2003, observa-se que a ponderação regional e a regressão linear com os
dados de São Lourenço (Regressão 2) obtiveram uma maior aproximação com os dados
observados em Lavras, enquanto que os dados preenchidos a partir dos dados de Lambari
(Regressão 1) pouco se aproximaram com os observados, principalmente nos meses mais
quentes do ano. A partir da Tabela III para este ano o resíduo total anual foi de 4,2°C para a
ponderação regional, 4,9°C para a regressão com os dados de São Lourenço (Regressão 2) e
23,0°C para a regressão 1 (com os dados de Lambari).
Figura 03: Desempenho mensal das técnicas de preenchimento para o ano 2003
No ano de 2004 os dados da ponderação regional e da regressão 2 (com os dados de São
Lourenço) se mantiveram mais próximos dos dados observados, enquanto os dados da regressão
com os dados de Lambari se aproximaram apenas nos meses Maio, Junho, Julho, e nos meses
mais quentes a estimativa teve um desempenho pior.
IBSN: 978-85-7282-778-2 Página 10
Figura 04: Desempenho mensal das técnicas de preenchimento para o ano 2004
Para o ano de 2005 o comportamento foi semelhante, seguindo a mesma dinâmica, a
ponderação regional com o melhor desempenho variando bem próximo dos dados observados,
seguido pela regressão 2 (com os dados de São Lourenço) e pela regressão 1 (com os dados de
Lambari) que teve o pior desempenho ao longo dos três anos.
Figura 05: Desempenho mensal das técnicas de preenchimento para o ano 2005
Nos três anos aqui exemplificados 2003, 2004, 2005 (figuras 03, 04 05) foi possível
verificar que a qualidade do preenchimento dos dados pela ponderação regional esteve acima
das outras técnicas, as duas regressões utilizadas tiveram um comportamento variável ao longo
do período.
IBSN: 978-85-7282-778-2 Página 11
Como uma forma de avaliar estatisticamente o preenchimento das falhas, os conjuntos
de dados foram submetidos ao Teste t de Student, utilizado com o intuito de verificar se os
conjuntos de dados estimados pelas técnicas se aproximavam dos dados observados.
De acordo com o Teste t, confirmando o que visualmente já se mostrava, a ponderação
regional estimou conjuntos de dados semelhantes estatisticamente aos dados observados, em
nenhum dos meses a estatística de teste calculada ultrapassou o limite de confiança, dessa forma
pode-se considerar que todos os meses mantiveram uma semelhança estatística nos conjuntos.
Na tabela IV, estão os dados da estatística t calculada mensalmente para a ponderação
regional, é possível observar que os valores estiveram bem baixos, em relação ao limite de
confiança de -2,33< Start t<2,33, sendo que apenas os meses Março, Julho e Setembro
ultrapassaram o valor 1. O segundo conjunto de dados, na regressão 1 (com os dados de
Lambari), em 10 meses os conjuntos de dados estimados foram estatisticamente diferentes dos
observados, apenas os meses de Junho e Julho semelhantes.
Tabela IV: Estatística do Teste t calculada para os dados observados e os calculados pela ponderação
regional, Regressão 1 e Regressão 2.
-2,33< Start t<2,33- Limite de confiança a 95%.
Já a regressão 2, com os dados de São Lourenço, o teste t demonstrou que os meses
Maio, Junho, Julho, Agosto, Setembro, Outubro foram preenchidos por conjuntos de dados
diferentes dos dados observados, no entanto, os outros meses foram bem representados pelo
preenchimento (Janeiro, Fevereiro, Março, Abril, Novembro, Dezembro).
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
Start t 0,2 0,55 -1,61 0,97 -0,8 -0,54 -1,49 0,38 1,93 -0,16 0,05 0,75
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
Start t 10,37 13,37 10,07 13,99 4,46 1,33 1,96 5,5 6,67 9,66 9,51 5,87
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
Start t -1,61 -0,97 -1,84 -1,92 -2,79 -2,81 -5,17 -2,43 -4,22 -3,27 -0,66 -1,13
Ponderação regional
Regessão linear 1: Lavras-Lambari-MG
Regressão 2: Lavras- São Lourenço
IBSN: 978-85-7282-778-2 Página 12
5. Considerações finais
Assim como apresentado na literatura, a Ponderação Regional apresentou um bom
desempenho para o preenchimento das falhas para a região de estudo, sendo isso confirmado
pelos testes realizados no presente trabalho, os dados estimados por esta técnica mantiveram a
variabilidade normal dos dados observados.
Destaca-se a importância da avaliação das técnicas estatísticas utilizadas em
preenchimento de falhas, uma vez que permitem uma melhor estimativa dos dados,
enriquecendo as análises posteriores da série temporal utilizada.
Referências bibliográficas.
ALEXANDRE, G. R. Estudo para identificação de tendências do regime pluvial na região metropolitana de
belo horizonte a partir de métodos estatísticos e modelos climáticos. Dissertação de Mestrado (em Engenharia),
Programa de Pós-Graduação em Saneamento, Meio Ambiente e Recursos Hídricos, Universidade Federal de
Minas Gerais-UFMG, Belo Horizonte, 2009.
BACK, A.J. Aplicação de análise estatística para identificação de tendências climáticas. Pesq. Agropec. Bras.
Brasília, v.36, n.5, p. 717-726, maio 2001.
BIER, A. A.; FERRAZ, S. E. T. Comparação de metodologias para preenchimento de falhas em dados
meteorológicos para estações no Sul do Brasil. Revista Brasileira de Meteorologia, v. 32, p. 215-226, 2017.
BLAIN, G. C. Precipitação pluvial e temperatura do ar no Estado de São Paulo: periodicidades,
probabilidades associadas, tendências e variações climáticas. Tese de Doutorado (em Agronomia), Escola
Superior de Agricultura “Luiz de Queiroz” -ESALQ, Universidade de São Paulo-USP, 2010.
FANTE, K. P.; SANT’ANNA NETO, J. L. Aplicação de técnicas geoestatísticas em análises climatológicas:
Metodologias para preenchimento de falhas. In. Simpósio Brasileiro de Geografia Física Aplicada (SBGFA), 15,
2013, Vitoria- ES, anais ..., Vitória, 2013, p. 782-790.
FANTE, K. P.; SANT’ ANNA NETO, J. L. Técnicas Estatísticas para homogeneização de dados de temperatura
em séries temporais climatológicas, Revista Brasileira de Climatologia, V. 18, p. 143-156, 2016.
FOLHES, M. T.; FISCH, G. Caracterização climática e estudo de tendências nas séries temporais de temperatura
do ar e precipitação em Taubaté (SP). Revista Ambiente, Água, v.1, n.1. p.61-71, 2006.
INMET. Base de dados meteorológicos para ensino e pesquisa-BDMEP. Disponível em <
http://www.inmet.gov.br/portal/index.php?r=bdmep/bdmep>, Acesso em 16/08/2018.
OLIVEIRA, D. M.; REBOITA, M. S. ROCHA, R. P.; A influência da topografia da região sul de Minas Gerais
nas variáveis atmosféricas simuladas com o RegCM4. Revista Brasileira de Geografia Física, V. 11, n.3, p.
758-772, 2018.
REBOITA, M. S.; RODRIGUES, M.; SILVA, L. F.; ALVES, M. A. Aspectos climáticos do estado de Minas
Gerais. Revista Brasileira de Climatologia, V. 17. p. 206-226, 2015.
REBOITA, M. S.; MARRAFON, V. H. A.; LLOPART, M.; ROCHA, R. P. Cenários de mudanças climáticas
projetados para o estado de Minas Gerais. Revista Brasileira de Climatologia, Edição especial Dossiê
Climatologia de Minas Gerais, p.110-128, 2018.
SANCHES, F. O Geógrafo-Climatologista e as mudanças climáticas: uma proposta metodológica. Revista
Equador (UFPI), v. 4, n. 3, p.101-118, 2015.
SANCHES, F.; FIALHO, E. S.; QUINA, R. R. Evidências de mudanças climáticas em Viçosa-MG, Revista do
Departamento de Geografia- USP, v.34, p. 122-136, 2017.