ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
ECO-STATISTICA: OBIECTIVE: A. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE
In zona investigata cu o probabilitate de 90% (riscul asumat alfa =10%)
presiunea este cuprinsa in intervalul:
771,444-0.011 mmHg 771,444+0.011 mmHg
B. EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI
Presiunea = -6.467* Temperatura + 890.9 Coeficient de corelatie: -0.89028
C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE
Titlu diagram
y = -6.467x + 890.9
700.00
720.00
740.00
760.00
780.00
800.00
820.00
840.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00temperatura
pres
iun
e
presiunea-temperaturaLiniar (presiunea-temperatura)
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
1. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE care depinde de
a. Densitatea punctelor de observatie b. Variabilitatea caracteristicii studiate c. Riscul asumat
Ex.: CONTINUTUL DE HUMUS DIN SOL IN PADUREA BANEASA este de 250ppm PLUS /MINUS 15ppm cu un RISC DE 10%.
V+/-EROARE T=10GRADE Celsius+/-2 grade Celsius
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
DATELE UTILIZATE PENTRU PRELUCRARI STATISTICE
Variabile/caracteristici ALFANUMERICE Ex.: LITOLOGIA: GRANIT, BAZALT,.... Pentru valorile alfanumerice operatiile posibile in cadrul prelucrarilor statistice sunt:
COMPARAREA (identice sau diferite) CONCATENAREA (alaturarea celor doua valori)
Pentru prelucrari suplimentare, valorile alfanumerice se codifica BINAR utilizand doua cifre:
0 (zero) care semnifica absenta valorii alfanumerice
1 (unu) care semnifica prezenta valorii alfanumerice
Variabile/caracteristici NUMERICE Ex.: TEMPERATURA: 100C, 150C, ... PRESIUNEA: 760 mm colHg
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
ETAPELE PRELUCRARILOR STATISTICE
1. ANALIZA VARIABILITATII GLOBALE (A.V.G)
DATELE UTILIZATE: VALORILE variabilelor/caracteristicilor mediului: v(i); i=1,2,...n OBIECTIVUL: cea mai probabila valoare a caracteristicii studiate si eroarea de estimare a acestei valori
( )v
( )%10210 00 CC
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PRELUCRAREA DATELOR ALFANUMERICE
Cea mai simpla varianta de evaluare a celei mai probabile valori alfanumerice se bazeaza pe HISTOGRAMA NOMINALA.
Frecventa absoluta a valorilor
alfanumerice
Valorile alfanumerice intr-o succesiune arbitrara
arin salcie ?
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PRELUCRAREA DATELOR NUMERICE a) Analiza valorilor extreme conduce la doua variante
decizionale: a. Eliminarea: daca numarul valorilor extreme este
redus b. Prelucrarea separata a grupului de valori
extreme: daca grupul este numeros.
Eliminarea valorilor extreme conduce la reducerea marimii erorii de estimare pentru cea mai probabila valoare a
caracteristicii studiate in zona investigata.
Aplicatie temperatura Tema T7:
Nr.valorii
Valoarea variabilei
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Din diagrama de variabilitate a temperaturii rezulta ca nu sunt valori extreme care sa fie eliminate din setul de date original. In continuare se vor prelucra toate cele 40 de valori disponibile.
b) Analiza distributiei valorilor de temperatura utilizand HISTOGRAMA VALORILOR TEMPERATURII
Normalitatea unei distributii (simetria histogramei) se cuantifica prin COEFICENTUL DE ASIMETRIE:
ZERO cand histigrama este SIMETRICA NEGATIV daca asimetria este de STANGA POZITIV daca asimetria este de DREAPTA
Dupa aplicarea transformarilor radical (valmax+1-v) si 1/v s-a decis sa se calculeze valoarea cea mai probabila cu valorile netrensformate ale temperaturii deoarece coeficientul de asimetrie corespunzator valorilor originale este cel mai mic: -0,27.
c) calculul valorii celei mai probabile si a erorii de estimare a acesteia pentru un risc asumat de 10%.
F.abs.T
T
Vmin VMAX
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
LABORATOR 1. 1.Crearea fisierului cu date:
Date numerice: o Coordonatele punctelor de masura (x,y) [m] o Presiunea aerului [mmHg] o Temperatura aerului [oC]
Date alfanumerice: o Litologia: granit, diorit
2. Construirea diagramei de variabilitate pentru identificarea valorilor EXTREME
c) Evaluarea distributiei valorilor caracteristicilor numerice
Instrumentul utilizat: HISTOGRAMA
V Vmin Vmax
Frecventa absoluta
D n1=2 n2=4
n3=3 n4=1 0
1
2
3
4
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Frecventa absoluta: numarul de aparitii al unei valori
in
Amplitudinea selectiei de valori:
minmax VVA =
Interval de grupare (STURGESS):
)ln(33,21 nAD
+=
Utilizarea HISTOGRAMEI pentru studiul distributiei valorilor
In functie de tipul HISTOGRAMEI se stabileste modul de calcul al celei mai probabile valori din zona investigata:
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Tipuri de HISTOGRAME: si modul de prelucrare specific
HISTOGRAMA UNIMODALA SI SIMETRICA
DISTRIBUTIA VALORILOR ESTE NORMALA
Valoarea cea mai probabila se calculeaza cu toate valorile utilizate pentru constructia histogramei
HISTOGRAMA ESTE UNIMODALA SI ASIMETRICA
Valoarea cea mai probabila se calculeaza cu toate valorile utilizate pentru constructia histogramei DAR
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
NORMALIZATE CU AJUTORUL UNOR FUNCTII ANALITICE ELEMENTARE (ex.: log(v)=t)
DACA NU SE NOMRALIZEAZA DISTRIBUTIA VALORILOR , VALOAREA CEA MAI PROBABILA
VA FI SUPRAESTIMATA/SUBESTIMATA IN FUNCTIE DE TIPUL DE ASIMETRIE (DE DREAPTA
respectiv de STANGA)
HISTOGRAMA BIMODALA SIMETRICA `
Selectia de valori este NEOMOGENA si pentru prelucrare valori sunt separate in doua grupuri OMOGENE pentru care se calculeaza valori diferite ale celei mai probabile valori CU VALORILE ORIGINALE
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
HISTOGRAMA BIMODALA ASIMETRICA
Selectia de valori este NEOMOGENA si pentru prelucrare valori sunt separate in doua grupuri OMOGENE pentru care se calculeaza valori diferite ale celei mai probabile valori CU VALORILE ORIGINALE NORMALIZATE.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
CALCULUL CELEI MAI PROBABILE VALORI DIN ZONA INVESTIGATA
Cea mai PROBABILA valoarea a unui set de valori cu distributie NORMALA (HISTOGRAMA UNIMODALA-SIMETRICA) este MEDIA ARITMETICA A VALORILOR.
n
v
v
ni
ii
=
=
=1
Daca distributia valorilor este NON-NORMALA (HISTOGRAMA este ASIMETRICA) valoarea cea mai probabaila calculata cu formula MEDIEI ARITMETICE va fi SUBESTIMATA/SUPRAESTIMATA in functie de tipul de asimetrie. Pentru eliminaea SUPRAESTIMARII/SUBESTIMARII celei mai probabile valori se NORMALIZEAZA distributia valorilor.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
APLICATIE Calculul celei mai probabile valori a PRESIUNII in zona investigata. Etapele de prelucrare (dupa construirea histogramei):
1) Evaluarea tipului de histograma: a. Unimodala b. Asimetrica
i. de stanga ii. moderata
2) Calculul mediei aritmetice a valorilor presiunii (nenormalizate), media care va subestima cea mai probabila valoare a presiunii.
3) Normalizarea distributiei valorilor a. Transformarea valorilor folosind functia
RADICAL de ordinul 2
nivt ii ,...,2,1;2 ==
b. Construirea histogramei cu valorile transformate c. Compararea histogramelor construite cu valorile
originale si cu valorile transformate: i. Calitativ/vizual (aproximativ)
ii. Cantitativ pe baza coeficientului de asimetrie (SKEWNESS) care este:
1. ZERO pentru histograma SIMETRICA 2. NEGATIV pt.hist. asim. STANGA 3. POZITIV pt.hist.asim. DREAPTA
4) Calculul mediei cu valorile transformate, daca distributia acestora are un coeficient de asimetrie mai mic decat al valorilor originale.
mmHgv 444,771=
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
2. Calculul erorii de estimate a mediei cu formula:
( ) Hg0.011443mm),2
1( == tn
s
( )Hg0.164949mm
11
2
=
=
=
=
n
vv
s
ni
ii
CONCLUZIA analizei variabilitatii globale
In zona investigata valoarea cea mai probabila a presiunii este 771,444 mmHg cu o eroare de estimare de 0,011443 mmHg in conditiile unui risc asumat de 10%.
presiunea
Probabilitatea de aparitie
a valorii
771,44mmHg
0,014 0,014
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI
Metodologia de evaluare a corelatiilor dintre caracteristicile mediului (numerice/alfanumerice) este constituita din urmatoarea succesiune de prelucrari:
Identificarea corelatiei dintre variabilele selectate (exista corelatie in C1 si C2) prin metode grafice.
Evaluarea intensitatii corelatiei dintre cele doua variabile selectate: o Standardizarea variabilitatii celor doua variabile
selectate pe domeniul valoric [0,1] o Calculul coeficientilor de corelatie dintre cele
doua variabile selectate; Coeficientul de corelatie lineara PEARSON
C1
C2
C1
C2
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Val minima: -1: indica o corelatie lineara perfecta de tip INVERS PROPORTIONAL.
Val medie: 0: indica lipsa corelatiei lineare dintre cele doua variabile selectate
Valoarea MAXIMA: +1 indica o corelatie lineara perfecta de tip DIRECT PROPORTIONAL
Modelarea matematica a corelatiei dintre cele doua variabile selectate
21 CbaC +=
r = -1 r = 0 r = +1 C1 C1 C1
C2 C2 C2
a
C1
C2
1C
2C
21
CCb
=
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
LABORATOR Se evalueaza/analizeaza corelatia dintre:
PRESIUNE si TEMPERATURA
1. Identificarea corlatiei: a. Realizarea diagramei de corelatie:
EXISTA CORELATIE 2. Evaluarea intensitatii
STANDARDIZAREA DIAGRAMA DE CORELATIE CU VALORILE STANDARDIZATE
CALCULUL COEFICIENTULUI PEARSON: -0,89
INTENSITATEA CORELATIEI INVERSE DINTRE PRESIUNE SI TEMPERATURA ESTE F.BUNA!
3. Modelarea MATEMATICA a corelatiei dintre PRESIUNE si TEMPERATURA:
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE
DATELE NECESARE Coordonatele punctelor de observatie: Xi,Yi ;
i=1,2,...,n Valorile variabilei cercetate in toate punctele de
observatie disponibile: Vi; i=1,2,...,n
APLICATIA: DATELE utilizate sunt:
n =40 puncte de observatie Variabilele investigate:
o Alfanumerica: LITOLOGIA cu 2 valori distincte: Calcar Argila
o Numerica: Presiunea [mmHg] Temperatura [oC]
METODOLOGIA DE EVALUARE 1. ANALIZA VARIABILITATII GLOBALE are ca obiectiv evaluarea celei mai probabile valori a variabilei in zona investigata. APLICATIA:
Evaluarea celei mai probabile valori a LITOLOGIEI in zona investigata.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
2. ANALIZA VARIABILITATII SPATIALE a variabilelor investigate
OBIECTIV: identificare LEGII DE VARIATIE SPATIALA variabilelor investigate ( )yxfV ,=
?????
APLICATIA: Lege de variatie spatiala pentru
Variabila alfanumerica (LITOLOGIA) Variabile numerica (presiunea/temperatura)
3. EVALUAREA VALORII VARIABILEI IN ORICE PUNCT DIN DOMENIUL INVESTIGAT
APLICATIA: Evaluarea:
Pentru LITOLOGIE Pentru presiune/temperatura
4. EVALUAREA ERORII DE ESTIMARE A VARIABILEI IN ORICE PUNCT DIN DOMENIUL INVESTIGAT.
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PROGRAMUL SURFER: Realizeaza doua tipuri de fisiere:
i. Worksheet (similare cu fisierele de tip excel) ii. Plot-pentru reprezentari grafice si aplicarea
metodologiei de evalure a distributiei spatiale.
APLICATIA: Evaluarea celei mai probabile valori a
LITOLOGIEI in zona investigata.
INSTRUMENTUL UTILIZAT: HISTOGRAMA NOMINALA REZULTAT:
PROBABILITATE DE APARITIE CALCAR: 20/40*100=50%
PROBABILITATE DE APARITIE ARGILA: 20/40*100=50%
VALORILE ALFANUMERICE
FRECVENTA ABSOLUTA
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
APLICATIA: Lege de variatie spatiala pentru
Variabila alfanumerica (LITOLOGIA) Variabile numerica (presiunea/temperatura)
Metodologia de lucru Reprezentarea distributiei spatiale a punctelor de
observatie (SURFER< datele din fisierul excel: sheet: datasurfer (x,y pentru cele 40 de puncte de observatie)
File+new Plot+Map+New+Post Map+ Evaluarea legii de variatie spatiala a variabilei
alfanumerice:LITOLOGIE cu doua valori distincte: 1. argila
codificarea binara a valorii argilei calculul variogramei experimentale
omnidirectionale
NOTA_CURS
VARIOGRAMA EXPERIMENTALA (V.E.)-forma de exprimare sintetica a legii de variatie spatiala pentru caracteristicile alfanumerice si numerice. DATELE NECESARE pentru calculul V.E. sunt:
coordonatele punctelor de observatie (x,y)
valorile caracteristicii: o 0/1 pentru cele alfanumerice o Valorile pentru cele numerice
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
FORMULA DE CALCUL pentru V.E.
( ) ( ) ( )( )
=
dN
ji vvdNd
r
rr
1
2
21
Calculul variogramei experimentale cu prg.SURFER 1. CREAREA UNUI FISIER DE TIP: PLOT File+New+Plot 2. LANSAREA PROGRAMULUI DE CALCUL
AL VARIOGRAMEI Grid+Variogram+New Variogram 3. Selectarea fisierului cu date 4. Selectarea datelor: x, y, Cod_argila 5. Calculul si salvarea variogramei pentru
argila:Variograma_ARGILA. 6. Calculul variogramei pentru calcar:
Variograma_CALCAR OBSERVATIE:
dr
( )dr
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Daca sunt doar DOUA valori alfanumerice DISTINCTE variogramele sunt identice pentru aceste valori. Variogramele pentru variabile/caracteristici ALFANUMERICE se numesc VARIOGRAME INDICATOARE
7. Calculul variogramei experimentale pentru variabilele numerice:
Presiune: Variograma_PRESIUNE
MODELAREA MATEMATICA A VARIOGRAMEI EXPERIMENTALE consta in identificarea unei functii continui care interpoleaza cu abateri minime valorile variogramei experimentale
1. modelarea matematica a Variogramei ARGILEI 2. etc.
EVALUAREA DISTRIBUTIEI SPATIALE PENTRU VARIABILELE ALFANUMERICE
NOTA CURS: Harta distributiei spatiale a variabilelor ALFANUMERICE este o harta cu distributia PROBABILITATII DE APARIATIE a valorii afanumerice studiate (ARGILA). De regula pe aceste harti se reprezinta numai zonele cu probabilitati mai mari de 50%.
o Aplicatia: Reteaua de interpolare pentru probabilitatea
de aparitie a argilei (GRID_ARGILA)
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Reprezentarea grafica a distributiei spatiale a probabilitatilor de aparitie pentru ARGILA
Definitivarea reprezentarii grafice