35
Institut National Agronomique de Paris-Grignon Introduction ` a la g´ eostatistique Gilles Guillot janvier 2004

introduction A La G Eostatistique - Imm.dtu.dkgigu/notes.pdf · Ces notes correspondent a un cours de g eostatistique dispens e en deuxi eme ann ee a L’INA-PG. Il s’agit d’un

  • Upload
    lykien

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

  • Institut National Agronomique de Paris-Grignon

    Introduction a la geostatistique

    Gilles Guillot

    janvier 2004

  • Ces notes correspondent a un cours de geostatistique dispense en deuxiemeannee a LINA-PG. Il sagit dun cours dintroduction, dun volume total dedouze heures, dans le cadre dun module dAgriculture de Precision. Ce coursna pas lambition daborder reellement les problemes de modelisation en sta-tistique spatiale poses par lAgriculture de Precision, qui pour la plupart sontdes problemes ouverts. Toutefois, dans la mesure du possible, les notions in-troduites sont illustrees a laide de donnees agronomiques collectees par luniteEnvironnement et Grandes Cultures sur la parcelle experimentale de Pont-Cailloux a Grignon.

  • TABLE DES MATIERES

    Table des matieres

    1 Introduction 4

    2 Methodes exploratoires 5

    2.1 Quelques points de vocabulaires . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Distribution monovariable . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.3 Repartition spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.4 Nuee variographique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    3 Fonctions aleatoires, stationnarite, covariance 6

    3.1 Fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.2 Fonction de covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.3 Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.4 Variogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.5 Fonctions de structure empiriques . . . . . . . . . . . . . . . . . . . . . . . 10

    4 Lajustement dune fonction de structure theorique 11

    4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114.2 Familles parametriques de covariance . . . . . . . . . . . . . . . . . . . . . 114.3 Methodes dajustement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    5 Interpolation lineaire sans biais de variance minimale : le krigeage 15

    5.1 Objectif du krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155.2 Calcul des poids de krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    5.2.1 Le krigeage simple . . . . . . . . . . . . . . . . . . . . . . . . . . . 165.2.2 Le krigeage ordinaire . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    5.3 Evaluation de lerreur : la variance de krigeage . . . . . . . . . . . . . . . . 175.4 Analogies et differences avec les techniques du modele lineaire . . . . . . . 175.5 Comportement des poids de krigeage . . . . . . . . . . . . . . . . . . . . . 175.6 Comportement de la courbe ZKS(s) et influence de la fonction de covariance

    sur les estimations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215.7 Une propriete probabiliste du krigeage . . . . . . . . . . . . . . . . . . . . 265.8 Quelques applications utiles du krigeage . . . . . . . . . . . . . . . . . . . 265.9 Quelques applications a proscrire . . . . . . . . . . . . . . . . . . . . . . . 26

    6 Les logiciels 26

    7 Code R permettant de fabriquer les exemples 28

    3

  • 1 INTRODUCTION

    1 Introduction

    Dans les annees 50, des ingenieurs des mines sud-africains faisaient des calculs pourevaluer les ressources en minerai dun gisement a partir dun petit nombre de sondagespreleves en des sites irregulierement repartis dans le domaine detude. Dans ce contexte,la quantite dinteret (la reserve totale disponible) etait inconnue et traitee comme unevariable aleatoire. Mais il etait impossible dassimiler les teneurs mesurees aux differentssites sondes a des realisations de variables aleatoires independantes. En effet si on supposeune independance statistique entre les mesures realisees entre differents points de lespace,la meilleur prediction que lon peut faire de la teneur en un site non informe (i.e ou lon napas realise de sondage) est dattribuer la moyenne de lechantillon. On sent bien que cettesolution a quelque chose de sous-optimal, en particulier il semble souhaitable dutiliserune methode qui donne plus de poids aux sites proches quaux autres points de mesure.

    Cette situation : (i) un formalisme probabiliste pour representer des quantites incon-nues (ii) limpossibilite de supposer une independance entre les donnees, (iii) lexistencedune structuration de la variable etudiee par rapport aux coordonnees despace est ca-racteristiques de la statistique spatiale. Quand les mesures sont realisees en des sitesirregulierement espaces choisis par lexperimentateur (on dit alors que la position des sitesest non informative), on se trouve exactement dans la situation du probleme devaluationdun gisement, qui a donne lieu a de nombreux developpements methodologiques : laGeostatistique.

    Il arrive que les sites de mesures soient regulierement espaces sur une grille par exemplelorsque la mesure est realisee par un satellite. Cette regularite geometrique apporte de nom-breuses simplifications mais elle saccompagne dune complication : les donnees regulieressont en general fournies en tres grand nombre (typiquement 128128 pixels) et il fautse limiter a des modeles pour lesquels les calculs sont ne sont pas trop complexes. Cestprecisement lobjet des techniques statistiques dAnalyse dImage.

    Il existe enfin des situations ou la position des sites de mesure est une des variablesdu probleme a modeliser. On peut penser par exemple au probleme de levaluation de laquantite de bois dune parcelle forestiere a partir dun releve de la position et du volumede quelques arbres de la parcelle. Levaluation du volume total passe necessairement parune evaluation de la position (inconnue) des arbres non mesures. Ce type de situation estaborde a laide de modele specifiques : les processus aleatoires ponctuels.

    Chacun des trois domaines de la statistique spatiale est tres vaste et seuls quelquesaspects seront evoques. Tout dabord on exclu tous les aspects lies aux processus ponctuelsainsi que les techniques danalyse dimage.

    On nabordera pas non plus les problemes non lineaires, les methodes associees aux dis-tributions dicretes, et les problemes de classification qui seraient tres interessants dans lecadre dun cours oriente vers lagronomie mais qui sont mathematiqement plus complexeset demanderaient plus de temps.

    Lobjectif de ce cours dintroduction est donc simplement de donner une idee desproblemes qui se posent quand on doit traiter des donnees spatiale, dintroduire les no-tions geostatistiques descriptives de base (stationnarite, variogramme) et de les utiliser

    4

  • 2 METHODES EXPLORATOIRES

    pour calculer des interpolations (krigeage).

    2 Methodes exploratoires

    2.1 Quelques points de vocabulaires

    En general un jeu de donnees spatiales se presente sous la forme dune liste de valeursnumeriques z = (z1, ..., zn)

    t (la variable) et des coordonnees des sites (s1, ..., sn) auxquellesla variable a ete mesuree. Quand on realise une mesure physique, cette mesure est associee aune longueur, une surface ou un volume elementaire. Par exemple on peut mesurer la pluieavec un pluviometre qui donne la hauteur deau tombee sur une surface denviron 400cm2,mesurer une teneur en minerai dans le sol avec une carotte de 500cm3. Ces longueurs,surfaces, volumes, elementaires constituent ce que lon appelle le support de la mesure. Unemesure realisee a support spatial donne peut etre realisee a differents supports temporels. Parexemple, on peut mesurer la pluie avec un pluviographe pendant une journee et en deduirela pluie moyenne sur la journee ou la pluie maximale sur la journee. Il sagit de deuxvariables distinctes qui auront des proprietes geostatistiques tres differentes. Lorsquoncherche a deduire les proprietes statistiques dune variable a un certain support a partir decette meme variable a un autre support, on dit quon realise un changement de support. Ilne faut pas confondre la notion de support avec la notion dechelle qui designe quelquechosede beaucoup plus vague selon le contexte. Il peut sagir de la taille du dommaine etudieou du support temporel de la mesure.

    2.2 Distribution monovariable

    Avant denvisager quoi que se soit il est bon de representer lhistogramme de z, ce quipermet devaluer a quel point la distribution secarte dune loi gaussienne. On verra par lasuite que beaucoup de methodes atteignent une efficiacite maximale lorsque la distributiondes z est celle dun vecteur multi-gaussien, ce qui suppose entre autre que la distributionmarginale soit gaussienne. Lecart au caractere gaussien peut se manifester par- une dissymmetrie- un ensemble de valeurs possible borne- une accumulation de valeurs en un (ou plusieurs) points (distribution atomique)

    2.3 Repartition spatiale

    Cette inspection tres partielle de la distribution de z doit etre completee par une etudede la repartition spatiale des valeurs de z. On peut le faire en tracant un symbol plotdans lequel on represente en chaque site un symbole (croix, etoile, cercle) dont la taille estproportionnele a la valeur observee zi.

    Lexamen de ce symbol plot permet de detecter (de maniere qualitative encore) lapresence de variations systematiques dans les donnees, on parlera de tendance ou dederive.

    5

  • 3 FONCTIONS ALEATOIRES, STATIONNARITE, COVARIANCE

    0 100 200 300 400 500

    010

    020

    030

    0

    Eastings (m)

    Nor

    thin

    gs(m

    )

    0 100 200 300 400 500 600

    020

    0040

    0060

    0080

    00

    Distance

    Squ

    arre

    d di

    ffere

    nce

    of d

    epth

    (cm

    ^2)

    Fig. 1 Droite : Profondeurs de sol en 222 points de la parcelle de Pont-Cailloux. Lerayon du cercle est proportionnel a la profondeur mesuree. Ces profondeurs sont assezheterogenes. Gauche : nuee variographique

    La figure 1 donne les profondeurs de sol en 222 points irregulierement espaces de laparcelle experimentale de Pont-Cailloux a Grignon. Les valeurs sont assez heterogenes maisaucune tendance reguliere ne se manifeste.

    2.4 Nuee variographique

    A ce stade, on ne sest pas encore preoccupe de leventuelle dependance entre lesdonnees. Cest ce que lon fait en construisant ce que lon appelle la nuee variographique.Il sagit du nuage de points formes par les couples (si sj), (zi zj)2.

    Ce nuage presente lallure des figures 1(gauche) et 2 (en bas a droite). La nuee vario-graphique de profondeurs de sol (figure 1) ne fait pas apparaitre de liaison entre lecart(zi zj)2/2 et la distance correspondante. En revanche, la difference quadratique ij =(zi zj)2/2 des resistivites a tendance a croitre en fonction de la distance hij = |si sj|.Autrement dit, les paires de valeurs de z mesurees en des sites geographiquement prochesont tendance a etre plus similaires que celle mesurees en des sites eloignes. Cest ce genrede comportement qui fait quon doit rejeter lhypothese dindependance entre les donnees.En effet, dans le cas dun echantillon i.i.d les ij seraient des variables aleatoires de memeloi et de meme variance.

    3 Fonctions aleatoires, stationnarite, covariance

    3.1 Fonction aleatoire

    La question qui se pose maintenant est de modeliser la distribution statistique delechantillon z1, ..., zn. Dans le cas dun echantillon i.i.d, la caracterisation est facile, ilsuffit de specifier une fonction de repartition (communes a toutes les v.a de lechantillon).

    6

  • 3 FONCTIONS ALEATOIRES, STATIONNARITE, COVARIANCE

    0 100 200 300 400 500

    010

    020

    030

    040

    0

    Measurement sites of resistivity (july 2002)

    Eastings (m)

    Nor

    thin

    gs (

    m)

    Resistivity (.m3)

    Fre

    quen

    cy

    0 50 100 150 200

    020

    4060

    8010

    0

    0 100 200 300 400 500

    010

    020

    030

    040

    0

    Eastings (m)

    Nor

    thin

    gs (

    m)

    0 100 200 300 400 500 600

    010

    000

    2000

    030

    000

    4000

    0

    distances (m)

    Mea

    n sq

    uare

    d di

    ffere

    nces

    (

    2 m6

    )

    Fig. 2 De haut en bas et de gauche a droite : trajectoire du tracteur lors de 8235 mesuresde resitivites (les blancs correspondent a des zones non visitees ou a des dysfonction-nement du GPS au moment du passage ; histogramme des resitivites ; symbol plot (rayon 2) ; nuee variographique.

    7

  • 3 FONCTIONS ALEATOIRES, STATIONNARITE, COVARIANCE

    Ici cest beaucoup plus difficile parcequen toute generalite, il faudrait specifier commentest distribue chaque Zi, chaque couple (Zi, Zj), chaque triplet etc...

    Mais il se trouve que lon peut decrire la distribution spatiale dun echantillon demaniere assez precise dans le cas ou la distribution statistique de la variable presente uneforme dinvariance par translation dans lespace.

    Pour preciser cette notion, il sera commode de pouvoir faire reference a des valeurs dela variable en tout point de lespace. Notons z(s) la valeur de notre variable (mesuree ounon) au point de coordonnees s. Comme z1, ..., zn, cette grandeur est une realisation dunevariable aleatoire. On definit ainsi en tout point s une variable aleatoire Z(s). On dit queZ est une fonction aleatoire.

    Cette notation permet de faire le lien a la fois avec les notations habituelles en statis-tique (la variable nest plus indexee par les entiers 1, 2, ... mais par les points de lespaceou on lobserve), et avec les notations de la physique (on pourra par exemple calculer lesderivees 1Z(s) et 2Z(s) de notre variable par rapport a une coordonnee despace).

    3.2 Fonction de covariance

    On peut decrire partiellement la distribution statistique dune fonction aleatoire via desmoments dordre un et deux tels que lesperance et la covariance (qui sont ici des fonctionsdes coordonnees despace) definis par

    (s) = E[Z(s)] (1)

    C(s, s) = Cov[Z(s), Z(s)] (2)

    La covariance satisfait deux proprietes importantes :

    Symetrie : C(s, s) = C(s, s)

    Defini-positivite : Considerons par exemple la variance dune somme du type V ar[n

    i=1

    iZsi].

    A laide de C elle secrit

    i,j

    ijC(si, sj). (3)

    En tant que variance, cette somme doit etre positive, ceci quels que soient les i, cequi exprime que la fontion C est une fonction de type positif.

    3.3 Stationnarite

    On dit quune fonction aleatoire Z(s) est stationnaire a lordre 1 si son esperance estla meme en tout point de lespace, soit formellement :

    m R / E[Z(s)] = m m (4)

    8

  • 3 FONCTIONS ALEATOIRES, STATIONNARITE, COVARIANCE

    On dit que Z(s) est stationnaire a lordre 2 si lesperance et la covariance sont invariantspar translation :

    C / Cov[Z(s), Z(s)] = C(s s) s, s (5)Lorsque les hypotheses (4) et (5) sont verifiees, la description de la distribution sta-

    tistique de Z sen trouve considerablement simplifiee. Tous les moments dordre deux sededuisent de la fonction de covariance C(h) = C(s s) et de la moyenne m.

    En toute generalite, une fonction de covariance est definie pour tous les couples s, s.Lorsque Z est stationnaire, la fonction de covariance se reduit a une fonction dune seulevariable despace, ce que lon note abusivement C(s, s) = C(s s) = C(h). Il arrive quecette fonction C ne dependent pas non plus de la direction du vecteur h, mais seulementde sa norme : C(h) = C(|h|). Ceci exprime que la variable nest pas structuree selon desdirections preferentielles, on dit que Z et C sont isotropes. Dans le cas contraire, on ditque Z et C sont anisotropes.

    Il se trouve que lhyptohese de stationnarite constitue souvent en premiere approxima-tion un bon compromis entre fidelite aux donnees et simplicite mathematique. Mais biensouvent, cette hypothese est faite demblee sur les donnees car il est difficile de la testerefficacement. On cherche ensuite le moins mauvais modele dans ce cadre simplificateur.

    La notion de stationnarite est illustree par les figures ?? et ?? qui presentent desexemples de processus (simules par ordinateur) stationnaires et non stationnaires. Lim-pression visuelle dinvariance par translation de laspect general de chaque trajectoire esttres dependante de la largeur de la fenetre dobservation.

    La figure ?? montre des realisations de processus stationnaires avec des parametresdechelle variables. La figure ?? presente des realisations de processus non stationnairesayant tous le meme parametre dechelle. On voit quune trajectoire stationnaire peut pa-raitre non stationnaire et vice versa. La notion de stationnarite appliquee a un nombrelimite de realisations na de sens quen reference a un modele particulier. La question ase poser est donc : etant donne un modele de dependance et un modele de tendance (cesmodeles etant en general choisis par des considerations a priori sur le phenomene etudie),lhypothese de stationnarite est-elle raisonnable ?

    3.4 Variogramme

    Dans la continuite dun cours de statistique, il etait naturel de commencer par introduirela fonction de covariance C puisquelle generalise la notion de matrice covariance dunvecteur aleatoire, mais il se trouve que lusage geostatistique a consacre ce que lon appellele variogramme. Celui-ci est defini par :

    (s, s) =1

    2V ar[Z(s) Z(s)] (6)

    Un calcul simple montre quil est relie a la covariance par la relation :

    (s, s) =1

    2[C(s, s) + C(s, s)] C(s, s) (7)

    Ainsi, dun point vue theorique il est equivalent de connaitre la covariance ou le va-riogramme de la variable etudiee. Lusage courant confond souvent ces deux fonctions endesignant lune et lautre par fonction de structure.

    9

  • 3 FONCTIONS ALEATOIRES, STATIONNARITE, COVARIANCE

    20 40 60 80

    010

    020

    030

    0

    Distances (m)

    Mea

    n sq

    uare

    d di

    ffere

    nces

    (cm

    2 )

    Fig. 3 Variogramme empirique des profondeurs de sol. Lecart quadratique moyen nesemble pas dependre de la distance qui separe les points. La variable nest pas structureespatialement

    Dans le cas ou Z est stationnaire dordre deux, cette relation se simplifie en

    (h) = C(0) C(h) (8)

    Dans le cas stationnaire, le variogramme secrit

    (h) =1

    2E

    [

    (z(s) Z(s + h))2]

    + ((s) (s + h))2 (9)

    Le terme (s) (s + h) est appele derive de Z.

    3.5 Fonctions de structure empiriques

    On peut faire le lien entre ces notions theoriques et les nuees variographiques empiriquesobservees (figures 1 et 2).

    Definissons la covariance empirique par

    C?(h) =1

    nh

    si,sjSh

    zizj z2 (10)

    ou z =

    i zi,et (en supposant que la derive est nulle), le variogramme empirique par

    ?(h) =1

    2nh

    si,sjSh

    (zi zj)2 (11)

    ou Sh = {(si, sj) : |si sj| h} et nh = Card Sh.Des exemples de variogrammes empiriques sont presentes aux figures 3 et 6Ces deux quantites permettent destimer respectivement C et lorsque Z est station-

    naire dordre deux.

    10

  • 4 LAJUSTEMENT DUNE FONCTION DE STRUCTURE THEORIQUE

    4 Lajustement dune fonction de structure theorique

    4.1 Introduction

    On a vu que les fonctions C? et ? calculees empiriquement permettaient destimerles fonction theoriques sous-jacentes C et . Mais ces fonctions empiriques ne sont pastotalement satisfaisantes pour plusieurs raisons :

    Ces courbes empirique sont souvent assez erratiques, il est donc difficile de resumeren quelques mots comment elles se comportent

    On a vu quune fonction de covariance theorique satisfaisait la propriete de defini-positivite, condition qui nest pas assuree par la covariance empirique.

    On resoud ces deux problemes en substituant a la fonction de structure empirique unefonction appartenent a une famille parametrique simple de fonctions defini-positives.

    4.2 Familles parametriques de covariance

    Il existe un catalogue de modeles parametriques dont la defini-positivite est etablie etdont chaque famille correspond a un comportement type (Cf figures 4 et 5). En voiciquelques exemples simples (Cf [1, 5] pour une liste plus complete) :

    Le modele pepitique pur (h) = I0(h)Cette structure est en fait une absence de structure et peut sinterpreter commeune erreur de mesure, comme un bruit ou parfois comme une maniere commodede prendre en compte un phenomene strucuture a une echelle non resolue par lesdonnees.

    Le modele exponentiel (h) = exp(h/a)Dans ce modele, la decroissance de la covariance est lineaire a lorigine et decroit tresrapidement aux grandes valaurs de h sans jamais sannuller.

    Le modele gaussien (h) = exp(h/a)2 Ici la decroissance a lorigine est tres lente (lesderivees en 0 sont nulles a tous les ordres) ce qui donne une allure tres lisse auxrealisations correspondantes.

    Les deux derniers modeles dependent dun parametre dechelle a qui gouverne lin-tensite de la dependance spatiale. Plus a est eleve, plus dependance se propage a longuedistance.

    Les trois modeles correspondent a une fonction aleatoire de variance unite ((0) = 1).On obtient un modele de variance quelquonque en multipliant un modele norme par unevariance 2 : C(h) = 2(h). Un calcul simple montre que 2 est la limite du variogrammeen +, cette valeur est appelee palier du variogramme.

    Enfin, si C1 et C2 sont deux fonctions de covariance, alors pour tout reels positifs a1 eta2, a1C1 +a2C2 est aussi une fonction de covariance. Cest la covariance de

    a1Y1 +

    a2Y2

    ou Y1 (resp. Y2) est une fonction aleatoire de cov. C1 (resp. C2).En particulier, on utilise tres souvent le modele suivant : C(h) = 2Ipep(h) + C

    (h) ouC est une covariance continue a lorigine (par exemple exponentielle ou gaussienne). Ceci

    11

  • 4 LAJUSTEMENT DUNE FONCTION DE STRUCTURE THEORIQUE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    distance

    Mea

    n sq

    uare

    d di

    ffere

    nce

    (h) = exp( h 0.1)

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    distance

    Mea

    n sq

    uare

    d di

    ffere

    nce

    (h) = exp( h 0.5)

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    distance

    Mea

    n sq

    uare

    d di

    ffere

    nce

    (h) = exp( (h 0.2)2)

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    distance

    Mea

    n sq

    uare

    d di

    ffere

    nce

    (h) = 0.1Il(h) + 0.9exp( (h 0.2)2)

    Fig. 4 Quatre fonctions de covariance usuelles. De haut en bas et de gauche a droite :exponentielles avec deux portees differentes, gaussienne, gaussienne avec pepite

    12

  • 4LA

    JU

    ST

    EM

    EN

    TD

    UN

    EFO

    NC

    TIO

    ND

    EST

    RU

    CT

    UR

    ET

    HE

    OR

    IQU

    E

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0 0.2 0.4 0.6 0.8 1.0

    Fig

    .5

    R

    ealisationdes

    fonction

    aleatoiresasso

    cieesau

    xcovarian

    cesde

    lafigu

    re4.

    13

  • 4 LAJUSTEMENT DUNE FONCTION DE STRUCTURE THEORIQUE

    revient a decomposer la variable etudiee en un terme spatialement structure et un termespatialement non structure (Cf figure 6)

    4.3 Methodes dajustement

    Pour estimer les parametres de la covariance theorique on commence par choisir unefamille parametrique simple, (en general des combinaisons lineaires a coefficients positifsdu type C(h) = 2Ipep(h) + C

    (h)), puis on estime les deux ou trois parametres reels misen jeu par lune des trois manieres suivantes :

    Ajustement a la main Cest la methode la plus simple, on choisit les parametres dumodele de maniere a obtenir le meilleur ajustement visuel, en portant une attentionparticuliere (par ordre decroissant dimportance) au comportement a lorigine au comportement aux petites distance (lineaire, parabolique) a la distance a laquelle le comportement se stabilise (Cf figure 6)

    Moindes carres On minimise par rapport au parametre inconnu la somme des erreursquadratiques

    h

    ((h) (h))2

    Comme cette methode donne un poids egal a toutes les classes de distances, elledonne de mauvais resultats. On lui prefere la minimisation du critere suivant :

    h

    ((h) (h))2w(h)

    ou w(h) est une fonction plus ou moins arbitraire qui donne beaucoup de poids alorigine et peu aux grandes distances.

    Vraisemblance Si on se donne une loi de probabilite parametrique pour le vecteur aleatoire(Z1, ...Zn)

    t, on peut ecrire la vraisemblance de lechantillon L(z1, ..., zn|) et la maxi-miser par rapport a .

    Conceptuellement cest la methode al plus satisfaisante, neanmoins elle a trois in-convenients : La methode repose fortement sur lhypotese distributionnelle (en general la multi-

    normalite), elle produit parfois des solutions bizarres, de plus on na pas de solution explicite, il faut maximiser numeriquement, enfin la

    solution est parfois biaisee.

    On est parfois surpris du manque de formalisation qui prevaut dans les methodes des-timations de parametres Il y a deux raisons a cela :

    tout dabord les methodes habituelles (moindres carres, maximum de vraisemblance)ne marchent pas toujours tres bien

    ensuite les developpement des methodes geostatistiques ont ete fortement guideespar des problemes concrets au cours desquels les geostatisticiens disposaient dinfor-mation exterieure (ou a priori) sur le phenomene quils etudiaient, dou la necessite

    14

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0 5 10 15 20

    05

    01

    00

    15

    0

    0 100 200 300 400 500

    050

    100

    150

    200

    250

    300

    Distances (m)

    Mea

    n sq

    uare

    d di

    ffere

    nces

    (

    2 m6

    )

    Fig. 6 Variogramme experimental de la resistivite et variogramme theorique exponentiel-pepitique de la forme (h) = I0(h)+ (1)(1 e|h|/a) avec = 0, 1 et a = 30m. Leffetde pepite prend en charge 10% dela variance et les correlations sont tres faibles au-delade h=100m. Le zoom a gauche met en evidence la discontinuite a lorigine quon peutimputer a une erreur de mesure non auto-correlee ou a une structure a tres petite echellenon observable a partir du semis de point disponible.

    de conserver une certaine flexibilite aux techniques dinference pour pouvoir inclurecette information a priori plus ou moins subjective.

    5 Interpolation lineaire sans biais de variance mini-

    male : le krigeage

    5.1 Objectif du krigeage

    Un probleme qui se pose tres souvent dans les questions environnementales et celuide lestimation dune valeur non mesuree : a partir dun lechantillon z1, ..., zn, commentevaluer la valeur quon aurait trouve au site s0 si on lavait mesuree. Pour resoudre ceprobleme on va supposer que les zi sont les valeurs aux points si de la realisation dunfonction aleatoire de fonction de covariance C connue.

    5.2 Calcul des poids de krigeage

    Il peut sembler naturel de chercher un estimateur de Z(s0) de la forme

    Z(s0) =

    n

    i=1

    iZ(si) (12)

    Un tel estimateur est statistiquement satisfaisant sil est sans biais et si la variance delerreur commise est faible.

    15

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    On va donc chercher des poids i qui assurent un biais nul et qui minimisent la variance.Ceci secrit :

    E[Zs0 Zs0 ] = 0 (13)

    V ar[Zs0 Zs0] = min{

    V ar

    [

    i

    iZ(si) Zs0

    ]

    , Rn}

    (14)

    5.2.1 Le krigeage simple

    Si on suppose que Z est desperance nulle, le biais secrit :

    E[Zkss0 ] = E[

    i

    iZsi] =

    i

    iE[Zsi] = 0 (15)

    La condition (13) est donc automatiquement verifiee.La deuxieme impose que les poids i soient solution du systeme matriciel

    C = C0 (16)

    ou par abus de notation, C designe la matrice des covariances entre les points variablesaux points de mesure. Cest a dire C = (C(si sj))i,j.

    En notant ks = C1C0, la solution de notre probleme secrit :

    ZKS(s0) = (Z1, ..., Zn).ks (17)

    Cette expression est assez commode a manipuler et met en evidence le fait quon ne doitinverser la matrice C quune seule fois lorsque quon veut kriger Z en differents points. Enrevanche elle nexplicite pas du tout les proprietes statistiques et geometriques du krigeage.Celles-ci seront evoquees aux section 5.5 et 5.7.

    Si E[Z(s)] = m ou m est non nul mais connu, il suffit dappliquer la techniqueprecedente a Y (s) = Z(s) m

    5.2.2 Le krigeage ordinaire

    Si on suppose maintenant que Z est desperance m inconnue la condition de non biaissecrit

    m

    i

    i = 0 (18)

    Cest donc un probleme de minimisation sous contrainte. Un calcul simple montre queles poids de krigeage doivent etre solution du systeme

    (

    C 11t 0

    )

    =

    (

    )

    (19)

    ou est un multiplicateur de Lagrange du probleme de minimisation sous contrainte.

    16

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    5.3 Evaluation de lerreur : la variance de krigeage

    Le krigeage fournit une valeur estimee en nimporte quel point de lespace s0. Lerreurcommise Z(s) Z(s0) est evidemment inconnue mais on peut evaluer la variance de cetteerreur appelee variance de krigeage. Dans le cas du krigegae simple elle secrit :

    2KS = C(0)

    i

    iC(si s0) (20)

    Pour le krigeage ordinaire, on obtient :

    2KO = C(0)

    i

    iC(si s0) KO (21)

    ou KO est la valeur du multiplicateur de Lagrange dans la solution du systeme (19).

    5.4 Analogies et differences avec les techniques du modele lineaire

    Il est clair que les expressions mathematiques employees dans les problemes dinter-polation sont assez similaires a celles utilisees dans le cadre du modele lineaire. Cetteimpression nest pas fortuite : il sagit de modeles a lordre deux pour lesquels on utilisedes combinaisons lineaires des donnees, et on minimise des formes quadratiques associeesa des variances. Par exemple, le krigeage simple peut sembler equivalent a une regressionmultiple de la v.a Z(s0) sur les v.a Z(s1), ..., Z(sn) (cf equation 16).

    Certains statisticiens ont meme recemment pousse le soucis de coherence jusqua re-formule certaines methodes geostatistiques avec le vocabulaire de la theorie du modelelineaire (generalise)[3].

    En fait cette parente est surtout formelle et il y a des differences notables, en particulier,ne retenir du krigeage que lequation C = C0 occulte tous laspect spatial du probleme.

    5.5 Comportement des poids de krigeage

    Il est difficile de decrire de maniere generale comment se comportent les poids dekrigeage. On peut observer parfois des phenomenes complexes : effet decran, effet derelais, effet de trou. Mais de maniere generale, on observe que les poids

    ont tendance a etre faibles dans les regions ou il y a beaucoup de donnees (chaquesite prend en charge une fraction de linformation apportee par cette les points decette region.

    ont tendance a decroitre lorsque les points informes seloignent du point non informe(a linfini, plus aucun point napporte dinformation).

    Ces deux proprietes sont illustrees par les figures 7, 8, 9 en dimension 1. On sest donnedix points alignes sur le segment [0, 1] . La fonction de covariance est connue. On calculele poids de krigeage 6 associe a la sixieme observation z6 dans une estimation de Z(s) dela forme ZKS(s) =

    i iZ(si).Ce poids 6 depend de la position du point s. pour lequel on veut obtenir une estimation.

    On peut le noter 6(s) et tracer la courbe s, 6(s) pour s variant entre 0 et 1. On observe unphenomene de decroissance de 6(s) lorsque s seloigne de s6. La decroissance est dautantplus rapide que le parametre dechelle de la fonction de covariance est petit.

    17

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    Fig. 7 Comportement des poids de krigeage avec modele de covariance exponentiel sanspepite

    18

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    s

    lam

    bda

    Fig. 8 Comportement des poids de krigeage avec modele de covariance exponentielpepitique

    19

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.

    20.

    20.

    61.

    0

    s

    lam

    bda

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    0.

    40.

    00.

    40.

    8

    s

    lam

    bda

    Fig. 9 Comportement des poids de krigeage avec modele de covariance gaussien sanspepite.

    20

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    5.6 Comportement de la courbe ZKS(s) et influence de la fonction

    de covariance sur les estimations

    Une fois encore, il est tres difficile de dire comment se comporte la courbe ZKS(s)de maniere generale puisque cela depend des donnees, de la covariance choisie et de lageometrie du semis de points informes. Toutefois quelques proprietes ont un caractereassez general :

    Lorsque la fonction de covariance est continue a lorigine, le krigeage interpole exacte-ment la fonction aleatoire aux points informes : Z(si) = Z(si). On dit que le krigeagerealise une interpolation exacte.

    Le krigeage se rapproche de la moyenne (m dans le cas connu, son estimation quandelle est inconnue) dans les regions ou il ny a pas donnees

    La fonction de covariance utilisee dans le krigeage a une influence sur le comportementde la courbe obtenue. Quelques exemples sont donnes en dimension 1 aux figures 10 ,11,12 et 13.

    21

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    Fig. 10 Comportement de la fonction ZK(s) avec une fonction de covariance exponentielleet differents parametres dechelle. C est continue, la courbe krigee passe par les points dedonnes.

    22

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    Fig. 11 Idem fig 10 avec representation de la vraie trajectoire.

    23

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    Fig. 12 Comportement de la fonction ZK(s) avec une fonction de covariance gaussienneet differents parametres dechelle.

    24

  • 5 INTERPOLATION LINEAIRE SANS BIAIS DE VARIANCE MINIMALE : LE

    KRIGEAGE

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    h

    C(h

    )

    0.0 0.2 0.4 0.6 0.8 1.0

    1.

    5

    0.5

    0.5

    1.5

    s

    Z

    Fig. 13 Consequence de lintroduction dun effet de pepite sur la courbe krigee. C estdiscontinue, lampleur de lecart a la donnee depend de la variance de leffet de pepite.

    25

  • 6 LES LOGICIELS

    5.7 Une propriete probabiliste du krigeage

    Lerreur de krigeage est non correlee avec les donnees :

    Cov[Z(s) ZK(s), Z(si)] = 0 (22)

    Par consequent, le krigeage et lerreur de krigeage sont non correles :

    Cov[Z(s) ZK(s), ZK(s)] = 0 (23)

    On peut donc ecrire tout champ aleatoire comme la somme de son krigeage et duneerreur non correlee : Z(s) = ZK(s) + KU ou U est une variable centree reduite noncorrelee a Z(s). Cette propriete ouvre la voie a une technique de simulation appelee krigeageconditionnant.

    5.8 Quelques applications utiles du krigeage

    Si lon souhaite evaluer une moyenne spatiale sur un domaine du type

    DZ(s)ds, il y

    a deux strategies possibles. La premiere consiste a chercher un estimateur de

    DZ(s)ds

    sous la forme dune combinaison lineaire des donnees et a minimiser la variance derreur.La deuxieme consiste a kriger les donnees et calculer (par somme de Riemann) lintegraledes valeurs krigees

    DZ(s)K(s)ds. Il se trouve que ces deux strategies sont equivalentes.

    De maniere genrale, si (Z) est une fonction lineaire de Z il est equivalent de kriger lesdonnees et dappliquer la transformation au krigeage ou transformer dabord les donneeset de kriger les donnees transformees.

    5.9 Quelques applications a proscrire

    Lemploi de la terminologie estimateur optimal pourrait laisser croire que le krigeageapporte une solution definitive a toutes les questions. Il nen est rien.

    Par exemple si lon souhaite evaluer laire du domaine {s, Z(s) > c}, lestimationbasee sur {s, ZK(s) > c} est une estimation biaisee qui sous-estime tres fortement lairerecherchee pour les valeurs de c elevees.

    6 Les logiciels

    Il existe de tres nombreux logiciels qui proposent du krigeage et dautres techniquesgeostatistiques. Pour une liste assez detaillee, voir http ://www.ai-geostats.org/.

    A lINA-PG on peut travailler avec :

    Isatis qui a deux avantages : le logiciel est structure comme la theorie geostatistique, les menus deroulants

    proposent des fonctionnalites dans lordre naturel dans lequel on doit les fairedans une etude reelle ; ainsi en apprenant a se servir dIsatis, on apprend aussi laGeostatistique.

    26

  • 6 LES LOGICIELS

    comme tout est pre-programme, on ne peut quasiment pas se tromper.Son gros defaut est quon est prisonnier des menus deroulants qui revelent assez viteleurs limites...

    SAS possede quelques fonctions pour faire de la geostatistique lineaire

    Matlab necessite linstallation de packages (a faire soi-meme)

    R offre a la fois la puissance dun interpreteur oriente vers la manipulation de donnees etle traitement statistique et plusieurs packages tres bien faits :

    RandomFields http ://btgyxd.geo.uni-bayreuth.de/ martin

    field http ://www.cgd.ucar.edu/ nychka

    geoR http ://www.est.ufpr.br/geoR

    geoRglm http ://www.maths.lancs.ac.uk/ christen/geoRglm

    que lon chargent avec la commande library(nom.du.package)

    27

  • 7 CODE R PERMETTANT DE FABRIQUER LES EXEMPLES

    7 Code R permettant de fabriquer les exemples

    ####

    # Donnees pedologiques

    pedo

  • 7 CODE R PERMETTANT DE FABRIQUER LES EXEMPLES

    plot(dist(rho.raw0702[sub,1:2]),

    dist(rho.raw0702[sub,3])^2,

    xlab="distances (m)",

    ylab="squared difference of resistivities (Ohm.m)^2",

    pch=16,cex=0.2,cex.lab=1.5)

    dev.off()

    # Histogramme

    ps(where="/home/guillot/cours/spatial/poly/histo_resist.ps",h=T)

    hist(rho.raw0702[sub,3],main="",col=3,nclass=70,xlab="Resistivity (Ohm.m)")

    dev.off()

    # Symbol plot

    ps(where="/home/guillot/cours/spatial/poly/symbol_resist.ps",h=T)

    setplot(rho.raw0303[,1]-min(rho.raw0303[,1]),

    rho.raw0303[,2]-min(rho.raw0303[,2]))

    plot(rho.raw0702[sub,1]-min(rho.raw0702[sub,1]),

    rho.raw0702[sub,2]-min(rho.raw0702[sub,2]),

    pch=16,xlab="Eastings (m)",

    ylab="Northings (m)",cex.lab=1.5,type="n")

    symbols(rho.raw0702[sub,1]-min(rho.raw0702[sub,1]),

    rho.raw0702[sub,2]-min(rho.raw0702[sub,2]),

    circles= (rho.raw0702[sub,3])^10,

    inches=.3,

    lwd=1.5,add=T,col=2)

    dev.off()

    #################################################

    #

    # Trois fonctions pour realiser les simulations

    #

    #################################################

    # Une fonction pour fabriquer une matrice de covariance

    # entre deux echantillons de points

    mat.cov

  • 7 CODE R PERMETTANT DE FABRIQUER LES EXEMPLES

    # Une fonction pour simuler un vecteur aleatoire

    # desperance et de variance donnes

    rmultnorm

  • 7 CODE R PERMETTANT DE FABRIQUER LES EXEMPLES

    perm

  • 7 CODE R PERMETTANT DE FABRIQUER LES EXEMPLES

    {

    plot(s.grid[,1],(1-pep)*exp(-(s.grid[,1]/range)^model),

    "l",xlab="h",ylab="C(h)",ylim=c(0,1))

    abline(0,0);abline(0,9999);abline(1,0,col=2,lty=2)

    plot(s.grid[,1],Z.grid,"n",

    xlab="s",ylab="Z")

    lines(s.grid[,1],krige(s.data,Z.data,model,range,pep,s.grid),

    col=3,lwd=2)

    points(s.data[,1],Z.data,col=2,lwd=3)

    #lines(s.grid[,1],Z.grid)

    }

    dev.off()

    #####

    ps(h=F,where="~/cours/spatial/3.ps")

    par(mfrow=c(4,2))

    model=2

    pep = 0.

    for(range in c(0.01,0.05,0.1,0.15))

    {

    plot(s.grid[,1],(1-pep)*exp(-(s.grid[,1]/range)^model),

    "l",xlab="h",ylab="C(h)")

    abline(0,0);abline(0,9999);abline(1,0,col=2,lty=2)

    plot(s.grid[,1],Z.grid,"n",

    xlab="s",ylab="Z")

    lines(s.grid[,1],krige(s.data,Z.data,model,range,pep,s.grid),

    col=3,lwd=2)

    points(s.data[,1],Z.data,col=2,lwd=3)

    #lines(s.grid[,1],Z.grid)

    }

    dev.off()

    ######

    ###

    # Poids de krigeage

    ps(h=F,where="~/cours/spatial/4.ps")

    par(mfrow=c(4,2))

    model=1

    pep = 0.

    for(range in c(0.01,0.05,0.1,0.2))

    {

    C

  • 7 CODE R PERMETTANT DE FABRIQUER LES EXEMPLES

    }

    dev.off()

    ###

    ps(h=F,where="~/cours/spatial/4bis.ps")

    par(mfrow=c(4,2))

    model=1

    range=0.2

    for(pep in c(0.01,0.1,0.3,0.7))

    {

    C

  • Index

    echelle, 5

    anisotrope, 9

    changement de support, 5

    derive, 10

    effet de pepite, 11

    fonction de covariance, 8

    fonction de structure, 9

    fonction de type positif, 8

    interpolateur exact, 21

    isotrope, 9

    moyenne, 8

    nuee variographique, 6

    palier, 11

    parametre dechelle, 11

    stationnaire dordre 1, 8

    support, 5

    systeme de krigeage, 16

    variogramme, 9

    34

  • REFERENCES

    References

    [1] J.P. Chiles and P. Delfiner. Geostatistics. Wiley, 1999.

    [2] N.A.C Cressie. Statistics for spatial data. Series in Probability and Mathematicalstatistics. Wiley, 1994.

    [3] P.J. Diggle, R.A. Moyeed, and J.A. Tawn. Model based geostatistics. Journal of theRoyal Statistical Society, serie A, Applied Statistics, 1998.

    [4] C. Lantuejoul. Geostatistical simulation. Springer, 2002.

    [5] M. Schlather. Introduction to positive definite functions and to unconditional simula-tions of random fileds. Technical Report ST-99-10, Department of Mathematics andStatistics, Faculty of Applied Sciences, Lancaster, UK, 1999.

    [6] H. Wackernagel. Multivariate geostatistics : an introduction with applications. SpringerVerlag, Berlin, 2003.

    [7] R. Webster and M. Oliver. Geostatistics for environmental scientists. Statistics inPractice. John Wiley and Sons, 2001.

    35