20
Journal of Hydrology, 44 (1979) 17--36 17 © Elsevier Scientific Publishing Company, Amsterdam -- Printed in The Netherlands [3] ETUDE DE LA PERSISTANCE DE QUELQUES PARAMi~TRES DE QUALITE DE L'EAU B. BOBI~E et D. CLUIS INRS--Eau, Universit$ de Quebec, Sainte-Foy, Qua. G I V 4C7 (Canada) (Re~u le 28 aofit, 1978; accept~ pour publication le 23 avril, 1979) ABSTRACT l~b~e, B. et Cluis, D., 1979. Etude de la persistance de quelques param~tres de qualit~ de l'eau. (A study of the persistence of some water-quality parameters.) J. Hydrol., 44: 17--36. From 1967 to 1975 the water-quality service of the Quebec Department of Natural Resources collected some 16,000 water samples at 250 stations: in 1975 the number of stations in operation had been reduced to 66 and a weekly sampling schedule had been adopted. Despite of these improvements, the data obtained cannot be analysed by such classical and sophisticated methods as spectral analysis. In order to make use of these data some less sophisticated, although adequate methods, have been considered in this study, in this way the persistence of several parameters (major ions, silica, nitrate, phosphate) has been studied by analysing the autocorrelation of weekly and monthly series of data and by considering their information content. This technique, based on the analysis of historical data will indicate the optimal sampling frequencies rela- tive to the types of parameters as well as the hydrographical regions under investigation. R]~SUMI~ De 1967 ~ 1975, le Service de la Qualit~ des Eaux du Minist~re des Richesses Naturelles du Quebec a effectu~ quelques 16,000 pr~l~vements d'~chantillons d'eau 250 stations; en 1975, le nombre de stations en operation ~tait r~duit ~ 66 et une fr~quence de pr~l~vements hebdomadaire avait ~t~ adopt~e. Malgr~ ces ameliorations, les donn~es ainsi acquises se pr~tent real aux m~thodes raf- rinses et classiques telles que l'analyse spectrale. Pour tirer le meilleur patti de la masse de donn~es acquises, on a dfl utiliser, pour cette ~tude des donn~es de qualit~ de l'eau, des m~thodes plus primitives mais adapt~es ~ ce type de donn~es: ainsi, une ~tude de la per- sistance des ions majeurs, de la silica, des nitrates, des phosphates et de la conductivit~ a ~t~ effectu~e en analysant les coefficients d'auto-corr~lation des s~ries hebdomadaires et men- snelles et le contenu en information moyen des donn~es; cette technique, ~ partir de l'ana- lyse des donn~es historiques donne une indication des fr~quences optimales d'~chantillon- nage selon les param~tres et les r~gions.

Étude de la persistance de quelques paramètres de qualité de l'eau

Embed Size (px)

Citation preview

Journal of Hydrology, 44 (1979) 17--36 17 © Elsevier Scientific Publishing Company, Amsterdam -- Printed in The Netherlands

[3]

ETUDE DE LA PERSISTANCE DE QUELQUES PARAMi~TRES DE QUALITE DE L'EAU

B. BOBI~E et D. CLUIS

INRS--Eau, Universit$ de Quebec, Sainte-Foy, Qua. G I V 4C7 (Canada)

(Re~u le 28 aofit, 1978; accept~ pour publication le 23 avril, 1979)

ABSTRACT

l~b~e, B. et Cluis, D., 1979. Etude de la persistance de quelques param~tres de qualit~ de l'eau. (A study of the persistence of some water-quality parameters.) J. Hydrol., 44: 17--36.

From 1967 to 1975 the water-quality service of the Quebec Department of Natural Resources collected some 16,000 water samples at 250 stations: in 1975 the number of stations in operation had been reduced to 66 and a weekly sampling schedule had been adopted.

Despite of these improvements, the data obtained cannot be analysed by such classical and sophisticated methods as spectral analysis.

In order to make use of these data some less sophisticated, although adequate methods, have been considered in this study, in this way the persistence of several parameters (major ions, silica, nitrate, phosphate) has been studied by analysing the autocorrelation of weekly and monthly series of data and by considering their information content. This technique, based on the analysis of historical data will indicate the optimal sampling frequencies rela- tive to the types of parameters as well as the hydrographical regions under investigation.

R]~SUMI~

De 1967 ~ 1975, le Service de la Qualit~ des Eaux du Minist~re des Richesses Naturelles du Quebec a effectu~ quelques 16,000 pr~l~vements d'~chantillons d'eau 250 stations; en 1975, le nombre de stations en operation ~tait r~duit ~ 66 et une fr~quence de pr~l~vements hebdomadaire avait ~t~ adopt~e.

Malgr~ ces ameliorations, les donn~es ainsi acquises se pr~tent real aux m~thodes raf- rinses et classiques telles que l'analyse spectrale. Pour tirer le meilleur patti de la masse de donn~es acquises, on a dfl utiliser, pour cette ~tude des donn~es de qualit~ de l'eau, des m~thodes plus primitives mais adapt~es ~ ce type de donn~es: ainsi, une ~tude de la per- sistance des ions majeurs, de la silica, des nitrates, des phosphates et de la conductivit~ a ~t~ effectu~e en analysant les coefficients d'auto-corr~lation des s~ries hebdomadaires et men- snelles et le contenu en information moyen des donn~es; cette technique, ~ partir de l'ana- lyse des donn~es historiques donne une indication des fr~quences optimales d'~chantillon- nage selon les param~tres et les r~gions.

18

INTRODUCTION

De mani~re g~n~rale, la variabilit~ temporelle des param~tres de qualit~ de l'eau est analys6e de mani~re descriptive et limit~e aux ~tudes de cyclicitds et

la mise en ~vidence de tendances. Les m~thodes avanc~es permettant une analyse temporelle des donn~es de qualit6 (analyse spectrale, analyse en s~rie de temps) sont connues mais imposent des contraintes que les donn~es re- cueillies ne respectent pas en g~n~ral. Ceci est d~ au fait que les plans d'~chan- tillonnage ne sont g~n~ralement pas ~tablis en fonction d'une analyse tempo- relle des donn6es obtenues, mais plutSt en fonction d'une ~valuation spatiale de la qualit~ de l'eau. L'~tude des tendances darts le temps, par exemple, n6ces- site des s~ries longues et homog~nes, c'est ~ dire en particulier sans modifica- tion majeure des techniques analytiques; or, durant les dix derni~re~ ann~es, on a assist~ ~ une ~volution des techniques analytiques.

La mise en ~vidence des cycles de p6riode T exige des mesures effectu~es des dates ~quidistantes s~par~es par une dur~e T/3. Ceci explique que pour la plupart des param~tres, seuls les cycles saisonniers peuvent ~tre ~tudi~s. Dans le cas de cycles de fr~quence plus ~lev~e, leur ~tude a ~t~ limit~e ~ des para- m~tres comme l'oxyg~ne dissous, la temperature pour lesquels on dispose de donn~es fr~quentes et souvent en continu.

De plus, l'emploi de m~thodes avanc~es d'analyse de la variabilit~ temporelle telles que l'analyse en s~rie de temps ne peuvent s'appliquer qu'~ des s~ries suf- fisamment longues comportant peu de valeurs absentes, ce qui a jusqu'~ present limit~ leur application aux donn~es de qualit~ de l'eau.

1] est donc important pour analyser la variabilit~ temporelle des donn~es existantes de qualit~ de l'eau, de disposer de techniques moins ~labor~es mais permettant de d~gager les principales caract~ristiques des donn6es mesur6es. Cette ~tude vise ~ d~velopper une technique simple permettant de mettre en 4vidence la persistance des ph6nom~nes et la redondance des observations suc- cessives; la connaissance de ces aspects est en effet importante pour l'~tablisse- ment d'un r~seau d'acquisition de donn~es rationnel, en particulier en ce qui a trait ~ la d~termination des fr6quences de mesures des divers param~tres.

ORIOINE DU RESEAU D'ACQUISITION DE DONNEES DE QUALITE DE L'EAU

Les activit~s du Minist~re des Richesses Naturelles du Quebec concernant la qualit~ de l'eau ont d~but~ en 1967. Durant la p~riode 1967--1975, plus de 16.000 pr~l~vements d'eau ont 4t~ effectu~s repr~sentant environ 300.000 in- formations concernant 257 stations de sept r~gions hydrographiques du Quebec m~ridional (Fig. 1).

De1968 ~ 1972, l'acquisition des donn6es s'est progressivement am~lior6e rant par la diminution des d~lais entre pr~l~vement et analyse, que par l'im- plantation de nouvelles techniques analytiques. Par ailleurs, apr~s quelques variations concernant les fr~quences d'~chantillonnage, une fr~quence hebdo- madaire a ~t~ adopt~e de mani~re syst6matique d~s 1973 (Fig. 2).

19

Fig. 1. R~gions hydrographiques du Quebec (r~gions 01---07: Quebec m~ridional; et r~gions 08--10 : Nouveau Quebec).

Fig. 1. Hydrographical regions of Quebec (regions 01-07; southern Quebec; and regions 08--10: New Quebec).

20

,ool 9oJ ~,

0 ANNEE 1967

l 5o L

F - DONN~'S UTILISL~'ES~,~ DANS ['I~TUDE /

I I I • : JOURNALIER ( J ) ~

- [] =HEBDOMADAIRE ( H ) O : MENSUEL (M) f • : AUTRES ( A ) - - % - - .

\

\ I - I

• I

~ ' ~ "~ I ~ ~ ~.....~. ,I.,. .. I

~ ~ , t b""~"'l'~"~ 1968 1969 1970 L971 1972 1973 1974 1975

,0~ t s, I ,26 I ,24 I 9s ] 76 I 66 I NOMBRE DE STATIONS EN SERVICE

Fig. 2. R~partition du nombre de stations du r~seau 6chantillonn~es en fonction du type de fr~quence de pr61~vement.

Fig. 2. Distribution of the number of water-sampling stations in the area studied as func- tion of the type of sampling frequency.

L'ensemble des donn~es fournies par le r6seau a fait l 'objet d 'une analyse g6n~rale et d 'une interpretation globale (Bob~e et al., 1977). Ici, nous pr~- sentons des r~sultats concernant plus sp~cifiquement un aspect de la variabilit~ temporelle mis en ~vidence sur les donn6es recueillies ~ partir de l'ann6e 1973. Ces donn~es qui pr~sentent l 'avantage d'etre homog~nes, quant ~ leur mode d'acquisition, ont ~t~ regroup~e dans une banque aprSs avoir ~t~ filtr~es de deux fa~ons (Bob6e et al., 1977).

Fil trage statistique

Pour chaque param~tre mesur~ h chaque station, on a ~tabli des s~ries saison- niSres au sens hydrologique, c'est ~ dire correspondant aux p6riodes de hautes-

21

eaux et de basses-eaux. Pour chacune des valeurs de ces s~ries, on peut associer une valeur centr6e r6duite (obtenue par soustraction de la moyenne de la s6rie et division du r6sultat par l '6cart-type de la s6rie). Les valeurs centr6es r6duites sup6rieures ~ 3 en valeur absolue ont 6t6 consid6r6es comme douteuses ou aberrantes et 61imin6es. Ce filtrage statistique effectu6 sur une base saisonni6re est plus efficace dans la recherche des valeurs douteuses qu 'un filtrage global.

Filtrage physico-chimique

Les ions majeurs, Na +, Ca 2+, Mg 2+, K + , HCO~, SO~- et Cl-, repr6sentent l'essentiel de la charge ionique des eaux; on peut effectuer, pour chaque 6chan- tillon, deux bilans susceptibles de mettre en ~vidence des erreurs d'~chantillon- nage ou d'analyse pour les sept ions majeurs mesur6s: (1) le calcul du bilan ionique; et (2) le calcul des conductivit6s ioniques 6quivalentes.

Le Tableau I, tir6 de Harned et Owen (1958), donne les facteurs de convex- sion pour le calcul du bilan ionique et des conductivit6s ioniques 6quivalentes

dilution infinie. Pour chaque 6chantillon, on a calcul6 le d6s6quilibre ionique (DI) en pour-

centage, donn6 par:

DI = (~[Ci] - Z[Aj])/1/~(Z[Ci] + Y~ [A/]) × 100

o~ [Ci] et [Aj] sont respectivement, les concentrations du cation i et de l 'anion j exprim~es en milli6quivalents.

Le calcul de la conductivit6 th6orique 7th a 6t6 effectu6 en utilisant la relation:

7th = Y~ ~iCi

o~ hi est la conductance limite ionique de chaque ion. On a aussi calculi, dans tousles cas possibles, l'6cart, en pourcentage (EC),

TABLEAU I

Facteurs de conversion utilisds pour le calcul du bilan ionique et de la conductivit~

Facteur de conversion (mequiv./1 par mg/1)

Conductivit~ ionique ~quivalente fi dilution infinie et fi 25°C (~S/cm par mg/1)

C a 2+

Mg 2+ Na + K + HCO~- SO~- CI-

0,04990 0 ,08226 0 ,04350 0,02557

- 0 , 0 1 6 3 9 - 0 , 0 2 0 8 2 - 0 , 0 2 8 2 1

2,98 4,35 2,21 1,88 0,73 1,67 2,15

22

entre la conductivit~ mesur6e et la conductivit~ calcul6e ~ partir des concentra- tions des ions majeurs et des conductivit~s ioniques ~quivalentes:

EC -- [(conductivit~ calcul6e) - (conductivit6 mesur~e)]/(conductivit~ mesur~e) X I00

Dans ces calculs, l'influence de l'ion hydrog~ne, qui est n~gligeable dans la gamme de pH rencontr6s, n'a pas ~t~ prise en compte.

L'6tude simultan~e des r~sultats permet de d~tecter et de corriger 6ventuel- lement, certaines erreurs d'analyse particuli~rement flagrantes. Tousles 6chan- tillons pour lesquels le d~s~quilibre ionique et l'6cart de conductivit~ 6taient tous deux inf~rieurs ou ~gaux ~ 25% ont ~t~ retenus.

DONNEES UTIUSkES

Les param~tres de qualit~ utilis~s dans cette ~tude incluent les ions majeurs (Na + , K +, Ca 2+, Mg 2+, C1- et SO~-), la silice, la conductivit~ ainsi que les teneurs en nitrates et phosphates; ils repr6sentent des caract~ristiques tr~s g6n6- rales de qualit~ de l'eau.

En ce qui concerne le choix des stations, il a ~t~ d~cid~ de retenir, dans cha- cune des sept r~gions hydrographiques du Qu6bec m6ridional, trois stations contrSlant des bassins versants de superficies diff~rentes, pour mettre en ~vi- dence une 6ventuelle influence du temps de s6jour des eaux dans le bassin.

On consid~re des donn~es pour la p~riode 1973--1975 qui correspond dans le meilleur des cas ~ un ~chantillonnage hebdomadaire. Les stations retenues sont dans une r~gion donn~e, celles pour lesquelles le plus grand nombre de donn~es est disponible durant la p~riode 1973--1975. Le Tableau II indique les caract~ristiques des 21 stations retenues.

Analyse de l ' indtpendance des observations

D'un point de vue pratique, la d~pendance des observations successives d'une s6rie traduit un ph~nom~ne persistant au niveau de fr~quence consid~r6e et est significative d'une redondance d'information. EUe est peut-~tre une des cons6quences de l'effet tampon des eaux ~ temps de s~jour long dans la com- position de l 'hydrogramme des ~pisodes hydrologiques. I1 est donc souhaitable de d~terminer la fr~quence pour laqueUe les observations cessent d'etre d~pen- dantes, car on optimise alors l'acquisition de l'information. De mani~re g6n~- rale, lorsque la fr6quence augmente, la d6pendance entre les observations croit. Ainsi pour un param~tre donn~, on peut avoir une forte d6pendance au niveau journalier, une faible d~pendance au niveau hebdomadaire et une ind6pen- dance au niveau mensuel; on peut d~duire que la fr~quence hebdomadaire est trop ~lev~e et la fr~quence mensuelle insuffisante ou acceptable. La d~termina- tion de la fr~quence optimale n6cessite donc de disposer d'observations effec- tu~es ~ une fr~quence trop ~lev6e; l'~tude de la s~rie obtenue permet alors d'in- diquer ~ quel niveau la fr~quence peut ~tre r~duite. La representation de s~ries d~pendantes peut ~tre effectu~e ~ l'aide de modules markoviens alors que celle de s~ries ind~pendantes peut l'~tre au moyen de lois statistiques.

TABLEAU II

Caract~ristiques des stations retenues

23

R~gion Code Rivi~re Superficie Nombre d'~chantillons hydrographique MRN drain~e

(kin 2 ) 1973 1974 1975

01 01080A Bonaventure 2.170 52 52 43 01100B Cascap~dia 3.134 52 52 44 01120A Nouvelle 1.140 52 52 47

02 02140B Sainte-Anne 787 52 52 46 02200A Rimouski 1.585 31 29 41 02340A Chaudi~re 5.825 45 32 24

03 03020A Saint-Franqois 10.180 46 38 35 03030D Yamaska 3.367 49 0 0 ~'3090A Chfiteauguay 2.346 52 48 40

04 04020A Rouge 5.545 5 48 50 04080C Gatineau 23.650 49 49 43 04310A Des Outaouais 143.000 53 49 44

05 05030A Batiscan 4.610 50 53 46 05070A Portneuf 357 52 52 46 05280C Du Loup 1.427 50 41 34

06 06100A Chicoutimi 3.393 52 51 43 06190A Chamouchouane 15.330 52 39 46 06290B Saguenay 79.800 48 53 41

07 07020B Des Escoumains 798 1 19 38 07190A Aux Roches 4.145 0 19 31 07230C Moisie 19.160 0 19 42

La d @ e n d a n c e des observat ions successives d ' u n e s~rie peu t ~tre ~tudi~e en consid~rant le coef f ic ien t d ' au to-cor r~ la t ion d ' o rd re 1.

E t u d e du c o e f f i c i e n t d ' a u t o c o r r e l a t i o n

Le coef f ic ien t d ' au tocor r~ la t ion d ' o rd re 1 d ' une s~rie de taille N, (x~ . . . . . x i , . . . , X N ) p e u t ~tre calcul~ en supposan t la s~rie circulaire (c'est-~-dire en supposan t que l ' observa t ion suivant XN est x~ ). I1 est donn~ par:

(XlX2 + . . . +XiXi+l + . . . + X N X l ) - X N

r 1 =

X~ - X i i=1 i=1

Pour des ~chanti l lons de taiUe N p rovenan t de popu la t ions normales, il est possible de m o n t r e r (Anderson , 1941), que rl est distribu~ p r a t i quemen t nor- ma lemen t avec:

24

une m o y e n n e : ~'1 = - 1 / ( N - 1)

une var iance: vat ( r , ) = (N - 2 ) / ( N - 1) 2

La var iable u = (rl - ~ , ) / [var (r l)] _1~ sui t donc une loi n o r m a l e centr~e r6dui te e t il est poss ib le de t e s t e r l ' i nd6pendance des 61~ments de l '6chant i l lon .

So ien t u, = 1.96, u2 = 2 .57 les var iables n o rma le s d o n t la p robab i l i t6 au d~- p a s s e m e n t est r e s p e c t i v e m e n t 2.5% et 0.5%.

Si I u I < ul : on accep te l ' h y p o t h ~ s e d ' i n d ~ p e n d a n c e au n iveau de significa- t ion 5%.

Si u l < I u I < u2 : on re je t te l ' h y p o t h ~ s e d ' i n d ~ p e n d a n c e au niveau de signi- f i ca t ion 5%, on l ' a c c e p t e au n iveau 1%.

Si u2 < I u I: on re je t te l ' h y p o t h ~ s e d ' i n d 6 p e n d a n c e au n iveau de significa- t ion de 1%.

9t .8

.7

C:L_" 6 ~

.5 ̧

.4

~3

.2

]%%%

Jl 12 15 m 21 24 21' 30 60 90 t~O 180 IlK) 210 240 aO0

N

Fig. 3. Niveaux de signification ~ 5% et 1% de coef f ic ien t d 'auto-corr6la t ion d 'ordre 1 en fonc t ion de la taille de l '~chant i l lon (test d 'Anderson, 1941).

Fig. 3. The au tocor re la t ion coeff ic ient of order 1 at the 5% and 1% significance levels as func t ion of the sample series magni tude.

25

En pratique, ce test est utilis~ selon la procedure d~crite, quelle que soit la distribution don t provient l'~chantillon, bien que th6oriquement, l 'hypoth~se de normalit~ soit souhaitable.

La Fig. 3 montre les limites des zones d 'acceptat ion au niveau de significa- tion de 5% et de 1% de l 'hypoth~se d'ind~pendance (p = 0) selon la longueur N de la s~rie consid~r~e.

Contenu d' information d'une s~rie

Si l 'on consid6re une s6rie d'observations ind6pendantes dont la moyenne est K et la variance 02 , la variance de la moyenne de cette s6rie est donn6e par:

var(~), = o 2/N

Lorsque l 'on consid6re une s6rie dont les valeurs successives sont d6pen- dantes et pour laquelle le coefficient d'autocorr~lation d 'ordre 1 est r , , on peut montrer (Matalas, 1966) que l 'on a:

0 2 [1 +r, 2 r:(_X--rln)l (varK)2 : ~ l---r-~ - N ( l - r , ) 2 J

On peut d6finir le contenu d ' information de la s6rie autocorrel6e par:

I = (vat x ) l / (va t x)2

Le contenu d ' information atteint une valeur maximale de 1, lorsque la s~rie est const i tu te d 'observations ind@endantes et d~croit lorsque l'autocorr~la- tion augmente. Ce coefficient permet done de quantifier la redondance des ob- servations; on peut en partieulier d~finir le nombre effectif N ' d 'observations ind~pendantes d 'une s~rie de taille N par:

N ' = N I

Analyse de tableaux de contingence

On consid~re N observations class~es selon deux caract~res A et B. Soit Nii le nombre d'observations correspondant ~ la modalit~ Ai du caract~re A et la modalit~ Bj du caract~re B. Soient N/. la somme des observations corre- spondant ~ la modal i t~Ai de A e t N.. la somme des observations correspondant

la modalit~ Bj de A. Le " "~ caractere A comprend k modalit~s (A, . . . . . Ai . . . . . Ak ) et le caract~re B comprend l modalit~s (B, . . . . . B i . . . . . Bl).

On peut montrer que lorsque les caract~res A et B sont ind@endants, le nombre th~orique d'observations auquel on peut s 'attendre pour les moda- lit6s At et B i e s t vii tel que:

vii = ( N i . N 4 ) / N

26

De plus, la quantit6:

k l (Nij _ Vii)2 z = E E

i=1 j= l vii

suit une loi du chi-carr6 fi v = (h - 1)(l - 1) degr6s de libert6. I1 est donc possible de tester, au niveau de signification a, l 'hypoth~se d'in-

d6pendance des caract~res A et B e n comparant la valeur calcul6e Z avec la valeur X~ (a) correspondant fi une probabilit6 au d6passement ~.

Lorsque Z < X~ (a), les 6carts entre les observations Niy et les valeurs th6o- riques viy ne sont pas suffisants pour rejeter l 'hypoth~se d' ind6pendance au niveau a.

RESULTATS

Etude des auto-correlations: s$ries hebdomadaire et mensuelles

Pour chacune des 21 stations et pour les param6tres retenus, on consid6re: (1) La s6rie hebdomadaire la plus longue dans la p6riode 1973--1975 qui a

un minimum de valeurs absentes. Cette s6rie ne contient jamais plus de deux valeurs cons6cutives absentes; en effet, il est possible de montrer la grande sen- sibilit6 -- dans le sens d 'une augmentation -- du coefficient de corr61ation, lorsque l 'on remplace des valeurs absentes, par une interpolation lin6aire entre les valeurs observ6es adjacentes.

(2) Les quatre s6ries mensueUes d6duites de la s6rie hebdomadaire, en con- sid6rant une valeur toutes les quatre semaines.

Pour chacune de ces s6ries, il est possible de calculer le coefficient d'auto- correlation d 'ordre 1. Le coefficient d'auto-corr61ation d 'ordre 1 de chacune des s6ries mensuelles correspond, en r6alit6, ~ un coefficient d'auto- corr61ation d 'ordre 4 de la s6rie hebdomadaire, en prenant comme valeur de d6part, la premi6re, deuxi~me, troisi6me ou quatri6me valeur. La taille de chaque s6rie hebdomadaire est variable suivant la station et le param6tre consi- d6r6s; c 'est pourquoi il est pr6f6rable d 'effectuer l 'analyse des r6sultats en con- siddrant la signification statistique du coefficient d'auto-corr61ation plutSt que sa valeur calcul6e. En effet, une m~me valeur du coefficient d'auto-corr61ation peut ~tre significativement diff6rente de zdro, pour une s6rie de grande taille, et non significativement diff6rente de z6ro, pour une autre s6rie de taille plus petite. Le contenu en information de chaque s6rie est 6galement une caract6- ristique qui est analysde, car elle int6gre ~ la fois la valeur du coefficient d'auto- corr61ation et la taille de la s6rie.

(a) Test de signification du coefficient d'auto-corr$lation Pour chacune des 210 s6ries hebdomadaires consid6r6es (dix param6tres

21 stations), on examine si le coefficient d'auto-corr61ation calcul6 est signifi-

27

cativement different de zdro aux niveaux de signification de 5% et de 1%, l'aide du test d 'Anderson (1941) d~crit prdc~demment.

Si le coefficient d'auto-corrdlation est: -- Non significativement different de Z~ro au niveau de 5%, le code " 0 " est

utilis~. - - Significativement different de z~ro au niveau de 5% et non significative-

ment different de z~ro au niveau de 1%, on utilise le code "1" . -- Significativement different de z~ro au niveau de 1%, on utilise le code "2" . Pour chacune des quatre s~ries mensuelles, la codification pr~c~dente est

~galement utilis~e. Pour un param~tre et une station donn~s, chaque s~rie men- suelle est ~galement probable et l 'on obtient quatre estimations d 'un mSme co- efficient d'auto-corr~lation th~orique. La synth~se des r~sultats des quatre sdries est effectu~e en considdrant la some des codes des quatre s~ries. Si cette somme, qui peut varier de 0 ~ 8, vaut:

0, I ou 2: le code mensuel moyen utilis~ est "0" ; il correspond ~ un coeffi- cient d'auto-corrdlation mensuel non significativement different de z~ro au niveau de 5%.

3, 4 ou 5: le code mensuel moyen utilis~ est "1" ; il correspond ~ un coeffi- cient d'auto-corr~lation mensuel significativement different de z~ro au niveau de 5%, et non significativement different de z~ro ~ 1%.

6, 7 ou 8: le code mensuel moyen utilis~ est "2" ; il correspond ~ un coeffi- cient d'auto-corr~lation mensuel significativement different de 0 au niveau de 1%.

O n obtient, pour chacun des 210 cas dtudi~s, un code hebdomadaire et un code mensuel; le Tableau III indique la r~partition des stations en fonction des codes hebdomadaire et mensuel.

Ces r~sultats sont indicatifs de trois classes de comportement:

T A B L E A U I I I

R~partition des stations en fonction des codes hebdomadaire et mensuel

Code

daire Q Q (p : O) (p ~ O;

niveau 5%)

(p : o) Q

(P ~ o;niveau 5%) Q

(P ~ O;niveau l%) Q

-...43

2 ~

-.. 17

© (p ~ o ;

niveau I%)

71

32

39 " -

28

Classe 1. Cette classe regroupe les cas des cellules situ~es audessus de la dia: gonale pour lesquels, soit le coefficient hebdomadaire (code 1 et 2) est signifi- catif ~ 5% ou ~ 1% alors que le coefficient mensuel (code 0) est non significati- vement different de 0, soit le coefficient hebdomadaire est significatif au ni- veau de 5%, alors que le coefficient mensuel (code 1) est seulement significatif

5%. Le degr~ de signification du coefficient d'auto-corr~lation (donc le coef- ficient d 'autocorr~lation pour une taille donn~e) augmente lorsque la fr~,, I quence de pr~l~vement croit (donc lorsque le pas de temps entre deux pr~l~ve- ments successifs diminue). Pour les 120 (17 + 71 + 32) cas de cette classe (soit 57% du total), la d~pendance entre les observations mensuelles est inexistante ou moins ~lev~e que la d~pendance entre les observations hebdomadaires.

Classe 2. Cette classe comprend les 87 (43 + 5 + 39) cas des cellules diagonales qui correspondent ~ un code hebdomadaire et ~ un code mensuel identiques. Le degr~ de signification est identique pour les s~ries hebdomadaires et les s~ries mensuelles. L'augmentation de la fr~quence de pr~l~vements ne se tra- duit pas en une plus grande d~pendance des observations.

Classe 3. Cette classe comprend les trois cas (moins de 2% de l 'effectif) des cel- lules situ~es sous la diagonale pour lesquels la d~pendance entre les valeurs mensuelles est plus ~lev~e que celle qui existe entre les valeurs hebdomadaires. Le degr~ de signification du coefficient d'autocorr~lation diminue lorsque la fr~quence de pr~l~vement croit. Ces cas, qui n 'ont aucune r~alit~ physique, moins d'envisager une p~riodicit~ de quatre semaines, ce qui n'a pas de sens, peuvent ~tre expliqu~s par la not ion m~me de test de signification; en effet, lorsque l 'on ~tudie l 'hypoth~se que le coefficient d'auto-corr~lation n'est pas significativement different de z~ro ~ un niveau de signification a, il y a une probabilit~ a de rejeter cette hypoth~se, alors qu'elle est vraie (erreur de type 1). I1 n'est donc pas anormal, d 'un point de vue statistique, de trouver un nombre limit~ de cas physiquement aberrants.

(b ) D~pendance des codes hebdomadaire et mensuel Le Tableau III est en fait un tableau de contingence et l 'on peut examiner si

il y a ind~pendance entre le caract~re "code hebdomadaire" et le caract~re "code mensuel" pour lesquels on dispose de trois modalit~s.

Le Tableau IV donne le tableau de contingence contenant les valeurs obser- v~es Nij, les valeurs th~oriques vii et les fr~quences marginales Ni. et N.j.

La valeur calcul~e Z vaut 34,5 et est sup~rieure ~ la valeur critique de chi- carr~ ~ quatre degr~s de libert~ pour un niveau de 1%, [×24 (1%) = 13,28]. I1 y a donc une tr~s forte d~pendance entre le code hebdomadaire et le code mensuel.

Cette d~pendance traduit que le code hebdomadaire est toujours sup~rieur (classe 1 ) ou ~gal (classe 2) au code mensuel; ceci signifie que l'auto-corr~la- tion est plus ~lev~e ou aussi ~lev~ au niveau hebdomadaire qu'elle l'est au ni- veau mensuel; on retrouve 1~ un r~sultat classique qui indique que l'augmenta-

TABLEAU IV

Tableau de contingence en fonction des codes hebdomadaire et mensuel

CODE HEBDOMADAIRE

z

O

0

0 i

TOTAL 45

I 2 TOTAL

t I~14" 4 778~8"6 131

5 32 39

i

4.3

23 142 210

valeur observ~e~valeu r th~orique

29

tion de la fr~quence de pr~l~vement accroit l 'auto-corr~lation, donc la d~pen- dance entre observations successives et peut conduire ~ une redondance d ' information.

(c ) Analyse des r~sultats d'auto.corr$lation par r~gion et par param~tre Pr~c~demment, on a consid~r~ de mani~re globale, l 'association des codes

hebdomadaires et mensuels. 1] est int~ressant, pour chacune des neuf paires de codes possibles (x,y) oh x est le code hebdomadaire et y le code mensuel, de consid~rer la distribution: (1) par r~gion hydrographique pour l 'ensemble des param~tres (Tableau V; et (2) par param~tre pour l 'ensemble des r4gions hydrographiques (Tableau VI).

Dans ces tableaux, on a regroup~ les trois classes mises en ~vidence ci-dessus. L 'examen du Tableau V (d~composition par r~gion) montre que: (1) Pour l 'ensemble des r~gions ~ l 'exception des r~gions 06 et 07, le code

(2,0) est dominant , ce qui indique une forte d~pendance entre les valeurs hebdomadaires, alors que les valeurs mensuelles peuvent ~tre consid4r~es comme ind~pendantes.

(2) Darts le cas des r~gions 03 et 06, les codes (2,0), (0,0) et (2,2) sont les plus frequents, ce qui traduit une assez grande h~t~rog~n~it~ des r~sultats.

(3) Dans le cas de la r~gion 07, le code (0,0) est tr~s ne t tement dominant, ce qui est significatif d 'une ind~pendance des valeurs tant hebdomadaires que

30

:>

0

0

0

.~

0 °~

9 o

"0

.o

b~

0

I

I c 0 Z

E

I

'4-

Z

+

,¢)

°~'~1~

~ 1 ~

CO

" - . . 0 0 0 . 1 1 0 0

¢q 0 ~-I

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 1 0

c q o c , I 0,1

0 0 0 I 0

~ - ~ 1 ~ ~ ° ~ 1 ~ ° ° ° l °

° ~ 1 ~ ~°~-I~ ° ° °1 °

°°

"0 0

II

"~t

0

0

II

"cI

8 4("

31

T A B L E A U VI

Signi f ica t ion des au to -co r re l a t ions : d i s t r i bu t ion des codes selon les rSgions h y d r o g r a p h i q u e s

R~gion 01 02 03 04 05 06 0 7 Tota l

Code*

Classe 1 : 1, 0* 6 0 2 1 4 1 3 17 2, 0 8 18 9 12 14 8 2 71 2, 1 7 3 6 7 6 3 0 32

Tota l 21 21 17 20 24 12 5 120

Classe 2 : 0, 0 3 3 7 1 0 7 22 43 1, 1 2 0 0 1 0 1 1 5 2, 2 4 6 6 7 6 9 1 39

Tota l 9 9 13 9 6 17 24 87

Classe 3 : O, 1 0 0 0 0 0 1 1 2 0, 2 0 0 0 0 0 0 0 0 1, 2 0 0 0 1 0 0 0 1

Tota l 0 0 0 1 0 1 1 3

*Code (x ,y): x = code h e b d o m a d a i r e ; e t y = code mensuel

mensuelles, ce qui peut traduire l'~chantillonnage d 'un bruit de fond, dans cette r~gion ~loign~e et peu habitue.

I1 ressort du Tableau VI (d~composition par param&re) que: (1) Pour tous l e s param&res, sauf la silice, les sulfates et les nitrates, le code

(2,0) est le plus frequent. (2) Dans le cas de la silice, les codes (2,0), (2,1) et (2,2), se produisent de

mani~re sensiblement identique; il y a donc dans tous les cas, une d~pendance tr~s significative des valeurs hebdomadaires alors que les valeurs ont tendance

&re d~pendantes au niveau mensuel. (3) Le cas des sulfates est voisin de celui de la silice, on peut cependant

noter une certaine importance du code (0,0) qui traduit une ind~pendance, rant des valeurs hebdomadaires que mensueUes.

(4) Les nitrates sont caract~ris~s par le code (2,2) qui indique une ddpen- dance tr~s significative des valeurs mensuelles et hebdomadaires. Ce code est ~galement dominant mais de mani~re moins nette, pour la silice et les sulfates.

L 'examen des paires de codes (x,y) associ~es aux valeurs des coefficients d'auto-corr~lation calculus sur une base hebdomadaire et mensuelle, a des im- plications relativement fi l 'op~ration du r~seau, en termes de fr4quence de pr~l~vements:

(1) Les codes (0,1), (0,2) et (1,2), qui se produisent tr~s rarement, corre-

32

spondent ~ la classe 3, d6finie pr~c6demment, n'ont aucune signification phy- sique et ne sont pas consid6r~s.

(2) Le code (0,0) signifie que les s6ries hebdomadaires et mensuelles sont constitu6es de valeurs ind6pendantes. I1 est donc probable qu'une augmenta- tion de la fr6quence de pr~l~vement conduise ~ l'obtention d'une information plus complete et non redondante. Ce code est essentiellement obtenu dans la r~gion 07, pour la plupart des param~tres (Tableaux V et VI).

(3) Les codes (1,0) et (2,0) indiquent que l'information obtenue au niveau hebdomadaire est redondante, alors que les valeurs des s~ries mensuelles sont ind6pendantes donc conduisent ~ une information plus ad6quate. La fr~- quence hebdomadaire est donc trop 61ev6e et peut ~tre r6duite sans perte d'in- formation. Ces codes sont fr6quemment obtenus dans les r~gions 01 ~ 05, pour l'ensemble des param~tres, ~ l'exception de la silice, des nitrates et des phosphates (Tableaux V e t VI).

(4) Les codes (1,1), (2,1) et (2,2) indiquent que l'information obtenue est redondante tant au niveau hebdomadaire qu'au niveau mensuel et la fr~quence de pr61~vements peut ~tre r6duite (une fois par six semaines, par exemple) sans perte notable d'information. Ces codes sont frequents dans toutes les r6gions (sauf la r6gion 0 7) essentiellement pour la silice, les sulfates et les nitrates.

De mani~re sommaire, on peut donc conclure que: (1) Dans la r6gion 07, la fr6quence peut ~tre augmentAe (deux fois par se-

maine) pour obtenir une information plus complete; (2) Dans les r6gions 01 ~ 05, pour l'ensemble des param~tres, ~ l'exception

de la silice et des nitrates, la fr6quence mensuelle est acceptable et la fr6- quence hebdomadaire trop ~lev6e;

(3) Dans les r6gions 01 ~ 05, pour la silice, les sulfates et lea nitrates, la fr6- quence mensueUe trop 6levee peut ~tre r~duite sans perte d'information;

(4) Dans la r~gion 06, la fr~quence hebdomadaire est en g6n6ral trop 61ev6e mais, suivant les param~tres, la fr~quence mensuelle peut ~tre acceptable ou trop 61ev6e.

L'6tude de l'ind~pendance des valeurs d'une s6rie sur une base de temps fix6e est un pr6-requis si l'on veut utiliser les distributions statistiques pour re- pr6senter des s~ries observ6es. Ce mode du repr6sentation, qui pr6sente un in- t~r~t pour la d6termination de la probabilit~ au d~passement de valeurs cri- tiques d'un param~tre, encore peu utilis~ pour les donn6es de qualit~ de l'eau, semble prometteur (Cazaillet, 1977).

Dans le cas oh l'on montre que les valeurs observ6es d'une s~rie sont d~pen- dantes, cette d6pendance chronologique peut ~tre prise en compte ~ l'aide de module markovien.

(d) Influence de la tail!e des bassins versants Dans chacune des sept r6gions hydrographiques, on a retenu trois bassins de

taille diff6rente (P = petite, M = moyenne, F = forte). Pour examiner l'in- fluence de la taiUe des bassins versants sur les codes obtenus pour les coeffi-

TABLEAU VII

Table de contingence des codes en fonction de la taille des bassins versants

33

CODE PETITE (P) MOYENNE (M) FORTE (F)

10 \ 18 \ 15 \

TOTAL

43

0.1

0.2

1.0

o.6r ~.,~67 ~ , , , , , o ~,,

1 0 ~ , ~ . 17

0.3:; 0,3 5

27 ~ 28 ~

2,] ~ ' ~ . 6 7 " ~ . 6 ' 11 ~ 31 ~

1~0"3~

"- . 7 .

71

32

39

TOTAL 70 70 70 210

valeur observ6e ' ~ ~ - ~ v a l e u r th6orique Code (;'~.. mens ue ]

m hebdomada.i re

TA

BL

EA

U

VII

I

Co

nte

nu

e

n i

nfo

rma

tio

n

de

s s~

ries

he

bd

om

ad

air

es

tr~

s si

gn

ific

ati

ve

me

nt

au

to-c

orr

el~

es

(niv

ea

u

1%

)

Sil

ice

C

a 2

+

Mg

2+

N

a +

K

+

SO

~ -

C

l-

NO

~

PO

~ -

C

on

du

cti

vit

~

01

08

0A

0

.16

1

--

0.3

30

0

.38

0

0.3

57

0

.49

3

--

0.1

97

0

.37

9

0.4

59

01

10

0B

0.

252

--

--

--

0.3

44

--

--

0

.25

2

--

0'~

40

2

01

12

0A

0

.24

6

--

0.5

5.3

0

.52

7

0.4

17

0

.50

2

--

0.3

21

0

.33

1

--

02

14

0B

0

.25

8

0.1

37

0

.14

7

0.1

97

0

.22

1

0.3

29

0

.20

3

0.2

94

0

.48

3

0.1

38

02

20

0A

0

.25

6

0.3

87

0

.33

7

0.3

00

0

.41

8

0.3

89

0

.32

5

0.0

89

0

.29

0

0.2

60

02

34

0A

0

.20

7

0.2

01

0

.18

3

0.3

75

--

0

.26

4

--

0.1

46

--

0

.25

5

03

02

0A

0

.13

8

0.2

18

0

.31

7

0.4

90

0

.22

2

0.2

65

--

0

.12

0

--

0.2

87

03

03

0D

0

.21

0

--

--

--

0.2

93

--

0

.48

4

--

--

--

03

09

0A

0

.49

1

0.2

57

0

.28

2

0.2

53

0

.24

0

0.1

82

0

.38

0

0.3

88

0

.31

3

0.1

68

04

02

0A

0

.26

0

0.2

35

0

.25

5

0.2

56

0

.19

3

0.2

09

0

.28

9

0.2

40

0

.31

9

0.2

27

04

08

0C

0

.23

7

0.1

96

0

.26

4

0.3

22

0

.41

6

--

--

0.1

96

--

0

.25

4

04

31

0A

0

.15

7

0.3

94

0

.13

5

0.3

83

0

.52

5

0.4

37

0

.46

4

--

0.1

25

0

.16

1

05

03

0A

0.

079

--

0.3

64

0

.30

9

--

0.4

61

0

.31

2

0.2

67

0

.36

5

0.2

85

05

07

0A

0

.15

6

0.3

72

0

.24

3

0.3

35

--

0

.29

5

--

0.2

39

0

.50

1

0.5

11

05

28

0C

0

.06

0

0.2

71

0

.26

9

0.0

72

0

.16

2

0.3

52

0

.13

8

0.0

75

0

.29

4

0.1

68

06

10

0A

0

.07

9

0.3

15

0

.22

9

0.3

00

--

0

.52

4

0.3

22

0

.10

3

0.4

09

0

.10

8

06

19

0A

0

.04

9

0.4

21

0

.15

8

0.3

50

--

--

0

.43

5

0.1

49

0

.33

7

0.1

02

06

29

0B

0

.38

0

..

..

0

.40

4

--

--

0.4

53

--

07

02

0B

~

--

0.3

15

.

..

.

0.3

08

--

--

07

19

0A

.

..

..

..

..

.

07

23

0C

.

..

..

..

..

0

.39

5

35

cients d'auto-corr~lation, on a ~tabli une table de contingence (Tableau VII). La valeur calcul~e Z vaut 24,12 alors que la valeur critique au niveau de signifi- cation 5% pour 16 degr~s de libert~ vaut ×2 (5%) = 26,30. On accepte donc is l 'hypoth~se que le code (x,y) est ind~pendant de la taiUe des bassins versants.

Ce r6sultat doit cependant ~tre consid6r~ comme indicatif; en effet, pour ~tre plus rigoureux, il aurait fallu ~tablir des classes identiques de bassins ver- sants pour l 'ensemble des r6gions hydrographiques et disposer d 'un nombre plus ~lev~ de bassins versants par r6gion.

(e) Contenu en information des s~ries hebdomadaires Lorsque le coefficient d'auto-corr~lation d 'une s6rie hebdomadaire est tr~s

significativement different de 0 (niveau de 1%), on peut en d6duire que les valeurs successives de la s6rie sont d~pendantes et apportent une information redondante.

Le calcul du contenu en information permet de quantifier cette redondance; cette caract~ristique (I) permet en effet de d6terminer le nombre effectif N ' d 'observations ind6pendantes 6quivalentes correspondant ~ la s6rie de taille N. Une faible valeur du contenu en information correspond ~ une forte redon- dance des observations successives et permet d'envisager une fr6quence plus faible de pr~l~vements sans perte notable d ' information. Le Tableau VIII donne les valeurs du contenu d ' information pour routes les s6ries hebdoma- daires off le coefficient d'auto-corr~lation est tr~s significativement different de 0.

Si l 'on multiplie chacune des valeurs du tableau par 100, on obtient le nombre 6quivalent d'observations ind~pendantes correspondant fi une s6rie ob- serv~e de taille 100, par exemple dans le cas de la silice ~ la station 01080A, on aurait N ' = 16.

Les valeurs absentes dam le Tableau VIII correspondent ~ des s~ries dont les coefficients d'auto-corr~lation sont non significativement diff~rents de 0 au niveau 1% (ces valeurs peuvent cependant ~tm significativement diff6rentes de 0 au niveau de 5%). I1 s'agit de s4ries pour lesqueUes l 'on observe peu ou pas de d~pendance et qui ont donc un contenu d ' information ~lev~. L'examen du tableau confirme que dans toutes les r~gions, ~ l 'exception de 07 (valeurs absentes), les s~ries hebdomadaires sont redondantes pour la plupart des para- m~tres. Cependant, dans le cas des chlorures et du calcium, pour la r~gion 01, et du potassium dans la r~gion 06, la redondance est faible ou inexistante, au niveau hebdomadaire puisque dans ce cas, le coefficient d'auto-corr~lation n'est pas significativement different de 0, au niveau de 1%. En ce qui concerne les stations 03030D et 06290B, la redondance est faible ou inexistante pour la plupart des param~tres.

CONCLUSION

Pour la plupart des donn~es de qualit~ de l'eau, des techniques avanc6es d'~valuation de la variabilit6 temporelle, telles que l'analyse en s~rie de temps,

36

ne peuvent ~tre employdes en raison des contraintes de dur~e et de pas de temps d'~chantillonnage. Cependant, des m~thodes simples bas~es sur l'ana- lyse des coefficients d'autocorr~lation correspondant ~ des frdquences hebdo- madaire et mensuelle permet tent de ddgager les principales caracthristiques de l '6volution temporelle. L'application en a ~t~ effectu~e aux donn~es r~sultant de la mesure de dix param~tres dans sept r~gions hydrographiques du Quebec pendant trois anndes. Les r~sultats obtenus ont une incidence sur la recom- mandation d 'une fr~quence optimale d'op~ration du rdseau pour 6viter l'acqui- sition d 'une information redondante.

On a de plus confirm~ que la ddpendance entre les observations successives croit avec la frAquence et mis en ~vidence que les niveaux d'auto-corr~lation dtaient inddpendants de la taille des bassins versants. La connaissance de base acquise dans l'analyse de cette variabilit~ temporelle constitue un premier pas vers l '~laboration de modules repr~sentatifs: (1) d 'une ~ventuelle persistance (modUles markoviens par exemple); et (2) de donn6es ind~pendantes (lois statistiques).

REMERCIEMENTS

Nous remercions sinc~rement pour leur support financier, le minist~re de l 'Education du Quebec (subvention EQ 72) et Environnement Canada.

BIBLIOGRAPHIE

Anderson, R.L., 1941. Distribution of the serial correlation coefficient. Ann. Math. Stat., 8(1): 1--13.

Bob~e, B., Cluis, D., Goulet, M., Lachance, M., Potuin, L. et Tessier, A., 1977. Analyse et interpretation des donn~es de la p~riode 1967--1975. Service qualit~ des Eaux, Ministate des Richesses Naturelles, Quebec, Qua., Rapp. QE-20.

Cazaillet, O., 1977. Contribution ~Ia rationalisation d'un r~seau de mesure de qualit~ de l'eau: application au r~seau du bassin de la rivi~re Yamaska. Th~se, Universit~ du Quebec, I.N.R.S.-Eau, Sainte Foy, Qua.

Harned, H.S. et Owen, B.B., 1958. The Physical Chemistry of Electrolytic Solutions. Reinhold, New-York, N.Y., 3~me ~d.

Matalas, N.C., 1966. Information content of the mean. J. Geophys. Res., 67(9): 3441--3442.