20

Série A, N° 3392

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Série A, N° 3392

N° d'ordre

4264

THÈSES PRÉSENTÉES

A L A F A C U L T É D E S S C I E N C E S

D E L ' U N I V E R S I T É D E P A R I S

POUR OBTENIR

LE GRADE DE DOCTEUR ÈS SCIENCES MATHÉMATIQUES

PAR

Pierre THIONET

PREMIÈRE THÈSE

La perte d'information par sondage. (application de la notion d'information à la théorie

de l'échantillonnage)

DEUXIÈME THÈSE

Propositions données par la Faculté

Soutenues le 16 Juin 1958 devant la Commission d'examen

MM. G. DARMOIS PRÉSIDENT

F A C U L T É D E S / r a f W C E p t ^ y U N I V E R S I T É D E P A R I S J . PÉRÉS

= J * ^ U R S -

G. JULIA T Analyse sup. & Alg. sup. FOCH ...........T Méc. physique & expérim. PAUTHENIER . . . . T Electrotechnique Gle. DE" BROGLIE . . . . T Théories physiques. PRENANT . . T Anatomie et Histologie

comparées . GARNIER T Géométr ie supér ieure . PERES T Mécan. des fluides et

applications. LAUGIER T Physiologie générale. M. CURIE T Physique (S. P. C. N. ) BARRABE T Géol. s t ruct . & Géol.

appliquée. G.DARMOI S T Calcul des probabil. et

physique Math. J. BOURCART . . . . T Géogr. phys. & Géol.

dynamique. PLAPÎTEFOL . . . . T Botanique. GRASSÉ T Evol. des ê t res organ. PREVOST T Chimie organique. BOULIGAND T Appl. de l 'analyse à la

Géométr ie . CHAUDRON T Chimie appliquée. WYART T Minéralogie. TEISSIER T Zoologie. MANGENOT T Biologie végétale. P. AUGER T Physique quantique et

Relativité. MONNIER T Physiol. générale. PIVETEAU T Paléontologie. ROCARD T Physique (E. N. S. ). H. CARTAN T Mathématiques (E.N. S. ). LAFFITTE T Chimie Générale. FAVARD T Géomét r ie supér . COULOMB T Physique du Globe Mlle COUSIN . . . . . T Biologie animale (S.P.C.N.). CHRETIEN . T Chimie minérale. P. DRACH T Zoologie. KASTLER T Physique. EPHRUSSI T Génétique. WURMSER T Biol. physico-chimique. RIVIERE T Géologie (S. P. C. N. ). GAUTHERET . . . . T Biol. Végétale (P. C. B. ). LUCAS T Recherches physiques. A. THOMAS...... T Biologie cellulaire. ARNULF T Optique appliquée. M. MORAND.... T Enseignement de phys. SOLEILLET T Physique. FORTIER T Mécanique exper. des

fluides. DANJON T Astronomie. LAPORTE . T Phys. générale &

Radioactivité. JANET T Mécan. ana l . et

Mécanique célestè. PETIT T Biol. marit ime.

QUENEY T Météorologie et dyn. atmosphérique.

GALLIEN T Embryologie. EICHHORN T Biol. Vég. (S.P.C.N.). DE CUGNAC Biol. Vég. Mlle CAUCHOIS 1. T Chimie Physique. THELLIER T Physique du Globe. L'HERITIER T Génétique. GRIVET . . . T Radioélectrici té. PONCIN T Méc. générale. DUBREIL .. T Arith. k théorie des

nombres. QUELET T Chimie organique. CAGNIARD T Géophysique appliquée. CHAMPETIER . . . T Chimie macromolécul . CUVILLIER T Géol. struct. et

Géol. appliquée. JUNG T Pétrographie. TRILLAT T Microscopie e t diffr.

électronique. WIEMANN T Chimie organique et

s t ruc tura le . JACQUINOT T Spectroscopie et

Phys. céleste . VASSY T Phys. de l ' a t mosphère. DESTOUCHES . . . . Théor ies physiques. M. PRUVOST T Géologie. AMIEL T Chimie générale (P.C.B.). HOCART . . . T Minéralogie. J. P. MATHIEU . . T Physique (P.C.B.). COUTEAUX . . . . . . T Biol. animale (P.C.B.). MAY T Biol. animale (P.C.B.). CHOQUET . . . . . . . T Cale. différentiel et

Intégral .

FELDMANN T Biologie ( P . C . B . ) . GUINIER T Physique des solides

(P. C .B. ) . JOST T Physiologie comparée FORTET T Calc. des probabili tés. SCHWARTZ T Cale. diff. et intégral. CHOUARD T Physiologie Végétale. MALAVARD T Aviation. BRELOT T Calcul différentiel. NORMANT T Chimie organique (P.C.B.). BENARD T Chimie (P. C. B. ). BUVAT T Botanique (E. N. S. ). DUGUE T Statistiques mathém. GELOSO T Chimie (S. P. C. N. ). SOULAIRAC T Psychophysiologie. ULRICH T Physiol. Végétale., MARECHAL..... T Optique théorique et

appliquée. KIRRMANN T Théories chimiques. CHADEFAUD . . . . Botanique. DESTRIAU T Physique (M. P. C. ). Mlle LE BRETON T Physiologie générale. SALEM T Mathém. générales . LELONG T Mathém. générales DEVILLERS Anatomie et Histologie

comparées . EHRESMANN . . . . T Topologie Algébrique. FRANÇON Physique (S. P. C. N. ). GLANGEAUD . . . . T Géogr. physique et

Géol. dynamique. GODEMENT T Mathématiques (M.P.C.). PISOT T Calcul des Probabili tés. ROCH (E. ) T Géologie. SCHATZMANN . . . Astrophysique. • TERMIER T Paléontologie s t ra t igr . ZAMANSKY T Mathém. généra les LENNUIER Physique (P. C. B. ). RIZ ET Génétique ROUTHIER Géologie Appliquée. Mme TONNELAT . Théor ies physiques. DIXMIER Mathématiques (M. P.C.). SOUCHAY Chimie générale. AIGRAIN Physique (P. C. B. ). BRUSSET Chimie Minérale. M. LEVY Physique théorique. LENORMANT . . . . Physiologie. Mme CHAIX Chimie biologique. Mme HUREL-PY . Biol. Végétale

(P. C . B . ) . PIAUX Chimie (P. C. B. ). BRUN Méc. exper. des fluides. LEDERER T Chimie biologique. Mme ÇUBREIL . . T Mathématiques. Mme LELONG . . . T Mathématiques (E.N.S. ). BELLAIR T Géologie (S.P.C.N.). COTTE T Physique (M.P.C. ). DUBOIS J . E T Chimie (S. P. C. N. ). LAMOTTE Zoologie (E. N. S. ). MICHEL T Chimie (S. P. C. N. ). OLMER T Energétique générale. ROUAULT T Physique générale. GAUTHIER T Mécanique appliquée. BARCHEWITZ . . . Chimie Physique. BROSSEL Physique Atomique. BUSER Biologie Animale

(P. C . B . ) . CAMUS Biologie Végétale

(P. C . B . ) . CASTAING Physique Générale . CURIEN Minéralogie etCristal log. MOYSE Physiologie Végétale. NOIROT Evolution des Et res organ. PANNETIER Chimie (P. C. B. ). POSSOMPES Biologie Animale

(P. C . B . ) . PULLMANN..... Chimie théorique. TEILLAC Physique Nucléaire et

Radioactivité. TONNELAT Biologie physico-chimique VILLE Econométrie WILLEMART . . . . Chimie (P. C. B. ). DODE Chimie FREYMANN . . . . . Physique (S. P. C. N. ). GUINOCHET Biologie Végétale (Orsay). ROLLET Chimie (P. C. B. ). Mlle JOSIEN Chimie (P. C. B. ). CHEVAL LEY . . . . . T Géométr ie Algébrique

et théorie des groupes. DESNUELLE T Chimie biologique.

Secré ta i re général . . . . . . . . . . . . . ^ Ch. MONIER I

E n t r e p r i s e s à p a r t i r d ' u n e a m p l e c o n n a i s s a n c e t h é o r i q u e e t p r a - t i q u e d e la t e c h n i q u e , c e s r e c h e r c h e s n ' a u r a i e n t pu ê t r e m e n é e s à b i e n s i n o u s n ' a v i o n s é t é p u i s s a m m e n t a i d é e t e n c o u r a g é . M o n s i e u r G e o r g e s D a r m o i s n o u s i n i t i a e n c e t t e F a c u l t é m ê m e à la S t a t i s t i q u e M a t h é m a t i -

que e t n o u s e n s e i g n a a u s s i la g é o m é t r i e à l ' E c o l e N o r m a l e ; b i e n s o u v e n t d e p u i s , s a b o n t é e t s a c o m p r é h e n s i o n n o u s o n t é p a u l é e n d e s c i r c o n s - t a n c e s f o r t d i v e r s e s . A v e c M o n s i e u r D a r m o i s q u i n o u s c o n s e i l l a d e c h e r c h e r " d u c ô t é de l ' i n f o r m a t i o n " e t a b i e n v o u l u n o u s f a i r e l ' h o n n e u r

de p r é s i d e r l a s o u t e n a n c e de c e t t e t h è s e , n o u s v o u l o n s r e m e r c i e r M o n - s i e u r l e P r o f e s s e u r D u g u é de n o u s a v o i r , a v e c t a n t d e p a t i e n c e , e n - c o u r a g é à la p o u r s u i v r e j u s q u ' a u b o u t .

C e t r a v a i l d e m a n d a i t t o u t e la c o m p r é h e n s i o n e t l ' a m i t i é d e M o n - s i e u r C l o s o n , D i r e c t e u r G é n é r a l d e l ' I n s t i t u t N a t i o n a l d e s S t a t i s t i q u e s e t de M o n s i e u r G r u s o n , C h e f du S e r v i c e d e s E t u d e s E c o n o m i q u e s e t F i n a n c i è r e s a u M i n i s t è r e d e s F i n a n c e s , qu i v o u d r o n t b i e n t r o u v e r i c i l ' e x p r e s s i o n d e n o s s e n t i m e n t s d é v o u é s e t r e c o n n a i s s a n t s .

I l e s t j u s t e d ' a s s o c i e r à n o s r e m e r c i e m e n t s M o n s i e u r M. F r é ch e t (qui eu t en 1941 un r ô l e i m p o r t a n t d a n s n o t r e o r i e n t a t i o n ) ; M o n s i e u r J e q n M a y e r ( P r o f e s s e u r a u C o l l è g e d e F r a n c e r é c e m m e n t d é c é d é ) , g r â c e à qu i n o u s d é c o u v r î m e s l e s s o n d a g e s d è s 1945; n o s p r e m i e r s C h e f s à l a S t a t i s t i q u e G é n é r a l e MM. B u n l e e t R . R i v e t ; e n f i n M. A l f r e d Sauvy , l e s P r o f e s s e u r s G e o r g e B a r n a r d e t H a n s K e l l e r e r , M M . A n d r é N a t a f , F o n s a g r i v e , D e s a b i e , d o n t l e s a v i s e t e n c o u r a g e m e n t s n o u s f u - r e n t p r é c i e u x ; n o u s o u b l i o n s c e r t a i n e m e n t d e c i t e r t o u s c e u x qu i l e m é - r i t e n t e t n o u s e n e x c u s o n s d ' a v a n c e .

C e t t e t h è s e e s t d é d i é e à la m é m o i r e d e n o t r e c o u s i n e S i m o n e

L é a r d e t de n o s g r a n d - p è r e , t a n t e e t g r a n d - o n c l e - q u i f u r e n t m e m b r e s de l ' E n s e i g n e m e n t d e s 1 e r e t 2 è m e d e g r é s .

Pierre THIONET

LA PERTE D'INFORMATION

PAR SONDAGE

(Calcul des probabilités)

INTRODUCTION

L ' o b j e t de la p r é s e n t e t h è s e e s t l ' i n t r o d u c t i o n du c o n c e p t d ' i n f o r - m a t i o n a u s e n s de S c h u t z e n b e r g e r d a n s la t h é o r i e d e s s o n d a g e s . O n e s t p a r t i de l ' i d é e d e la v a l i d i t é , d a n s s e s g r a n d e s l i g n e s , de la t e c h n i q u e d e s s o n d a g e s ( t e l l e q u ' e l l e e s t e n s e i g n é e d a n s l e s m a n u e l s d e Y a t e s - t r a d u i t e n f r a n ç a i s s o u s la d i r e c t i o n d e M. G. D a r m o i s , - d e D e m i n g , d e H a n s e n , H u r v i t z e t M a d o w , d e S u k h a t m e , d e C o c h r a n , e t c . , d a n s l e s

c o u r s de T a n g , K e l l e r e r , Z a r c o v i c , e t c . L é v y - B r u h l , C h a r t i e r , D e s a - b i e , e t n o u s - m ê m e ) . O n a a d m i s t o u t e f o i s q u e l e s c o n c e p t s t h é o r i q u e s qui s o n t à la b a s e de c e s m é t h o d e s p o u v a i e n t g a g n e r à u n e x a m e n n o u - v e a u , - e t que la t e c h n i q u e s ' e n t r o u v e r a i t c o n s o l i d é e .

M a l g r é l ' a c c o r d qu i r è g n e e n t r e t o u s c e s a u t e u r s , i l e x i s t a i t e n fa i t d e u x é c o l e s : c e l l e de R o t h a m s t e d p o u r l a q u e l l e l e s é c h a n t i l l o n s e t p o p u l a t i o n s s o n t e x t r a i t s d ' u n i v e r s d ' e f f e c t i f s i n f i n i s , où l e s v a r i a b l e s on t d e s d i s t r i b u t i o n s v o l o n t i e r s c o n t i n u e s e t d o t é e s d e d e n s i t é s ; c e l l e du

B u r e a u of t h e C E N S U S p o u r l a q u e l l e l e s é c h a n t i l l o n s s o n t e x t r a i t s de p o p u l a t i o n s - u n i v e r s d ' e f f e c t i f s f i n i s ( ce qu i c o n d u i t n o t a m m e n t à c o n s i - d é r e r un c o e f f i c i e n t de c o r r é l a t i o n i n t r a c l a s s e c o m p r i s p o u r l e s u n s e n t r e 1 e t 0, e t p o u r l e s a u t r e s e n t r e 1 e t -1 / v - 1). N o u s n o u s p l a ç o n s d ' e m b l é e d a n s l ' é c o l e a m é r i c a i n e , s o u s r é s e r v e q u ' o n n ' o u b l i e p a s le c a s l i m i t e ( e s s e n t i e l en p r a t i q u e ) où v d e v i e n t i n f i n i m e n t g r a n d ,

L ' e x i s t e n c e de l o i s d e d i s t r i b u t i o n d o n t le m o m e n t d ' o r d r e 2 n ' e x i s -

t e p a s ne p o s e r a p a s d e p r o b l è m e b i e n g r a v e ( c a r t o u t e s l e s i n f o r m a t i o n s ne s o n t d é f i n i e s q u ' à u n f a c t e u r p r è s ) .

O n n o u s r e p r o c h e r a s a n s d o u t e d a v a n t a g e d ' a v o i r d é f i n i la p e r t e d ' i n f o r m a t i o n à p a r t i r d ' u n u n i v e r s c o m p l è t e m e n t c o n n u d o n t l e s é l é - m e n t s é c h a p p e n t u n à u n à n o t r e v u e ( c o n t r a i r e m e n t a u x m é t h o d e s d ' a - n a l y s e p r o g r e s s i v e ) , a u l i e u de d é f i n i r l e g a i n d ' i n f o r m a t i o n à p a r t i r d ' u n é t a t i n i t i a l d e la c o n n a i s s a n c e , c o m m e le f a i t L i n d l e y ( s u i v a n t d e p r è s la d é f i n i t i o n q u e S h a n n o n d o n n e de l ' i n f o r m a t i o n d a n s la t h é o r i e d e s

c o m m u n i c a t i o n s ) . L i n d l e y n ' o b t i e n t de r é s u l t a t s q u ' e n s u p p o s a n t c o n - n u e s e t la lo i de d i s t r i b u t i o n ( é c o l e d e R o t h a m s t e d ) et l a p r o b a b i l i t é a

p r i o r i d e s p a r a m è t r e s à e s t i m e r , c o n s i d é r é s c o m m e d e s v a r i a b l e s a l é a -

t o i r e s ( m é t h o d e d ' e s t i m a t i o n d ' a p r è s B a y e s ) . C e t t e t h é o r i e n e p a r a î t

p a s , a u m o i n s s o u s s a f o r m e a c t u e l l e , a p p l i c a b l e a u x t e c h n i q u e s d e s o n -

d a g e ( C h . V I I I ) . P a r e x e m p l e u n e q u a n t i t é d ' i n f o r m a t i o n q u i d e v i e n t i n f i -

n i e a v e c l e n o m b r e d e t i r a g e s ( a v e c r e m i s e ) e s t i n a p p l i c a b l e a u x s o n d a -

g e s à p l u s i e u r s d e g r é s , s t r a t i f i é s e t e n g r a p p e .

A u c o n t r a i r e n o u s a v o n s r e t r o u v é , a u x p r e m i è r e s p l a c e s d e s p e r -

t e s d ' i n f o r m a t i o n , l a v a r i a n c e d ' é c h a n t i l l o n n a g e , d o n t f a i t g r a n d u s a g e l a

t e c h n i q u e . N o u s a v o n s d ' a i l l e u r s c r i t i q u é , p o u r l e s e s t i m a t e u r s b i a i s é s ,

l e p r o c é d é c o u r a n t q u i c o n s i s t e à a j o u t e r à l a v a r i a n c e l e c a r r é d u b i a i s ;

c e t o t a l n ' e s t p l u s u n e p e r t e d ' i n f o r m a t i o n . N o u s a v o n s é g a l e m e n t s i g n a l é

q u e l ' u s a g e d e l a v a r i a n c e n ' é t a i t p a s a p p r o p r i é a u c a s d e l ' e s t i m a t i o n d ' u n e m é d i a n e .

D e t o u t e f a ç o n l a v a r i a n c e e s t u n e p e r t e d ' i n f o r m a t i o n p a r t i c u l i è -

r e , à s a v o i r s y m é t r i q u e ; e l l e s u p p o s e q u ' o n a t t r i b u e l e m ê m e p o i d s à

d e u x e r r e u r s d ' é c h a n t i l l o n n a g e , l ' u n e p o s i t i v e , l ' a u t r e n é g a t i v e , d e m ê -

m e a m p l e u r . - O n e n a t r o u v é b i e n d ' a u t r e s .

L e s e x p r e s s i o n s d e l a p e r t e d ' i n f o r m a t i o n d a n s l e c a s d e d i s t r i -

b u t i o n s q u e l c o n q u e s ( C h . I V ) n ' o n t é t é t r o u v é e s q u e s o u s d e s c o n d i t i o n s

d e r é g u l a r i t é t r è s r e s t r i c t i v e s ; i l e s t p o s s i b l e q u e c e s c o n d i t i o n s p u i s -

s e n t ê t r e r é d u i t e s ; e n o u t r e i l y a u r a i t l i e u d ' é t u d i e r p l u s s y s t é m a t i q u e -

m e n t , l e s p o s s i b i l i t é s q u e p e u t p r é s e n t e r l e c a s o ù l a d é r i v é e p r e m i è r e

n ' e x i s t e p a s q u a n d la p e r t e é l é m e n t a i r e s ' a n n u l e ( o u d ' a u t r e s c a s e n c o r e ) .

N o u s n ' a v o n s p a s é t é e n m e s u r e , d ' a i l l e u r s , d ' i n t e r p r é t e r t o u t e

p e r t e d ' i n f o r m a t i o n a u m o y e n d ' e s t i m a t e u r s e t d e q u a n t i t é s à e s t i m e r ;

i l s e m b l e q u e c e s o i t i m p o s s i b l e . - U n e a u t r e l a c u n e d a n s n o s r e c h e r -

c h e s s e r a i t u n e é t u d e d e l ' e s t i m a t i o n d u m o d e d e l ' u n i v e r s p a r c e l u i

d e l ' é c h a n t i l l o n ; i l y a u r a i t u n r é e l i n t é r ê t p r a t i q u e à s a v o i r e x p r i m e r ( e t

m i n i m i s e r ) l a p e r t e d ' i n f o r m a t i o n c o r r e s p o n d a n t e .

P o u r l ' e s t i m a t i o n d e l a p l u s g r a n d e v a l e u r o u d e l ' é t e n d u e ( r a n g e ) ,

l a r é p a r t i t i o n o p t i m u m d e l ' é c h a n t i l l o n s e r a c e l l e q u i d o n n e l a m o i n d r e

p e r t e d ' i n f o r m a t i o n , p a r u n e e x t e n s i o n n a t u r e l l e d e l a t h é o r i e d e l à

m o i n d r e v a r i a n c e . L e t o t a l [ c o û t d ' e n q u ê t e , p l u s p e r t e d ' i n f o r m a t i o n ] e s t

à m i n i m i s e r , c e q u i e s t a s s e z d a n s l e s i d é e s d e W a l d ( 1 9 5 0 ) ; l e m u l t i p l i -

c a t e u r d e L a g r a n g e j o u e l e r ô l e d ' u n i t é m o n é t a i r e .

C h e m i n f a i s a n t , n o u s a v o n s c o m p l é t é l a t h é o r i e d e l ' e s t i m a t i o n

p a r s o n d a g e d a n s l e c a s b i a i s é . O n a u r a i t p u c r o i r e q u ' a l o r s t o u t e s t a -

t i s t i q u e p o u v a i t s e r v i r à e s t i m e r t o u t p a r a m è t r e . D u m o m e n t q u ' o n d é -

f i n i t l ' i n f o r m a t i o n p a r u n e r é c u r r e n c e e n t r e e s t i m a t i o n s s u r u n e s u i t e d e

p l a n s d e s o n d a g e d e t a i l l e s d é c r o i s s a n t e s , l ' e s t i m a t i o n Z ' n ' i n f o r m e s u r

Ç q u e s i e l l e i n f o r m e s u r t o u s l e s Z q u i s ' i n t e r c a l e n t e n t r e Z ' e t £ .

L a p e r t e d ' i n f o r m a t i o n n e p e u t ê t r e d é f i n i e q u e p o u r l e s e s t i m a t e u r s u n i f o r m é m e n t b i a i s é s ; c e q u i s i g n i f i e q u ' i l e x i s t e u n e f o n c t i o n n e l l e

A [ Z ' Z ] t e l l e q u ' o n a i t ℰ ∆ = 0.

C e c i c o n d u i t à c a l c u l e r l a p e r t e d ' i n f o r m a t i o n d a n s l e c a s o ù i l

e x i s t e u n e f o n c t i o n n e l l e y t e l l e q u e :

S y [Z] = y [Ç]

E n p a r t i c u l a r i s a n t e n c o r e , o n a i n t r o d u i t l ' e s t i m a t e u r i s o m o r p h e

q u i p e r m e t d e r e t r o u v e r l e s c a s p r a t i q u e s c o u r a n t s d ' e s t i m a t i o n b i a i -

s é e ; i l c o r r e s p o n d a u c a s o ù ζ = f ( a , b , c ) Z = f ( A , B , C ) , l a f o n c t i o n

f é t a n t l a m ê m e , A B C é t a n t d e s a l é a t o i r e s c a l c u l é s s u r l ' é c h a n t i l l o n ,

l e u r s e s p é r a n c e s m a t h é m a t i q u e s é t a n t a b c . L e s i n d i c a t e u r s q u e c a l -

c u l e n t l e s t e c h n i c i e n s o n t é t é r e t r o u v é s , p a r e x e m p l e p o u r l e s r a t i o s ;

c e q u ' o n c o n s i d é r a i t j u s q u ' i c i c o m m e d e s v a l e u r s a p p r o c h é e s d e s c a r -

r é s d e s c o e f f i c i e n t s d e v a r i a t i o n s o n t d e v é r i t a b l e s p e r t e s d ' i n f o r m a t i o n .

A c e t t e m ê m e o c c a s i o n o n a r e t r o u v é l ' i n f o r m a t i o n d e F i s h e r ,

c o m m e p e r t e d ' i n f o r m a t i o n d e l ' e s t i m a t i o n d u m a x i m u m d e v r a i s e m -

b l a n c e - C h . I V ) .

L e s p l a n s d e s o n d a g e r é e l s é t a n t n o t a b l e m e n t p l u s c o m p l i q u é s q u e

l ' u r n e d e B e r n o u l l i , o n a m e n é s é p a r é m e n t e t p a r a l l è l e m e n t l ' é t u d e d e

c e s d e u x c a s ( C h . I , I I ) . O n a e u l ' i d é e d e r e p r é s e n t e r l e s s o n d a g e s

d a n s l ' u r n e u n i q u e p a r d e s p o i n t s d ' u n a x e e t l e s s o n d a g e s p l u s g é n é -

r a u x p a r l e s p o i n t s d ' u n t r e i l l i s , l e s d i s t a n c e s é t a n t c o m p t é e s s u r l e s

d r o i t e s d u d i t t r e i l l i s ( C h . I I I ) . C e t é c l a t e m e n t d e s d i f f i c u l t é s s u i v a n t

l e u r n a t u r e , t o p o l o g i q u e o u a n a l y t i q u e , s ' e s t r é v é l é f r u c t u e u x . - L a

r e p r é s e n t a t i o n m é t r i q u e d e s p l a n s d e s o n d a g e d a n s u n e s p a c e e u c l i d i e n

à u n n o m b r e d o n n é d e d i m e n s i o n s a p a r u f a c i l e p o u r l e s s o n d a g e s à

p l u s i e u r s d e g r é s e t m ê m e à p l u s i e u r s p h a s e s . - N o t r e c o m p r é h e n s i o n

d e s f o r m u l e s d e v a r i a n c e ( a p p a r e m m e n t c o m p l i q u é e s ) s ' e n e s t t r o u v é e

a m é l i o r é e ( C h . V , V I ) .

L a p e r t e d ' i n f o r m a t i o n é t a n t s u p p o s é e p r e n d r e p l a c e d a n s l ' e n -

s e i g n e m e n t d e s S o n d a g e s , d o i t - o n c o n t i n u e r à p a r l e r d e s i n f o r m a t i o n s

s u p p l é m e n t a i r e s d o n t l ' e m p l o i p e r m e t d ' a m é l i o r e r l e s e s t i m a t e u r s o u

l e s p l a n s d e s o n d a g e ? A u t r e m e r t d i t , q u e d e v i e n t l ' i n f o r m a t i o n q u a n d o n

c o m p a r e p l u s i e u r s i t i n é r a i r e s ζ Z , a u l i e u d e s e d é p l a c e r l e l o n g d ' u n

s e u l i t i n é r a i r e ? T e l e s t l ' o b j e t d u C h a p i t r e V I I .

A u t o t a l n o u s p e n s o n s q u e l e s s t a t i s t i c i e n s n e d e v r a i e n t p a s d i r e

d ' u n p l a n d e s o n d a g e q u ' i l a p p o r t e p l u s d ' i n f o r m a t i o n q u ' u n a u t r e , m a i s

q u ' i l f a i t p e r d r e m o i n s d ' i n f o r m a t i o n q u e l ' a u t r e . U n e p e r t e n é g a t i v e

est un gain, par r a p p o r t à un sondage de r é f é r e n c e . Les d i v e r s e s théo- r i e s déf in i ssen t des niveaux d ' informat ion; pour nous le niveau le plus bas c o r r e s p o n d à un sondage ( ) de ta i l le minimum; pour d ' a u t r e s il c o r r e s p o n d à des r e n s e i g n e m e n t s a n t é r i e u r s p e r m e t t a n t d ' é c r i r e une loi de probabi l i té a p r io r i . Quant au niveau le plus é levé, pour nous il est n é c e s s a i r e m e n t à d i s tance finie; d ' a u t r e s l ' a u t o r i s e n t à s ' é l o igne r à l ' infini . - Cela m i s à pa r t , l ' équat ion de r é c u r r e n c e e s t la même; la na ture des solut ions diffère; c a r le symbole E s p é r a n c e Mathémati - que n'a pas du tout le m ê m e sens chez Lindley qu ' ic i m ê m e . La topo- logie s e r a i t la m ê m e , si nous n 'avions t rouvé utile de fa i re jouer à l ' infini un rô le spéc ia l : il r e p r é s e n t e l ' ab sence de toute in format ion ut i l isable; et i l es t conforme aux habi tudes des technic iens de p e n s e r qu'on n'a pas d ' in fo rmat ion ut i l i sable tant qu ' i l r e s t e une s t r a t e non sondée (Ch. VIII).

On peut p e n s e r f ina lement que la technique c lass ique des sonda- ges (y c o m p r i s l ' e s t ima t ion du m a x i m u m de v r a i s e m b l a n c e de F i s h e r , so r t consol idée de no t re ana lyse .

CHAPITRE I

TIRAGES ÉQUIPROBABLES DE BOULES

DANS UNE URNE

I - I N T R O D U C T I O N -

1 / - P o i n t de d é p a r t c o n c r e t .

L e s p l a n s de s o n d a g e s o n t é t a b l i s en p r a t i q u e p o u r e s t i m e r c e r - t a i n e s g r a n d e u r s p h y s i q u e s ( é c o n o m i q u e s , s o c i a l e s , m é d i c a l e s , e t c . ) au m o y e n d ' o b s e r v a t i o n s l i m i t é e s à u n é c h a n t i l l o n d é s i g n é p a r d e s t i - r a g e s au s o r t p l u s ou m o i n s c o m p l i q u é s .

D a n s la p l u p a r t d e s c a s , c e s g r a n d e u r s s o n t d e s v a l e u r s t o t a l e s ( s u p e r f i c i e c u l t i v é e en j u t e , n o m b r e de p e r s o n n e s t r a v a i l l a n t m o i n s d e q u a r a n t e h e u r e s p a r s e m a i n e , e t c . ) ou ( ce qui r e v i e n t a u m ê m e p o u r la s t a t i s t i q u e p r a t i q u e ) d e s v a l e u r s m o y e n n e s ou d e s " p a r un i t é de s o n d a g e . O n " e x t r a p o l e , c ' e s t - à - d i r e q u ' o n p a s s e d e s p o u r c e n t a g e s ou v a l e u r s m o y e n n e s à l ' e s t i m a t i o n du t o t a l , en m u l t i - p l i a n t p a r un f a c t e u r c o n n u .

A i n s i la t e c h n i q u e d e s s o n d a g e s e s t a x é e s u r l e s p r o b l è m e s d ' e s - t i m a t i o n d e m o y e n n e s - c o m p t e t e n u d ' u n p l a n de s o n d a g e p l u s o u m o i n s c o m p l i q u é .

L ' e s t i m a t i o n d e s r a t i o s e s t un a u t r e p r o b l è m e p r a t i q u e t r è s i m - p o r t a n t q u i n e p o u r r a ê t r e é t u d i é d a n s l e s p r e m i e r s c h a p i t r e s . O n la t r o u v e r a a u c h a p i t r e IV.

O n c o m m e n c e p a r l ' é t u d e du p l a n d e s o n d a g e le p l u s s i m p l e : t i - r a g e s é q u i p r o b a b l e s de b o u l e s d a n s u n e u r n e , s a n s r e m i s e p u i s a v e c r e m i s e .

2 / - D é f i n i t i o n s .

C o n s i d é r o n s u n e u r n e (ou u n i v e r s ) U r e n f e r m a n t v b o u l e s n u m é -

r o t é e s 1, 2 , . . . i . . . v p o r t a n t c h a c u n e un n o m b r e r é e l x, . D é s i g n o n s p a r X l ' e n s e m b l e de c e s v v a l e u r s .

La moyenne des xi s e r a notée :

L ' é c a r t - t y p e des x, est σ , défini par :

On t i r e au so r t une boule de l ' u rne , n fois de suite sans j a m a i s r e m e t t r e les boules t i r é e s . P o u r un échanti l lon donné de n boules, la moyenne des n va l eu r s de xi a ins i connues s e r a notée :

Xnest une va r i ab le a l éa to i r e lo rsque (n étant donné) on envisage les m échant i l lons éga lement p robab les à e x t r a i r e de l ' u rne , avec cha- cun desque l s on peut c a l cu l e r une va l eu r de Xn.

Cas des t i r a g e s sans r e m i s e ou exhaust i fs . . m = v! /n! ( v - n)!

Cas des t i r a g e s avec r e m i s e ou bernou l l i ens m = vn

Lorsque x n ' e s t pas connu, on l ' " e s t i m e " p a r une ce r ta ine va leur de Xn, à savo i r cel le ca lcu lée s u r l ' échant i l lon effect ivement t i r é .

On dit que Xn est e s t i m a t e u r " s a n s b ia i s" de x, p a r c e qu 'on a :

où l ' o p é r a t e u r & d é s i g n e l ' e s p é r a n c e m a t h é m a t i q u e ( é t e n d u e a u x m v a - l e u r s é g a l e m e n t p r o b a b l e s de Xn).

C e q u ' o n d i t p o u r x et X s ' é t e n d a u x m o m e n t s d ' o r d r e q u e l c o n - q u e d e X c a l c u l é s s u r l ' u n i v e r s et s u r é c h a n t i l l o n ( a v e c la m ê m e o r i - g i n e p o u r X) .

P l u s g é n é r a l e m e n t on c o n s i d è r e r a l ' e s t i m a t e u r s a n s b i a i s Z d e l ' e s t i m é Ç d é f i n i s s u r l ' é c h a n t i l l o n e t s u r l ' u n i v e r s r e s p e c t i v e m e n t , a v e c & Z = Ç.

E r r e u r d ' é c h a n t i l l o n n a g e :

O n d é s i g n e a i n s i l ' a l é a t o i r e X - x , ou e n c o r e Z - i .

O n a c o u t u m e de r e p é r e r l ' a m p l e u r d e s e r r e u r s d ' é c h a n t i l l o n n a - ge p a r la v a r i a n c e de l ' e s t i m a t e u r , V Z = ë ( Z - ζ . O n s a i t q u e :

On emploie éga l emen t beaucoup la r a c i n e c a r r é e de cet te var iance :

ou é c a r t - t y p e d e Z , e t la v a l e u r r e l a t i v e d e c e t é c a r t - t y p e

σ ( Z ) / £ = C. V ( Z ) = y

ou c o e f f i c i e n t de v a r i a t i o n ( s o u v e n t e x p r i m é en p o u r c e n t ) .

II - L E M M E S -

L e m m e 1.

L e c a r r é d e l ' é c a r t - t y p e d e v v a l e u r s d e (x) p e u t s ' é c r i r e :

52 dés ignant le c a r r é de la d i f fé rence de deux quelconques des v a l e u r s de x,

Σ d é s i g n a n t l a s o m m e d e s - - v a l e u r s d i s t i n c t e s d e 52 .

A u t r e f o r m e d u L e m m e : — v - 1 2

où d é s i g n e la moyenne des é c a r t s c a r r é s .

Démons t ra t ion du Lemme.

L e s c a r r é s d i s t i n c t s (x, - x j ) s o n t a u n o m b r e d e v( v - 1 ) / 2

2 (Xi - Xj)2 c o m p r e n d ( v - 1) t e r m e s

E n s o m m a n t c e t t e d e r n i è r e e x p r e s s i o n p a r r a p p o r t à i, o n o b t i e n t (v - 1)(v - 2) p r o d u i t s .

O r l e s (xi - x j ) (x i - Xh) c o m p r e n n e n t ^ v a l e u r s d i s -

t i n c t e s , d e s o r t e q u e

e s t é g a l à d e u x f o i s la s o m m e de t o u s l e s p r o - j h d u i t s d i s t i n c t s .

M a i s :

(X, - xj)(xi - Xh) + (Xj - Xh)(Xj - Xi) = (X, - Xj)(Xi - Xh + Xh - Xj)

= (Xi - Xj)2

L e s (v - l)(v - 2) p r o d u i t s d o n n e n t donc n a i s s a n c e à (v - l ) (v - 2 ) / 2 c a r r é s , c ' e s t - à - d i r e (v - 2) f o i s c h a q u e c a r r é d i s t i n c t , c ' e s t - à - d i r e

(v - 2) Σ σ

A i n s i :

v = 2 ^ 52 + (v - 2) 2 52

= V V52

d ' o ù a2 = 21 82/ V2 c . q . f . d.

E n p a r t i c u l i e r s i l a v a r i a b l e x p r e n d l e s v a l e u r s a e t b , l e c a r r é de l ' é c a r t - t y p e d e x p e u t s ' é c r i r e :

L e m m e 2 s u r la v a r i a n c e d ' u n é c h a n t i l l o n e x h a u s t i f .

P o u r l ' é c h a n t i l l o n d ' e f f e c t i f n , l a m o y e n n e d e s d i f f é r e n c e s c a r - r é e s s a n s r é p é t i t i o n e s t :

D = 2 S ( x i - x j ) - 1)

où S d é s i g n e la s o m m a t i o n é t e n d u e à l ' é c h a n t i l l o n . I l e s t é v i d e n t q u e

1 / E (D) = ∆

où E d é s i g n e l ' e s p é r a n c e m a t h é m a t i q u e l o r s q u e n e s t d o n n é e .

Il en r é su l t e que :

T e l e s t l e l e m m e 2. ( R é s u l t a t c o n n u , p a r f o i s o u b l i é ) .

L e m m e 3 s u r la v a r i a n c e d ' u n é c h a n t i l l o n b e r n o u l l i e n .

F a i s o n s t e n d r e v v e r s l ' i n f i n i ; i l v i e n t à la l i m i t e :

L e m m e 3 :

E ' d é s i g n a n t l ' e s p é r a n c e m a t h é m a t i q u e r e l a t i v e a u x t i r a g e s a v e c r e - m i s e . ( R é s u l t a t b i e n c o n n u ) .

III - E T U D E D E S S U I T E S D E P L A N S DE S O N D A G E -

1/ - L e s d e u x p o i n t s de vue :

A u l i e u d ' e n v i s a g e r , c o m m e d ' h a b i t u d e , d e s t i r a g e s s u c c e s s i f s d a n s l ' u r n e , au b e s o i n j u s q u ' à é p u i s e m e n t (n = v), - on p o u r r a , e n s e n s i n v e r s e , p a r t i r d ' u n e u r n e p a r f a i t e m e n t c o n n u e ( v = n) c ' e s t - à - d i r e t o - t a l e m e n t v i d e ( l e s b o u l e s é t a n t p l a c é e s d a n s une u r n e a u x i l i a i r e ) e t e x - t r a i r e d e c e t t e d e r n i è r e , p a r t i r a g e a u s o r t , s u c c e s s i v e m e n t

1, 2, . . . (v - n), . . . (v - 1), v b o u l e s ,

q u ' o n r e p l o n g e r a d a n s l ' u r n e p r i m i t i v e .

2 / - Su i t e de p l a n s de s o n d a g e : n o t i o n d ' i n f o r m a t i o n .

C a s d e s s o n d a g e s e x h a u s t i f s .

O n p e u t s y m b o l i s e r la f a m i l l e de s o n d a g e s en q u e s t i o n p a r d e s p o i n t s c o n s é c u t i f s n u m é r o t é s 0, 1, 2 , . . . , n , . . . v s u r un a x e D , le p o i n t n r e p r é s e n t a n t l ' e n s e m b l e d e s s o n d a g e s e x h a u s t i f s d ' e f f e c t i f n ( p o u r la p o p u l a t i o n e t la v a r i a b l e X c o n s i d é r é e s ) .

Une é c h e l l e a r i t h m é t i q u e s u r l ' a x e D p e u t d ' a b o r d ê t r e e m p l o y é e

(D)

Si l ' o n s e d é p l a c e d e (0) v e r s (v) , on c o n n a î t d e m i e u x en m i e u x l ' u r n e ; (0) r e p r é s e n t e l ' a b s e n c e t o t a l e d e r e n s e i g n e m e n t s e t (v) f i g u r e la c o n n a i s s a n c e p a r f a i t e d e l ' u n i v e r s . (On d é s i g n e r a p l u t ô t u n t e l po in t pa r un ( U).

O n p e u t d i r e q u ' o n " g a g n e de l ' i n f o r m a t i o n " en p a s s a n t de (n) à (n + 1) e t q u ' o n " p e r d de l ' i n f o r m a t i o n e n p a s s a n t d e n à (n - 1) .

I l s e r a i t i n t é r e s s a n t q u e la d i s t a n c e (v n) s u r l ' a x e D r e p r é s e n t â t la p e r t e d ' i n f o r m a t i o n r é s u l t a n t d u f a i t q u ' o n a l i m i t é l e s o b s e r v a t i o n s à n b o u l e s s u r v (en c e q u i c o n c e r n e la c o n n a i s s a n c e de l ' u r n e U). A cet é g a r d l ' é c h e l l e a r i t h m é t i q u e ne n o u s p a r a î t p a s s a t i s f a i s a n t e q u a n - t i t a t i v e m e n t ; il ne s e r a i t p a s c o n f o r m e à n o t r e c o n c e p t d ' i n f o r m a t i o n de d i r e q u ' o n p e r d la m ê m e q u a n t i t é d ' i n f o r m a t i o n c h a q u e f o i s q u e l ' e f f e c - t i f de l ' é c h a n t i l l o n d i m i n u e d ' u n e u n i t é . B i e n a u c o n t r a i r e n o t r e s e n t i -

m e n t e s t que :

- c o n n a î t r e t o u t e s l e s b o u l e s , ou t o u t e s s a u f u n e , n ' e s t p a s t r è s d i f f é r e n t ;

- c o n n a î t r e une b o u l e , ou n ' e n c o n n a î t r e a u c u n e , e s t t r è s d i f f é r e n t ;

- c o n n a î t r e d e u x b o u l e s a u l i e u d ' u n e c o n s t i t u e un g a i n d ' i n - f o r m a t i o n b i e n p l u s g r a n d q u e c o n n a î t r e v b o u l e s a u l i e u de v - 1 .

E n r e v a n c h e p o r t o n s s u r u n a x e D l e s v a l e u r s p o u r n = 0, 1, 2 , . . . , v - 1, de la v a r i a n c e de Xn

c ' e s t - à - d i r e :

Le point (0) es t r e j e t é à l ' infini , tandis que le point ( v) e s t l ' o r i - gine des a b s c i s s e s . Quand n c ro î t , chaque pas fait v e r s la conna i s sance par fa i te e s t bien i n f é r i eu r au p récéden t .

Ainsi not re intuit ion s e r a sa t i s fa i t e si l 'on chois i t la v a r i a n c e V X pour m e s u r e r la pe r t e d ' in fo rmat ion imputable au sondage. v X possède une au t r e p rop r i é t é .

THEOREME -

La va r i ance V X sa t i s fa i t à la défini t ion de l ' i n fo rma t ion suivant l ' ax iomat ique de Schu tzenberger (Sch. page 45 ).

En effet, posons :

symbole rappelant que n uni tés s u r v sont connues; et mon t rons que :

p(v, n - j) - p(v, n) = E P(n, n - j)

où P a la m ê m e définition que p m a i s e s t a l éa to i r e .

P o u r cela fo rmons :

et posons :

où s désigne la va r i ance d 'un échant i l lon (exhaustif) de n boules :

L e t h é o r è m e d é c o u l e i m m é d i a t e m e n t d u L e m m e 2 :

E ( n s 2 / n - 1) = va2 /v - 1

3/ - Cas des sondages Bernoul l i ens .

Le nombre n de t i r a g e s peut ( théor iquement au moins) ê t r e p r i s auss i g rand qu'on veut (et bien entendu d é p a s s e r v ).

Rep ré sen tons p a r des points consécu t i f s s u r l ' axe D, les d ive r s plans de sondage. Lor sque l ' e f fec t i f n croî t

n = 1, 2, 3

le point f igura t i f (n) p a r t d 'une posit ion (1) et se r approche cons t am- ment sans j a m a i s y p a r v e n i r d 'un point U f igurant la conna i s sance p a r - fai te de l ' u rne .

Le point (n)a donc un point d ' accumula t ion ∞ et il n ' e s t pas évi- dent que c e l u i - c i doive co ïnc ide r avec le point U figurant la conna is - sance par fa i te .

N o u s f e r o n s p a r la s u i t e l e P o s t u l a t ∞ = U c ' e s t - à - d i r e q u e la p e r t e d ' i n f o r m a t i o n , p a r r a p p o r t à U, t e n d v e r s 0 q u a n d n t e n d v e r s l ' i n f i n i .

4 / - A c c o r d e n t r e f i g u r a t i o n s d e s s o n d a g e s e x h a u s t i f e t b e r n o u l l i e n .

S u p e r p o s o n s l e s a x e s D r e l a t i f s à un s o n d a g e e x h a u s t i f et à un s o n d a g e b e r n o u l l i e n d a n s la m ê m e p o p u l a t i o n .

I l e s t é v i d e n t q u e l e s d e u x p o i n t s (1) d o i v e n t c o ï n c i d e r , p u i s q u e s o n d a g e s b e r n o u l l i e n e t e x h a u s t i f s o n t i n d i s c e r n a b l e s t a n t q u ' o n ne t i r e q u ' u n e b o u l e . D e m ê m e le p o i n t (v) de l ' a x e " e x h a u s t i f " d o i t c o ï n c i d e r a v e c l e p o i n t U de l ' a x e b e r n o u l l i e n ; e t , a v e c le P o s t u l a t ( 00 = U ) , i l c o ï n c i d e a v e c l e p o i n t ∞.

E n o u t r e , i l e s t i n t u i t i f que le t i r a g e d e la n è m e b o u l e a p p o r t e m o i n s d ' i n f o r m a t i o n e n s o n d a g e b e r n o u l l i e n q u ' e n s o n d a g e e x h a u s t i f , c e qu i d o i t s e t r a d u i r e p a r :

dis tance n - 1, n d i s tance n - 1, n s u r D exhaust i f S s u r D bernoul l ien

T o u t e s c e s c o n d i t i o n s s o n t r e m p l i e s s i la p e r t e d ' i n f o r m a t i o n e n s o n d a g e b e r n o u l l i e n e s t c h o i s i e é g a l e à

quand la pe r t e en sondage exhaust i f es t e l l e - m ê m e (à effectif égal)

E x a m i n o n s t o u t e f o i s c e q u ' i l a d v i e n t de la f o r m u l e d e S c h ü t z e n - b e r g e r r e l a t i v e a u x q u a n t i t é s d ' i n f o r m a t i o n .

5 / - T H E O R E M E -

La v a r i a n c e V X en s o n d a g e b e r n o u l l i e n s a t i s f a i t à la d é f i n i t i o n de l ' i n f o r m a t i o n s u i v a n t l ' a x i o m a t i q u e de S c h u t z e n b e r g e r .

E n e f f e t , p o s o n s :

il vient

Calculons ensui te

P ' (n , n - 1)

Soit s ' la va r i ance des xi de l ' échant i l lon t i r é de tai l le n . P o u r p a s s e r de là à l ' échant i l lon d 'e f fec t i f n - 1, il faut t i r e r au s o r t l 'une des n boules et l ' exc lu re , ce qui équivaut à c o n s e r v e r un échant i l lon exhaustif de (n - 1) boules; la p e r t e d ' i n fo rma t ion c o r r e s p o n d a n t e est donc :

I l f a u t e n f i n p r e n d r e l ' e s p é r a n c e m a t h é m a t i q u e de S ' la s o m - m a t i o n é t a n t é t e n d u e à t o u s l e s é c h a n t i l l o n s b e r n o u l l i e n s d ' e f f e c t i f n . A p p l i q u o n s la l e m m e 3, i l v i e n t :

D ' o ù

p ' ( v , n - 1) - p ' ( v , n) = ℰ ' P ' ( n , n - 1) c . q. f. d .