101
´ Econom´ etrie de la finance Guillaume SIMON Capital Fund Management 6-8 Boulevard Haussmann, 75008 Paris Ann´ ee scolaire 2011-2012 Option : M2 ISF/Actuariat

Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

  • Upload
    hathuy

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Econometrie de la finance

Guillaume SIMONCapital Fund Management

6-8 Boulevard Haussmann, 75008 Paris

Annee scolaire 2011-2012Option : M2 ISF/Actuariat

Page 2: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Preambule :

Ce cours doit beaucoup a Serge DAROLLES (Lyxor AM / CREST) qui en a inspire leplan et le contenu. La troisieme partie taitant des processus autoregressifs profite gran-dement des apports de Gulten MERO (CREST / Universite de Cergy) et de FlorianIELPO (BCV). Qu’ils en soient ici vivement remercies. Ce cours introductif a quelquesconcepts fondamentaux d’econometrie de la finance et de la theorie du portefeuille serautilement complete par la lecture des ouvrages cites dans la bibliographie qui constituerontdes references plus completes.

Photo de couverture : Bourse de New-York, debut du XXe siecle.Extrait du Hors-Serie Special Fonds de Placement - Le Temps - 1e Fevrier 2012.

Page 3: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Table des matieres

1 Rappels statistiques et modelisation des rendements 7

1.1 Statistique elementaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.1 Notion de statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.2 Notion d’estimateur . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.3 Moments et moments empiriques . . . . . . . . . . . . . . . . . . . . 10

1.1.4 Independance, correlation et covariance . . . . . . . . . . . . . . . . 10

1.1.5 Regression, Moindres carres ordinaires . . . . . . . . . . . . . . . . . 10

1.1.6 Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2 Outils statistiques pour la modelisation des rendements financiers . . . . . . 12

1.2.1 Hypothese statistique forte . . . . . . . . . . . . . . . . . . . . . . . 12

1.2.2 Moments empiriques et leur comportement asymptotique . . . . . . 15

1.2.3 Annualisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.3 Agregation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.3.1 Portefeuille d’un actif . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.3.2 Portefeuille de plusieurs actifs . . . . . . . . . . . . . . . . . . . . . . 19

1.3.3 Pour retrouver un modele gaussien . . . . . . . . . . . . . . . . . . . . 19

1.4 Modelisation statistique : cas general . . . . . . . . . . . . . . . . . . . . . . 21

1.4.1 Echantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.4.2 Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2 Introduction a la theorie du portefeuille 25

2.1 Trace de la frontiere efficiente . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.1.1 Modelisation des preferences des agents . . . . . . . . . . . . . . . . 26

2.1.2 Marche a deux actions . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.1.3 Introduction de l’actif sans risque . . . . . . . . . . . . . . . . . . . . 29

2.1.4 Un exemple numerique . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.1.5 “En bref, ce qu’il faut retenir...” . . . . . . . . . . . . . . . . . . . . 31

2.2 Analyse moyenne-variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.2.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.2.2 Frontiere d’efficience . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.2.3 En pratique : quelques mesures de performance celebres . . . . . . . 35

2.3 Le CAPM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.3.1 Hypotheses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.3.2 Capital Market Line . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.3.3 Modele quantitatif associe . . . . . . . . . . . . . . . . . . . . . . . . 37

2.3.4 Arbitrage Pricing Theory . . . . . . . . . . . . . . . . . . . . . . . . 39

2.4 Faits stylises et efficience . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3

Page 4: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4 TABLE DES MATIERES

2.4.1 Faits stylises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.4.2 Efficience de marche . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.5 Annexe : preuves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.5.1 Demonstration de l’expression de l’allocation du portefeuille optimal 45

2.5.2 Demonstration de l’expression de l’allocation fournissant une va-riance minimale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.5.3 Demonstration de l’expression de l’allocation du portefeuille de marche 46

2.5.4 Demonstration de l’expression du CAPM . . . . . . . . . . . . . . . 47

3 Processus Autoregressifs 49

3.1 Processus AR, MA, ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.1.1 Stationnarite, bruit blanc, operateurs retard . . . . . . . . . . . . . . 49

3.1.2 MA, AR, ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.1.3 Pourquoi ces processus ? . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.2 Estimation et tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.2.1 Fonctions d’autocorrelation : un ”guide” visuel . . . . . . . . . . . . 57

3.2.2 Estimation : quelques generalites . . . . . . . . . . . . . . . . . . . . 60

3.2.3 Tests sur les residus . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

3.2.4 Exemple : test d’efficience de marche . . . . . . . . . . . . . . . . . . 67

3.3 Processus ARCH-GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.3.1 Motivations - Faits stylises . . . . . . . . . . . . . . . . . . . . . . . 69

3.3.2 Presentation theorique . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3.3.3 Tests et estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3.4 Complement : specification du processus . . . . . . . . . . . . . . . . . . . . 75

3.4.1 Choix de l’entier d . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

3.4.2 Choix des entiers p et q . . . . . . . . . . . . . . . . . . . . . . . . . 75

3.4.3 Estimation des parametres . . . . . . . . . . . . . . . . . . . . . . . 76

3.4.4 Validation du modele estime . . . . . . . . . . . . . . . . . . . . . . 77

3.4.5 Prevision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4 Econometrie des produits derives 79

4.1 Marches complets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4.1.1 Non arbitrage et completude . . . . . . . . . . . . . . . . . . . . . . 79

4.1.2 Modele de Black-Scholes . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.2 Inference statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.2.1 Estimation a partir du prix de l’actif sous-jacent . . . . . . . . . . . 83

4.2.2 Application au calcul des prix d’options . . . . . . . . . . . . . . . . 85

4.2.3 Incompatibilite avec la demarche statistique . . . . . . . . . . . . . . 87

4.3 L’effet smile et sa correction . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.3.1 Volatilite implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.3.2 L’effet smile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.3.3 Insuffisance du modele de Black-Scholes . . . . . . . . . . . . . . . . 91

4.3.4 Volatilite stochastique . . . . . . . . . . . . . . . . . . . . . . . . . . 92

4.4 Marches Incomplets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

4.4.1 Formule generale de valorisation . . . . . . . . . . . . . . . . . . . . 94

4.4.2 Reconstruction descriptive . . . . . . . . . . . . . . . . . . . . . . . . 95

4.4.3 Reconstruction structurelle : information asymetrique . . . . . . . . 97

4.5 Complement : Densite des prix d’etat . . . . . . . . . . . . . . . . . . . . . 97

Page 5: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

TABLE DES MATIERES 5

4.5.1 Densite de prix d’etat - State Price Density . . . . . . . . . . . . . . 974.5.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

Page 6: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages
Page 7: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Chapitre 1

Rappels statistiques etmodelisation des rendements

Cette section s’attache a definir des concepts fondamentaux de statistique qui nous se-ront utiles tout au long de ce cours. On procede dans un premier temps a un rappelelementaire de statistique theorique. Dans un second temps nous developperons les basesde la modelisation econometrique des rendements financiers.

1.1 Statistique elementaire

1.1.1 Notion de statistique

Notre modele est constitue au depart d’un ensemble d’observations possibles : X et d’unetribu associee : A. Une statistique est une fonction mesurable S(.), definie sur X. L’en-semble d’arrivee de la fonction S(.) est dependant de cette statistique, il peut par exemples’agir de IRn, muni de la tribu des boreliens associee. Une statistique sert a resumer l’in-formation contenue dans un ensemble d’observations, il s’agit d’une variable aleatoire,eventuellement multi-dimensionnelle.

Exemple simple : on considere n realisations d’une variable aleatoire Xi a valeurs dans[0; 1]. Le couple (mini∈[1;n]Xi,maxi∈[1;n]Xi) est un exemple de statistique.

1.1.2 Notion d’estimateur

Estimation parametrique

Pour que le modele statistique soit complet, on lui ajoute un ensemble de lois de probabi-lites du type IPθ|θ ∈ Θ, indexe par l’ensemble de parametres Θ, dit modele parametrique(par exemple : Θ ⊂ IRd). Le but de la statistique parametrique est d’etudier les realisationsd’une variable aleatoire que l’on pense etre issue d’une loi IPθ, et d’identifier le parametre θ.

Exemple : on peut avoir Θ = IR × IR+, et considerer l’ensemble des lois normales demoyenne m et de variance σ2 : θ = (m,σ2) ∈ Θ. Les lois normales font partie d’unensemble de lois plus general, les lois exponentielles, dont l’importance est capitale enstatistique (estimation aisee, proprietes theoriques utiles, etc.)

7

Page 8: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

8 RAPPELS STATISTIQUES

Estimateurs : biais, precision...

Supposons que l’on dispose de realisations d’une variable aleatoire X issue d’une loi pa-rametrique fθ : on cherche a estimer la valeur de θ. Un estimateur de θ, note le plussouvent θ, est une statistique (donc en particulier une fonction des observations et unevariable aleatoire) qui nous renseigne sur la valeur “la plus probable” de θ au regard desobservations.

Exemple : on considere n realisations d’une variable aleatoire Xi a valeurs dans [0; θ] ouθ ∈ IR. Un estimateur possible de θ est :

θ = maxi∈[1;n]xi.

NB : theoriquement, rien n’interdit de prendre pour estimateur n’importe quelle fonctiondes observations ! Bien sur les cas degeneres n’ont aucun interet : proposer dans l’exempleprecedent pour estimateur de θ la fonction constante (x1, . . . , xn) 7→ 10.28 est toujourspossible mais n’a aucun sens ! Il existe donc des methodes fondees d’estimation, et bienentendu toute une theorie relative a cette estimation pour obtenir l’estimateur le plusconvenable possible.

A ce stade, definissons deux concepts tres importants : le biais et la precision. Rappelonsqu’un estimateur est a son tour une variable aleatoire, et que l’analyse de sa fonctionde densite est de toute premiere importance. En particulier l’evaluation de son momentd’ordre 1 (son esperance) et son moment centre d’ordre 2 (variance) sont tres informatifs.Notons a ce stade que comme l’on dispose de methodes adequates pour donner la formede l’estimateur comme fonction des realisations aleatoires, les calculs evoques peuvent etretheoriques. Ainsi on peut avoir une idee (preexistante a l’obervation) du comportementd’un estimateur. Ceci n’est bien sur possible que parce que l’on suppose au depart uneforme parametrique pour la densite de la variable aleatoire etudiee. Tout ecart dans lecomportement empirique de l’estimateur indiquera qu’il faudrait justement revoir ces hy-potheses, et est a la base de la notion de test, expliquee plus bas.

Le biais de l’estimateur θ de θ est l’ecart entre l’esperance de l’estimateur et le vraiparametre :

Biais = θ − IE[θ].

On dit qu’un estimateur est sans biais lorsque cette quantite est nulle. Cela signifie qu’enmoyenne, si l’on repete un nombre important de fois l’experimentation, la moyenne desvaleurs obenues pour l’estimateur ne devie pas de la vraie valeur. “En moyenne, il ne setrompe pas.”

La precision de l’estimateur est la variance de celui-ci. Un estimateur plus precis qu’unautre a une variance inferieure. Cela signifie que l’estimateur en tant que variable aleatoire,est peu disperse autour de son esperance. En d’autres termes, plus l’estimateur est precis,moins il se trompe “a tous les coups”.

Distance Finie/ Convergence Asymptotique

Remarquons que tout ce que nous venons de developper est relatif a un ensemble d’obser-vations de taille n. En pratique, n ne pourra jamais etre infini. Ainsi, certaines proprietes

Page 9: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.1. STATISTIQUE ELEMENTAIRE 9

peuvent parfois etre acquises pour tout n ∈ IN ou a partir d’un certain rang : on diraalors que l’on se place a distance finie. Lorsque la propriete n’est vraie que lorsque ntend vers l’infini, on parlera de convergence asymptotique. Lorsque l’on parlera parexemple d’estimateur “asyptotiquement normal”, cela signifiera que la loi de l’estimateurconverge en loi vers une loi normale.

NB : on preferera toujours (entre deux estimateurs convergents) un estimateur plus precis :ainsi entre deux estimateurs, si l’un est sans biais a distance finie, et l’autre sans biaisasymptotiquement mais plus precis, on preferera le second.

Rappel : On dit qu’une suite de variables aleatoires (Xn)n∈IN converge en loi vers Xsi pour toute fonction mesurable f , IE[f(Xn)]→ IE[f(X)].

Elle converge vers X presque-surement si IP (w|Xn(w)→ X(w)) = 1

Elle converge vers X en probabilite si ∀ε > 0, on a IP (|Xn −X| > ε)→ 0.

De maniere concise, on pourrait dire que les convergences en probabilite et presque-sures’interessent avant tout aux “causes” des variables aleatoires. La convergence en loi sefocalise non plus sur l’espace des evenements, mais sur les “consequences” des variablesaleatoires.

Estimation par maximum de vraisemblance

Supposons que l’on dispose d’observations (y1, ..., yn) de la variable aleatoire Y issue d’uneloi de densite fθ dependant d’un parametre θ que l’on cherche a estimer. La vraisemblanced’un echantillon est egale a la valeur que prendrait la densite de probabilite de tout levecteur d’observations, prise en l’echantillon, pour un certain θ. Il s’agit avant tout d’unefonction de θ, elle se calcule a echantillon fixe. L’estimation par maximum de vraisem-blance permet surtout de trouver un estimateur qui possede de bonnes proprietes (loiasymptotique facile a obtenir, independance, etc).

Exemple : si les realisations de Y sont independantes les unes des autres, alors la vrai-semblance de l’echantillon s’ecrit :

L(y1, . . . , yn, θ) =

n∏i=1

fθ(yi.)

L’estimateur du maximum de vraisemblance de θ est la valeur de θ qui permet de maxi-miser a echantillon fixe la fonction

θ → L(y1, . . . , yn, θ).

On parle souvent de log-vraisemblance car la foncion logarithme etant croissante, elleconserve le maximum, et lorsque les realisations sont independantes, le passage au loga-rithme fait que les expressions en produit deviennent alors des sommes, les calculs devenantalors plus faciles.

Page 10: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

10 RAPPELS STATISTIQUES

1.1.3 Moments et moments empiriques

Rappelons que le moment d’ordre k ∈ IR d’une variable aleatoire X est la quantite IE[Xk],soit si la variable X possede une densite f(.) par rapport a la mesure de Lebesgue, il s’agitde la quantite : ∫

xkf(x)dx.

On appelle moment empirique d’ordre k d’une variable aleatoire X pour un ensemble derealisations (x1, . . . , xn) la quantite :

1

N

n∑i=1

xki .

Il s’agit a nouveau bien entendu d’une variable aleatoire, fonction des observations. Enpratique, les moments empiriques sont tres utiles pour les problematiques d’estimation.Rappelons par la meme occasion que le moment centre d’ordre k de la variable X s’ecrit :

IE[(X − IE[X])k

].

1.1.4 Independance, correlation et covariance

La vraie definition de l’independance entre deux variables X et Y est la suivante. X et Ysont independantes si pour 1 toutes fonctions f et g on a :

IE[f(X)g(Y )] = IE[f(X)]IE[g(Y )].

Un cas particulier concerne les fonctions affines. Dans ce cas on peut etudier la covariancedes deux variables :

cov(X,Y ) = IE[XY ]− IE[X]IE[Y ].

On peut definir la correlation qui est une normalisation de la covariance :

corr(X,Y ) = ρ(X,Y ) =cov(X,Y )

V[X]V[Y ].

Attention, lorsque deux variables ne sont pas correlees (correlation et covariance nulles)les deux variables ne sont pas independantes pour autant. Un exemple ? Prendre Y = X2

ou X est une variable aleatoire centree de moyenne nulle.

1.1.5 Regression, Moindres carres ordinaires

Le but de l’econometrie est d’etudier des modeles economiques ou financiers en se basantsur une observation statistique, pour identifier et estimer des elements inconnus, tester deshypotheses et si possible faire des predictions. Nous ne presenterons dans ce paragrapheque le modele le plus simple, a savoir le modele de regression lineaire.

Supposons que l’on dispose de n observations d’un vecteur aleatoire Y : (y1, . . . , yn). Ondesire expliquer le comportement de Y grace a K variables explicatives vectorielles : X1,de meme dimension, disposant pour chacune egalement de n donnees. On note pour unY , X1, . . . , XK : y, x1, . . . , xK l’empilement des n variables observees. On designera pare le vecteur constant : e = (1, . . . , 1)′, et on notera x = (e, x1, . . . , xK).

1. en fait, pas techniquement pour toutes...

Page 11: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.1. STATISTIQUE ELEMENTAIRE 11

Definition 1.1.1. L’estimateur des moindres carres ordinaires se definit comme etantle vecteur β de dimension K+1, compose des coefficients de la combinaison lineaire descolonnes de x : e, x1, . . . , xK qui realise le minimum de la distance de y a l’espace vectoriel

de IRN qui est engendre par les colonnes de x au sens de la norme euclidienne.

βMCO = argminβ||y − x× β||2.

On a en particulier la proposition particulierement importante :

Proposition 1.1.1. Si l’on suppose les vecteurs e, x1, . . . , xK independants alors il existeun unique estimateur des moindres carres qui s’ecrit comme :

βMCO = (x′x)−1xy.

Sous cet aspect, il y a certaines consequences sur les proprietes que satisfont alors le vecteurde residus (y − x× β) du modele estime. On peut a l’inverse poser le modele suivant :

Y = X × β′ + ε

ou Y est un vecteur de taille n × 1, X est de taille n ×K, β de taille 1 ×K, ε de taillen × 1. Y est la variable expliquee, X regroupe les K variables explicatives, ε designe lesperturbations. Ayant pose ce modele, on suppose de plus que :– les colonnes de X sont independantes entre elles (X ′X inversible) ;– les perturbations ε sont independantes entre elles et des X, de meme loi et d’esperance

nulle ;

Alors dans ce cas :

β = (X ′X)−1X ′Y .

1.1.6 Tests

La notion de test est importante et assez delicate, car elle demande d’adopter un pointde vue propre a cette theorie. Le but d’un test statistique est de repondre, apresobservation, a une question que l’on s’est pose avant. En aucun cas, il ne s’agitde se demander a quelles conditions l’hypohtese aurait ete acceptee ou refusee,ni de repondre a coup sur a une question.

Le traitement d’un test est disymetrique. On pose d’abord une hypothese. On peut diresi on l’accepte ou si on la refuse. On ne peut pas se demander : “si je rejette l’hypothese,combien de chances ai-je de me tromper ?”

Fondamentalement, la premiere etape est de poser une hypothese et une hypothese alter-native :– H0 : θ ∈ Θ0.– Ha : θ ∈ Θa 6= Θ0.Le test doit specifier cette seconde hypothese. Le niveau du test est la probabilite de rejeterH0 a tort. C’est ce niveau que l’on controle. Il est d’ordinaire de l’ordre de 1, 2, 5, 10% . . . .On fixe ce niveau α avant de proceder au test. Ainsi :

α = IP [rejeter H0|H0 est vraie].

Page 12: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

12 RAPPELS STATISTIQUES

Pour y proceder, on calcule une statistique ξ dite statistique de test dependant des ob-servations. Cette statistique a la particularite de suivre une loi f connue sous H0 (c’estle principe meme du test). On compare ensuite la valeur de la statistiquecalculee a l’aide

l’echantillon, au quantile a (1 − α)% de la loi f : qf(1−α)%. Si cette statistique est pluspetite, H0 est acceptee, sinon refusee. La p-valeur est le niveau minimal du test a partirduquel le test est accepte. Avec un logiciel, si ce dernier fournit une p-valeur plus petiteque le niveau que l’on s’est fixe, le test est accepte.

NB : Il faut bien voir que si l’on effectue une hypothese du type θ = 4, et que le test estaccepte, on pourrait tout aussi bien pour le meme echantillon de test avoir a accepter uneautre hypothese, comme par exemple θ = 3.6 ! Le fait est qu’un test repond a une question :“Au vu des valeurs prises dans l’echantillon, 4 est-elle une valeur plausible pour θ ?” maisne repond aucunement la question a “Quelle est la valeur exacte de θ ?”

1.2 Outils statistiques pour la modelisation des rendementsfinanciers

1.2.1 Hypothese statistique forte

Expression des rendements

On s’interesse a un actif financier echange sur un marche (sur lequel peuvent aussi existerdes actifs illiquides, non echanges). Le rendement de l’actif i sur la periode elementaire[t, t + 1] doit dependre de : la valeur de l’actif en t-1 ; de la valeur de l’actif en t ; eteventuellement des flux lies a la detention de l’actif sur la periode (les dividendes) dont ilfaudra tenir compte dans les etudes empiriques. On parlera alternativement de rentabilite,de rendement, ou de performance. Cette rentabilite sera toujours definie par unite detemps : on parle de rentabilite journaliere, hebdomadaire, annuelle, . . . Deux approchessont possibles, l’une en temps discret, l’autre en temps continu, les deux se traduisant pardes expressions finales de rendements proches et quasiment equivalentes.

Vision en temps discret : a la date t, si pt est le prix de l’actif a la periode t, et sil’actif verse un dividende dt, alors la performance rt s’ecrit :

rt =pt − pt−1

pt−1+

dtpt−1

La premiere partie de cette ecriture est le gain (ou la perte) en capital. La seconde estrelative au taux de dividende. Par exemple, pour une obligation, la partie dt est connue,il s’agit du coupon verse (nul pour une obligation zero-coupon). Pour une action, dt est lavaleur du dividende verse. Pour les obligations comme pour les actions, la valeur de pt estaleatoire. Elle n’est connue pour les obligations que si t correspond a la date d’echeance(remboursement du nominal). Naturellement si aucun flux n’est associe a la detention del’actif, l’expression de la performance devient :

rt =pt − pt−1

pt−1.

B On parlera dans ce cadre de rendements simples ou arithmetiques.

Page 13: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.2. OUTILS STATISTIQUES POUR LA MODELISATION DES RENDEMENTS FINANCIERS13

Vision en temps continu : supposons que l’on se situe a la date u ∈ [t − 1; t]. Surla periode elementaire [u;u + du], si on suppose la performance constante egale a rt sur[t− 1; t], si dpu designe un accroissement elementaire du prix en u, on a :

rtdu =dpupu

.

On peut integrer l’expression entre t− 1 et t, le resultat etant immediat :

rt = ln( ptpt−1

)On parle alors de rendements composes ou geometriques. Les definitions des rentabilitessimples (issu de la vue en temps discret) et composees (issu de la vision en temps continu)sont finalement assez proches, le developpement limite ln(1 + x) ∼ x pour x ∼ 0 nouspermet en effet de voir que pour pt−pt−1

pt−1proche de 0 :

ln( ptpt−1

)= ln

(1 +

pt − pt−1

pt−1

)' pt − pt−1

pt−1.

Exemple : pour illustration, nous donnons ici l’exemple de rendements mensuels etjournaliers.

Figure 1.1 – Prix et rendements mensuels du titre Total entre Janvier 2003 et Aout 2007

Figure 1.2 – Prix et rendements journaliers du titre Alcatel entre Janvier 2003 et Aout2007

Page 14: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

14 RAPPELS STATISTIQUES

Considerons n actifs. On note rt = [r1,t, ..., rn,t]′ l’ensemble des rendements des actifs

consideres. Nous allons effectuer une hypothese dite hypothese statistique forte. His-toriquement et pratiquement, son role est absolument central. Elle peut fondamentalement,paraıtre assez sensee, mais est la plupart du temps infirmee par les etudes empiriques.

Hypothese 1.2.1. Hypothese statistique forteLe vecteur des rendements rt suit une loi gaussienne, d’esperance le vecteur m et de matricede variance-covariance Σ. Les rendements sont identiquement distribues, independantsentre eux au cours du temps.

On ne travaille jamais sur les prix : on n’aurait jamais d’hypothese d’independancesur les prix. En effet, les prix d’une periode sur l’autre (surtout si cette derniere est courte)sont souvent d’un niveau comparable, si l’on suppose les trajectoires de prix continues, ilserait irrealiste de penser que les prix sont independants les uns des autres au fil du temps.

Cette hypothese sert deux objectifs : definir un cadre theorique dont on puisse aisementestimer les parametres, et faciliter le calcul des lois des portefeuilles constitues de plu-sieurs actifs. Le vecteur m correspond a l’esperance des rendements, performance moyenneesperee. Σ correspond a la dispersion des rendements, c’est le risque lie a la detention del’actif. L’avantage de la modelisation gaussienne est qu’avec la donnee de ces deux premiersmoments, toute la loi est alors connue. La nature gaussienne des rendements apparaıt biensouvent comme inadequate aux praticiens mais reste historiquement l’une des premierestentatives de modelisation du comportement des actifs. C’est pourquoi la moyenne et lavariance des rendements (deux premiers moments de la loi gaussienne definissant la tota-lite de la loi) restent les principales quantites d’interet dans une premiere approche. Unepartie de son succes est probablement la facilite avec laquelle elle se manipule, s’agrege(cette loi fait partie de la famille plus large des familles parametriques exponentielles),et sa nature de loi limite dans certains cas (estimateurs du maximum de vraisemblanceen particulier). Nous verrons dans un premier temps comment cette hypothese permet dederiver statistiquement des proprietes asymptotiques pour les estimateurs obtenus. En-suite, nous examinerons comment avec les memes lois et outils statistiques simples (loigaussienne) nous pourrons nous ecarter de ce cadre pour complexifier la dynamique desactifs.

Considerons le cas d’un seul actif. Dans le cas des rendements simples : l’hypothese setraduit pour l’actif i a la date t,

ri,t =pi,t − pi,t−1

pi,t−1∼ N (mi, σ

2i,i)

soit encore :pi,t ∼ N (pi,t−1 + pi,t−1mi; p

2i,t−1σ

2i,i).

Mais sous l’hypothese gaussienne, les prix peuvent etre negatifs. Dans le cas des rendementscomposes on a pour l’actif i ln(pi,t) = ln(pi,t−1) + (mi + σi,iεi,t) d’ou :

pi,t = pi,t−1 exp(mi + σi,iεi,t).

Les prix sont ainsi log-normaux et la loi log-normale ayant pour support les reels positifs,cette definition est dans le cadre gaussien la plus naturelle pour les rendements. Cecis’apparente egalement au cadre de Black et Scholes comme nous le verrons plus tard.

Page 15: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.2. OUTILS STATISTIQUES POUR LA MODELISATION DES RENDEMENTS FINANCIERS15

1.2.2 Moments empiriques et leur comportement asymptotique

Nous avons precise d’ou viennent les raisons historiques qui ont pousse a regarder les deuxpremiers moments de la distribution de rendement. A ce stade, nous ne supposerons pasque cette distribution est gaussienne, mais nous pouvons nous contenter de supposer queles deux premiers moments existent : la moyenne m et la matrice de variance Σ. Noussupposerons de plus que les realisations des rendements sont independantes entre elles.Nous n’effectuerons pas d’hypothese sur la specification de la loi des rendements, qui neseront donc pas forcement gaussiens pour le moment.

On cherche dans ce paragraphe a estimer les parametres m et Σ puis a evaluer la qualitede cette estimation. On notera Σ = (σ2

i,j)i,j ; σ2i,j,T et Σ designeront les estimateurs pour

un ensemble de T observations. De meme mT sera un estimateur de m.

Moyenne Empirique

Definition 1.2.1. La moyenne empirique de l’echantillon (r1, . . . , rT ) est

mT =1

T

T∑t=1

rt.

Pour un actif i donne on a :

E[miT ] =

1

T

T∑t=1

E[rit] = mi et V[miT ] =

1

T 2

T∑t=1

V[rit] =σ2i

T.

Les valeurs rt sont des realisations entre 0 et T de la variable aleatoire qu’est le rendementmensuel de l’actif considere. Ces realisations sont issues d’une loi d’esperance m. Cepen-dant, n’y ayant pas acces, nous sommes tenus de l’estimer par la moyenne empirique mT ,qui est un estimateur, et donc aussi une variable aleatoire. Elle possede donc elle aussides moments : une esperance E[mT ] = m, et une variance V [m] = σ2/T . La moyenneempirique a une esperance egale a m : l’estimateur est donc sans biais. Cependant, nousn’avons pas non plus acces a la valeur σ qui ne pourra a son tour qu’etre estimee par σcomme moment empirique d’ordre deux de la distribution des rendements mensuels. Ainsi,si avec les donnees, nous pouvons avoir acces a une realisation de la variable aleatoire mT ,et pour avoir connaissance de la variance de l’estimateur, nous n’avons acces qu’a uneestimation de la variance de cet estimateur : V [m] = σ2/T .

Si l’on a ce stade suppose de plus que les rendements suivent une loi gaussienne, on obtientla proposition suivante qui donne la loi precise des estimateurs.

Proposition 1.2.1. Sous l’hypothese statistique forte, mT suit une loi gaussienne demoments :

E[mT ] = m et V[mT ] = T−1Σ.

Matrice de Variance Empirique

Σ est la matrice de variance-covariance de la serie rt (qui est la matrice des moments centresd’ordre 2). Cette variance est toujours definie par unite de temps : elle est journaliere,hebdomadaire, annuelle, . . .

Page 16: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

16 RAPPELS STATISTIQUES

Definition 1.2.2. La matrice de variance empirique de l’echantillon (r1, . . . , rT ) est :

σ2ij,T =

1

T

T∑t=1

(ri,t − mi,T )(rj,t − mj,T ) et ΣT =1

T

T∑t=1

(rt − mT )(rt − mT )′.

Dans le cas precedent, on avait acces aux moments de l’estimateur moyenne empiriquea distance finie. En supposant les rendements gaussiens, on pouvait meme specifier la loiexacte de l’estimateur, toujours a distance finie. Ici il est plus difficile d’obtenir une loi adistance finie car ΣT est une matrice dont les coefficients sont contraints par une conditionde symetrie. Meme en supposant les rendements gaussiens, obtenir une loi a distance finiepour la matrice de variance empirique reste difficile. Dans un souci de simplicite, on sedoit alors de quitter le cadre a distance finie pour passer au cadre asymptotique.

Comportement asymptotique des moments empiriques

Proposition 1.2.2. Sous l’hypothese statistique forte :i) les estimateurs m et Σ sont convergentsii) ils sont asymptotiquement independants, normaux et sans biaisiii) leurs variances asymptotiques ont pour expression :

Vas[√T (m−m)] = Σ

Vas[√T (σ2

ii − σ2ii)] = 2σ4

i,i

ou a et b sont deux vecteurs de RN

On remarque a ce point de l’analyse que la precision (i.e. la variance de l’estimateur)des estimateurs mT et de ΣT est une fonction de Σ. C’est a ce niveau que l’hypothesede rendements gaussiens est encore necessaire, elle nous permet d’obtenir une expressionsimplifiee de la variance. Sans celle-ci, asymptotiquement, on aurait encore la normalitedes estimateurs mais pas un calcul aise des moments.

En resume, l’hypothese essentielle a formuler reste l’independance des rendements et l’ho-mogeneite des moments au cours du temps. On accede ainsi aux moments de l’estimateurd’esperance a distance finie, et a la loi asymptotique de l’estimateur de variance. L’hy-pothese statistique forte permet en plus d’obtenir la loi a distance finie de l’estimateurd’esperance, et les moments de la loi asymptotique de l’estimateur de variance.

1.2.3 Annualisation

Les donnees qui peuvent nous etre presentees peuvent etre de sources et de naturesdifferentes. A des fins de comparaison cependant, nous devons definir un moyen de compa-rer des rendements et des volatilites sur un meme horizon. L’usage est de ramener l’etudea l’echelle de l’annee et de proceder a ce que l’on apelle l’annualisation.

Supposons que l’on dispose de rendements simples journaliers (r1, . . . , rT ). Pour obtenirl’estimateur de rendement annualise ma

T , il faut calculer l’estimateur mT puis le multiplierpar la quantite α :

maT = α× ma

T

Page 17: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.3. AGREGATION 17

ou α est une quantite dependant de la base d’annualisation choisie et de la frequence dedonnee disponible. Par exemple, avec des donnees journalieres α sera egal a la plupart dutemps a 250, 252, voire 360 ou 365. Ce chiffre n’est important que lorsqu’il est precise,car il s’agit avant tout d’une convention. Dans le cas des donnees journalieres, il s’agit dechanger d’echelle et de passer de donnees disponibles tous les jours, a une estimation dela moyenne “pour l’annee”, bien que l’on etudies des realisations quotidiennes des rende-ments, en multipliant par le nombre de jours ouvres ou par le nombre de jours total. Si l’ondisposait de donnees mensuelles, il suffirait de prendre α = 12 pour obtenir la quantitedesiree. Le nombre alpha est donc un rapport entre deux echelles temporelles.

Concernant la volatilite, il suffit de multiplier la grandeur σ estimee par la racine du memecoefficient α choisi pour les rentabilites :

σaT =√α× σaT .

Donnons une intuition de l’origine de cette convention. Considerons un ensemble de prixde T+1 prix : p0, . . . , pT . Avec des rendements logarithmiques, l’estimateur de l’esperance(en donnees journalieres) est tel que :

m =1

T

T−1∑i=0

ln(pi+1

pi

)=

1

Tln( T−1∏i=0

pi+1

pi

)=

1

Tln(pTp0

).

Le mode d’annualisation ne depend en aucun cas du nombre de donnees disponibles. Pourune annee de 250 jours ouvrables, on annualise l’esperance de rendement en multipliant lesmoyennes empiriques des rendements par 250. Pour la volatilite annualisee, on multiplieles ecarts-types empiriques par

√250.

Exemple : on considere les rendements mensuels du titre Total entre Aout 2006 etJuillet 2007 :

Date Aou06 Sep06 Oct06 Nov06 Dec06 Jan07

Rendement −1, 31% −1, 80% 2, 51% 1, 58% 1, 26% −5, 08%

Date Fev07 Mar07 Avr07 Mai07 Juin07 Juill07

Rendement −1, 53% 2, 82% 3, 83% 2, 83% 7, 30% −3, 31%

La moyenne de cet echantillon est de 0.76%, ce qui multiplie par 12 (base mensuelle ramenea un horizon annuel) nous donne un rendement moyen annualise de 9.12%. L’ecart-typede l’echantillon est de 3.31% ce qui multiplie par

√12 donne une volatilite annualisee de

11.47%.

1.3 Agregation

Nous nous interessons au comportement statistique au cours du temps, des portefeuillessimples ou composes. Nous exposerons l’incidence des diverses hypotheses sur les rende-ments des actifs, et comment elles se transmettent lorsqu’on agrege ces actifs au sein d’unmeme portefeuille. Nous complexifierons au fur et a mesure le cadre d’etude (une/plusieuresperiodes, un/plusieurs actifs) pour exposer les differences statistiques qui appraissentlorsque notre vue porte sur des portefeuilles de plus en plus complexes.

Page 18: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

18 RAPPELS STATISTIQUES

1.3.1 Portefeuille d’un actif

On considere un investissement realise dans un unique actif i, sans reajustement, sur uneperiode de detention H differente de l’unite de temps, entre les dates t0 et t0 +H. Precisiond’importance, l’investissement est considere dans un premier temps en quantites et non enproportion du montant investi. Nous considererons des rendements geometriques et effec-tuerons l’hypothese de stationnarite : les caracteristiques de l’investissement ne dependentde la periode qu’ a travers H.

Expression des prix et rendements : soit a la quantite d’actif i achetee en t0 pourun prix total P (a, t0) = api,t0 . En fin de periode la valeur du portefeuille est P (a, t0 +H) = api,t0+H . Puisque l’on considere des rendements geometriques, on a alors l’ecrituresuivante :

P (a, t0 +H)

P (a, t0)=

pi,t0+H

pi,t0+H−1× . . .× pi,t0+1

pi,t0= exp

[ t0+H∑u=t0+1

yi,u

].

La rentabilite geometrique par unite de temps relative a la quantite a pour u ∈ [t0; t0 +H] :dP (a, u) = r(i, t0, t0 + H)P (a, u)du. En integrant cette expression entre t0 et t0 + H onobtient :

r(i, t0, t0 +H) =1

Hln(P (a, t0 +H)

P (a, t0)

)=

1

H

t0+H∑u=t0+1

yi,u.

L’evolution des prix est alors la suivante :

ln(pi,t0+H) = ln(pi,t0) +[ t0+H∑u=t0+1

yi,u

].

Sous l’hypothese statistique forte :i) le rendement par unite de temps de l’actif i, relativement a la periode [t0, t0 + H] suitune loi gaussienne

r(i, t0, t0 +H) ∼ N (mi,σ2i

H)

ii) le prix pi,t0+H suit une loi log-normale :

ln(pi,t0+H) ∼ N (ln(pi,t0 +miH

), Hσ2

i )).

B Ce qu’il faut retenir : detenir l’actif, sans modifier le portefeuille, est equivalentpour une meme rentabilite, a diminuer la variance par unite de temps lorsque le temps dedetention augmente. Intuitivement, ceci s’explique par la loi des grands nombres : lorsquel’horizon d’investissement devient de plus en plus grand, en agregeant les valeurs, les aleasse compensent car ceux-ci sont independants.

La propriete ii) est a rapprocher du modele de Black et Scholes de drift quelconque etde volatilite σi puisque l’on retrouve un modele log-normal pour les prix. Il signifie aussiqu’a un seuil α de confiance fixe, la valeur finale P (a, t0 +H) du portefeuille se situe dansun intervalle dont la demi-longueur est croissante en H. Cette demi-longueur est egale aq1−αN (0,1)

√Hσi ou q1−α

N (0,1) est le quantile a 1− α% d’une loi normale centree reduite.

Page 19: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.3. AGREGATION 19

1.3.2 Portefeuille de plusieurs actifs

On considere un investissement realise dans plusieurs actifs indexes de 1 a n, sans reajustement,sur une periode de detention egale a H, toujours differente de l’unite de temps, entre t0et t0 + H. L’investissement est la encore vu en quantites, a etant desormais un vecteur :a = (a1, . . . , an)′. Nous considererons toujours des rendements geometriques et effectue-rons toujours une hypothese de stationnarite.

Expression des prix et rendements A la date initiale t0, le portefeuille a pour valeurP (a, t0) = a′pt0 =

∑ni=1 aipi,t0 . A la date t0 + H on aura P (a, t0 + H) = a′pt0+H =∑n

i=1 aipi,t0+H . La rentabilite geometrique par unite de temps sur la periode, r(a, t0, t0+H)satisfait alors :

r(a, t0, t0 +H) =1

Hln(a′pt0+H

a′pt0

)=

1

Hln[ n∑i=1

αi,t0eH×r(t0,t0+H)

].

Cette expression depend des ponderations initiales de chaque actif dans le portefeuille :

αi,t0 =aipi,t0a′pt0

On remarque qu’il n’y a aucune raison pour que r(a, t0, t0 + H) soit gaussienne ou queV (a, t0 +H) ait une loi log-normale.

BCe qu’il faut retenir : lorsque les quantites investies sont constantes, meme sous l’hy-pothese statistique forte, le caractere gaussien n’est pas conserve par agregationau sein d’un portefeuille de plusieurs titres. Dans cette situation on peut seulement fairele calcul des deux premiers moments de la valeur finale P = P (a, t0, t0 +H). La donnee deces deux moments ne suffit plus a caracteriser la loi de P car nous avons perdu l’aspectgaussien.

1.3.3 Pour retrouver un modele gaussien . . .

On considere un investissement realise dans plusieurs actifs indexes par i = 1, . . . , n, sansreajustement, sur plusieurs periodes. On envisagera toujours l’investissement en quantites :a = (a1, . . . , an)′. On effectue cependant une hypothese forte sur les rendements simples(on ne les considerera plus comme geometriques dans ce paragraphe).

Hypothese 1.3.1. Hypothese forte sur les rendements simples :

yi,t =pi,t − pi,t−1

pi,t∼ N (µ,Ω).

Nous supposons desormais que les moments des lois des rendements actifs consideres nedependent pas de l’actif : tous suivent la meme loi. Cette hypothese est tres restrictive,elle va cependant nous permettre d’obtenir certaines proprietes statistiques.

Page 20: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

20 RAPPELS STATISTIQUES

Portefeuille de plusieurs actifs sur une periode : pour un portefeuille contenantles quantites a = (a1, . . . , an)′, sa valorisation est alors :

P (a, t0 + 1) = a′pt0+1 =

n∑i=1

aipi,t0(1 + yi,t0).

On est ici assure de la normalite de la valeur du portefeuille. car contrairement au casprecedent, la loi suivie par les rendements des actifs est la meme, c’est cette homogeneitequi nous fournit la normalite. Il nous suffit alors de calculer les moments pour totalementcaracteriser la loi. Dans la suite nous noterons les ponderations initiales de chaque actifdans le portefeuille :

αi,t0 =aipi,t0a′pt0

.

Proposition 1.3.1. Sous l’hypothese statistique forte 1.3.1 :

– i) le rendement par unite de temps du portefeuille suit une loi gaussienne :

r(a, t0, t0 + 1) ∼ N (α′t0µ, α′t0Ωαt0).

– ii) la valeur du portefeuille a horizon 1 conditionnellement a pi,t0 suit une loi gaus-sienne :

P (a, t0 + 1) ∼ N(P (a, t0)[α′t0(e+ µ)], P (a, t0)2α′t0Ωαt0

).

On obtient une loi des rendements qui contrairement a la loi de la valeur du portefeuille,n’est pas conditionnelle. Notons µT l’estimateur de µ et Ω les estimateurs de µ et Ω telsque nous les avons definis auparavant.

Proposition 1.3.2. Sous l’hypothese statistique forte :

– i) α′t0 µT et α′t0ΩTαt0 sont asymptotiquement independants

– ii) leurs lois ont pour expression :

α′t0 µT ∼ N(α′t0µ,

1

Tα′t0Ωαt0

).

α′t0ΩTαt0 ∼ N(α′t0Ωα′t0 ,

2

T(α′t0Ωαt0)

)2.

B Nous etendrons plus loin ces resultats mais retenons pour le moment que la diversi-fication d’un portefeuille (incorporation de diverses sources d’alea dans un portefeuille,plusieurs actifs par exemple) peut avoir un reel interet.

Cas general : portefeuille de plusieurs actifs, plusieurs periodes : lorsque l’etudeporte sur un horizon superieur a l’unite de temps, les calculs deviennent considerablementplus difficiles. Pour un actif i on a alors :

pi,t0+H

pi,t0=

pi,t0+H

pi,t0+H−1× . . .× pi,t0+1

pi,t0= (1 + yi,t0+H)× . . .× (1 + yi,t0).

Page 21: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.4. MODELISATION STATISTIQUE : CAS GENERAL 21

A priori un produit (et non une somme !) de H variables gaussiennes independantescomme l’expression precedente n’a pas de raison d’etre lui meme une loi gaussienne, la loiobtenue n’est pas simple. Seul le calcul de ses deux premiers moments est envisageable.

1.4 Modelisation statistique : cas general

Les proprietes des moments empiriques et leur interpretation se trouvent notablementmodifiees lorsque ne sont plus satisfaites certaines hypotheses. Nous nous attacherons danscette section a examiner les consequences de l’absence de l’hypothese d’echantillonnage,et de l’hypothese de normalite.

1.4.1 Echantillonnage

Definition

Hypothese 1.4.1. On nommera hypothese d’echantillonnage le fait qu’une serie tem-porelle soit issue de tirages independants de meme loi.

On se placera dans le cadre asymptotique, mais il est important de noter que l’hypothesegaussienne n’est pas formulee.

Moment et variance empirique

Proposition 1.4.1. Sous l’hypothese d’echantillonnage :

– i) Les estimateurs mT , ΣT de m et Σ sont convergents et asymptotiquement normaux ;

– ii) Vas

[√T (mT −m)

]= Σ ;

– iii) les estimateurs mT , ΣT sont asymptotiquement independants des que la loi des ren-dements est symetrique ;

– iv) la variance asymptotique de ΣT depend de Σ et des queues de distribution.

Les resultats obtenus sont assez similaires a ceux obtenus dans le cadre gaussien. Ce-pendant la precision de l’estimateur de variance depend du comportement des queuesde distribution. Lorsque la taille de l’echantillon est trop faible pour utiliser un cadreasymptotique, on peut utiliser la technique dite de bootstrap. Elle consiste a partir desT observations, a construite une distribution empirique FT , et d’y effectuer S × T ti-rages. Pour chaque jeu de replication s ∈ [1;T ] on calcule l’estimateur ms

T . La distributionempirique des ms

T donne un estimateur a distance finie de mT

Skewness et Kurtosis empirique

Definition 1.4.1. Considerons la loi de Xi d’esperance mi et de variance σ2i,i.

Le skewness est le moment centre d’ordre 3 :

Sk = E

[(Xi −mi

σi,i

)3]=

E[(Xi −mi)

3]

σ3i,i

.

Page 22: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

22 RAPPELS STATISTIQUES

Le kurtosis est le moment centre d’ordre 4 :

κ = E

[(Xi −mi

σi,i

)4]=

E[(Xi −mi)

4]

σ4i,i

.

Proposition 1.4.2. On dispose des estimateurs empiriques suivants :

Ski,T =1

T

T∑t=1

(ri,T − mi,T )3

σ3i,i,T

.

κi,T =1

T

T∑t=1

(ri,T − mi,T )4

σ4i,i,T

.

Interpretation

Le skewness est nul pour des lois symetriques, donc en particulier dans le cas gaussien.Une valeur positive du skewness indique que la distribution est asymetrique et se trouvedecalee vers les valeurs positives. A contrario un skewness negatif signale que la distribu-tion est decalee vers les valeurs negatives.

Le kurtosis est egal a 3 dans le cas d’une loi gaussienne. Souvent, on definit le kurtosispar l’excess kurtosis qui est la valeur κ− 3 et on en regarde le signe. Une valeur negativeest signe de distribution piquee. A l’inverse, une valeur superieure a 3 est caracteristiqued’une loi plus etalee que la loi gaussienne. Le kurtosis est donc un indicateur d’etalement.En general, dans le cas des rendements boursiers, on observe des valeurs de κ superieuresa trois. On parle de distribution leptokurtique, signe que les queues des distributions em-piriques des rendements observes ont des queues plus epaisses que celles qu’on observeraitsi la distribution etait gaussienne (dans le cas contraire on parle de distribution platykur-tique). En d’autres termes, les evenements constitues par des rendements eleves en valeurabsolue “ne sont pas si rares.” La modelisation gaussienne n’est donc peut-etre pas tresbien adaptee, dans la mesure ou elle sous-estime la probabilite d’occurence des rendementsimportants (negatifs ou positifs).

1.4.2 Stationnarite

On leve ici l’hypothese d’independance, et on accepte que les rendements aient un compor-tement dynamique. Les rendements observes peuvent donc dependre des valeurs passees.

Hypothese 1.4.2. Stationnarite au second ordreSoit (yt) une serie des rendements, on dit qu’elle est stationnaire au second ordre si laloi du couple (yt, yt+h) depend du decalage h mais pas de t. En particulier, l’esperance derendement est independante du temps, tout comme la fonction d’autocovariance de la seriequi ne depend que du decalage considere :

E[yt] = m et Γ(h) = Cov(yt, yt+h).

Proposition 1.4.3. Sous l’hypothese de stationnarite au second ordre de la dynamiquedes rendements :

Page 23: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

1.4. MODELISATION STATISTIQUE : CAS GENERAL 23

– i) les estimateurs mT , ΣT de m et Σ sont convergents et asymptotiquement normaux ;

– ii) la variance asymptotique a pour expression :

Vas

[√T (mT −m)

]=

∞∑h=−∞

Γ(h).

Page 24: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

24 RAPPELS STATISTIQUES

Page 25: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Chapitre 2

Introduction a la theorie duportefeuille

Qu’attendre de ce chapitre...

Nous allons definir dans ce chapitre le cadre de l’analyse moyenne-variance. 1. En un sens,cette section etend les resultats du paragraphe 1.3.3 dans la mesure ou nous utiliseronsles concepts d’esperance de rendement et de volatilite pour modeliser les preferences desagents. Nous allons presenter dans le cadre de l’analyse moyenne variance le concept defrontiere d’efficience.

En un mot, si l’on “croit” en les modeles presentes au cours de ce chapitre, et que l’on sebase sur une modelisation de type moyenne-variance, on peut retenir l’idee simple suivante.Pour obtenir dans un marche “actions” avec un actif sans-risque, un rendement par unitede risque maximal, on doit investir dans un “portefeuille de marche” (qu’il nous restera adefinir). C’est l’idee centrale sous-jacente au CAPM. Le CAPM est une theorie developpeepar Sharpe a partir des annees 60 qui a rencontre bon nombre de detracteurs mais dont leprincipe est important a connaıtre. Les critiques formulees ou les theories concomittantesau CAPM sont en tout cas tout aussi nevralgiques pour la culture financiere commune.

Mais commencons par la definition des preferences au sens de Markowitz et la qualificationde la frontiere efficiente.

2.1 Trace de la frontiere efficiente

La representation d’une frontiere efficiente est plus parlante lorsque l’on procede a uneanalyse simplifiee d’un marche a deux actions.

1. On parlera souvent d’analyse “moyenne-variance” cependant les plans de representation auront leplus souvent pour axe des abcisses la volatilite, et pour axe des ordonnees le rendement.

25

Page 26: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

26 THEORIE DU PORTEFEUILLE

2.1.1 Modelisation des preferences des agents

On cherche a modeliser les preferences (subjectives) d’un agent representatif 2, pour quan-tifier son ”bien-etre” a travers une fonction u(.) de sa richesse que nous noterons X.La fonction u doit etre croissante (eventuellement strictement), et concave. Cela signifieque l’utilite marginale d’une unite supplementaire de richesse decroıt avec X. Si X estaleatoire, l’agent va chercher, a une richesse initiale donnee X0, a maximiser l’esperancesous la probabilite reelle de sa richesse a une date future T :

maxX0

E[u(XT )]

Utilite exponentielle : Placons nous dans le cas particulier d’une utilite exponentielleu(x) = 1− exp(−γx), qui satisfait aux conditions prealablement enoncees : le parametre γest le coefficient d’aversion au risque de l’agent. Pour completer le modele precedent nousdevons supposer une dynamique pour l’evolution de la richesse entre 0 et T . On supposeraqu’a la date T , la richesse XT est i.i.d. et suit une loi normale de moyenne mX et devariance σ2

X , XT ∼ N (mX , σ2X). On a alors :

E[u(XT )] = 1−E[exp(−γX)] = 1− exp(−γmX +1

2γ2σ2

X)

D’ou :

maxX0

E[u(XT )] =⇒ max(mX −1

2γσ2

X)

On est donc ramenes a un cadre d’etude moyenne-variance. Il y a un lien direct entre laconcavite de la fonction d’utilite et l’aversion au risque. A moyenne constante on prefereratoujours un portefeuille atteignable dont la variance sera minimale. La variance est doncl’expression que l’on retient du risque. Plus la variance du portefeuille est grande plusle risque qui lui est associe est important. De plus a variance fixee, on preferera toujoursle portefeuille offrant le rendement le plus important 3. Nous sommes donc dans un cadrequi est equivalent a celui de Markowitz, developpe dans la section precedente.

2.1.2 Marche a deux actions

Nous n’avons pas restreint jusqu’a present le nombre d’actifs de notre marche. Nous allonsnosu limiter ici a l’etude fine du cas a deux actifs. On etudie deux actifs X et Y sur unmeme horizon, et on suppose que tous les agents ont les memes anticipations (homoge-neous beliefs). On note RX , RY les rendements aleatoires supposes gaussiens de X et Y ,on notera ρ leur correlation lineaire :(

RXRY

)∼ N

[(RXRY

),

(σ2X ρσXσY

ρσXσY σ2Y

)]2. On renverra vers des cours relies a l’approche par esperance d’utilite qui est une theorie bien plus

generale. On ne s’interessera ici qu’au message sous-jacent et aux conclusions relatives a l’optimisationmoyenne-variance.

3. NB : Dans un graphique moyenne variance, les lignes d’iso-utilite sont les lignes telles quemX− 12γσ2

X∗est une constante.

Page 27: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.1. TRACE DE LA FRONTIERE EFFICIENTE 27

On fait de plus l’hypothese suivante que l’on ne peut pas choisir l’un ou l’autre des deuxactifs a priori :

RX < RY et σ2X < σ2

Y

Comme il n’y a pas d’ordre total dans IR2, une telle hypothese nous dit que si l’actif Ya un rendement espere superieur a celui de X, il n’en est pas moins risque. Y n’est paspreferable a X (et reciproquement) sans autre critere que la donnee de leurs deux premiersmoments. De plus on considere notre portefeuille investi en proportions : (1 − a, a) ou aest la proportion investie en Y , et on suppose que a ∈ [0; 1] : l’action ne peut pas etrevendue a decouvert. Notant Ra le rendement aleatoire de notre portefeuille ainsi constitue,de moyenne ma et de variance σ2

a, on aura Ra = aRY + (1− a)RX et ainsi :ma = aRY + (1− a)RXσ2a = a2σ2

Y + (1− a)2σ2X + 2a(1− a)ρσXσY

ma = aRY + (1− a)RX

σ2a = a2σ2

Y + (1− a)2σ2X + 2a(1− a)ρσXσY

Trace dans un plan (σ,m) l’ensemble des portefeuilles obtenus pour a ∈ [0; 1] est untroncon d’hyperbole.

Exemple : en figure 2.1 en est donne un exemple pour deux actifs X et Y tels queles rendements moyens valent : RX = 2.6% et RY = 3.8% et les volatilites σ2

X = 5% etσ2Y = 30%.

Figure 2.1 – Portefeuilles admissibles en fonction de la correlation dans le plan (σa,ma)

−→ Si ρ = 1 :

σ2a = (aσY + (1− a)σX)2 = (σX + a(σY − σX))2)

Page 28: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

28 THEORIE DU PORTEFEUILLE

−→ Si ρ = −1 :

σ2a = (aσY − (1− a)σX)2 = (−σX + a(σY − σX))2)

Rappelons que toute cette modelisation decoule des hypotheses que nous avons formulesur la richesse et les preferences des agents .

Portefeuille de variance minimale

Un parametre d’interet est le portefeuille de variance minimale, qui s’obtient en minimisantσ2a. Sa ponderation est :

a =σ2X − ρσXσY

σ2X + σ2

Y − 2ρσXσY(2.1)

Une demonstration est donnee dans la section 2.5.2. Le portefeuille de ponderation a d’ex-pression donnee par l’equation 2.6 est tel que pour a quelconque dans [0; 1] la variance duportefeuille de ponderation a est superieure ou egale a celle du portefeuille de ponderationa. Pour a < a, les portefeuilles sont de variance superieure et de rendement espere inferieur.Pour a > a, les portefeuilles sont de variance superieure mais de rendement espere plus im-portant. On voit donc que les portefeuilles de ponderation inferieure a a sont plus risqueset moins rentables, ils n’ont donc pas d’interet. On definit alors la frontiere efficientequi est l’ensemble des portefeuilles admissibles c’est a dire qu’elle correspond dans le plan(m,σ) aux portefeuilles de ponderation a ∈ [a; 1].

La Diversification

Le point le plus important dans ce qui a ete expose auparavant, est la necessite dediversifier : lorsqu’on ajoute dans un portefeuille exclusivement compose de X, un peud’action Y, le premier effet est de diminuer la variance donc le risque du portefeuille,bien que l’on ait σY > σX . Cependant la frontiere efficiente ne decrit que les portefeuillesadmissibles, atteignables et coherents avec un critere moyenne-variance. Lesagents choisissent leur ponderation selon leurs preferences et se deplacent ainsi sur cettefrontiere. Pour calculer dans ce cadre les ponderations d’un portefeuille optimal, il nousfaut specifier une fonction d’utilite, propre a l’agent.

Considerons la fonction d’utilite : u(x) = 1−exp(−γx) dont la maximisation en esperancerevient a la maximisation de m − 1

2γσ2, comme exprime dans le paragraphe 2.1.1. Le

portefeuille optimal pour l’agent est celui qui permet d’obtenir dans le plan (σ2,m) unecourbe d’utilite (relative a ses preferences personnelles) tangente a la frontiere efficiente(les portefeuilles atteignables).

a∗ = a+RY − RX

γ(σ2Y + σ2

X − 2ρσXσY )(2.2)

Une demonstration est disponible en section 2.5.1. L’expression de la ponderation en Ydu portefeuille optimal decroıt avec γ : ce resultat est attendu car γ quantifie l’aversionau risque, et plus celle-ci est grande, plus la possession en Y qui est l’actif le plus risque,est faible.

Page 29: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.1. TRACE DE LA FRONTIERE EFFICIENTE 29

Generalisation

En fait, en absence d’un actif sans risque, quand le nombre d’actif est plus important, lafrontiere efficiente garde cette forme de portion d’hyperbole, comme enveloppe convexedes portefeuilles admissibles dans le plan. Le portefeuille de variance minimale n’est passi innocent car il joue un peu le role du portefeuille sans risque vu comme extremite decette hyperbole. Voir ? pour le detail des calculs en quantites.

2.1.3 Introduction de l’actif sans risque

On incorpore desormais dans notre modele a deux actifs, un actif de rendement certain(ou risk-free) Rf , et on suppose que l’on peut vendre a decouvert (position short). Danscette nouvelle situation, on s’interesse a l’evolution de la frontiere efficicente.

On envisage tout d’abord le marche fictif constitue de l’actif sans risque et d’une actionA, et on considere le portefeuille constitue de ces deux actifs de ponderation a en action,1− a en actif sans risque. Dans le plan (σ,m), l’ensemble des portefeuilles parametres para est une demi-droite, d’origine le point (0, Rf ) :

a ponderation en action synthetique A (decomposee en aM en actif Y , 1−aM en actif X),1− a en actif sans risque.

Ra = aRA + (1− a)Rfσ2a = a2σ2

A

Desormais nous prendrons en compte le deuxieme actif, si bien que notre marche se com-pose de deux actifs risques X et Y (on gardera les memes notations qu’a la sectionprecedente). L’ensemble des portefeuilles admissibles ne se situe plus cette fois sur unehyperbole : chaque point de l’hyperbole definit un portefeuille (intermediaire) qui est luimeme ponderable vis a vis de l’actif sans risque. Le portefeuille compose de deux actifsrisques peut donc etre vu comme un actif risque synthetique.

Proposition 2.1.1. L’ensemble des portefeuilles admissibles dans le nouveau marcherepresente dans le plan (σ,m) est le cone de sommet l’actif sans risque (0, Rf ), et quipasse par tous les points de l’hyperbole des portefeuilles admissibles du marche a deuxactifs risques.

Le cone des portefeuilles admissibles est alors presente en 2.2 pour les memes actifs queprecedemment, avec un taux fixe Rf = 2.1% et une correlation ρ = −0.4.

Ainsi il existe une demi-droite d’angle maximal par rapport a l’axe des abscisses, c’estla demi-droite d’origine l’actif sans risque et tangente superieurement a l’hyperbole. Lanouvelle frontiere efficiente est cette demi-droite car a variance fixee, c’est surcette demi-droite que se trouve le portefeuille atteignable de rendement espere maximal.Il est important de noter que cette demi-droite est la meme pour tous les agents,independamment de leurs preferences : leur fonction d’utilite les fait la encore sedeplacer le long de la demi droite. Tous les agents devraient donc posseder le memeportefeuille en action, la quantite relative d’actif sans risque dependant seulede leur utilite.

Page 30: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

30 THEORIE DU PORTEFEUILLE

Figure 2.2 – Portefeuilles admissibles (cone grise) avec actif risque dans le plan (σa,ma)

On peut donc resumer ceci par le fait qu’a l’equilibre, dans un marche pret-emprunt, toutagent detient une part d’un meme portefeuille de marche, optimal, dont l’information surla composition est identique pour tous. L’indice CAC40 est un exemple de portefeuillede marche. C’est aussi l’essence du theoreme de separation des fonds de Tobin etMarkowitz.

Theoreme 2.1.1. Le theoreme de separation des fonds de Tobin et Markowitzpoursuit cette analyse et stipule que pour les investisseurs moyenne-variance, tous lesportefeuilles efficients sont des combinaisons de l’actif sans risque et d’un portefeuilleparticulier. Quoiqu’immerges dans un marche plus riche, tous les portefeuilles efficientssont senses se construire a partir de ces deux “ fonds”, a savoir l’actif sans risque etl’actif synthetique tangent. Tous ne different que par leur ponderation en actif sans risque,dependant de leur aversion au risque.

On pouvait se douter de cette conclusion ! En effet, etant donnee l’allocation α∗ opti-male derivee dans la premiere section (cf supra). On voit que les poids en actifs risquessont en fait homothetiques les uns des autres en fonction de l’aversion au risque : aun facteur de proportionnalite pres il s’agit donc du meme portefeuille, caracterise parα∗ = 1

A0Ω−1[µ − (1 + rt)e] ou A0 = e′(Ω−1[µ − (1 + rt)e]) permet de normaliser l’ex-

pression et α0 = 0. On rajoutera enfin que de maniere plus generale il peut etre montreque la somme de deux portefeuilles efficients reste un portefeuille efficient. Enfin, il existeune version du theoreme de separation des fonds (version dite theoreme de separation desfonds de Black) en l’absence de l’actif sans risque. Dans ce cas, le portefeuille de varianceminimale remplace l’actif sans risque dans l’interpretation.

Attention ! Cette conclusion (la frontiere efficiente avec un actif sans risque est unedroite) semble en contradiction avec le premier paragraphe de ce chapitre (ou l’on obtenaitune parabole). Les deux approches qu’elles soient menees en valeur ou en quantites sontidentiques, mais ne different que dans la mesure ou l’on travaille soit dans le plan volati-

Page 31: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.1. TRACE DE LA FRONTIERE EFFICIENTE 31

lite/rendement (droite) ou dans le plan variance/rendement (parabole).

Portefeuille de marche Nous cherchons desormais a connaıtre precisement la composi-tion de ce portefeuille de marche. Nous noterons aM la ponderation en Y de ce portefeuille,1−aM etant par consequent celle en X (il s’agit du portefeuille synthetique en actions). Ceportefeuille peut etre considere comme une action synthetique, et est pondere a hauteurde a∗ en quantite, le reste etant investi en actif sans risque. Son esperance de rendementsera notee RM et sa volatilite σM .

Finalement on trouve une expression qui ne depend pas de l’aversion au risque γ :

aM =(RY − RX)σ2

X + (RX −Rf )(σ2X − ρσXσY )

(RX −Rf )(σ2X + σ2

Y − 2ρσXσY ) + (RY − RX)(σ2X − ρσXσY )

2.1.4 Un exemple numerique

On considere les deux actifs X et Y tels que mX = 2.6% et mY = 3.8%, ainsi que σ2X = 5%

et σ2Y = 30%. On suppose que leur correlation est ρ = −40% et que le taux sans risque

est de Rf = 2.1%. Alors le portfeuille de marche est de composition aM = 43.32%. Onobtient le graphe de la figure 2.3.

Figure 2.3 – Frontiere efficiente dans le plan (σa,ma)

2.1.5 “En bref, ce qu’il faut retenir...”

– Le cadre moyenne-variance definit une typologie d’investisseurs qui different par leuraversion au risque.

Page 32: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

32 THEORIE DU PORTEFEUILLE

– Dans ce cadre, on ne peut pas toujours determiner pour n’importe quel couple de por-tefeuilles, lequel est preferable. Efficient = aucun portefeuille n’est a coup sur preferable.

– L’approche par quantites et par poids sont equivalentes et menent aux meme conclusions.– En l’absence d’actif sans risque, la frontiere efficiente est une hyperbole, enveloppe

convexe des portefeuilles admissibles.

– Quand on rajoute l’actif sans risque, cette frontiere devient une droite (avec la volatiliteen abcisse car si c’est la volatilite, c’est une parabole). Elle est tangente a l’enveloppeprecedente en un portefeuille particulier, portefeuille de marche.

– Qu’il y ait ou non un actif sans risque, les portefeuilles efficients sont toujours sommede deux portefeuilles efficients particuliers et reciproquement. Si actif sans risque il y ac’est un de ces deux portefeuilles, sinon ce sera le protefeuille de variance minimale.

– En quantites ou en poids, l’allocation optimale sera homogene au produit de l’inversed’une matrice de variance-covariance et d’un vecteur de rendements particulier.

2.2 Analyse moyenne-variance

Reprenons le meme probleme sous d’autres termes. Cette section presente le cadre d’ana-lyse moyenne-variance en quantites investies et s’inspire tres fortement de la modelisationde ?, choisie pour son exhaustivite et sa precision. Une presentation en francais, en pro-portions, et probablement plus didactique est disponible dans ?. Le principe ne changecependant pas pour autant et est une reprise theorique des concepts presentes auparavant.

2.2.1 Principe

Nous nous placons a la date t, et l’on cherche a definir une strategie d’investissement surla periode a venir [t; t+ 1]. Le montant investi sur cette periode est note wt. Sur le marcheexiste un actif sans risque de rendement connu rt, ainsi que n actifs risques, de rendementsaleatoires yi,t+1 = 1 + ri,t. On fait l’hypothese suivante sur ces rendements :

Hypothese 2.2.1. Conditionnellement a l’information disponible a la date t, les quantitesyi,t+1 sont d’esperance µ et de variance Ω.

Remarquons que nous n’effectuons pas d’hypothese sur la nature de la loi des rende-ments (bien que ne fixer que les deux premiers moments soit historiquement relie a lamodelisation gaussienne comme nous l’avons precedemment exprime). On notera IEt et Vtles operateurs d’esperance et de variance conditionnels a l’information disponible en t.

Un portefeuille est caracterise par un vecteur de quantites d’investissement : (a0, a1, . . . , an),ou a0 est l’investissement en actif sans risque, a = (a1, . . . , an) l’investissement en actifsrisques. Le portefeuille est compatible avec le montant initial investi si : a0 + a′pt = wt.On note pt le vecteur de prix des actifs risques a la date t. A la date t + 1 la valeur duportefeuille est :

Vt+1(a0,a) = a0(1 + rt) + a′diag(pt)yt+1

ce qui en incluant la contrainte de de budget initiale, fournit :

Vt+1(wt, a) = wt(1 + rt) + a′diag(pt)[yt+1 − (1 + rt)e]

Page 33: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.2. ANALYSE MOYENNE-VARIANCE 33

Ainsi :

IEt[Vt+1(wt, a)] = wt(1 + rt) + a′diag(pt)[µ− (1 + rt)e] (2.3)

Vt[Vt+1(wt, a)] = a′diag(pt)Ωdiag(pt)a (2.4)

Definition 2.2.1. Soient deux portefeuilles de meme valeur initiale, de caracteristiques :

(a(1)0 , a(1)) et (a

(2)0 , a(2)). Pour un investisseur de type “moyenne-variance”, (a

(1)0 , a(1)) est

preferable a (a(2)0 , a(2)) si :

– IEt[Vt+1(a(1)0 , a(1))] ≥ IEt[Vt+1(a

(2)0 , a(2))]

– Vt[Vt+1(a(1)0 , a(1))] ≤ Vt[Vt+1(a

(2)0 , a(2))]

Il n’existe pas de relation d’ordre total dans IR2 : sans autre critere, un portefeuille estdonc preferable a un autre si son rendement espere a la periode suivante est superieur,et ce avec un risque inferieur, modelise par la variance. Toute autre consideration appellel’introduction d’un critere supplementaire impliquant par exemple une aversion au risquequi quantifie la maniere dont l’investisseur est pret a accepter plus de risque pour un ren-dement plus eleve.

La donnee des moments ne suffit pas a caracteriser la loi de la valeur du portefeuille ent + 1, il faudrait pour cela specifier la loi des rendements 4. Si ce n’est pas le cas (ce quiserait trop restrictif), pour qu’un investisseur dit “moyenne-variance” puisse comparerdeux portefeuilles, il est alors necessaire de definir une relation d’ordre faisant intervenirces deux moments ; mais il est difficile d’integrer plus d’information. Intuitivement, oncomprend bien cependant que l’esperance de rendement est un proxy de la performance“pure” d’un portefeuille, et que la variance est une premiere tentative de modelisation durisque d’un portefeuille.

2.2.2 Frontiere d’efficience

Revenons au cadre moyenne-variance (ou alternativement dans la suite rendement-risque).On represente d’ordinaire les portefeuilles dans un plan moyenne-variance. Ce point de vueequivaut a considerer chaque portefeuille comme un objet statistique, caracterise par sonesperance et sa variance (relativement a une unite de temps). On voit que dans ce plan,tous les portefeuilles ne seront pas dignes d’interet.

Definition 2.2.2. La frontiere d’efficience est l’ensemble des portefeuilles qui ne sont pasdomines au sens de la relation d’ordre definie en 2.2.1.

On voit que comme deux parametres sont libres (esperance et variance), on ne peutdeterminer cette frontiere qu’a partir d’un montant initial w et en contraignant le niveaude risque comme etant egal a v. Les portefeuilles efficients sont donc ceux de rendementmaximal pour un niveau de risque fixe. Ainsi, il faut trouver le vecteur a tel que :

maxaIEt[Vt+1(w, a)] sous contrainte Vt[Vt+1(w, a)] = v

Ayant toujours les expressions de 2.3 et 2.4, on peut ecrire le Lagrangien du probleme :

L = IEt[Vt+1(w, a)]− A

2Vt[Vt+1(w, a)− v]

4. C’est du reste l’avantage de la loi gaussienne, totalement connue des que l’on dispose de ses deuxpremiers moments.

Page 34: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

34 THEORIE DU PORTEFEUILLE

L’exploitation de la condition du premier ordre donne la proposition suivante :

Proposition 2.2.1. La frontiere efficiente est constituee par les portefeuilles dont la com-position en actif risque a∗ est :

a∗ =1

Adiag(pt)

−1Ω−1[µ− (1 + rt)e]

Le multiplicateur de Lagrange A, est contraint par le niveau de variance accepte v quiest le niveau de risque auquel on se place pour l’etude. Lorsque v tend vers zero, A tendvers l’infini, ce qui signifie que l’aversion au risque du detenteur du portefeuille augmente.Lorsqu’au contraire, v tend vers l’infini, A tend vers zero, ce qui signifie que l’investisseurtend vers la neutralite au risque. Enfin la quantite d’actif sans risque est determinee parla contrainte de budget : a∗0 = w − a∗pt.

Lorsque v varie, on se deplace schematiquement sur l’axe de variance. Pour une valeur dev correspond une valeur de A, et un portefeuille (portefeuille atteignable, de rendementmaximal, le seul a etre non domine par les autres portefeuilles). A parametrise donc lafrontiere efficiente. On a l’esperance et la variance (dependant de A) qui sont alors (enremplacant a par a∗ dans 2.3 et 2.4) :

m(A) = w(1 + rt) +1

A[µ− (1 + rt)e]

′Ω−1[µ− (1 + rt)e]

σ2(A) =1

A2[µ− (1 + rt)e]

′Ω−1[µ− (1 + rt)e]

En utilisant ces deux equations, on peut eliminer A et des lors obtenir une expressiondirecte liant le rendement espere et la variance des portefeuilles de la frontiere efficiente :

σ2 =[m− w(1 + rt)]

2

[µ− (1 + rt)e]′Ω−1[µ− (1 + rt)e]

Proposition 2.2.2. Dans le repere moyenne-variance, la frontiere efficiente est representeepar une demi-parabole de sommet le portefeuille sans risque, et de courbure liee a la quan-tite :

[µ− (1 + rt)e]′Ω−1[µ− (1 + rt)e]

qui est la performance de Sharpe du marche.

La performance de Sharpe du marche est la norme des exces de rendements par rapporta l’actif sans risque relativement a la metrique Ω. Nous avons vu que dans le cas general,il etait difficile de classer deux portefeuilles quelconques. Nous devons donc etendre lanotion de performance, presentee auparavant pour les actifs financiers, et trouver un critereagrege, scalaire, pour resumer la notion de performance du portefeuille. Elle doit doncmeler la prise en compte du risque et celle du rendement.

Definition 2.2.3. La performance de Sharpe d’un portefeuille a, a la date t est definiepar :

S∗t (a) =[a′diag(pt)[µ− (1 + rt)e]]

2

a′diag(pt)Ωdiag(pt)a

Page 35: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.2. ANALYSE MOYENNE-VARIANCE 35

On peut montrer que la performance de Sharpe d’un portefeuillle efficient est egale a celledu marche exprimee a la proposition 2.2.2.

Considerons un portefeuille investi a hauteur de a0 en actif sans risque, et a en actif risque,et definissons a la date t :

St(a0, a) =[IEt[Vt+1(a0, a)]]2

Vt[Vt+1(a0, a)]

Supposons que l’on cherche a qui permettre de maximiser St(a0, a) et notons a∗ la solu-tion de ce probleme. Notons v∗ le niveau de variance atteint par ce portefeuille : v∗t =Vt[Vt+1(a0, a

∗)]. Le portefeuille a∗ maximise donc IEt[Vt+1(a0, a)]]2 sous contrainte queVt[Vt+1(a0, a

∗)] = v∗t . Le portefeuille a∗ est donc un portefeuille efficient. Le critere deperformance defini ci-dessus est pratique car il agrege a la fois la notion de risque et cellede performance. Malheureusement, on ne peut caracteriser qu’un portefeuille efficient, etnon toute la frontiere efficiente car on s’est place a nieau de variance fixe.

Conclusion : cette construction reste tres generaliste. On pourra trouver dans d’autrespresentations une approche en deux temps ou on ne considere dans un premier temps queles actifs risques et on rajoute dans un second l’actif sans risque. Il est aussi frequent detravailler en proportions plutot qu’en quantites. Dans ce cas, les formules pour l’allocationoptimale sont inchangees pour a∗ qui devient α∗ mais ou le facteur d’aversion au risqueest contraint par le niveau de variance tolere, mais on a de plus α0 + e′α∗ = 1.

2.2.3 En pratique : quelques mesures de performance celebres

Il existe differentes mesures utilisees en pratique pour attester de la performance et “clas-ser” entre eux des actifs financiers (fonds, actions, etc.). Supposons donc que nous dispo-sions d’une serie de rendements (r1, . . . , rT ). La premiere mesure, qui decoule de ce quivient d’etre dit est le Sharpe Ratio :

Sharpe Ratio =(IE[R]− r)√

V[R]

qui est donc egal a l’excedent de l’esperance de rendement par rapport au taux sans risque,divise par l’ecart-type de la loi de rendements du portefeuille (si l’on prend un taux sansrisque constant sur la periode). On trouvera aussi souvent utilise le Sortino Ratio dont ladefinition est :

Sortino Ratio =R−RCDR

ou RC est un rendement cible pour la strategie consideree, et DR est le downside risk eten notant f la densite de la loi de rendements :

DR =

√∫ RC

−∞(RC − u)2f(u)du.

Enfin on voit de plus en plus l’emergence de mesures de performance basees sur unequantite statistique nommee L-Moments, mais qui depasse le cadre de ce cours. On pourrase referer pour cela a ?.

Page 36: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

36 THEORIE DU PORTEFEUILLE

2.3 Le CAPM

Originellement, le Capital Asset Pricing Model (CAPM - MEDAF pour l’affreux acronymefrancais pour Modele d’Evaluation Des Actifs Financiers) a ete developpe par WilliamSharpe des les annees 60. Il a recu pour cela le prix Nobel en 1990. A ce titre, il est conseillede lire son Nobel Prize lecture ou il detaille son approche au grand public (voir ?). Le butdu CAPM est de s’interesser aux aspects centraux de l’equilibre dans les marches de capi-taux. Sa proposition centrale, comme detaille au-dessus, est que le portefeuille de marcheest efficient au sens de Markowitz. De nombreuses ameliorations et versions existent et ontete proposees. Lintner, Brennan, Merton, Black, Kraus, Breeden, Rubinstein, Litzenbergeront ainsi travaille sur le sujet au cours des annees 70 et 80.

2.3.1 Hypotheses

Commencons par le jeu d’hypothese elementaire necessaire a l’elaboration du modele. Onsuppose :

1. les investisseurs n’ont pas d’autre choix d’investissement que d’investir dans les stockset l’actif sans risque ;

2. il n’y a pas de taxe ;

3. on peut vendre a decouvert sans restriction ;

4. tous les investisseurs s’accordent sur une meme vue et une meme estimation desrisques et des rendements ;

5. les investisseurs ont des preferences de type moyenne-variance.

On notera que les deux dernieres hypotheses sont excessivement restrictives et restent deshypohteses fortes mais qui permettent de relativiser la portee du modele. Une nuance seglisse alors (et c’est Sharpe qui le souligne) : alors que les modelusations des preferencesde Markowitz sont normatives, le CAPM se veut descriptif. Cette distinction s’illustrenotamment dans le fait que le CAPM suppose que les investisseurs suivent les preferencesde type Markowitz. La force de cette modelisation, bien que simple et “myope” (myopicen anglais - c’est a dire que l’optimisation se fait periode par periode) est de capturerl’essentiel de l’objet d’itneret des investisseurs (risque et rendement).

Quantitativement, l’essentiel qu’il y a a retenir du modele est qu’a l’equilibre (lorsquel’offre rencontre la demande), il existe une relation lineaire entre les primes de risque desstocks et du marche. En d’autres termes, l’esperance de rendement des stocks est unefonction lineaire de leurs beta (voir plus bas), et ces beta suffisent a decrire ces esperancesau niveau global.

Dans ce qui precede, nous avons vu que l’analyse moyenne variance conduit a une analyseaffine des portefeuilles, qu’elle soit avec ou sans actif sans risque, et ce via le theoreme despearation des fonds. On peut considerer que le CAPM etend cette vision pour passer al’analyse individuelle des fonds et actions.

Page 37: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.3. LE CAPM 37

2.3.2 Capital Market Line

Revenons un peu en arriere et considerons un marche constitue de N actions. On noteR = (R1, ..., RN ) leur vecteur de rendement et leur matrice de variance-covariance Σ =(Σi,j)i,j∈[1;N ] = (ρi,jσiσj)i,j∈[1;N ]. Un portefeuille est un ensemble de poids w = (w1, ..., wn)qui sont des allocations pour chaque titre. Son rendement est alors RN = w′ · R et sa va-riance VN = w′ · Σ · w. La frontiere efficiente est plus difficile a obtenir que dans le cas adeux actions comme auparavant, elle est cependant solution du probleme de minimisationsuivant :

minw

w′ · Σ · w

sous les contraintes : w′ · 1 = 1w′R = µ

On cherche la encore a minimiser la variance de notre portefeuille a esperance de rende-ment donnee.

On complete ensuite le marche par un actif sans risque (pret/emprunt) de taux Rf . L’en-semble des portefeuilles admissibles est dans le cone de sommet (0, Rf ) et passant partous les points de l’hyperbole. Le cone est delimite superieurement par la capital marketline tangente a la frontiere efficiente, qui est l’ensemble des portefeuilles optimaux sur lemarche incluant Rf . Elle est tangente au troncon d’hyperbole en wM , ponderation corres-pondant au portefeuille de marche. Tout les agents ont donc la meme allocation en action,caracterisee par wM , qui est connu par observation de tout le marche, par observation despositions de tous les agents. Si Vi designe la capitalisation boursiere de l’actif i, alors lacomposante correspondante du portefeuille wM est donnee par

(wM )i =Vi∑Nj=1 Vj

Ce qui differencie les agents est leur position sur cette “capital market line“. Des que del’actif sans risque est utilise avec le portefeuille de marche (qui rappelons le peut etrevu comme une action synthetique), on se place sur cette droite (alors que si tout estplace en actions, on se deplacera uniquement sur l’hyperbole). Ceci introduit une nouvelleproblematique qui est de savoir quel est le comportement d’une action vis a vis du marche.

2.3.3 Modele quantitatif associe

Le CAPM est directement issu du cadre de pensee qui precede mais se focalise plus parti-culierement sur la vision d’une action individuelle plongee au sein du marche. Soit i uneaction donnee, et examinons le sous-marche compose de cette action i, du portefeuille demarche M donne precedemment, et de l’actif sans risque Rf . On supposera que a designela ponderation en action relative a l’actif i, et de fait 1 − a etant la ponderation en leportefeuille de marche M . Son rendement et sa matrice de variance sont :

Ra = a(Ri − RM ) + RM et Σ =( σ2

i ρiMσiσMρiMσiσM σ2

M

)

Page 38: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

38 THEORIE DU PORTEFEUILLE

Σ =( σ2

i ρiMσiσMρiMσiσM σ2

M

)Pour alleger les notations on notera σi,M = ρiMσiσM . On obtient (voir la demonstrationen 2.5.4) le modele suivant :

Ri = RF + (RM −RF )σiMσ2M

(2.5)

Nous obtenons un modele de rendement moyen par l’intermediaire de l’expression del’exces de rendement :

Ri −RF︸ ︷︷ ︸exces de rendement sur i

= (RM −RF )︸ ︷︷ ︸exces de rendement sur M

σiMσ2M︸︷︷︸

coefficient βi

Le coefficient βi est tres important, il est la plupart du temps designe comme etant lebeta de l’action par rapport au marche. Il relie les deux exces de rendement et quantifiela sensibilite de l’action par rapport au marche.

Le point important de ce modele est que l’on considere une action face au marche et qu’ilpermet de justifier la demande de titre par d’autres composantes que le rendement. Onpeut reecrire l’equation precedente sous la forme :

Ri −RFρiMσi

=RM −RF

σM

Le terme RM −RF /σM est la prime de risque du marche. Le terme Ri−RF /ρiMσi signifieque la prime de risque est payee a hauteur de ρiMσi < σi ce qui signifie que le marche neremunere pas toute la variance. La partie non remuneree (qui est (1−ρiM )σi) est la partienon correlee au marche, elle est appelee variance specifique. Elle est dite diversifiablecar au sein d’un portefeuille compose d’un grand nombre d’actions, ce terme disparaıt enmoyenne.

Illustration

Si on prend un rendement gaussien et que l’on considere un modele de rendement aleatoire :

Ri = RF + (RM −RF )σiMσ2M︸ ︷︷ ︸

risque systematique

+(√

(1− ρ2iM )σ2

i εi

)︸ ︷︷ ︸

risque specifique

ou εi ∼ N (0, 1)

remunere par la prime de risque, et le risque specifique est diversifiable, non remunere, etindependant du marche. Comme la somme des risques specifiques sur l’ensemble des titress’annule en esperance ils n’apparaıtront pas par la suite.

On notera que l’on pourrait tout a fait envisager un coefficient βi negatif ce qui signifieraitque le rendement de l’action i est inferieur a celui de l’actif sans risque. On pourrait penserqu’il y a un paradoxe a premiere vue, si un tel titre a un rendement faible, on pourraitpenser qu’elle ne soit pas cotee. Or elle fait effectivement partie du marche, compte des

Page 39: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.3. LE CAPM 39

actionnaires, et fait partie du portefeuille de marche. Une action de ce type est en fait tresrecherchee car elle permet de diminuer la variance du portefeuille (NB : un tel titre estappele super-diversificateur). Si l’action etait seule dans le marche elle disparaıtrait. Maisimmergee dans l’ensemble du marche, elle contribue a diminuer la variance globale. Ellediminue le risque du portefeuille d’ou la demande pour cette action.

Security Market Line

Dans le plan (β, R) le CAPM prevoit que tous les couples (Ri, βi) sont sur une droitepassant par les points (0, RF ) et (1, RM ). On nomme cette droite security market line.

La realite est qu’il y a la possibilite d’un leger ecart au CAPM. On achete les actionssituees au dessus de cette droite (les rendements effectifs sont superieurs aux previsions duCAPM). Ceci cree une demande, ce qui signifie que le prix augmente, donc le rendementdiminue. On peut effectuer le raisonnement inverse pour les actions situees en dessous. Enconclusion, on retrouve le CAPM comme un modele d’equilibre. Sharpe reprecise que leCAPM relie les esperances de rendement au risque de marche et non au risque total.

2.3.4 Arbitrage Pricing Theory

Sharpe distingue egalement les motivations des differents modeles economiques de valo-risation d’actifs : certains utilisent le cadre de l’esperance d’utilite, d’autres le principed’arbitrage. Nous avons vu auparavant le premier aspect ; le second implique que les prixdes actifs se forment de sorte a corriger les imperfections du marche et a faire disparaıtreles arbitrages (un arbitrage etant un gain strictement positif a cout nul et ce avec uneprobabilite differente de zero).

C’est aussi le theme de l’Arbitrage Pricing Theory : due a Stephen Ross en 1976, l’APTstipule que l’esperance de rendement d’un actif financier peut etre modelise comme unefonction lineaire de divers facteurs : ces facteurs sont des variables macro-economiques oudes indices de marche theoriques. L’idee initiale de Ross etait de proposer une alternativeau CAPM. Ainsi pour un actif i :

E[Ri] = rf + βi,1I1 + ...+ βi,nIn

ou rf est le taux sans risque et les Ii sont les primes de risque des differents indices, c’est adire leur esperance de rendement corrigees du sans-risque. Moins restrictif que le CAPM,ce modele n’est pas “statistique” mais veut resolument “explicatif”. On voit facilementque le CAPM peut etre vu comme un cas particulier de l’APT. Mais contrairement auCAPM, l’APT ne “revele” pas de maniere endogene le nombre et la nature des facteurs dumodele qui peuvent donc varier d’un etude a l’autre. Quels sont ces facteurs ? Ils peuventetre des taux d’interet courts ou longs, les rendements des commodities (petrole, matierespremieres, metaux), de l’or, des taux de change, des indices de type action, etc.

Enfin, rappelons un element important. Les β du CAPM et de l’APT se ressemblentmais philosophiquement, ce n’est pas tout a fait la meme chose. Comme dans l’APT, enregressant les rendements d’un actif sur un rendement d’indice de marche, on obtiendraune estimation statistique du β du CAPM. Mais dans le modele du CAPM, le β est issud’une vue probabiliste ex ante des rendements futurs.

Page 40: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

40 THEORIE DU PORTEFEUILLE

2.4 Faits stylises et efficience

De nombreux articles de recherche (voir en particulier les papiers de ? et ?) infirment leshypotheses et les conclusions du CAPM. Un des principaux problemes est que le porte-feuille de marche est difficile a definir. Les tests qui decoulent de l’utilisation d’un proxypour le portefeuille de marche sont forcement partiels car un tel proxy ne peut se substituera une notion complete de “marche”.Au dela, on peut s’interesser aux faits stylises observes sur les marches. Diverses lecturesvous seront particulierement utiles pour apprehender ces phenomenes. En particulier onpourra citer ?, ou ?.

2.4.1 Faits stylises

Les references sont nombreuses, selon que l’on s’interesse aux faits empiriques des rende-ments, des volumes, des marches de taux, des marches de produits derives, de la frequenced’observation, etc. Nous ne pourrons donc par la suite que donner un apercu incomplet deces faits stylises. Mais tout d’abord il convient de definir ce qu’est un fait stylise. Un faitstylise est une propriete statistique, empirique, frequemment observee, dans des conditionsde marche usuelles (...quoique nous definissions par pour autant ce qu’est une conditionusuelle de marche !). Cependant, il ne releve pas d’une verite absolue et il est toujourspossible d’observer des “contre-exemples” dans des conditions de marche differentes.

Non-gaussianite

Le premier fait stylise remarquable est la non-stationnarite (definie au chapitre precedent)des series financieres. En effet, leurs proprietes statistiques evoluent au fil du temps et nesont pas constantes.

En premier lieu, l’hypothese de log-normalite des rendements (les rendements logarith-miques suivent une loi normale, comme suppose par une dynamique de Black-Scholes parexemple) est fausse et non verifiee en pratique. Losque l’on observe la distribution desrendements, il s’avere que les queues de ces distributions sont plus epaisses que ce quesupposerait une loi log-normale. Ceci se verifie en calculant l’exposant de queue eq desdistributions. Sa definition pour une variable aleatoire Y est la suivante :

eq = supqq ∈ IR|IE[Y q] < +∞

Une distribution a queue epaisse est obtenue lorsque cet exposant est fini. Cela signifie quela decroissance de la distribution dans les queues est equivalente a une loi de puissance 5.Enfin les distributions empiriques des rendements sont asymetriques et leptokurtiques.

Le fait stylise le plus important de cette section tient certainement dans le fait que “lesevenements rares ne le sont pas tant !” Cependant, l’echelle temporelle de calculdes rendements reste importante car ces proprietes peuvent fortement en dependre. Ainsilorsque le pas de temps augmente entre l’observation de deux prix pour le calcul des ren-dements, on peut dire que schematiquement ces derniers tendent a devenir “de plus enplus gaussiens”.

5. Lorsque cette decroissance s’effectue comme une fonction exponentielle, on est dans le cas d’unedistribution a queue legere et l’exposant de queue est infini.

Page 41: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.4. FAITS STYLISES ET EFFICIENCE 41

Memoire longue et correlations

On appelle phenomene de memoire longue le fait que lorsqu’on calcule l’auto-correlationd’une serie de rendements eleves au carre ou pris en valeur absolue, cette correlation al’ordre h decroisse comme :

Γ(h) ∼ ch−α

ou α prend souvent une valeur faible, typiquement de l’ordre de 0.2 ou 0.4.

Entre actifs, la correlation inter-stocks semble augmenter dans les periodes de fortes vo-latilites. De plus, lorsque l’on regarde la matrice de variance-covariance des actifs, uneanalyse de son spectre montre que peu de valeurs propres s’averent informatives et quela majorite peut s’apparenter a du bruit. Pour ce type d’etude, la theorie des matricesaleatoires (random matrix theory en anglais) est de plus en plus utilisee.

Volatilite et “Volatility Clustering”

De nombreux faits stylises ont ete mis a jour sur la volatilite (nous supposerons ici, poursimplifier que la volatilite est calculee comme etant l’ecart-type des rendements). Un pre-mier fait stylise parfois souligne est par exemple la correlation qui peut exister entre lavolatilite et les volumes.

Un phenomene celebre sur les marches reste sans conteste le “volatility clustering” (unetraduction possible en francais etant accumulation des volatilites). Ceci traduit qu’en pra-tique les periodes de volatilite faible, forte, ou moyenne, s’accumulent par “paquets”. Cespaquets, ou “clusters” n’ont cependant pas de longueur typique ou caracteristique.

Un autre fait stylise celebre sur la volatilite est l’effet de levier. Ceci traduit le fait que lesrendements sont negativement correles avec les variations de leur volatilite. La volatiliteaugmente suite a des rendements negatifs (de mauvaises nouvelles) mais diminue dans lecas contraire. Nous reviendront plus tard sur ce fait stylise qui motive notamment l’utili-sation du modele de Heston.

2.4.2 Efficience de marche

“The supposed omniscience and perfect efficacy of a free market stems from economicwork in the 50s and 60s, which with hindsight looks more like propaganda againstcommunism than a plausible scientific description.” (J.P. Bouchaud - ?)

Une definition malaisee

L’efficience des marches est a la fois une hypothese necessaire pour bon nombre de developpementstheoriques (telle que la valorisation des options), un postulat de bon sens, une supposi-tion inverifiable et... un concept fondamental pourtant difficilement definissable ! Il estimperatif d’en connaıtre les bases meme si l’efficience est un aspect de marches de plusen plus mis a mal par les faits comme par les theories. Le but de cette section n’est pasde convaincre le lecteur du bien fonde de ces hypohteses, ni de prendre position (encoreque...) mais juste de les exposer, ainsi que le cheminement qui a permis d’y arriver. Tentez

Page 42: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

42 THEORIE DU PORTEFEUILLE

dans un premier temps de considerer l’efficience en tant que concept.

En substance, l’hypothese des marches efficients (efficient markets hypothesis en anglais)suppose que les prix de marches refletent a tout instant toute l’information disponible.Les premieres contributions theoriques sur l’efficience de marche datent de 1900 et des tra-vaux de Bachelier. Elles trouveront un echo dans les etudes empiriques de Cowles (1933).

En 1965, les travaux de Paul Samuelson marquent le debut de la theorie moderne. Ladefinition statistique d’un marche efficient est malaisee. On peut dire dans un premiertemps qu’un marche financier est efficient si les mouvements de prix sont imprevisibles,des que l’on incorpore dans la prevision l’ensemble des informations de tous les partici-pants. Cette propriete est cependant difficile a tester en pratique.

Eugene Fama reprend ce formalisme dans ses travaux en 1963, 1965 puis 1970 : il developpeles tests d’efficience, en s’efforcant de resoudre le debat entre analyse technique et analysefondamentale. Il donne la definition precisee ci-dessus, stipulant qu’un marche est efficientsi les prix a la date t refletent l’ensemble de l’information disponible a la meme date. Il estalors necessaire de definir un modele donnant le prix theorique en fonction de l’information.

Un corollaire de bon sens mais quelque peu contre-intuitif est que les opportunites d’ar-bitrage ne sont pas sensees exister en pratique dans un mache efficient. En effet, ellesdisparaissent aussitot que les agents les reperent et les exercent, utilisant toute informa-tion potentiellement en leur avantage. Lorsque ces corrections s’effectuent instantanement,on dit que le marche est “sans friction” (frictionless en anglais).

Tests d’efficience

“Pour transformer un perroquet en analyste financier averti, il n’y a qu’un pas,l’arbitrage.” (Stephen Ross)

En pratique, il est difficile de tester l’efficience. On etend donc l’efficience au corollairesuivant : il est impossible de faire des profits, si l’on utilise pour notre investissement lameme information que le marche. Ceci est la base de nombreux travaux empiriques surl’efficience des marches.

Dans une premiere approche, les tests envisages peuvent se baser sur les resultats desstrategies employees, a savoir les profits engendres par les intervenants professionnels. Sile gerant ou le trader bat invariablement le marche, alors c’est que le marche n’est pas effi-cient pour l’information de l’intervenant. L’avantage immediat de cette vision est que l’onse base sur des donnees reelles et clairement observables. Sa limite est la definition precisede ce qu’est l’information du gerant ou du trader, qui n’a toujours pas ete precisementmathematiquement definie.

On peut aussi choisir de proceder a des tests bases sur des strategies fictives qui utilisentune information specifique. Le probleme du choix de l’ensemble d’information se pose alors(les prix passes ? un ensemble d’information publique ? d’information privee ?) La limite estalors que l’on utilise seulement pour notre analyse des comportements fictifs, non observes.

Page 43: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.4. FAITS STYLISES ET EFFICIENCE 43

Une limite qui peut cependant etre formulee a ces definitions est qu’elles ne font pas clai-rement la distinction entre le mecanisme qui permet d’aboutir a la formationdes prix, et le contenu effectif de “l’information” utilisee. Tout test sur l’efficiencede marche devrait en theorie prendre cela en compte.

Critiques

Sans aller jusqu’a un test sophistique, des decalages, des ecarts, et des opportunites d’ar-bitrage s’observent en permanence sur les marches. Lorsque des agents la reperent, il tentede l’exercer. Finalement, lorsque cette “inefficacite” est portee a la connaissance des agentsau desavantage desquels elle se fait, cette opportunite disparaıt ou est en theorie corrigee.Mais quelle peut-etre l’origine de tels decalages ?

Tout d’abord, les agents reagissent peut-etre de maniere idiosyncratique et/ou inappro-priee a l’information (performance positive ou negative, selon l’aversion au risque, crash-o-phobia). Ensuite, les effets de ces decalages peuvent eventuellement etre attenues parla presence de frictions, c’est a dire les latences, procedures et frais de transaction. Deplus, les agents peuvent croire qu’ils voient de l’information la ou il n’y en a pas. En effet,les strategies de trading basees sur de l’analyse technique peuvent ne reposer que sur dela chance : les reponses du marche a certains patterns ne sont peut-etre que purementfortuites...

Les critiques sur l’efficience des marches sont nombreuses. Des 1980, Grossman et Siglitzvont plus loin en affirmant que des marches efficients ne peuvent exister ( !) car si lesmarches l’etaient, il n’y aurait aucun profit a collecter de l’information, auquel cas l’ac-tivite meme de trading n’aurait aucune raison d’etre. Mais si personne ne la collectait,comment le prix pourrait-il la refleter. Il serait des lors plus juste de quantifier le degre d’in-efficience du marche. Pour le quantifier, il faudrait proceder a une analyse cout/rendementdes intervenants du marche en fonction de l’information disponible. Ceci est probablementderriere l’idee de l’existence des noise traders, des agents persuades d’utiliser une infor-mation qui n’en est en fait pas une...

Quelles conclusions tirer ?

Force de constater que cette hypothese, quoique sujette a caution, a la vie longue. Sesramifications dans la vie quotidienne des places boursieres et financieres sont cependantnombreuses (comme cela est tres justement et tres bien explique dans ?, a qui bon nombrede citations sont ici empruntees). De cette hypothese decoule entre autres le CAPM et l’at-trait frenetique pour les indices. Le glissement entre l’obtention d’un rendement maximal(qui devrait, selon Sir Templeton, definir l’objectif initial d’un investissement) et la situa-tion actuelle est frappant. Beaucoup (beaucoup !) de produits vendus tentent de suivre,reproduire, repliquer des indices. Des produits dits innovants fondent leur originalite surles ponderations modifiees d’indices modifies.

De plus, les comparaisons entre investisseurs et entre produits sont satisfaisantes lorsquel’investisseur arrive a un comportement moyen. Des performances memes negatives, de-viennent argument commercial des qu’elles se demarquent positivement du reste du marche.

Page 44: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

44 THEORIE DU PORTEFEUILLE

L’exemple le plus frappant est probablement la replication de Hedge Funds qui tente dereproduire des rendements d’indices de Hedge Funds (donc des performances “moyennes”)a base de facteurs qui eux, sont disponibles depuis toujours. Pourquoi une telle cible, sa-chant que les rendements des meilleurs Hedge Funds ne pourront jamais etre reproduitsde la sorte ? En fait, il apparaıt que face a un manque d’originalite et d’innovation, unfonds redevient un produit de marge, quasi “industriel”.

“Il vaut mieux, pour sa reputation, echouer avec les conventions, que reussir contreelles.” (J. Keynes)

En conclusion, le debat est loin d’etre fini. Une hypothese recente change de paradigme etutilise une approche sociologique ainsi que des theories comportementalistes. Ceci depasselargement le cadre de cet expose mais il s’agit peut-etre d’une direction de rechercheinteressante. Pour faire le point et aller plus loin sur ces concepts, les travaux de ? consti-tueront une reference solide.

Figure 2.4 – Une opportunite d’arbitrage ?

Page 45: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.5. ANNEXE : PREUVES 45

2.5 Annexe : preuves

2.5.1 Demonstration de l’expression de l’allocation du portefeuille op-timal

Le portefeuille de variance minimale s’obtient en cherchant la valeur de a qui permet deminimiser σ2

a, donc en tentant d’annuler sa derivee.

∂σ2a

∂a= 0 ⇐⇒ 2aσ2

Y − 2(1− a)σ2X + 2(1− a)ρσXσY − 2aρσXσY

⇐⇒ a(σ2X + σ2

Y − 2ρσXσY ) = σ2X − ρσXσY

⇐⇒ a =σ2X − ρσXσY

σ2X + σ2

Y − 2ρσXσY(2.6)

2.5.2 Demonstration de l’expression de l’allocation fournissant une va-riance minimale

On utilise donc une fonction d’utilite : u(x) = 1 − exp(−γx) dont la maximisation enesperance revient a la maximisation de m − 1

2γσ2. On cherche dans le plan (σ2,m) une

courbe d’utilite tangente a la frontiere efficiente (les portefeuilles atteignables). On rappe-lait p. 26 que la courbe d’iso-utilite etait la courbe telle que m− 1

2γσ2 est une constante.

On doit donc avoir pour a = a∗ :

∂m

∂σ− γσa∗ = 0

soit encore :∂m

∂σa∗− γσa∗ = 0.

Le premier terme peut se reecrire :

∂m

∂σ=

(∂m/∂a)

(∂σ/∂a).

Essayons de calculer ce terme qui est la pente de la frontiere efficiente dans le plan (σ,m), aun point de la frontiere correspondant a une ponderation a, est egale a (∂m/∂a)/(∂σa/∂a).Pour calculer cette quantite on remarque que :

∂σ2a

∂a= 2σa

∂σa∂a

Or on a aisement :

∂σ2a

∂a= 2a(σ2

Y + σ2X − 2ρσXσY )− 2(σ2

X − ρσXσY )

d’ou∂σa∂a

=a(σ2

Y + σ2X − 2ρσXσY )− (σ2

X − ρσXσY )

σa

Page 46: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

46 THEORIE DU PORTEFEUILLE

Il est trivial de s’assurer que (∂m/∂a) = (RY − RX). Ainsi on peut conclure que :

(∂m/∂a)

(∂σ/∂a)=

(RY − RX)σaa(σ2

Y + σ2X − 2ρσXσY ) + ρσXσY − σ2

X

En egalisant la quantite precedente avec l’expression de la pente d’iso-utilite on trouveque :

a∗ =

(RY −RX)γ + (σ2

X − ρσXσY )

σ2Y + σ2

X − 2ρσXσY

Ceci peut se reecrire :

a∗ = a+RY − RX

γ(σ2Y + σ2

X − 2ρσXσY )

2.5.3 Demonstration de l’expression de l’allocation du portefeuille demarche

Nous cherchons la composition du portefeuille de marche. aM est la ponderation en Y dece portefeuille, 1− aM est celle en X (portefeuille synthetique en actions). Ce portefeuilleest pondere a hauteur de a∗ en quantite, le reste etant investi en actif sans risque. Sonesperance de rendement est RM et sa volatilite σM .

Comme nous l’avons vu auparavant, la pente de la courbe d’iso-utilite au point (σM , RM )est γσa∗ . La courbe est tangente a la demi-droite passant par (0, Rf ) et (σM , RM ), la pentede cette droite vaut donc (RM −Rf )/σM . Ainsi :

(σa∗)γ = (a∗σM )γ =RM −Rf

σM=⇒ a∗ =

RM −Rfγσ2

M

a∗, relatif a la possession d’actif risque depend encore de γ, ce qui etait attendu car lerapport entre le rendement de l’actif risque et celui de l’actif sans risque depend de lasensibilite au risque des agents. Il nous reste a trouve l’expression de la ponderation duportefeuille de marche. Utilisant que RM = aM RY + (1 − aM )RX et que la pente dela droite d’efficience doit etre egale a la derivee de l’hyperbole (voir les calculs effectuesprecedemment) en aM :

RM −RfσM

=(∂m/∂a)

(∂σ/∂a)=

(RY − RX)σMaM (σ2

X + σ2Y − 2ρσXσY ) + (RY − RX)(σ2

X − ρσXσY )

Finalement on trouve bien une expression qui ne depend pas de l’aversion au risque γ :

aM =(RY − RX)σ2

X + (RX −Rf )(σ2X − ρσXσY )

(RX −Rf )(σ2X + σ2

Y − 2ρσXσY ) + (RY − RX)(σ2X − ρσXσY )

Page 47: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

2.5. ANNEXE : PREUVES 47

2.5.4 Demonstration de l’expression du CAPM

Le CAPM est obtenu en reecrivant la tangence de la frontiere d’efficience avec le troncond’hyperbole en wM (correspondant a a = 0).

RM −RFσM

=∂Ra/∂a

∂σa/∂a

∣∣∣a=0

Dans un premier temps on a aisement que :

∂Ra/∂a = Ri − RM

De plus, comme precedemment, on obtient que :

2σa∂σa∂a

= 2aσ2i − 2(1− a)ρiMσiσM − 2aρiMσiσM

Ainsi :

σM∂σa∂a

∣∣∣a=0

= σ2iM − σ2

M

D’ou :

Ri − RM =RM −RF

σ2M

(σ2iM − σ2

M )

On a donc finalement :

Ri = RF + (RM −RF )σiMσ2M

Page 48: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

48 THEORIE DU PORTEFEUILLE

Page 49: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Chapitre 3

Processus Autoregressifs

On parle souvent dans l’etude des cours financiers de composantes cycliques, de la memoirea long terme, de tendance, etc. Pour les etudier, on modelise usuellement ces series a l’aidede processus stochastiques. Un processus stochastique est une suite de variables aleatoiresdefinies sur un meme espace, Ω. Un processus X univarie indexe par le temps est note :

Y = (Yt, t ∈ Z). (3.1)

La serie observee correspond a Yt(ω), t = 1, ..., T , ou ω est une realisation d’un etat particu-lier et [1, ..., T ] est la periode d’observation. Une realisation (Yt(ω), t ∈ Z) est la trajectoiredu processus. Pour etudier ces processus, il est utile de restreindre la classe des processusstochastiques a laquelle on se donne acces pour l’etude. Cela permet aussi une utilisationplus simple des concepts. Nous verrosn deux exemples de restrictions qui peuvent etreintroduites : la condition de stationnarite et l’hypothese de processus Markovien.

Un petit rappel utile : supposons que l’on dispose d’une serie d’obervations Yt d’unevariable X au cours du temps. La loi conditionnelle de Y est, grossierement, la loi de Xsans consideration du lien temporel entre Yt−1 et Yt. On est donc dans le cas ou l’on agregeles donnees “en bloc”. La loi conditionnelle va cependant s’attacher a regarder ce que l’onpeut dire de la distribution de Yt avec la connaissance de l’information passee Yt−1, Yt−2,Yt−3, . . .

3.1 Processus AR, MA, ARMA

Les processus que nous allons ici etudier ont ete construits avant tout pour proceder a desprevisions de court-terme. Ils s’attachent donc aux donnees qu’ils copient et ne sont enrien structurels. Ils necessitent de definir auparavant certains outils et certains concepts.

3.1.1 Stationnarite, bruit blanc, operateurs retard

Stationnarite

Dans ce qui suit, on considere une suite de variables (Yt) ou pour tout t, la variable Yt estde carre integrable.

Definition 3.1.1. Si ∀n ∈ IN , ∀t1, . . . , tn ∈ Z,∀h ∈ Z, la loi de (Yt1 , . . . , Ytn) est la memeque (Yt1+h, . . . , Ytn+h), alors la serie (Yt) est est dite stationnaire au premier ordre(ou au sens strict ou fort).

49

Page 50: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

50 PROCESSUS AUTOREGRESSIFS

Definition 3.1.2. Si les variables aleatoires (Yt)t sont de meme loi marginale et sonttelles que :– esperance et variance ne dependent pas du temps : ∀t ∈ Z on a IE(Yt) = m,V(Yt) = σ2.– la covariance ne depend pas du temps : ∀ ∈ Z,∀h ∈ Z, cov(Yt;Yt−h) = γ(h)Si ces proprietes sont verifiees alors le processus est stationnaire au second ordre (ouau sens faible ou large.

Definition 3.1.3. Un processus est Markovien d’ordre K (K ∈ IN) si et seulement si :

f(Yt|Yt−1...Yt−k) = f(Yt|Yt−1...Yt−K), ∀t,∀k ≥ K (3.2)

Ceci signifie donc qu’a la date t toute l’information resumee par les K dernieres valeursde X sont suffisantes pour proceder a sa modelisation.

Definition 3.1.4. Un processus stochastique du second ordre est :

– - (i) un processus autoregressif d’ordre K si et seulement si :

E(Yt|Yt−1...) = E(Yt|Yt−1...Yt−K) ∀t (3.3)

– - (ii) un processus lineaire autoregressif d’ordre K si et seulement si :

EL(Yt|Yt−1...) = EL(Yt|Yt−1...Yt−K) ∀t; (3.4)

ou EL(.) denote l’operateur d’esperance lineaire. De tels processus sont dits AR(K), eten pratique on ne distingue pas les deux notions.

Un bruit blanc fort (voir ensuite) est un exemple de variable strictement stationnaire. Lastationnarite est un concept important pour l’analyse des series temporelles, car on cherchesouvent a appliquer certaines transformations aux series observees pour les rendre station-naires. En pratique, les series economiques presentent souvent une saisonnalite et/ou unetendance. Un processus ”tendance-stationnaire” est vu comme la combinaison lineaire d’unprocessus stationnaire ainsi que de processus suivant une ou des tendances. Ce processusest rendu stationnaire en enlevant les tendances.

Il est a preciser qu’un processus stationnaire au second ordre admet une loi qui, pourses deux premiers moments (s’ils existent), est invariante par changement de l’origine dutemps. Il s’ensuit que les variables Xt ont une meme variance egale a γ(0) (propriete dited’homoscedasticite).

Definition 3.1.5. La fonction h 7→ γ(h) est la fonction d’autocovariance du processus.Pour un processus stationnaire, cette fonction est telle que γ(h) = γ(−h).

Definition 3.1.6. Soit un processus stationnaire Xt. La fonction d’auto-correlation h 7→ρ(h) est definie par ρ(h) = γ(h)/γ(0). La valeur γ(0) etant la variance de la variablealeatoire Yt, ρ(h) represente donc la correlation entre Yt et Yt+h.

Page 51: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.1. PROCESSUS AR, MA, ARMA 51

Theoreme 3.1.1. Theoreme de WoldUn processus stationnaire au second ordre (Yt, t ∈ Z), tel que : limh→∞E(Yt+h|Y t) =E(Yt), admet toujours une representation dite moyenne mobile infinie :

Xt = C0 + εt +A1εt−1 + ...+Ajεt−j + ... (3.5)

ou (εt, t ∈ Z) est une suite de variables de moyenne nulle, de meme variance uniforme(dites homoscedastiques) et non correlees.

La condition donnee par (3.5) signifie que les observations anterieures a la date t n’ap-portent aucune information significative dans l’objectif d’effectuer une prevision a un hori-zon infini. Le theoreme de Wold apporte en fait une justification theorique aux representationsARMA que nous allons etudier par la suite. Comme nous allons l’aborder dans une sectionsuivante, les representations ARMA peuvent etre considerees comme des approximationsdes representations moyennes mobiles infinies. Dans la pratique, l’avantage est que lesmodeles ARMA ne sont fonction que d’un petit nombre de parametres, donc plus facilesa mettre en place.

Bruits blancs

Un bruit blanc est une suite de variables aleatoires de moyenne nulle et de meme varianceσ2. Il s’agit d’une brique de base des modelisations utilisees en series temporelles. Un bruitblanc est en quelque sorte le processus le plus elementaire que l’on puisse imaginer et ilen existe plusieurs distinctions.

Definition 3.1.7. La serie (εt)t,t = 1 . . . T est un bruit blanc faible si les covariancesentre les elements de la serie sont nulles :

cov(εt, εt′) = 0 ∀t, t′ ∈ IR

Il s’agit d’un bruit blanc fort si les εt sont independants les uns des autres.Enfin on parlera de bruit blanc gaussien si les εt suivent des lois gaussiennes independantes.

La distinction entre bruit blanc faible et fort reside bien entendu sur le fait que l’independanceimplique la non correlation mais que la reciproque n’est pas vraie 1.

Operateur retard

Definition 3.1.8. On note L l’operateur retard ( lag en anglais) tel que pour une serie(Yt)t∈Z, L · (Yt)t = (Xt)t ou pour tout t ∈ Z, Xt = Yt−1.

On generalise en notant : Lk(Xt) = Xt−k. On utilisera souvent les notations polynomialesen L, qui sont les polynomes retard. Ainsi pour (a1, . . . , an) ∈ IRn, on notera :

(n∑i=0

aiLi) ·Xt =

n∑i=0

aiXt−i

1. Considerez le cas d’une variable X d’esperance nulle et symetrique, et considerez les deux variablesnon independantes : X et X2 sont non correlees.

Page 52: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

52 PROCESSUS AUTOREGRESSIFS

Definition 3.1.9. Un polynome retard A(L) est inversible si et seulement si il existe unautre polynome retard B(L) tel que A(L) B(L) = Id.

Proposition 3.1.1. Soit λ un reel. Etudions l’inversibilite du polynome (1− λL) :– Si |λ| < 1, (1− λL) est inversible d’inverse :

∑∞k=0 λ

kLk.– Si |λ| > 1, (1− λL) est inversible d’inverse :

∑−∞k=−1−λkLk.

– Si |λ| = 1, le polynome (1− λL) n’est pas inversible.

3.1.2 MA, AR, ARMA

Processus MA

Definition 3.1.10. Soit (εt)t un bruit blanc (respectivement : faible, fort, ou gaussien).Une serie (Yt)t suit un processus MA d’ordre q note MA(q) (respectivement : faible,fort, ou gaussien), des lors que Yt peut s’ecrire :

Yt = εt +

q∑k=1

θkεt−k

Proposition 3.1.2. Un processus MA est toujours stationnaire.

Ceci est immediat, car un tel processus s’ecrit comme une fonction lineaire d’un bruit blanc.

NB : Si Yt est un processus MA pouvant s’ecrire Yt = m+ Θ(L) · εt ou le polynome Θ(.)a toutes ses racines de module strictement superieur a 1, la representation du processusest dite canonique.

Processus AR

Definition 3.1.11. (yt, t = 1, . . . , T ) suit un processus AR d’ordre p (respectivement :faible, fort, ou gaussien) si pour t ∈ Z

Yt = µ+

p∑i=1

φiYt−i + εt

avec (εt) bruit blanc (resp. faible, fort, ou gaussien), (φi)i∈[1;p] ∈ IR, et φp 6= 0. On dit queεt est l’innovation du processus a la date t.

Proposition 3.1.3. Supposons que Yt suit un processus AR(p)., qui s’ecrit sous formepolynomiale retardee : Φ(L) · Yt = µ+ εt. Alors

IE[Yt] =µ

Φ(1)

NB : Lorsque toutes les racines du polynome Φ(.) sont de module strictement superieur a1 on dit que la representation AR du processus est canonique.

On peut toujours se ramener au cas d’un processus autoregressif sans constante µ pour lamodelisation. Si Yt suit un processus AR(p) dont la representation canonique est Φ(L)·Yt =µ+ εt, alors en posant Yt = Yt −m ou m = µ/Φ(1) on remarque que Φ(L) · Yt = εt.

Page 53: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.1. PROCESSUS AR, MA, ARMA 53

Proposition 3.1.4. Soit Yt un processus AR(p), dont la dynamique dans sa representationcanonique s’ecrit :

yt = µ+

p∑i=1

φiyt−i + εt

Alors la fonction d’autocovariance γ(h) definie precedemment satisfait la relation de recurrencesuivante :

γ(h) =

p∑i=1

φiγ(h− i)

La fonction d’auto-correlation ρ(h) satisfait a la meme dynamique. Ces equations sontdites equations de Yule-Walker.

Qu’en est-il de la stationnarite d’un processus AR(p) ? Selon ce qui precede, un processusAR(p) s’ecrit : φ(L)Xt = µ+εt. Ce processus est pour l’instant defini sous forme impliciteet, contrairement a un processus MA(q), il n’est pas toujours assure que l’equation ad-mette une solution stationnaire. La stationnarite est assuree des lors que le polynome φ(L)a toutes ses racines de module different de 1. Si c’est le cas, on peut inverser φ(L) defini surles valeurs du processus stationnaire. Alors l’equation admet une solution unique, avec uneecriture moyenne mobile infinie (on utilise le theoreme de Wold) et est donc stationnaire.

L’exemple du processus AR(1) : nous nous attardons plus particulierement surcette modelisation car elle sera utilisee a diverses fins, pour tester plus finement l’hypothesed’efficience des marches financiers compte tenu de l’observation des prix, pour prevoirl’evolution future des prix (moyenne, dispersion...), construire des strategies d’arbitrage,ou encore pour evaluer le risque d’une position.

Definition 3.1.12. (yt, t = 1, . . . , T ) suit un processus AR d’ordre 1 (respectivement :faible, fort, ou gaussien) si :

yt = µ+ ρyt−1 + εt

gaussien) et |ρ| < 1. On dit que ρ est le coefficient autoregressif.

D’apres ce qui precede sur l’inversion de l’operateur retard, on a aisement la propositionsuivante :

Proposition 3.1.5. Soit (yt)t, avec t = 1, . . . , T un processus autoregressif ; alors on peutecrire :

yt = (1− ρL)−1εt =

∞∑k=0

ρkεt−k

On obtient ainsi une representation moyenne mobile infinie MA(∞) du processus AR(1).La condition |ρ| < 1 est donc importante pour que cette serie converge.

Modele ARMA

Les modeles ARMA constituent une classe plus large de modeles dynamiques. Ils resultentde l’association d’une composante auto-regressive et d’une composante moyenne mobile.

Page 54: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

54 PROCESSUS AUTOREGRESSIFS

Representation equivalente

Definition 3.1.13. (Yt)t, ou t ∈ [1, ..., T ] est un processus ARMA(p,q) si :

Yt − φ1Yt−1 − . . .− φpYt−p = µ+ εt − θ1εt−1 − . . .− θqεt−qou (εt)t, t ∈ [1, ..., T ] est un bruit blanc de variance σ2, φp 6= 0, et θq 6= 0. Les φi sont lescoefficients auto-regressifs, et les θi sont les coefficients moyenne-mobile.

En utilisant l’operateur retard on dispose de la notation plus compacte : Φ(L)Yt =µ + Θ(L)εt. Sous la condition de stationnarite on dispose toujours d’une representationmoyenne-mobile infinie du processus :

Yt = Φ−1(L)Θ(L)εt =

∞∑k=0

akεt−k

On dispose aussi d’une representation auto-regressive infinie des processus ARMA(p,q) :

εt = Θ−1(L)Φ(L)Yt =∞∑k=0

bkYt−k

L’avantage de la forme ARMA est qu’il est possible de modeliser avec un nombre deparametres limites des dependances auto-regressives longues. On parle de representationcanonique minimale lorsque les polynomes Φ(.) et Θ(.) ont toutes leurs racines de modulestrictement superieur a 1 et n’ont pas de racines communes.

Proposition 3.1.6.

IE[Yt] =µ

Φ(1)

La proposition 3.1.7 formalise les proprietes de linearite, d’inversibilite et les conditionsde stationnarite d’un processus ARMA. Une definition precise de ces concepts peut-etreobtenue dans ? ou ?.

Proposition 3.1.7. Soit (Yt)t∈Z un processus ARMA(p, q) donne par :

φ(L)Yt = µ+ θ(L)εt

– (i) - Si le polynome φ(z) ne s’annule pas sur un cercle defini par |z| = 1, alors le pro-cessus (Yt)t∈Z est un processus lineaire stationnaire.

– (ii) - Si le polynome φ(z) ne s’annule pas sur un cercle defini par |z| ≤ 1, alors leprocessus (Yt)t∈Z possede une representation causale.

– (iii) - Si le polynome θ(z) ne s’annule pas sur un cercle defini par |z| ≤ 1, alors leprocessus (Yt)t∈Z possede une representation inversible.

Tout comme dans le cas des processus AR, il faut retenir que ces processus sont station-naires dans la mesure ou les racines des polynomes que l’on manipule sont de modulesdifferents de 1. Une representation canonique suppose que ces racines sont de modulesuperieur a 1. Si ce n’est pas le cas, il existe des mecanismes (on utilise alors les conjuguesdes racines) pour obtenir des representations canoniques et obtenir des formes inversibles.Mais globalement, les ARMA et les AR sont aussi des processus stationnaires des qu’iln’y a pas integration (racines de module unitaire - voir paragraphe suivant). En conclusionde ce que nous venons de dire, les processus les plus utilises dans les faits sont certainementles processus AR(1) et ARMA(1, 1) (qui suffisent dans bien des cas !).

Page 55: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.1. PROCESSUS AR, MA, ARMA 55

3.1.3 Pourquoi ces processus ?

La plupart des series economico-financieres ne sont pas stationnaires. Mais si l’on considerepar exemple les differences premieres (ou plus generalement les differences d’ordre d) deces series, l’hypothese de stationnarite devient souvent vraisemblable. Il est donc natu-rel de considerer la classe des processus dont la difference d’un certain ordre satisferaitune representation ARMA. Nous allons donc nous attarder quelque peu sur les processusintegres. Ce paragraphe peut paraıtre artificiel a premiere lecture mais en plus d’insistersur des apscects fondamentaux de la modelisation, il donne une intuition sur l’importancedes conditions d’inversibilite et de stationnarite sur lesquelles nous nous attardons depuisle debut de ce chapitre.

Si on note 4dYt la difference d’ordre d de Yt, c’est a dire 4dYt = (1 − L)dYt, on peutgeneraliser les definitions precedentes au cas des processus ARMA(p, q) integres d’ordred, ou ARIMA(p, d, q).

Definition 3.1.14. Un processus stationnaire au second ordre (Yt)t∈Z est defini commeetant un processus ARIMA(p, d, q), si le processus ((I−L)dYt)t∈Z est un processus ARMAdefini comme precedemment.

φ(L)4dYt = µ+ θ(L)εt (3.6)

⇔ φ(L)(1− L)dXt = µ+ θ(L)εt

On peut aussi generaliser a nouveau les deux definitions precedentes au cas des processussaisonniers SARIMA (Seasonal ARIMA) mais ceci est hors du champ de ce cours.

Processus integres d’ordre 1

Definition 3.1.15. (Yt)t,t = 1, ..., T ) est un processus integre d’ordre 1 si :

Yt = Yt−1 + εt

ou (εt, t = 1, ..., T ) est un bruit blanc de variance σ2. Il est dit avec tendance si l’expressionprecedente devient :

Yt = µ+ Yt−1 + εt

Remarque 3.1.1. La definition peut se reecrire a l’aide de l’operateur retard : (1−L)Yt =εt

Le premier probleme qui apparaıt clairement est l’impossibilite pour ce processus de serepresenter a l’aide d’une moyenne mobile infinie. On montre cependant sans peine que sil’on dispose d’une observation initiale Y0 alors a la date t, dans le cas le plus general :

Yt = Y0 + µt+

t∑k=1

εk.

C’est de cette somme infinie (non ponderee) que le processus tire son nom de processusintegre. Les moments de ce processus sont alors clairement

E[Yt] = y0 + µt

Page 56: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

56 PROCESSUS AUTOREGRESSIFS

V [Yt] = σ2t

La fonction d’auto-covariance est alors γ(t, h) = σ2(t− h) puis

ρ(t, h) = 1− h

t

ainsi lorsque t est grand, ρ(t, h) → 1, ceci nous permettant de detecter rapidement etvisuellement un tel type de processus en examinant l’auto-correlogramme. Les tests quipermettent de tester la presence de racines unitaires (donc quand le processus est integre)sont essentiellement les tests de Dickey-Fuller (1979) ou Philips-Perron. L’idee du test deDickey-Fuller est de comparer et de tester trois regressions sur ∆Yt = Yt − Yt−1 sur Yt−1

(ou Yt−k dans sa version augmentee), en incluant aussi potentiellement un drift ou untrend :

∆Yt = αYt−1 + εt

∆Yt = α0 + αYt−1 + εt

∆Yt = α0 + µt+ αYt−1 + εt.

L’idee est ensuite d’effectuer un test sur α pour le comparer via une certaine statistiquepar une loi tabulee par Dickey et Fuller.

Lien avec les martingales : on peut remarquer qu’un processus integre d’ordre 1 estdirectement lie a la notion de martingale, centrale en finance (par exemple notammentdans les problematiques de pricing).

Definition 3.1.16. (Yt, t = 1, ..., T ) est une martingale si

E[Yt|Y t−1] = Yt−1

On dispose donc d’une representation AR d’une martingale sous la forme Yt = Yt−1 + εtou E[εt|εt−1] = 0. On dit alors que εt est une difference de martingale. Rappelons quesi la variance de εt est independante de t alors εt est un bruit blanc faible mais pasnecessairement fort. La condition ”etre martingale” est en fait plus forte que celle ”etreintegre d’ordre un avec innovation bruit blanc faible. La meilleure prevision des prix futursest :

E[Yt+h|Y t] = Yt

Note finale sur les processus integres - la stationnarite est une notion essentielleet les processus integres sont tout sauf un gadget. C’est meme la premiere chose dontil faut se debarasser dans une etude. Sinon, si l’on regresse une ou deux series integreesl’une sur l’autre, nous pouvons entrer dans le cadre d’une spurious regression ou regressionfallacieuse. En d’autres termes : on fait n’importe quoi et nos resultats n’ont aucune valeur.Le R2 est eleve, les coefficients significatifs, et pourtant... Les tests ne sont plus valables,les estimateurs biaises. Donc...

Page 57: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.2. ESTIMATION ET TESTS 57

3.2 Estimation et tests

3.2.1 Fonctions d’autocorrelation : un ”guide” visuel

Nous avons auparavant defini les concepts d’autocovariance et l’autocorrelation. Leurinteret reside dans le fait qu’elles permettent de caracteriser la loi jointe des series (Yt, . . . , Yt+n),puisque meme si la mesure est imparfaite, la correlation entre Yt et Yt+h evalue entre autresla persistance de l’information dans une serie. Comme elles constituent des outils utilespour l’etude et l’identification des procesus evoques ci-dessus, nous allons presenter leurcomportement dans ces cas la. Rappelons que γ(.) designe la fonction d’autocovariance,et ρ(.) la fonction d’autocorrelation. Nous donnons ici les proprietes de leurs estimateursempiriques. Soit (Yt)t∈[1,...,N ] une serie temporelle de moyenne empirique Y =

∑Nt=1 Yt/N .

Alors on rappelle que pour h ∈ IN on a :

γ(h) =1

N

N∑t=h+1

(Yt − Y )(Yt−k − Y ) ρ(h) =ˆγ(h)

ˆγ(0)

Proposition 3.2.1. Pour h ∈ Z, l’estimateur ρ(h) suit une loi normale de moyenne ρ(h)et de variance

V[ρ(h)] =1

N − h(1 + 2

K∑i=1

ρ(i)2)

Bruit blanc

Si (εt) est un bruit blanc de variance σ2 alors :

γ(0) = σ2 et γ(h) = 0 ∀h 6= 0

ρ(0) = 1 et ρ(h) = 0 ∀h 6= 0

Processus MA(q)

Supposons que le modele s’ecrive Yt = θεt−1 + εt. Alors :

γ(0) = V[Yt] = (1 + θ2)σ2 γ(1) = IE[YtYt−1] = θσ2 et γ(h) = 0 ∀h > 1

ρ(1) =θ

1 + θ2et ρ(h) = 0 ∀h > 1

Sur la figure 3.1 on observe un processus MA d’ordre 1 et sa fonction d’autocorrelationempirique estimee. Bien sur, ces valeurs ne sont qu’estimees, sur une simulation de taillefinie. C’est pour cela que pour des ordres superieurs ou egaux a 2, les autocorrelations nesont pas strictement nulles. Cependant si la nature du processus nous etait inconnue, ladonnee d’un tel graphe d’autocorrelation devrait nous mettre sur la voie d’un processusMA(1). Supposons que le modele s’ecrive : xt =

∑qi=0 θiεt−i. Alors on peut montrer que :

γ(0) = (

q∑i=0

θ2i )σ

2 γ(h) =

q∑i=0

θiθi+hσ2 ∀h ≤ q et γ(h) = 0 ∀k > q

Ainsi, les calculs de covariance et d’autocorrelation sont simples dans le cas d’un processusMA. Ceci est du au fait que les termes IE[εiεj ] deviennent tres vite nuls lorsque i et js’eloignent.

Page 58: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

58 PROCESSUS AUTOREGRESSIFS

Figure 3.1 – Exemple de processus MA(1) et sa fonction d’autocorrelation empirique

Processus AR(q)

On peut calculer les fonctions d’autocorrelation des processus AR d’ordre quelconque deplusieurs manieres. On peut soit calculer ces correlations en utilisant directement la formeAR du processus, soit en utilisant sa representation MA(∞). Dans le cas du processusAR(1), si ce dernier s’ecrit Yt = φYt−1 + εt alors on peut montrer que :

γ(h) =φh

1− φ2σ2 et ρ(h) = φh ∀h ∈ IN

Figure 3.2 – Exemple de processus AR(1) et sa fonction d’autocorrelation empirique

La figure 3.2 donne un exemple de processus AR(1) et de sa fonction d’autocorrelationempirique. Pour les modeles d’ordre quelconque, la fonction d’autocorrelation peut engeneral avoir la forme d’une sinusoıde dont l’enveloppe decroitrait de maniere exponen-tielle. Cependant quel que soit le modele, on observe que l’autocorrelation decroıt a terme

Page 59: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.2. ESTIMATION ET TESTS 59

vers 0 pour les ordres eleves, le tout suivant une decroissance d’aspect exponentiel.

Le test de nullite d’une correlation d’ordre h est simple puisque lorsque l’on teste pourh < 1 ρ(h) = 0 contre ρ(h) 6= 0, la statistique de test est

√T ρ(h) qui suit sous H0 une

loin normale centree reduite. Le test a 5% est donc rejete des que√T ρ(h) depasse 1.96.

Fonction d’autocorrelation partielle

Definition 3.2.1. Soit (Yt)t∈Z un processus de moyenne µ, son autocorrelation partielled’ordre k est estimee le coefficient de Yt−k − µ dans la regression lineaire de (Yt − µ) sur(Yt−1 − µ, . . . , Yt−k − µ). Nous la noterons r(k) dans la suite.

Ainsi la fonction d’autocorrelation partielle a l’ordre k d’un processus Yt designe la correlationentre les series Yt et Yt−k−i si l’on occulte l’influence que pourraient avoir les variables Yt−k′

ou 1 ≤ k′ < k qui sont des retards intermediaires. Dans le cas d’un processus AR(p), lafonction d’autocorrelation partielle est nulle pour des ordres superieurs a p, ce qui peutetre utile dans l’identification de l’ordre des processus AR.

Un guide visuel

On suppose que |ρ| < 1 de maniere a ce que les moments de la loi de Yt existent.

Proposition 3.2.2. Soit (yt)t, ou t = 1, . . . , T un processus autoregressif d’ordre 1 quis’ecrit :

yt = µ+ ρyt−1 + εt

avec (εt) bruit blanc et |ρ| < 1. Alors :– E(yt) = µ/(1− ρ)– γ(t, h) = cov(yt, yt−h) = σ2ρ|h|/(1− ρ2)– ρ(t, h) = corr(yt, yt−h) = ρ|h|

– (yt, t = 1, . . . , T ) est stationnaire au second ordre

Pour les processus stationnaires, ρ(t, h) decroıt de maniere exponentielle vers 0 lorsqueh −→∞. Les autocorrelations traduisent en quelque sorte la memoire du processus.

La encore le test de nullite d’une autocorrelation partielle d’ordre h est simple puisquelorsque l’on teste pour h < 1 r(h) = 0 contre r(h) 6= 0, la statistique de test est

√T r(h)

qui suit sous H0 une loin normale centree reduite. Le test a 5% est donc rejete des que√T r(h) depasse 1.96.

Ce qu’il faut retenir Supposons que l’on soit face a une serie Yt inconnue dont on tentede tirer une modelisation sous la forme AR ou MA. Si son autocorrelogramme presenteune forme plate ou quasi lineaire, le processus semble integre et il faut probablementfaire porter l’etude non directement sur le processus mais sur une difference d’ordre unou plus de ce processus. Si l’autocorrelogramme montre des valeurs quasi nulles pour kinferieur ou egal a un entier q > 0, on est probablement face a un processus MA(q). Sil’autocorrelogramme presente une forme decroissante exponentielle, la presence d’une com-posante autoregressive est plus que probable. Pour determiner cet ordre, on peut utiliserla fonction d’autocorrelation partielle. Si celle-ci semble s’annuler au dela d’un decalage

Page 60: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

60 PROCESSUS AUTOREGRESSIFS

p > 0, ceci indique probablement la presence d’un ordre autoregressif AR(p). L’identifiac-tion d’un comportement ARMA resultera de la combinaison de ces deux effets.

Bien entendu, tout cela n’a de valeur que lorsque toute une procedure precise d’identifica-tion, d’estimation, de validation et de test est menee. Plusieurs modeles peuvent parfoissembler convenir. Ce qui vient d’etre indique n’a de valeur que dans le phase preliminairequi nous guide quant aux ordres a choisir pour tester un modele AR, MA ou ARMA.

3.2.2 Estimation : quelques generalites

Il y a diverses manieres d’estimer les parametres des processus AR, MA ou ARMA. Nousn’en presenterons ici que quelques unes (laissant de cote par exemple l’utilisation poten-tielle des equations de Yule-Walker evoquees plus haut).

Processus AR

Premier cas : processus AR(1) Notons que les realisations des processus AR ne sontpas, inconditionnellement, independantes et identiquement distribuees. Leur dynamiquen’est connue que conditionnellement :

Yt = µ+ ρYt−1 + εt avec εt ∼ N(0, σ2)

la loi de Yt n’est connue simplement qu’avec l’information disponible en t−1. La dynamiqued’un processus AR(1) est essentiellement gouvernee par deux parametres : la connaıtrerevient donc a estimer ρ et σ2 (on occultera le parametre µ comme nous avons vu quenous pouvons toujours nous ramener a un modele sans constante a la proposition 3.1.3).Deux approches sont a notre disposition. On peut choisir de n’imposer aucune contraintesur la loi des perturbations εt, auquel cas l’approche est dite semi-parametrique (desparametres sont a estimer mais on ne fait pas d’hypothese sur leur loi pour decrire leurcomportement). Si une loi est specifiee pour decrire les perturbations εt, l’approche utiliseeest dite parametrique.

Supposons que l’on dispose d’un jeu de donnees observees (yt) avec t ∈ [1;T ].

Approche semi-parametrique :

ρT = argminρ

T∑t=2

(yt − ρyt−1)2

Il s’agit en fait de l’estimateur des moindres carres ordinaires dont l’expression matricielleest :

ρT = (X ′X)−1X ′Y

ou Y = [y2, . . . , yT ]′ et X = [y1, . . . , yT−1].

Proposition 3.2.3. Soit (yt)t, ou t = 1, . . . , T , une serie observee telle que le processusdont elle est issue suit un AR(1) et on suppose que les perturbations (εt)t, t = 1, . . . , T unbruit blanc fort de variance σ2.

Page 61: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.2. ESTIMATION ET TESTS 61

ρT = (X ′X)−1X ′Y

(ou Y = [y2, . . . , yT ]′ et X = [y1, . . . , yT−1]) est un estimateur sans biais de ρ, devariance minimale dans la classe des estimateurs sans biais ;

– sa loi est asymptotiquement gaussienne :

√T (ρT − ρ) ∼ N (0, 1− ρ2)

L’estimation de σ2 est calculee a partir des residus d’estimation. Les residus sont lesapproximations du processus εt qui est quant a lui inobservable. Une fois ρT estime, ilssont definis pour tout t ∈ [1, . . . , T ] :

εt = yt − ρT yt−1

Si l’on suppose que la moyenne empirique des perturbations εt est proche de zero (cettehypothese est fondee car on a suppose la variable d’esperance nulle) :

σ2 = V (εt) ≈1

T − 1

T∑t=2

ε2t ≈

1

T − 1

T∑t=2

εt2 = σ2

T

Equations de Yule-Walker : elles relient les valeurs de la fonction d’auto-correlationaux coefficients du modele. Elles definissent un systeme lineaire qu’il faut resoudre pourobtenir les coefficient du modele (voire ?).

Approche parametrique : dans ce cas, on choisit a priori une loi pour les bruitsblancs, et on utilise une estimation par maximum de vraisemblance. On peut procederainsi car l’on dispose de la loi de la densite des perturbations. Par exemple etudions lecas ou (εt)t est un bruit blanc gaussien. Tout d’abord, avec cette hypothese, nous devonscalculer les moments conditionnels et inconditionels de la loi de Yt sachant Yt−1. Pour lesmoments conditionnels :

IE[Yt|Yt−1] = ρYt−1 et V[Yt|Yt−1] = σ2

Concernant les moments inconditionnels l’ecritureMA(∞) du processus est particulierementutile :

Yt = (1− ρL)−1(µ+ εt) =µ

1− ρ+∞∑i=0

ρiεt−i

Alors les momentS inconditionnels sonT les suivants :

IE[Yt] =µ

1− ρet V[Yt] =

σ2

1− ρ2

Notant L(y1, . . . , yn) la vraisemblance de l’ensemble d’observations (y1, . . . , yn), on peututiliser la formule de Bayes pour l’exprimer :

L(y1, . . . , yn) = f(y1)

n∏i=2

f(yi|y1, . . . , yi−1)

Page 62: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

62 PROCESSUS AUTOREGRESSIFS

or pour un processus AR(1) :

f(yi|y1, . . . , yi−1) = f(yi|yi−1) ∼ N(µ+ ρyi−1, σ2)

Finalement la log-vraisemblance s’ecrit :

ln(L) = −n− 1

2ln(2π)− (n− 1)ln(σ)− 1

2σ2

n∑t=2

(yt − ρyt−1)2 + ln(f(y1))

NB : le terme ln(f(Y1)) est souvent negligeable lorsque n est grand. Pour trouver lesestimateurs σ, et ρ, il faut resoudre en (σ, ρ) le systeme fournit par les equations :

∂ln(L)

∂ρ=∂ln(L)

∂σ= 0

ce qui fournit les expressions suivantes pour les estimateurs :

(ρMVT , (σMV

T )2) = argmaxρ,σ2

T∑t=2

(− 1

2ln(σ2)− 1

2

(yt − ρyt−1)2

σ2

)Les expressions des estimateurs sont donnees par :

ρMVT =

∑Tt=2 ytyt−1∑Tt=2 y

2t−1

(σMVT )2 =

1

T

T∑t=2

(yt − ρT yt−1)2

Proposition 3.2.4. Les estimateurs du parametre autogreressif et de la variance desperturbations sont asymptotiquement gaussiens, sans biais et de variance minimale.

Cas general : processus AR(p) Les procedures d’estimation sont similaires au cas duprocessus AR(1). Le mode d’estimation semi-parametrique peut etre utilise, tout commele mode parametrique. Dans ce dernier cas, la methode du maximum de vraisemblance estaussi utilisee. Pour un modele AR(p) tel que :

Yt = µ+

p∑i=1

ρiYt−iεt

la log-vraisemblance ln(L) s’ecrit en utilisant des notations matricielles ou Xi:k designe lamatrice formee des vecteurs yt pour t ∈ [i, k], et Φ = (φ1, . . . , φp) :

ln(L) = −(n− 1)ln(σ)− 1

2σ2[Xt −Xt−1:t−pΦ

′]′[Xt −Xt−1:t−pΦ′]

D’ou :

Φ = (Xt−1:t−p′Xt−1:t−p)

−1Xt−1:t−p′Xt

σ =

√1

n− 1ε′tεt

Page 63: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.2. ESTIMATION ET TESTS 63

Ce qu’il faut retenir : l’estimation dans le cadre des processus AR est simple, lesparametres en sont aisement estimables car ils conıncident avec les estimateurs desmoindres carres ordinaires de la regression d’une serie sur son passe.

Processus MA

L’estimation des parmetres des processus MA est plus delicate. La principale difficultevient du fait que pour un modele MA(q) tel que :

Yt =

q∑i=1

θiεt−i + εt (3.7)

a chaque date t ∈ Z, la loi des εt est connue (si l’on suppose les perturbations (εt i.i.d.suivant une loi N(0, σ2) mais les valeurs qu’elles prennent ne sont pas observables. Commedans le cas des processus AR, les moments conditionnels et inconditionnels different, et lavraisemblance conditionnelle f(yt|εt−1, εt−2, . . .) peut etre utilisee. Mais le probleme ren-contre est que la vraisemblance ne peut pas etre calculee directement pour un ensemblede n observations : elle doit etre evaluee de maniere recursive, car les residus ne peuventetre calcules qu’a parametre donne.

Placons nous (dans le cas le plus general) du modele MA(q) precedent (equation 3.7).Notons Θ = θ1, . . . , θq : les residus ne sont calculables qu’a Θ fixe. On doit donc procederde la maniere suivante :

– Pour i ∈ [1; q] on suppose εi = 0, et on fixe εq+1 = yq+1.– Pour t > q, εt = yt −

∑qi=1 θiεt−i, en prenant en compte le fait que les q premiers εt

sont nuls.

On cherche ensuite a maximiser les vraisemblances comme fonctions de Θ, mais en vertude ce qui a ete precise ci-dessus, nous ne disposons pas de formule fermee, nous devonsfaire appel a une methode numerique (a chaque iteration, tous les residus sont recalculesiterativement pour calculer la vraisemblance) car nous ne disposons pas de formule expli-cite comme pour les processus AR.

Processus ARMA

Leur estimation passe egalement par des methodes de maximum de vraisemblance, etappellent aussi une resolution par des methodes numeriques (influence de la composanteMA). Les methodes d’estimation des parametres dans un processus ARMA(p, q) sont laplupart du temps basees sur l’expression de la vraisemblance conditionnelle du processus.Ici nous rappelons la methode d’estimation des parametres par maximum de vraisemblanceproposee par Box et Jenkins (1976). Cette methode se base sur l’hypothese gaussienne faitesur le processus d’innovations (εt)t∈Z . En effet, la vraisemblance du processus est condi-tionnee sur les p premieres valeurs observees du processus (Yt)t∈Z , et sur les q premieresvaleurs du processus gaussien (εt)t∈Z , telles que :

εp = εp−1 = ... = εp−q+1 = 0. (3.8)

Ainsi, a partir de la suite Y1...YT , on peut alors calculer par iterations la suite εp+1, εp+2, ..., εT ,de la maniere suivante, pour t = p+ 1, ..., T :

Page 64: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

64 PROCESSUS AUTOREGRESSIFS

εt = Yt − φ1Yt−1 − ...− φpYt−p − θ1εt−1 − ...− θqεt−q (3.9)

ou εt ∼ N(0, σ2).La log-vraisemblance conditionnelle du processus gaussien est alors donnee par l’equaitonsuivante :

LBJ(Θ) = −T − p2

log(2πσ2)− 1

2σ2

T∑t=p+1

ε2t (3.10)

ou Θ denote le vecteur des parametres du modele.L’estimateur du maximum de vraisemblance, note ΘEMV , est le parametre qui maximisela log-vraisemblance, LBJ(Θ) :

ΘEMV = Arg maxΘLBJ(Θ) (3.11)

3.2.3 Tests sur les residus

A ce stade cependant, une etape de la modelisation n’a pas encore ete abordee. N’ou-blions pas que ces procedures d’estimation reposent en grande partie sur des hypohtesesformulees sur les perturbations εt (gaussien, i.i.d., etc.) Une demarche coherente impliquede tester, apres estimation des parametres, si ces hypohteses tiennent effectivement au vude la serie des residus estimee.

Pratiquement, dans le cas d’un processus AR(1), apres avoir estime un parametre ρ surla serie d’observation yt, on peut recalculer les residus d’estimation (qui sont donc desestimateurs des perturbations εt) par : εt = yt − ρyt−1. C’est sur cette serie que devrontporter les tests pour se demander, au choix, si ses realisations sont bien independantes,identiquement distribuees ou encore issues d’une loi gaussienne.

Dans ce qui suit, on note yt la serie observee et εt les residus d’estimation (on omet la nota-tion ε par souci de simplicite). La procedure qui consiste a caler un modele et examiner siles residus sont effectivement un bruit blanc est connue en pratique blanchir les residus.

NB : certains de ces test peuvent etre utiles dans un cadre d’utilisation different car ilstestent une hypothese somme toute assez generale, mais il nous paraıt cependant opportunde commencer leur expose dans cette section.

Test de nullite de l’esperance

Comme suppose dans les modeles, on s’attend a ce que les perturbations se comportentcomme des bruits blancs. En particulier leur esperance doit etre nulle. On se proposede tester cette propriete. Comme les realisations sont supposees etre independantes etidentiquement distribuees, de variance σ la moyenne empirique converge vers l’esperance :

εt =1

T

T∑t=1

εt → IE[εt]

Page 65: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.2. ESTIMATION ET TESTS 65

La statistique de test est la suivante :

ξT =√Tεtσ

Cependant comme σ est inconnu, il doit lui aussi etre estime, et ce comme ecart-typeempirique de l’echantillon εt. La statistique de test devient alors :

ξT =√Tεtσ

Pour un test de niveau α%, cette statistique est a comparer avec le quantile a 1 − α/2%d’une loi normale centree reduite. Par exemple, “a 95%” ,la valeur de la statistique est acomparer a 1.96 : si elle est superieure, le test est rejete, inferieure le test est accepte.

Test de normalite : test de Jarque et Berra

Une des hypotheses formulees etait que les residus suivent une loi normale. Pour testercette hypohtese, on peut proceder de differentes manieres. Visuellement, on peut compa-rer les quantiles empiriques qε(.) de la distribution des (εt) aux quantiles theoriques qN (.)d’une loi normale. On represente dans un plan les points (qN (x), qε(x)) si les perturba-tions sont issues d’une loi normale, on s’attend a ce que les points forment un segment dedroite. C’est ce que l’on appelle le qq-plot mais cette methode ne permet pas de repondrede maniere precise a la question, elle permet juste de guider l’intuition.

Pour repondre de maniere ”quantitative”, on peut utiliser le test de Jarque et Berra. Cedernier se fonde sur le calcul des contreparties empiriques du skewness et de la kurtosisde la distribution (moments empiriques d’ordre trois et quatre) donnes par :

Sk =1

T

T∑t=1

(εt − ε)3

σ3K =

1

T

T∑t=1

(εt − ε)4

σ4

avec σ ecart-type empirique de l’echantillon (εt), et ε sa moyenne empirique. Pour une loinnormale, le skewness theorique vaut zero, et le kurtosis trois. Jarque et Berra proposentla statistique suivante :

JB =T

6(Sk − 0)2 +

T

24(K − 3)2.

Cette statistique mesure simplement l’ecart de ces statistiques aux lois prises par une loinormale. On connaıt sa distribution asymptotique, il s’agit d’une loi du χ2 a deux degresde liberte : la encore on decide du rejet ou de l’acceptation du test selon la valeur de lastatistique par rapport au quantile d’un loi du χ2 a un niveau donne.

Attention : en fait cette hypohtese de normalite des residus n’est pas centrale dans lamesure ou l’estimation des parametres peut rester valable meme si la loi specifiee n’estpas la bonne (il suffit que la loi specifiee soit une loi exponentielle, (voir par exemeple ?) :c’est ce que l’on appelle l’estimation par pseudo-maximum de vraisemblance. Ainsi le testde Jarque-Berra n’est pas une condition sine qua non pour valider la consistance desestimateurs, qui seront in fine asymptotiquement gaussiens.

Page 66: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

66 PROCESSUS AUTOREGRESSIFS

Test de Durbin-Watson

Plus que la normalite des residus, la vraie question qui se pose reste leur independanceentre eux au cours du temps. Si ca n’est pas le cas, cela peut notamment signifier, outreque notre estimation n’est pas valide, que nous avons oublie de modeliser une des sourcesd’information pour l’analyse de notre variable observee yt. Une maniere d’examiner si l’hy-pothese de bruit blanc est justifiee, est d’examiner le comportement des auto-correlationsde la serie des residus d’estimation. Le test de Durbin et Watson traduit l’absence decorrelation entre les perturbations εt et εt−1 sous l’hypothese de bruit blanc, en calculantla distance suivante :

dw =

∑Tt=2(εt − εt−1)2∑T

t=1 ε2t

Si ρε designe le coefficient d’autocorrelation de la serie des residus d’estimation, cettedistance s’approxime par :

dw ' 2(1− ρε).

On sait que la statistique dw est comprise entre 0 et 4. On sait aussi qu’il existe deuxreels d1 et d2 dans cet intervalle tels que si dw < d1 on accepte l’autocorrelation desrendements ; si d1 < dw < d2 on est dans une zone d’indetermination et on est incapablede conclure ; si d2 < dw alors on ne rejette pas l’independance.

Tests fondes sur les correlations

Tester l’autocorrelation dans la serie (εt)t∈[1;T ] est donc le meilleur moyen de s’assurer de lavalidite de notre modelisation. Dans le cas de l’independance, les correlations sont nulles.On cherche a verifier (jusqu’a un certain rang de decalage temporel) si les correlationsentre rendements sont proches de zero. On utilise a cette fin les proprietes statistiquesdes estimateurs des autocorrelations a differents ordres. Rappelons que l’estimateur del’autocorrelation ρ(k) est donne par :

ρ(k) =1T

∑(εt − εT )(εt+k − εT )1T

∑(εt − εT )2

ou εT designe encore la moyenne empirique de l’echantillon. E[ρ(k)] = − T−kT (T−1) +O(T−2)

ainsi ρT (k) est biaise negativement. Pour corriger de ce biais, la litterature propose parfoisl’estimateur alternatif :

ρT (k) = ρT (k) +T − k

T (T − 1)(1− ρT (k))

Sous l’hypothese nulle (independance, donc non autocorrelation) les estimateurs ont pourcomportement asymptotique :

√T√T − kρ(k)→ N(0, 1)

T√T − k

ρ(k)→ N(0, 1)

Page 67: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.2. ESTIMATION ET TESTS 67

Test de Box-Pierce

Ce test est aussi dit test du Portmanteau. Box et Pierce definissent la Q-statistique :

Q = Tm∑k=1

ρ2(k)

L’hypothese nulle (les perturbations sont normales et identiquement distribues) est equivalentedans ce cadre a l’hypothese : ρ(1) = . . . = ρ(m) = 0. L’hypothese alternative est : il existej ∈ [1;m] tel que ρ(j) 6= 0 (ce qui reviendrait a dire que les perturbations ne sont pasindependantes). Sous l’hypothese nulle, les perturbations suivent une loi du χ2 a m−p−qdegres de liberte ou p et q sont les ordres du modele ARMA (q = 0 pour un modele ARpur, p = 0 pour un modele MA pur).

Test de Ljung-Box

Si l’on desire effectuer un test a distance finie, Ljung et Box apportent une correction enproposant la statistique suivante :

Q′m = T (T + 2)m∑k=1

ρ2(k)

T − k

qui sous l’hypothese nulle suit aussi une loi du χ2 a m − p − q degres de liberte. Cettestatistique a l’avantage de detecter les ecarts au bruit blanc quelle qu’en soit la cause. Laselection de l’ordre m est cependant un point crucial. Une valeur trop faible de m pourraitocculter les rangs correspondant a une auto-correlation elevee. Une valeur trop grandepourrait en diluer la puissance en attenuant de potentiels effets reels d’auto-correlationsd’ordre faible. Pour un resultat satisfaisant, il est preferable de specifier l’alternative testee.

3.2.4 Exemple : test d’efficience de marche

On decide finalement d’estimer une dynamique sur des titres boursiers, et d’exploiter cettemodelisation pour en tirer un test d’efficience de marche. Nous utiliserons pour cela lesprocessus auto-regressifs que nous venons d’introduire.

Modele

On se base sur un modele explicatif des rendements, qui est un modele d’equilibre. Apartir de ce modele, on cherche a calculer le rendement attendu d’un titre comme fonctionde l’information disponible. Le rendement additionnel se calcule alors comme la differenceentre le rendement observe et le rendement calcule, attendu. S’il est imprevisible, c’est adire qu’il n’est pas fonction du passe, alors on ne peut pas rejeter l’hypothese d’efficience.

Considerons pour ensemble d’information les prix passes d’un actif quelconque, et pourmodele d’evaluation des rendements (rt) de cet actif, un modele reduit a une constanteplus un bruit. Cela revient a se demander si la serie de rendement (rt)t d’un actif donne,suit la dynamique :

rt = µ+ εt

alternativement a :rt = µ+ ρrt−1εt

Page 68: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

68 PROCESSUS AUTOREGRESSIFS

On teste alors l’hypothese H0 = ρ = 0 contre l’hypothese alternative Ha = ρ 6= 0.Notons qu’un tel type d’hypothese se generalise aisement au cas ou les rendements sontdependants du temps.

Comment exploiter cette relation ?

Aussi simple que puisse paraıtre cette modelisation, elle permet d’identifier deux types degestion tres pratiques sur les marches. Supposons que ρ soit strictement positif (on occul-tera la constante µ pour simplifier l’explication). Ainsi pour t ∈ Z, on a IE[rt] = ρrt−1.Ainsi, si le rendement observe a la periode precedente est positif, celui a la periode suivantesera en esperance positif. Une strategie possible est donc d’acheter le titre si ce derniervient d’obtenir un rendement positif, et de le vendre si ce rendement est negatif, car onespere dans les deux cas que le comportement directionnel du titre sera similaire dans lesdeux cas. Il s’agit au final d’une strategie de suivi de tendance (trend following), dite aussimomentum.

A contrario, si ρ est strictement negatif, on aura tendance a vendre le titre si son dernierrendement est positif, et l’acheter si ce rendement a ete negatif. Il s’agit d’une strategiede retournement de tendance, ou de mean-reverting. Notons que dans les deux cas, ρ estdifferent de 0, et l’hypothese d’efficience de marche se doit bien d’etre rejetee car on peutelaborer des strategies (dont on peut esperer qu’elles soient profitables) avec pour simpleensemble d’information l’ensemble des prix passes.

Il subsiste un probleme dans le test meme des hypotheses, car sa formulation en l’etatmele plusieurs concepts. L’hypothese d’efficience peut etre rejetee :– soit parce que le modele d’equilibre est faux (mauvaise specification du modele) ;– soit parce que le marche n’est pas efficient.En theorie, on ne peut jamais rejeter l’efficience des marches si l’on doute du modeled’evaluation. De plus, Grossman et Stiglitz (1980) montrent que l’efficience n’est pas at-teignable, car l’acquisition d’information a un cout. On passe alors a la notion d’efficiencerelative, entre deux marches par exemple. Celle ci est alors liee a la taille et a la liquiditedu marche. Des lors, des perspectives sont ouvertes vers la litterature relative a la micro-structure des marches financiers.

3.3 Processus ARCH-GARCH

Nous abordons ici les processus dits autoregressif conditionnellement heteroscedastique ouARCH, et leur generalisation, les processus GARCH. Les travaux de Robert Engle en1982 qui ont donne naissance a ces processus lui ont assure le prix Nobel d’Economieen 2003. Leur succes est en grande partie du aux nombreux modeles statistiques qui enderivent tout comme les multiples applications que l’on peut en trouver en finance et eneconomie. Si l’on s’interesse au cas de la finance, les processus ARCH permettent entreautres d’evaluer la variabilite de la volatilite d’un actif, d’estimer diverses Value-at-Risk(VaR) d’un portefeuille, de mesurer le risque systematique de modeles, mettre en placedes strategies dynamiques de couverture ou de valorisation d’option pricing, de modeliserdes primes de risque, etc. Enfin en economie, les ARCH peuvent intervenir dans la mesure

Page 69: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.3. PROCESSUS ARCH-GARCH 69

de l’incertitude sur l’inflation, dans la modelisation des decisions des banques centrales,ou d’ameliorer la maniere dont on apprehende la relation entre l’economie au sens general,et les marches d’actifs financiers. Une reference utile pour toute cette section pourra etre ?.

3.3.1 Motivations - Faits stylises

Il faut tout d’abord souligner quelle a ete la motivation a la source du developpement (voirles travaux d’Engle ou Cragg (1982)) des processus ARCH ou GARCH. Empiriquement,comme nous l’avons vu auparavant dans ce cours, les series chronologiques financierespresentent des faits stylises, c’est a dire certains comportements statistiques specifiques,se repetant la plupart du temps en pratique. Or ces faits caracteristiques ne peuvent pasetre rendus par des processus lineaires comme les ARMA que nous venons d’introduire.L’expose (ou le rappel) de ces quelques faits est donc crucial pour comprendre l’interet detels processus, et s’avere donc concomittant a leur definition.

NB : il est absolument necessaire de comprendre que tout ce qui est expose dans ce qui suitest 1/ la presentation de faits stylises, donc des faits qui par essence n’ont pas de ”justi-fication” a part entiere, ou de certitude d’ocurrence ; 2/ relatif a une echelle temporelle :des rendements hebdomadaires ou mensuels ont une structure statistique profondementdifferente des rendements a la seconde ou aux 5 minutes.

Non normalite des rentabilites

La distribution inconditionnelle empirique des rentabilites d’une serie financiere (utili-sant une methode non parametrique, c’est a dire un histogramme ou une estimation parmethode des noyaux) possede des queues de distribution plus epaisses que celle de laloi normale. En d’autres termes, les evenements exceptionnels arrivent plus souvent queprevu”. L’epaisseur des queues de distribution est fournie par la kurtosis (defini auparavanten 1.4.1). De plus, cette distribution est souvent asymetrique, et ce vers la gauche, i.e. laqueue gauche (rentabilites negatives) est plus epaisse que la queue droite. Ainsi les grandsrendements negatifs sont plus frequents que les forts rendements positifs. L’hypothese denormalite de la distribution non conditionnelle est donc bien souvent rejetee. Or ceci peutavoir un impact, notamment lorsque l’on cherche a tester la validite de certains modelestel le MEDAF.

Autocorrelation

L’autocorrelation des series financieres est en pratique assez faible. Generalement, lamodelisation avec un processus AR(p) avec p assez faible (p < 4) est souvent suffisante.Il arrive meme parfois que la serie etudiee puisse directement etre consideree comme unbruit blanc (non independant). En revanche, l’autocorrelation de la serie au carre (ouelevee a une certaine puissance) presente une persistance assez forte. Ceci indique quela modelisation lineaire (type ARMA) entre valeurs presentes et passees est nettementinsatisfaisante.

Page 70: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

70 PROCESSUS AUTOREGRESSIFS

La variance n’est pas constante

Contairement a ce qui a pu etre suppose dans les modeles precedents (comme dans le casdes ARMA), les series de rentabilites ne sont pas homoscedastiques (de variance constante)et presentent une variance pouvant varier dans le temps (et ce en particulier sous l’effetde chocs exogenes comme les crises). Les series sont donc dites heteroscedastiques (devariance variable). Qui plus est, comme il a ete souligne au paragraphe 2.4.1 on s’apercoitaussi que la variance presente des faits tres caracteristiques, a savoir des successions etalternances de phases de faible, puis de forte volatilite. Ceci est le phenomene d’agregatde volatilite (en anaglais volatility clustering). Il semble donc qu’il soit necessaire de faireevoluer ces modeles en incorporant cette heteroscedasticite potentielle.

Effet de levier

Il y a une correlation negative entre les variations des prix d’actifs et les variations de lavolatilite, et cette correlation est asymetrique. Au sens ou, la volatilite augmente fortementlorsque les prix baissent fortement (en cas de crise financiere par exemple, ou de phasede ”mauvaises nouvelles”). Cependant, lors des phases ou les ”bonnes nouvelles” sontnombreuses, la volatilite est plus stable.

3.3.2 Presentation theorique

Nous commencerons par presenter les processus ARCH (definition, proprietes) puis expo-serons par la suite leur principale extension, a savoir les processus GARCH.

Definition et proprietes statistiques

Definition 3.3.1. Un processus (εt)t∈Z est defini comme etant un processus ARCH(p)s’il verifie l’equation suivante :

εt =√htut (3.12)

avec (ut)t∈Z ∼ N(0, 1) et

ht = α0 +

p∑i=1

αiε2t−i (3.13)

Dans la suite εt−1 designera l’ensemble des valeurs passees :

εt−1 = εt−1, εt−2, ...

Le processus ARCH(p) defini par les equations (3.12) et (3.13) possede les proprietessuivantes :

Proposition 3.3.1. Si (εt)t∈Z suit un processus ARCH(p), alors :

1. on a :E(εt|εt−1) = 0 (3.14)

2. de plus :E(ε2

t |εt−1) = ht (3.15)

3. enfin, la loi conditionnelle de (εt)t∈Z est une normale centree de variance ht :

εt|εt−1 ∼ N(0, ht) (3.16)

Page 71: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.3. PROCESSUS ARCH-GARCH 71

4. si on pose ηt = ε2t − ht, alors :

ε2t = α0 +

p∑i=1

αiε2t−i + ηt (3.17)

avec (ηt)t∈Z est un processus centre, non correle et de variance non constante. Ainsi,(εt)t∈Z admet une representation proche d’un AR(p).

NB : (ηt)t∈Z defini dans la proposition precedente est interprete comme le processus d’in-novation de la variance conditionnelle. Cet aspect se montrera utile pour deceler la presenced’heteroscedasticite conditionnelle et estimer les parametres du processus a partir de laserie des carres.

Cas d’un ARCH(1) : c’est le processus ARCH le plus simple pour notre etude, il estdefini pour t ∈ Z, par :

εt =√α0 + α1ε2

t−1ut

Il est bon de souligner que les ARCH(p) des processus a memoire courte : ajuster un telprocessus sur des donnees reelles des ARCH(p) avec p eleve est donc peu pertinent. Siun ARCH(1) ne suffit pas a capturer toute la variance conditionnelle de la serie, il estpreferable d’utiliser un processus GARCH (voir apres). Le processus ARCH(1) est doncle plus utilise, nous allons en voir quelques proprietes remarquables.

Proposition 3.3.2. Si (εt)t∈Z est un ARCH(1) alors :

1. Si α0 > 0 et 0 < α1 < 1, alors il existe une solution stationnaire :

V ar(εt) = E(ht) =α0

1− α1(3.18)

V ar(εt|εt−1) = ht = α0 + α1ε2t−1 (3.19)

2. Les moments d’ordre 2r existent des que :

αr1

r∏j=1

(2j − 1) < 1 (3.20)

3. Si l’on note K le kurtosis du processus (εt)t∈Z defini par :

K =E(ε4

t )

E2(ε2t ), (3.21)

alors K est donne par :

Kε =3(1− α2

1)

1− 3α21

, (3.22)

et Kε est finie si 3α21 < 1.

Page 72: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

72 PROCESSUS AUTOREGRESSIFS

Pour resumer, la variance conditionnelle d’un ARCH est une fonction quadratique de laserie retardee, ce qui permet de capter l’heteroscedasticite conditionnelle, et constitue toutl’interet de la modelisation par ces processus. La proposition nous fournit aussi que surson intervalle de definition, le kurtosis d’un ARCH est toujours superieur a 3, la valeurpour une normale. La loi inconditionnelle d’un processus ARCH est donc une loi queuesepaisses, donc non gaussienne. Un ARCH capte donc l’heteroscedasticite conditionnelled’une serie, mais aussi la leptokurticite : deux des faits stylises des series de rentabilitesfinancieres exposes auparavant sont ainsi reproduits par cette modelisation.

Cependant, accordons nous sur le fait que nous sommes face a un processus dont la loide distribution est symetrique et qui de plus a une variance non conditionnelle constanteau cours du temps. Un ARCH est donc non conditionnellement homoscedastique,puisqu’egalement sa moyenne non conditionnelle et les autocovariances γ(h) (h > 0) sontnulles. Il peut donc etre caracterise comme un bruit blanc faible.

Extension : processus GARCH

Les ARCH ont donne naissance a de nombreux modeles derives. Un ”bestiaire” completde ces extensions, aux noms tous plus originaux et amusants les uns que les autres, pour-rait etre compile au regard de la litterature econometrique sur le sujet, mais ceci seraithors de propos dans le cadre de ce cours. L’extension la plus naturelle et la plus celebreest bien entendu le processus GARCH.

Definition 3.3.2. Un processus (εt)t∈Z est un processus GARCH(p, q) s’il verifie :

εt =√htut (3.23)

avec ut ∼ N(0, 1) et

ht = α0 +

p∑i=1

αiε2t−i +

q∑i=1

biht−j (3.24)

La moyenne non-conditionnelle d’un GARCH(p, q) est nulle et, sous l’hypothese de sta-tionnarite (voir ensuite), sa variance non conditionnelle est constante egale a σ2 = α0(1−∑αi−

∑bj). Comme le processus ARCH, un GARCH est un bruit blanc faible. De plus,

la loi conditionnelle d’un processus GARCH est gaussienne, centree de variance ht donneepar l’equation (3.24).

Definition 3.3.3. Si (εt)t∈Z est un GARCH(p, q) alors :

1. Une condition necessaire et suffisante pour que (εt)t∈Z ait une solution stationnaireest :

max(p,q)∑i=1

(αi + bi) < 1 (3.25)

2. Si (ηt)t∈Z designe toujours l’innovation du carre du processus : ηt = ε2t − ht, alors :

Page 73: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.3. PROCESSUS ARCH-GARCH 73

ε2t − ηt = α0 +

q∑i=1

αiε2t−i +

p∑j=1

bj(ε2t−j − ηt−j) (3.26)

⇔ ε2t = α0 +

max(p,q)∑i=1

(αi + bi)ε2t−i + ηt −

q∑j=1

bjηt−j

avec αi = 0, pour tout i > q et bj = 0, pour tout j > p. On obtient alors unerepresentation proche d’une representation ARMA(max(p, q), q) pour (ε2

t )t∈Z . Ce-pendant, le terme d’erreur n’est pas forcement de variance constante.

Attention : la “semantique” GARCH est symetrique de celle liee aux ARMA au sensou le degre p apparaıt comme un degre moyenne mobile, et non necessairement comme undegre autoregressif.

Cas du GARCH(1,1) : trouver les bons ordres p et q d’un GARCH(p, q) est difficile.La plupart du temps, on considere uniquement des GARCH(1, 1), ce qui suffit a fournirune description convaincante de bon nombre de series. En pratique, p et q sont toujours prisinferieurs ou egaux a 2. Un GARCH(1, 1) est parfois une approximation parcimonieused’un processus ARCH(p) ou p est eleve (p = 8 par exemple). Le processus GARCH(1, 1),est defini pour tout t ∈ Z, par :

εt =√α0 + α1ε2

t−1 + b1ht−1ut. (3.27)

La variance a t est composee d’une ponderation de la variance en t−1, et du choc constateen t− 1 sur le processus sous-jacent. Un processus GARCH(1, 1) est stationnaire si α1 +b1 < 1.

3.3.3 Tests et estimation

Presence d’un effet ARCH

Pour justifier de la volonte de caler un processus ARCH sur une serie, il faut d’aborddetecter la presence d’heteroscedasticite conditionnelle dans la serie. L’ACF ou la PACFne peuvent cependant plus nous aider.

Premiere idee : s’interesser aux moments d’ordre superieur, pour rechercher un kurtosiseleve (superieur a 3), que l’on espere etre indicateur d’heteroscedasticite. Deuxieme pos-sibilite : s’interesser a la serie au carre. Comme nous l’avons vu dans les propositions decette section, la representation au carre des series conditionnellement heteroscedastiques(ARCH, GARCH) est proche de celle d’un processus ARMA. Ainsi, les ACF et PACFpourront etre utiles, mais non plus sur la serie, mais sur son carre. Pour attester formelle-ment de ce fait, on peut utiliser le test du multiplicateur de Lagrange mais ce dernier nesera pas aborde dans ce cours.

Pour tester la presence d’effets GARCH, une astuce utile utilise le fait qu’approximati-vement, on peut considerer qu’un GARCH(p, q) est proche d’un ARCH(p+ q). On peutdes lors reutiliser l’approche precedente dans cette optique.

Page 74: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

74 PROCESSUS AUTOREGRESSIFS

Estimation des ARCH

Comme nous l’avons vu, si (εt)t est un processus ARCH, sa loi conditionnelle est une loinormale centree de variance conditionnelle ht. La methode utilisee est celle du pseudo-maximum de vraisemblance (PMV, ou pseudo maximum likelihood en anglais) comme vuauparavant.

Supposons que l’on note ε1, ..., εt, ..., εT la serie de T observations d’un processusGARCH(p, q)decrit auparavant. Cette serie peut etre consideree comme une trajectoire possible du pro-cessus sous-jacent. En supposant que le processus est conditionnellement Gaussien, oncherche a estimer le vecteur de parametres, θ = (α0, α1, ..., αp, b1, ..., bq) en utilisant lamethode de pseudo-maximum de vraisemblance. Le logarithme de la vraisemblance condi-tionnelle du processus, pour la trajectoire de longueur T , s’ecrit :

LT−p(θ) = −T − p2

log(2π)− 1

2

T∑t=p+1

[log(ht) +ε2t

ht] (3.28)

ou la variance conditionnelle ht est definie de facon recursive, pour t > p, par :

ht = α0 +

p∑i=1

αiε2t−i +

q∑i=1

biht−j . (3.29)

Nous supposons implicitement (par convention) que p > q. De maniere similaire a l’esti-mation d’un processus MA, les p valeurs initiales de la variance conditionnelle (h1, ..., hp)ne sont pas connues et sont prises egales a la variance non conditionnelle de l’echantillon.L’estimateur de pseudo-vraisemblance note θPMV , est le parametre qui maximise la log-vraisemblance conditionnelle :

θPMV = argmaxθL(θ) (3.30)

Les differents processus de type GARCH peuvent etre estimes avec une methodologieanalogue, sachant qu’un processus ARCH(p) peut etre considere comme un processusGARCH(p, 0). Pour les processus ARMA − GARCH, l’estimation des parametres peuts’effectuer en deux etapes. On estime d’abord un processus ARMA sur la serie d’origine,on recupere les residus et on cale dans un second temps un processus de type ARCH surces residus.

La methode de pseudo-maximum de vraisemblance est une methode efficace pour l’esti-mation mais elle reste contraignante car elle suppose que la loi conditionnelle est normale(hypothese tres forte), ce qui est loin d’etre toujours le cas en pratique. Lorsqu’on estimeles residus, on obtient la encore des rendements a queues de distribution epaisses. Pourprendre en compte cet effet, on peut reutiliser des lois a queue epaisse dans la methode dePMV (de type Student ou exponentiel par exemple). On pourra se reporter entre autrespour une etude aux travaux de Bollerslev (1987,1989) ou de Hsieh (1989).

Page 75: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.4. COMPLEMENT : SPECIFICATION DU PROCESSUS 75

Validation

Une fois les parametres estimes, il est possible de calculer la serie (εt(θPMV ))t standardiseepar la variance conditionnelle predite par le modele, (ht(θPMV ))t, c’est a dire :

εt(θPMV ) =εt√

ht(θPMV )(3.31)

Si le modele estime est bien specifie, cette serie doit etre un bruit blanc (i.e. εt(θPMV ) ≡ut). Si l’heteroscedasticite conditionnelle reste presente dans la serie standardisee, le modeleestime n’est pas convenable, et notre estimation n’est pas suffisante. Ceci signifie qu’il fau-dra probablement introduire des retards p ou q d’ordre superieur.

3.4 Complement : specification du processus

L’etape de specification d’un processus ARIMA(p, d, q) consiste a choisir les ordres desparties AR (choix de l’entier p) et MA (choix de l’entier q) ainsi que l’ordre d’integrationd. Cette section resume donc la procedure generale dont les details ont ete abordes aucours de ce chapitre. Elle se fonde sur la methodologie de Box et Jenkins (1976) qui reposesur une modelisation de la serie d’etude par un processus de type ARIMA(p, d, q). Cettemethodologie est basee sur les 4 etapes suivantes :

1. specification du processus ;

2. estimation des parametres du processus ;

3. validation du processus par tests ;

4. utilisation du processus en prevision.

3.4.1 Choix de l’entier d

Ce choix est lie a une des toutes premieres questions que doit se poser le statisticiendesireux de mettre en oeuvre la methodologie de Box et Jenkins (1976), a savoir si latrajectoire observee est issue d’un processus stationnaire. Si tel est le cas, on dira alorsque la serie (Xt)t∈Z est integree d’ordre 0. Sinon, on suppose qu’il existe un entier d > 0tel que (I − L)dXt est stationnaire. on dira alors que le processus (Xt)t∈Z est integred’ordre d. Ainsi, le probleme revient a tester l’hypothese H0 : d = 0 contre l’hypotheseH1 : d = 1. Les tests de racine unitaire permettent de tester si d est oui ou non differentde 1. Par exemple, le test de Dickey et Fuller permet de tester la presence d’une racineunitaire dans un processus AR(p).

3.4.2 Choix des entiers p et q

A partir de donnees reelles, le choix de p et q se fait a l’aide de l’ACF , ρ(.) et de la PACFempiriques r(.). Ceci a ete developpe au paragraphe 3.2.1. On rappelle la propriete sui-

Page 76: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

76 PROCESSUS AUTOREGRESSIFS

vante vue plus haut :

Definition 3.4.1. Soit (Yt)t∈Z un processus stationnaire :– (i) - Si (Yt)t∈Z ∼ AR(p), alors rY (k) = 0, si k > p ;– (ii) - Si (Yt)t∈Z ∼MA(q), alors ρY (k) = 0, si k > q.

En pratique, on cherche le retard k a partir duquel rY (k) = 0 ou ρY (k) = 0. Pour unerecherche s’appuyant sur un test, on peut appliquer le test de Barlett qui permet de testerstatistiquement l’hypothese H0 : ρY (k) = 0 contre l’hypothese H1 : ρY (k) 6= 0. De memele test de Quenouille permet de tester statistiquement l’hypothese H0 : rY (k) = 0 contrel’hypothese rY (k) 6= 0. On rappelle ces deux tests, bases sur les theoremes suivants :

Theoreme 3.4.1. Theoreme de BarlettSoit (Yt)t∈Z un processus MA(q) stationnaire gaussien. Sous H0 : ρY (k) = 0, pour k ≥q + 1, on a quand T →∞ :

T 1/2ρY (k)→ N(0, 1 + 2

q∑i=1

ρY (i)) (3.32)

Theoreme 3.4.2. Theoreme de QuenouilleSoit (Yt)t∈Z un processus MA(q) stationnaire gaussien. Sous H0 : rY (k) = 0, pour k ≥p+ 1, on a quand T →∞ :

T 1/2rY (k)→ N(0, 1) (3.33)

Ce qui a ete decrit n’est valable que pour des processus AR et MA purs. Dans le casdes processus ARMA, le choix de p et q devient delicat, car la theorie ne permet pas deconclure. Il arrive souvent que l’on selectionne plusieurs modeles que l’on suppose capablesd’ajuster correctement la serie etudiee. Chacun de ces modeles sera ensuite estime et puisvalide. La phase de validation permettra de ne retenir qu’un nombre restreint de modeles.Une maniere efficace de choisir les ordres p et q consiste a choisir p et q de telle sortequ’ils optimisent un critere d’interet determine a priori. Un des criteres les plus utilises enstatistique est le critere d’information d’Akaike (1977), denote AIC (Akaike InformationCriterion), defini de la maniere suivante :

AIC = T log(σ2ε) + 2(p+ q), (3.34)

ou σ2ε est la variance residuelle estimee. Un modele possedant une bonne qualite d’ajus-

tement aux donnees fournira une variance residuelle faible, par consequent une valeur decritere AIC faible. On cherchera donc a minimiser ce critere.

3.4.3 Estimation des parametres

Nous avons explore a la section 3.2 les differentes manieres d’estimer des processus de typeAR, MA, ARMA. Elles font intervenir des methodes de type maximum de vraisemblance,eventuellement numeriques.

Page 77: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

3.4. COMPLEMENT : SPECIFICATION DU PROCESSUS 77

3.4.4 Validation du modele estime

La validation du processus estime se fait tout d’abord a l’aide d’un test de significativitedes parametres pour se demander si les parametres que l’on vient d’estimer sont significa-tivement differents de zero et peuvent etre conserves tel quels. Puis, comme l’estimationde tout modele resulte d’une hypohtese formulee sur la nature du bruit du modele, uneanalyse doit etre menee sur les residus qu’on estime. Cette etape est cruciale.

Significativite des parametres

La premiere chose a effectuer est de determiner si les parametres estimes sont significative-ment differents de zero. Si c’est le cas, on conserve la valeur estimee, sinon on considere quele parametre est nul. On effectue pour cela un test de Student sur les parametres estimes.On pose pour hypothese nulle la nullite du parametre, et on la teste contre l’hypothesealternative que le parametre est different de zero. Si la valeur absolue du parametre estimeest plus grande que le produit de 1.96 (quantile a 95% d’une loi normale) par son ecart-type, alors l’hypothese est refusee (au seuil de 5%) et les parametre est considere commesignificativement non nul.

Analyse des residus

Si le modele est correctement specifie, les residus estimes doivent constituer un processusde bruit blanc. Il faut alors proceder a certains tests, ou etudier l’ACF et la PACF desresidus. Nous detaillerons plus tard les procedures de test qui y sont relatives.

3.4.5 Prevision

Une fois que l’on a specifie, estime et valide un modele ARMA, on peut l’utiliser poureffectuer des previsions, c’est a dire tenter de predire la valeur de la serie a la date t+ h,compte tenu des valeurs connues jusqu’a la date t. Le predicteur Xt(h) a l’horizon h estl’esperance conditionnelle de Xt+h sachant le passe de la serie jusqu’au temps t. L’erreurde prevision est alors la difference : Xt+h − Xt(h).

Naturellement, dans le cas d’un processus ARMA(p, q), le predicteur au pas h = 1 estdonne par l’ecriture :

Yt(1) = φ1Yt + ...+ φpYt−p+1 + θ1εt + ...+ θq εt−q+1.s ≤ t).

Pour cela, on utilise les parametres φ estimes, et les bruits εt de meme estimes. On peutainsi calculer un predicteur sans pour autant tenir compte de son incertitude d’estimation.Lorsque h > 1, on recommence l’operation en remplacant les valeurs inconnues de la seriepar les valeurs que l’on a auparavant predites iterativement pour les etapes 1, . . . , h − 1,et en remplacant les valeurs inconnues des residus par leur moyenne conditionnelle, donczero.

Page 78: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

78 PROCESSUS AUTOREGRESSIFS

Page 79: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

Chapitre 4

Econometrie des produits derives

Le but de cette section est de presenter les apports de l’econometrie pour l’analyse desproduits derives et leur valorisation. Nous en profiterons pour rappeler quelques definitionset notions fondamentales sur les produits derives tels que les options, auxquelles nousnous limiterons. Nous preciserons ainsi le principe de valorisation en marche complet, etessaierons de tirer des procedures d’estimation dans ce cadre, en soulignant qu’il existeun probleme d’adequation entre ces formules et les prix observes. Nous verrons en quoi lanature incomplete des marches pose probleme pour l’estimation, et comment trouver desmethodes de valorisation compatibles avec les prix observes. D’autres references pourrontetre plus adequates si le lecteur souhaite un cours global sur la valorisation des produitsderives, ou sur toutes les manieres d’apprhender la volatilite (qu’elle soit implicite, localeou stochastique). Nous axerons ici volontairement notre propos sur les aspects statistiquesqui y sont relies.

4.1 Marches complets

4.1.1 Non arbitrage et completude

Nous avons expose dans le paragraphe 3.2.4 les premiers efforts de Cowles, Samuelson, ouFama pour tenter de definir l’efficience de marche. On peut en retenir qu’un marche estefficient lorsque les mouvements de prix ne sont pas previsibles, des que l’onutilise pour cette prevision l’ensemble des informations de tous les participantsdu marche. On etend de plus la notion d’efficience a l’intuition suivante : il est impossiblede faire des profits, si l’on utilise pour notre investissement la meme information que lemarche. (Voir ? pour plus de precisions).

A titre illustratif, placons nous dans un marche multiperiodique de periodes t = 0, . . . , T ,considerons l’espace filtre d’evenements (Ω,F, IP ) et notons F = Ft, t = 0, ..., T Consideronsle marche financier compose d’un actif sans risque (suppose normalise) S0 ≡ 1 et de dactifs risques : S1, ..., Sd. St, t = 0, ..., T designera donc le processus des prix desactifs risques a valeur dans Rd et F-adapte. Un portefeuille est un processus F-adapte∆t, t = 0, . . . , T − 1 a valeurs dans Rd ou ∆i

t quantifie le nombre d’actifs i possedes a ladate t dans ce portefeuille. Si la richesse initiale est x0, on peut montrer qu’a la date t larichesse Xt possedee s’ecrit :

Xx0,∆t = x0 +

t∑j=1

∆t(Sj − Sj−1)

79

Page 80: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

80 PRODUITS DERIVES

Definition 4.1.1. (Arbitrage et Non Arbitrage) Un arbitrage est un portefeuille ∆tel que

Xx0,∆T ≥ 0 P-ps et P[Xx0,∆

T > 0] > 0

Un marche est dit sans arbitrage si il n’existe pas de tel portefeuille.

Il est a noter que la probabilite P intervient dans l’expression precedente uniquement atravers ses negligeables a savoir les ensembles de mesure nulle sous P. Sous des hypothesesde regularite suffisantes, on peut donc s’attendre a ce que cette caracterisation reste vraiepour des probabilites equivalentes. On peut montrer en fait le theoreme suivant :

Theoreme 4.1.1. (Theoreme Fondamental de Valorisation des Actifs)Notons :

M(S) = Q ∼ P|S est une Q-martingale

M∞(S) = Q ∈M(s)|dQdP

est bornee

Les trois proprietes suivantes sont equivalentes :– i) Le marche est sans arbitrage– ii) M(S) n’est pas vide– iii) M∞(S) n’est pas vide

On peut donc retenir le resultat suivant : l’absence d’opportunite d’arbitrage estequivalente a l’existence d’une probabilite Q equivalente a la probabilite his-torique P sous laquelle les prix actualises des actifs sont des martingales. Unetelle probabilite Q est dite probabilite risque neutre.

Nous nous interessons dans un deuxieme temps a la notion de completude. Tout d’abord,precisons qu’un actif contingent europeen est une variable aleatoire Ft-mesurable et posi-tive P-presque surement.

Definition 4.1.2. (Completude) Le marche est dit complet si tout actif contingent eu-ropeen est atteignable, c’est a dire si il existe un portefeuille ∆ et une richesse initialex0 ∈ R tels que :

Xx0,∆T = B p.s.

Theoreme 4.1.2. (Second Theoreme Fondamental de Valorisation des Actifs)Sous hypothese d’absence d’opportunite d’arbitrage, le marche est complet si et seulementsi il existe une unique probabilite risque neutre Q. Sous ces hypotheses, tout actif contingenteuropeen B admet une unique prix d’arbitrage donne par EQ[B].

En guise d’illustration nous nous sommes places jusqu’ici dans un cadre multiperiodiquediscret. Ces notions s’etendent au cas continu, mais en resume :

– L’absence d’opportunite d’arbitrage est a relier a l’existence d’une probabilite dite”risque neutre” equivalente a la probabilite historique sous laquelle les prix des actifsde marche actualises sont des martingales.

Page 81: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.1. MARCHES COMPLETS 81

– Cette probabilite est unique des lors que le marche est complet.– Dans l’extension au cas continu par exemple, on peut retenir que le marche est com-

plet si le nombre d’actifs financiers est egal au nombre d’aleas (pour une modelisationimpliquant des mouvements browniens.)

4.1.2 Modele de Black-Scholes

Nous nous placons donc dans le cadre continu. Notons St le prix d’un actif sous-jacent a ladate t. On considere un produit derive echangeable de maturite H (date d’exercice t+H)a laquelle il verse un flux g(St+H). Dans un marche complet sans opportunite d’arbitrage,il existe une probabilite unique Qt,H telle que :

C(t,H, g) = B(t, t+H)EQt,H [g(St+H)]

ou B(t, t+H) est le prix en t du zero-coupon d’echeance t+H.

Le message delivre par Black, Scholes et Merton en 1976 est trop souvent reduit a uneformule de valorisation fermee bien connue pour les calls et puts europeens. Leur apportest en fait plus large. En s’inspirant des travaux de Louis Bachelier (1900), ils effectuentcertes une hypothese sur la dynamique du prix d’un sous-jacent, mais definissent avanttout le prix d’un produit derive comme celui de sa couverture.

On effectue en plus les quelques hypotheses supplementaires courantes :– le marche tres liquide, sans couts de transaction ni contraintes de gestion (limitations

des quantites d’achat ou de vente) ;– la vente a decouvert est autorisee ;– les taux d’interet seront supposes constants et cristallises a la valeur r ;– les marches sont supposes complets et sans opportunite d’arbitrage.

Definition 4.1.3. (Hypothese de Black-Scholes)

Sous Qt,H probabilite risque neutre, en marches complets, le prix du sous-jacent est solutionde l’equation differentielle stochastique suivante :

dStSt

= rdt+ σdWt (4.1)

ou Wt est un mouvement brownien.

L’hypothese de Black-Scholes, outre sa simplicite, fournit des formules explicites pourquelques fonctions de payoff g(.) standard, notamment dans le cas d’options europeennes.Par la suite nous noterons aussi π la probabilite Qt,H .

Role des parametres : dans la formule (4.1), le terme de drift ne fait intervenir quele parametre r, taux sans risque cristallise, et ne prend pas ainsi une valeur µ quelconque.Ceci est l’apport principal du changement de probabilite evoque ci-dessus et de l’evaluationrisque-neutre. Cependant, l’estimation du parametre de volatilite σ reste un element clede la formule de valorisation. Le modele de Black-Scholes suppose que σ est constant :nous verrons en quoi cette hypohtese peut s’averer irrealiste, quoique la definition d’uncadre precis pour la volatilite est un probleme tres large.

Page 82: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

82 PRODUITS DERIVES

Un peu d’histoire... Black, Scholes, et Merton sont les trois noms dont la pratique etles usages ont garde memoire. On trouvera de nombreuses references rappelant des contri-butions au domaine de la valorisation des produits derives et de la couverture. En plusde bien mettre au jour les dangers d’une confiance aveugle dans le concept de couverturedynamique, ? rappellent que Bachelier, Sprenkle, Boness, Samuelson, Thorp, Kassouf,Higgins ou encore Nelson, ont travaille avec succes sur ce sujet.

Proposition 4.1.1. Prix d’un call europeen

Le prix theorique d’un call europeen d’echeance t + H et de strike K, de payoff g(S) =(S −K)+, en t est donne par :

C(t,H,K) = exp(−rH)E[(St+H −K)+|St]

ou la loi de St+H sachant St est definie sous π.

Proposition 4.1.2. Dynamique de Black-Scholes

En appliquant la formule d’Ito et en integrant entre t et t+H, on obtient alors :

St+H = St exp(

(r − σ2

2)H + σ

√Hu)

ou u suit une loi normale centree reduite.

Proposition 4.1.3. Prix de Black-Scholes

Le prix de Black-Scholes d’un call europeen a la date t, d’echeance t + H et de strike Kest :

C(t,H,K) = StΦ(d1)−Ke−rHφ(d0)

ou Φ est la fonction de repartition de la loi centree reduite et :

d1 =1

σ√H

ln[ StKe−rH

]+σ√H

2et d0 = d1 − σ

√H

Avec les memes notations, le prix d’un put europeen de memes caracteristiques s’ecrit :

P (t,H,K) = Ke−rHφ(−d0)− StΦ(−d1)

Definition 4.1.4. Moneyness On utilise souvent le moneyness k plutot que le strike K :

k =K

St

L’ecriture du prix d’un call est alors : C(t,H, k) = StΨ(σ, k,H, r) ou l’on a :

Ψ(σ, k,H, r) = Φ(x)−K exp(−rH)Φ(x− σ√H)

Page 83: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.2. INFERENCE STATISTIQUE 83

x =−1

σ√H

ln(ke−rH) +σ√H

2

Les prix de l’option s’obtiennent donc via une correction des prix St par un facteur qui estindependant de t et de St, mais fonction des caracteristiques de l’option et de la dynamiquedu sous-jacent.

Definition 4.1.5. Relation de parite Call-Put

Si l’on note St le prix d’un actif sous-jacent, et que l’on considere des produits optionnelseuropeens de strike K, de maturite T , un taux sans risque r, le prix Ct du call europeenet le prix Pt du put europeen correspondant verifient :

Ct − Pt = St −KB(t, T ) (4.2)

ou B(t, T ) est la valeur en t du zero-coupon d’echeance T .

Comme auparavant, B(t, T ) peut etre approxime par e−r(T−t) si l’on fait l’hypothese que letaux sans risque peut etre cristallise a sa valeur actuelle pour la periode [t;T ]. La relation4.2 est une relation de non-arbitrage. Elle ne depend pas du modele choisi pour evaluerles valeurs des calls et des puts. Si cette relation n’est pas verifiee par les prix observessur le marche, c’est qu’un arbitrage peut exister. Il est a noter qu’en raison de limites deliquidite, ou plus simplement a cause des couts de transaction, de tels arbitrages peuventcependant ne pas etre au final profitables et ne peuvent donc pas etre exerces.

La demonstration de cette relation est assez simple. On raisonne par l’absurde en sup-posant que Dt = Ct − Pt > St − KB(t, T ). En vendant un call, achetant un put etune action, en placant Dt − KB(t, T ) a l’horizon T au taux sans risque r, le porte-feuille ainsi constitue est de valeur initiale nulle. A l’horizon T il garantit pourtant :−(ST −K)+ + (K−ST )+ +ST −K +Dt/B(t, T ) = Dt/B(t, T ) qui est strictement positifpar hypothese. Ceci constitue donc un arbitrage. On raisonne de meme dans le cas ouCt − Pt < St −KB(t, T ).

4.2 Inference statistique

On suppose ici que le modele de Black et Scholes est bien specifie et que la dynamiquesupposee du sous-jacent est satisfaisante pour le modeliser. On cherche alors a en esti-mer les parametres. On s’interessera aussi aux problemes de specification impliques parle modele et aux solutions pour reconcilier le modele de Black-Scholes avec l’approcheeconometrique.

4.2.1 Estimation a partir du prix de l’actif sous-jacent

Cadre general

Ce paragraphe reprend l’approche de ? ou de ?. On y suppose que l’on peut observerles prix d’un actif S a des dates equi-espacees au sein de l’intervalle de temps [0;T ] : Sk

Page 84: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

84 PRODUITS DERIVES

pourra ainsi designer la valeur de l’actif S a la date kh ou k ∈ [0;n] avec T = nh. Onnote :

fk = f(Sk|Sk−1; θ)

la loi conditionnelle de transition entre k−1 et k, de parametre θ que l’on souhaite estimer.La log-vraisemblance des observations s’ecrit :

L(θ) = ln(

Πnk=1fk

)=

n∑k=1

ln(fk)

et l’estimateur du maximum de vraisemblance θT,h maximise cette expression.

Sous les conditions de regularite usuelles θT,h est un estimateur consistant et asymptotique-ment gaussien, sans biais et de variance asymptotique l’inverse de sa matrice d’informationde Fisher. L’estimateur du maximum de vraisemblance est donc asymptotiquement effi-cace dans la classe des estimateurs consistants gaussiens.

Il s’agit du meilleur choix possible, si tant est que l’on connaisse la forme des lois condi-tionnelles fk, ce qui est en general impossible pour une modelisation generale ou µ et σne sont pas forcement constants. Pour y remedier, ? utilise une caracterisation de fk entant que solution d’une equation aux derivees partielles. Ceci rend l’estimation numeriqueparticulierement difficile. ? expose une approximation de la loi de transition a partir depolynomes d’Hermite.

B Exemple dans le cas de Black-Scholes

On suppose que sous la probabilite historique le processus de prix suit une dynamique :

dSt = µStdt+ σStdWt.

Si l’on pose ν = (µ− σ2/2) on montre aisement en utilisant la formule d’Ito que :

d ln(St) = νdt+ σdWt

ce qui en s’integrant entre les dates k − 1 et k permet d’obtenir :

ln(Sk)− ln(Sk−1) = νh+ σ√hεk ou εk ∼ N(0, 1)

Ainsi sous la probabilite historique les accroissements de ln(S) suivent une loi normale demoyenne νh et de variance σ2h. L’estimateur du maximum de vraisemblance peut alorsetre explicite.

Proposition 4.2.1. (Estimateurs des parametres d’une diffusion Black-Scholes)Les estimateurs du maximum de vraisemblance des parametres d’une diffusion de Black-Scholes sont :

νT,h = 1nh

∑nk=1(∆ln(Sk) = (∆ln(Sk))/h

σ2T,h = 1

nh

∑nk=1(∆ln(Sk)− (∆ln(Sk)))

2

Page 85: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.2. INFERENCE STATISTIQUE 85

Ces deux estimateurs sont independants, asymptotiquement normaux, de variances respec-tives :

V [νT,h] = σ2

nh = σ2

T

V [σ2T,h] = 2σ4

n

On peut donc ainsi mettre en evidence et departager l’influence des parametres T (laperiode d’observation) et h (le pas d’observation des donnees). Concernant l’estimateurdu parametre de tendance, on voit que sa variance, donc sa precision, ne depend que de Tet non du prametre h. A une periode donnee, la variance de l’estimateur du parametre devolatilite diminue avec le pas : plus la decomposition de la periode est fine, plus l’estimateurest precis. Ces resultats ont d’abord ete mis en evidence par Merton et se generalisenta l’ensemble des diffusions.

B Par la suite on considerera h = 1 soit T = n.

4.2.2 Application au calcul des prix d’options

B Prix actuel

Le prix a la date t d’une option d’achat de maturite H et de moneyness k sur le sous-jacentS est donne par la formule :

C(T,H, k) = Stψ(σ, k,H, rT )

ce qui peut etre estime par :

C(T,H, k) = Stψ(σ, k,H, rT )

Le prix estime differe du prix reel par le terme de volatilite, il est donc legitime des’interesser a l’erreur de valorisation inherente a l’erreur d’estimation de la volatilite. Cetteerreur peut etre calculee via une aproximation de la loi asymptotique de CT :

√T(C(T,H, k)− C(T,H, k)

)∼ N(0, Vas(σ))

ou la variance asymptotique est donnee par :

Vas(σ) =∂C(T,H, k)′

∂σI−1(σ)

∂C(T,H, k)

∂σ= 2[ST

∂ψ

∂σ(σ, k,H, rT )σ

]2.

On utilise pour demontrer cela, la δ-methode. Un intervalle de confiance pour ce prix est :

C(T,H, k)± 2√T

[√2ST

∂ψ

∂σ(σT , k,H, rT )σT

].

La precision du prix de l’option depend donc de la sensibilite ∂ψ∂σ de la fonction de valori-

sation par rapport a la volatilite.

Page 86: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

86 PRODUITS DERIVES

B Evolution du prix de l’option

On cherche a connaıtre l’evolution du prix d’une option de caracteristiques connues (strikeK, date d’exercice T0, taux d’interet cristallise rT ). A une date donnee t < T0 ce prix est :

C(t, T0 − t,K) = Stψ(σ,K/St, T0 − t, rT ).

Le rendement geometrique de cette option entre les dates t− 1 et t est :

ln( C(t, T0 − t,K)

C(t− 1, T0 − t+ 1,K)

)c’est une f(.)non lineaire de St et St−1.

Plusieures observations peuvent etre faites. Tout d’abord, l’hypothese statistique forten’est pas satisfaite lorsqu’on analyse simultanement les prix des sous-jacents et ceux desoptions. Les taux de rendement de l’option ne sont pas independants de meme loi.

Ensuite, la loi conditionnelle du prix ou du rendement de l’option a la date T < t, n’estpas symetrique. Le calcul de la prevision du prix d’option par esperance conditionnellen’est pas adapte, de meme pour les ecarts-types. C’est la loi du prix de l’option condi-tionnellement a l’information disponible en t qui est pertinente. Dans le cas leplus general, il est pratiquement impossible de determiner de maniere explicite cette loiquel que soit le payoff : il faut utiliser des simulations. Tout d’abord on exprime le prix ent de l’option en fonction de ST et des aleas pouvant se produire entre T et t (u suit uneloi normale standard) :

C(t, T0 − t,K) = StΨ(σ,K/St, T0 − t, rT )

= ST e(ν(t−T )+σ

√T−tu)Ψ(σ,K/(ST e

(−ν(t−T )+σ√T−tu)), T0 − t, rT )

= g(u, ν, σ)

Dans un deuxieme temps, on simule independamment des valeurs us, s ∈ [1, . . . , S] et oncalcule le prix de l’option en remplacant ν et σ par leurs estimations :

Cs(t, T0 − t,K) = g(us, νT , σT )

La loi conditionnelle du prix de l’option est obtenu en lissant la distribution empirique deces valeurs.

Remarque 4.2.1. L’estimation du prix actuel d’une option necessite uniquement l’es-timation de σ. L’estimation du prix futur demande aussi l’estimation du parametre detendance ν intervenant dans la probabilite historique.

Remarque 4.2.2. La loi conditionnelle peut etre determinee explicitement lorsque t =T0 :

C(T0, T0 − t,K) = (ST0 −K)+

Il s’agit d’une loi log-normale tronquee.

Page 87: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.2. INFERENCE STATISTIQUE 87

Definition 4.2.1. Valeur Intrinseque

Pour une option de payoff φ c’est la valeur de φ(.) si a maturite la valeur du sous-jacentetait cotee a son prix actuel. Ainsi si une option est initialisee a t0, pour une maturite Tavec un payoff φt0,T , sa valeur intrinseque est : φt0,T (St) ou St designe le prix de l’actifS a t ∈ [t0;T ]. Par exemple pour un call (respectivement : put) europeen de strike K lavaleur intrinseque a t vaut : (St −K)+ (repsectivement : (K − St)+).

Definition 4.2.2. Valeur Temps

C’est la difference entre le cours de l’option et sa valeur intrinseque. En particulier elleest nulle a echeance pour une option europeenne.

Rappelons ici qu’une option est dans la monnaie lorsque sa valeur intrinseque est differentede zero. Par exemple, pour un call, cela correpond au cas ou le prix de l’actif sous-jacentest superieur au prix d’exercice (pour un put, c’est l’inverse). Une option a la monnaie aun prix d’exercice au voisinage du prix de l’actif sous-jacent. Enfin une option hors de lamonnaie a une valeur intrinseque nulle. Pour un call, il s’agit des situations ou le prix del’actif est inferieur au prix d’exercice (situation opposee pour un put).

4.2.3 Incompatibilite avec la demarche statistique

Le modele de Black-Scholes est pratique et simple dans son application, specialement poureffectuer des simulations. Nous ne cherchons pas a aborder dans ce paragraphe l’adequationdu modele a la ”realite”, mais insistons sur les obstacles statistiques poses par cemodele.

Tout d’abord dans ce qui precede, le taux court est fixe pour le futur a sa valeur courante(ce que l’on appelle la cristallisation). On ne peut pas dans ce cadre de modelisation,induire plus d’incertitude sur le prix de cette option via ce parametre.

Ensuite, supposons que l’on dispose d’observations simultanees de prix d’options C(t,H, k)et des prix du sous-jacent correspondant St. La fonction Ψ etant monotone en le parametreσ, il existe une solution unique σimp en σ a l’equation :

C(t,H, k) = StΨ(σimp,K/St, T0 − t, rT ).

Il s’agit de la volatilite implicite de Black-Scholes : σimp = σ(t,H,K). La volatilite im-plicite est le parametre qui, toutes choses egales par ailleurs, permet de faire correspondreles prix de marche observes a la valorisation fermee par la formule de Black-Scholes. σimpn’est qu’un estimateur du maximum de vraisemblance partiel construit a partir de St. Avecla totalite de l’information, on peut donc estimer la volatilite par inversion et σimp = σ.Un probleme statistique apparaıt car notre estimateur est de precision infinie. En effet, sile modele est bien specifie, et le marche sans frictions ni arbitrage, inverser la formule deBlack-Scholes permet de determiner de maniere unique et univoque la volatilite σ. L’esti-mateur est donc une constante, c’est a dire une variable aleatoire degeneree.

Page 88: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

88 PRODUITS DERIVES

Toutes ces difficultes peuvent etre surmontees de differentes facons. On peut considerer lemodele de Black-Scholes comme une approximation raisonnable des prix et non commeune ”verite absolue”. On peut aussi introduire des aleas supplementaires dans le modele.Enfin, on peut essayer de distinguer l’ensemble d’information detenu par les investisseurs,de celui detenu par les econometres.

4.3 L’effet smile et sa correction

4.3.1 Volatilite implicite

Dans l’hypothese ou la volatilite de Black-Scholes fournit des approximations convenablesdes prix d’options, on peut ecrire un modele statistique en considerant que les prix sontobserves avec une erreur :

C(t,H,K) = StΨ(σ∗, k,H, rt) + ε(t,H, k)

ou ε(t,H, k) est un terme d’erreur de moyenne nulle a minimiser, σ∗ etant le parametrea estimer. Ici, σ∗ ne joue donc, via cette estimation, qu’un role mathematique, et n’aaucune raison de coincider avec la volatilite du prix du sous-jacent. L’estimation de σ∗

s’effectue par moindres carres ordinaires. Cependant elle se fonde sur peu d’observations(difficulte de trouver des contrats exactement identiques pour faire l’inference) ce qui larend assez peu precise. On s’attend enfin a ce que σ∗ soit croissante avec le prix de l’option.

Exemple : si l’on considere un call a la monnaie de prix C(t,H, 1) (k = 1,rt = 0) alors :

σimp(t,H,K) =2√H

Φ−1[1 + C(t,H, 1)

2

]Une interpretation possible de la volatilite implicite est de la considerer comme un prixd’option mais corrige d’effets dits “de flux” (dependance telles que le niveau du prixd’exercice, dependance en la maturite). Si le modele de Black-Scholes etait ”vrai”, tousles prix seraient differents, mais cette normalisation menerait a une seule valeur de vola-tilite (”structurelle”, inherente au titre) quels que soient les valeurs de t,H, k. Ce n’esten pratique pas le cas. Cette volatilite depend de maniere significative de t,H, k : ladynamique de Black-Scholes etant ainsi empiriquement invalidee suite a l’observation desprix de marche.

Nous avons donc vu que pour tous autres parametres fixes par ailleurs, la volatilite implicites’obtient par inversion et constitue donc un estimateur statistique degenere. Si les agentsvalorisaient les produits observables sur le marche avec la formule de Black-Scholes, nousdevrions, lorsque nous procedons a cette inference, obtenir une valeur de volatilite paractif, non dependante des autres parametres. Ce n’est pas le cas en pratique, et nousallons explorer la nature de cette dependance dans la suite.

4.3.2 L’effet smile

L’effet smile est la dependance la plus connue de la volatilite implicite en un parametre,en l’occurence le moneyness k (ou alternativement, le strike). Lorsque l’on trace cette

Page 89: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.3. L’EFFET SMILE ET SA CORRECTION 89

volatilite implicite en fonction du moneyness (tout autre parametre fixe) on obtient uneforme particuliere, qui evoque une parabole. Il ne s’agit pas d’une forme parabolique caril existe en general une asymetrie. Si l’hypothese de Black-Scholes etait realiste, on nedevrait avoir une telle forme, mais une fonction constante (egale a la valeur de la volati-lite du sous-jacent dans la diffusion). La presence de cet effet ”smile”, devrait conduire amodifier le modele de valorisation.

B Quelques faits stylises

On peut citer quelques faits stylises principaux concernant le smile :– Le smile est convexe en le moneyness ;– il est de plus asymetrique, avec une pente plus importante pour les moneyness k (aveck = K/St) inferieurs a 1 ;

– cette asymetrie est plus prononcee pour les maturites courtes ;– la structure par terme est croissante pour les options a la monnaie.

Une bibliographie indicative couvrant la majorite des faits stylises et des interpretationssur le sujet pourra etre constituee des travaux suivants : ?, ? ?, ?, ou encore ?.

Quoiqu’il existe des dependances en les autres parametres, l’effet smile reste probablementla dependance la plus etudiee. Pour une maturite donnee, le ”smile” usuellement observea une forme generalement convexe. Cette forme n’est en general pas une parabole car ilexiste une asymetrie dans les pentes de cette fonction. Le minimum est atteint pour lesoptions forward a la monnaie, c’est a dire celles dont le moneyness est egal a e−r(T−t) our est le taux sans risque et T − t le temps restant a maturite. Il s’agit d’une vue ”sta-tique” puisque nous decrivons ici un smile a une date donnee, pour une maturite fixee.En considerant tout un continuum de maturites, pour une date donnee, on observe unesurface de volatilite, dependant elle-meme de la date d’observation.

L’amplitude du smile depend du temps restant a maturite : pour les maturites plus courtes,sa forme est plus prononcee, et a tendance a s’applatir pour les maturites plus longues.Empiriquement, ? note qu’il est possible de relier directement la vitesse d’applatissementdes pentes du smile au temps restant a maturite. ? donne egalement des bornes sur lespentes du smile, en ne prenant en compte que l’hypothese d’absence d’opportunite d’ar-bitrage. On pourra aussi se reporter a ? pour plus de precisions.

Comme nous l’avons dit auparavant, le smile presente generalement une asymetrie, un”skew”, cette terminologie reprenant parfois dans la litterature le relai du terme ”smile”.Comme l’explique ?, les agents ont tendance a craindre une baisse des prix, et une augmen-tation consequente des volatilites realisees et implicites. Les puts hors de la monnaie sontalors echanges a une volatilite implicite plus haute que les calls en dehors de la monnaie,expliquant cette asymetrie negative.

Il y a aussi un effet de niveau. En general, les volatilites implicites sont plus basses pourles options de temps restant a maturite plus court (tous autres parametres fixes) compa-rativement aux options de temps restant a maturite plus long. La structure par terme dela volatilite implicite est donc croissante. Ce fait stylise est observe pour des conditions

Page 90: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

90 PRODUITS DERIVES

de marche ordinaires, sans mouvement violent du prix du sous-jacent. Dans certains casextremes, cette structure par terme peut etre decroissante. Comme il a ete souligne par ?,il est peut etre toujours plus ou moins possible de trouver des formes differentes, y comprisnon monotones, de structures par terme de volatilites implicites, si l’on explore toujoursplus de marches (action, change, etc.). Si l’on considere les options sur indice S&P500, parexemple entre Octobre et Novembre 1997, cette structure par terme a ete non monotone.Enfin, ? a montre une conjecture de ? stipulant que la nappe de volatilite ne pouvait passe deplacer par des translations paralleles, toute translation devant s’accompagner d’unchangement de forme plus profond de la surface.

Enfin un dernier fait stylise, plus anecdotique, est le fait que lorsque l’on estime un modeleautoregressif simple sur des series de volatilite implicite pour un meme ensemble d’optionssuivies au cours du temps (donc a maturite decroissante), a moneyeness fixe, le parametreautoregressif, de retour a la moyenne est lui-meme dependant du moneyness, a son toursous la forme d’un “smile” concave. L’interpretation la plus probable de cet effet etant dua la liquidite disponible pour les contrats etudies (moins liquides hors de la monnaie, doncretour a la moyenne plus faible). Pour plus de details, voir ?.

B Modelisation de la surface de volatilite

La modelisation precise de la nappe de volatilite prise dans son ensemble est un problemedifficile. Un des premiers travaux sur le sujet est celui de ? qui se livre a une etude des-criptive avec seulement deux maturites. De reelles avancees ont ete effectuees par ?, quisoulignent reellement l’importance de la structure par terme de la nappe de volatilite im-plicite. Cependant, il ne s’agissait pas d’expliciter un modele de dynamique pour la nappe,mais d’explorer les proprietes empiriques de cette structure par terme.

Des lors, ? introduisent l’Analyse en Composantes Principales pour tenter d’identitfierdes facteurs ou des variables d’etat a meme d’expliquer la forme de cette structure parterme. Cependant, ils se focalisent sur les options a la monnaie, et non sur l’ensemble dela surface de volatilite.

Avec les memes objectifs ? et ? ont tous deux travaille sur l’ensemble de la nappe devolatiilte. Le but de ? etait de modeliser directement la dynamique de la nappe a l’aidede processus stochastiques. Malheureuement, quoique tres (trop ?) ambitieux, ce type demodele rencontre des difficultes a maintenir les conditions de non-arbitrage. L’approchede ? est plus descriptive et statistique. Ils utilisent une decomposition de Karhunen-Loevepour identifier les facteurs possibles sur les indices SP500 et FTSE. Il s’agit essentielle-ment d’une decomposition en valeurs singulieres de l’operateur de covariance induit par lanappe. La premiere composante concerne les translations paralleles du niveau de la sur-face. La seconde composante est relative a l’asymetrie de la nappe (mouvements opposespour les strikes hors de la monnaie) et la troisieme controle les changements de convexite.Notons que ? etudie les variations de la nappe dans le temps (comme si elle ”flottait”), etnon pas l’evolution du smile dans le temps.

Page 91: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.3. L’EFFET SMILE ET SA CORRECTION 91

B Prise en compte de l’effet smile

La premiere solution est de proposer un modele approche de valorisation en approximantla volatilite par un polynome, par exemple d’ordre 2 :

C(t,H, k) = StΨ(a+ bk + ck2, k,H, rt) + v(t,H, k)

ou les parametres a, b, et c peuvent etre approximes par une methode de type moindrescarres. A chaque date t, on observe les options de caracteristiques Hj , kj , et de prixC(t,Hj , kj) ou j = 1, . . . , J . Les estimateurs sont alors solutions du programme :

(at, bt, ct) = argmina,b,c

J∑j=1

[C(t,Hj , kj)− StΨ(a+ bkj + ck2j ; kj ;Hj ; rt)]

2

Les estimateurs sont calcules en privilegiant la dimension transversale par actifs, on parled’estimation en coupe instantanee. Cette demarche peut s’apparenter a la reconstructionde la courbe des taux. Une des ameliorations serait de ponderer les termes de la fonctionminimisee, mais malheureusement, il n’existe pas de critere simple ou intuitif pour endeterminer les poids. Les residus d’estimation, a savoir les quantites :

C(t,Hj , kj)− StΨ(at + btkj + ctk2j ; kj ;Hj ; rt)

nous permettent de mettre a jour les erreurs de pricing.

4.3.3 Insuffisance du modele de Black-Scholes

Plusieurs raisons peuvent etre avancees pour expliquer l’insuffisance du modele de Balck-Scholes. L’hypothese initiale que nous avons avance pour developper toute cette modelisationest que le marche est suppose sans frictions et arbitrairement liquide. En pratique, il existedes couts de transaction. Le prix d’un produit derive etant celui de sa couverture, ces coutsde transaction induisent un choix (temporel au premier lieu) pour son detenteur dans samaniere d’ajuster son portefeuille. Il est cependant difficile de conclure que ces couts detransaction impliquent directement la presence d’un smile, mais nous devons garder a l’es-prit qu’en pratique des contraintes apparaissent.

De plus, le modele de diffusion de Black et Scholes n’est qu’un modele. Il implique pourl’actif etudie des log-rendements gaussiens, ce qui ne constitue pas une approximationrealiste : une telle distribution sous-estime les probabilites de rendements extremes obervessur le marche, comme nous en avons deja parle dans les sections precedentes.

Le modele de Black-Scholes est aise a comprendre et a manipuler. La dependance de la vo-latilite implicite en les autres parametres reste cependant en contradiction avec le modele.Mais un prix d’option est un prix de marche, restultant d’un mecanisme d’offre et dedemande. Par dela la dynamique de l’actif sous-jacent, les options refletent les anticipa-tions des agents, et constituent une sorte de vue des intervenants sur le marche a venir.Ainsi le modele de Black-Scholes ne doit pas etre considere comme une ”vue absolue” maisune facon d’observer le marche. On peut alors non plus essayer de specifier une diffusionexacte pour l’actif, mais d’ameliorer le lien entre le prix de l’actif et celui de l’option, par lamodelisation de la volatilite implicite. Pour les options les plus liquides, la problematique

Page 92: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

92 PRODUITS DERIVES

de valorisation n’a en fait que peu d’importance, car son prix juste est son prix de marche.? remarque que les volatilites implicites sont meme des ”alternatives aux prix de marche”.Ainsi, avec le temps, le modele de Black-Scholes n’est pas reste dans les usagescomme un modele de valorisation en tant que tel, mais comme un prisme ouune maniere robuste de lire ou de dechiffrer les informations du marche ou lesanticipations des agents.

On peut tenter de donner quelques interpretations pour essayer de comprendre l’effet smile.?, ? ou ? soulignent que cet effet est plus observe depuis le crack de 1987. Avant cettedate, la modelisation basee sur le modele de Black-Scholes etait plutot convaincante etfondee. Depuis, ? explique que les agents ont developpe une ”aversion au crash”, ce qui aaugmente le prix relatif de la protection, impliquant une asymetrie pour les puts hors dela monnaie. Les agents veulent se proteger des grands rendements negatifs. L’effet smilepeut aussi etre le resultat d’une oposition entre anticipations heterogenes sur le marche,des effets d’offre et de demande, et de volonte de protection contre les evenements rares.

Enfin, on peut parfois trouver dans la litterature que la presence d’un effet smile n’impliquepas pour autant l’existence d’opportunites d’arbitrage. En fait ?, utilisant les precedentsresultats de ?, ont trouve des conditionssuffisantes pour exclure la possibilite d’arbitragestatique. Ces conditions sont l’absence de butterfly spread, de call spread, et d’arbitrage decalendar spread (i.e. les adjacent vertical spreads, calendar spreads and butterfly spreadsont une valorisation positive).

Enfin, alors que les formes les plus communes de smile sont convexes, pour certains actifs,certaines options, sous certaines conditions de marche particulieres, on peut s’autoriser apenser que le smile prenne parfois des formes peu courantes, sans pour autant que celaimplique d’arbitrage tant que les conditions de ? sont verifiees.

4.3.4 Volatilite stochastique

L’existence du smile de volatilite montre en tout cas que le modele de Black et Scholesest mal specifie. La volatilite ne peut etre supposee constante. Une idee fut d’introduirede l’heterogeneite dans cette volatilite. Suppossons que sous la probabilite π, la volatiliteσ admette une densite f(σ) alors le prix d’un call de parametres t, H, k :

C(t,H, k) = StEσ[ψ(σ, k,H, r)] = St

∫ψ(σ, k,H, r)f(σ)dσ.

La volatilite implicite est alors solution de :

Ψ(σBS(t,H, k), k,H, r) =

∫Ψ(σ, k,H, r)f(σ)dσ.

La volatilite stochastique permet de decrire plus precisement la distribution reellementsuivie par les rendements financiers. On ne suppose plus, comme dans le cadre de Black-Scholes, que les parametres de tendance et de volatilite sont constants, mais on supposequ’ils dependent du temps :

dSt = St(µtdt+ σtdWt) (4.3)

Page 93: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.3. L’EFFET SMILE ET SA CORRECTION 93

σt est un processus stochastique, mais qui n’est pas deterministe en le temps ou le prix del’actif (ce cas etant le cadre de la volatilite locale). Le processus suivi par σt est gouvernepar un second mouvement brownien, pouvant etre correle avec W : σt = f(Yt) ou Yt estun processus stochastique Ft-adapte et f une fonction deterministe. Yt est souvent choiside maniere a etre un processus Markovien.

Un Premier Exemple - Voici un modele simple ou les rendements (simples) yt del’actif sous-jacent sont supposes suivre la dynamique suivante :

yt = σtεtlog(σ2

t ) = φ log(σ2t ) + ηt

ou σt est la volatilite instantanee (inobservable) et les perturbations (εt) sont independantes,indentiquement distribuees selon une loi gaussienne centree reduite. Le logarithme de lavolatilite suit un processus AR(1), εt et ηt etant independants. L’estimation de ces pa-rametres n’est pas aisee : la vraisemblance est difficile a exprimer, comme la volatilite nepeut pas etre directement observee (voir par exemple ?).

La specification d’un processus de volatilite stochastique est une facon de considerer la vo-latilite comme une quantite aleatoire. Les distributions de rendements ainsi obtenues sontplus realistes (et sont notamment a queues epaisses), un effet ”smile” peut etre observe,et la correlation entre Yt et Wt permet d’obtenir des lois asymetriques. Deux problemespersistent cependant : la volatilite reste inobservable et l’hypothese de marches completsn’est plus valide.

Le Modele de Heston - ? suppose que les prix d’un actif sous-jacent suivent la dyna-mique :

dSt = St(µdt+√σtdWt)

dσt = κ[θ − σt]dt+ σ√σtdZt

La volatilite suit un processus d’Ornstein-Uhlenbeck, ou le mouvement brownien Zt a unecorrelation ρ avec Wt. Dans ce cadre, il est possible de valoriser certaines options avec uneformule fermee. L’avantage principal de cette vue est de fournir une explication aux pro-prietes des prix d’options observes via une modelisation satisfaisante de la distribution desrendements. En fait, le parametre de correlation ρ impacte le skewness de la distributionde rendements. Lorsque ρ est positif, une augmentation des prix entraıne une augmenta-tion de la volatilite : la queue de distribution droite des rendements est plus epaisse quela gauche, en resulte un skewness positif. Une consequence sera que les calls hors de lamonnaie seront relativement ”plus chers” que les options dans la monnaie. En terme devolatilite implicite, le smile est directement impacte par cette asymetrie de prix.

Les effets du modele lui-meme doivent etre separes des effets de la correlation entre lavolatilite et les rendements de l’actif sous-jacent. Sans cette correlation, la volatilite sto-chastique (des lors aleatoire) contribue a l’augmentation des prix des options tres loin dela monnaie, relativement aux options dans la monnaie (en d’autres termes, une forme de”smile” est generee). Une correlation introduit quant a elle une asymetrie dans cette formeconvexe, avec des options dans la monnaie (relativement) moins cheres dans le cas d’unecorrelation positive.

Page 94: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

94 PRODUITS DERIVES

4.4 Marches Incomplets

Nous levons ici l’hypothese de completude des marches, nous perdons donc l’unicite dela probabilite risque-neutre. Nous avions vu que dans le cas continu, les marches etaientcomplets si il y avait plus d’alea dans la modelisation que d’actifs disponibles.

4.4.1 Formule generale de valorisation

Notons St le prix a la date t du sous-jacent. On considere un produit derive echangeableversant a la date t+H un flux g(St+H).

Proposition 4.4.1. Les conditions d’absence d’opportunite d’arbitrage impliquent l’exis-tence mais pas l’unicite d’une probabilite Qt,H telle que :

C(t,H, g) = B(t, t+H)EQt,H [g(St+H)]

ou B(t, t+H) est le prix en t du zero-coupon d’echeance t+H.

Prix d’un call : on s’interesse au prix d’un call europeen de maturite H et de strike K,K etant appele a prendre differentes valeurs. On fait l’hypothese que toutes ces optionssont echangeables avec suffisamment de liquidite, elles ont donc toutes un prix de marcheobservable. La formule de valorisation se reecrit donc :

C(t,H,K) = B(t, t+H)EQt,H [(St+H −K)+]

= B(t, t+H)∫

(s−K)+dQt,H(s)

= −B(t, t+H)∫∞K (s−K)+dQt,H(s)

ou Qt,H(s) designe la fonction de repartition de la probabilite Qt,H , qt,H designant sadensite, et Qt,H(s) = 1 − Qt,H(s). En integrant l’expression precedente par parties onobtient :

C(t,H,K) = −B(t, t+H)[[(s−K)Qt,H(s)]∞K −

∫∞K dQt,H(s)

]= B(t, t+H)

∫∞K dQt,H(s)

On derive alors cette expression par rapport au strike pour obtenir la loi risque neutre :

∂C∂K (t,H,K) = −B(t, t+H)(1− Qt,H(K))

∂2C∂K2 (t,H,K) = B(t, t+H)qt,H(K)

Ceci nous permet de formuler la remarque importante suivante :

Remarque 4.4.1. La connaissance de l’ensemble des prix des calls implique l’unicite dela probabilite Qt,H ce qui correspond a l’hypothese de marches complets.

On souhaite des lors reconstruire au mieux cette densite risque-neutre a l’aide des prixobserves, qui ne pourront jamais l’etre pour un continuum et une infinite de maturites, destrikes, etc.

Page 95: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.4. MARCHES INCOMPLETS 95

4.4.2 Reconstruction descriptive

Pour reconstruire cette densite, on suppose connu a la date t les prix des options dematurite H et de differents prix d’exercice Kj , j ∈ [1, . . . , J ] ranges par ordre croissant.En pratique, la demarche est la suivante : on recherche les probabilites risque-neutrescompatibles avec ces prix, puis l’on selectionne parmi celle-ci la distribution de probabilited’aspect le plus lisse de cet ensemble.

B Contraintes sur les prix

A partir des prix C(t,H,Kj), j ∈ [1, . . . , J ], on cherche a retrouver les contraintes im-posees par l’hypothese d’absence d’opportunite d’arbitrage sur C(t,H,K) pour un prixd’exercice donne. La fonction K 7→ C(t,H,K) est convexe et decroissante : des contraintesapparaıtront alors ce qui menera a un encadrement des prix du call :

C(t,H,K) < C(t,H,K) < C(t,H,K)

B Lissage

Le choix de la probabilite de valorisation s’effectue par le choix d’un critere tel que ledegre de lissage, la proximite du modele parametrique usuel, ou la compatibilite avec lesprix oberves. Il s’agit d’un probleme similaire a la reconstruction d’une nappe de taux apartir de prix d’obligations.

i) - Lissage par splines

Considerons une famille de fonctions K 7→ C(K, θ) decroissantes convexes, parametreesvia θ de dimension superieure ou egale a 4. On recherche donc des fonctions de valorisationqui seraient admissibles sur chaque intervalle [Kj ,Kj+1] derivables et s’ajustant aux prixobserves. Soit (Kj , cj) les prix observes et δj les pentes en ces points. Une formule devalorisation est alors :

K 7→J∑j=1

C(K, θj)1[Kj ,Kj+1](K)

ou le parametre θj est contraint par :

C(Kj , θj) = cjC(Kj+1, θj) = cj+1∂C∂K (Kj , θj) = δj

∂C∂K (Kj+1, θj) = δj+1

C(Kj , θj) = cj et C(Kj+1, θj) = cj+1

∂C

∂K(Kj , θj) = δj et

∂C

∂K(Kj+1, θj) = δj+1

Lorsque θ est de dimension 4, chaque valorisation se ramene au choix d’une suite possiblede valeurs δj , j ∈ [1, . . . , J ]. Par exemple, une facon de selectionner une suite, peut etre decontroler la convexite de la courbe vis a vis des δj . Cependant ce type de methode resteassez sensible au choix des prix d’exercice Kj autour desquels s’articulent l’estimation.

Page 96: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

96 PRODUITS DERIVES

ii) - Lissage par regression

On specifie une forme parametrique de la fonction de valorisation K 7→ C(K, θ). On estimeθ par la methode des moindres carres :

θJ = argminθ

J∑i=1

[cj − C(Kj , θ)]2

Il existe cependant de nombreuses limites a cette approche, seduisante sur le principe.Avant tout, l’estimation depend de la forme parametrique retenue. Ensuite les prix ajustessur les prix d’exercice ne coıncident pas toujours avec les observations : C(Kj , θJ) 6= cj .Enfin l’estimation ne prend pas en compte de potentiels effets de flux (heteroscedasticite,correlation). Ces limites peuvent cependant etre corrigees par la prise en compte d’unmodele plus complet.

Si l’on utilise la formule de Black-Scholes avec le taux court observe alors :

C(K, θ) = STΨ(σ,K/ST , H, rT ) et θ = σ

σJ = argminσ

J∑j=1

[cj − STΨ(σ,KJ/ST , H, rT )]2.

Si l’on utilise la formule de Black-Scholes avec le taux court calibre alors :

C(K, θ) = STΨ(σ,K/ST , H, r) et θ = (σ, r)

(σJ , r) = argminσ,r

J∑j=1

[(cj − STΨ(σ,KJ/ST , H, r))]2.

Si l’on utilise la formule de Black-Scholes avec de l’heterogenite sur la volatilite alors :

c(K, θ) = ST

L∑l=1

ΠlΨ(σl,K/ST , H, rT ) et θ = (σ, r)

(σJ , r) = argminσ,r

J∑j=1

[(cj − STΨ(σ,KJ/ST , H, rT ))]2.

iii) - Lissage par noyaux

On peut aussi exploiter la propriete exposee par ? stipulant que la densite des prix d’etats 1

peut etre approximee via la derivee seconde du continuum des prix de calls par rapportau strike :

∂2C

∂K2(t,H,K) = erTHqt,H(K)

On pourra aussi renvoyer a ? pour plus de details sur l’utilisation de cette formule.

1. Un complement sur ce concept est fourni au paragraphe 4.5 de cette section.

Page 97: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.5. COMPLEMENT : DENSITE DES PRIX D’ETAT 97

4.4.3 Reconstruction structurelle : information asymetrique

Dans ce paragraphe, on adopte une demarche inferentielle basee sur une demarche separantmodele latent et modele observable. On suppose obervables en t les prix de produits derivesversant des flux gj(St+H), j ∈ [1, . . . , J ], de prix associes C(t,H, gj). On peut introduire unalea supplementaire en supposant que le marche dispose d’un ensemble d’information plusprecis (c’est le modele latent) que l’econometre qui desire realiser une estimation et quine peut se baser que sur les observations du marche (modele observable). On suppose quel’ensemble d’information du marche est suffisant pour qu’il existe une unique probabiliteQt,H (absence d’opportunite d’arbitrage et marches complets) telle que :

V (t,H, gj) = B(t, t+H)

∫gj(s)dQt,H(s).

Notons Iinc l’information pertinente qui n’est pas accessible pour l’econometre. La valori-sation s’ecrit :

V (t,H, gj , Iinc) = B(t, t+H)

∫gj(s)dQt,H(s, Iinc).

Du point de vue de l’econometre, la mesure de valorisation est donc aleatoire (puisqu’iln’a pas acces a toute l’information). La relation precedente relie des prix observables auxvariables latentes vt,H que l’on definit par :

vt,H(s) = B(t, t+H)Qt,H(s) s ≥ 0.

Il s’agit de prix d’options digitales. Introduire un modele aleatoire sur ces prix permetdonc de deduire la loi des observables.

4.5 Complement : Densite des prix d’etat

Une option est caracterisee par une fonction de payoff φ(S.), aleatoire par sa dependancea la date T , des valeurs prises par un processus de prix sous-jacent (St)t. Si ce payoffdepend uniquement de la valeur terminale ST a la maturite T , l’option est dite europeenne.Cependant, une large classe d’options ont des payoffs qui dependent de l’histoire du pro-cessus sousejacent (options barrieres, americaines, panier, etc.) et sont dites exotiques.Schematiquement, le but de la valorisation d’options est toujours le meme et vise a don-ner un prix a toute nouvelle option, en respectant les conditions de non-arbitrage et encalibrant le modele de valorisation de maniere a se conformer aux prix de marche.

Certains travaux ont deja ete effectues pour envisager la valorisation d’options comme unprobleme inverse. Le defi principal a relever est d’inferer, a partir de prix observes d’optionseuropeennes, des quantites ou des fonctions pour valoriser des produits plus complexescomme des options exotiques. Pour realiser ceci, differents concepts sont utilises, que nousexplicitons ici.

4.5.1 Densite de prix d’etat - State Price Density

B Introduction

La valorisation de produits tres liquides n’est pas un souci car leur prix est leur prix demarche. Pour des options illiquides, le probleme est different lorsque l’on essaye d’estimer

Page 98: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

98 PRODUITS DERIVES

leur prix juste ou de detecter des opportunites d’arbitrage. Il est bien connu que le prixd’un produit derive sur un actif sous-jacent de processus de prix St, dont le payoff φ(ST ) aT , est l’esperance actualisee de ce payoff, conditionnellement a l’information disponible ala date de valorisation. Mais sous quelle probabilite ? Ceci a ete clairement identifie : sousla probabilite de marche appelee probabilite risque-neutre. Il est possible de montrer qu’ilexiste une probabilite Q (unique sous l’hypothese de marches complets) sous laquelle leprocessus actualise des prix est une martingale. Cela ne signifie pas que le processusde diffusion des prix de l’actif est sans derive ou martingale sous la probabilitehistorique. Si l’on note Pt le prix d’un produit derive qui delivre un payoff φ(ST ) a dateT , alors on a qu’a la date T :

Pt = IEQ[e−∫ Tt rsdsφ(ST )|Ft]

ou Ft est l’information disponible a la date t (incluant de possibles variables d’etat comme

le prix de l’actif St) ; rt est le processus de taux court ; B(t, T ) = IEQ[e−∫ Tt rsds|Ft] ou

B(t, T ) est le prix en t du zero-coupon qui delivre une unite de monnaie en T . En fonctiondu modele que l’on considere on peut avoir B(t, T ) = e−r(T−t) si le taux d’interet est

cristallise a sa presente valeur r ; on aura B(t, T ) = e−∫ Tt rsds dans le cadre d’un modele

deterministe.

B Definition

Pour comprendre le concept de densite de prix d’etat (ou State Price Density en anglais,SPD dans la suite) on pourra se reporter a ? ou ?. La SPD definit le prix d’un actifd’Arrow-Debreu i.e. un actif donnant une unite de monnaie a T si l’actif termine dansl’etat [y; y + dy] (voir ?). Dans un marche complet, ceci rejoint le concept de densiterisque-neutre (voir ?). Le prix Pt d’un produit derive de payoff φ(ST ) en T (avec un tauxcourt cristallise a r sa valeur courante) :

Pt = IEQ[e−r(T−t)φ(ST )|Ft] = e−r(T−t)∫ ∞

0φ(y)ft,T (y)dy (4.4)

ou ft,T (y) est la SPD a t pour les payoffs delivres a T . La SPD n’est pas une proprietede l’actif incrimine mais une maniere de caracteriser le prix de l’option a travers un outilemathematique utile. Sous la probabilite historique P :

Pt = IEP [φ(ST )Mt,T |Ft] =

∫ ∞0

φ(x)Mt,T (y)qHt,T (y)dy (4.5)

avec Mt,T qui est le facteur d’escompte stochastique, ou le Stochastic DiscountFactor (ou pricing kernel) qui est similaire dans l’esprit a une SPD par unite de probabiliteet peut etre vu comme le prix de marche d’un actif payant 1/qHt,T (y) unites de monnaie a T ,

si l’actif sous-jacent termine dans l’etat [y; y+dy]. On a que qHt,T est la densite de probabilite

sous la probabilite historique. On a alors clairement : Mt,T (y)qHt,T (y) = ft,T (y)e−r(T−t).

B Comment l’utiliser ?

Comme la SPD peut-etre reliee aux anticipations des agents, on peut esperer tirer profitde la difference entre la SPD estimee et la distribution historique realisee. Des strategiesbasees sur le skewness et le kurtosis sont proposees dans ?. Pour illustration, supposons

Page 99: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.5. COMPLEMENT : DENSITE DES PRIX D’ETAT 99

que nous travaillions avec des options de maturite fixe que l’on tient jusqu’a leur maturite.On espere acheter des options sous-evaluees et vendre des options sur-evaluees. Si la SPDimplicite a un skewness inferieur au skewness de de la densite historique, on tentera devendre des puts hors de la monnaie, et d’acheter des calls hors de la monnaie. Le skewnessetant un indicateur d’asymetrie, dans ce cas, la probabilite subjective des agents d’unrendement eleve est plus basse que ce que sous-tend la distribution historique.

4.5.2 Estimation

B Cadre initial

Le probleme est le suivant. On dispose a t, les prix de marche pour les calls europeensstandard CM (t, T,Ki) de maturite T et differents strikes Ki. Le payoff correspondant estφ(ST ) = (ST −Ki)

+. Pour simplifier, on supposera B(t, T ) = e−r(T−t). On veut estimerla probabilite Q (qui depend implicitement de t et T ), donc une densite qt,T telle que :

CM (t, T,Ki) = IEQ[B(t, T )(ST −Ki)+|Ft] = B(t, T )

∫qt,T (y)(y −Ki)

+dy

CM (t, T,Ki) = B(t, T )

∫ ∞Ki

qt,T (y)dy

Un resultat utile (et tres celebre) du a ? exprime qu’en derivant deux fois cette expressionrelativement a la variable de strike, on obtient :

∂2C

∂K2

∣∣∣t,T,Ki

= B(t, T )qt,T (Ki) (4.6)

Une fonction de valorisation est alors une fonction F telle que :

F : q(.) 7→ B(t, T )

∫q(y)(y −Ki)

+dy

On pourrait lisser la fonction K 7→ C(t, T,K) estimee avant de la deriver, il s’agit del’idee originale de ?. Cependant, il faut que cette probabilite satisfasse les conditions denon-arbitrage, tres sensibles aux methodes d’interpolation et de lissage. L’estimation non-parametrique est robuste a l’erreur de specification de modele mais est exigeante en termede temps de calcul, ce qui la rend trop lente. Au contraire, les methodes parametriques sontsimples, permettent d’etendre le domaine d’observation (strikes non cotes) mais peuventmener a une erreur de specification (modele faux). Quelques methodes sont ici presentees...

B Methodes parametriques

i) - Methodes d’expansion : les parametres sont calibres sur des prix d’options. LaSPD, prise comme une fonction de densite est calculee comme :

P (ST − St ≤ x) = Po(x) +∞∑k=1

αkPk(x)

ou les fonctions Pk sont de differents types (expansions d’Edgeworth, polynomes d’Hermite,etc.) et corrigent Po (qui peut-etre issu de la distribution normale ou log-normale). Onarrete le developpement en Pk a un ordre donne, et le modele devient parametrique. Leprincipal defaut de cette approche est que la distribution peut devenir negative, et que lesresultats les plus probants sont obtenus pour des options proches de la monnaie.

Page 100: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

100 PRODUITS DERIVES

ii) - Mixtures Lognormales : la SPD en t pour une maturite T et un actif S, est laquantite :

qt,T (ST ) =N∑k=1

wk.LN

(St − µkσk√T

)s.c.

N∑k=1

wk = 1

ou LN(.) est la loi lognormale, de moyenne r le taux sans-risque, d’ecart-type unitaire.Le prix de l’option est alors la moyenne ponderee par wk d’options de type Black-Scholespour differentes volatilites. Cette approche simple souffre d’un manque de justificationtheorique. En pratique les queues de distribution obtenues sont aussi trop fines.

B Methodes non-parametriques

i) - Methodes par noyaux : les estimations sont basees sur des prix d’option puisqueles prix de marche se basent a la fois sur la notion de payoff et d’anticipation des agents :dans ce cadre, le resultat 4.6 issu de ? est tres important. En prenant les memes notations,l’idee est d’estimer C par C, et d’estimer la SPD grace a :

e−r(T−t)(∂2C

∂K2)K=ST

Si Z est un ensemble de variables d’etat (strike, maturites,etc.), et que nous notonsZ1, . . . , Zn ses observations, C est donne par l’estimateur de Nadaraya-Watson :

C(Z) = E[C|Z] =

∑ni=1K((Z − Zi)/h)Ci∑ni=1K((Z − Zi)/h)

(4.7)

ou K(.) est un noyau non-parametrique classique et h une fenetre associee (bien quece concept devrait etre defini ici plus precisement). L’estimation non-parametrique de Csuppose que nous avons un nombre d’observations Zi suffisant. De plus, le noyau K doitetre suffisamment lisse pour obtenir un estimateur convenable de la derivee. Il doit y avaoirsuffisamment de variables d’etat pour obtenir une estimation correcte, mais pas trop nonplus. Une facon de contourner ce probleme est de considerer que le prix d’un produit derive(un call europeen par exemple) est son prix de Black-Scholes ou la volatilite est estimeenon-parametriquement. C’est l’approche developpee par ?. Si on peut directement lisser lesprix, alors on peut estimer la volatilite implicite a travers une regression non-parametriqueet la considerer comme un parametre des formules de Black-Scholes.

ii) - Methodes d’entropie : ces methodes sont presentees dans ? par exemple. Pourune probabilite P l’entropie s’ecrit :

S(P ) = −∫ ∞

0P (x)ln(P (x))dx.

On recherche alors la soluytion du probleme suivant :

maxP

S(P ) s.c.

∫ ∞0

P (x)dx = 1

Une idee serait de faire intervenir une autre probabilite dans la procedure d’estimation.Ceci peut etre fait en specifiant une probabilite a priori P (qui peut etre l’historique) etchercher une probabilite Q qui corresponde aux prix de marche des options, et soit aussi

Page 101: Guillaume SIMON Capital Fund Management · concepts fondamentaux d’ econom etrie de la nance et de la th eorie du portefeuille sera utilement compl et e par la lecture des ouvrages

4.5. COMPLEMENT : DENSITE DES PRIX D’ETAT 101

proche que possible de la probabilite a priori. On recherche donc la probabilite la plusproche en terme d’information theorique. Ceci se rapproche plus d’un probleme d’opti-misation contrainte que d’un cadre Bayesien. Par exemple, on peut tenter de minimiserl’information de Kullback-Leiber qui est :

S(P,Q) =

∫ ∞0

P (x)ln(P (x)

Q(x))dx