80
Rapport de stage : Elaboration et automatisation d’un outil d’estimation des taux futurs de cr´ edit Geoffrey NICHIL Master 2 ”Probabilit´ es, Statistiques et Applications”. Ann´ ee 2009 - 2010 Responsables de stage : Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM , BPLC, Metz. M. Philippe BONNEAU , professeur ` a l’Universit´ e de Metz. 1

Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Embed Size (px)

Citation preview

Page 1: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Rapport de stage :

Elaboration et automatisation d’un outil d’estimation

des taux futurs de credit

Geoffrey NICHIL

Master 2 ”Probabilites, Statistiques et Applications”.Annee 2009 - 2010

Responsables de stage :

Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM , BPLC, Metz.M. Philippe BONNEAU , professeur a l’Universite de Metz.

1

Page 2: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Remerciements :

Avant tout developpement sur cette experience professionnelle, il apparaıt opportun decommencer ce rapport de stage par des remerciements, a ceux qui m’ont beaucoup apprisau cours de ce stage, et meme a ceux qui ont eu la gentillesse de faire de ce stage un momenttres profitable.Je remercie Yannick GEROME pour son accueil dans le service Controle de Gestion qu’ildirige, Catherine BACH, mon maıtre de stage qui m’a forme et accompagne tout au longde cette experience professionnelle avec beaucoup de patience et de pedagogie.Enfin, je remercie les collaborateurs du service : David LYSZYK, Remy PRANIC, SebastienRICHARD, Julie SIMON, Erwan BARRET,Stephanie MENNET, Christelle SCHMITT,Jerome TACHON, Isabelle CHOLOT, Julie Millot, Anne Caroline SCHMITT et JacquesMOREAU pour les conseils qu’ils ont pu me donner au cours de ces cinq mois.

2

Page 3: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Resume :

L’augmentation du besoin de tresorerie de la BPLC, accentue par la diminution des commis-sions, tend a renforcer le besoin et meme la necessite de gerer au mieux la marge d’interetet egalement de pouvoir prevoir cette marge.

Les consequences d’une meilleur prevision de cette marge d’interet sont avant tout fi-nancieres ;en effet une prevision plus precise signifiera une diminution des couts des strategiesde couverture a mettre en place par la banque.(swaps)

Le but de mon stage etait de prevoir une partie de cette marge d’interet, en l’ocurenceles taux de credit.

D’un point de vue mathematique, il existe, comme je le montrerai dans ce rapport, deuxvisions pour modeliser les series financieres representant les taux de credit.La premiere consiste a supposer que les taux de credit sont fonctions des taux de marchedu fait du refinancement sur le marche interbancaire des credits accordes aux clients.J’aiutilise ici toutes les principales methodes de regression.La seconde vision, bien plus concrete a mon sens, est de modeliser les taux de credit uni-quement en fonction de leurs valeurs passees.J’ai pour ce faire modelise mes series sous la forme AR-GARCH et variantes lineaires etnon lineaires.Les modeles AR-GARCH permettent de prendre en compte des caracteristiques presentesdans les series des taux de credit que les autres methodes ne permettent pas, a savoir :– clustering de volatilite, ou variance heteroscedastique.– aspect leptokurtique.– effet de levier.– asymetrie perte/gain.– saisonnalite

Une troisieme vision existe egalement mais est bien plus difficile a mettre en oeuvre dans lapratique, il s’agit de modeliser les series des taux de credit par des VAR ou VAR-GARCHet variantes.

Mots cles :– regression, PLS, ARMA, GARCH, TGARCH , LSTGARCH, GJRGARCH, MGARCH,

IGARCH, VAR, RIDGE.– Risque de taux, risque de liquidite, swaps, marge d’interet, taux de credit, taux de marche.

3

Page 4: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Table des matieres

1 Le groupe BPCE 1

2 La banque Populaire Lorraine Champagne 32.1 La BPLC : un acteur majeur en Lorraine Champagne . . . . . . . . . . . . 32.2 Organigrammes de la BPLC et presentation des differents services . . . . . 3

3 Presentation de la gestion actif-passif 103.1 Presentation du bilan de la banque . . . . . . . . . . . . . . . . . . . . . . . 103.2 Organisation et definition de la gestion actif-passif . . . . . . . . . . . . . . 103.3 Presentation des risques geres par l’ALM . . . . . . . . . . . . . . . . . . . 11

4 Objectifs du stage et presentation des methodes utilisees 154.1 Premiere vision : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154.2 Deuxieme vision : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184.3 Point de vue pratique et ancienne methode de prevision . . . . . . . . . . . 19

5 Presentation des methodes utilisees 215.1 Le probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215.2 Modeles lineaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215.3 Modeles de regression non lineaires . . . . . . . . . . . . . . . . . . . . . . . 345.4 Modelisation ARCH/GARCH lineaire et non lineaire et modelisation AR

avec residus ARCH/GARCH lineaire et non lineaire . . . . . . . . . . . . . 365.5 Remarques sur l’estimation des parametres. . . . . . . . . . . . . . . . . . . 47

6 Estimations des parametres 486.1 Moindres Carres Ordinaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486.2 Moindres Carres Non Lineaires . . . . . . . . . . . . . . . . . . . . . . . . . 506.3 Maximum de Vraissemblance . . . . . . . . . . . . . . . . . . . . . . . . . . 516.4 Moindres Carres ou Maximum de vraissemblance ? . . . . . . . . . . . . . . 54

7 Backtesting des differentes methodes 567.1 Pret consommation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567.2 Pret immobiliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577.3 Pret equipement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4

Page 5: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

7.4 Pret epargne logement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577.5 Pret credit bail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

8 Impact de l’amelioration des previsions 59

9 Conclusion 63

5

Page 6: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

1 Le groupe BPCE

Le reseau des Banques Populaires, avec 9 400 000 clients (dont 3 460 000 societaires, c’esta dire des clients qui possede une partie du groupe) et plus de 3 391 agences (regroupantpres de 40 000 collaborateurs), fait partie du deuxieme groupe bancaire francais : le GroupeBPCE.

Le Groupe BPCE : Banque Populaire et Caisse d’Epargne se sont unies pour former en-semble le deuxieme groupe bancaire francais au capital de 37 millions de clients, 7 millionsde societaires et 120 000 collaborateurs.Partenaire financier majeur pour les particuliers, les entreprises et l’ensemble de l’economie,le Groupe BPCE developpe une offre complete de services bancaires, financiers et immobi-liers. Fidele aux valeurs cooperatives des Banques Populaires et des Caisses d’Epargne, ils’appuie sur l’ensemble de ses reseaux pour promouvoir une societe entreprenante et soli-daire.

Le reseau Banque Populaire est constitue de 18 Banques Populaires regionales, de la CAS-DEN Banque Populaire et du Credit Cooperatif. Autonomes, ces banques exercent tous lesmetiers de la bancassurance dans une relation de proximite avec leurs clienteles.

On resume ici l’organigramme du groupe BPCE :

Figure 1 – Organigramme BPCE.

Voyons maintenant les activites et le type de clientele du groupe BPCE.

1

Page 7: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Banque des entrepreneurs des sa creation, la Banque Populaire est aujourd’hui capabled’etre a la fois generaliste et specialiste afin de repondre aux attentes de chacun de sesmarches. Pour cela, elle federe le savoir-faire de ses differentes entites et couvre l’ensembledu territoire.

Cette somme d’expertises lui permet d’etre un acteur de reference sur des terrains aussidifferents que :

– l’epargne retraite des particuliers– l’assurance-credit ou l’affacturage pour les entreprises– l’economie sociale, la monetique et le financement de la franchise pour les commercants– la creation reprise d’entreprises pour les PME

La clientele est compose de :– particuliers– gestion privee et les activites immobilieres– professionnels

2

Page 8: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

2 La banque Populaire Lorraine Champagne

2.1 La BPLC : un acteur majeur en Lorraine Champagne

La Banque Populaire Lorraine Champagne compte parmi les acteurs economiques majeursde la region et connaıt de ce fait particulierement bien les preoccupations de ses interlocu-teurs.Elle est un important reseau bancaire regional en terme de parts de marche, et le nombre declients, particuliers et professionnels, qui lui accordent chaque jour leur confiance ne cessede croıtre.La Banque Populaire Lorraine Champagne attache une attention particuliere aux besoinset aux attentes de ses clients. Largement investie dans les nouvelles techniques de commu-nication et d’information, elle allie judicieusement proximite et technologie.Cette banque ”multi-canal”, offre a ses clients les avantages d’un contact personnalise dansune agence de proximite et la commodite des autres modes d’acces de la banque : internetavec LineBanque, le service de gestion de comptes en ligne, les automates, les services partelephone,ect...

2.2 Organigrammes de la BPLC et presentation des differents ser-vices

2.2.1 Differentes directions

Figure 2 – Organigramme BPLC.

DIRECTION GENERALE :La direction generale est celle qui prend toutes les decisions concernant la gestion de labanque et de ses objectifs, c’est a dire les orientations strategiques de la banque.

3

Page 9: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

DIRECTION FINANCIERE :La direction financiere et administrative (DAF) d’une banque supervise la gestion financierede cet organisme. Elle est chargee notamment :– d’optimiser la gestion des sources de capitaux et leurs emplois, dans une optique de

rentabilite et de maıtrise du risque– d’assurer les relations avec les apporteurs de fonds (proprietaires ou societaires, banques,

marches financiers...)– de rendre compte de la situation financiere aupres du Directeur general, du Conseil

d’administration, des autorites de surveillance (par ex. l’AMF), des auditeurs, des agencesde notation financiere

– de preparer les budgets et de suivre leur execution en collaboration avec le controleur degestion

– de fournir des simulations de rentabilite et de risque financier comme aide a la decisionpour les projets d’investissement importants et de mettre en perspective les grandsequilibres de l’institution.

– de preparer et mettre en oeuvre les operations financieres importantes (emissions detitres, introduction en bourse, fusion-acquisition)

– le plus souvent, de superviser la comptabilite, la tresorerie, les questions fiscalesEn resume elle doit garantir l’equilibre financier.

DIRECTION DES RESEAUX :La direction des reseaux doit remplir plusieurs missions : elle dirige d’abord les equipes desdifferentes agences en relation directe avec leurs responsables : elle joue le role d’animateur.Les agences sont regroupees en groupes (plusieurs agences) et secteurs (plusieurs groupes).Elle elabore ensuite le contenu de la politique commerciale et vise a sa bonne diffusion.Enfin, on lui assigne un certain nombre d’objectifs, que ce soit en termes de chiffres d’affairesou de developpement du nombre de points de vente.

DIRECTION ORGANISATION ET INFORMATIQUE :La direction organisation et informatique doit piloter l’ensemble des projets informatiquesde la banque et egalement assurer la maintenance du systeme informatique.La direction de l’organisation gere tous les projets notamment ceux lies a la fusion desBanques Populaires et des Caisses d’epargne.

AUDIT :L’audit interne est une activite de conseil qui certifie la regularite de la gestion grace ausuivi de ses procedures.L’audit interne est une activite independante et objective qui permet de donner a la banqueune assurance sur le degre de maıtrise de ses operations, lui apporte ses conseils pour lesameliorer, et contribue a creer de la valeur ajoutee. Ce service aide donc la banque aatteindre ses objectifs en evaluant, par une approche systematique et methodique, ses pro-cessus de management des risques, de controle, et de gouvernance d’entreprise, et en faisantdes propositions pour renforcer leur efficacite.

4

Page 10: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

DEVELOPPEMENT ET MARKETING :Le service developpement et marketing a pour but de proposer des services cibles a desclients cibles (et aussi par le choix de canaux specifiques : CRM).Ce service realise entre autres des etudes de satisfaction et contribue egalement a donnerune image de marque distinctive a la banque.Il existe trois dimensions dans le marketing :

1. Le marketing operationnel.

2. Le marketing organisationnel.

3. Le marketing strategique.

On peut remarquer a l’aide du graphique suivant que les differents marketing ont evolue atravers le temps.

Figure 3 – Evolution du marketing bancaire.

SECRETARIAT GENERAL :Le secretariat general supervise une ou plusieurs activites fonctionnelles majeures (ex. :Juridique et Contentieux, Personnel, Administratif, Informatique...) de l’entreprise.Il prepare et suit egalement la gestion des documents remis aux societaires, gere le paiementdes dividendes, etc.Generalement, il assiste au conseil d’administration et est membre du comite de direction.Enfin il rend compte au Directeur general.Ce service n’est plus present a la BPLC (ses activites sont effectuees par d’autres services).

5

Page 11: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

DIRECTION DES RESSOURCES HUMAINES :La gestion des ressources humaines est un ensemble de pratiques du management ayant pourobjectif de mobiliser et developper les ressources humaines pour une plus grande perfor-mance de l’organisation. C’est une activite qui doit tendre a ameliorer une communicationtransversale, tout en faisant respecter l’organigramme de l’entreprise.Leurs responsabilites couvrent en realite l’ensemble des relations humaines de la banque.Concretement, ce sont eux qui supervisent a la fois les relations sociales, l’administrationet la gestion du personnel, la formation, la communication interne, le management social.Place directement sous les ordres du directeur general, ils proposent une politique de ges-tion des ressources humaines et definissent les conditions generales d’application de cettepolitique. Ils ont egalement une mission de conseil, de negociation avec les representantsdu personnel et s’occupe aussi de la coordination de l’action des chefs du personnel.

CONFORMITE :Le service conformite doit :– Concevoir et mettre en place les controles en fonction des evolutions de la reglementation

de l’activite.– Verifier la mise en place au sein de chaque services des recommandations emises lors des

controles periodiques et audits internes et externes.– Realiser des reportings et comites pour la direction de la banque, les societaires et la

branche metier.

2.2.2 Direction financiere

Figure 4 – Organigramme Direction financiere.

SERVICE COMPTABILITE :Le service comptabilite gere le suivi de l’activite comptable (facturation, comptabiliteclients/fournisseurs, tresorerie, parfois l’administration des ventes).

6

Page 12: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Il etablit egalement des etats analytiques de gestion .Il gere enfin les declarations fiscales et sociales ainsi que la gestion des contrats d’assurancede l’entreprise.C’est ce service qui fournit par exemple le bilan (Actifs/Passifs) de la banque.

SERVICE CONTROLE DE GESTION :Ce service doit mesurer la performance et participer a l’elaboration de la gestion previsionnellede la banque.Il doit egalement mener des etudes de rentabilite relatives aux operations, aux produits,aux clients et aux differentes unites de la banque.

SERVICE TRESORERIE :Le service tresorerie doit controler les risques (gestion de devises, SICAV de tresorerie) etoptimise l’utilisation et la gestion des flux de tresorerie.La mission de ce service tourne autour de trois axes : l’optimisation des finances de l’en-treprise ce qui inclut la veille a l’evolution des marches financiers et la participation al’elaboration des strategies de gestion des risques.Cela comprend egalement la recherche de financements necessaires au developpement de labanque.C’est ce service qui par exemple, s’occupe d’acheter les couverture sur le marche preconisepar le controle de gestion.

SERVICE CONTENTIEUX :Ce service s’occupe de gerer les contentieux opposants la banque a ces contreparties defaillantes.Il s’occupe par exemple de vendre un bien hypotheque par un de ses clients qui n’est pluscapable de rembourser son credit.

SERVICE LOGISTIQUE :Ce service s’occupe d’approvisionner la banque en fournitures diverses(materiels de bureau,ampoules,...)

SERVICE IMMOBILIER :Le service immobilier gere le parc immobilier de la banque.

7

Page 13: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

2.2.3 Service controle de gestion-ALM-Etudes strategiques

Figure 5 – Organigramme Service Controle de Gestion.

On regarde ici le compte de resultat.Le compte de resultat est un document comptable synthetisant l’ensemble des charges etdes produits de la banque, pour une periode donnee, appelee exercice comptable.Ce document donne le resultat net, c’est-a-dire ce que l’entreprise a gagne (benefice) ouperdu (perte) au cours de la periode.Chaque service du controle de gestion travaille sur un domaine en particulier.

Figure 6 – Organigramme Service Controle de Gestion.

ALM :L’ALM analyse le bilan de la banque ainsi que son evolution dans le temps en fonction decertaines hypotheses (scenario) et mesure les differents risques lies a ce bilan.Cf. partie 3 pour les details.

PNB :

Le service PNB (produit net bancaire) s’occupe d’analyser les commissions et la marge

8

Page 14: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

d’interet. Il gere notamment l’allocation des budgets des differents services.

FRAIS GENERAUX :

Les frais generaux gere les comptes des salaires, l’achat du materiel informatique...

POLE CHIFFRE :

La cellule ”Pole Chiffre” repond a des demandes qui proviennent de quatre sources differentes :– Le service Marketing– L’equipe du projet CRM– La Direction Financiere– Le Reseau d’agences

Bien que la cellule realise d’autres travaux tels que des etudes descriptives ou des comptages,la cellule a quatre missions principales :

1. Le scoring

2. Les segmentations

3. Le geomarketing

4. Les retours d’Actions commerciales

9

Page 15: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

3 Presentation de la gestion actif-passif

3.1 Presentation du bilan de la banque

Un bilan comptable est un document qui synthetise a un moment donne ce que l’entreprisepossede, appele ”actif” (credits,etc.) et ses ressources, appele ”passif” (capital, reserves,emprunts, etc.).

Le bilan d’une banque est compose de l’actif (ou va l’argent) et du passif (d’ou vientl’argent).L’actif est compose de :

– l’actif clientele (80 pourcent de l’actif total) : il est compose principalement des credithabitats (40 pourcent) et des credits equipements non aide (30 pourcent).

– l’actif tresorerie (11 pourcent des l’actif total) : il est constitue majoritairement des pretsinterbancaires et des titres (OPCVM,...).

– l’actif structure (7 pourcent de l’actif total) : il est constitue des participations, descontentieux,...

Le passif est compose du :

– passif clientele (47 pourcent du passif total) : il est constitue en partie des CAV (comptesa vue), CSL (compte sur livret) et de l’epargne reglementee.

– passif tresorerie (36 pourcent du passif total) : il regroupe les emprunts interbancaires(26 pourcent) et le refinancement (2,7 pourcent).

– passif structure ( 16 poucent du passif total) : il est constitue en partie des fonds propres.

L’actif est donc principalement compose de l’actif clientele et le passif tresorerie sert acombler l’ecart (par le refinancement) entre actif et passif clientele.

On peut aussi remarquer que les operations de couvertures ( achat de swaps, caps, floors)de la banque n’apparaissent pas dans le bilan de la banque ; on les consigne dans le ”horsbilan”.Autre remarque : le bilan a l’actif doit toujours etre equilibre a celui du bilan passif. 1

3.2 Organisation et definition de la gestion actif-passif

La gestion actif-passif (ou ALM : Asset Liability Management) se definit par le fait d’ana-lyser le bilan de la banque ainsi que son evolution dans le temps en fonction de certaineshypotheses (scenario) et de mesurer les differents risques lies a ce bilan.

La direction generale determine sa politique de gestion actif-passif et rend compte au moinsune fois par an a son conseil d’administration.

Le controle permanent des activites de gestion actif-passif est assure par la direction des

1. Cf bilan en annexe

10

Page 16: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

risques de chaque banque populaire (BP) et de la BPCE.

Les objectifs de la gestion actif-passif sont varies :– contribuer au developpement commercial en maitrisant les risques propres a l’activite de

la banque de details– proteger les marges commerciales– determiner des couvertures adequates a la limitation de l’exposition aux risques de taux

et de liquidite et aux respects des limites– maitriser les risques de bilan en definissant des scenarios de stress et en liquidite

Les principaux acteurs de l’ALM sont :– departement gestion actif-passif– departement tresorerie– directeur financier– comite finance

La filiere ALM est controlee par deux services : la direction des risques et l’audit interne.

3.3 Presentation des risques geres par l’ALM

3.3.1 Le risque de taux

Le risque de taux est le risque de subir des pertes ou des gains sur la Marge d’interet, noteMI, en fonction d’une variation des taux de marche. La marge d’interet est la differenceentre le taux auquel la banque prete multiplie par le montant des prets et le taux auquella banque se refinance multiplie par le montant des refinancemenents (c’est a dire comblel’ecart entre passif et actif).La mesure porte sur le risque de taux structurel du bilan a l’exclusion de tout risqueautonome (trading, compte propre,...).

Ce risque est mesure en regardant la variation du rendement des actifs et passifs entraineepar une variation des taux.

Il existe deux visions d’analyse : une en statique et l’autre en dynamique.

– En vision statique : on fait evoluer le bilan et le hors bilan sans faire d’hypotheses deproduction nouvelle.L’objectif est d’eviter un report des risques dans le futur.La methode utilisee est celle de calculer un gap statique definit par :

gapstat = passif(bilan+ horsbilan)TF − actifs(bilan+ horsbilan)TF

– En vision dynamique : on integre les previsions commerciales et les previsions des postesde structures (actifs et passifs de structure).Le risque de taux en dynamique est mesure par la sensibilite de la marge d’interet a unevariation des taux :

MISC(t)−MI(t)/MI(t)

11

Page 17: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Donc les correlations de taux interviennent a l’actif sur les taux de credit.Si un taux de credit A est correle avec des taux de marche B et C, alors on peut connaitrela prevision de A en fonction de B et C car on connait les previsions de B et C. On peutdonc effectuer une prevision de la MI grace aux previsions de ces taux de credit car onconnait les volumes futurs.Remarque : Les scenarios de taux sont fournis par Natixis : c’est le scenario central, et lesautres sont des scenarios de stress.Remarque 2 : On peut egalement connaitre la prevision des taux de credit uniquementgrace a l’historique des taux de credit.

Une fois ces mesures effectuees (on appelle cela des indicateurs), on regarde si :

– en statique : le rapport gap-stat TF/Actifs TF pur de depart est en dessous d’un certainseuil (appele limite)

– en dynamique : la limite en sensibilite de la marge d’interet.

Figure 7 – Vision statique et dynamique.

3.3.2 Le risque de liquidite

Ce risque mesure :

– a court terme, la capacite de la banque a faire face a une crise brutale.– a moyen terme, le risque de combler l’ecart entre passif clientele et actif clientele, aussi

appele besoin de tresorerie.– a long terme, le niveau de transformation : c’est a dire le rapport entre les montants

d’emprunt a court terme sur le marche interbancaire et les montants des prets a longterme pour les clients ou entreprises.

En effet, la banque privilegie les emprunts a court terme sur le marche car leurs taux sontmoins important que les emprunts a long terme.Donc en vision statique, si le nombre et le volume de pret court interbancaire sont tropeleves la banque ne pourra pas financer ses credits sur le long terme.

Il y a comme pour le risque de taux, deux visions d’analyse : statique et dynamique.– En vision statique, on calcule le ratio d’observation (horizon 10 ans) :

Encours passift/Encours actift

– En vision dynamique, on veut mesurer le besoin de financement compte tenu du developpement

12

Page 18: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

commercial de la banque (horizon 3 mois) :

(Encours passif - Encours actif)t/Encours actift

On fixe maintenant certaines limites :– en statique : on limite le ratio d’observation a 85 pourcent et 90 pourcent pour la BPCE– en dynamique : on regarde le resultat d’un stress sur le bilan :

Impasse calcule apres choc/actifs avant choc

Les limites sont fixees a 0 pourcent.On regarde maintenant concretement comment sont presentees ces limites.

Figure 8 – Vision dynamique.

Pour equilibrer le bilan apres chocs ( et faire face au risque de liquidite) la banque doitdisposer de collateraux.Les collateraux sont des prets qui presentent des caracteristiques precises, comme parexemple etre couvert par une hypotheque.La banque est parfois oblige de se refinancer aupres de la BCE (ou autres organismes dumeme genre).Si la banque ne parvenait plus a rembourser ses emprunt aupres de la BCE, celle ci pourraitalors vendre l’actif a son propre compte.

3.3.3 Comment gerer ces risques ?

Le risque de taux : il faut prevoir les taux futurs de credit et de marches (determiner lescorrelations entre ces differents taux) et fixer les taux en achetant des swaps (ou caps etfloors).

Definition 1.Un swap est un echange de flux entre les interets d’un pret, reciproquement un emprunt, ataux variable contre des interets d’un emprunt, reciproquement un pret, a taux fixe.En cas de risque a hausse des taux : on va donc preter a taux variable et emprunter a tauxfixe, ce qui va neutraliser une partie de notre passif a taux variable.Et en cas de risque a la baisse on fera l’inverse.

13

Page 19: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Pour gerer le risque de taux en vision statique on peut :– soit emprunter a taux fixe– soit acheter un swaps emprunteur TF en cas de risque a la hausse des taux et emprunteur

TV en cas de risque a la baisse des taux

Pour gerer le risque de taux en vision dynamique, on doit considerer deux possibilites :– risque a la hausse des taux– risque a la baisse des taux

Exemple. Vision dynamique : hausse des tauxOn considere le bilan suivant :

Figure 9 – Bilan.

On est ici sensible a la hausse des taux.Dans ce scenario de hausse des taux la banque perdrait : 5−7

7 = −2/5 = −20 pourcent desa marge d’interet.Pour annuler ce risque on achete un swaps emprunteur TF de 200 euros.Le bilan devient donc :

Figure 10 – Bilan apres l’achat d’un swap.

Dans ce scenario de hausse des taux la banque perdrait : 6−66 = 0 pourcent de sa marge

d’interet.La banque n’est donc plus sensible en cas de hausse des taux.

Le risque de liquidite : on joue sur la duree des emprunts interbancaires.

14

Page 20: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

4 Objectifs du stage et presentation des methodes uti-lisees

Le but de mon stage etait la prevision des taux de credit, notee TC, sur une periode de 5ans. Cette prevision est notamment utile pour gerer au mieux les strategies de couverturedes differents risques et aussi pour la prevision de la marge d’interet.Un autre objectif etait de quantifier la hausse des taux de credit qu’engendrerait une haussedes taux de marche de un pourcent (scenario de crise).

Deux visions sont possibles pour effectuer une telle prevision.

4.1 Premiere vision :

On peut considerer que les taux de credit sont expliques uniquement par les taux de marche,notes TM.En effet lorsqu’une banque effectue un pret a un client (a l’actif ), cette banque doit biendisposer de l’argent pour le preter (au passif ). Elle doit donc effectuer elle meme un pretsur le ”marche interbancaire” (ie marche ou les banques s’echangent de l’argent) .L’argent achete sur ce marche est aussi soumis a un taux d’interet (CMS2,CMS3,...).Ces taux de marche sont notamment fonction de la duree des prets.

Prenons pour simplifier l’exemple suivant :

Exemple.Une banque effectue un credit a un client de 100 euros.Question 1 : Ou la banque va t-elle chercher l’argent ?Reponse : Sur le marche interbancaire.Par exemple :– 50 euros au taux CMS2 a 2 pourcent.– 50 euros au taux CMS3 a 3 pourcent.Question 2 : Comment la banque va t-elle determiner le taux auquel elle va effectuer soncredit ?Reponse : La banque n’etant pas une association a but non lucratif, elle doit degager unbenefice d’une telle operation.Etant donne que son pret sur le marche interbancaire lui coute :

50 ∗ 2

100+ 50 ∗ 3

100= 2.5 euros

La banque doit donc fixer sont taux de credit au client tel que :100 ∗ Taux > 2.5 euros, ie :Taux > 2.5

100 , ie : Taux = 2.5100 + ε, ou ε est le taux qui permet a

la banque de tirer un profit de cette operation.La derniere equation peut se reecrire :

Taux =50

100∗ CMS2 +

50

100∗ CMS3 + ε

Et on obtient un moyen de prevoir le taux de credit par une simple regression multilineaire.

15

Page 21: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

L’equation de l’exemple precedent peut bien sur etre generalisee avec k taux de marche.

En generalisant, on a donc montre que :

TCt = g(Y1, ..., Yk)t + εt

ou : TC represente le taux de credit, Yj represente un taux de marche, g est une fonctionlineaire en les variables Yj prises separement.

J’ai egalement remarque que certains taux de marche etaient fortement correles entre eux.J’ai donc effectue la meme modelisation que precedemment en excluant les taux de marchecorreles, ie :

TCt = g(Y1, ..., Yh)t + εt ou : Xi⊥Xj ∀i 6= j ∈ 1, ..., k

On peut egalement remarquer que les observations passees les plus recentes ont un im-pact plus important sur les valeurs futurs que les observations passees eloignes.C’est pourquoi j’ai effectue une regression multiple ponderee.Le vecteur poids etant determine pour l’observation i par : 2i

N∗(N+1) ou N est le nombre

total d’observations disponibles.

On peut compliquer legerement les choses en supposant que les taux de credit sont liesde maniere non lineaire aux taux de marche, on obtient alors un modele du type :

TCt = g(Y1, ..., Yk)t + εt

ou g est une fonction non lineaire en les variables Yj prises separement.J’ai effectue plusieurs regressions non lineaires, a savoir :– Regression quadratique, ou : g =

∑aiYi +

∑biY

2i .

– Regression cubique, ou : g =∑aiYi +

∑biY

2i +

∑ciY

3i .

– Regression logarithmique, ou : g =∑aiYi +

∑bi log(Yi).

– Regression ”racine carre”, ou : g =∑aiYi +

∑biY

1/2i .

Par soucis d’optimalite (ie gain de temps), j’ai egalement effectue ces regressions en choi-sissant, par ACP, le taux de marche ressemblant le plus au TC considere, a savoir :– Regression quadratique plus ACP, ou : g = aYj + bjY

2j ou Yj est tel que : R2(Yj , TC) =

max(R2(Y1, TC), ..., R2(Yk, TC)).– Regression cubique plus ACP, ou : g = aYj + bY 2

j + cY 3j ou Yj est tel que : R2(Yj , TC) =

max(R2(Y1, TC), ..., R2(Yk, TC)).– Regression logarithmique plus ACP, ou : g = aYj + bj log(Yj) ou Yj est tel que :R2(Yj , TC) = max(R2(Y1, TC), ..., R2(Yk, TC)).

– Regression ”racine carre” plus ACP, ou : g = aYj + bY12j ou Yj est tel que : R2(Yj , TC) =

max(R2(Y1, TC), ..., R2(Yk, TC)).

– Regression polynomiale d’ordre 7 plus ACP, ou : g =∑7i=1 aiY

ij ou Yj est tel que :

R2(Yj , TC) = max(R2(Y1, TC), ..., R2(Yk, TC)).

16

Page 22: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Un autre aspect, economique, apparait important pour la prevision des taux de credit :il existe un decalage dans le temps entre le moment ou la banque decide du taux de creditaccorde a son client et le moment ou elle se refinance sur le marche.J’ai donc cree des variables retardees des taux de marche.Par exemple, si TM1 = (1, 2, 3, 4)t alors le taux de marche 1 retarde d’un mois sera :TM1retard1 = (., 1, 2, 3, 4)t.J’ai choisis 15 mois comme retard maximal (arbitrairement).Le nombre de variables explicatives passe donc de 13 a 13 ∗ 15 = 195 et nous ne disposonsque de 60 observations passees sur les taux de marche et les taux de credit (historiquedebutant en 2005).

Deux problemes se presentent alors :– colinearite entre certains taux de marche.– nombre de variables trop important compare au nombre d’observations passees dispo-

nibles.

Une solution existe pour faire face a ces problemes : la regression PLS.Cette methode, comme toutes les autres d’ailleurs, sont expliquees dans la partie 5.En quelques mots, la regression PLS effectue une ACP entre les taux de marche et le tauxde credit considere.On determine alors des axes principaux, via l’ACP, les plus correles au taux de credit, et oneffectue la regression non plus sur les taux de marche mais sur les composantes principales.

J’ai egalement utilise des variantes de la regression PLS, a savoir :– la regression PLS quadratique : j’ai ajoute les taux de marche au carre avant de faire

l’ACP.– la regression PLS cubique : j’ai ajoute les taux de marche au carre et au cube avant de

realiser l’ACP.– la regression PLS inverse ; j’ai ajoute l’inverse des taux de marche avant de faire l’ACP.– la regression PLS logarithmique : j’ai ajoute le logarithme des taux de marche avant de

faire l’ACP.– la regression PLS kernel : au lieu de contourner le probleme de colinearite par ACP, on

cherche un nouvel espace vectoriel dans lequel les taux de marche ne sont plus colineaires.

Il existe egalement une alternative a la regression PLS, il s’agit de la regression RIDGE.Elle est egalement expliquee dans la partie 5.

Remarquons que pour toutes les methodes presentees jusqu’a maintenant, nous avons be-soin des previsions des taux de marche.Ces previsions sont effectuees par les economistes de Natixis.Donc la prevision des taux de credit est conditionnee par la bonne prevision des taux demarche.

Cette remarque conduit a la deuxieme vision pour modeliser et prevoir les taux de credit.

17

Page 23: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

4.2 Deuxieme vision :

On considere ici que les taux de credit sont uniquement expliques par leur passe.

La premiere methode, et la plus simple, que j’ai utilise est celle de Box et Jenkins : lamodelisation ARMA ou Auto Regressing Moving Average.Cette modelisation prend en compte les valeurs passees de la serie (partie autoregressive)ainsi que les valeurs passees et presente d’un bruit (partie moyenne mobile), c’est a dire unmodele de la forme :

Φ(p)(TCt) = Θ(q)(εt) ou : Φ et Θ sont les polynomes retard d’ordre p et q

Lors de cette modelisation je me suis rendu compte, contrairement a ce que font les modelesARMA, que la variance conditionnelle des taux de credit n’est pas constante dans le temps.Autre caracteristique importante des taux de credit que les modeles ARMA ne prennentpas en compte est celle de l’aspect leptokurtique de la distributions des erreurs : les queuesde distributions des erreurs sont plus grandes que celle d’une loi normal, usuellement uti-lisee dans la modelisation de Box et Jenkins.Ces deux aspects que ne considerent pas les processus ARMA m’ont conduit a modeliserles erreurs du processus ARMA par un processus GARCH (ou variantes) de facon a obtenirune modelisation AR-GARCH.

Voici toutes les variantes que j’ai utilisee :– Modele GARCH avec residu suivant une loi normal, student et ged– Modele EGARCH avec residu suivant une loi normal– Modele TGARCH avec residu suivant une loi normal et student– Modele MGARCH avec residu suivant une loi normal et student– Modele IGARCH avec residu suivant une loi normal et student– Modele GJRGARCH avec residu suivant une loi normal, student et ged– Modele LSTGARCH avec residu suivant une loi normal, student et ged– Modele AR-GARCH avec residu suivant une loi normal, student et ged– Modele AR-EGARCH avec residu suivant une loi normal– Modele AR-TGARCH avec residu suivant une loi normal et student– Modele AR-MGARCH avec residu suivant une loi normal et student– Modele AR-IGARCH avec residu suivant une loi normal et student– Modele AR-GJRGARCH avec residu suivant une loi normal, student et ged– Modele AR-LSTGARCH avec residu suivant une loi normal, student et ged

Une troisieme vision existe aussi.C’est en realite un melange des deux visions dans le sens ou on va modeliser les taux decredit en fonction du passe des taux de marche mais aussi en fonction du passe des tauxde credit.

La premiere methode que j’ai utilise est un VAR ( vector autoregressive) comprenant untaux de credit et le taux de marche le plus ressemblant a ce taux de credit (selection parACP).

18

Page 24: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Le second modele est un VAR-GARCH comprenant un taux de credit et le taux de marchele plus ressemblant.

Voici pour resumer, et en fonction des differentes visions, l’ensemble des methodes quej’ai utilise :

Methodes faisant intervenir les TM Methodes ne faisant pas intervenir les TM :Regression multiple ARMA de Box et JenkinsRegression multiple avec poids Modele GARCH loi normal, student et gedRegression multiple sans colinearite Modele EGARCH loi normalRegression multiple avec poids et sans colinearite Modele TGARCH avec residu loi normal et studentRegression multiple avec poids et sans colinearite Modele MGARCH loi normal et studentRegression multiple avec poids et sans colinearite Modele IGARCH loi normal et studentRegression quadratique + ACP Modele GJRGARCH loi normal, student et gedRegression cubique +ACP Modele LSTGARCH loi normal, student et gedRegression polynomiale d’ordre 7 + ACP Modele AR-GARCH loi normal, student et gedRegression racine carre + ACP Modele AR-EGARCH loi normalRegression logarithmique + ACP Modele AR-TGARCH loi normal et studentRegression inverse +ACP Modele AR-MGARCH loi normal et studentRegression quadratique Modele AR-IGARCH loi normal et studentRegression cubique Modele AR-GJRGARCH loi normal, student et gedRegression logarithmique Modele AR-LSTGARCH loi normal, student et gedRegression inverseRegression racine carreRegression PLSRegression PLS quadratiqueRegression PLS cubiqueRegression PLS inverseRegression PLS logarithmiqueRegression PLS kernel Regression RidgeVAR + ACPVAR + ACP +GARCH

4.3 Point de vue pratique et ancienne methode de prevision

D’un point de vue pratique l’objectif de mon stage etait la modelisation et la prevision decertaines donnees ( taux de credit ou TC) sur une duree de 5 ans.Le but etait egalement d’automatiser cette prevision pour qu’elle soit reproductible dansle temps.J’ai donc du utiliser les logiciels suivant : SAS, R, Teradata (SQL) et VBAExcel pour lamise en forme ( eviews ne permettant pas une automatisation des previsions je ne l’ai pasutilise).

La premiere etape de mon projet etait de creer la base de donnees des TC ( ie l’histo-rique des TC).Les informations du groupe BP (=donnees) sont stockees dans un ”datawarehouse”(=entrepot

19

Page 25: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

de metadonnees) situe a Paris. Les differentes donnees sont stockees dans des tables ac-cessibles via un site intranet. J’ai donc d’abord du trouver ou se situaient les donnees quim’interessait.Une fois les tables trouvees, les donnees ont ete extraites a l’aide du logiciel Teradata (lan-guage SQL). 2

J’ai ensuite traite et trie ces donnees sous SAS puis la plupart des modelisations ont eterealisee avec SAS et quelques unes avec R .

D’un point de vue economique nous avons deja demontre que les TC peuvent etre ex-pliques par les taux de marche, ou TM (il a egalement fallu trouver l’historique des TMdans l’entrepot de donnees et les importer via teradata 3)La methode de prevision utilisee par la BP est une regression ”multiple” de la forme sui-vante :

TCi = TMjRetardk + TMjRetardl

∀i ∈ 0, ..., 17 ∀j ∈ 0, ..., 12 ∀(k, l) ∈ 0, ..., 152 tel que :k 6= lou : TMjRetardk correspond a un TM numero j retarde de k mois.

Ce modele est bon lorsqu’il s’agit de reperer le TM qui influence le plus le TC considere,mais il est moins bon pour faire de la prevision .En effet dans un modele plus le nombre de variables explicatives est important meilleuresera la prevision.Autre defaut de ce modele : son temps d’execution (environ 18 heures).

2. Cf annexe 2 pour les procedures d’import.3. Cf annexe 2 pour les procedures d’import.

20

Page 26: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5 Presentation des methodes utilisees

5.1 Le probleme

On dispose de l’historique de 19 TC ainsi que de l’historique de 13 TM sur une periode de5 ans.Ces TM sont censes expliquer les TC.

On note yi = (yi1, ...yin) les taux de credit ( ∀i = 1...19 et n = 60).On note xi = (xi1, ...xin) les taux de marche ( ∀i = 1...13 et n = 60).

Le but de mon stage etait de prevoir les TC sur une periode 5 ans.

Ayant deja vu les autres methodes en cours, je ne rentrerai dans les details que pourla modelisation GARCH.

On commence par presenter rapidement les modeles lineaires les plus connus :

5.2 Modeles lineaires

5.2.1 Regression multiple d’un TC en fonction de tout les TM

Les donnees :

On considere une variable a expliquer yi (representant un TC) et des variables explica-tives xi ∀i ∈ 1, ..., n(representant les TM) tel que :

yi = (yi1, ..., yin)t et xi = (xi1, ...xin)t = et X = (x1, ..., x13)t

On note pour alleger les notations : y = yi ∀i.

Le modele :

On suppose l’existence d’une relation de la forme :

y ' AX

C’est a dire une relation du type :

y = AX + ε

ou :ε est le terme residuel (variable aleatoire) representant tout ce que le modele y ' AXest incapable d’interpreter.Remarquons que : ε est tel que : E(ε) = 0 et E(εtε) = σεId et cov(εt, εh) = 0 ∀t 6= h.On peut noter que dans dans notre cas, ε peut representer l’effet de la concurrence sur lavariation des taux de credit.

21

Page 27: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Remarque.Il est important de supposer que la matrice X est de rang plein.Dans le cas contraire : ∃v tel que : Xv = 0 et ∀A : XA = X(A+ v).Donc l’estimateur A+ v est aussi performant que A.On ne pourra donc pas determiner A a moins de faire des hypotheses restrictives.On peut egalement constater que si X n’est pas de rang plein alors la matrice XtX n’estpas inversible ( → probleme lors des MCO).

Notons que le modele est ici semi-parametrique car la loi des residus n’est pas precisee.

L’estimation de A et σ2ε :

Definition 2. Soit SS(A) la somme des carres des erreurs de prediction, definie par :

SS(A) =‖ y −XA ‖2=∑i

‖ yi − xiA ‖2

L’estimateur de A au moindre carre ordinaire est :

A = argminASS(A) = A tel que : ∀B : SS(A) < SS(B)Notons que l’estimateur MCO est identique a celui obtenu par la technique du maximumde vraissemblance.

Remarque.Concretement et graphiquement, ceci consiste a minimiser la somme des carres des dis-tances entre les points et la droite, distance mesuree verticalement, comme on le voit surla figure suivante.

Figure 11 – Regression

22

Page 28: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Voyons maintenant quelques proprietes utiles :

Proposition 1.

1. A = (XtX)−1Xty

2. A = A+ (XtX)−1Xtε

3. A est sans biais, ie : E(A) = A

4. V (A = σ2ε(XtX)−1

Remarque.La premiere proposition donne un moyen simple de calculer l’estimateur A dans le cas oula matrice X est de rang plein.

Qualite du modele :”Le R2”.

Definition 3.R2 est le coefficient de determination ( ou part de variance expliquee), il est definit par :

R2 =(∑i(xi − x)(yi − y))2∑

i(xi − x)2∑i(yi − y)2

=cov(X,Y )

V (X)V (Y )

Interpretation du R2 : R mesure la correlation entre les variables explicatives et la va-riable a expliquer ⇒ qualite du modele !

Critique du R2 :– plus le nombre de variables explicatives augmente plus le R2 augmente.– R2 est une variable aleatoire dont la distribution depend de la repartition des regresseurs.

Pour remedier a la premiere critique on utilise le R2 ajuste definit par :

R2ajust = 1− σ2

ε(n− 1)

TSS

ou : TSS = RSS + ESS =∑i ε

2i +

∑i(yi − y)2

Remarque.Il est egalement possible d’ajouter un poids aux observations xij.En effet lorsque l’on veut prevoir le comportement d’une serie financiere, les valeurs passeestres eloignees ont moins d’importance que les valeurs passees recentes.J’ai donc realise la meme regression qu’auparavant en ajoutant un vecteur poids.

23

Page 29: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Le seul probleme ici est de determiner correctement le vecteur poids.J’ai donc definit le vecteur poids pour chaque observations de la maniere suivante :

Pobsi =2i

n(n+ 1)

On a ainsi :∑i Pobsi = 1.

5.2.2 Regression multiple d’un TC en fonction des TM non correles

Avant d’effectuer ces regressions, j’ai effectue une ACP sur les taux de marche pour detecterd’eventuelles autocorrelations parfaites.Cette ACP a etait realiser sous SAS.

Les resultats de l’ACP sont les suivants :– on regarde la representation des taux de marche sur les composantes principales :

Figure 12 – ACP des taux de marche.

24

Page 30: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

– on regarde la matrice des correlations des taux de marche

Figure 13 – Matrice des correlations.

On voit clairement qu’il y a autocorrelation parfaite entre certains taux de marche.L’autocorrelation parfaite est genante car elle rend impossible l’inversion de la matriceXtX.Cependant, les correlations etant proche de 1 mais differente de 1, on pourra tout de memeinverser cette matrice.

On va donc effectuer la meme regression multiple que precedemment mais en excluantcertains taux : CMS3A CMS4A CMS15A EURIB1M EURIB3M .

Remarque. J’ai, comme pour la regression precedente, rajoute un vecteur poids (le meme).

25

Page 31: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.2.3 Regression PLS

Si l’on veut incorporer dans les variables explicatives les taux de marche retardes jusqu’a15 mois : le nombre de variables explicatives passe de 13 a 15 ∗ 13 = 195 ! ! !Or l’historique disponible sur les TC et les TM n’est que de 60 observations.Autre probleme : certaines variables explicatives sont extremement correlees les une parrapport aux autres.

Donc pour resume, il y a deux problemes si l’on considere les variables explicatives re-tardees :– correlations entre les variables explicatives.– nombre de variables trop important compare au nombre d’observations.Il existe une methode qui permet de resoudre ces deux problemes : la regression sur com-posantes principales.La regression sur composantes principales consiste a effectuer une ACP sur les variablesexplicatives, puis a determiner les axes principaux et enfin a effectuer la regression sur lescomposantes principales et non plus sur les variables explicatives de depart.

Le probleme est qu’ici lors de l’ACP, on choisit les composantes principales qui ressemblentle plus aux TM ( en maximisant le R2 entre les TM).Or on voudrait que les composantes principales ressemblent le plus aux TC, c’est ce quefait la regression PLS.

Presentation de la regression PLS :

On cherche donc a modeliser une variable y en fonction de variables explicatives x1, ..., xp.On note ici : y = yi ∀i = 1...13.

Premiere etape :On construit la composante t1 :

t1 = w11x1 + ...+ w1pxp

ou : w1j =cov(xj ,y)

(∑pj=1 cov(xj ,y)

2)1/2

Remarque.Dans la pratique les series chronologiques representant les taux de marche ou de credit nesont generalement pas completes.On appelle cela des donnees censurees.On a vu cette annee en biostatistique qu’il etait plus judicieux de garder cette valeur man-quante plutot que de chercher a interpoler la valeur, et de la considerer comme une infor-mation supplementaire.L’avantage de la methode PLS compare aux autres methode de regression est qu’elle permetde traiter ces donnees censurees.Si il y a des donnees manquantes, on va legerement modifier les formules.Notons xji la valeur de la variable xj a l’observations i.

26

Page 32: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

∀i, on pose :

t1i =

∑j : xj existe w

′′1jxji∑

j : xj existe(w′′1j)

2

ou : w′′1j =w′1j

(∑pj=1(w

′1j)

2)1/2

ou : w′1j =

∑i : xji et yi existe xjiyi∑i : xji et yi existe y

2i

Le logiciel SAS ne permet malheuresement pas d’utiliser cette version de la regression PLS.

On effectue ensuite la regression de y sur t1 :

y = c1t1 + y1

ou : c1 est le coefficient de regression et y1 est le residus.Ceci equivaut a :

y = c1w11x1 + ...+ c1w1pxp + y1

Etape 2 :

Si le pouvoir explicatif de cette regression est trop faible, on cherche a construire unedeuxieme composante t2 combinaison lineaire des xj non correle a t1 et expliquant bien leresidu y1 :

t2 = w21x1 + ...+ w2pxp

ou : w2j =cov(x1j ,y1)

(∑pj=1 cov(x1j ,y1)2)1/2

Remarque.On adapte de la meme facon que precedemment les formules dans le cas des donneesmanquantes.

On effectue ensuite la regression de y sur t1 et t2 :

y = c1t1 + c2t2 + y2

Et ainsi de suite...

Remarque.Le nombre de composantes a retenir est habituellement determine par validation croisee.Pour chaque valeur h, on calcule la prevision yhj et yh(−j) de yj a l’aide du modele a hcomposantes, calcule en utilisant toutes les observations puis sans utiliser l’observation j.On calcule ensuite les deux criteres suivants :– RSSh =

∑j(yj − yhj)2

– PRESSh =∑j(yj − yh(−j))2

On retient la composante si :

(PRESSh)1/2 6 O.95(RSSh−1)1/2

27

Page 33: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.2.4 Modelisation ARMA

Dans la suite on note : Y = yi ∀i = 1...13.

J’ai voulu ici voir si les taux de credit ne pouvaient pas etre uniquement modelises enfonction de leurs valeurs passees sans autres variables explicatives.

Generalites sur les series temporelles.On rappelle ici la definition d’une serie temporelle, d’un bruit blanc et de l’operateur retard :

Definition 4.

1. On appelle serie temporelle discrete , et on note (Yt)t∈Z, toute suite de nombres reelsindexee par Z.

2. On definit le polynome retard, note Φ(L), par :

Φ(L)Yt = Yt − φ1Yt−1 − ...− φpYt−p

3. (εt)t∈Z est un bruit blanc (faible), note εt ∼ BB(O, σ2ε), si :

(a) E(εt) = O

(b) E(ε2t ) = σ2ε 6 +∞

(c) cov(εt, εt+h) = fonction(h)

(d) E(εtYt′) = 0 ∀t 6= t′

Une serie temporelle (Yt)t∈Z est stationnaire au second ordre si :– E(Yt) = m– E(Y 2

t ) ≤ ∞– cov(Yt, Yt+h) = fonction(h)Donc la stationnarite au second ordre (ou au sens faible) implique la stationnarite enmoyenne et en variance.

Pour stationnariser une serie en moyenne on utilise un filtre (=application lineaire) ap-pele ”operateurs des differences premieres” : ∆Yt = Yt − Yt−1.Pour stationnariser une serie en variance on utilse la transformee de Bose -Cose :

BCλ = (Y λt−1) si λ 6= 0 et BCλ = log(Yt−1).

Pour stationnariser une serie en variance et en moyenne, on commence par la stationnariseren variance et ensuite en moyenne.

28

Page 34: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

On donne maintenant quelques caracteristiques des series temporelles :

Definition 5.Soit (Yt)t∈Z une serie temporelle.

1. Fonction d’autocovariance : γh = cov(Yt, Yt+h)

2. Fonction d’autocorelation : ρh = γhγ0

3. Fonction d’autocorelation partielle : φhh determinee par l’algorithme de Durbin. 4

4. Fonction de densite spectrale : f(ω) = 12π

∑+∞i=−∞ γhe

iωh

La non stationnarite peut etre reperee :– par son graphe.– par le graphe de la fonction d”autocorrelation note ρh (ρh diminue tres lentement).– par la fonction de densite spectrale : fortes valeurs pour les frequences basses. (lien avec

l’analyse spectrale)– par des tests de stationnarite ( ils sont abordes a la fin de cette partie).

Processus ARMA.

En 1970 Box et Jenkins ont introduit les processus ARMA (autoregressing moving average).Le but est de modeliser une serie temporelle en tenant compte de ses valeurs passees(AR)et des valeurs passees et presente d’un bruit (MA).La procedure comporte 4 etapes : Identification du modele-Estimation des parametres-Validation du modele-Prevision.

Definissons tout d’abord ce qu’est un processus ARMA.

Definition 6.

1. On appelle processus autoregressif d’ordre p, note AR(p), toute serie temporelle verifiant :Φ(L)Yt = εt, ou : εt ∼ BB(O, σ2

ε).

2. On appelle processus moyenne mobile d’ordre q, on note MA(q), toute serie temporelleverifiant : Yt = Θ(L)εt ou : εt ∼ BB(O, σ2

ε).

3. On appelle processus autoregressif moyenne mobile d’ordre p et q, note ARMA(p,q),toute serie temporelle verifiant : Φ(L)Yt = Θ(L)εt ou : εt ∼ BB(O, σ2

ε).

On peut montrer qu’un ARMA(p,q) est stationnaire si toutes les racines de son polynomeretard sont strictement inferieure a 1.

Etape 1 : Identification du modele.On determine les ordres p et q a l’aide du resultat suivant :

1. Pour un AR(p) : φkk = 0 ∀k ≥ p2. Pour un MA(q) : ρk = 0 ∀k ≥ q

4. Cf. Econometrie des series temporelles, Sandrine Lardic.

29

Page 35: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Etape 2 : Estimation des parametres.L’estimation des parametres repose sur la methode du maximum de vraissemblance. 5

Etape 3 : Validation du modele.

1. Tests sur les parametres.L’objectif est de comparer un ARMA(p, q) et un ARMA(p′, q′).

(a) H0 : ARMA(p− 1, q)(φp = 0) et Ha : ARMA(p, q)(φp 6= 0)

On calcule la statistique de student associe : tφp =φpσφp

Regle de decision : si tφp < 1, 96 : on accepte H0.

(b) On procede de la meme facon pour tester : p′ = p, q′ = q−1 ou p′ = p−1, q′ = q...

Remarquons qu’il est impossible de tester simultanement p′ = p+ 1 et q′ = q + 1 cartout processus admettant une modelisationARMA(p, q) admet aussi une representationARMA(p+ 1, q + 1).

2. Tests sur les residus.On cherche a verifier si les residus sont des bruits blancs :

(a) Test d’autocorrelation : on utilise le test de Ljung-Box. 6

(b) Test d’homoscedasticite : on utilise le test ARCH de Engle. 7

3. Criteres de choix.Une fois les precedents tests effectues et s’il y a encore plusieurs modeles, on lesdepartage a l’aide des criteres suivants (on cherche a les minimiser) :– Criteres standards

(a) MAE = 1T

∑t |εt|

(b) RMSE = ( 1T

∑t ε

2t )

12

(c) MAPE = 100T

∑t |

εtXt|

– Criteres d’informations, bases sur la quantite d’informations de Kulback 8

(a) AIC(1969) : log(σ2εt) + 2p+qT

(b) SIC(1977-1978) : log(σ2εt) + 2p+qT log(T )

(c) HQ (1979) : log(σ2εt) + α(p+ q) log( log(T )

T )

Etape 4 : Prevision.On a vu precedemment qu’un ARMA(p,q) s’ecrit : Φ(L)Xt = Θ(L)εt, ie :

Yt = φ1Yt−1 + ...+ φpYt−p + εt − θ1εt−1 − ...− θqεt−q

Une fois l’estimation effectuee, cela donne :

Yt = φ1Yt−1 + ...+ φpYt−p − θ1εt−1 − ...− θqεt−q + cste

5. Cf Econometries des series temporelles, Sandrine Lardic et partie 6.6. Cf Econometries des series temporelles, Sandrine Lardic.7. Cf Econometries des series temporelles, Sandrine Lardic.8. Cf annexe 5.

30

Page 36: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Test de non stationnarite.

Les ARMA ne peuvent etre effectues que sur des series stationnaires.La non stationnarite est eliminee par le filtre des differences premieres, mais ce filtre intro-duit parfois des mouvements parasites.

Les cas de non stationnarite sont regroupes en deux groupes :– processus TS (trend stationnary) : non stationnarite de type deterministe.– processus DS (difference stationnary) : non stationnarite de type stochastique.

Notons qu’un processus DS repose sur la presence de racine unitaire dans le polynome deretard associe au processus ARMA.

Nous allons maintenant voir les differents tests de racines unitaires.

1. Test de Dickey Fuller (DF).L’hypothese nulle, note H0, de ce test est la non stationnarite d’un AR(1), ie : φ1 = 1.L’hypothese alternative, note Ha, de ce test est la stationnarite d’un AR(1), ie :φ1 6= 1.

– Il existe trois modeles de base pour ce test :

(a) M1 : modele sans constante ni tendance, ie sous Ha : Yt = φ1Yt−1 + εt

(b) M2 : modele avec constante et sans tendance, ie sous Ha : Yt = φ1Yt−1+µ(φ1−1) + εt

(c) M3 : modele avec constante et tendance, ie sous Ha : Yt = φ1Yt−1 + µ(φ1 −1)− β + εt

– Sous H0, et quelque soit le modele on a une non stationnarite de type DS.– Mise en pratique du test de DF.

Le test est en realite effectue sur les variations des variables, donc sur : Yt − Yt−1.Regle de decision : si la valeur de la T-stat est inferieur aux valeurs tabulees parDickey et Fuller alors on rejette l’hypothese nulle.La mise en pratique du test peut etre representee par le schema represente enannexe 4.

– Le test de Dickey Fuller presente une limite : il suppose que les residus sont desbruits blancs, or dans la pratique ce n’est pas souvent le cas. Si les residus sontautocorreles : avoir une racine unitaire en ce qui concerne la variable endogene negarantit pas la presence d’un processus non stationnaire.

2. Test de Dickey Fuller augmente : c’est une correction parametrique du test de DF. 9

3. Test de Phillips-Perron : c’est une correction semi-parametrique du test de DF. 10

9. Cf Econometrie des series temporelles, Sandrine Lardic10. Cf Econometrie des series temporelles, Sandrine Lardic

31

Page 37: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.2.5 Modelisation VAR

Les VAR (Vector Autoregressive) sont une generalisation des AR au cas multivarie.Ils ont ete introduits par SIMS en 1980 comme alternative aux modeles macro-economiquekeynesien 11 .Un VAR prend en compte le passe de la variable que l’on veut expliquer (ici les TC) maisaussi le passe des variables explicatives (les TM).On voit ainsi une ressemblance avec la regression multiple generalisee.

Formulation generale :

Soit Yt une variable aleatoire multidimensionnelle contenant plusieurs variables aleatoires :Yt = (Y1t, ...YNt)

t

Definition 7.On dit que Yt ∼ V ARP (p) si et seulement si : ∃ εt ∼ BB(0,Σε), ∃ φ0 ∈ IRN , ∃ φ1...φp ∈MN (IR) tel que :

Yt = φ0 +

p∑i=1

φiYt−i + εt

Remarque.Si les erreurs sont autocorrelees a l’ordre q, on peut generaliser le VAR(p) pour tenir comptede cette autocorrelation et on a dans ce cas un VARMA qui s’ecrit :

Φ(L)Yt = Θ(L)εt + φ0

Representation canonique et processus d’innovations :

On considere un VAR(p) centre, ie : φ0 = 0

Definition 8.Si toutes les racines du determinant de Φ(L) sont de modules superieur a 1, l’equationΦ(L)Yt = εt definit un unique processus VAR(p) stationnaire.On dit alors que Yt est en representation canonique.

Estimation des parametres d’un VAR(p) :

L’estimation peut se faire par deux methodes :– MCG, lorsqu’il n’y a pas de contrainte imposee sur les parametres. 12

– Maximum de vraissemblance dans les autres cas. 13

11. Cf ”http ://junon.univ-cezanne.fr/bornier/modmac.pdf”12. Cf Econometrie des series temporelles, Sandrine Lardic13. Cf Econometrie des series temporelles, Sandrine Lardic

32

Page 38: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Validation du modele

Tout comme dans les modeles ARMA, il existe des criteres d’informations permettant dechoisir l’ordre du modele.Ce sont des mesures de proximite entre la distribution empirique des observations et cellefaite par un processus VAR(p).Les criteres a minimiser sont les suivants :

1. AIC = log(detΣε) + 2N2pT

2. SIC = log(detΣε) +N2p log(T )T

3. SIC = log(detΣε) +N2p log(log(T ))T

Prevision a l’aide d’un VAR :

Si Yt est en representation canonique, alors :

E[Yt+1 \ Yt] =

p∑i=1

φiYt−i+1

Remarque.

1. Ici la variable Y est multidimenssionnelle et contient k variables.La premiere variable sera un TC et les autres seront les TM.

2. Cette methode semble etre la plus interessante car elle prend en compte le passe desTC et egalement le passe des TM.

33

Page 39: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.3 Modeles de regression non lineaires

5.3.1 Regression quadratique, cubique, logarithmique, inverse, racine carre etpolynomiale

Le principe des regressions non lineaire est le meme que celui des regressions lineaires, seulla methode d’estimations change, elle est d’ailleurs expliquee dans la partie suivante.

Pour une regression quadratique le modele devient :

TC =∑

aiYi +∑

biY2i

Pour une regression quadratique avec selection du meilleur taux de marche par ACP, lemodele s’ecrit :

TC = aYj + bY 2j ou : R2(TC, Yj) = max(R2(TC, Y1), ..., R2(TC, Yk))

Pour une regression cubique le modele devient :

TC =∑

aiYi +∑

biY2i +

∑ciY

3i

Pour une regression cubique avec selection du meilleur taux de marche par ACP, le modeles’ecrit :

TC = aYj + bY 2j + cY 3

j ou : R2(TC, Yj) = max(R2(TC, Y1), ..., R2(TC, Yk))

Pour une regression logarithmique le modele devient :

TC =∑

aiYi +∑

bi log(Yi)

Pour une regression logarithmique avec selection du meilleur taux de marche par ACP, lemodele s’ecrit :

TC = aYj + b log(Yj) ou : R2(TC, Yj) = max(R2(TC, Y1), ..., R2(TC, Yk))

Pour une regression inverse le modele devient :

TC =∑

aiYi +∑

bi1

Yi

Pour une regression inverse avec selection du meilleur taux de marche par ACP, le modeles’ecrit :

TC = aYj + b1

Yjou : R2(TC, Yj) = max(R2(TC, Y1), ..., R2(TC, Yk))

Pour une regression racine carre le modele devient :

TC =∑

aiYi +∑

biY12i

Pour une regression racine carre avec selection du meilleur taux de marche par ACP, lemodele s’ecrit :

TC = aYj + bY12j ou : R2(TC, Yj) = max(R2(TC, Y1), ..., R2(TC, Yk))

34

Page 40: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.3.2 Regression PLS non lineaires

La regression PLS quadratique fonctionne comme la regression PLS standard si ce n’estque l’on ajoute les variables explicatives au carre avant de faire l’ACP.Meme principe pour les regressions PLS cubique, inverse et logarithmique.

La regression PLS kenrel fonctionne differemment.On cherche tout d’abord un nouvel espace vectoriel dans lequel nos variables explicatives nesont plus correlees et ensuite on effectue la regression PLS standard dans ce nouvel espacevectoriel.

5.3.3 Regression Ridge

L’idee est qu’au lieu d’inverser la matrice des correlations XtX on va inverser la matriceXtX + λIn, c’est a dire que l’on va perturber la matrice de covariance par un superpa-rametre qu’il faudra au prealable fixe.

L’avantage est que meme si le rang de X est superieur a n, la matrice XtX + λIn seratoujours inversible.L’inconvenient est qu’il faut determiner au prealable λ.

Concretement, on minimise :

SSR =‖ Y −AX ‖2 +λ

2‖ A ‖2

En derivant et en annulant on obtient alors :

A = (λI +XtX)−1XY

35

Page 41: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.4 Modelisation ARCH/GARCH lineaire et non lineaire et modelisationAR avec residus ARCH/GARCH lineaire et non lineaire

5.4.1 Motivation des processus ARCH/GARCH

La volatilite, ou variance, mesure l’instabilite d’une serie.Dans certains cas les series financieres sont caracterisees par un ”clustering de volatilite” :c’est a dire que des periodes de fortes volatilites alternent avec des periodes de faibles vo-latilites, ou en d’autres terme la variance conditionnelle est heteroscedastique.Pour des series presentant cette propriete, les modeles que nous avons vu jusqu’a main-tenant, c’est a dire des modeles lineaires, ne sont pas adaptes : en effet dans le cas desprocessus ARMA on voit clairement que de tel processus ne permettent pas la prise encompte des phenomenes de volatilite en fonction du temps, car la variance conditionnelleest homoscedastique.

Autre propriete interessante des series financieres : leurs aspect leptokurtique (ou plati-kurtique).En effet la queue de distribution de ces series est generalement plus epaisse que celle de ladistribution de la loi normale comme on peut le voir sur l’exemple suivant.

Figure 14 – Noire : loir normale, Rouge : Laplace, Orange : Hyperbolique, Verte : Logis-tique, Bleue : Wigner, Magenta : Uniforme continue.

Cet epaississement peut etre detecte par le kurtosis, ou coefficient de Pearson ( momentnormalise d’ordre 4).

Autre propriete que les modeles ARCH/GARCH (non lineaires) peuvent prendre en compteest ”l’effet de levier”.L’effet de levier est une asymetrie entre l’effet des valeurs passees negatives et l’effet desvaleurs passees positives sur la volatilite de la serie.Empiriquement, une baisse des cours de la serie tend a engendrer une augmentation de lavolatilite superieure a celle induite par une hausse du cours de meme ampleur.Il faudraitdonc ajouter au residu du ARCH/GARCH non lineaire une fonction de transition continuepouvant representer cet effet de levier.

36

Page 42: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Autre propriete a ne pas confondre avec l’effet de levier, celle de ”l’asymetrie perte-gain”.L’asymetrie perte-gain represente le fait que la distribution de la serie ”penche” d’un coteou de l’autre de la droite des ordonnees, c’est a dire qu’il y a plus de mouvement a la hausseou a la baisse.

Figure 15 – Distribution leptokurtique et platikurtique.

Cette asymetrie peut etre reperer par le skewness (moment d’ordre 3 normalise).

On peut egalement noter quer les series financieres possedent un effet de saisonnalite,effet que les processus ARCH/GARCH ne prennent pas en compte ”intrasequement”(onpourra neanmoins integrer une saisonnalite dans la modelisation notre serie par un proces-sus ARMA et en ne specifiant uniquement le residus comme un ARCH/GARCH). Voici unexemple de serie presentant une saisonnalite :

Figure 16 – Serie temporelle representant les temperatures du Golf du Mexique de 1993a 1998.

37

Page 43: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Exemple.On considere un AR(1) definit par : yt = θyt−1 + εt.Son esperance conditionnelle est θyt et son esperance inconditionnelle est nulle.Or l’amelioration des previsions provient de l’exploitation des moments conditionnelles.Or la variance conditionnelle (et inconditionnelle) d’un AR(1) est constante.Donc de tels modeles sont incapables de mesurer d’eventuels changements dans la variancedes erreurs de previsions meme si l’on souhaite que celle ci soit affectee par l’evolutionpassee.

A travers cet exemple, on voit bien que les processus ARMA ( et les processus lineaires engeneral) ne permettent pas de prendre en compte :– les mecanismes d’asymetrie.– les clusters de volatilite.

5.4.2 Les grandes classes de modeles non lineaires

Un processus non lineaire s’ecrit de la facon suivante :

Yt = g(εt−1, εt−2, ...) + εth(εt−1, ...)

ou : g correspond a la moyenne conditionnelle de Yt et h correspond a un coefficient deproportionnalite entre Yt et εt.

Definition 9.

1. On dit que Yt est un processus non lineaire en moyenne si g est non lineaire.

2. On dit que Yt est un processus non lineaire en variance si h est non lineaire.

Deux approches existent pour ”creer” des modeles non lineaires :

1. La premiere est une extension des modeles ARMA.

2. La seconde consiste a representer la variance pour un AR conditionnellement a soninformation passee.

5.4.3 Modeles non lineaires : premiere approche

Modeles bilineaires

Definition 10.Yt suit un modele bilineaire, et on note Yt ∼ BL(p, q, P,Q), si :

Yt = µ+

p∑i=1

φiYt−i +

q∑i=0

θiεt−i +

P∑i=1

Q∑j=1

λijYt−iεt−j

ou :

θ0 = 1εt ∼ BB(φp, θq, λiP , λPj) ∈ IR4

38

Page 44: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Remarque.On voit que le modele est lineaire en Yt et εt mais non lineaire par rapport a ces deuxvariables prises conjointement.

Proposition 2.On se limite ici au cas ou Yt ∼ BL(0, 0, 2, 1) ie : Yt = εt + λYt−2εt−1

1. E(Xt) = 0

2. γ(h) = 0 et γ(0) = σ2ε + λ2σ2

εE(Y 2t−2)

3. V (Yt) =σ2ε

1−λ2σ2ε

et V [Yt | Yt−2] = σ2ε(1 + λ2Y 2

t−2)

La variance conditionnelle de Xt depend des valeurs passees, c’est ce qu’on appelleun effet ARCH.

Modele autoregressif exponentielle : modele EXPAR

Definition 11.On dit que Yt suit un modele EXPAR(p) si :

Yt = µ+

p∑i=1

(αi + βi exp(−γY 2t−1))Yt−i + εt

Ce modele permet de prendre en compte le cluster de volatilite.

Modele autoregressif a seuil : modele TAR

L’idee est ici de postuler a priori de l’existence de plusieurs dynamiques (en fonction desvaleurs passees des residus) pour une meme serie et a specifier un mecanisme de transitiond’un regime a l’autre.Deux type de mecanismes existent :

1. des mecanismes de transition stochastique et exogenes regient par des processus detype chaines de Markov : ”Markov Switching Model”.

2. des mecanismes de transition endogene ou la fonction de transition depend de lavariable dependante et d’un seuil : ”Treshold AR”, TAR.

Exemple. Exemple de modele TAR : SETARYt suit un SETAR si :

Yt = Φ1(L)Yt1Yt−d>γ + Φ2(L)Yt1Yt−d6γ

ou : d ∈ IN est le delai et γ ∈ IR est le seuil.

39

Page 45: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.4.4 Modele non lineaire : deuxieme approche

C’est Engle en 1982 qui introduit les modeles ARCH (autoregressive conditional heterosce-dasticity).Engle a introduit un modele compose de deux relations (l’une etant un ARCH/GARCH) :– la premiere met en relation la serie avec certaines variables qui l’expliquent.– la seconde modelise la variance conditionnelle des residus par un ARCH/GARCH.Engle a introduit une dynamique dans la determination de la volatilite de la serie en sup-posant que la variance est conditionnelle aux informations passees.

On a donc :

Yt = XB + εtεt = zt(ht)

1/2

On suppose dans la suite que : X ≡ 0

Definissons a present un modele ARCH.

Modele ARCH(q)

Definition 12.Un processus Yt suit une representation ARCH(q) si :

Yt = zt(ht)1/2 ou :

ht = α0 +

∑qi=1 αiY

2t−i

zt ∼ BB

Remarque.On considere ici que : Yt ∼ ARCH(1).

1. Yt est caracterise par des autocorelations nulles et une variance conditionnelle heteroscedastiquequi varie egalement en fonction de l’ampleur de l’innovation passee.

2. Y 2t = α0 + α1Y

2t−1 + εt ou : εt = Y 2

t − ht tel que : E[εt | εt−1] = 0

Donc : Y 2t ∼ AR(1).

3. Un ARCH(1) est une difference de martingale homoscedastique, ie :

E[Yt | Yt−1] = 0 et V (Yt) =α0

1− α1

Ce qui implique que :– un ARCH est un bruit blanc faible.

Ceci est tres important car cela nous permettra de specifier des erreurs de ce modele(ARMA ou autres) sous la forme ARCH.

– un ARCH Yt est conditionnellement heteroscedastique :

V [Yt | Yt−1] = α01−αh11−α1

+ αh1Y2t−h

Remarquons que : limV [Yt | Yt−1] = V (Yt)

4. cov(Yt, Yt+k, Yt−h) = 0Un ARCH est donc un processus qui conditionnellement a Yt−h est un processus sansmemoire.Il serait donc interessant de specifier les residus suivant un ARCH a l’aide d’unechaine de Markov comme dans le cas des modeles TAR.

40

Page 46: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5. Un ARCH admet un aspect leptokurtique, en effet : le kurtosis est superieur a 3.

6. Pour s’assurer de la positivite de la variance, il faut que : α0 > 0 et αi ∈]0; 1[ .

Toutes les remarques que l’on vient de voir sont generalisables au cas ou q ∈ IR.

Modele GARCH(p,q)

Dans de nombreux cas le parametre q, representant le nombre de retard, intervenant dansl’equation de la variance , est important car il doit tenir compte de la memoire longue dela volatilite.Ce nombre important de parametres peut conduire a ne pas respecter les conditions res-trictives assurant la positivite de la variance.Solution : modele GARCH.

Definition 13.Un processus εt suit un modele GARCH(p,q) si :

εt = zt(ht)1/2 ou :

ht = α0 +∑qi=1 αiε

2t−i +

∑pi=1 βiht−i

zt ∼ BBα0 > 0, αi > 0 ∀i = 1...q, βi > 0 ∀i = 1...p pour assurer la positivite de la variance.

Remarque.

1. La persistance de la volatilite est plus grande dans le modele GARCH a cause del’ajout d’une relation de recurrence entre la variance conditionnelle actuelle a celledes q periodes precedentes.

2. GARCH(1,1)=ARCH(∞)

Proposition 3.

1. E[εt | εt−1] = 0

2. V [εt | εt−1] = ht

3. Posons : µt = ε2t − λt, alors :

ε2t = α0 +

max(p,q)∑i=1

(αi + βi)ε2t−i + µt −

p∑i=1

βiµti

avec la convention :

αi = 0 si i > qβi = 0 siı > p

Donc ε2t ∼ ARMA(max(p, q), p).

4. Supposons que zt ∼ N(0, 1).

(a) La loi marginale de εt a une queue de distribution plus epaisse qu’une loi nor-male : E(ε4t ) > 3E(ε2t )

2.

41

Page 47: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

(b) Son coefficient d’exces du kurtosis vaut :3V [εt|εt−1]

E(ε2t )2

Donc le kurtosis est directement lie a l’heteroscedasticite conditionnelle.

Modele avec erreur ARCH(q) ou GARCH(p,q)

On ne considere non plus un ARCH/GARCH pour modeliser la serie, mais on considereque le residu de notre modele (ARMA ou autres) suit un ARCH/GARCH.

Exemple.On considere un modele lineaire AR de la forme :

Yt = E[Yt | Yt−1] + εt

ou : εt ∼ BB faibleOn suppose de plus que ce residu admet une representation ARCH(p,q).On a donc un modele qui decrit a la fois l’esperance conditionnelle et la variance condi-tionnelle de Yt dans le temps.

Definition 14.

1. On dit que Yt suit un AR(p,q)-ARCH(Q) si :

Φ(L)Yt = εt ou : εt ∼ ARCH(Q)

2. On dit que Yt suit un AR(p,q)-GARCH(P,Q) si :

Φ(L)Yt = εt ou : εt ∼ GARCH(P,Q)

Exemple.On considere un AR(1)−ARCH(1), ie :

Yt = µ+ ρYt−1 + εt

ou : εt ∼ ARCH(1) et | ρ |< 1.On a dans ce cas :

1. E[εt | εt−h] = 0

2. V [εt | εt−h] = α01−αh11−α1

+ αh1Y2t−h et V (Yt) = α0

1−α1

3. cov(Yt, Yt+k, Yt−h) = 0

4. Si α21 <

13 alors la distribution est leptokurtique.

5. E[Yt | Yt−h] = µ 1−ρh1−ρ + ρhYt−h

6. V [Yt | Yt−h] = µ+ α1ε2t−1

Donc la variance d’une erreur de prevision suit un processus avec erreur ARCHdependant du temps : V [Yt | Yt−h] = g(εt−h).L’amplitude des intervalles de confiance associe a cette prevision n’est donc pas constantedans le temps.

42

Page 48: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

5.4.5 Detection de l’effet ARCH

L’effet ARCH ou l’heteroscedasticite conditionnelle est la presence d’autocorrelations dansles residus au carre.Il existe deux principales approches pour l’identifier :

1. Test d’autocorrelations sur les carres ε2t .

2. Test LM d’abscence d’auto-correlations sur ε2t .Il s’agit d’un test du multiplicateur de Lagrange.H0 : β1 = β2 = ... = βk = 0 dans le modele ε2t = β0 + β1ε

2t−1 + ...+ βkε

2t−k + µt

5.4.6 Estimations des parametres

Il existe trois methodes pour estimer de tels parametres :– estimateur de la classe du maximum de vraisemblance– estimateur du pseudo maximum de vraisemblance– estimateur en deux etapesOn ne traitera que des deux premieres methodes, car la derniere est asymptotiquementequivalente au maximum de vraisemblance.

On considere le modele suivant :AYt = BXt + εtE[Yt | Yt−h, Xt] = mt[Yt−h, Xt, θ] = mt(θ)

V [Yt | Yt−h, Xt] = ht[Yt−h, Xt, θ] = ht(θ)

Maximum et pseudo maximum de vraisemblance appliques aux modeles ARCH/GARCH

On presentera conjointement la methode d’estimation du maximum de vraisemblance sousl’hypothese de normalite de la distribution conditionnelle des residus et la methode d’esti-mation du PMV.On peut montrer que la fonction de vraisemblance definissant l’estimateur du MV sousl’hypothese de normalite et la fonction de pseudo vraisemblance de l’estimateur du PMVsous l’hypothese que la vrai loi des residus appartient a la meme classe que la loi normalesont les memes .

43

Page 49: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Definition 15.La fonction log-vraisemblance associee a un echantillon de T observations (y1, ...yt) de Ytsous l’hypothese de normalite de la loi conditionnelle de Yt sachant Yt−1 et Xt est :

logL(θ) =−T2

log(2π)− 1

2

T∑t=1

log(ht(θ))−1

2

T∑t=1

(yt −mt(θ))2

ht(θ)

Definition 16.Les estimateurs du MV sous l’hypothese de normalite ou du PMV, note θ, des parametresθ ∈ IR, satisfont un systeme non lineaire a k operations :

∂ logL(θ)

∂θ|θ=θ= 0

ou :

∂ logL(θ)

∂θ|θ=θ=

−1

2

T∑t=1

1

ht(θ)

∂ht(θ)

∂θ|θ=θ +

1

2

T∑t=1

(yt −mt(θ))2

ht(θ)2∂ht(θ)

∂θ|θ=θ +

T∑t=1

yt −mt(θ)

ht(θ)

∂mt(θ)

θ|θ=θ

Estimateur du MV sous d’autres loi

On considere un modele ou le residus est defini par :

εt = zt(ht)12

Quatre lois sont possible pour zt :

1. loi normal

2. loi de student

3. loi de Sewed-Student

4. loi GED

La seconde et la quatrieme sont des lois symetriques qui permettent de prendre en comptedes queues epaisses.La troisieme est dyssimetrique et permet de modeliser les series qui ont un skewness nonnul( c’est a dire qui penche).

5.4.7 Extensions lineaires des modeles ARCH/GARCH

Modele GARCH-MCe modele introduit la variance conditionnelle comme variable explicative de la serie consideree.

Definition 17.Un processus εt admet une representation GARCH-M lineaire en la variance conditionnellesi et seulement si :

εt = δht + εt = δV [εt | εt−1] + εt ou :

εt ∼ GARCH(p, q)zt ∼ N(0, 1)

44

Page 50: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Remarque.On peut egalement prendre :

1. εt = δlog(ht) + εt : forme log-lineaire

2. εt = δ(ht)12 + εt : forme racine carre

Modele IGARCHLes processus IGARCH correspondent au cas d’une racine unitaire dans le processus devariance conditionnelle. Ces modeles sont alors caracterises par un effet de persistance dansla variance : ie un choc sur la variance conditionnelle se repercute sur toutes les valeursfutures predites.

Definition 18.Un processus εt admet une representation IGARCH(p,q) si et seulement si :

εt admet une representation GARCH(p,q)∑qi=1 αi +

∑pi=1 βi = 1

Remarque.Il existe une representation FIGARCH ou la memoire est longue mais pas infinie.

5.4.8 Extensions non lineaires des modeles ARCH/GARCH

La reaction de la volatilite a un choc sur la serie peut-etre differente selon le signe du residu.Une mauvaise nouvelle a generalement un impact plus important sur la volatilite qu’unebonne nouvelle.L’idee a retenir est simple : ”L’effet heteroscedastique n’est sans doute pas le meme suivantque l’erreur precedente soit positive ou negative”.Ce mecanisme d’asymetrie sur la variance conditionelle peut-etre modelise par des proces-sus ARCH/GARCH non lineaires.

Modele EGARCHCe modele est caracterise par une specification asymetrique des perturbations.Dans un GARCH, les conditions sur les parametres de modeles sont contraignantes : ellesrestreignent la dynamique reelle de la volatilite et la non negativite des coefficients estsouvent violee en pratique quand l’orde du modele est eleve.C’est pourquoi dans un modele EGARCH on met la variance conditionelle sous sa formelogarithmique : ce qui permet de ne pas mettre de conditions sur les parametres.

Definition 19.εt admet une representation EGARCH(p,q) si et seulement si :

εt = zt(ht)1/2 ou :

log(ht) = α0 +∑qi=1 αig(zti) +

∑pi=1 βi log(ht−i)

zt ∼ BBg(zt−i) = θzt−i + γ(| zt−i | −E(zt−i)

45

Page 51: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Remarque.

1. Le coefficient γ capte l’effet du signe de l’erreur.

2. α mesure l’amplitude du terme d’erreur passee.

3. β mesure la relation de recurrence entre la variance conditionnelle a celle de la periodepassee.

Modele GJR-GARCHLa formulation GJR-GARCH est un modele GARCH avec l’ajout d’une variable muettequi est multipliee par le carre du terme d’erreur de la periode passee dans l’equation de lavariance conditionnelle.C’est un modele a seuil ou la fonction indicatrice(=variable muette) vaut 1 si le residus dela periode precedente est negatif et 0 sinon.

Definition 20.Un processus εt admet une representation GJR-GARCH(p,q) si :

εt = zt(ht)1/2 ou : ht = α0 +

q∑i=1

(αiε2t−i + γi1εt−i<0ε

2t−i) +

p∑i=1

βiht−i

Donc les chocs negatifs provoquent une augmentation de la variance conditionnelle plusforte que des chocs negatifs.

Generalisations APARCH et VSGARCHLes modeles APARCH et VSGARCH sont une generalisation des modeles ARCH, GARCHet GJR-GARCH.

Definition 21.εt admet une representation APARCH(p,q) si et seulement si :

εt = zt(ht)1/2 ou : (ht)

1/2 = α0 +

q∑i=1

αi(| εt−i | −γiεt−i)δ +

p∑i=1

βi(ht−i)δ

Remarque.

1. APARCH(1, 1) = ARCH(1, 1) pour δ = 2 γ1 = 0 β1 = 0

2. APARCH(1, 1) = GARCH(1, 1) pour δ = 2 γ1 = 0

3. APARCH(1, 1) = GJR−GARCH(1, 1) pour δ = 2

De la meme facon on peut proposer une generalisation des processus GJR-GARCH avecles modeles VS-GARCH dans lesquels la totalite des coefficients peut varier selon le regimeet non plus uniquement le coefficient du carre de l’innovation passee.

46

Page 52: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Modele TARCH ou TGARCHUne autre facon de modeliser les asymetries consiste a retenir des modelisations a seuil. Onse limite au cas ou p = 1 et q = 1.

Definition 22.Un processus εt admet une representation TGARCH(1,1) si :

εt = zt(ht)1/2 ou : (ht)

1/2 = α0 + αpos1εt−1>0εt−1 + αneg1εt−1<0εt−1 + β1(ht−1)1/2

Ces modeles sont donc similaires au modele GJR-GARCH mais ils specifient une asymetriesur l’ecart type et non sur la variance conditionnelle.

Modele LSTGARCHAvec les processus GJR-GARCH, on modelise deux regimes pour la variance conditionnelle,le choix de l’un ou l’autre etant fixe uniquement par le signe de l’innovation passee.Gonzales et Riviera en 1998 ont imagine que le basculement s’effectuerait de maniere moinsradicale en introduisant une fonction de transition de type logistique : la ”Logistic SmothTransmission GARCH”.

Definition 23.Un processus εt suit un LSTGARCH(1,1) si :

εt = zt(ht)1/2 ou :

ht = α0 + αposε

2t−1[Λ(θεt−1)] + αnegε

2t−1[1− Λ(θεt−1)] + β1ht−1

Λ(θεt−1) = 11+exp(−θεt−1

Probleme : Ameliorer la fonction de transition

Ce qu’on pourrait essayer d’ameliorer ici c’est la fonction de transmission.Il faudrait determiner comment la variance conditionnelle evolue en fonction de l’evolutiondu residus.Peut-etre en regressant les residus par rapport a la variance conditionnelle

5.5 Remarques sur l’estimation des parametres.

Lors de l’estimation des parametres sous sas pour la methode ar-GARCH, je me suis renducompte que la plupart de ces parametres etaient biaises.Il m’a donc parut important de preciser tout d’abord les methodes d’estimations (MCO,MCNL, Maximum de vraissemblance) et ensuite de voir pourquoi ces estimateurs etaientbiaises.C’est ce que j’ai fait dans la partie 6.

47

Page 53: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

6 Estimations des parametres

6.1 Moindres Carres Ordinaire

Je presenterai dans cette partie la methode des Moindres Carres Ordinaires, MCO, methodequi s’applique pour l’estimation des parametres d’une regression lineaire.

On considere donc une variable a expliquer y contenant n observations et k variables expli-catives : x1, ..., xk contenant egalement n observations.On note X = (x1, ..., xk) la matrice de dimension nk des variables explicatives.Notons que les k regresseurs x1, ..., xk engendrent un sous espace de dimension k de En

(ou : E = IR ou IC) : on notera cet espace δ(X).Ce sous espace est constitue par tous les points z ∈ En tel que : z = Xγ (ou γ est donnede dimension k).

On suppose dans la suite que nos regresseurs sont lineairement independants 14

En effet, en pratique, les regresseurs ne sont JAMAIS lineairement dependant : il existetoujours des erreurs sur les donnees qui empechent cette dependance (Cf. correlations desTM).Il existe plusieurs types d’erreurs qui vont au final nous rendre service :– erreur de saisie des taux de marche.– erreur d’approximation : si un taux de marche T1 est une combinaison lineaire des taux

T2 et T3, il peut y avoir une erreur d’approximation lors de l’import des taux de marchede Teradata vers Sas.

On cherche maintenant le point de δ(X) qui est le plus proche de notre vecteur y : ondoit donc minimiser la distance entre y et Xγ ; c’est le principe des moindres carres ordi-naires.

On veut minimiser la distance de y a Xγ, ce qui est equivalent a minimiser le carre decette distance, on cherche donc a resoudre le probleme suivant :

minγ‖y −Xγ‖2 (∗)

La valeur de γ de cette minimisation sera l’estimateur MCO et on la notera γ.

Remarque.

1. (∗) peut se reecrire de la maniere suivante :

(∗) minγ

n∑t=1

(y − t−Xtγ)2 = (y −Xγ)t(y −Xγ)

ou : yt est le tieme element du vecteur y et Xt est la tieme ligne de X.

14. Cf. ”Estimation and Inference in Econometrics” de J.Russel

48

Page 54: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

2. La quantite∑nt=1(y − t −Xtγ)2 est appelee ”somme des residus au carre”, ou SSR

en anglais (sum squared resid).

3. Le vecteur Xγ est le point de δ(X) le plus proche de y.La ”ligne” joignant y a Xγ forme un ”angle droit”, angle entre δ(X) et y −Xγ.En effet si β est un point tel que δ(X) et y−β ne forme pas un angle droit on aurait :‖y −Xβ‖ 6 ‖y −Xγ‖, et donc γ ne serait pas l’estimateur des MCO.La figure suivante illustre ce que je viens d’expliquer :

Enoncons maintenant un theoreme garantissant l’existence et l’unicite de l’estimateur MCO.

Theoreme 6.1.Soit y et X comme precedemment.Si les k composantes de X sont lineairement independantes alors : l’estimateur γ existe etest unique.

Preuve.On considere l’expression suivante que l’on cherche a minimiser :

n∑t=1

(y − t−Xtγ)2 = (y −Xγ)t(y −Xγ)

Derivons maintenant par rapport a γ : −2Xt(y −Xγ).On cherche maintenant la solution de : Xt(y −Xγ) = 0.Comme les colonnes de X sont lineairement independantes, la matrice XtX est de rangplein.De plus cette matrice est definie positive ceci implique que :

∑nt=1(y− t−Xtγ)2 = f(γ) tel

que : f est strictement convexe en γ.Et donc f admet un unique minimum.

Remarque.

1. On a vu dans la preuve que γ est determine par : Xt(y −Xγ) = 0.Cette equation ”normale” implique que X est orthogonal (pour l’operateur produit) atoutes les colonnes de X et par consequent a n’importe quel vecteur se trouvant dansl’espace engendre par ces colonnes.Donc : y −Xγ ⊥ δ(X)

2. L’equation normale precedente nous donne donc un moyen de calculer γ. En effetcomme XtX est de rang plein on peut l’inverser et donc :

γ = (XtX)−1Xty

49

Page 55: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

3. On a aussi : Xγ = X(XtX)−1Xty = PXyou : P est la projection orthogonale de y sur δ(X).On definit egalement la matrice M qui projette y sur le complementaire de δ(X) par :MX = I − PX .Remarquons que MX + PX = I.On obtient ainsi une decomposition orthogonale de En.On peut egalement montrer que :

‖y‖2 = ‖PXy‖2 + ‖Mxy‖2

c’est a dire que la somme des carres totaux est egale a la somme des carres expliquesplus la somme des residus au carre.

4. La mesure de la qualite de la regression s’obtient en divisant la partie non expliquepar les regresseurs de l’equation precedente par la variation de y.Cette mesure est appelee coefficient de determination, ou coefficient de Pearson et onla note R2.

6.2 Moindres Carres Non Lineaires

On considere ici une variable y a expliquer de n composantes et k variables explicativesx1, ..., xk a n composantes.Le modele ici considere est le suivant :

(∗) yt = Xt(γ) + ut ou ut ∼ iid(0, σ2) ∀t = 1...n)

ou : γ est un vecteur de parametres a k composantes et X. est une fonction lineaire ou nonlinaire qui determine l’esperance de yt conditionnellement a γ.

Remarquons que le modele de regression lineaire vu dans la partie precedente est un casparticulier du modele (*) avec Xt(γ) =

∑ni=1 γixit.

Comme lors des MCO, on va estimer notre vecteur parametre γ en minimisant la sommedes residus au carre.La SSR pour le modele (*) s’ecrit :

SSR(γ) =n∑t=1

(yt −Xt(γ))2 = (y −X(γ))t(y −X(γ)) = ‖y −X(γ)‖2

On peut encore l’ecrire : SSR(γ) = yty − 2ytX(γ) +Xt(γ)X(γ).

On cherche maintenant a minimiser cette expression, on doit donc la differencier par rap-port a toutes composantes de γ et chercher a annuler cette differenciation.On obtient donc :

−2Xt(γ)y + 2Xt(γ)X(γ) = 0

ou : xti(γ) = ∂Xt(γ)∂γi

.

Ceci est equivalent a : Xt(γ)(y −X(γ)) = 0 (∗∗).On constate donc que : y −X(γ) est orthogonal a X(γ).Comme X depend du vecteur γ il n’est pas toujours possible de resoudre analytiquement(**)

50

Page 56: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

La condition (**) n’est pas suffisante pour garantir que γ soit un minimum interieur et glo-bal de la SSR : il peut etre un minimum local, un point stationnaire ou bien un maximumlocal.Il faut donc determiner un algorithme de minimisation qui le permet. 15

Pour s’assurer de l’unicite de γ il faut que le modele soit identifie localement, ie : la fonctionSSR doit etre strictement convexe en γ.Si la stricte convexite est verifiee alors on a : SSR(γ) 6 SSR(γ + δ) ∀δ.En effet la stricte convexite implique que SSR(γ) est incurvee dans toutes les directions,aucun ”plat” n’est autorise quelque soit la direction consideree.Dans le cas contraire, si SSR(γ) est plat dans une direction au voisinage de γ, on pourraits’eloigner de γ dans cette direction sans modifier la valeur de SSR(γ).Par consequent γ ne serait pas unique.Pour obtenir l’unicite globale, il n’existe pas de critere suffisant, on compare donc unique-ment la valeur des differents minima locaux.

6.3 Maximum de Vraissemblance

6.3.1 Definition

L’idee fondamentale de l’estimation par maximum de vraisemblance est de trouver un en-semble d’estimations de parametres, γ tel que la ”vraisemblance” d’avoir obtenu l’echantillonque l’on utilise soit maximale.La densite de probabilite jointe du modele considere est evaluee aux valeurs observees ettraitee comme une fonction de parametres du modele.Le vecteur γ est alors le maximum de cette fonction.

On considere dans toute la suite la structure statistique suivante :

M = (Ω,Υ, Pγ , γ ∈ Γ)

ou Ω est un ensemble, Υ est une tribu sur Ω et Pγ est la famille de lois de probabilites sur(Ω,Υ).

De nombreuse proprietes de la technique du maximum de vraisemblance sont interessantes,par exemple :– la convergence– la normalite asymptotique– l’efficacite asymptotique– l’invariance a la reparametrisation du modeleJe parlerai uniquement dans la suite de la derniere propriete.

Autre propriete moins interessante voir nefaste, celle de la dependance trop forte a ladistribution des erreurs.Une autre proprietes regrettable du MV, est que ses proprietes obtenues avec des echantillonsfinis peuvent etre differentes des proprietes asymptotiques ( cela ne nous concerne pas caron a que des echantillons fini).

15. Cf. ”Estimation and Inference in Econometrics” de J.Russel

51

Page 57: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

On considere maintenant un echantillon de taille n, ou chaque observation est une realisationd’une variable aleatoire yt t = 1, ..n a valeurs dans IRm.On note alors l’echantillon yn = (y1, ..., yn).Si chaque observation est un vecteur de dimension m, alors yn ∈ IRnm.

La densite de yn est definit de Ω(ensemble de realisations possibles de yn, sous espacede IRnm) et a valeurs dans IR.La fonction de vraisemblance depend donc des parametres du modele et de l’ensemble d’ob-servations donnees pour yn.Sa valeur correspond a la densite de probabilite associee a l’echantillon caracterise parγ ∈ Γ(espace parametrique de ”vie” de γ, sous ensemble de IRk).

On donne maintenant la definition generale de la fonction de vraisemblance note L.

On considere ici que notre structure statistique M est domine, ie :Pγ = fγ .m ou : m est mesure sur IRd tel que Pγ est absolumment continue par rapport am.

Definition 24.Soit M = (Ω,Υ, Pγ = fγ .m, γ ∈ Γ).On appelle fonction de vraisemblance, note L, la fonction definit par :L : Ω ∗ Γ −→ IR tel que : L(yn, γ) =

∏nt=1 fγ(yt)

On definit maintenant l’estimation par maximum de vraisemblance.

Definition 25.On dit que γ ∈ Γ est une estimation par maximum de vraisemblance pour yn si :

∀γ ∈ Γ : l(yn, γ) > l(yn, γ)

Remarque.

1. Si l’inegalite est stricte alors on a unicite de γ.

2. Une condition suffisante pour avoir l’unicite de γ est que la fonction l soit continuepar rapport a γ et que Γ soit compact.

Notons que estimateurs et estimations sont deux choses differentes.Un estimateur est une variable aleatoire des ensembles possibles d’observations alors qu’uneestimation est une realisation de cette variable aleatoire.On donne a present la definition d’un estimateur du maximum de vraisemblance.

Definition 26.On dit que γ : IRnm −→ Γ est un estimateur du maximum de vraisemblance pour yn si :∀γ ∈ Γ tel que : γ 6= γ(yn) on a : L(yn, γ(yn)) > L(yn, γ)

52

Page 58: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Exemple.On considere ici la structure statistique de loi exponentielle, c’est a dire que chaque obser-vation yt, n au total, possede la densite exponentielle suivante : f(yt, γ) = γ exp(−γyt).Ici le ”vecteur γ” est reduit a l’unique parametre γ. C’est donc ce parametre que l’on vachercher a estimer.On appelle fonction de vraisemblance , et on note L(yn, γ), la densite jointe des yt.Cette fonction nous donne la probabilite d’observer l’echantillon yn = (y1, ..; , yn) pour toutevaleur de γ.Le cas particulier de la distribution exponentielle implique l’independance des variables ytet donc la densite jointe est :

L(yn, γ) =

n∏t=1

γ exp(−γyt)

On peut noter que si n est tres grand, la quantite precedente L(yn, γ) peut devenir extremementgrande ou petite.On considere le logarithme de la vraisemblance, appele fonction logvraisemblance et definitpar :

l(yn, γ) = log(L(yn, γ)) = n log(γ)− γn∑t=1

yt

On maximise cette expression par rapport a γ ; et on obtient :

γ =n∑nt=1 yt

Remarquons que dans ce cas particulier, la derivee seconde de l(yn, γ) est negative, ce quiimplique l’unicite de l’estimateur γ.

6.3.2 Transformations et reparametrisation

On note dans cette partie M le modele etudie.On appelle parametrisation de M toute application λ definit de Γ et a valeurs dans M.Il existe une infinite de parametrisation pour le modele M.On peut en effet construire une application bijective et derivable partout definit de K ⊂IR∗ ⊂ Γ et a valeurs dans R∗ ⊂M en utilisant des translations, rotations,...

Definition 27.On dit que l’estimateur γ ∈ Γ du maximum de vraisemblance est invariant si : pour touteapplication bijective reguliere (ie derivable) η : Γ −→ Φ ⊂ R∗ tel que : η(γ) = φ alors :

η(γ) = φ

Theoreme 6.2. L’estimateur du maximum de vraisemblance est invariant.

Preuve.On considere η : Γ −→ Φ une application reguliere qui transforme γ en un unique vecteurφ = η(γ).La fonction de vraisemblance pour le modele M en terme du nouveau parametre,φ, note L’,est definit par : L′(yn, γ) = L(yn, γ) car la fonction de vraisemblance est la densite d’un

53

Page 59: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

processus stochastique et que γ et φ decrivent le meme processus).

Montrons que η(γ) = φ.On a :L(yn, γ) L(yn, γ) ∀γ ∈ ΓDonc : L′(yn, η(γ) = L(yn, γ) L(yn, γ) = L′(yn, φ)ie : L′(yn, η(γ) L′(yn, φ) ∀φ ∈ Γ

Par unicite : η(γ) = φ.

Remarque.

1. Une fois que l’on a choisit une parametrisation du modele, λ : Γ −→M et que l’on achoisit une application reguliere bijective η : Γ −→ Φ tel que : η(γ) = φ, alors on peutreparametriser le modele en construisant une application de Φ vers Γ, note u, definitpar : u = λ η−1.Ici η−1 existe car η est bijective.On peut resumer cela par le diagramme suivant :

L’avantage de l’invariance est quelque soit la parametrisation choisie les estimateursseront les memes.

2. La propriete d’invariance implique aussi que les estimateurs du maximum de vrai-semblance seront biaises ! ! ! !En effet si on suppose une parametrisation dans laquelle l’estimateur du maximumde vraisemblance γ soit sans biais, alors : E(γ) = γ

On suppose maintenant que η est une parametrisation non lineaire, alors :E(φ) =E(η(γ) 6= φ car pour une fonction non lineaire : E(η(γ) 6= ηE(γ) = η(γ) = φ

Exemple. Exemple d’invariance a la reparametrisationOn considere que l’on a reparametriser notre modele exponentielle de la maniere suivante :f ′(yt, φ) = 1

φ exp(−ytφ ) ou φ = 1γ .

Montrons que : φ = 1γ

La fonction de log vraisemblance avec la parametrisation φ est : l′(y, φ) = −n log(φ) −1φ

∑nt=1 yt.

En derivant l’expression precedente et en l’annulant on obtient bien : φ = 1γ

6.4 Moindres Carres ou Maximum de vraissemblance ?

Les techniques de MC sont applicables uniquement aux modeles de regression , c’est a diredes modeles qui peuvent s’ecrire comme une egalite entre une variable a expliquer y et unefonction de regression x(γ) plus un terme d’erreur u.

Certains modeles (Cf. modele ARCH : ε = zt(ht)12 ) ne peuvent s’ecrire sous cette forme,

et donc la technique d’estimation du MC est inadaptee.Le maximum de vraissemblance peut s’appliquer a de tels modeles.

54

Page 60: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Exemple. Prenons comme exemple le modele suivant (qui n’est pas un modele de regression) :

yζt = a+ bxt + ut ouu ∼ idd(0, σ2)

Si on suppose que ∀t | yt || xt | , que yt est positif et xt negatifs alors on devrait supposerau moins que ut 0∀t.Ce qui impliquerait que E(ut) 6= 0 et on ne pourrait plus appliquer les MC.

55

Page 61: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

7 Backtesting des differentes methodes

Une fois les differentes methodes effectuees il m’a fallu en choisir une, la meilleur, pourchaque taux de credit.Pour ce faire, j’ai calcule le SSR de chaque methode et j’ai choisit la methode qui minimisercette indicateur.

L’objectif de mon stage etait la prevision des taux de credit mais egalement de quanti-fier la hausse des taux de credit qu’engendrerait une hausse des taux de marche de unpourcent.J’ai donc separer les methodes utilisant les taux de marche et celles ne les utilisant pas.Donc au final : 2 previsions.J’ai egalement mis de cote les modeles faisant intervenir le passe des taux de credit et destaux de marche.Donc pour conclure : 4 previsions, a savoir :

1. un mixe de 25 methodes faisant intervenir les taux de marche.

2. un modele VAR+ACP.

3. un modele VAR+ACP+GARCH.

4. un mixe de 30 methodes ne faisant pas intervenir les taux de marche.

Nous allons maintenant voir pour chaque taux de credit le backtesting de la methode 1uniquement sur 3 mois (avril-mai-juin 2010).Nous comparerons egalement ces previsions a celle effectue par Paris pour voir laquelle desdeux methodes est la meilleure.

7.1 Pret consommation

On constate ici que l’ecart residuel calcule ( difference en valeur absolue entre la valeurreelle et la valeur predite par le modele) est tres nettement a l’avantage de mon modele.En effet l’ecart residuel est de 0.05 pour mon modele et de 0.26 pour le modele de Paris.

56

Page 62: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

7.2 Pret immobiliers

On constate ici encore que fois que l’ecart residuel est plus faible pour mon modele, 0.12,que celui de Paris, 0.13.

7.3 Pret equipement

On constate ici que bien que l’ecart residuelle de mon modele est assez eleve, 0.65,il restetout de meme inferieur a celui de Paris,0.69.

7.4 Pret epargne logement

L’ecart residuel de mon modele, 0.24, est inferieur a celui de Paris,0.63.

57

Page 63: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

7.5 Pret credit bail

Une fois de plus, l’ecart residuel de mon modele, 0.37, est inferieur a celui de Paris,1.48.

58

Page 64: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

8 Impact de l’amelioration des previsions

La premiere conclusion que l’on peut porter est qu’en moyenne ma prevision des taux decredit est fiable a 0.29 pres tandis que celle de Paris est fiable a 0.63 pres.Cela signifie que si Paris predit un taux a 4 pourcent, ce taux sera compris entre 3.27 et4.63.Tandis qu’avec ma methode le taux sera compris entre 3.71 et 4.29.

La BPLC possede un enorme besoin de tresorerie, c’est a dire un besoin de refinancement.En effet le montant des credit est de loin le plus important compare aux autres banques dugroupe.Notons que la diminution des commissions tend a renforcer ce besoin de tresorerie.Ce montant de credit impose un besoin de refinancement tres consequent, c’est a dire quel’on doit aller chercher, ou plutot emprunter, beaucoup d’argent sur les marche.L’argent que l’on va chercher sur les marche est soumis a un taux d’interet.Ce taux d’interet, variant dans le temps, nous place donc face a un risque de taux, enlocurence a la hausse.Pour faire face a ce risque, la BPLC doit mettre en place une strategie de couverture, no-tamment par l’achat de swaps.Le montant de swaps a acheter est conditionne par la prevision des taux de credit.Notons que l’annee passe, le montant des swaps s’est eleve a 200 millions d’euros.Une meilleur prevision de ces taux de credit va entrainer une diminution du montant deswaps a acheter.

Voyons un exemple simple expliquant ceci :

Exemple.La BPLC ayant un risque de taux a la hausse, on cherche a savoir de combien les taux decredit augmenteront en vue d’une augmentation, par exemple, de 1 pourcent des taux demarche.Je fais donc tourner mon modele : une fois avec les previsions des taux de marche sur lescenario centrale et une autre fois avec les previsions des taux de marche sur le scenariode stress +1.J’obtiens donc 2 previsions.

59

Page 65: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

La precision de la prevision de Paris est de 0.26 pour un backtesting de deux mois, et maprecision est de 0.08 pour un backtesting de deux mois.La premiere observation a propos du graphe precedent est que plus l’ecart entre les deuxcourbes est important moins on perd de l’argent.La seconde observation est que l’on perd de l’argent uniquement si l’ecart est inferieur a 1.

Comment determiner le montant de swaps a achete ?

Il nous faut tout d’abord calculer l’indicateur de sensibilite a la marge d’interet puis determinerle montant de swaps qui annule tout depassement.On considere le bilan (chiffres reels) de la BPLC :

La sensibilite a la marge d’un interet se calcule, nous l’avons deja vu dans la troisiemepartie, par :

(MISC(t)−MI(t))/MI(t)

L’indicateur precedent mesure donc la sensibilite de la marge d’interet fasse a une haussedes taux de marche.

Supposons que la hausse des taux de marche considere soit de 1 point.Dans ce cas, tous les postes a taux variables prennent un point et tous les postes a taux fixerestent au meme taux excepte les 2 milliards a l’actif tresorerie qui representent la nouvelleproduction de credit estimee.C’est ici qu’interviennent mes previsions de taux de credit.

60

Page 66: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Il faut cependant tenir compte de la fiabilite de la prevision (ie le degre de precision).Supposons que l’augmentation des taux de credit en fonction d’une augmentation de unpoint des taux de marche soit :– de 1 point pour paris– de 1 point pour ma methodeOn integre la fiabilite de la methode et on se place donc dans le pire des cas ; l’augmentationest donc de :– 0.74 pour Paris– 0.92 pour ma methodeVoyons maintenant les nouveaux bilans choque pour Paris et pour ma methode :

Apres calculs, la sensibilite de la marge d’interet pour Paris est de -5 pourcent et de -4pourcent pour ma methode !

Il nous faut maintenant determiner le montants des swaps a prendre pour eliminer cerisque de taux.Prenons 2.25 comme taux pour les swaps a l’actif et 2.62 comme taux pour les swaps aupassif.Apres calculs, nous obtenons :– 2 000 000 000 d’euros de swaps pour la methode de Paris– 1 900 000 000 d’euros de swaps pour ma methodeSoit une diminution de 5 pourcent du couts des swaps avec ma methode compare a celle deparis.

Donc une amelioration de 0.2 pourcent sur la precision de la prevision destaux de credit entraine une diminution du montant des swaps de 5 pourcent.

Remarquons que cette amelioration est basee uniquement sur une prevision identique des

61

Page 67: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

taux de credit pour Paris et pour ma methode.Le gain sur le montant des swaps pourrait etre en realite plus important.

Le gain que l’on vient de constater grace a la prevision des taux de credit pourrait etrerenforce par la prevision des taux de marche, et notamment par la detection des chocs surles taux de marche, ainsi on ne pourrait plus supposer qu’une augmentation des taux demarche va avoir lieu mais on pourrait le predire.

Autre aspect que l’on pourrait ameliorer serait celui de la prevision de la marge d’interet.En effet la prevision de la marge d’interet, apporte une meilleur connaissance des perfor-mances de la banque sur le long terme, et des moyens a mettre en place pour corriger deseventuels problemes, ou pour gerer au mieux une periode saine.

62

Page 68: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

9 Conclusion

Pendant ce stage de 5 mois, j’ai decouvert le service ALM et ses differents objectifs, c’esta dire d’analyser le bilan de la banque ainsi que son evolution dans le temps.Ce service mesure egalement les differents risques lies a ce bilan :– risque de taux– risque de liquiditeLes methodes mathematiques que j’ai utilise etant relativement simple en theorie, le problemeque j’ai rencontre a etait de mettre en pratique ces methodes, notamment a l’aide des lo-giciels SAS, R et VBA excel.J’ai enormement appris sur ces trois logiciels durant mon stage car bien qu’ayant eu descours sur ces logiciels a l’universite il n’etait pas adapte a mon sujet de stage.

Mon sujet de stage a apporte a la banque un outil automatise de prevision des taux decredit independant de celui de la BPCE.

A la lumiere de ces premieres analyses et des impacts financiers importants pour la banque,un approfondissement de ces differentes methodes paraıt necessaire. Cela constitueraitmeme un excellent sujet de these, tant pour l’etablissement bancaire que pour moi !

63

Page 69: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

References

[1] ”Estimation and Inference in Econometric”, J.Russel, Livre.

[2] ”Econometrie des Series Temporelles”, S.Lardic, Livre.

[3] ”La regression PLS”, M.Tenenhauss, Livre.

[4] ”Diplome post-grade de staistique : La regression PLS”, S.Vancolen, Documents inter-net.

[5] ”These :Approche PLS lineaire et non lineaire pour la modelisation de multi tableaux :theorie et applications”, M.Vivien, Documents internet.

[6] ”Introduction a la regression des moindres carres partiels avec la procedure PLS SAS”,D.Desbois, Documents internet.

[7] ”Cours de series temporelles : theorie et application”, A.Charpentier, Documents inter-net.

[8] ”Series temporelles appliquees”, Y.Aragon, Documents internet.

[9] ”Statistique”, M.Boutahar, Documents internet.

[10] ”Econometrie pour la finance-Modeles ARCH-applications a la VAR”, C.Hurlin, Do-cuments internet.

[11] ”These : regression PLS et donnees censures”, P.Bastien, Documents internet.

[12] ”Probabilites”, P.Florchinger, Cours universitaire.

[13] ”Statistiques”, P.Bonneau, Cours universitaire.

[14] ”Biostatistique”, A.Maul, Cours universitaire.

64

Page 70: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

References

[1] ”Maitriser SAS et SAS Macro”, O.Decourt, Livre

[2] ”VBA pour les nuls”, J.Walkenbach, Livre.

[3] ”Forum Developpez.net”, Documents internet

[4] ”SAS Support”, Documents internet.

[5] ”SQL et Programmation”, A.Grange, Cours universitaire.

65

Page 71: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Annexe 1 : BILAN DE LA BANQUE :

Figure 17 – Bilan de la banque.

66

Page 72: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Annexe 2 : Import des donnees sous Teradata :

Figure 18 – Import TC.

67

Page 73: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Annexe 2 : Import des donnees sous Teradata :

Figure 19 – Import TC Credit bail.

Figure 20 – Import TM.

68

Page 74: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Annexe 3 : Presentation de l’ACP.

1.Historique de l’ACP

L’analyse en composante principale est une methode mathematique permettant de synthetiserles donnees d’un tableau a analyser en recherchant les directions de l’espace (ou compo-santes principales) qui representent le mieux les correlations entre un ensemble de variablesquantitatives. Ces directions nous permettront de representer d’une maniere concrete lescorrelations entre les variables, notamment a l’aide du cercle de correlations variables- com-posantes. Cet outil nous permettra de comprendre facilement les liens, lineaires, entre lesdifferentes variables.L’Analyse en Composante Principale, ou ACP, est aussi connue sous le nom de ”transformeede Hotelling” en l’honneur de Harold Hotteling( 1895-1973) qui devellopa cette methodestatistique a partir de 1933. En realite le fondateur de l’ACP est K.Pearson qui l’introduitdes 1901. Hotelling s’est illustre dans de nombreux domaines : theorie du jeux, theorie dubien etre, distribution du T-Student et intervalles de confiance.

2.Principe de fonctionnement de l’ACP

On considere un tableau de donnees de n individus et m variables. Le but d’une analysede donnees est de synthetiser l’information contenue dans notre tableau en determinant, sipossible, des liens entre les differentes donnees (correlations des variables).On considere maintenant notre tableau comme une matrice X de taille n et m a valeursreelles.

X =

x11 x12 x13 ... x1mx21 x22 x23 ... x2mx31 x32 x33 ... x3m

......

......

...xn1 xn2 xn3 ... xnm

Le principe de l’ACP est le suivant : pour synthetiser l’information contenue dans X onva creer un nombre de variables nouvelles h, tel que : h 6 m. Ces variables sont ap-pelees composantes principales et nous permettront de visualiser geometriquement les liens( correlations) entre les differentes variables.

3.Les differentes etapes de l’ACP

On suppose que toute nos variables sont centrees et reduites, c’est a dire que l’esperance

est nulle et que la variance est egale a 1. Dans le cas contraire on pose : Xj =Xj−E(Xj)√

V (Xj)et

ensuite Xj = Xj .

69

Page 75: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

A l’etape 1 :

On determine une variable C1 comme combinaison lineaire des variables Xj :

C1 = a11X1 + .....+ a1mXm

Les inconnues a determiner sont les facteurs a1 = (a11, ..., a1m)

C1 est une nouvelle variable et on peut donner sa valeur pour chaque individui :

C1i = a11Xi1 + ...+ a1mXim

A l’etape k :

On procede de la meme facon, on obtient une variable synthetique Ck :

Ck = ak1X1 + ...+ akmXm

Cki = ak1Xi1 + ...+ akmXim

Les inconnues a determiner sont les facteurs ak = (ak1 , ..., akm)

Ainsi on a (Ck1 , ..., Ckm) = Xak

L’objectif est maintenant de determiner les facteurs ak et les composantes principales Ck.Notre probleme peut etre visualise dans deux espaces differents :

1. Dans l’espace des individus

On se place dans Rm (on utilise la distance euclidienne dans Rn). Chaque individu am coordonnees.

Theoreme 9.1.L’ACP determine a l’etape 1 un axe D1 passant par l’origine 0 (les variables sontcentrees) selon laquelle la dispersion des points est maximale. Cet axe est tel que lamoyenne des carres des distances entre les n points et l’axe D1 est minimale ( principedes moindres carres).Soit a1 le vecteur directeur norme (les variables sont reduites) de D1.Alors a1 est le vecteur propre associe a la valeur propre de plus haut module de lamatrice de correlation entre les variables 1

ntXX.

Preuve. Les coordonnees de l’individu i sur D1 sont :

a11Xi1 + ...+ a1mXim = C1i

D’apres Pythagore : d2(i, 0) = (C1i )2 + d2(i, C1

i )

⇔ 1

n

n∑i=1

d2(i, 0) =1

n

n∑i=1

(C1i )2 +

1

n

n∑i=1

d2(i, C1i ) (?)

70

Page 76: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

On veut minimiser le deuxieme terme dans le membre de droite, ce qui revient amaximiser le premier terme :

max1

n

n∑i=1

(C1i )2 ⇔ max tC1C1 sous la contrainte a1 norme

max1

n

n∑i=1

(C1i )2 ⇔ max ta1(

1

ntXX)a1 sous la contrainte ta1a1 = 1

Or le maximun d’une forme quadratique tuAu sous la contrainte tuu = 1 est donneepar le vecteur propre de A associe a la valeur propre de module le plus eleve.Donc le minimum du deuxieme terme de l’equation ? est atteint par le vecteur propreassocie a la valeur propre de plus haut module de 1

ntXX .

Remarque. A l’etape 1, l’ACP fournit le meilleur resume unidimensionnelle dunuage de points, mais la dispersion du nuage dans les directions orthogonale a D1

n’est pas decrite pas cette etape. C’est pourquoi il est necessaire de determiner un axeD2 et ainsi de suite jusqu’a l’etape k.

Theoreme 9.2.L’ACP determine a l’etape k un axe Dk passant par l’origine 0 (les variables sontcentrees) selon laquelle la dispersion du nuage de points est maximale. Le vecteurdirecteur norme ak est orthogonal aux axes ar pour r 6 k.Alors ak est le vecteur propre associe a la k-ieme valeur propre de la matrice decorrelation entre les variables 1

ntXX.

Preuve. Meme methode que la preuve du theoreme 1

2. Dans l’espace des variables

On se place dans Rn.On veut creer une variable C1 ressemblant le plus possible aux m variables Xj .Le coefficient de correlation mesure la ressemblance entre deux variables. Donc pourcreer une variable C1 qui ressemble a m variables Xj on cherche a ce que :

m∑i=1

R2(C1, Xi)

soit maximale.

Theoreme 9.3.A l’etape 1, l’ACP determine la variable C1 tel que :

∑mi=1R

2(C1, Xi) soit maximale.C1 est le vecteur propre associe a la valeur propre de plus haut module de 1

nXtX.

71

Page 77: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Preuve.

max1

n

m∑i=1

R2(C1, Xi)⇔ max

∑mi=1 Cov

2(C1, Xi)

V (C1)

max1

n

m∑i=1

R2(C1, Xi)⇔ max1

n

∑mi=1

t(C1Xj)tXjC

1∑nj=1(C1

j )2

max1

n

m∑i=1

R2(C1, Xi)⇔ max

m∑i=1

tC1(1

nXj

tXj)C1 sous la contrainte tC1C1 = 1

max1

n

m∑i=1

R2(C1, Xi)⇔ max tC1(1

nXtX)C1 sous la contrainte tC1C1 = 1

D’apres le resulat sur les formes quadratiques vu dans la preuve du theoreme 1 on ale resultat recherche.

Remarque. C1 represente le mieux possible les variables de depart, mais il ne lesdecrit pas totalement. C’est pourquoi on a besoin de determiner d’autres composantesprincipales.

Theoreme 9.4.L’ACP determine a l’etape k une variable Ck resumant le mieux possible les variablesde depart et non correlees aux k − 1 variables de depart.Ck est alors le k-ieme vecteur de la matrice 1

nXtX.

Preuve. Meme principe que la preuve du theoreme 3.

On peut montrer l’equivalence des deux analyses. En effet les valeurs propres de 1ntXX

sont les memes que celle de 1nX

tX aux valeurs propres triviales pres.On note βk la k-ieme valeur propre de 1

ntXX

On sait maintenant comment construire les composantes principales mais on ne sait pasencore combien de composantes il nous faut construire.

L’ACP nous donne a chaque etape un resume de la matrice X moins interessant que leprecedent. On veut mesurer la quantite de representation de chaque etape.A l’etape k et dans l’espace des individus on a montre que βk est la variance du nuageexplique par l’axe k ( donc de Ck). Par consequent la part de variance de l’axe k est βk

m .Ce pourcentage est aussi appele pourcentage d’inertie. Du fait de l’equivalence des analysesdans l’espace de individus et l’espace des variables on peut montrer que βk

m est la moyennedes carres des correlation entre les composantes et les variables.Concretement : si βk est faible, l’information apportee par l’axe k est peu significative.On choisit donc des axes dont la part de variance est significative.

72

Page 78: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

On va maintenant definir deux cartes qui nous permettront d’analyser plus rapidementles donnees du tableau X a l’aide des resultats obtenus precedemment : on considere lesprojections des individus et des variables sur les differents axes obtenus par l’ACP.

1. Premiere carte : La representation des individus

On projette chaque individu sur les plans engendres par les facteurs (ak)k∈N.On obtient donc une description des points en projection sur le plan.Les coordonnees de i sur l’axe Dr sont : CriLes coordonnees de i sur l’axe Ds sont : Csi

Comme l’ACP determine un nombre de composantes inferieures au nombre totalde variables il est naturel de se demander si un individu i est bien represente sur telou tel axe. Ce resultat nous est donne par la ”qualite de representation de l’individu

i sur l’axe r” qui vaut :(Cri )

2∑mj=1(C

ji )

2

Plus ce coefficient est eleve et meilleure sera la representation de i sur l’axe r.

On peut aussi se demander quel role joue un individu i dans la construction d’un

axe r : la contribution de l’individu a la variance de l’axe r est donnee par :(Cri )

2

nβrSi cette contribution est elevee alors l’individu i joue un role important dans laconstruction de cet axe.

2. Deuxieme carte : La representaion des variables

On projette chaque variable sur le plan defini par deux composantes principales Cr

et Cs.Les coordonnees de ces variables sur ce plan sont : R(Xi, C

r) et R(Xi, Cs).

Geometriquement le point representatif de Xj se situe a l’interieur d’un cercle derayon 1 et centree a l’origine, i-e le cercle des correlations.Concretement : si Xj et Xi sont proches du bord du cerccle et proche l’une de l’autrecela veut dire que ces variables sont fortement correlees.

73

Page 79: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Annexe 4 : Definition des differents taux de credit.

Prets consommation :Juridiquement, on considere un prets a la consommation comme tout pret de sommes d’ar-gent :– qui est consenti a titre onereux ou gratuit par un professionnel– qui a une duree superieure a 3 mois– qui a un montant inferieur a 21.000 euros– qui ne se rapporte pas a une activite professionnelle– qui n’est pas authentifie devant notaire– qui n’est pas destine a financer un achat immobilier

Prets immobiliers :Le credit immobilier est un emprunt fait sur le long terme. Comme son nom l’indique bien,il s’agit d’un credit consenti pour faire l’achat d’un bien immobilier tels un appartement,une maison ou meme un commerce. Le credit immobilier peut aussi bien servir pour unbien en construction ou deja existant.Voici maintenant les principales caracteristiques de ce type de credit. Tout d’abord, lecredit immobilier est transmis sous la forme d’un pret avec un montant fixe et precis. Cepret immobilier peut etre accorde par une societe financiere specialisee dans ce secteur oualors, par n’importe quelle banque. Comme il s’agit d’un credit a long terme, ce pret estgeneralement fait sur une duree de plusieurs annees. Le consommateur a droit de choisirentre un pret immobilier a taux fixe sur toute la duree du contrat ou sur un taux variable.En France, comme dans plusieurs autres pays, le taux fixe est le plus utilise par les clients.

Prets equipements :Le prets equipements est un emprunt reserve au professionnel concernant l’achat de materielspour leurs entreprises.

Prets epargne logement :En France, ce pret peut etre accorde lorsque l’on est titulaire d’un Logement (CEL) oud’un Plan Epargne Logement (PEL) et si l’on y a place son epargne.Apres une periode d’epargne durant laquelle on acquiert des droits a prets bonifies, onpeut envisager d’utiliser ces droits pour financer l’achat, la construction d’une Residenceprincipale soit a titre personnel soit dans le but de la louer. Ils peuvent egalement servira financer une residence secondaire pour l’achat ou des travaux a condition toutefois dene pas avoir d’encours de prets epargne logement sur la Residence principale. En outre, lemontant peut etre augmente par la Cession de droits d’autres membres de la famille.

Prets credits bails :Le credit-bail (ou leasing, de l’anglais) est un credit permettant l’acquisition d’un bien enechange de redevances et avec option d’un droit de propriete a l’echeance.

74

Page 80: Rapport de stage : Elaboration et automatisation d’un ... · Mlle Catherine BACH, gestionnaire actif-passif, cellule ALM ... commencer ce rapport de stage par des ... son accueil

Annexe 5 : Quantite d’information de Kullback.

Definition 28.Soit (Ω, χ, P ) un espace probabilisable.On considere A un evenement tel que : P (A) 6= 0 et A ∈ χ.On associe a la realisation de A la quantite d’information propre, ou incertitude, par :

h(A) = − logp(A)

Remarque. L’unite de h depend de la base choisit pour le logarithme :– log2 : Shanon ou bit (binary unit)– loge : logon ou nat( natural unit)– log1 0 : Hartley ou decit (decimal unit)

Definissons maintenant la quantite d’information de Kullback.

Definition 29.La quantite d’information de kulback est defini par :

h(A) =∑

pi log(piqi

)

ou pi, qi ∈ p1, ..., pn est l’ensemble des probabilites que peut prendre A.

75