Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
1
METHODES QUANTITATIVES DE
RECHERCHE APPLIQUEES A LA FISCALITE
Damas HOUNSOUNON, PhD
ATAF/ATRN, Nairobi, Keynia, du 3 au 6 juin 2019
2
Plan de présentation Introduction
Méthodes d’évaluation de la performance d’une administration fiscale
Méthodes d’évaluation d’impact des politiques/réformes publiques/fiscales
3
INTRODUCTION Recherche quantitative: relation entre deux ou
plusieurs variables mesurables
Recherche quantitative: Deux groupes de méthodes :
Méthododes statistiques
Méthodes économétriques
4
INTRODUCTION Méthodes statistiques:
Exemples
Tests statistiques (correlation, proportion, moyenne/variance, adéquation, etc.)
Analyse variance-covariance (ANOVA, ANCOVA, MANOVA et MANCOVA)
Modèles de frontières
Etc.
5
INTRODUCTION Méthodes économétriques:
Exemples
Modèles de régression linéaire et non linéaire (instantané, temporel, panel, spatial ou qualitatif)
Modèle de frontière (Stochastique)
MEGC
MEGDS/DSGE
etc.
6
METHODES D’EVALUATION
Méthodes d’évaluation de la performance d’une administration fiscale
7
METHODES D’EVALUATION DE LA PERFORMANCE D’UNE ADMINISTRATION FISCALE
Méthodes d’évaluation de l’efficacité des systèmes fiscaux (DEA et Modèle de frontière)
Méthodes d’évaluation du potentiel et de l’effort fiscaux et du gap fiscal en matière de TVA (Modèle économétrique, TAX GAP Model du FMI)
Méthodes d’estimation de la taille optimale de l’Etat et de fiscalité optimale (Laffer, Barro, Scully, Amry, Ramsey, Mirrlees, etc.)
Méthodes d’évaluation de l’impact d’une modification de taux (MEGC/DSGE, Modèles de taxation marginale, Modèles d’analyse Coût-Bénéfice, etc.)
8
METHODES D’EVALUATION DES POLITIQUES/REFORMES
9
METHODES D’EVALUATION DE L’EFFICACITE DES SYSTEMES FISCAUX
Deux principales méthodes:
Méthodes non paramétriques
o Data Enveloppement Analysis (DEA)
o DEA-Malmquist
Méthodes paramétriques
o Modèle de frontière stochastique
10
DATA ENVELOPPEMENT ANALYSIS (DEA)
La méthode DEA permet d’évaluer la performance des organisations
(appelées decision-making units –DMUs–) qui transforment des ressources (inputs) en prestations (outputs).
Elle a été développée par Charnes et al. (1978, 1981) pour évaluer l’efficience d’un programme fédéral américain d’allocation de ressources aux écoles (« Programme Follow Through »).
L’utilisation de la méthode DEA s’est ensuite généralisée dans toutes les autres organisations publiques (comme l’Administration Fiscale) et entreprises privées.
11
DATA ENVELOPPEMENT ANALYSIS (DEA)
Elle est donc adaptée tant aux entreprises du secteur privé qu’aux organisations du secteur public. Elle peut également être appliquée à des entités comme des villes, des régions, des pays, etc.
Elle est fondée sur deux notions fondamentales: Efficacité et Efficience
Efficacité: l'atteinte des résultats prévus ou des objectifs fixés quelles que soient les dépenses engagées dans le processus de réalisation de ces résultats ou objectifs (Mikol, 1989; Camus, 2000; Calme et al., 2003)
12
DATA ENVELOPPEMENT ANALYSIS (DEA)
Efficience: elle fait apparaître la façon dont les ressources ou dépenses engagées sont exploitées. Pour Camus (2000), l'efficience implique, qu'il faut être efficace en combinant au mieux les moyens alloués, c'est-à-dire produire la quantité escomptée tout en optimisant les coûts
Un exemple (en séance!)
13
DATA ENVELOPPEMENT ANALYSIS (DEA)
La DEA est une méthode non paramétrique d’estimation des scores d’efficacité ou d’efficience qui doivent être inférieurs ou égaux à 1
Le score d’efficience de chaque DMU est calculé par rapport à une frontière d’efficience (meilleures pratiques)
Les organisations qui se situent sur la frontière ont un score de 1 et sont qualifiés d’efficientes
Les organisations qui sont localisées sous la frontière ont un score inférieur à 1 et disposent par conséquent d’une marge d’amélioration de leur performance. Elles sont donc qualifiées inefficientes
14
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: deux différentes formulations:
L’orientation du modèle: deux orientations possibles:
o Orientation Input: le modèle DEA minimise les inputs pour un niveau donné d’outputs; autrement dit, il indique de combien une organisation peut réduire ses inputs tout en produisant le même niveau d’outputs.
o Orientation Output: le modèle DEA maximise les outputs pour un niveau donné d’inputs. Autrement dit, il indique de combien une organisation peut augmenter ses outputs avec le même niveau d’inputs.
15
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: deux différentes formulations:
Le profil ou la nature des rendements d’échelle: deux profils possibles
o Rendements d’échelle constants (Constant Returns to Scale: CRS): une augmentation de la quantité d’inputs consommés mènerait à une augmentation proportionnelle de la quantité d’outputs produits. Un tel modèle connu sous le nom de CCR a été formulé par Charnes A. et al. (1978)
o Rendements d’échelle variables (Variable Returns to Scale : VRS):la quantité d’outputs produits va augmenter plus ou moins proportionnellement que l’augmentation de la quantité d'inputs. Le modèle DEA à rendements d'échelle variable connu sous le nom de BCC a été proposé par Banker et al. (1984)
16
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: CRS vs VRS: que choisir?
Le modèle CRS est approprié lorsqu’on est certain que toutes les organisations ont atteint leur taille optimale
Le modèle VRS est approprié lorsque les organisations n’opèrent pas à leur taille optimale
Mais dans la pratique on estime les deux modèles afin d’identifier la source de l’éventuelle inefficience (Score CRS étant l’efficience totale décomposée en efficience pure (efficience VRS) et en efficience d’échelle (liée à la taille de la DMU)
17
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: CRS vs VRS: que choisir?
Ainsi,
une DMU VRS efficiente et CRS inefficiente doit modifier sa taille ou l’échelle à laquelle elle opère pour devenir CRS efficiente
Une DMU à la fois VRS et CRS inefficiente, n’a pas seulement un problème de taille (modification de l’échelle à laquelle elle opère) mais elle est également gérée de manière déficiente
18
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: Orientation Input (OI) vs Orientation Output (OO): que choisir?
Si le modèle CRS est choisi, pas de souci car dans ce cas, Efficience (OI) = Efficience (OO)
Si c’est le modèle VRS qui est adopté, le choix de (OI) ou de (OO) doit être fait en fonction des variables (inputs ou outputs) sur lesquelles les décideurs exercent le plus grand pouvoir de gestion.
(Des exemples pratiques en séance!)
19
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: Un exemple numérique
Services des impôts
Input (Inspecteurs: x)
Output (Contrôles effectués : y)
Productivité (Production/tête)
A 2 1 0,5
B 3 4 1,33
C 5 5 1
D 4 3 0,75
E 6 7 1,17
20
DATA ENVELOPPEMENT ANALYSIS (DEA)
La frontière d’efficience CRS passe par l’ordonnée à l’origine et par le point B correspondant au service des impôts ayant la plus forte productivité (1,33)
Calcul des scores d’efficience (SE) CRS
o Orientation Input: 𝑆𝐸𝐶𝑅𝑆 =𝑆𝐴𝐶𝑅𝑆.𝐼
𝑆𝐴= 37,5%
o Orientation Output: 𝑆𝐸𝐶𝑅𝑆 =𝑇𝐴
𝑇𝐴𝐶𝑅𝑆.𝑂= 37,5%
21
DATA ENVELOPPEMENT ANALYSIS (DEA)
La frontière d’efficience VRS quitte le point A correspondant au service des impôts ayant la plus faible productivité (0,5) et passe par les points B et E correspondant aux services ayant les plus fortes productivités
Calcul des scores d’efficience (SE) VRS
o Orientation Input: 𝑆𝐸𝑉𝑅𝑆 =𝑈𝐷𝑉𝑅𝑆.𝐼
𝑈𝐷= 𝟔𝟔, 𝟕%
o Orientation Output: 𝑆𝐸𝑉𝑅𝑆 =𝑉𝐷
𝑉𝐷𝑉𝑅𝑆.𝑂= 𝟔𝟎, 𝟎%
Les scores d’efficience d’un modèle VRS sont différents selon l’orientation retenue (input ou output)Relation entre SECRS, SEVRS et efficience d’échelle (SEE)
SECRS = SEVRS x SEE
22
DATA ENVELOPPEMENT ANALYSIS (DEA)
Modèle DEA: Généralisation:o Plusieurs inputs et plusieurs outputs: utilisation de progiciels
DEAP et ses variantes (consultez le site web https://sigmdel.ca/aed-dea/index_fr.html
STATA (via le pacquage « dea » )
o Plusieurs DMU sur plusieurs années: DEA-MALMQUIST
DEAP et ses variantes (consultez le site web https://sigmdel.ca/aed-dea/index_fr.html
XTFRONTIER STATA (via les pacquages « malmquist » et « xtfrontier »)
23
METHODES D’EVALUATION
Méthodes d’évaluation des politiques/réformes publiques/fiscales
• Essais randomisés• Méthodes quasi-expérimentales
24
EXPERIMENTATION RANDOMISEE ET METHODES QUASI-EXPERIMENTALES
Evaluation des politiques/réformes publiques/fiscales: Pourquoi faire?
Le problème fondamental de l’inférence causale
Les expérimentations randomisées ou expériences aléatoires contrôlées
Les méthodes quasi-expérimentales
25
EVALUER LES POLITIQUES/REFORMES: POURQUOI FAIRE?
Objectif : Estimer les effets causaux des interventions publiques
Exemples de réformes/politiques fiscales: En séance!
Principe général : comparaison entre des individus, des ménages ou des entreprises qui bénéficient d’une réforme ou d’une intervention publique et ceux qui n’en bénéficient pas
Comme pour tester l’effet d’un médicament : un groupe traité vs un groupe non-traité/de contrôle
26
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Le cadre de Rubin• Evaluation d’une mesure de traitement « 𝑇 »
• Population 𝑃 d’unités 𝑖. Chaque individu 𝑖 de la population 𝑃 possède certains attributs, appelés variables. Ces attributs, observables ou inobservables permettent de décrire l’individu
• On distingue les individus qui bénéficient du traitement (𝑇𝑖 = 1) de ceux qui n’en bénéficient pas (𝑇𝑖 = 0)
• Effet du traitement sur une grandeur d’intérêt, qu’on appelle la variable de résultat et que l’on note 𝑌
27
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Le cadre de Rubin• Chaque individu a deux résultats potentiels, selon qu’il bénéficie ou non de la mesure : 𝑌𝑖0 est associé à 𝑇 = 0 (pas de traitement) et 𝑌𝑖1 est associé à 𝑇 = 1 (traitement)
• Pour chaque individu, on peut alors définir l’effet propre (ou causal) de la mesure Δ𝑌𝑖, à partir de ces deux résultats potentiels comme étant :
𝚫𝒀𝒊 = 𝒀𝒊𝟏 − 𝒀𝒊𝟎 (1)
=> En réalité, il est impossible de les observer simultanément !
28
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Formulation du problème fondamental• Il est impossible d’observer simultanément la valeur de 𝑌𝑖0 et 𝑌𝑖1 pour la même unité 𝑖. Il est donc impossible d’observer Δ𝑌𝑖 , l’effet causal de la politique évaluée sur le résultat de l’unité 𝑖
• Solution: Trouver un contrefactuel : l’esprit des méthodes d’évaluation sera d’estimer une situation contrefactuelle, i.e. ce qui aurait été observé si la mesure n’avait pas été mise en place. On parle de groupe de contrôle.
On disposera alors de deux groupes pour l’évaluation: un groupe de contrôle ou témoin et le groupe traité
29
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Biais de sélection• L’effet moyen du traitement sur les traités (ATT) correspond :
𝑬(𝒀𝟏|𝑻 = 𝟏) − 𝑬(𝒀𝟎|𝑻 = 𝟏) (2)
MAIS: Si 𝐸(𝑌1|𝑇 = 1) est connu, 𝐸(𝑌0|𝑇 = 1) ne l’est souvent pas
• Une Solution « naïve » revient à comparer les résultats des traités avec ceux des non-traités (groupe de contrôle):
𝑬(𝒀𝟏|𝑻 = 𝟏) − 𝑬(𝒀𝟎|𝑻 = 𝟎) (3)
qui est bien mesurable! Mais on introduit un biais en procédant ainsi
30
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Biais de sélection•PROBLEME: Biais de sélection qui peut surestimer ou sous-estimer l’effet recherché
• Comment mesurer ce biais ?
o L’estimateur naïf revient à estimer :
𝐸(𝑌|𝑇 = 1) − 𝐸(𝑌|𝑇 = 0) = 𝐸(𝑌1|𝑇 = 1) − 𝐸(𝑌0|𝑇 = 0) (4)
En décomposant l’équation (4), on trouve:
= 𝐸 𝑌1 𝑇 = 1 − 𝑬 𝒀𝟎 𝑻 = 𝟏 + 𝑬(𝒀𝟎|𝑻 = 𝟏) − 𝐸(𝑌0|𝑇 = 0) (5)Ce que nous cherchons Le biais introduit
31
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Biais de sélection•On a donc un biais égal à : 𝑬 𝒀𝟎 𝑻 = 𝟏 − 𝑬 𝒀𝟎 𝑻 = 𝟎 qui n’est rien d’autre que la différence de résultat moyen qui serait enregistrée sans la mesure, entre ceux qui ont choisi d’être traités et les autres
=> On comprend aisément que ce biais est Non Nul dès lors que les individus peuvent choisir de bénéficier du programme en fonction de leur revenu (ou variable d’intérêt en jeu)
Un autre problème lorsque l’on s’intéresse à l’effet moyen du traitement sur la population totale (et non uniquement sur les traités)
32
LE PROBLEME FONDAMENTAL DE L’INFERENCE CAUSALE
Biais de sélection Illustrations graphiques
Comparaison avant/après Comparaison avec/sans
33
HETEROGENEITE ET EXTERNALITES
Effet moyen du traitement sur la population totale (ATE) et Problème d’hétérogénéité
• L’effet moyen du traitement sur la population totale (ATE) correspond à :
Δ𝑌𝑖 = 𝑃(𝑇 = 1) [𝐸(𝑌1|𝑇 = 1) − 𝐸(𝑌0|𝑇 = 1)] + (1 − 𝑃(𝑇 = 1)) [𝐸(𝑌1|𝑇 = 0) − 𝐸(𝑌0|𝑇 = 0)]
• Effet moyen sur la population totale = moyenne pondérée (par leurs proportions respectives) de l’effet observé de la mesure sur les traités et de celui, hypothétique, sur les non-traités
Hypothèse: pour mesurer l’effet moyen de la mesure sur la population totale à partir des traités, il faut que l’effet moyen sur les traités soit le même que celui qu’on aurait enregistré en moyenne si on avait appliqué le traitement aux non-traités.
34
HETEROGENEITE ET EXTERNALITES
Effet moyen du traitement sur la population totale (ATE) et Problème d’hétérogénéité
• Or l’effet d’une mesure peut différer selon les individus, d’où l’hypothèse suivante pour contrôler ce problème d’hétérogénéité: l’hypothèse d’indépendance entre le traitement et les résultats potentiels
Qui n’est pas évident à garantir!
35
HETEROGENEITE ET EXTERNALITES
Un autre problème: Présence d’externalités
• Une hypothèse courante dans la théorie sur les modèles d’évaluation des politiques/réformes est d’exclure l’existence d’externalités.
• On suppose en effet que le traitement de l’individu 𝑖 n’a d’effet que sur son revenu (variable d’intérêt ou de résultat) et non sur ceux des autres personnes
• C’est l’hypothèse connue sous la terminologie « Stable Unit Treatment Value Assumption (SUTVA) ou Hypothèse d’absence d’effets de diffusion
Qui n’est pas évident à garantir!
36
FACE A CES PROBLEMES, QUE FAIRE?
Evaluation d’impact: Trois (3) problèmes généraux
(1) Biais de sélection
(2) Biais d’hétérogénéité)
(3) Biais ou effet de diffusion
Que faire? DEUX SOLUTIONS PLAUSIBLES:
Les expérimentations randomisées
Les méthodes quasi-expérimentales
37
LES EXPERIMENTATIONS RANDOMISEES
l’expérimentation randomisée ou expérience aléatoire contrôlée consiste à déterminer aléatoirement les personnes qui bénéficieront du traitement (groupe des traités) et celles qui n’en bénéficieront pas (le groupe de contrôle)
Si la répartition aléatoire est bien vérifiée, le problème du biais de sélection est résolu et le choix d’être traité ou non est indépendant des résultats de la politique (hypothèse d’indépendance ou absence d’hétérogénéité est garantie)
L’estimateur est alors sans biais et l’effet du traitement sur les traités (ATT(𝑋)) .
𝐀𝐓𝐓(𝑿) = 𝑬(𝒀|𝑻 = 𝟏;𝑿) − 𝑬(𝒀|𝑻 = 𝟎;𝑿)= 𝑬(𝒀𝟏|𝑻 = 𝟏;𝑿) − 𝑬(𝒀𝟎|𝑻 = 𝟎;𝑿)
38
LES EXPERIMENTATIONS RANDOMISEES
Les différents types de randomisation
(1) Randomisation d’un traitement
(2) Randomisation après auto-sélection
(3) Randomisation de l’accès au traitement
(4) Randomisation d’un encouragement
(5) Randomisation de l’ordre d’allocation du traitement
39
LES EXPERIMENTATIONS RANDOMISEES
1- Randomisation d’un traitement
Avantages: • Représentation parfaite du contrefactuel par le
groupe contrôle• Estimation sans biais de sélection de l’effet causal
moyen du traitement sur la population totale
Inconvénients:• Le groupe traité est contraint à accepter le
traitement alors que certains sujets peuvent pour diverses raisons ne pas le souhaiter;
• Privation du groupe de contrôle d’un programme potentiellement bénéfique
• Estimation sans biais de l’effet causal moyen du traitement sur les traités difficile ou impossible
40
LES EXPERIMENTATIONS RANDOMISEES
2- Randomisation après auto-sélection
Principe: Laisser le choix aux individus de candidater au programme évitant ainsi toute obligation de participation: On parle d’auto-sélection
Avantages: • Evite d’imposer le traitement au groupe traité, donc
plus adapté aux programmes sociaux• Représentation parfaite du contrefactuel par le
groupe contrôle• Estimation sans biais de sélection de l’effet causal
moyen du traitement sur la population totale
Inconvénients:• Privation du groupe de contrôle ayant exprimé le
souhait de participer au programme potentiellement
41
LES EXPERIMENTATIONS RANDOMISEES
3- Randomisation de l’accès au traitementPrincipe: Constituer aléatoirement deux groupes (Traité et Contrôle) dans la population éligible et informer les sujets du groupe de traitement qu’ils peuvent candidater à un programme
Avantages: • Evite d’imposer le traitement aux individus• Et les autres avantages des deux premiers types de randomisation
Inconvénients:• Problème persistant: Privation du groupe de contrôle (mieux que
le type 2 car contrairement au type 2, tous ceux qui ont exprimé leur souhait de participer au programme le sont effectivement
42
LES EXPERIMENTATIONS RANDOMISEES
4- Randomisation d’un encouragementPrincipe: • Constituer aléatoirement deux groupes (Traité et Contrôle) dans
la population éligible • Inciter le groupe traité à rentrer dans le programme
(encouragement, loterie, etc.)• informer les sujets du groupe de contrôle qu’ils peuvent
candidater au programme
Avantages: • Tous les problèmes techniques sont résolus
Inconvénients:
43
LES EXPERIMENTATIONS RANDOMISEES
Les problèmes des expérimentations randomisées et les solutions envisagées
Contamination:
Solution: Espacement des deux groupes (Traité et contrôle)
Effets comportementaux inattendus (Effets John Henry et Hawthorne):
Solution: enquête qualitative testant les réponses comportementales
Attrition:
Solution: Motiver davantage les sujets traités; Rester en contact
permanent avec eux et Augmenter la taille des traités au départ (mesure
de précaution)
44
LES EXPERIMENTATIONS RANDOMISEES
Principales étapes
1. Concevoir l'étude soigneusement
2. Identifier l’échantillon d’étude et collecter les données debaseline sur tout l’échantillon
3. Assigner par hasard les personnes dans l’échantillon au groupe traitement ou témoin
45
LES EXPERIMENTATIONS RANDOMISEES
Principales étapes4. Vérifier que la randomisation a bien marché et que les deux groupes sont semblables
5. Surveiller la mise en œuvre du programme et vérifier que
l'intégrité de l’étude est respectée
6. Collecter les données de suivi pour tout l’ échantillon initial (groupes traitement et témoin)
46
LES EXPERIMENTATIONS RANDOMISEESPrincipales étapes
7. Mesurer l’impact du programme en comparant les deux groupes
8. Estimer si l’impact du programme est significatif:
• Significatif en termes statistiques: la différence observée n’est pas due au hasard
• Significatif en termes pratiques: la différence observée est suffisamment importante
47
LES METHODES QUASI-EXPERIMENTALES
La méthode de Matching
La méthode de la double différence (diff-in-diff)
La méthode de régression par discontinuité
48
LA METHODE DE MATCHING
La méthode de matching, ou méthode d’appariement, utilise des données non-expérimentales et estime l’impact causal d’un programme en comparant des individus traités à des individus non traités qui possèdent des caractéristiques observées similaires
Autrement dit, en utilisant des données sur des individus traités et non traités, la méthode de matching distingue les individus traités et les individus non traités ayant les mêmes caractéristiques (revenus, sexe, situation sociale, nationalité; etc.) puis établit une comparaison entre les individus similaires
49
LA METHODE DE MATCHING
Cette méthode repose sur plusieurs hypothèses/
Hypothèse 1 : Des individus ayant des caractéristiques similaires ont potentiellement la même valeur des paramètres étudiés en l’absence du programme. De même des individus traités, s’ils n’avaient pas reçu le programme, auraient le même niveau de paramètre d’intérêt que des individus non traités ayant les mêmes caractéristiques
Hypothèse 2 : Pour chaque caractéristique, il existe à la fois des individus traités et des individus non traités. Cela garantit que chaque individu traité ait un "jumeau" non traité à qui il peut être comparé
50
LA METHODE DE MATCHING
51
LA METHODE DE MATCHING
Il existe principalement deux méthodes de matching:
Le modèle de sélection sur OBSERVABLE : méthode d’appariement sur le score de propension (propensity score)
Le modèle de sélection sur INOBSERVABLE : procédure en deux étapes de Heckman
52
LA METHODE DE MATCHING
Sélection sur observable: la propensity scorepour chaque individu 𝑖 de caractéristiques 𝑋 bénéficiant du programme, on retient le(s)
individu(s) ne bénéficiant pas et ayant les mêmes caractéristiques 𝑋 observables
Puisqu’il y a plusieurs caractéristiques, il est difficile de faire correspondre à chaque bénéficiaire, un non bénéficiaire ayant strictement les mêmes caractéristiques que lui. On réalise donc l’appariement sur la base d’un score de propension qu’on estime.
Le score de propension est la probabilité qu’un individu soit bénéficiaire conditionnellement à certaines caractéristiques : Pr(𝑇 = 1/𝑋).
Cette probabilité est estimée à l’aide d’un modèle probit ou logit
L’appariement consiste donc à retenir pour chaque individu bénéficiaire le(s) individu(s) ne bénéficiant pas de crédit ayant le score le plus proche du sien.
53
LA METHODE DE MATCHING
Sélection sur observable: la propensity scoreUne fois le propensity score calculé, on dispose de deux méthodes pour estimer l’effet causal moyen tu traitement sur les traités:
(1) La méthode d’appariement du plus proche voisin (nearestneighbor matching) ;
(2) La méthode de stratification;
(3) La méthode d’appariement de Kernel (Kernel matching).
54
LA METHODE DE MATCHING
Sélection sur inobservable: la procédure de Heckman
o En optant pour une estimation par la méthode d’appariement sur le score de propension, nous faisons l’hypothèse que le fait d’être bénéficiaire d’un programme dépend uniquement des caractéristiques observables des individus (d’où le nom de modèle de sélection sur observable)
o Or, il se peut que des caractéristiques inobservables (par exemple la motivation) aient une influence sur l’impact étudié ; d’où la nécessité d’avoir recours à la procédure en deux étapes de Heckman qui corrige les biais de sélection résultant de caractéristiques inobservables.
55
LA METHODE DE MATCHING
Sélection sur inobservable: la procédure de heckman
Première étape: Estimer l’équation de sélection (probabilté d’être traité) par un modèle probit et calculer l’inverse du ratio de Mills (IMR)
Deuxième étape: Régresser la variable de résultat sur les caractéristiques 𝑋, le traitement Ti et le ratio de Mills (IMR):
56
LA METHODE DIFF-IN-DIFF
Une autre technique pour prendre en compte l’hétérogénéité des caractéristiques on observables est la méthode « diff-in-diff »
Le principe est d’estimer l’effet causal d’une politique en calculant :
la différence avant/après du paramètre d’intérêt pour le groupe traité
la différence avant/après du paramètre d’intérêt pour le groupe contrôle
et en comparant les deux différences
57
REGRESSION PAR DISCONTINUITE
Une méthode non expérimentale qui parvient à prendre en compte l’hétérogénéité des caractéristiques observables et des caractéristiques non observables des individus étudiés, résolvant ainsi le problème de biais de sélection
Cette méthode constitue une expérience naturelle qui peut être utilisée dans une situation où l’allocation à un traitement dépend d’une règle de sélection relative au seuil d’un certain facteur, par exemple un programme social disponible à partir d’un certain seuil de revenu ou une bourse accessible à partir d’un certain score à un examen
58
REGRESSION PAR DISCONTINUITE
59
REGRESSION PAR DISCONTINUITE
Cette méthode utilise le fait que lorsqu’un programme est distribué par
rapport à un seuil d’éligibilité, une discontinuité est créée dans l’allocation
du programme. Les individus juste en-dessous du seuil et ceux juste au-dessus
ont des caractéristiques similaires alors que seuls les derniers ont accès au
traitement.
Cette discontinuité permet de comparer l’effet net d’un programme sur les
traités proche du seuil d’éligibilité en utilisant comme groupe de contrôle les
individus non traités mais près de ce seuil
60
Les progiciels
STATA
EXPERIMENTATION RANDOMISEE ET METHODES QUASI-EXPERIMENTALES