Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
Prévision humaine de séries temporelles
Thèse
Jean-François Gagnon
Doctorat en Psychologie
Philosophiae Doctor (Ph.D)
Québec, Canada
© Jean-François Gagnon, 2014
iii
RÉSUMÉ
La fonction cognitive de prévision est à la base du processus de décision dans
plusieurs domaines de travail tels que les finances, la gestion des inventaires et la médecine.
Les individus en charge de prendre des décisions quant à l’évolution de situations
dynamiques complexes commettent régulièrement des erreurs, généralement attribuées à
l’utilisation de stratégies décisionnelles simplificatrices : les heuristiques. Ces heuristiques
sont décrites comme irrationnelles puisqu’elles ne tiennent pas compte de l’ensemble des
informations disponibles pour porter un jugement sur l’évolution future d’une situation. À
l’inverse, la classe de modèle du jugement linéaire constituerait la norme rationnelle dans
ce contexte. Les modèles de jugement linéaire stipulent qu’un jugement optimal rationnel
intègre et pondère linéairement l’ensemble des indices disponibles pour la prévision d’un
critère au sein d’une seule représentation. Plus le jugement d’une personne s’écarterait du
jugement linéaire, plus il serait irrationnel. La thèse remet cet énoncé en question et tente
de valider une vision plus adaptative de la rationalité dans un contexte de prévision de
situations dynamiques complexes. La rationalité dite écologique considère que la norme
rationnelle ne doit pas être absolue, mais plutôt définie en fonction des contraintes
environnementales. Selon cette vision de la rationalité, il est possible que dans un
environnement favorable, une heuristique donnée soit plus performante que l’application
d’une règle de jugement linéaire. Les individus sélectionneraient ainsi la stratégie la plus
adaptée au contexte à partir d’un bassin de stratégies disponibles en mémoire à long terme.
Or, à l’aide de simulations, la présente thèse démontre qu’il est possible que des
heuristiques simplificatrices performent mieux que le jugement linéaire et que cette
modulation dépend en partie des contraintes environnementales. La thèse suggère ensuite
que les individus appliquent différentes stratégies en fonction des contraintes
environnementales et que la stratégie appliquée est généralement adaptée à la nature de la
situation. Finalement, la thèse indique que certaines limites cognitives ont également un
impact sur la sélection de stratégies de prévision. Dans l’ensemble, ce patron de résultats
appuie une vision écologique de la rationalité, mais souligne également que les limites
cognitives fondamentales des individus contraignent le bassin de stratégies disponibles.
v
TABLE DES MATIÈRES
RÉSUMÉ...................................................................................................................................................... III
TABLE DES MATIÈRES .................................................................................................................................. V
LISTE DES TABLEAUX ................................................................................................................................. VII
LISTE DES FIGURES ...................................................................................................................................... IX
REMERCIEMENTS ..................................................................................................................................... XIII
AVANT-PROPOS ........................................................................................................................................ XV
INTRODUCTION GÉNÉRALE .......................................................................................................................... 1
CHAPITRE I .................................................................................................................................................. 5
CONTEXTE THÉORIQUE ET PROBLÉMATIQUE ............................................................................................................. 6
OBJECTIF DE LA THÈSE ........................................................................................................................................ 30
MÉTHODE GÉNÉRALE ......................................................................................................................................... 31
CHAPITRE II ................................................................................................................................................37
OBJECTIF ......................................................................................................................................................... 40
FORMALISATION DES STRATÉGIES ........................................................................................................................ 41
SIMULATION I .................................................................................................................................................. 56
SIMULATION II ................................................................................................................................................. 74
DISCUSSION DU CHAPITRE II ............................................................................................................................... 97
CHAPITRE III ............................................................................................................................................. 105
OBJECTIF ....................................................................................................................................................... 109
MÉTHODE GÉNÉRALE ...................................................................................................................................... 110
EXPERIENCE I ................................................................................................................................................. 119
EXPERIENCE II ................................................................................................................................................ 142
DISCUSSION CHAPITRE III ................................................................................................................................. 160
CHAPITRE IV ............................................................................................................................................. 165
RAPPEL DES PRINCIPAUX RÉSULTATS ................................................................................................................... 166
CONTRIBUTIONS THÉORIQUES ........................................................................................................................... 168
IMPLICATIONS PRATIQUES ................................................................................................................................ 182
CONTRIBUTIONS MÉTHODOLOGIQUES ................................................................................................................ 184
CONCLUSION GÉNÉRALE ........................................................................................................................... 191
RÉFÉRENCES ............................................................................................................................................. 193
ANNEXE A ................................................................................................................................................. 207
vii
LISTE DES TABLEAUX
Tableau 1 Sources d’information et modèles ....................................................................... 55 Tableau 2 Nombre d’indices extrinsèques, force d’association entre meilleur indice et
critère, et autocorrélation du critère ...................................................................................... 61 Tableau 3 Moyenne (écart-type) des corrélations entre les prévisions des modèles ............ 67
Tableau 4 PVE moyenne (écart-type) des modèles .............................................................. 68 Tableau 5 Fréquence de différence positive indiquant une performance supérieure au
modèle linéaire par modèle ................................................................................................... 68 Tableau 6 Modèle le plus performant par série temporelle .................................................. 69
Tableau 7 Coefficient de corrélation de Pearson entre autocorrélation du critère et
performance des modèles ...................................................................................................... 71 Tableau 8 Force d’association entre meilleur indice et critère et autocorrélation du critère 76 Tableau 9 Moyenne (écart-type) des corrélations entre les prévisions des modèles ............ 80
Tableau 10 PVE moyenne (écart-type) des modèles ............................................................ 81
Tableau 11 Fréquence de différence positive indiquant une performance supérieure au
modèle linéaire par modèle d’heuristique ............................................................................. 81
Tableau 12 Modèle le plus performant par série temporelle ................................................ 82 Tableau 13 Moyenne (écart-type) de performance des modèles par simulation .................. 84 Tableau 14 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque
sur la performance du modèle ANC2 ................................................................................... 85 Tableau 15 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque
sur la performance du modèle L&V1 ................................................................................... 86 Tableau 16 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque
sur la performance du modèle L&V2 ................................................................................... 87 Tableau 17 Régression linéaire de l’autocorrélation sur la performance du modèle L&V3 87
Tableau 18 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque
sur la performance de ML1 ................................................................................................... 88 Tableau 19 Résumé des coefficients de régression standardisés par source d’information et
modèles ................................................................................................................................. 88 Tableau 20 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force
d’association extrinsèque sur le gain de performance du modèle ANC1 ............................. 91 Tableau 21 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force
d’association extrinsèque sur le gain de performance du modèle ANC2 ............................. 92 Tableau 22 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force
d’association extrinsèque sur le gain de performance du modèle L&V1 ............................. 93 Tableau 23 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force
d’association extrinsèque sur le gain de performance du modèle L&V2 ............................. 93
Tableau 24 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force
d’association extrinsèque sur le gain de performance du modèle L&V3 ............................. 94 Tableau 25 Sources d’information par modèle ................................................................... 114 Tableau 26 Modèle le plus performant par série temporelle, défini par simulation ........... 118 Tableau 27 Déroulement des sessions expérimentales ....................................................... 120
Tableau 28 Décomposition de l’interaction performance PVE .......................................... 125
Tableau 29 Test-t à un échantillon entre fréquences moyennes de gain standardisées et
valeur test de zéro ............................................................................................................... 127
viii
Tableau 30 Fréquence de représentativité des modèles par participant ............................. 131 Tableau 31 Test-t à un échantillon entre fréquence de représentativité et valeur test de zéro
............................................................................................................................................ 132
Tableau 32 Différences absolues de fréquence moyenne d’utilisation entre les modèles. Les
différences non significatives sont ombragées ................................................................... 133 Tableau 33 Décomposition de l’interaction L&V1 ............................................................ 136 Tableau 34 Décomposition de l’interaction L&V2 ............................................................ 136 Tableau 35 Décomposition de l’interaction ML1 .............................................................. 137
Tableau 36 Décomposition de l’interaction sur adaptabilité .............................................. 138 Tableau 37 Test-t à un échantillon entre fréquence de gain et valeur test de zéro ............. 149 Tableau 38 Fréquence de représentativité des modèles par participant ............................. 151
Tableau 39 Test-t à un échantillon entre fréquence d’utilisation des modèles et valeur test
de zéro ................................................................................................................................ 152 Tableau 40 Différences moyennes absolues de la fréquence de représentativité des modèles.
Les différences non significatives sont ombragées ............................................................ 153
Tableau 41 Décomposition de l’interaction ML1 .............................................................. 156
Tableau 42 Décomposition de l’interaction adaptabilité .................................................... 158
ix
LISTE DES FIGURES
Figure 1. Modèle computationnel de prise de décision dynamique de Gibson et
collaborateurs (1997). Selon ce modèle, la prévision de l’évolution de la situation est une
composante importante dans le processus de prise de décision, mais demeure distincte de
cette dernière. Ainsi, la prévision de l’évolution peut, mais ne doit pas, inclure l’action. ..... 7 Figure 2. Illustration de trois séries temporelles. Dans ce cas précis, où la Variable 3 à la
période t = 26 serait le critère, et où aucune connaissance du domaine n’est possible, les
indices disponibles peuvent être de deux sources distinctes. La source extrinsèque concerne
la valeur des autres variables explicitement disponibles dans l’environnement. Dans ce cas-
ci, la valeur de la Variables 1 et de la Variable 2 aux périodes t <= 25 seraient des indices
de source extrinsèque possibles pour prédire le critère. La source intrinsèque serait la valeur
du critère lui-même (c’est-à-dire Variable 3) aux périodes passées t <= 25. ....................... 10 Figure 3. Welch, Bretschneider et Rohrbaugh (1998) manipulent entre autres la tendance à
long terme des séries temporelles. La série (a) représente une croissance moyenne de 20 par
période alors que la série (b) est caractérisée par une croissance moyenne de 10 par période.
Les participants doivent prédire la valeur de la série temporelle au temps t+n à plusieurs
reprises. ................................................................................................................................. 13 Figure 4. Welch, Bretschneider et Rohrbaugh (1998) ont aussi manipulé les indices
disponibles aux participants pour réaliser leur prévision. La condition (a) ne comportait
seulement que la valeur actuelle du critère alors que la condition (b) présentait certaines
informations relatives aux valeurs passées du critère. .......................................................... 14 Figure 5. Selon le ML, un environnement (composé d’un ensemble de critères Ye) peut être
prédit par une combinaison linéaire d’un ensemble d’indices (Xi). Le jugement (Ys) peut
également être modélisé par une pondération linéaire des indices. ...................................... 17 Figure 6. Diagramme du ML. Dans “Heuristic and Linear Models of Judgment: Matching
Rules and Environments” par R. M. Hogarth et Karelaia, 2007, Psychological Review, 114,
p. 734. Copyright 2007 de American Psychological Association. ....................................... 18 Figure 7. Exemple du comportement du modèle ANC1 lors de la prévision d’une série
temporelle critère de référence. ............................................................................................ 43 Figure 8. Exemple du comportement du modèle ANC2 lors de la prévision d’une série
temporelle critère de référence. On remarque entre autres que pour la période t = 17, la
prévision du modèle est parfaitement ajustée au critère alors qu’elle ne l’était pas lors de
l’application du modèle ANC1. ............................................................................................ 44
Figure 9. Exemple du comportement du modèle ANC3 lors de la prévision d’une série
temporelle critère de référence. Pour la prévision de cette série, les réponses produites par
ANC3 sont très similaires à ANC2 et identiques à ANC1. .................................................. 45 Figure 10. Exemple du comportement du modèle L&V1 lors de la prévision d’une série
temporelle critère de référence. Notez que les prévisions faites à l’aide de ce modèle sont
relativement différentes de celles faites par les modèles d’ancrage et ajustement. .............. 48 Figure 11. Exemple du comportement du modèle L&V2 lors de la prévision d’une série
temporelle critère de référence. Ce modèle est le premier, parmi ceux décrits, qui utilise des
informations de source extrinsèque (ces séries ne sont pas montrées dans la figure). Cela a
x
pour effet de modifier les prévisions par rapport à L&V1, notamment pour les périodes t >
1 et t < 9. ............................................................................................................................... 50 Figure 12. Exemple du comportement du modèle L&V3 lors de la prévision d’une série
temporelle critère de référence. Ce modèle extrait, intègre et pondère l’ensemble des
indices disponibles. Bien que la méthode de pondération soit simplifiée, ce modèle demeure
néanmoins le plus complexe parmi ceux présentés et constitue probablement une stratégie
hors de la portée cognitive humaine. .................................................................................... 51 Figure 13. Exemple du comportement du ML1 lors de la prévision d’une série temporelle
critère de référence. Ce modèle constitue la norme rationnelle dans ce contexte. Dans ce cas
précis, on observe que les prévisions de ML1 semblent relativement bien ajustées au
critère, mais que le niveau d’ajustement semble moindre à celui de certains modèles
d’heuristiques décrits précédemment. .................................................................................. 53 Figure 14. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces
séries est à la fois un critère et un indice. ............................................................................. 59 Figure 15. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces
séries est à la fois un critère et un indice. ............................................................................. 59
Figure 16. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries
est à la fois un critère et un indice. ....................................................................................... 60 Figure 17. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries
est à la fois un critère et un indice. ....................................................................................... 60 Figure 18. Facteur de relation entre la série temporelle critère Y2 et chacune des séries
temporelles K. Il n’y a pas de facteur de relation pour la série K2 puisqu’il s’agit de la série
critère et que ce paramètre n’est estimé que pour les séries extrinsèques. ........................... 63
Figure 19. Poids attribué aux indices Kn et Y pour la prévision de la série temporelle critère
Y2. Notez qu’au départ, le poids attribué à l’indice intrinsèque est le plus important, mais
qu’il cède éventuellement place à d’autres indices extrinsèques. ........................................ 64 Figure 20. Coefficients de régression non-standardisés des indices Kn et Y pour la prévision
de la série temporelle critère Y2. Notez qu’à l’inverse des poids calculés par le modèle
L&V3, le coefficient de l’indice intrinsèque (B 02) est d’abord faible, puis devient le plus
important par la suite. ........................................................................................................... 65
Figure 21. Prévisions de L&V3 et ML1 et valeurs réelles de la série temporelle critère
(nommée 7 ind ; faible – V2) pour les périodes [t > 9 : t <= 41]. Le critère est nommé « 7
ind » et « faible » puisqu’il est dans une condition où 7 indices extrinsèques sont
disponibles pour le prédire et où la force d’association extrinsèque avec ces indices est
faible.Les deux modèles génèrent des prévisions distinctes, et aucune n’arrive à prédire
parfaitement la série temporelle critère. ............................................................................... 65 Figure 22. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle
des modèles d’heuristiques formalisées et séries co-évoluant avec celles-ci (grises). ......... 69 Figure 23. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries
est à la fois un critère et un indice. Ces huit séries ont en moyenne une autocorrélation et
une force d’association extrinsèque élevées. ........................................................................ 77 Figure 24. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries
est à la fois un critère et un indice. Ces huit séries ont en moyenne une autocorrélation
élevée et une force d’association extrinsèque faible. ........................................................... 77
Figure 25. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries
est à la fois un critère et un indice. Ces huit séries ont en moyenne une autocorrélation
faible et une force d’association extrinsèque élevée. ........................................................... 78
xi
Figure 26. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries
est à la fois un critère et un indice. Ces huit séries ont en moyenne une autocorrélation
faible et une force d’association extrinsèque faible. ............................................................. 78
Figure 27. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle
de tous les modèles d’heuristiques et séries co-évoluant à celles-ci (grises). ....................... 83 Figure 28. Interface de CODEM. L’onglet « Situation » permet aux participants d’accéder
aux informations relatives aux valeurs actuelles et passées de toutes les variables de la
situation. Ces valeurs sont présentées sous forme graphique et numérique. Pour consulter
les valeurs passées, les participants doivent glisser la poignée située au bas à droite de
l’interface vers la gauche. ................................................................................................... 112 Figure 29. Interface de CODEM. L’onglet « Prédiction » permet aux participants d’entrer
la valeur numérique de leurs prévisions ainsi que d’indiquer leur niveau de confiance
moyen pour la période actuelle sur une échelle de 1 à 5. ................................................... 112 Figure 30. Interface de CODEM. Les écrans de rétroaction fournissent des informations sur
les changements dans les valeurs réelles des variables (haut) et sur la direction et
l’amplitude des erreurs de prévision (bas). ......................................................................... 113
Figure 31. Instructions présentées aux participants avant la tâche expérimentale. ............ 121 Figure 32. Exemple des réponses données par un sous-ensemble de 13 participants (gris)
comparativement à la série temporelle critère (noire). ....................................................... 123
Figure 33. Performance moyenne des participants par condition expérimentale (nombre
d’indices et force d’association extrinsèque). La performance correspond à la proportion de
variance expliquée des séries temporelles par les prévisions des participants. .................. 124 Figure 34. Gain de performance moyen des participants par condition expérimentale
(nombre d’indices et force d’association extrinsèque). Le gain de performance correspond à
la différence entre la performance des participants et celle obtenue par l’application parfaite
du modèle de jugement linéaire. ......................................................................................... 126 Figure 35. Fréquence de gain de performance par participant. Tous les participants ont
obtenus une performance supérieure à celle du modèle de jugement linéaire à au moins sept
reprises sur une possibilité de vingt-quatre. ........................................................................ 127 Figure 36. Fréquence de gain standardisée moyenne par condition expérimentale (nombre
d’indices et force d’association extrinsèque). Les tests-t révèlent que les fréquences sont
supérieure à 0 pour l’ensemble des conditions expérimentales. ......................................... 128
Figure 37. Proportion moyenne de représentativité des modèles par condition
expérimentale (nombre d’indices et force d’association extrinsèque) et modèle. .............. 134
Figure 38. Adaptabilité par condition expérimentale (nombre d’indices et force
d’association extrinsèque). .................................................................................................. 138 Figure 39. Exemple des réponses données par un sous-ensemble de 13 participants (gris)
comparativement à la série temporelle critère (noire). ....................................................... 145 Figure 40. Performance moyenne des participants par condition expérimentale (force
d’autocorrélation et force d’association extrinsèque). La performance correspond à la
proportion de variance expliquée des séries temporelles par les prévisions des participants.
............................................................................................................................................ 147 Figure 41. Gain de performance moyen des participants par condition expérimentale
(autocorrélation et force d’association extrinsèque). Le gain de performance correspond à la
différence entre la performance des participants et de celle obtenue par l’application
parfaite du modèle de jugement linéaire. ............................................................................ 148
xii
Figure 42. Fréquence de gain de performance par participant. Tous les participants ont
obtenus une performance supérieure à celle du modèle de jugement linéaire à au moins neuf
reprises sur une possibilité de trente-deux. ........................................................................ 149
Figure 43. Fréquence de gain standardisée par condition expérimentale (force
d’autocorrélation et force d’association extrinsèque). Les tests-t révèlent que les fréquences
sont supérieures à zéro pour l’ensemble des conditions expérimentales. .......................... 150 Figure 44. Proportion moyenne de représentativité des modèles par condition
expérimentale (autocorrélation et force d’association extrinsèque) et modèle. ................. 154
Figure 45. Adaptabilité par condition expérimentale (autocorrélation et force d’association
extrinsèque). ....................................................................................................................... 157 Figure 46. Exemple de prévisions de participants et de modèles pour une série critère avec
3 indices extrinsèques, autocorrélation élevée et force d’association élevée. Prévisions de
deux participants (9 et 11, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert), la
série critère (en rouge) et les séries extrinsèques (en grises). ............................................ 207 Figure 47. Exemple de prévisions de participants et de modèles pour une série critère avec
7 indices extrinsèques, autocorrélation élevée et force d’association élevée. Prévisions de
deux participants (9 et 11, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert), la
série critère (en rouge) et les séries extrinsèques (en grises). ............................................ 208 Figure 48. Exemple de prévisions de participants et de modèles pour une série critère avec
7 indices extrinsèques, autocorrélation élevée et force d’association élevée. Prévisions de
deux participants (13 et 18, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert),
la série critère (en rouge) et les séries extrinsèques (en grises). ........................................ 209 Figure 49. Exemple de prévisions de participants et de modèles pour une série critère avec
7 indices extrinsèques, autocorrélation élevée et force d’association faible. Prévisions de
deux participants (13 et 16, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert),
la série critère (en rouge) et les séries extrinsèques (en grises). ........................................ 210
xiii
REMERCIEMENTS
J’aimerais d’abord remercier Dr Sébastien Tremblay, mon directeur de thèse, pour
son dévouement tout au long de mon cheminement. Sébastien m’a permis non seulement de
maîtriser les outils essentiels à la recherche, mais m’a aussi montré les qualités qui font
d’une personne un bon chercheur. Notamment, je lui suis reconnaissant pour son
dynamisme, sa curiosité intellectuelle et pour son humilité scientifique. Il m’a montré qu’il
est toujours possible de remettre les idées conçues en question, que ce soit les nôtres ou
celles d’autrui. Je le remercie également pour toutes les opportunités offertes qui m’ont
permis de réaliser cette thèse, mais aussi d’être impliqué dans une panoplie de projets
stimulants.
Je souhaite également remercier les Drs Robert Rousseau et Michel B. DuCharme
d’avoir accepté de siéger sur mon comité de thèse. Les discussions que j’ai eu la chance
d’avoir avec vous ont tantôt été stimulantes, tantôt inspirantes. Dans tous les cas, elles
auront été formatrices et m’auront fait apprécier le travail de recherche. J’aimerais aussi
faire une mention spéciale pour Dre Claudette Fortin qui m’a donné une première chance
alors que j’étais toujours au baccalauréat.
Je tiens aussi à souligner le soutient exceptionnel procuré par Dr Frédéric Dehais
lors de mon séjour à l’ISAE. Vous m’avez rapidement considéré comme un collègue,
témoignant ainsi de votre confiance envers moi, et je vous en suis reconnaissant. Je veux
aussi féliciter toute l’équipe du CAS pour la qualité de la recherche conduite dans votre
laboratoire. J’aimerais également profiter de cette occasion pour remercier cette équipe
pour leur accueil chaleureux et plus spécifiquement Frédéric Dehais, Mickaël Causse,
Nicolas Régis, Éric Menant, Gauthier Durantin et Louise Giraudet qui ont grandement
contribué à rendre mon expérience en France mémorable.
Cela me mène naturellement à saluer mes collègues et amis. Certaines amitiés se
sont créées au cours de mon cheminement, notamment celles de Rémi Gaudreault, Daniel
Lafond et Cindy Chamberland. Bien que récentes, ces amitiés sont toutes très importantes
pour moi. D’autres amitiés perdurent depuis des années, particulièrement Bruno-Alexandre
xiv
Veillette-Cossette, Maxime Beaulieu, Jean-Mathieu Leclerc et Mathieu Dupuis. Bien que
nos routes se soient séparées il y a déjà un bon moment, vous aurez toujours contribué de
façon significative à ce que je suis devenu. Je réserve un merci particulier à Charles Viau-
Quesnel, Paule Ellefsen-Gauthier et leur conjoint respectif Rosalie Bilodeau et Yann Wafer
pour leur complicité authentique concrétisée par les bons moments passés ensembles.
Je termine en remerciant mes proches pour le support qu’ils m’ont conférés au cours
de ces longues années. Merci d’abord à mes beaux-parents, je me sens privilégié d’être
votre gendre et de me sentir chez vous comme si j’étais chez moi. Un merci spécial à
Gaëtan, mon grand-père, pour m’avoir transmis sa curiosité intellectuelle qui représente
encore aujourd’hui le vecteur principal de ma passion pour la recherche. Mes frères,
Mathieu, Olivier, je serai toujours heureux de discuter avec vous, car la passion que vous
exprimez en parlant de vos activités respectives vous rallie. Évidemment, merci à mes
parents pour leur soutien sans faille, tant moral que matériel. Si je ne transmets qu’une
fraction de votre amour à Raphaël, je serai déjà le meilleur des pères. Raphaël, d’ailleurs,
que je remercie pour être le seul à ne pas me demander quand ma thèse sera terminée!
Finalement, merci à ma conjointe, Catherine. Sache que les sacrifices que tu as faits pour
me permettre de réaliser cette thèse ne sont pas vains puisqu’ils germent en mon cœur en
amour pour toi. Je te serai éternellement reconnaissant pour tout, merci.
xv
AVANT-PROPOS
La présente thèse est rédigée en français et présentée dans un format traditionnel.
Néanmoins, les résultats présentés dans la présente thèse ont été partiellement publiés lors
de la conférence annuelle de Cognitive Science Society. Les résultats de l’Expérience 1 ont
été publiés en 2011 à Boston alors que les résultats de la Simulation 2 et de l’Expérience 2
ont été publiés lors de la conférence de 2012 à Sapporo. Les références précises sont
présentées ci-dessous :
Gagnon, J.-F., St-Louis, M.-E., & Tremblay, S. (2012). Selection of decision rules in
dynamic decision making. Affiche présentée au 34ème
Annual Meeting of the
Cognitive Science Society, Sapporo, Japan.
Gagnon, J.-F., & Tremblay, S. (2011). Forecasting the evolution of a system: the role of
cognitive strategies in complexity discovery. Affiche présentée au 33ème
Annual
Meeting of the Cognitive Science Society, Boston, MA.
1
INTRODUCTION GÉNÉRALE
2
Les individus qui doivent prendre des décisions au sein d’un environnement
dynamique émettent constamment des prévisions sur l’évolution de la situation. Ces
prévisions permettent aux individus d’adapter leurs décisions afin de les rendre plus
efficaces (Pezzulo, 2008). Le processus de prévision est fondamental dans plusieurs
domaines, particulièrement dans un contexte où la complexité est élevée. Par exemple,
l’ajustement de politiques financières nécessite de prédire les changements dans la valeur
d’indicateurs macro-économiques. Les médecins doivent aussi se baser sur la prévision de
l’évolution de marqueurs physiologiques pour ajuster une intervention médicale (par
exemple, Busemeyer, 1999). Finalement, les investissements financiers sont largement
déterminés par la prévision des indices boursiers (par exemple, Lawrence et al., 2006;
Stekler, 2007; Teddy & Ng, 2011). De telles situations sont caractérisées par un niveau
élevé de complexité dynamique et d’opacité. Essentiellement, cela signifie qu’elles sont
déterminées par un nombre important de facteurs en interactions, dont émergent des patrons
d’évolution temporelle non linéaires, en plus d’être difficilement observables (Gonzalez et
al., 2005). Plusieurs études démontrent que les individus qui, de par leur fonction, doivent
tenter de contrôler et/ou prédire l’évolution de ces situations y arrivent difficilement, voire
pas du tout (par exemple, Blech & Funke, 2005; Diehl & Sterman, 1995).
La connaissance des sources de ces difficultés est critique puisque les dommages
qui sont associés à une prévision inefficace sont substantiels. Par exemple, la compagnie
Nike a reconnu qu’une erreur de prévision de son inventaire est à l’origine de pertes
évaluées à 400 millions de dollars (Worthen, 2003). Conséquemment, les efforts déployés
pour développer des modèles statistiques capables de prédire ces situations sont
considérables. Des modèles statistiques de prévision ont été appliqués avec succès entre
autres aux domaines du recrutement de personnel (par exemple, Jilani et al., 2008), des
indices financiers (par exemple, Wang & Chen, 2009), de la demande touristique (par
exemple, Huarng et al., 2007) et des accidents de véhicules routiers (par exemple, Jilani &
Burney, 2007). Néanmoins, malgré les efforts importants accomplis par la communauté de
chercheurs dans le domaine pour développer de tels modèles, le processus de prévision est
indissociable du jugement humain pour différentes raisons. Premièrement, plusieurs
travaux démontrent qu’un ajustement fait par un humain des prévisions calculées par les
3
modèles statistiques permet d’améliorer la précision des estimations (Goodwin, 2005;
McNees, 1990). Une des raisons mise de l’avant pour expliquer ce résultat étonnant est que
le prédicteur humain n’est pas contraint à un ensemble de facteurs prédéterminés et peut
donc intégrer des facteurs exogènes inexploités par le modèle statistique (Edmundson et al.,
1988; Sanders & Ritzman, 1992). Deuxièmement, les modèles statistiques peuvent être
perçus comme des boîtes noires dont les mécanismes sont mal compris et, par conséquent,
les décideurs peuvent souhaiter conserver un « droit de regard » sur les résultats
(Kleinmuntz, 1990; Langer, 1975). Finalement, derrière le développement de tout modèle
statistique, des jugements humains doivent être portés. Par exemple, lors du choix des
facteurs à intégrer au modèle (Stekler, 2007).
Le rôle central du jugement humain dans la prévision de situations dynamiques
complexes pousse plusieurs auteurs à dire que des recherches plus approfondies sur les
processus cognitifs impliqués dans l’exécution de cette tâche sont requises (Fildes &
Stekler, 2002; Stekler, 2007). Toutefois, toujours selon ces auteurs, seules de rares études
se sont intéressées aux processus cognitifs impliqués dans l’exécution de cette tâche.
Plusieurs auteurs (Gigerenzer & Gaissmaier, 2011; Stekler, 2007) suggèrent que pour
acquérir de telles connaissances, il faudrait développer et tester des modèles de prévision,
or, c’est précisément la méthode employée par la présente thèse. En effet, la thèse compare
plusieurs modèles en lien avec le comportement humain afin d’identifier quelles sont les
stratégies employées par les individus pour prédire les situations dynamiques complexes.
Entre autres, cette comparaison permettra d’établir si les individus sont irrationnels dans ce
contexte, c’est-à-dire s’ils emploient des stratégies sous optimales comparativement à une
norme établie.
La thèse explore le concept de « rationalité écologique » dans un contexte de
prévision. La rationalité écologique postule que l’adoption de règles simplifiées et rapides –
ou heuristiques – n’est pas intrinsèquement irrationnelle, mais qu’elle serait même
préférable, sous certaines conditions, à l’application stricte d’une logique formelle ou de la
théorie de la probabilité considérées comme rationnelles (Dieckmann & Rieskamp, 2007;
Rieskamp & Otto, 2006; Rieskamp & Reimer, 2007). Les conditions où de telles
4
heuristiques seraient performantes demeurent toutefois mal définies, particulièrement dans
un contexte de prévision de situation dynamique complexe. La thèse s’intéresse donc à ces
conditions, au sein d’une tâche de prévision, sous lesquelles l’adoption d’heuristiques est
adaptée.
La thèse se divise en quatre chapitres. Le premier chapitre présente une recension
des écrits dans laquelle sont décrits les principaux travaux empiriques portant sur les
facteurs associés à la qualité des prévisions humaines de situations dynamiques complexes.
Le chapitre se poursuit avec la présentation des principaux modèles théoriques qui
expliquent le jugement humain dans ce contexte. Il se conclut avec l’élaboration des
objectifs et hypothèses de la thèse. Le deuxième chapitre constitue un effort de simulation
computationnelle de stratégies cognitives de prévision. Ce chapitre évalue la performance
de modèles d’heuristiques comparativement à la norme rationnelle attendue de jugement
linéaire (Brunswick, 1952) sous plusieurs conditions. Ces conditions visent à faire varier la
qualité des informations dont disposent les modèles pour faire leurs prévisions. Les
simulations démontrent que les heuristiques performent mieux que le modèle de jugement
linéaire dans une grande variété de conditions. Le troisième chapitre concerne l’étude de la
prévision humaine de situations dynamiques complexes. Il étudie la performance humaine,
mais également les stratégies employées par les individus pour faire leurs prévisions. Les
expériences qui y sont décrites tentent de démontrer que la stratégie adoptée peut être plus
performante qu’une stratégie considérée comme rationnelle. En effet, les résultats
démontrent que les individus adaptent leur stratégie selon les caractéristiques de
l’environnement, ce qui permet fréquemment l’atteinte de performances supérieures à
celles obtenues par un modèle linéaire « rationnel ». Enfin, le dernier chapitre présente une
intégration théorique des deux chapitres empiriques de la thèse afin de mettre en lumière
l’ensemble des résultats observés. Les résultats sont principalement interprétés à la lumière
de la rationalité écologique.
5
CHAPITRE I
JUGEMENT HUMAIN DANS LA PRÉVISION DE SÉRIES
TEMPORELLES
6
Contexte théorique et problématique
Une prévision est une estimation de l’état futur d’une situation (Poli, 2010). Le
processus de prévision est fondamental dans plusieurs domaines d’application, notamment
dans un contexte où la complexité est élevée. Par exemple, des décideurs doivent prédire
l’évolution d’un feu de forêt pour allouer les ressources requises aux bons endroits
(Brehmer & Allard, 1991), ou encore prévoir quels seront les stocks d’inventaires de
chaînes d’approvisionnement pour éviter des effets indésirables comme le « bullwhip
effect ». Cet effet initialement décrit par Forrester (1961) consiste en des fluctuations
d’inventaires de plus en plus importantes et dissociées de la demande réelle du marché, qui
mènent à des coûts importants pour les entreprises en charge de la production et de la
distribution de biens (par exemple, Lawrence et al., 2006). De telles situations
dynamiquement complexes sont déterminées par un nombre important de facteurs en
interactions, dont émergent des patrons d’évolution temporelle non linéaires, en plus d’être
difficilement observables (Gonzalez et al., 2005). De plus, ces patrons temporels se
répètent rarement ce qui limite grandement la possibilité d’apprentissage (Kurtz &
Snowden, 2010; Sterman, 2010). Ces situations retiennent particulièrement l’attention des
chercheurs depuis quelques décennies puisqu’elles représentent un défi important pour les
humains en charge de les contrôler et de les prédire (pour une série d’exemples éloquents,
voir Dörner, 1996).
PRÉVISIONS ET DÉCISIONS
L’importance du processus de prévision dans la prise de décision ne fait aucun
doute (Osman & Speekenbrink, 2012). En effet, les prévisions sont requises dans la
planification des interventions pour l’atteinte efficace des objectifs (Burns & Vollmeyer,
2002; Gibson, 2007; Osman, 2010; Vollmeyer et al., 1996). Par exemple, certains
chercheurs ont observé qu’une proportion significative de temps est allouée par les pilotes
de ligne expérimentés à la prévision d’occurrences futures possibles lors du pilotage
(Amalberti & Deblon, 1992). Le processus de prévision fait d’ailleurs partie de plusieurs
modèles cognitifs qui tentent d’expliquer la prise de décision au sein d’environnements
dynamiques complexes. C’est le cas entre autres du modèle de la conscience de la situation
d’Endsley (1995), qui décrit la projection comme étant l’habileté à prévoir les évènements
7
et la dynamique future de la situation. Selon ce modèle, la projection constitue le plus haut
niveau de compréhension qu’un individu puisse avoir d’une situation et permettrait une
prise de décision adaptée en temps opportun (Endsley, 1995; 2000). L’utilité de telles
prévisions a d’ailleurs été testée par Gibson, Fichman et Plaut (1997) qui, au sein d’une
tâche de prise de décision dynamique (Sugar Production Factory; voir Stanley et al., 1989),
ont comparé des données humaines à des données simulées par un modèle de prise de
décision composé de deux sous-modèles : un sous-modèle d’action et un sous-modèle de
prévisions (voir Figure 1). Le sous-modèle de prévision a pour rôle de prédire l’utilité des
décisions dans un contexte donné. Les auteurs ont observé que le modèle représentait bien
plusieurs aspects des données humaines, notamment la performance à la tâche et la capacité
de transfert vers de nouveaux objectifs.
Figure 1. Modèle computationnel de prise de décision dynamique de Gibson et collaborateurs (1997). Selon
ce modèle, la prévision de l’évolution de la situation est une composante importante dans le processus de
prise de décision, mais demeure distincte de cette dernière. Ainsi, la prévision de l’évolution peut, mais ne
doit pas, inclure l’action.
Évolution prédite t+1 (F)
Évolution réelle t+1 (Y)
Objectif État actuel au temps t
Prévisions
Action
Modèle de prévision
Modèle d’action
8
Un autre consensus qui se dégage cette fois-ci des études sur la prévision en milieu
écologique est celui du rôle central du jugement humain pour réaliser cette tâche
comparativement à l’utilisation seule de modèles statistiques. Par exemple, la correction
des prévisions des modèles statistiques par des humains constitue la principale méthode
employée pour la prévision des niveaux d’inventaires dans les entreprises responsables de
chaînes d’approvisionnement (Fildes et al., 2009). Fildes et Goodwin (2007) ont réalisé des
entrevues auprès de 149 praticiens d’industries variées (par exemple, des gestionnaires de
haut niveau, des directeurs d’entreprises) dans le but de connaitre les méthodes employées
pour faire des prévisions dans un contexte écologique. Les praticiens étaient recrutés lors de
conférences internationales sur la prévision et représentaient plusieurs industries comme
l’alimentation, les télécommunications, les assurances, les banques, les produits
pharmaceutiques, le transport, le marché immobilier et les cosmétiques. Sur la base de ces
entrevues, les auteurs estiment que 75% des prévisions réalisées au sein de ces industries
impliquent une part de jugement humain. Seules 25% des prévisions seraient basées
exclusivement sur des modèles statistiques. De plus, bien que des prévisions puissent être
réalisées en partie par des algorithmes automatisés, il a été démontré à plusieurs reprises
que la précision des prévisions faites par ces modèles bénéficie d’un ajustement de la part
d’un analyste humain (par exemple, Goodwin, 2005; McNees, 1990). Entre autres, Fildes,
Goodwin, Lawrence et Nikolopoulos (2009) ont observé qu’en moyenne, sur 60 000
prévisions réelles tirées de quatre compagnies de chaîne d’approvisionnement, les
ajustements réalisés par des humains sur les prévisions statistiques ont permis d’accroître
leur précision. Ce résultat est surprenant étant donné les limites cognitives fondamentales
humaines, mais s’expliquerait par le fait que la combinaison humain machine pour la
réalisation de cette tâche permettrait de combler les faiblesses de l’une et l’autre des
approches pour l’atteinte d’un résultat supérieur (Goodwin, 2005).
Les modèles théoriques et les résultats empiriques cités précédemment démontrent
l’importance de la prévision dans la prise de décision dynamique. Ces observations sont
d’autant plus pertinentes que le jugement humain joue un rôle central dans la prévision de
situations dynamiques complexes. En effet, les méthodes statistiques semblent souvent
insuffisantes pour réaliser adéquatement cette tâche et sont ainsi peu utilisées seules.
L’importance des prévisions dans une panoplie de contextes et le manque d’études
9
intéressées à comprendre les processus cognitifs impliqués dans la prévision poussent
plusieurs auteurs à dire que des recherches plus approfondies sur ce sujet sont requises (par
exemple, Fildes & Stekler, 2002; Stekler, 2007). C’est donc dans ce contexte que la
présente thèse s’y intéresse.
Ce chapitre est organisé en quatre sections : (1) la description du paradigme
employé pour étudier la prévision de situations dynamiques complexes au sein de la
présente thèse (c’est-à-dire la prévision de séries temporelles) et des résultats clés qui en
émanent; (2) la description des principaux modèles du jugement humain applicables à la
prévision de séries temporelles; (3) une exposition des lacunes actuelles et des pistes de
réconciliation, notamment la rationalité écologique; et (4) une exposition des méthodes,
objectifs et hypothèses de la présente thèse.
PRÉVISION DE L’ÉVOLUTION DE SITUATIONS DYNAMIQUES COMPLEXES
Une prévision est tout jugement porté sur le futur (Clements & Hendry, 2002). Dans
un contexte de jugement, on réfère à la variable à prédire en tant que critère alors qu’on
réfère aux informations employées pour porter le jugement en tant qu’indices. Selon
Harvey (2007), trois types d’indices (ou source d’information) peuvent être utilisés afin de
réaliser ce jugement. Pour référence, ils seront nommés source mémoire (SM), source
extrinsèque (SE) et source intrinsèque (SI). La source mémoire ne concerne pas les données
explicitement disponibles dans l’environnement, mais plutôt les connaissances a priori
contenues en mémoire qui sont en lien avec la situation à prédire. Par exemple, un analyste
financier pourrait avoir une certaine représentation mentale du comportement du produit
intérieur brut d’un pays donné même s’il n’a pas accès à ces informations explicitement.
Lors d’un cours à l’université, il pourrait avoir acquis certaines connaissances sur le
comportement du produit intérieur brut en temps de crise économique sans pour autant en
avoir fait l’expérience dans sa pratique. Ces connaissances pourraient être employées pour
réaliser une prévision. La source extrinsèque concerne les valeurs d’autres variables
présentes dans l’environnement. Par exemple, dans la Figure 2, un jugement basé sur ce
type d’indice dans la prévision de la Variable 3 à la période t = 25 (donc pour la période t =
26), serait informé par la valeur de la Variable 1 et la Variable 2 aux périodes t <= 25.
Finalement, la source intrinsèque concerne les valeurs passées explicitement disponibles du
10
critère lui-même. Le critère est ainsi également son propre indice. Par exemple, dans la
Figure 2, la prévision de la Variable 3 à la période t = 25 (donc pour période t = 26), serait
informé par l’ensemble des valeurs de la Variable 3 aux périodes t <= 25. Ces sources
d’information ne sont pas mutuellement exclusives, chaque source pouvant être utilisée
individuellement ou en combinaison (Harvey et al., 1994). Par exemple, un individu
pourrait déterminer le niveau de base d’une variable avec la moyenne des instances passées
et ajuster la prévision selon la valeur d’une autre variable.
Figure 2. Illustration de trois séries temporelles. Dans ce cas précis, où la Variable 3 à la période t = 26 serait
le critère, et où aucune connaissance du domaine n’est possible, les indices disponibles peuvent être de deux
sources distinctes. La source extrinsèque concerne la valeur des autres variables explicitement disponibles
dans l’environnement. Dans ce cas-ci, la valeur de la Variables 1 et de la Variable 2 aux périodes t <= 25
seraient des indices de source extrinsèque possibles pour prédire le critère. La source intrinsèque serait la
valeur du critère lui-même (c’est-à-dire Variable 3) aux périodes passées t <= 25.
Le terme prévision peut toutefois être très englobant si on suppose qu’il concerne
tout jugement sur le futur, or, la présente thèse se concentre sur les situations dynamiques
complexes telles que la gestion de portefeuilles financiers ou la prévision de stocks
d’inventaire. Ces situations sont caractérisées par certaines propriétés qui spécifient la tâche
de prévision étudiée dans le cadre de la présente thèse. En effet, une situation est
dynamiquement complexe lorsque ses interrelations génèrent des patrons d’évolution non
0
50
100
150
200
250
300
350
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25
Val
eu
r
Période
Variable 1
Variable 2
Variable 3
Prévisions
11
linéaires dans le temps (voir Busemeyer & Pleskac, 2008; Gibson, 2007; Gonzalez et al.,
2005; Osman, 2010; Sterman, 2000). Selon Kurtz et Snowden (2010), ces patrons
temporels peuvent se répéter, mais leur évolution est incertaine. Conséquemment,
l’occurrence d’un patron spécifique dans le passé n’est pas garante de sa répétition dans le
futur. Typiquement, ces patrons non linéaires sont causés par des boucles de rétroactions
positives et des délais au sein de la structure causale d’un système (voir Forrester, 1961).
Toutefois, la nature des relations entre les variables impliquées dans une telle situation n’est
pas toujours accessible, c’est-à-dire que la situation est opaque (voir Brehmer, 1992;
Gonzalez et al., 2005; Machuca et al., 1998; Paich & Sterman, 1993; Sterman, 2002; 2006).
Les causes de l’opacité sont multiples, mais Sterman (1994) souligne que la principale
cause est la présence de délais de rétroaction qui limite l’apprentissage de telles relations.
Ces caractéristiques propres aux environnements dynamiques complexes sont critiques
puisqu’elles affectent la validité et la fiabilité des indices (en mémoire, intrinsèques et
extrinsèques) pour la prévision des critères (Seifert & Hadida, 2013). Ainsi, même si un
environnement est parfaitement déterminé par une structure causale bien définie, il peut
être perçu comme étant probabiliste, particulièrement par des individus non-familiers avec
l’environnement concerné (Vincente, 2003). Finalement, les indices et les critères
impliqués dans de telles situations sont fréquemment continus. Cette caractéristique est
importante puisqu’elle a un impact significatif sur la nature de la tâche à réaliser. En effet,
c’est une chose de prévoir si une cote boursière augmentera ou diminuera, mais il en est
une autre d’estimer la valeur du changement.
L’impact négatif de ces caractéristiques sur l’apprentissage des relations entre les
éléments de la situation est bien documenté (voir Dörner, 1996; Sterman, 2002; 2006).
Étant donné le peu d’apprentissage possible, la plupart des individus n’ont peu ou pas
d’information a priori en mémoire sur laquelle ils peuvent se baser lorsqu’ils émettent un
jugement de prévision. Ils doivent donc se baser sur les valeurs passées du critère et/ou la
valeur d’autres variables explicitement disponibles dans l’environnement. Pour reprendre
les termes de Harvey (2007), les individus doivent se baser sur les sources intrinsèques et
extrinsèques d’information. Ces sources d’information combinées à la nature continue des
variables impliquées dans ces situations sont des caractéristiques importantes qui sont
12
représentées au sein d’une tâche de prévision de séries temporelles, ce qui en fait un
paradigme de choix pour l’étude des prévisions de situations dynamiques complexes.
Tâche de prévision de séries temporelles. La tâche de prévision de séries
temporelles constitue un candidat intéressant pour l’étude de la prévision de situations
dynamiques complexes puisqu’elle en représente certains des aspects critiques (Lawrence
et al., 2006; Seifert & Hadida, 2013). Par exemple, elle comporte les mêmes sources
d’information et le critère est défini par des valeurs continues, non catégorielles. Cette
tâche consiste typiquement en la présentation d’une ou de plusieurs séries temporelles pour
lesquelles les participants doivent prédire la valeur pour la période suivante (t+1) ou une
période plus éloignée (t+n). Dans le paradigme de prévision de séries temporelles, le
participant est uniquement un observateur de la situation, c’est-à-dire que la situation
évoluera de la même façon, peu importe les prévisions faites par le participant. De plus, la
prévision de séries temporelles n’implique aucune pression temporelle. À l’inverse, dans
une tâche de prise de décision dynamique, les interventions du participant influenceront
l’évolution de la situation en plus de devoir composer avec une évolution autonome et en
temps réel de celle-ci (Brehmer, 1992; Edwards, 1962). Les différences entre la prévision
de séries temporelles et les situations dynamiques à proprement parlé sont importantes et
pourraient avoir une incidence sur la façon dont ces tâches sont réalisées. Néanmoins, sur
un continuum entre une situation purement statique et une situation dynamique, la prévision
de séries temporelles, se rapproche davantage des caractéristiques dynamiques étant donné
l’évolution temporelle des séries. Au sein du paradigme de prévision de séries temporelles,
les caractéristiques propres aux séries diffèrent en fonction des objectifs expérimentaux,
mais la valeur à prédire est continue, contrairement à une tâche de catégorisation d’objets,
par exemple, où le critère est souvent catégoriel. La Figure 3 montre deux exemples de
séries temporelles présentées par Welch, Bretschneider et Rohrbaugh (1998) à leurs
participants.
13
Figure 3. Welch, Bretschneider et Rohrbaugh (1998) manipulent entre autres la tendance à long terme des
séries temporelles. La série (a) représente une croissance moyenne de 20 par période alors que la série (b) est
caractérisée par une croissance moyenne de 10 par période. Les participants doivent prédire la valeur de la
série temporelle au temps t+n à plusieurs reprises.
Pour réaliser les prévisions, les participants ont typiquement accès à différentes
sources d’information, pouvant toutes être catégorisées selon les types d’indices
mentionnés précédemment (c’est-à-dire, SM, SE et SI; Harvey, 2007). Par exemple, Welch,
Bretschneider et Rohrbaugh (1998) ont manipulé les indices présentés aux participants
selon la condition de disponibilité de l’information à laquelle ils étaient assignés (voir
Figure 4). Dans la condition A, les participants avaient accès seulement à la valeur actuelle
du critère alors que dans la condition B, les participants avaient également accès à la valeur
actuelle du critère, ainsi qu’à certaines informations concernant ces valeurs passées. Par
exemple, ils avaient accès à la moyenne des trois dernières périodes et au changement
moyen par période.
14
Figure 4. Welch, Bretschneider et Rohrbaugh (1998) ont aussi manipulé les indices disponibles aux
participants pour réaliser leur prévision. La condition (a) ne comportait seulement que la valeur actuelle du
critère alors que la condition (b) présentait certaines informations relatives aux valeurs passées du critère.
Les données présentées aux participants le sont parfois sous forme graphique (par
exemple, Lim & O’Connor, 1996; Welch et al., 1998) et parfois sous forme numérique, au
sein d’un tableau (par exemple, Desanctis & Jarvenpaa, 1989; Harvey & Bolger, 1996). Ces
formats ont été testés puisqu’ils sont typiquement utilisés dans les tâches écologiques de
prévision telle que la gestion de portefeuilles financiers. La plupart des chercheurs adoptent
un mode graphique de présentation des données qui privilégierait une meilleure estimation
de la tendance des séries temporelles comparativement à la forme numérique au sein d’un
tableau (Lawrence et al., 2006).
Observations empiriques. Le principal consensus qui se dégage de l’étude du
jugement humain avec le paradigme de prévision de séries temporelles est que le jugement
humain est sujet à des biais et des erreurs systématiques attribués à l’adoption de règles
irrationnelles (par exemple, Becker & Leopold-Wildburger, 1996; Becker et al., 2007;
Bolger et Harvey, 1993; Eggleton, 1982; Harvey, 2007; Lawrence & Makridakis, 1989;
Ying Luo, 2013; O’Connor et al., 1997; Reimers & Harvey, 2011). Un jugement est
généralement considéré comme rationnel lorsqu’il est raisonné (ou choisi explicitement) et
15
qu’il correspond à la méthode considérée comme optimale pour l’atteinte des objectifs
(Sturm, 2012). Un jugement optimal est considéré comme le plus favorable à l’atteinte d’un
objectif, dans ce cas-ci, l’objectif étant de minimiser l’erreur de prévision. Par exemple,
lors d’une tâche de prévision basée sur un lien probabiliste entre les indices et le critère, le
modèle rationnel attendu correspond à un jugement linéaire où l’ensemble des indices sont
intégrés et pondérés de façon linéaire au critère, et ce au sein d’une même représentation
(Anderson, 1981; Brehmer, 1994; Hammond, 1996; Muth, 1961). Un jugement est donc
irrationnel s’il n’est pas raisonné ou optimal par rapport à une norme donnée, dans ce cas-ci
le jugement linéaire (Muth, 1961). Selon ces prémisses, les résultats observés en ce qui
concerne la rationalité des individus ne sont toujours pas concluants (voir Stekler, 2002;
2007). Dans certains cas, souligne Stekler, le même individu réalisera des prévisions
cohérentes avec le modèle rationnel pour une variable donnée et incohérentes pour une
autre variable.
Parmi les biais observés, il semble que les individus sous-estiment les pentes des
séries temporelles, autant positives que négatives (Eggleton, 1982; Lawrence &
Makridakis, 1989; O’Connor et al., 1997). Bolger et Harvey (1993) observent également
que (1) le choix de l’heuristique dépend du type de série temporelle, que (2) les heuristiques
adoptées n’étaient pas paramétrées de façon optimale et que (3) c’est ce qui expliquerait en
partie la performance médiocre observée. Ce dernier point est essentiel puisqu’il attribue
une partie de la performance humaine aux stratégies employées pour faire un jugement,
comparativement aux caractéristiques individuelles, comme l’intelligence (Danner et al.,
2011). L’adoption de ces stratégies pourrait être modulée par les caractéristiques
environnementales, particulièrement selon la nature des sources d’information disponibles
(voir Harvey, 2007). Les connaissances sur les stratégies employées pour porter des
jugements sur les séries temporelles sont néanmoins encore fragmentaires et parfois
contradictoires, comme en témoigne le débat toujours actif de la rationalité des jugements
dans ce contexte (Stekler, 2002; 2007). Toutefois, plusieurs modèles d’heuristiques
pourraient s’appliquer à la prévision de séries temporelles et permettraient certainement
d’acquérir des connaissances sur les stratégies adoptées pour faire des prévisions (Fildes &
Stekler, 2002). Ces modèles sont décrits en détails dans les pages subséquentes.
16
MODÈLES DE JUGEMENT
La littérature sur le jugement humain est dominée par deux classes de modèles. La
première classe considère que les individus intègrent et pondèrent toutes les informations
disponibles au sein d’une représentation typiquement linéaire (Anderson, 1981; Brehmer,
1994; Hammond, 1996; Muth, 1961). Ce type de jugement est souvent considéré par
plusieurs comme étant la norme rationnelle, menant à une prévision optimale au sein des
environnements probabilistes comme la prévision de séries temporelles complexes.
D’ailleurs, Karelaia et Hogarth (2008) rapportent, dans une méta-analyse regroupant 249
études, un niveau élevé de prévisibilité des environnements linéaires et non linéaires à
l’aide de cette classe de modèle. La prévisibilité réfère à la capacité du jugement linéaire à
prédire le critère avec précision. Cette prévisibilité élevée constitue l’argument principal en
faveur du modèle linéaire comme étant la norme rationnelle dans ce type d’environnement.
La seconde classe de modèles considère que les individus sont intrinsèquement limités en
termes de traitement de l’information et que, par conséquent, ils adoptent des règles
simplificatrices, nommées heuristiques (Gigerenzer et al., 1999; Goldstein & Gigerenzer,
2009; Kahneman et al., 1982; Todd & Gigerenzer, 2000). Les heuristiques sont des
stratégies cognitives rapides et facilement exécutables, mais aussi simplificatrices
puisqu’elles ignorent une certaine partie de l’information disponible (Gigerenzer &
Gaissmaier, 2011). Les pages qui suivent contiennent une description de chacune de ces
classes de modèles et de leurs principaux représentants.
Jugement Linéaire. Le modèle le plus connu et le plus étudié du jugement linéaire
est le modèle lentille (ML) (Brunswik, 1952; 1955; puis Tucker, 1964; voir Figure 5). Bien
qu’il existe d’autres façons de modéliser le jugement linéaire, le ML représente la façon la
plus acceptée par la communauté scientifique. Selon le ML, un environnement (composé
d’un ensemble de critères Ye) peut être prédit par une combinaison linéaire d’un ensemble
d’indices (Xi). Ce modèle suppose également que le jugement humain (Ys) procède de cette
manière, c’est-à-dire par la pondération linéaire des indices.
17
JugementCritère
Indices
Figure 5. Selon le ML, un environnement (composé d’un ensemble de critères Ye) peut être prédit par une
combinaison linéaire d’un ensemble d’indices (Xi). Le jugement (Ys) peut également être modélisé par une
pondération linéaire des indices.
Le ML suppose donc que le lien entre les indices et le critère peut être décrit de
manière probabiliste et que cette façon de procéder représente bien la compréhension
qu’ont les humains de leur environnement (Brunswik, 1952; 1955). C’est-à-dire que la
compréhension de l’environnement passe par un jugement qui pondère la validité de chacun
des indices selon une probabilité de représentativité plutôt qu’une certitude. L’hypothèse
probabiliste ne peut toutefois pas être démontrée empiriquement puisqu’il est toujours
possible qu’une relation déterministe sous-jacente au comportement probabiliste existe.
Néanmoins, comme Vincente (2003) le souligne, il est tout à fait possible de décrire un
environnement déterminé par un modèle probabiliste. De plus, dans plusieurs situations
(par exemple, le marché de la bourse), les relations déterministes sont inconnues ou peut-
être même inexistantes. Par conséquent, ces situations ne peuvent pas être décrites par des
modèles déterministes, mais peuvent l’être par des modèles probabilistes comme le ML
(voir aussi Hammond, 1996).
Brunswik (1952) fut le premier à élaborer ce modèle probabiliste linéaire de
jugement humain, mais on attribue à Tucker (1964) sa formalisation en termes statistiques
(Figure 6). La partie gauche du ML constitue une description de l’environnement alors que
la partie droite du modèle concerne le jugement humain de ce même environnement. Selon
ce modèle, la prévisibilité de l’environnement (Re) et l’adéquation entre le modèle de
l’environnement et le modèle du jugement (G) sont deux déterminants importants de la
18
performance. La prévisibilité de l’environnement spécifie la limite supérieure de
performance qu’un individu peut atteindre (Vincente, 2003), alors que l’adéquation spécifie
le niveau auquel la règle de jugement linéaire est respectée. Selon une méta-analyse
récente, le ML explique environ 64% de la variance de l’environnement (Re2) et du
jugement humain (Rs2) (Karelaia & Hogarth, 2008).
X1
Xi
Xj
Xk
Jugement du participant = YsValeur du critère = Ye
Valeur prédite du critère = Ŷe
Prédiction du jugement du
participant = Ŷs
Indices
PYeX 1
PY
s X1
PYeX i PYsXi
PYeXj PYsX j
PY
e Xk PY
sXk
Prévisibilité du
jugement
Prévisibilité de
l’environnement
Index d’adéquation
Index de
performance
Figure 6. Diagramme du ML. Dans “Heuristic and Linear Models of Judgment: Matching Rules and
Environments” par R. M. Hogarth et Karelaia, 2007, Psychological Review, 114, p. 734. Copyright 2007 de
American Psychological Association.
Jugement Linéaire en tant que norme rationnelle. Il existe plusieurs définitions de
la rationalité. Bien qu’il existe probablement d’autres modèles de jugement qui pourraient
être considérés comme norme rationnelle dans ce contexte, le modèle de jugement linéaire,
qui a été largement étudié dans le domaine du jugement et de la prise de décision,
représente un candidat crédible car il répond aux principales conditions nécessaires pour
19
être considéré comme norme rationnelle. En effet, selon Hastie et Dawes (2010) la
rationalité se définit par quatre conditions :
(1) Elle est basée sur les capacités actuelles du juge, incluant son état cognitif,
physiologique, et émotif.
(2) Elle est basée sur les conséquences possibles du jugement.
(3) Lorsque les conséquences d’un jugement sont incertaines, les probabilités sont
évaluées en fonction des règles de base de la probabilité.
(4) Le jugement est adapté par rapport aux contraintes de ces probabilités et la
valeur des conséquences attribuées par le juge.
Dans ce contexte-ci, la première condition est satisfaite par le modèle de jugement
linéaire essentiellement pour deux raisons. La première concerne la pertinence
fonctionnelle du modèle comparativement à la cognition humaine, la seconde concerne
l’efficacité de ce modèle à représenter le jugement humain dans des situations dynamiques
complexes. Premièrement, la flexibilité du jugement linéaire constitue selon plusieurs
auteurs une caractéristique cruciale du jugement humain et devrait ainsi être représentée au
sein des modèles qui le représentent (Brehmer, 1994; Brunswick, 1952). Ce que Brunswick
appelle le fonctionnement par procuration du jugement humain, c’est sa capacité à être
flexible et interchangeable pour être adapté à une série de situations différentes. Cette
capacité serait critique pour faire face à des situations inconsistantes, inattendues ou
incomplètes. Cette similarité fonctionnelle du modèle de jugement linéaire en comparaison
avec le jugement humain se traduit également par un niveau élevé d’adéquation entre le
modèle et les jugements des individus (p.ex., Einhorn et al., 1979; Payne et al., 1993), ce
qui correspond au second argument en faveur de ce modèle comme norme rationnelle. En
effet, selon Karelaia et Hogarth (2008), le modèle de jugement linéaire expliquerait en
moyenne 64% de la variance du jugement des individus.
Dans le contexte de la thèse, les trois autres conditions sont aussi satisfaites,
notamment grâce à la nature de la tâche et aux mécanismes propres du jugement linéaire.
En effet, les « conséquences » possibles du jugement sont qu’il sera précis ou imprécis. Tel
qu’il sera décrit en détails plus loin dans le document, il n’y a pas d’autres conséquences
que de réussir ou échouer à prédire le critère. Le jugement doit donc nécessairement être
20
basé sur ces conséquences. De plus, les « conséquences » peuvent être évaluées en fonction
des règles de la probabilité. Le modèle de jugement linéaire est essentiellement basé sur
une optimisation de la combinaison linéaire pour prédire le critère et correspond donc à une
implémentation tout à fait viable des règles de base des probabilités. En effet, le modèle de
jugement linéaire a déjà démontré à plusieurs reprises sa capacité à représenter des
environnements complexes et dynamiques, et ce même lorsque ceux-ci sont caractérisés par
un certain niveau de non-linéarité. En effet, la méta-analyse de Karelaia et Hogarth (2008)
soulève que le modèle de jugement linéaire explique la variance de l’environnement entre
50% et 71%, dépendamment du contexte. En effet, même au sein d’environnements
défavorables, par exemple lorsqu’il n’y a pas de possibilité pour l’apprentissage ou dans un
environnement ou le lien entre les indices et les critères est non-linéaire, le modèle de
jugement linéaire arrive à bien expliquer la variance. Ce n’est d’ailleurs pas surprenant si le
modèle linéaire général est utilisé en mathématiques statistiques comme outil de
modélisation générique, étant donné sa grande flexibilité (Tabachnick & Fidell, 2007). De
plus, les modèles linéaires (souvent autorégressifs) sont fréquemment utilisés pour la
prévision de séries temporelles (p.ex., Anderson, 2011; Box et al., 2013; Chatfield, 2013;
Young, 2011).
Finalement, la quatrième condition est respectée étant donné la nature de la tâche,
qui attribue une valeur supérieure aux prévisions précises comparativement aux prévisions
imprécises. Le modèle de jugement linéaire tentera de minimiser l’erreur de prévision sur la
base de l’ampleur de l’erreur.
En résumé, selon ces critères, le modèle de jugement linéaire se qualifie comme
étant rationnel pour la prévision de séries temporelles et constituera la norme rationnelle
dans le contexte de la présente thèse. Il existe d’autres types de modèles, notamment le
jugement bayésien, qui pourraient également constituer la norme rationnelle dans ce
contexte, mais le modèle est jugé comme étant suffisant pour les besoins de la présente
thèse. En tant que norme rationnelle, il est attendu que les individus qui effectuent un
jugement de prévision de séries temporelles se comportent de manière similaire à ce dernier
pour l’atteinte de performance optimale.
21
Heuristique. Bien que le modèle de jugement linéaire représente la norme
rationnelle dans le contexte de cette thèse, il existe des situations qui mènent clairement à
des jugements mieux décrits par des règles non linéaires telles que certaines heuristiques
(par exemple, Anufriev & Hommes, 2012). Une heuristique est une stratégie cognitive
économe et rapide que les humains et même certains animaux utilisent (voir Hutchinson &
Gigerenzer, 2005). Elles sont qualifiées d’économes parce qu’elles ignorent généralement
une partie de l’information disponible pour faire un jugement. Elles sont considérées
comme rapides comparativement à des stratégies plus intégratives. À l’opposé des
stratégies intégratives comme le jugement linéaire, les heuristiques ne représenteraient pas
un traitement optimal de l’information lors d’une tâche de jugement ou de prise de décision
et ainsi, représenteraient une décision irrationnelle (par exemple, Dawes & Hastie, 2001;
Harvey, 2007). Néanmoins, selon certains auteurs, les humains seraient enclins à utiliser de
telles stratégies cognitives puisqu’elles représenteraient un bon compromis entre efforts et
résultats (par exemple, Beach & Mitchell, 1978; Smith & Walker, 1993). En effet, ces
stratégies sont faciles à implémenter et produisent des résultats suffisamment bons dans la
plupart des contextes. Selon Simon (1955; 1956), pionnier dans le domaine, les humains
ont une rationalité contrainte par leurs limitations cognitives, ce qui les pousseraient à
adopter des heuristiques.
On attribue à Kahneman, Slovic et Tversky (1982) l’origine du programme de
recherche sur les heuristiques et les biais qui en découlent, bien que certains travaux
antérieurs s’y étaient intéressés sans pour autant les nommer ainsi (par exemple, Anderson
et al., 1980; Carroll, 1978; Lichtenstein et al., 1978; Ross et al., 1977). Néanmoins,
Kahneman et ses collègues définissent trois heuristiques, (1) disponibilité, (2)
représentativité et (3) ancrage et ajustement, qui constituent encore aujourd’hui le cheval de
bataille des défenseurs du jugement rapide et économe. Ces heuristiques ont été observées
dans une grande variété de contextes et, récemment, Harvey (2007) discute de leur
implication dans la formulation des jugements de prévision de séries temporelles en lien
avec les sources d’information disponibles. Selon cet auteur, les sources d’information
présentes dans l’environnement guideront la sélection de l’une ou l’autre de ces stratégies.
Sommairement, il attribue l’adoption de l’heuristique de disponibilité d’information en
22
mémoire; l’heuristique de représentativité aux informations extrinsèques; et l’heuristique
d’ancrage et ajustement aux informations intrinsèque.
Heuristique de disponibilité. L’heuristique de disponibilité est basée sur la prémisse
que la facilité d’effectuer le rappel d’un évènement en mémoire est associée à la probabilité
réelle d’occurrence de cet évènement et peut donc constituer un indice unique pour la
prévision de ce dernier (voir Kahneman et al., 1982; Tversky & Kahneman, 1973). Cette
heuristique est similaire à celle de reconnaissance qui stipule que parmi deux options, si
une seule d’entre elles est reconnue, ce sera celle retenue (Goldstein & Gigerenzer, 1999).
Pour une discussion sur les similarités et différences de ces deux heuristiques, voir Harvey
(2007). Pour les besoins de la discussion, toutefois, ces deux heuristiques seront traitées
indifféremment puisqu’elles exploitent les mêmes informations en mémoire. Dans le but de
vérifier si les individus utilisent l’heuristique de disponibilité, Carroll (1978) a manipulé la
disponibilité d’un évènement en mémoire en demandant à des participants d’imaginer un
scénario bien défini dans lequel les Démocrates (participants du groupe A) ou les
Républicains (participant du groupe B) remportaient les élections. Par la suite, les
participants devaient prédire le résultat de la prochaine élection. Les résultats montrent que
les deux groupes étaient plus susceptibles de prévoir une victoire du parti qu’on leur avait
demandé d’imaginer. Ainsi, plus un évènement était disponible en mémoire, plus il était
jugé comme susceptible de survenir. Selon Harvey (2007), il est fortement probable que les
individus emploient cette heuristique lors de jugement de prévision puisque ce dernier
permet l’atteinte de performances qui excèdent parfois celle de modèles normatifs. Pour
appuyer ses propos, il discute d’une étude réalisée par Borges, Goldstein, Ortmann et
Gigerenzer (1999) dans laquelle les auteurs démontrent qu’un portfolio d’actions boursières
composé de titres ayant été reconnus (donc facilement accessibles en mémoire) surpasse les
indices moyens du marché. Toutefois, ces résultats n’ont pas persisté dans le temps suite à
des changements dans les conditions environnementales : c’est-à-dire lors du passage d’un
marché fort vers un marché plus faible (Boyd, 2001). Il faut également noter qu’une
condition sine qua non pour l’utilisation de cette heuristique est la disponibilité
d’information en mémoire. Conséquemment, un environnement complètement nouveau
pour un individu rendra impossible l’utilisation d’une telle stratégie, or, dans la présente
thèse, les situations dynamiques complexes d’intérêts sont caractérisées par des patrons
23
d’évolution qui ne se répètent pas dans le temps et qui sont ainsi toujours nouveaux du
point de vu d’un observateur (Kurtz & Snowden, 2010). Par conséquent, bien que l’étude
de cette source d’information et des heuristiques qui lui sont associées soit très intéressante,
elle ne constitue pas le point focal de la présente thèse.
Heuristique de représentativité. Une seconde heuristique potentiellement employée
par les individus lors de jugement de prévision est la représentativité. Selon Tversky et
Kahneman (1973) un évènement est jugé probable par la mesure où il représente les
caractéristiques essentielles (1) d’un évènement parent et (2) du procédé par lequel il est
généré. L’heuristique de représentativité a été observée, entre autres, au sein du marché
financier (par exemple, De Bondt & Thaler, 2002; Chopra et al., 1992) et permettrait
l’atteinte de performances au moins équivalentes à des stratégies « rationnelles » dans des
conditions difficilement prévisibles (Ying Luo, 2013). En effet, l’heuristique de
représentativité performe aussi bien que les décideurs « rationnels » lorsque les données du
marché sont partiellement déterminées par des processus stochastiques, c’est-à-dire lorsque
la prévisibilité environnementale (Re) est faible. Dans un contexte d’estimation de série
temporelle en laboratoire, l’utilisation de l’heuristique de représentativité se traduit par une
diminution de l’auto-régression des prévisions sur les valeurs passées du critère puisque les
prévisions des individus qui adoptent cette heuristique y intègrent des informations
concernant d’autres variables ou composantes jugées représentatives. En d’autres mots, il y
a un abandon des informations de sources intrinsèques pour favoriser les informations de
sources extrinsèques. Par contre, bien que cette stratégie semble porter fruits dans certains
contextes, elle peut aussi introduire des biais qui ont un effet néfaste sur la performance.
Considérez l’exemple suivant (de Harvey, 2007) : Si vous dites à un individu qu’un paquet
de cartes bien brassé contient 80% de cartes rouges et 20% de cartes bleues, les chances
sont que, s’il utilise l’heuristique de représentativité, il prédise une carte rouge dans 80% et
une carte bleue dans 20% de ses jugements. Ce faisant, l’individu cherche à être
représentatif du paquet duquel les cartes sont tirées. Néanmoins, en procédant ainsi, le
jugement sera juste dans 68% des cas en moyenne alors que s’il ne prédit que des cartes
rouges, son jugement sera juste dans 80% des cas. Dans un contexte de prévision de séries
temporelles, les individus intègreront aussi un certain niveau d’incertitude dans leur
prévision correspondant au niveau d’incertitude de la série jusqu’à présent. En effet, les
24
prévisions seront distribuées aléatoirement autour de la pente de la série plutôt qu’être
situées directement dessus. De plus, plus la série est incertaine, plus la distribution autour
de la pente sera large (Harvey, 1995; Harvey et al., 1997).
D’autres auteurs suggèrent une autre heuristique, celle de limites et vraisemblance
(Becker & Leopold-Wildburger, 1996; Becker et al., 2007) qui se base également sur les
informations disponibles à même la série temporelle critère et les séries associées qui co-
évoluent avec celle-ci. Pour cette raison, il semble raisonnable de catégoriser la stratégie de
limites et vraisemblance comme étant une spécification de l’heuristique de représentativité
puisqu’elle tente d’être représentative des sources extrinsèques d’information. Les indices
utilisés par cette heuristique sont toutefois extraits des séries temporelles puisqu’ils ne sont
pas explicitement disponibles a priori. Becker et ses collègues réfèrent à ces propriétés
comme étant des caractéristiques « gestaltiques » qui sont extraites visuellement des séries
temporelles. Ces propriétés sont les limites inférieures et supérieures des séries temporelles
ainsi que la probabilité que la prochaine période constitue un changement de direction.
Plusieurs versions de cette heuristique ont été développées. Dépendamment de la version,
les caractéristiques gestaltiques sont extraites de la série temporelle à prédire (donc une
information de source intrinsèque), et/ou peuvent également l’être des autres séries
temporelles qui co-évoluent avec celle-ci (donc une information de source extrinsèque).
Lorsque des caractéristiques sont extraites de plusieurs séries temporelles, elles sont ensuite
intégrées au sein d’une représentation linéaire afin d’émettre la prévision. Becker et ses
collègues (2007) soulignent que la capacité des individus à intégrer les indices générés au
sein d’une représentation linéaire est fort probablement limitée. Cet énoncé demeure
toutefois une hypothèse puisque les modèles de l’heuristique qui ont été testés se limitaient
à l’intégration de quatre indices. Becker et ses collègues (2000; 2004; 2007) rapportent une
série d’études dans lesquelles les participants devaient prédire l’évolution de séries
temporelles. Dépendamment de l’étude, les participants devaient prédire une série
temporelle seule, ou en se basant sur plusieurs autres séries temporelles plus ou moins
corrélées avec la série temporelle à prédire. Les auteurs rapportent des niveaux
d’adéquation entre les prévisions de l’heuristique et celles des participants, ce qui suggère
que cette heuristique serait représentative de la stratégie employée par les individus pour
prédire l’évolution de séries temporelles. De plus, les auteurs soulignent que cette
25
heuristique a également la capacité de mieux performer que l’hypothèse rationnelle
attendue dans ce contexte.
Heuristique d’ancrage et ajustement. Alors que l’heuristique de représentativité
expliquerait en partie pourquoi les individus intègrent une part d’information de source
extrinsèque dans leur jugement de séries temporelles, l’heuristique d’ancrage et ajustement
expliquerait comment les individus intègrent de l’information de source intrinsèque dans
leur jugement (Harvey, 2007). L’heuristique d’ancrage et ajustement consiste à fonder son
jugement sur une valeur initiale et ensuite de procéder à son ajustement pour produire un
jugement plus précis (Kahneman et al., 1982). Cette heuristique est probablement la plus
étudiée en lien avec la prévision de séries temporelles puisque plusieurs études démontrent
que les individus se comportent fréquemment comme s’ils utilisaient cette heuristique dans
ce contexte (Andreassen, 1990; Andreassen & Kraus, 1990; Harvey, 1988; Lawrence &
O’Connor, 1992). De plus, le propre de cette heuristique est d’intégrer des informations
ordonnées séquentiellement dans le temps (Anderson, 1981, 1991), ce qui est évidemment
pertinent dans un contexte de prévision de séries temporelles. Plusieurs variantes de cette
heuristique ont été suggérées, notamment concernant la nature de l’ancrage. Par exemple,
Bolger et Harvey (1993) proposent un modèle de l’heuristique qui utilise la dernière valeur
de la série temporelle comme ancrage alors que Lawrence et O’Connor (1992; 1995) et
Andreassen et Kraus (1990) proposent un modèle dans lequel le point d’ancrage est la
moyenne estimée des valeurs passées de la série temporelle. Un biais souvent associé à
l’utilisation de cette heuristique concerne la sous-estimation des pentes positives ou
négatives des séries, conséquence directe d’un sous-ajustement à partir du point d’ancrage
(Bolger & Harvey, 1993; Eggleton, 1982; Harvey & Bolger, 1996; Lawrence &
Makridakis, 1989; Sanders, 1992). Plusieurs raisons sont mises de l’avant pour expliquer le
sous-ajustement des prévisions. Par exemple, certains auteurs suggèrent que le choix d’un
point d’ancrage activerait les valeurs proches de ce dernier, ce qui augmenterait la
probabilité de les intégrer au jugement (voir Chapman & Johnson, 1999; Jacowitz &
Kahneman, 1995; Mussweiler & Strack, 1999). Une autre explication plausible de ce biais
présume que les séries temporelles « naturelles » seraient caractérisées par des propriétés
qui, globalement, favoriseraient cette stratégie. Supportant cette interprétation, Lawrence et
O’Connor (1995) ont utilisé 111 séries temporelles tirées de véritables séries présentes dans
26
la nature et ont observé qu’en moyenne, les participants ne présentaient pas de biais de
sous-ajustement lors de leur prévision, probablement parce que les séries temporelles
évoluaient de façon à favoriser cette stratégie.
Dans un contexte de prévision de séries temporelles, le comportement humain
semble particulièrement bien représenté par les modèles d’heuristiques comparativement au
modèle de jugement linéaire. En effet, la plupart des études qui s’intéressent aux stratégies
utilisées pour la prévision de séries temporelles indiquent que les individus se comportent
comme s’ils utilisaient l’heuristique d’ancrage et ajustement (Andreassen, 1990;
Andreassen & Kraus, 1990; Harvey, 1988; Lawrence & O’Connor, 1992) ou de limites et
vraisemblance (Becker & Leopold-Wildburger, 1996; Becker et al., 2007; 2008; 2009).
L’utilisation de ces stratégies simplificatrices seraient à l’origine de biais systématiques,
menant à des performances sous-optimales (Bolger & Harvey, 1993; Harvey & Bolger,
1996; Sanders, 1992) et serait par conséquent irrationnelle.
PROBLÉMATIQUE
Certains auteurs remettent toutefois le caractère irrationnel des heuristiques en
question (Dieckmann & Rieskamp, 2007; Goldstein & Gigerenzer, 2009; Rieskamp & Otto,
2006; Rieskamp & Reimer, 2007; Todd & Gigerenzer, 2000; Todd & Gigerenzer, 2007).
Est-ce que l’utilisation d’heuristiques est vraiment irrationnelle, ou est-ce que leur
utilisation mène à des performances équivalentes ou même supérieures au jugement
linéaire? Les heuristiques ont démontré leur utilité dans une grande variété de contextes,
performant souvent au moins aussi bien que la stratégie rationnelle (Dieckmann &
Rieskamp, 2007; Rieskamp & Otto, 2006). Par exemple, l’utilisation de l’heuristique
d’ancrage et ajustement est associée à un biais de sous-ajustement des pentes des séries
temporelles (Harvey & Bolger, 1996), mais il est également suggéré que ce biais soit en fait
adapté aux séries temporelles « naturelles » (Lawrence & O’Connor, 1995). Ces stratégies
étant donc potentiellement plus adaptées dans certains contextes, plusieurs auteurs
questionnent la définition classique de la rationalité et proposent une vision « écologique »
de la rationalité (Dieckmann & Rieskamp, 2007; Goldstein & Gigerenzer, 2009; Rieskamp
& Otto, 2006; Rieskamp & Reimer, 2007; Todd & Gigerenzer, 2000). Comme le résume
Sturm (2012), la théorie de la probabilité et le modèle linéaire ne devraient pas être
27
considérés comme une norme rationnelle applicable à tous les contextes. Au contraire, les
normes de la rationalité ne devraient pas être valides indépendamment du contexte dans
lequel elles sont appliquées. Toujours selon Sturm (2012), l’établissement du lien entre
normes et contexte est une entreprise empirique.
De plus, malgré son statut de stratégie rationnelle, le ML est tout de même
caractérisé par une limite supérieure d’efficacité (Hogarth & Karelaia, 2008; Tucker,
1964). En effet, la prévisibilité de l’environnement (Re) spécifie la proportion de variance
de l’environnement expliquée par un modèle de jugement linéaire et correspond ainsi à la
limite théorique supérieure de performance des individus qui adoptent une stratégie de
jugement linéaire. Alors, même si la plupart des environnements sont raisonnablement
prédit par le ML, il sera possiblement défaillant dans certains contextes, notamment lorsque
la qualité des sources d’information est dégradée.
Face à ces observations, plusieurs auteurs suggèrent que la force des heuristiques
repose sur l’aspect varié, modulaire et simple de ces stratégies, qui peuvent, à l’image d’un
coffre à outil, être utilisées dans différents contextes de manière adaptée, individuellement
ou en combinaison (Gigerenzer & Gaissmaier, 2011; Gigerenzer & Selten, 2001;
Gigerenzer et al., 1999). Selon cette perspective du coffre à outil, une heuristique n’est pas
bonne ou mauvaise en soi, mais sa performance est plutôt déterminée par les
caractéristiques de l’environnement telles que la qualité des sources d’information
disponibles (par exemple, Marewski & Schooler, 2011). Cela représente un ajout par
rapport à la rationalité contrainte de Simon (1956) puisque la stratégie cognitive employée
n’est plus uniquement fonction des contraintes cognitives de l’individu, mais aussi des
caractéristiques environnementales. À titre d’exemples, les heuristiques définies
précédemment ont fait l’objet de résultats en apparence contradictoires : l’heuristique de
disponibilité a permis l’atteinte de performance financière supérieure à la moyenne (Borges
et al., 1999), mais seulement au sein d’un marché fort (Boyd, 2001); l’heuristique de
représentativité permet également l’atteinte de performances financières au moins
équivalentes à un modèle rationnel, mais seulement lorsque l’environnement à prédire
comporte une part élevée de hasard (Ying Luo, 2013); l’heuristique d’ancrage et ajustement
mène à des prévisions biaisées pour des séries temporelles artificielles (par exemple, Bolger
28
& Harvey, 1993), mais à des prévisions adaptées pour la prévision d’un ensemble de 111
séries temporelles naturelles représentatives de l’écologie réelle (Lawrence & O’Connor,
1995). Ces observations demeurent parcellaires puisqu’aucun cadre intégratif n’est suggéré.
Comme le mentionnent Todd et Gigerenzer (2007), les chercheurs ont commencé à mettre
en place un vocabulaire pour décrire les structures de l’environnement, par exemple, en
termes de validité des indices et de leur distribution, mais cet effort est toutefois encore
incomplet et incohérent. Basé sur la taxinomie de Harvey (2007), la présente thèse propose
donc une série de facteurs associés à la qualité des sources d’information qui sont
susceptibles de faire varier la performance des heuristiques et ainsi créer des situations dans
lesquelles deux stratégies performeront différemment. Ces facteurs sont décrits ci-dessous
et regroupés selon qu’ils soient associés à la qualité des indices extrinsèques ou
intrinsèques.
Source extrinsèque. Dans le cadre de la thèse, deux facteurs sont associés à la source
extrinsèque d’information : le nombre d’indices extrinsèques et la force d’association
extrinsèque. Le nombre d’indices extrinsèques est un facteur dont l’impact sur l’adoption
des stratégies de jugement est bien documenté (Halford et al., 2005; Payne et al., 1993).
Plus précisément, les individus semblent avoir beaucoup de difficulté à appliquer une règle
de jugement linéaire au-delà de trois variables à considérer dans la production d’un
jugement (Karelaia & Hogarth, 2008). La force d’association extrinsèque est un indicateur
de validité et de fiabilité des indices extrinsèques pour la prévision du critère (Seifert &
Hadida, 2013). Dans le cas où la force d’association extrinsèque est faible, une prévision
fondée uniquement sur le meilleur indice sera moins précise que si la force d’association
était élevée. Pour améliorer la précision de la prévision, il faudra intégrer de nouveaux
indices et ainsi complexifier la stratégie cognitive. Bien que des études antérieures
démontrent que la manipulation de la validité des indices a un impact significatif sur la
performance à la tâche de prévision humaine de séries temporelles (par exemple, Lim &
O’Connor, 1996), son impact spécifique sur la performance des modèles formalisés dans la
présente thèse n’a pas été étudié.
Source intrinsèque. Un seul facteur, dans le contexte de la présente thèse, est associé
à la qualité des indices de source intrinsèque : l’autocorrélation du critère. Une
29
autocorrélation est la corrélation croisée de la série temporelle avec elle-même. C’est un
critère est un facteur critique dans l’adoption de stratégies alternatives au modèle de
jugement linéaire (Lawrence et al., 2006). En effet, plusieurs études observent que les
individus qui doivent prédire l’évolution d’une série temporelle auto corrélée ont tendance
à adopter une heuristique d’ancrage et ajustement (Andreassen & Kraus, 1990; Lawrence &
O’Connor, 1992; 1995; Reimers & Harvey, 2011). De plus, Bolger et Harvey (1993)
observent que la version de l’heuristique d’ancrage et ajustement employée est différente en
fonction de la force de l’autocorrélation du critère, ce qui suggère que ce facteur est
déterminant dans le choix des stratégies employées.
La rationalité écologique (Dieckmann & Rieskamp, 2007; Rieskamp & Otto, 2006;
Rieskamp & Reimer, 2007) est l’étude des caractéristiques environnementales, des
caractéristiques des stratégies cognitives, et de l’adéquation entre les deux (Todd &
Gigerenzer, 2007; Goldstein & Gigerenzer, 2009). L’objectif est de comprendre comment
la performance des heuristiques et des règles de jugement linéaire sont affectées par les
caractéristiques environnementales et comment cela guide leur sélection lors d’une tâche de
jugement. Dans le cadre de la présente thèse, ces caractéristiques environnementales
réfèrent aux facteurs associés à la qualité des sources d’information. Le concept de
rationalité écologique est plus englobant que celui du coffre à outils cognitif puisqu’il inclut
également les modèles de jugement plus complexes comme le ML, par exemple. Le
concept de la rationalité écologique se résume en trois aspects :
(1) Il existe une combinaison de stratégies quelconque pour laquelle la prévisibilité
de l’environnement est supérieure à celle du ML normalement considéré comme
la norme rationnelle;
(2) Les individus changent leur stratégie en fonction des caractéristiques de
l’environnement; et
(3) Le changement est adapté, c’est-à-dire qu’il permet l’atteinte de performance
optimale dans le contexte.
L’application humaine de la rationalité écologique demeure toutefois spéculative et
manque d’appuis empiriques, particulièrement dans un contexte de prévision de séries
temporelles (Bröder, 2003). Premièrement, plusieurs études computationnelles démontrent
30
que l’utilisation d’heuristiques peut mener à des performances supérieures à une norme
rationnelle (par exemple, Czerlinski et al., 1999; Gigerenzer & Goldstein, 1996, 1999;
Woike et al., 2012). Par contre, elles concernent des environnements statiques et ne
fournissent aucune preuve de la plausibilité d’une rationalité écologique pour la prévision
des séries temporelles. De plus, elles spécifient très rarement quelles sont les conditions
sous lesquelles les heuristiques performent mieux qu’une règle de jugement linéaire (Todd
& Gigerenzer, 2007). Deuxièmement, bien qu’il ait été démontré dans différentes études
que les individus se comportent comme s’ils utilisaient une stratégie d’ancrage et
ajustement (Andreassen, 1990; Andreassen & Kraus, 1990; Harvey, 1988; Lawrence &
O’Connor, 1992), de limites et vraisemblance (Becker & Leopold-Wildburger, 1996;
Becker et al., 2007) et de jugement linéaire (Bisantz et al., 2000), aucune de ces études ne
montre un changement de stratégie du même participant en fonction des caractéristiques
des séries temporelles à prédire. En effet, pour évaluer le changement de stratégies, celles-
ci doivent être comparées au sein d’un même devis expérimental intra-participants (Bröder,
2003; Payne et al., 1988). Une telle étude, manipulant des facteurs associés à ces stratégies
telle que la qualité des sources d’information permettrait d’évaluer si les individus changent
de stratégie. Troisièmement, la démonstration computationnelle de la plausibilité de la
rationalité écologique ne signifie pas que les humains y adhèrent (Bröder, 2003). Il est donc
critique de faire la démonstration empirique que les humains changent de stratégie de
manière adaptée, particulièrement dans la prévision de séries temporelles.
Objectif de la thèse
L’objectif de la thèse est de combler les lacunes actuelles dans la démonstration du
concept de rationalité écologique en contexte de prévision de séries temporelles.
Précisément, elle cherche à démontrer dans un contexte de prévision de séries temporelles
complexes (1) la plausibilité de la rationalité écologique (et sous quelles conditions cela est
possible), (2) que les individus changent de stratégies et (3) que ce changement permet
l’atteinte de performances supérieures au modèle de jugement linéaire. La position adoptée
et testée au sein de la présente thèse est que la rationalité écologique est plausible, que les
individus changent de stratégies en fonction des caractéristiques de la tâche de prévision et
31
que ces changements permettent l’atteinte de performances supérieures au modèle de
jugement linéaire.
Méthode générale
Typiquement, deux méthodes sont employées pour étudier l’utilisation des
stratégies cognitives dans une tâche : (1) le suivi des processus et (2) la comparaison des
prévisions de modèles computationnels et de participants humains. Le suivi des processus
consiste à observer toutes les actions du participant qui précèdent son jugement dans le but
d’établir quelles sont les informations consultées. Par exemple, l’interface d’une tâche
appliquant cette méthodologie peut cacher les informations pertinentes et les rendre
accessibles seulement sur demande (par exemple, Billings & Marcus, 1983; Matsuka &
Corter, 2008; Sayeki, 1969; Sundström, 1987). Ainsi, il est possible de « suivre » la
démarche du participant en termes d’information consultées et de l’ordre dans lequel cette
information est consultée. Cette technique présente par contre certaines lacunes.
Premièrement, la concordance entre la consultation de l’information et l’intégration de
l’information n’est pas garantie (Abelson & Levi, 1985; Billings & Marcus, 1983; Maule,
1994). Deuxièmement, cette technique ne permet pas toujours d’opérationnaliser avec
précision les stratégies cognitives d’intérêt. En effet, elle ne permettra pas de discriminer
deux stratégies qui utilisent les mêmes informations, mais qui les pondèrent de façons
différentes (Bröder, 2000; Bröder, 2003). Pour ces raisons, la méthode principale employée
dans le cadre de la thèse sera la comparaison de la performance des stratégies par
simulation de modèles computationnels et par l’étude du comportement humain dans la
prévision de séries temporelles en lien avec les heuristiques et le jugement linéaire.
STRUCTURE ET HYPOTHÈSES
La technique employée consiste à formaliser les stratégies cognitives d’intérêt en
modèles computationnels et de les simuler sous différentes conditions dans une tâche de
prévision de séries temporelles. Cette technique permet l’identification des conditions qui
sont appropriées ou inappropriées pour les heuristiques modélisées (Todd & Gigerenzer,
2007). Ces modèles peuvent également être simulés dans les mêmes environnements où les
participants humains effectuent leur tâche de prévision (Bolger & Harvey, 1993; Bergert &
32
Nosofsky, 2007; Shanteau & Thomas, 2000). Il est donc possible de comparer la
performance des participants par rapport à celle d’un modèle rationnel et ainsi quantifier
l’écart à la rationalité. Cette technique permet aussi de comparer directement les réponses
des participants à celles des modèles d’heuristiques et ainsi déterminer quelles sont les
stratégies représentatives de leur comportement. Par exemple, Bergert et Nosofsky (2007)
ont démontré, dans un contexte différent mais similaire à la prévision de séries temporelles,
que le comportement humain est mieux expliqué par l’utilisation d’heuristiques que d’un
processus complexe d’intégration et de pondération linéaire de l’information. De plus,
selon Goldstein et Gigerenzer (2009), l’utilisation de cette technique pourrait également
permettre de démontrer que l’utilisation de ces heuristiques peut être adaptée et
écologiquement rationnelle.
Dans le contexte de la présente thèse, la qualité de deux sources d’information
identifiées par Harvey (2007) sont manipulées au sein du paradigme de prévision de séries
temporelles pour faire varier la performance des stratégies (heuristiques et jugement
linéaire) et des participants. Les prévisions des modèles et des participants sont comparées
entre elles. La qualité de ces sources serait associée à la performance des stratégies puisque
ces dernières les utilisent pour estimer leur prévision. La manipulation de la qualité des
sources d’information permettra d’étudier les situations où certaines heuristiques seraient
plus performantes que le jugement linéaire et les conditions sous lesquelles les individus
adoptent de telles heuristiques (Todd & Gigerenzer, 2007). Précisément, la qualité des
sources d’information intrinsèque et extrinsèque seront manipulées. La source mémoire ne
sera pas variée dans le contexte de la présente thèse malgré l’intérêt de celle-ci. Ce facteur
est exclu puisque les situations complexes d’intérêts dans la présente thèse sont les
situations complexes nouvelles pour la personne en charge de sa prévision et qui sont entre
autres caractérisées par des patrons complexes d’évolution qui ne se répètent pas ou peu
dans le temps (Kurtz & Snowden, 2010). Par conséquent, la source mémoire n’est d’aucune
utilité dans ce contexte. Concrètement, la méthode employée sera opérée en trois chapitres :
Le Chapitre II étudie comment différentes stratégies performent sous différentes
conditions environnementales au sein du paradigme de la prévision de séries temporelles.
Précisément, il vise à comprendre l’effet de la qualité des différentes sources d’information
33
sur la performance des modèles de façon générale et comparativement au modèle de
jugement linéaire. Cette étude est réalisée par la modélisation computationnelle et la
simulation des stratégies de jugement appartenant aux deux classes (c’est-à-dire,
heuristiques et jugement linéaire) au sein de conditions variées de qualité des sources
intrinsèques et extrinsèques d’information. La tâche simulée consiste à prédire l’évolution
de plusieurs séries temporelles variant en termes de qualité des sources d’information sur
un horizon de quarante périodes. Dans une perspective de rationalité écologique, cela
permettra d’évaluer la plausibilité de l’approche dans ce contexte. Précisément, si la
rationalité écologique est plausible, les résultats devraient montrer que l’utilisation
d’heuristiques permet de supplanter l’application pure d’une règle de jugement linéaire.
Conformément à la position défendue par l’auteur, l’hypothèse associée à cette étude est
que :
H1 : La performance des heuristiques à la tâche de prévision temporelle sera
supérieure à celle du modèle de jugement linéaire.
Cette étude permettra également d’identifier les conditions sous lesquelles la
rationalité écologique est possible. En d’autres mots, les simulations réalisées dans ce
chapitre permettront de cartographier le paysage d’efficacité des stratégies de jugement en
lien avec la qualité des sources d’information. Ces analyses sont associées à un objectif
exploratoire de la présente thèse, c’est-à-dire :
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
Le Chapitre III étudie ensuite dans quelle mesure les individus changent leurs
stratégies de manière adaptée en fonction de la qualité des sources d’information. Cette
évaluation sera conduite au sein du paradigme de la prévision de séries temporelles. Tout
comme lors des simulations des modèles computationnels, la tâche des participants est de
prédire l’évolution de plusieurs séries temporelles caractérisées par des niveaux variés de
qualité des sources d’information sur un horizon de quarante périodes. La tâche des
participants est exactement la même que celle réalisée par les modèles de stratégies
(heuristiques et jugement linéaire) dans le Chapitre II. Cette étude se fera en trois temps.
34
Premièrement, la précision des prévisions des individus est comparée à celle de la norme
rationnelle, c’est-à-dire le jugement linéaire. Dans une perspective de rationalité
écologique, cela permettra de vérifier si les stratégies des individus sont plus adaptées que
l’application pure du jugement linéaire. Conformément à la position adoptée par l’auteur
l’hypothèse suivante est formulée :
H2 : La performance des participants à la tâche de prévision sera supérieure à
celle atteinte par le modèle de jugement linéaire.
Deuxièmement, l’adéquation entre les prévisions des participants et celles des
modèles de jugements (c’est-à-dire, heuristiques et jugement linéaire) est calculé. Cela est
réalisé pour identifier si les participants se comportent de manière équivalente aux modèles.
Dans une perspective de rationalité écologique, cela permettra de vérifier si les individus
changent leurs stratégies en fonction de la qualité des sources d’information. L’hypothèse
associée à cet objectif est la suivante :
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle
donnée variera significativement en fonction des caractéristiques de la tâche de
prévision.
Finalement, dans le cas où les participants changeraient de stratégie, se comportent-
ils comme les stratégies les plus performantes? Dans une perspective de rationalité
écologique, cela permettra d’évaluer si le changement de stratégie est adapté.
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif
du comportement d’un participant correspond au modèle le plus performant) sera
supérieure au hasard.
Finalement, le Chapitre IV intègrera l’ensemble des observations faites au sein du
paradigme de la prévision de séries temporelle dans les Chapitre I et II. La pertinence de
l’application d’une rationalité écologique dans un contexte de prévision de séries
temporelles sera discutée. Particulièrement, les conditions sous lesquelles la rationalité
écologique est pertinente seront décortiquées de manière critique dans une perspective de
généralisation des résultats au-delà du paradigme employé dans la présente thèse. Des
35
implications pratiques concernant les résultats de la thèse seront aussi élicitées, notamment
en lien avec le développement de systèmes d’aide à la décision basés sur la technique du
« bootstraping ». Finalement, les contributions méthodologiques de la présente thèse et
inversement, les limites associées à la méthodologie, sont présentées en lien avec les
travaux futurs.
37
CHAPITRE II
PREVISION DE SÉRIES TEMPORELLES : CARTOGRAPHIE DE
L’EFFICACITE DES MODELES DE JUGEMENT
38
Deux classes de modèles ont guidé la recherche récente sur le jugement humain.
L’une de ces classes, considérée comme la norme rationnelle, consiste à intégrer l’ensemble
des informations disponibles au sein d’une représentation unique dans laquelle les
informations sont combinées et pondérées de manière linéaire (Anderson, 1981; Brehmer,
1994; Hammond, 1996; Muth, 1961). L’autre classe, les heuristiques, présume plutôt que
les individus fondent leur jugement en fonction des limites fondamentales du système
cognitif, par exemple la limite en mémoire active, et serait donc mieux représentés par des
modèles de jugements simplifiés et rapides distant de la norme rationnelle (Gigerenzer et
al., 1999; Goldstein & Gigerenzer, 2009; Kahneman et al., 1982; Todd & Gigerenzer,
2000). Ces heuristiques sont-elles vraiment irrationnelles? Mènent-elles réellement à des
performances inférieures au jugement linéaire? Peut-être pas. Il a été démontré que les
heuristiques peuvent surpasser la performance attendue par la norme rationnelle dans
plusieurs contextes et seraient ainsi parfois plus adaptées à leur environnement (Dieckmann
& Rieskamp, 2007; Goldstein & Gigerenzer, 2009; Rieskamp & Otto, 2006; Rieskamp &
Reimer, 2007; Todd & Gigerenzer, 2000). Toutefois, le fait que certaines heuristiques
puissent être meilleures que la norme rationnelle sous certaines conditions ne signifie pas
que les individus évoluant sous ces mêmes conditions savent reconnaître et adopter la
stratégie la plus adaptée (Bröder, 2003).
Un domaine où l’utilisation d’heuristiques est particulièrement convaincante est
celui de la prévision de séries temporelles. En effet, plusieurs études indiquent que les
heuristiques d’ancrage et ajustement (Andreassen, 1990; Andreassen & Kraus, 1990;
Harvey, 1988; Lawrence & O’Connor, 1992) ou encore de limites et vraisemblance (Becker
& Leopold-Wildburger, 1996; Becker et al., 2005; Becker et al., 2007) sont représentatives
du comportement des individus lorsqu’ils doivent prédire l’évolution de séries temporelles.
Ces études considèrent généralement l’utilisation de ces heuristiques comme une limite
menant à des erreurs systématiques. Toutefois, ces études se sont rarement intéressées aux
facteurs associés à la prévision de séries temporelles qui affectent la performance des
heuristiques. En effet, bien que certaines études affirment que certaines heuristiques
performent mieux que le modèle de jugement linéaire (Leitner, & Leopold-Wildburger,
2007), plusieurs heuristiques demeurent non-testées et les conditions sous lesquelles ce
phénomène est observé ne sont pas spécifiées (Todd & Gigerenzer, 2007). Bref, la
39
cartographie des environnements favorables à l’emploi d’heuristiques demeure largement
incomplète.
Le domaine de rationalité écologique s’intéresse à cette cartographie. Il réfère à
l’étude du lien entre l’efficacité des stratégies de jugement et les différents contextes dans
lesquels le jugement a lieu. Selon les tenants de la rationalité écologique, le modèle de
jugement linéaire ne devrait pas être considéré comme une norme rationnelle applicable à
tous les contextes. À l’inverse, la norme rationnelle devrait être établie empiriquement
selon le contexte dans lequel le jugement prend place (Sturm, 2012). L’utilisation adaptée
de stratégies de prévision incluant le jugement linéaire et certaines heuristiques pourrait
donc, selon certains auteurs, constituer une méta-stratégie plus efficace que celle du
jugement linéaire seul (Rieskamp & Otto, 2006; Todd & Gigerenzer, 2007).
Tel que stipulé précédemment, l’étude de la rationalité écologique consiste à établir
le lien entre les conditions environnementales et la performance de différentes stratégies.
Cette entreprise doit être empirique et passe entre autres par la comparaison de modèles
formels de stratégies évoluant sous des conditions variées (Sturm, 2012). L’identification
des conditions favorables et défavorables aux différentes stratégies (par exemple, les
heuristiques et le jugement linéaire) permet d’évaluer les stratégies adaptées dans un
contexte donné et ainsi d’établir la nouvelle « norme » rationnelle. Tel que mentionné par
certains auteurs, il n’existe pas encore de cadre interprétatif clair qui permettrait d’organiser
la recherche dans ce domaine, essentiellement étant donné le caractère nouveau de celle-ci
(Todd & Gigerenzer, 2007). Ces mêmes auteurs, et leur équipe de recherche, proposent
ainsi certains éléments associés à la structure de l’environnement qui pourraient constituer
une base de cadre interprétatif (Todd et al., 2011). Ces éléments concernent essentiellement
la qualité des informations disponibles pour effectuer un jugement. Précisément, ils
concernent la qualité associée à un indice, la redondance entre les indices, la taille
d’échantillonnage et la distribution de la qualité entre les indices.
Dans une perspective différente, mais pertinente à cette approche, Harvey (2007)
discute du lien potentiel entre trois sources d’information disponibles lors de la prévision
de séries temporelles et les heuristiques pertinentes dans ce contexte. Alors que Todd et ses
collègues discutent davantage de la nature des indices, Harvey (2007) discute davantage de
40
la provenance de ces derniers. Les individus en charge de prédire l’évolution de séries
temporelles se baseraient essentiellement, individuellement ou en combinaison, sur les
indices en mémoire, les indices directement associés à la série temporelle critère (nommés
indices de source intrinsèque) et sur les indices coexistant à la série critère, mais distinct de
celle-ci (nommés indices de source extrinsèque). Puisque les différentes stratégies
potentielles misent sur des sources d’information différentes pour prédire l’évolution de la
série temporelle critère, il est logique de penser qu’elles seraient influencées différemment
par la variation de la qualité des indices provenant des sources d’information. Bref, le
présent chapitre s’intéresse à la qualité des indices, proposée par Todd et ses collègues
(2011), et les sources d’information, proposée par Harvey (2007). Précisément, ce chapitre
étudie la performance des stratégies en lien avec la qualité de deux sources d’information:
c’est-à-dire les sources intrinsèque et extrinsèque.
Objectif
Ce chapitre évalue la performance de modèles de stratégies de prévision, ancrage et
ajustement, limites et vraisemblance et jugement linéaire, sous des conditions variées de
qualité d’information de sources intrinsèque et extrinsèque. L’objectif est de juger si
l’application de stratégies supplantant le jugement linéaire est possible et de déterminer
quelles conditions favorisent ce phénomène. Deux heuristiques pertinentes à la prévision de
séries temporelles, ancrage et ajustement ainsi que limites et vraisemblance, sont
formalisées en modèles computationnels en plus du modèle de jugement linéaire. Ils seront
simulés sous des conditions variables de qualité des indices provenant des sources
d’information intrinsèques et extrinsèques. La mesure employée pour estimer la précision
des modèles sera la proportion de variance expliquée (PVE; Hays, 1963; Stevens, 2013).
Cette mesure tient compte à la fois de la précision des stratégies en termes d’erreur et de la
direction de la prévision de la stratégie par rapport à la série temporelle à prédire.
L’hypothèse testée dans ce chapitre est la suivante :
H1 : La performance des heuristiques à la tâche de prévision temporelle sera
supérieure à celle du modèle de jugement linéaire.
Ce chapitre concerne également l’atteinte d’un objectif exploratoire, c’est-à-dire :
41
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
Dans un premier temps, la formalisation des stratégies est présentée. Cette section
détaille précisément le ou les modèles computationnels qui représentent les stratégies de
prévision (ancrage et ajustement, limites et vraisemblance, jugement linéaire). Ces modèles
sont tirés de la littérature sur le jugement humain. Dans un deuxième temps, les résultats de
la simulation de ces modèles sont documentés. La première simulation s’intéresse d’abord à
l’influence de la source extrinsèque d’information alors que la seconde évalue l’impact
combiné des sources intrinsèque et extrinsèque d’information sur la performance des
modèles.
Formalisation des stratégies
Bien qu’il existe plusieurs formalisations possibles pour les stratégies employées
lors de prévision de séries temporelles, le sous-ensemble suivant a été retenu parce que
leurs paramètres sont bien documentés dans la littérature et leur plausibilité cognitive est
élevée. En effet, tous ces modèles (à l’exception du modèle L&V3 de limites et
vraisemblance) ont été rapportés comme ayant un certain niveau de représentativité du
comportement humain dans un contexte de prévision de séries temporelles.
ANCRAGE ET AJUSTEMENT
L’heuristique d’ancrage et ajustement a grandement été étudiée dans un contexte de
prévision de séries temporelles et plusieurs versions différentes existent (par exemple,
Goodwin & Wright, 1994; Harvey, 2007; Lawrence et al., 2006; Lawrence & O’Connor,
1995; Reimers & Harvey, 2011). Dans son essence, cette stratégie consiste à partir d’une
valeur initiale (c’est-à-dire, l’ancrage) et de l’ajuster dans le but d’émettre une prévision
avec une caractéristique importante de la série (c’est-à-dire, l’ajustement). Il y a très peu de
doutes que les individus se comportent comme s’ils utilisaient cette heuristique,
particulièrement dans les cas où les séries temporelles sont fortement auto corrélées (Bolger
& Harvey, 1993). Trois modèles de l’heuristique sont développés : ANC1, ANC2 et ANC3.
42
ANC1. Le premier modèle de l’heuristique d’ancrage et ajustement (Eq. 1) est
récupéré des travaux de Lawrence et O’Connor (1995). Dans cette version de l’heuristique,
l’ancrage est constitué de la moyenne à long terme de la série temporelle alors que
l’ajustement prend la forme d’une proportion ( de la différence entre la moyenne à long
terme de la série et la dernière observation :
(1)
où
La prévision pour la période t+1,
La moyenne de la série temporelle,
L’observation au temps t.
La proportion ( est un paramètre modulable par participant. Par contre, au sein du
modèle, par souci de parcimonie, ce paramètre est fixe pour l’ensemble des prévisions
associées à une série temporelle (c’est-à-dire qu’il ne peut pas être ajusté dynamiquement)
et est fixé de manière à réduire l’erreur quadratique moyenne au minimum pour l’ensemble
de la série prédite. Cela constitue une limite de la présente formalisation, puisqu’il est
connu que les individus qui se comportent comme s’ils utilisaient cette heuristique ont
tendance à mal estimer la proportion ( de la différence entre la moyenne à long terme de
la série et la dernière observation (c’est-à-dire à estimer une valeur de ce paramètre qui
mène à des prévisions sous-optimales; Bolger & Harvey, 1993). La version actuelle
constitue donc la limite supérieure de performance atteinte par cette stratégie. Lawrence et
O’Connor (1995) ont démontré que cette heuristique performe particulièrement bien dans le
cas où les séries temporelles sont relativement stationnaires (c’est-à-dire avec pente nulle)
et auto corrélées. La Figure 7 illustre un exemple du comportement du modèle ANC1 par
rapport à une série temporelle critère de référence (un critère de référence, nommé Variable
1 dans les figures subséquentes, est employé pour illustrer les prévisions distinctes des
modèles). Notez que l’abscisse ne comporte que 32 valeurs puisqu’elle ne représente que
les périodes pour lesquelles les prévisions sont considérées dans la thèse. Les premières
43
périodes de chaque série temporelle étaient en effet retirées puisque tous les modèles ne
permettaient pas de faire des prévisions pour celles-ci.
Figure 7. Exemple du comportement du modèle ANC1 lors de la prévision d’une série temporelle critère de
référence.
ANC2. Le second modèle d’ancrage et ajustement (Eq. 2) – récupéré de Bolger et
Harvey (1993) – serait davantage adapté à la prévision de séries temporelles non-
stationnaires. Dans ce cas, l’ancrage est constitué de la dernière observation alors que
l’ajustement est composé d’une proportion ( de la différence entre la plus récente
observation et la précédente.
(2)
où
La prévision pour la période t+1,
Observation précédente au temps t,
L’observation au temps t.
Encore une fois par souci de parcimonie, le paramètre ( est fixe et minimise
l’erreur pour l’ensemble de la série temporelle. Basé sur des observations empiriques, ce
modèle serait davantage adapté à la prévision de séries temporelles avec pente (positive ou
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
ANC1-V1
44
négative), par contre, il a été observé que les participants ont tendance à se comporter
davantage de manière similaire à ANC1 en présence de séries temporelles fortement auto
corrélées (Bolger & Harvey, 1993). Une série fortement auto corrélée signifie que les
observations pour la période actuelle sont très similaires aux périodes précédentes. La
Figure 8 illustre un exemple du comportement du modèle ANC2 par rapport à la série
temporelle critère de référence.
Figure 8. Exemple du comportement du modèle ANC2 lors de la prévision d’une série temporelle critère de
référence. On remarque entre autres que pour la période t = 17, la prévision du modèle est parfaitement
ajustée au critère alors qu’elle ne l’était pas lors de l’application du modèle ANC1.
ANC3. La dernière formalisation computationnelle de l’heuristique d’ancrage et
ajustement (Eq. 3) nécessite une rétroaction sur l’erreur de prévision, ce qui est le cas dans
la présente thèse. Ce modèle est proposé par Andreassen (1990) ainsi que Andreassen et
Kraus (1990) qui suggèrent que la dernière prévision représente l’ancrage et que
l’ajustement est constitué d’une proportion ( de l’erreur de la dernière prévision.
(3)
où
erreur de la prévision précédente.
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
ANC2-V1
45
Le paramètre ( est tenu fixe et sa valeur est celle qui minimise l’erreur de
prévision pour l’ensemble de la série à prédire. Selon Andreassen (1990) et Andreassen et
Kraus (1990), ce modèle serait adapté aux séries temporelles relativement stationnaires,
mais les auteurs ne fournissent toutefois pas de preuves empiriques en lien avec cet énoncé.
La Figure 9 illustre un exemple du comportement du modèle ANC3 par rapport à la série
temporelle critère de référence.
Figure 9. Exemple du comportement du modèle ANC3 lors de la prévision d’une série temporelle critère de
référence. Pour la prévision de cette série, les réponses produites par ANC3 sont très similaires à ANC2 et
identiques à ANC1.
LIMITES ET VRAISEMBLANCE
L’heuristique de limites et vraisemblance (Becker & Leopold-Wildburger, 1996) est
une des plus récentes suggérée et semble particulièrement bien représenter le comportement
humain dans la prévision de certaines séries temporelles et parfois même supplantant la
norme rationnelle (Becker et al., 2007). Cette stratégie est réalisée en deux temps. D’abord,
elle consiste à extraire des caractéristiques de la ou des série(s) temporelle(s) d’intérêt (par
exemple, les limites supérieures et inférieures passées). Ensuite, ces nouveaux indices sont
potentiellement (dépendamment de la version de l’heuristique) intégrés au sein d’une
représentation linéaire pour prédire le critère. L’implication d’une forme de jugement
linéaire – différente du ML - au sein de cette heuristique constitue d’ailleurs une propriété
intéressante qui sera discutée plus en détails plus tard dans la thèse. Au total, Becker et ses
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
ANC3-V1
46
collègues proposent six modèles de l’heuristique, variant essentiellement le nombre de
séries temporelles considérées simultanément et la force d’association entre les séries. Dans
le contexte de la thèse, trois versions seront retenues : L&V1, L&V2 et L&V3. Elles sont
décrites ci-dessous :
L&V1. Le premier modèle représente la formalisation la plus simple de l’heuristique
de limites et vraisemblance. Ce modèle a été proposé initialement dans le cadre des travaux
de Becker et Leopold-Wildburger (1996) et repris plus tard (Becker et al., 2005; 2007). Ce
modèle ne considère que la série temporelle critère. Deux caractéristiques sont extraites de
la série : la variation moyenne et la probabilité d’un point tournant. La première prémisse
de ce modèle est que les limites à l’intérieur desquelles la prévision aura lieu sont
déterminées par la moyenne absolue de variation de la série critère (Eq. 4).
∑ | |
(4)
Les limites inférieures et supérieures des prévisions sont donc représentées par
[ ]. Le changement prédit dépend quant à lui de la vraisemblance que la valeur
actuelle de la série soit un point tournant (c’est-à-dire si la valeur de la série temporelle
augmente depuis plusieurs périodes et qu’elle se met à descendre, ou vice versa). Si la
valeur de la période actuelle est plus grande que la valeur de la période précédente (
) il s’agit d’un possible sommet. Dans ce cas, représente la probabilité que
soit un maximum local. Le nombre total de maximums locaux observés jusqu’à présent
( ) et le nombre de maximums locaux plus petits ou égaux à la valeur actuelle de la série
critère ( ) sont considérés dans le calcul de la probabilité. Par exemple, si tous les
maximums locaux observés jusqu’à présent sont plus petits que la valeur actuelle du critère,
il est fort probable que la série soit à un point tournant. Inversement, si la valeur de la
période actuelle est plus petite que la période précédente ( ), il s’agit d’un possible
creux. Dans ce cas, représente la probabilité que soit un minimum local ( ). La
logique est la même que celle des maximums locaux, c’est-à-dire que plus la valeur actuelle
de la série temporelle est inférieure ou égale aux minimums locaux observés jusqu’à
47
présent ( ), plus les probabilités que la série temporelle soit à un point tournant est
grande. Le calcul des probabilités est représenté dans l’équation (Eq. 5).
(5)
Dans l’éventualité où aucun extrême (maximum ou minimum local) ne soit survenu
encore, la procédure employée par Becker et Leopold-Wildburger (1996) consiste à fixer
les probabilités d’un point tournant positif et négatif à .5. Il s’agit d’une prémisse qui tente
de limiter le biais potentiel vers l’une ou l’autre des valeurs et constitue rarement une
situation observée dans la présente thèse étant donné le caractère hautement non-
stationnaire des séries temporelles étudiées. Finalement, si la valeur de la période actuelle
est égale à celle de la période précédente les probabilités d’un point tournant
positif et négatif sont combinées linéairement. L’ensemble de ces équations peuvent être
résumées en une seule (Eq. 6).
{
( )
(6)
La Figure 10 illustre un exemple du comportement de l’heuristique L&V1 par
rapport à une série temporelle critère de référence.
48
Figure 10. Exemple du comportement du modèle L&V1 lors de la prévision d’une série temporelle critère de
référence. Notez que les prévisions faites à l’aide de ce modèle sont relativement différentes de celles faites
par les modèles d’ancrage et ajustement.
L&V2. La deuxième formalisation de l’heuristique utilise également un indice
intrinsèque (Eq. 7), mais intègre aussi un indice extrinsèque ( ) provenant d’une autre
série temporelle (k) qui co-évolue avec la série critère (y). Cet indice est ajusté par un
facteur de relation ( ) pour tenir compte des propriétés propres à chaque série. La série
temporelle indice est celle qui a la plus grande corrélation avec la série temporelle critère
au temps t. L’indice est calculé à partir de cette série temporelle à l’aide de l’équation
suivante (Eq. 8) :
(7)
Le facteur de relation est déterminé de la façon suivante (Eq. 7) :
∑ | |
∑ | |
(8)
Ainsi, on se retrouve avec deux indices pour faire le jugement de prévision : et .
Le premier découle directement de la série temporelle critère (il s’agit donc d’un indice de
source intrinsèque) alors que le second découle d’une série temporelle qui co-évolue dans
le même environnement (il s’agit donc d’un indice de source extrinsèque). Si ces deux
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
L&V1-V1
49
indices sont inégaux, le modèle doit avoir un mécanisme de sélection ou de pondération. Le
mécanisme proposé par Becker et ses collègues (2007) consiste à pondérer chacun de ces
indices à l’aide d’un paramètre proportionnel à l’erreur absolue de prévision (Eq. 9)
et (Eq. 10).
∑|
|
(9)
où ,
(10)
où ,
Finalement, la prévision consiste en une combinaison linéaire des deux indices
pondérés par leur paramètre respectif (Eq. 11).
(11)
La Figure 11 illustre un exemple du comportement de l’heuristique L&V2 par
rapport à une série temporelle critère de référence.
50
Figure 11. Exemple du comportement du modèle L&V2 lors de la prévision d’une série temporelle critère de
référence. Ce modèle est le premier, parmi ceux décrits, qui utilise des informations de source extrinsèque
(ces séries ne sont pas montrées dans la figure). Cela a pour effet de modifier les prévisions par rapport à
L&V1, notamment pour les périodes t > 1 et t < 9.
L&V3. Le troisième modèle de l’heuristique de limites et vraisemblance intègre les
indices ( ) provenant de l’ensemble des autres séries temporelles (k) qui co-évoluent avec
la série critère (y) en plus d’un indice de source intrinsèque déterminé de la même manière
que L&V1 et L&V2 (Eq. 6). À la manière de L&V2, ces indices sont ajustés par un facteur
de relation ( ) pour tenir compte des propriétés propres à chaque série, puis pondéré au
sein d’une représentation linéaire en fonction de leur erreur de prévision. Dépendamment
des conditions expérimentales, cette heuristique intègrera un total de quatre ( ,
ou huit ( , indices. Les indices sont pondérés
suivant la même équation que pour L&V2 (Eq. 9). Ce modèle de l’heuristique de limites et
vraisemblance est celui dont la complexité est la plus élevée en termes de nombre de
paramètres. Ainsi, ce modèle devrait mener à des prévisions précises de l’environnement,
quoique plusieurs études, entre autres dans le domaine de la prévision de séries temporelles,
démontrent que les modèles les plus complexes ne sont pas nécessairement les plus
performants (par exemple, Woike et al., 2012). Ce modèle est toutefois peu plausible d’un
point de vu cognitif, particulièrement lorsque huit indices doivent être intégrés. Pour cette
raison, ce modèle devrait être caractérisé par un faible niveau d’adéquation avec les
données expérimentales humaines (voir Chapitre 3). Cette hypothèse, basée sur les limites
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
L&V2-V1
51
cognitives humaines en mémoire active (Halford et al., 2005), est d’ailleurs émise par
Becker, Leitner et Leopold-Wildburger (2007) qui ont testé ce modèle seulement jusqu’à
l’intégration de cinq indices, ce qui demeure insuffisant pour se prononcer par rapport à
cette hypothèse. La Figure 12 illustre un exemple du comportement du modèle L&V3 par
rapport à une série temporelle critère de référence.
Figure 12. Exemple du comportement du modèle L&V3 lors de la prévision d’une série temporelle critère de
référence. Ce modèle extrait, intègre et pondère l’ensemble des indices disponibles. Bien que la méthode de
pondération soit simplifiée, ce modèle demeure néanmoins le plus complexe parmi ceux présentés et constitue
probablement une stratégie hors de la portée cognitive humaine.
MODÈLE DE JUGEMENT LINÉAIRE
Le jugement linéaire constitue, dans le cadre de la thèse, la norme rationnelle. Afin
de comparer la performance du jugement linéaire aux modèles de la classe heuristique
spécifiés plus haut, une formalisation computationnelle est réalisée. Cette formalisation se
fonde sur le modèle lentille (ML). Une seule formalisation est réalisée en lien avec le
jugement linéaire puisque le ML constitue la référence incontestée de jugement linéaire
dans la littérature depuis plusieurs décennies.
ML1. Les prévisions du ML1 sont basées sur la régression de chaque critère à
chaque tour de la simulation sur l’ensemble des indices ( ) disponibles, c’est-à-dire
toutes les valeurs passées des séries temporelles de chaque condition expérimentale. Par
0
2
4
6
8
10
12
14
16
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
L&V3-V1
52
exemple, pour prédire la valeur de la série temporelle « V3 » à la période t = 5 une
régression serait effectuée sur les valeurs de cette série aux périodes t = 0 à t = 4 (donc le
critère) avec les valeurs de toutes les séries temporelles pour les périodes passées (donc les
indices). Comme de nouvelles observations sont disponibles à chaque période de la
simulation, une nouvelle régression est réalisée pour chaque période – permettant ainsi au
modèle d’ajuster ses paramètres. La fenêtre temporelle des indices intégrés dans le modèle
est l’ensemble des observations actuelles et passées. Ainsi, pour chaque période, la fenêtre
temporelle s’agrandit. Ces régressions spécifient les coefficients ( ) pour chaque indice et
permet ainsi le calcul d’une valeur prédite pour chaque tour.
La prévision du modèle pour chaque critère est une combinaison linéaire de tous les
indices pondérés incluant une auto régression du critère lui-même (Eq. 12). Les équations
utilisées pour obtenir les valeurs des variables dans l’équation sont détaillées ci-dessous. À
l’instar des autres modèles, le ML1 ne comporte pas de composante stochastique.
∑
(12)
Les coefficients de régression non-standardisés (B) sont obtenus en inversant la
matrice de corrélation des indices et en la multipliant par la matrice de corrélation entre
indices et critère (Eq. 13).
(13)
Finalement, pour obtenir les coefficients de régression standardisés (β), il faut
multiplier les coefficients standardisés par le ratio entre l’écart-type du critère ( et de
l’indice ( (Eq. 14).
(
) (14)
La Figure 13 illustre un exemple des prévisions du ML1 par rapport à une série
temporelle critère de référence.
53
Figure 13. Exemple du comportement du ML1 lors de la prévision d’une série temporelle critère de référence.
Ce modèle constitue la norme rationnelle dans ce contexte. Dans ce cas précis, on observe que les prévisions
de ML1 semblent relativement bien ajustées au critère, mais que le niveau d’ajustement semble moindre à
celui de certains modèles d’heuristiques décrits précédemment.
Dans tous les cas, la première prévision est initialisée comme si les valeurs
précédentes (t-1) des séries temporelles étaient égales à zéro. Les prévisions faites par
l’ensemble des modèles sont arrondies à l’unité. De plus, la prévision la plus basse possible
est de zéro alors que la plus élevée est de 20. En effet, les valeurs des séries temporelles
sont des entiers et évoluent entre zéro et 20 inclusivement. Ces contraintes sont appliquées
puisque les participants humains (Chapitre III) y sont également soumis. Cela permet ainsi
de comparer justement les données humaines à celles des modèles computationnels.
Plusieurs autres modèles seraient formalisables. Notamment, il serait possible de
développer un modèle de jugement linéaire avec mémoire temporelle limitée ou encore un
modèle de jugement linéaire dans lequel seulement un sous-ensemble d’indices serait
considéré. Toutefois, la thèse se limite à des modèles (1) existants au sein de la littérature et
(2) qui permettent de répondre aux principales hypothèses de recherche.
SOURCES D’INFORMATION DES MODÈLES
Par l’analyse des modèles, il est possible d’identifier les sources d’information
(Harvey, 2007) sur lesquelles les modèles se fondent pour faire leur prévision. Tel que
0
2
4
6
8
10
12
14
16
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Val
eur
Période (t)
Variable 1
ML1-V1
54
décrit précédemment, la source intrinsèque concerne les informations qui sont associées au
critère lui-même. Par exemple, dans le présent contexte, les valeurs passées du critère
constituent un indice de source intrinsèque. À l’inverse, la source extrinsèque concerne les
informations qui sont associées aux autres séries temporelles. Par exemple, si on doit
prédire la série A, les valeurs des séries B, C et D constituent des indices de source
extrinsèque.
Ces sources peuvent être décomposées davantage en fonction des caractéristiques des
modèles formalisés dans la présente thèse. Les informations de source intrinsèque peuvent
être explicites, par exemple, la valeur du critère à la période t – 1, ou extraites, par exemple,
la probabilité d’un changement de direction dans le changement de la série temporelle.
Cette décomposition (entre extraite et explicite) a d’abord été suggérée par Karelaia et
Hogarth (2008) et se révèle pertinente puisque ces mêmes auteurs y associent des
différences en termes de performance de jugement dans un contexte différent, mais
similaire aux prévisions de séries temporelles. Dans ce contexte-ci, les modèles d’ancrage
et ajustement se fondent sur des indices explicites de source intrinsèque alors que les
modèles de limites et vraisemblance se fondent essentiellement sur des indices extraits de
source intrinsèque. La source extrinsèque peut aussi être décomposée selon que le modèle
se fonde sur un ou plusieurs indices. Cette décomposition est justifiée par le fait que le
nombre d’indices est une caractéristique importante qui serait associée à la performance du
jugement, mais aussi aux limites fondamentales des capacités cognitives humaines. C’est-à-
dire qu’il est démontré que les humains ont beaucoup de difficulté à adopter une stratégie
qui intègre plus de trois indices simultanément (voir Halford et al., 2005). Logiquement,
plus les sources d’information sur lesquelles un modèle se fonde sont de bonne qualité, plus
le modèle sera performant. C’est d’ailleurs pour cette raison que la qualité des sources
d’information est manipulée au sein des deux simulations à venir. Le Tableau 1 identifie les
sources d’information de chacune des versions des modèles.
55
Tableau 1
Sources d’information et modèles.
Intrinsèque Extrinsèque
Stratégie Modèle Explicite Extraite Unique Multiple
Ancrage et
ajustement
(heuristique)
ANC1 X
ANC2 X
ANC3 X
Limites et
vraisemblance
(heuristique)
L&V1 X
L&V2 X X
L&V3 X X
Jugement
linéaire ML1 X X
Sur la base des sources d’information employées par les modèles, il est raisonnable
d’avancer que les trois modèles d’ancrage et ajustement devraient se comporter
relativement de la même façon en fonction des variations dans la qualité des sources
d’information. En effet, ils misent tous sur des indices de source intrinsèque explicitement
disponibles. À l’inverse, les autres modèles (c’est-à-dire, ceux associés à l’heuristique de
limites et vraisemblance et au jugement linéaire) devraient avoir des patrons uniques de
performance en fonction de la qualité des sources d’information puisque chacun de ceux-ci
mise sur une combinaison différente de sources d’information.
Suite à cette analyse des modèles, il est possible de décomposer l’hypothèse H1 en
une série d’hypothèses plus précises, elles-mêmes associées à l’objectif O1 de cartographier
le lien entre les conditions environnementales et la performance des stratégies modélisées:
H1 : La performance des heuristiques à la tâche de prévision temporelle sera supérieure à
celle du modèle de jugement linéaire.
H1a : La performance de l’heuristique d’ancrage et ajustement sera supérieure à
celle du modèle de jugement linéaire dans les conditions où seule la qualité de la
source d’information intrinsèque est élevée.
56
H1b : La performance de l’heuristique de limites et vraisemblance (L&V1) sera
supérieure à celle du modèle de jugement linéaire dans les conditions où seule la
qualité de la source d’information intrinsèque est élevée.
H1c : La performance de l’heuristique de limites et vraisemblance (L&V2 et L&V3)
sera supérieure à celle du modèle de jugement linéaire dans les conditions où la
qualité des sources d’information intrinsèque et extrinsèque est élevée.
Simulation I
Ce chapitre vise à évaluer la performance des modèles de stratégie de prévision
(ancrage et ajustement, limites et vraisemblance et jugement linéaire) sous de conditions
variées de qualité d’information de sources intrinsèque et extrinsèque. L’objectif est de
juger si l’application de stratégies supplantant le jugement linéaire est possible et de
déterminer quelles conditions favorisent cette application. À cet égard, la première
simulation étudie l’influence de la qualité de la source extrinsèque d’information sur la
performance des stratégies formalisées. Par conséquent, la qualité de la source extrinsèque
est variée entre les séries temporelles alors que la qualité de la source intrinsèque est
contrôlée (c’est-à-dire qu’elle est maintenue à un niveau élevé pour l’ensemble des séries
temporelles). Les facteurs manipulés pour varier la qualité de la source extrinsèque sont le
nombre d’indices extrinsèques et la force d’association extrinsèque.
Le nombre d’indices extrinsèques correspond au nombre de séries temporelles qui
co-évoluent avec la série critère. Tel que discuté précédemment, le nombre d’indices est un
facteur bien connu pour avoir un impact sur l’adoption des stratégies de jugement. En effet,
au-delà de trois variables à considérer comme indices lors d’un jugement, les individus
semblent avoir beaucoup de difficulté à appliquer une règle de jugement linéaire et
adopteraient par conséquent des heuristiques simplificatrices (Karelaia & Hogarth, 2008).
Cet effet est généralement interprété à la lumière des limitations cognitives bien connues
des individus en termes de capacité de traitement de l’information et de limites en mémoire
active (Halford et al., 2005; Payne et al., 1993). C’est précisément ce seuil de trois indices
qui sera manipulé dans le cadre de la première simulation. En effet, les prévisions seront
réalisées selon deux conditions à l’égard du nombre d’indices à considérer. Dans la
57
première condition, le nombre d’indices sera de trois (donc équivalent au seuil établit par
Halford et ses collègues) alors quand dans l’autre, le nombre d’indices sera de sept (donc
supérieur au seuil établit).
La force d’association extrinsèque correspond au maximum des corrélations
linéaires absolues entre les indices extrinsèques et le critère. En d’autres mots, plus le
critère peut être prédit avec précision à l’aide d’un indice extrinsèque unique, plus la force
d’association extrinsèque est élevée. La force d’association extrinsèque réfère directement à
la validité et la fiabilité des indices (Seifert & Hadida, 2013). Certaines études démontrent
que la validité des indices influence la performance à une tâche de prévision de séries
temporelles (Lim & O’Connor, 1996), mais son impact spécifique sur la performance des
stratégies formalisées dans la présente thèse n’a pas été étudié. C’est-à-dire les heuristiques
d’ancrage et ajustement, et de limites et vraisemblance ainsi que la norme rationnelle de
jugement linéaire.
MÉTHODE
Tâche. La tâche consiste à prédire la valeur numérique d’un ensemble de séries
temporelles pour la période suivante t + 1. Ces séries temporelles évoluent sur 40 périodes.
Les paramètres des modèles sont fixés dans le but de minimiser l’erreur quadratique
moyenne entre les prévisions et la série temporelle critère. Les modèles ont accès à
l’ensemble des valeurs passées et actuelles de toutes les séries temporelles. Évidemment,
les modèles n’ont pas accès aux valeurs futures des séries temporelles. Les valeurs
présentées aux modèles ne comportent pas d’incertitude, c’est-à-dire qu’ils ont accès à une
information juste et précise sur la valeur actuelle et les valeurs passées de toutes les
variables de la situation.
Lorsque possible, les modèles sont simulés pour l’ensemble des 40 périodes de
chaque condition, néanmoins, toutes les statistiques rapportées ne concernent que les
périodes t > 9. Cela est causé par des limitations computationnelles de certaines stratégies
qui requièrent un nombre minimal d’observations pour être exécutées. Par exemple, le
calcul du ML1 ne peut être réalisé lorsque la matrice de variance-covariance est
caractérisée par un niveau de colinéarité trop élevé.
58
Procédure. Les heuristiques sont formalisées et simulées dans Excel alors que le
modèle linéaire l’est en partie dans SPSS (pour le calcul des coefficients de régression) et
en partie dans Excel (pour les prévisions finales). Les prévisions numériques réalisées par
les modèles sont consolidées dans un fichier Excel unique dans lequel l’adéquation par
rapport aux valeurs réelles des séries temporelles est calculée. L’adéquation est mesurée à
l’aide de la PVE. Cet indice de performance, tel que formulé (Hays, 1963; Stevens, 2013;
Eq. 14), tient compte à la fois de l’erreur moyenne des prévisions et de la prévision de la
variation des séries temporelles. Essentiellement, cet indice correspond à l’erreur de
prévision, pondérée par la variance de la série critère. La PVE peut théoriquement varier de
-∞ à +1. Plus la valeur de la PVE est proche de un, plus la prévision de la série temporelle
est bonne. Une PVE négative signifie que les prévisions réalisées ajoutent de la variance à
la variance réelle de la série.
∑ ̅ ∑
∑ ̅ (14)
La manipulation des facteurs nombre d’indices extrinsèques (3 et 7) et la corrélation
extrinsèque (telle que définie, cette valeur est absolue, donc nécessairement positive) (min
= .29, max = .98, m = .78, ET = .17) est réalisée sur 24 séries temporelles regroupées en
quatre versions de scénario. Les Figure 14, Figure 15, Figure 16 et Figure 17 représentent la
valeur de chacune des variables pour les 41 périodes de la simulation. Tel que décrit
précédemment, la qualité des indices de source intrinsèque a potentiellement un impact sur
la performance des heuristiques et du modèle de jugement linéaire. Pour cette raison, et
comme le centre focal de cette simulation concerne la qualité des indices de source
extrinsèque, ce facteur est contrôlé autant que possible. L’indice utilisé pour estimer la
qualité des indices de source intrinsèque est la force d’autocorrélation du critère. Plus
l’autocorrélation est élevée, plus la qualité des indices de source intrinsèque est élevée. Le
Tableau 2 recense la force d’association, le nombre d’indices extrinsèques et la force de
l’autocorrélation (facteur contrôlé) par série temporelle.
59
Figure 14. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un
indice.
Figure 15. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un
indice.
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Val
eur
Période (t)
V01
V02
V03
V04
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Vale
ur
Période (t)
V01
V02
V03
V04
60
Figure 16. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un
indice.
Figure 17. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un
indice.
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Val
eur
Période (t)
V01
V02
V03
V04
V05
V06
V07
V08
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Val
eur
Période (t)
V01
V02
V03
V04
V05
V06
V07
V08
61
Tableau 2
Nombre d’indices extrinsèques, force d’association entre meilleur indice et critère, et
autocorrélation du critère.
Manipulé Contrôlé
Série Nombre d’indices
extrinsèques (SE)
Force d’association
(SE)
Autocorrélation du
critère (SI)
1 3 0.96 0.99
2 3 0.64 0.99
3 3 0.96 0.99
4 3 0.75 1.00
5 3 0.89 0.90
6 3 0.89 0.96
7 3 0.59 0.97
8 3 0.61 0.97
9 7 0.94 0.93
10 7 0.84 0.95
11 7 0.83 0.98
12 7 0.29 1.00
13 7 0.98 0.98
14 7 0.98 0.98
15 7 0.83 0.98
16 7 0.94 0.99
17 7 0.76 0.83
18 7 0.59 0.92
19 7 0.84 0.99
20 7 0.72 0.98
21 7 0.76 0.91
22 7 0.58 0.75
23 7 0.84 0.98
24 7 0.64 0.98
62
ESTIMATION DES PARAMÈTRES DES MODÈLES
Les modèles effectuent leurs prévisions pour l’ensemble des séries temporelles.
Dans leur forme actuelle, chaque modèle fait systématiquement la même prévision lorsqu’il
sera dans les mêmes conditions environnementales, c’est-à-dire que les règles de prévision
des modèles sont complètement déterminées. Il résulte donc de 24 séries de prévisions pour
chaque modèle. Les figures suivantes (16 à 19) illustrent un exemple de l’évolution des
paramètres pour les modèles L&V3 et ML1 et des prévisions qui en découlent pour une des
séries temporelles critère. Aucun modèle d’ancrage et ajustement n’est montré en exemple
dans cette section puisque leur unique paramètre (α) est fixe pour l’ensemble des prévisions
associées à une série temporelle. Ce paramètre est fixé grâce à l’outil « Solver » du logiciel
Excel 2007 de Microsoft. Seul l’estimation des paramètres du modèle L&V3 de
l’heuristique de limites et vraisemblance est montrée en exemple puisqu’il s’agit de
l’instanciation la plus complexe des trois modèles de limites et vraisemblance et que
l’estimation de ses paramètres est identique à celle des modèles L&V1 et L&V2.
Finalement, l’estimation des paramètres de ML1 est montrée en exemple puisqu’il est le
seul représentant de sa classe de modèle (c’est-à-dire, le jugement linéaire). Notez que
toutes les statistiques rapportées ne concernent que les périodes t > 9. Cela est causé par des
limitations computationnelles de certains modèles qui requièrent un nombre minimal
d’observations pour être exécutés.
La Figure 18 montre l’évolution du paramètre facteur de relation entre la série
temporelle critère Y2 et chacune des séries temporelles de source extrinsèque Kn pour t > 9.
Ce paramètre est estimé pour le calcul des prévisions du modèle L&V3. Il s’agit d’un
paramètre qui évalue le degré d’association linéaire entre le critère et les indices, mis à jour
à chaque période pour y inclure les nouvelles observations. Tel que décrit précédemment,
ce paramètre estime une propriété gestaltique extraite des séries temporelles. Une fois
extrait, ce paramètre constitue un indice utilisé pour la prévision de la série temporelle
critère.
63
Figure 18. Facteur de relation entre la série temporelle critère Y2 et chacune des séries temporelles K. Il n’y a
pas de facteur de relation pour la série K2 puisqu’il s’agit de la série critère et que ce paramètre n’est estimé
que pour les séries extrinsèques.
L’utilisation du facteur de relation (illustré dans la Figure 18) dans le modèle L&V3
est pondérée en fonction de l’erreur des prévisions passées. La pondération de chaque
indice est inversement proportionnelle à l’erreur qui lui est attribuée. Cette pondération est
aussi ajustée à chaque période pour y inclure les nouvelles observations. La Figure 19
illustre l’évolution du poids de chaque indice pour la série temporelle critère Y2 (source
intrinsèque) et chacune des séries temporelles Kn (source extrinsèque).
0
0,5
1
1,5
2
2,5
3
3,5
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41
Fact
eu
r d
e r
ela
tio
n r
kt
Période (t)
Y2-K1
Y2-K3
Y2-K4
Y2-K5
Y2-K6
Y2-K7
Y2-K8
64
Figure 19. Poids attribué aux indices Kn et Y pour la prévision de la série temporelle critère Y2. Notez qu’au
départ, le poids attribué à l’indice intrinsèque est le plus important, mais qu’il cède éventuellement place à
d’autres indices extrinsèques.
La Figure 20 illustre la valeur des coefficients de régression non-standardisés par le
ML1 pour la même variable critère et les mêmes indices que ceux illustrés dans la Figure
19 pour le modèle L&V3.
La méthode utilisée pour estimer le poids des indices dans le modèle L&V3 (définie
dans Becker et al., 2007) diffère de celle employée par le ML1 pour le calcul des
coefficients de régression. De plus, les coefficients sont estimés sur des indices différents.
Ces différences résultent donc en des prévisions distinctes, telles qu’illustrées dans la
Figure 21.
0
0,05
0,1
0,15
0,2
0,25
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
Po
ids
αst
Période (t)
k1
k3
k4
k5
k6
k7
k8
Y (V2)
65
Figure 20. Coefficients de régression non-standardisés des indices Kn et Y pour la prévision de la série
temporelle critère Y2. Notez qu’à l’inverse des poids calculés par le modèle L&V3, le coefficient de l’indice
intrinsèque (B 02) est d’abord faible, puis devient le plus important par la suite.
Figure 21. Prévisions de L&V3 et ML1 et valeurs réelles de la série temporelle critère (nommée 7 ind ; faible
– V2) pour les périodes [t > 9 : t <= 41]. Le critère est nommé « 7 ind » et « faible » puisqu’il est dans une
condition où 7 indices extrinsèques sont disponibles pour le prédire et où la force d’association extrinsèque
avec ces indices est faible. Les deux modèles génèrent des prévisions distinctes, et aucune n’arrive à prédire
parfaitement la série temporelle critère.
-3
-2
-1
0
1
2
3
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
Val
eu
r d
es
coe
ffic
ien
ts d
e r
égr
ess
ion
Période (t)
B 01
B 02
B 03
B 04
B 05
B 06
B 07
B 08
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Val
eu
r
Période (t)
7 ind; faible - V2
L&V3 - V2
ML1 - V2
66
RÉSULTATS
Les données générées par la simulation sont analysées en quatre étapes. La première
consiste à évaluer la similarité des prévisions des modèles. Cette analyse vise
essentiellement à évaluer si les conditions de simulation permettent de discriminer les
modèles. La deuxième étape consiste à comparer les deux classes de modèles – heuristiques
(ANC1, ANC2, ANC3, L&V1, L&V2, L&V3) et jugement linéaire (ML1) – afin d’évaluer
si certaines heuristiques arrivent à mieux performer que le modèle de jugement linéaire.
Cette comparaison est directement en lien avec l’hypothèse H1, c’est-à-dire :
H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans
certains cas supérieure à celle du modèle de jugement linéaire.
La troisième étape consiste à évaluer l’impact des facteurs expérimentaux sur la
performance des modèles. Cette analyse vise à identifier quelles sont les conditions qui
pourraient déterminer l’utilité des stratégies. Finalement, la dernière étape consiste à
explorer d’autres facteurs potentiels pour expliquer la variation de la performance des
modèles. Les étapes trois et quatre sont en lien avec O1, c’est-à-dire :
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
Cet objectif est lui-même associé à trois sous-hypothèses :
H1a : La performance de l’heuristique d’ancrage et ajustement sera supérieure à
celle du modèle de jugement linéaire dans les conditions où seule la qualité de la
source d’information intrinsèque est élevée.
H1b : La performance de l’heuristique de limites et vraisemblance (L&V1) sera
supérieure à celle du modèle de jugement linéaire dans les conditions où seule la
qualité de la source d’information intrinsèque est élevée.
H1c : La performance de l’heuristique de limites et vraisemblance (L&V2 et L&V3)
sera supérieure à celle du modèle de jugement linéaire dans les conditions où la
qualité des sources d’information intrinsèque et extrinsèque est élevée.
67
Similarité des modèles. Pour chaque série temporelle, un coefficient de corrélation
Pearson entre les prévisions des modèles est calculé. Plus le coefficient est prêt de un, plus
les prévisions des modèles comparées sont similaires. Le Tableau 3 rapporte le coefficient
de corrélation de Pearson moyen pour l’ensemble des séries temporelles et l’écart-type
entre les prévisions des modèles.
Tableau 3
Moyenne (écart-type) des corrélations entre les prévisions des modèles.
ANC2 ANC3 L&V1 L&V2 L&V3 ML1
ANC1 .99 (.01) 1.00 (0) .98 (.05) .95 (.19) .95 (.08) .94 (.08)
ANC2
.99 (.01) .97 (.06) .94 (.20) .93 (.07) .95 (.09)
ANC3
.98 (.05) .95 (.19) .95 (.08) .94 (.08)
L&V1
.96 (.11) .93 (.13) .94 (.09)
L&V2
.92 (.23) .92 (.15)
L&V3
.89 (.14)
Notez que la corrélation moyenne entre ANC1 et ANC3 est de un, ce qui signifie
que les prévisions réalisées par ces deux modèles sont identiques en tout point pour
l’ensemble des séries temporelles de la simulation. Par conséquent, pour les analyses
subséquentes, ces deux modèles de l’heuristique seront traités de façon indifférenciée.
Comparaison des classes de modèles. Une ANOVA à mesures répétées sur la
performance en variable dépendante et le modèle comme facteur répété indique qu’en
moyenne, sur les 24 séries temporelles, aucun modèle ne permet l’atteinte de performance
supérieure aux autres F(5,115) = 1.579, non significatif. Les résultats de l’analyse indiquent
qu’on ne peut rejeter l’hypothèse nulle selon laquelle la performance moyenne des modèles
est équivalente. La moyenne de performance et l’écart-type des modèles sont rapportés
dans le Tableau 4.
68
Tableau 4
PVE moyenne (écart-type) des modèles.
ANC1 ANC2 L&V1 L&V2 L&V3 ML1
PVE moyenne .89 (.12) .92 (.12) .84 (.21) .83 (.26) .91 (.04) .67 (.87)
Bien qu’en moyenne, aucun modèle ne performe mieux que les autres, la
performance à chaque série temporelle est analysée. Afin de comparer les classes de
modèles et de vérifier si certaines heuristiques performent mieux que le ML, la différence
entre la performance de chaque modèle d’heuristiques et le ML1 est calculée. Ensuite,
selon que la différence est positive ou négative, les prévisions des modèles d’heuristiques
sont classifiées comme étant meilleure ou moins bonne que celles du ML1. Étant donné que
les modèles formalisés ne comportent pas de processus stochastiques, les prévisions pour
une série temporelle donnée ne comporteraient aucune variabilité s’ils étaient simulés à
plusieurs reprises. Ainsi, il est justifié de dire qu’un modèle est ou n’est pas plus
performant que le ML1 pour une série temporelle donnée, et ce, sans effectuer de test
statistique. Le Tableau 5 indique la fréquence de différence positive par modèle
d’heuristique.
Tableau 5
Fréquence de différence positive indiquant une performance supérieure au modèle
linéaire par modèle.
ANC1 ANC2 L&V1 L&V2 L&V3
Fréquence (/24) 10 18 9 7 10
Le modèle le plus performant est identifié par série temporelle. Ils sont rapportés
dans le Tableau 6. Au total, il existe au moins un modèle qui performe mieux que le ML1
pour 20 des 24 séries temporelles. Les quatre séries temporelles mieux prédites par ML1
sont les séries 4, 7, 9 et 10 (voir Figure 22).
69
Tableau 6
Modèle le plus performant par série temporelle.
ANC1 ANC2 L&V1 L&V2 L&V3 ML1
Séries 8, 17, 18
1, 2, 3, 9,
11, 12, 13,
14, 15, 16,
19, 20, 22,
23, 24
6, 21
4, 5, 7, 10
Figure 22. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle des modèles
d’heuristiques formalisées et séries co-évoluant avec celles-ci (grises).
Effet des facteurs expérimentaux sur la performance. Pour toutes les conditions et
les modèles confondus, la moyenne (ET) de performance est égale à .85 (.36) telle
qu’estimée par la PVE. Pour estimer la performance des modèles en fonction des facteurs
expérimentaux, une série d’analyses de régression est réalisée sur la performance atteinte
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 1
Série 2
Série 3
Série 4
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 5
Série 6
Série 7
Série 8
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 9
Série 10
Série 11
Série 12
Série 13
Série 14
Série 15
Série 160
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 9
Série 10
Série 11
Série 12
Série 13
Série 14
Série 15
Série 16
Période (t)
Période (t) Période (t)
Période (t)
Val
eur
Val
eur
Val
eur
Val
eur
70
par chaque modèle en VD et le nombre d’indices extrinsèques (3 vs. 7) et la force
d’association extrinsèque comme VIs. Les régressions sont réalisées sur la performance
PVE afin de savoir sous quelles conditions chaque modèle est susceptible de bien
performer.
Tous les modèles n’ont pas été retenus pour faire les analyses. Ce choix est motivé
par l’augmentation des risques d’erreur de type I (c’est-à-dire rejet erroné de l’hypothèse
nulle) avec l’augmentation du nombre de tests. Ainsi, pour limiter le nombre de tests, seul
un représentant des modèles d’ancrage et ajustement (ANC2) a été retenu. Il s’agit de la
version de l’heuristique qui obtient la meilleure performance de prévision moyenne. De
plus, les deux autres versions de cette heuristique sont caractérisées par les mêmes sources
d’information que la version ANC2. Les trois modèles de l’heuristique de limites et
vraisemblance ont été retenus puisqu’ils sont tous caractérisés par des sources
d’information distinctes. Finalement, le ML1 a aussi été retenu puisqu’il est le seul
représentant du jugement linéaire. Finalement, une correction Bonferroni a été réalisée pour
éviter le gonflement de la probabilité d’erreur de type I. Le nombre de tests effectués étant
égal à cinq, le seuil alpha corrigé est égal à .01 (initialement .05).
Les prémisses de normalité, linéarité et d’homoscédasticité des résidus ont été
vérifiés avec SPSS EXAMINE et SPSS REGRESSION. Étant donné la valeur extrême de
performance de L&V2, l’observation correspondant à la série temporelle #12 (voir Tableau
2) a été retirée des analyses. Les analyses ont été réalisées avec SPSS REGRESSION. La
méthode de sélection des facteurs se fonde sur un critère d’entré statistique STEPWISE1.
Les régressions sur la performance d’ANC2, L&V1, L&V2, L&V3 et ML1 révèlent que les
R sont tous non-statistiquement significatifs.
Autres analyses. Bien que la qualité de la source intrinsèque d’information telle que
mesurée par l’autocorrélation du critère soit contrôlée et tenue relativement stable pour
l’ensemble des séries temporelles, il existe de légères variations qui pourraient expliquer les
variations de performance des modèles. Une analyse corrélationnelle a été effectuée afin
1 Entrée à F <= .05, sortie à F >= .10
71
d’évaluer l’impact potentiel de ce facteur. Le Tableau 7 rapporte les coefficients de
corrélation et leur niveau de signification statistique.
Tableau 7
Coefficient de corrélation de Pearson entre autocorrélation du critère et performance
des modèles.
ANC1 ANC2 L&V1 L&V2 L&V3 ML1
R .945** .956** .814** .403 -.178 .431*
N 24 24 24 24 24 24
* Significatif à p < .05
** Significatif à p < .01
Afin de valider l’importance de l’autocorrélation, une analyse des coefficients de
régression standardisés du ML1 a été réalisée. L’analyse consiste à comparer la valeur
moyenne des coefficients attribués aux indices de source intrinsèque à ceux de source
extrinsèque. La valeur absolue des coefficients est utilisée puisque le signe ne qualifie pas
l’importance d’un coefficient, mais plutôt sa direction. Un test-t révèle que la moyenne des
coefficients standardisés absolus des indices de source intrinsèque (m = .83, ET = .25) est
statistiquement supérieure à la moyenne des coefficients standardisés absolus des indices de
source extrinsèque (m = .27, ET = .18) t(23) = 7.69, p < .01. Cela montre donc que le ML1
tient compte de la validité élevée des indices de source intrinsèque et les pondère ainsi de
manière plus importante que les indices de source extrinsèque pour faire ses prévisions.
DISCUSSION
De façon générale, les prévisions des modèles sont assez similaires. Cette similarité
s’explique par le fait que la performance moyenne des modèles dans le contexte de la
première simulation est très élevée. Ce résultat n’est toutefois pas une surprise puisqu’il est
raisonnable de s’attendre à ce que des modèles spécifiquement calibrés pour prédire des
séries temporelles arrivent à performer au moins modérément à la tâche. Les différences
entre les prévisions sont subtiles, mais tout même révélatrices de mécaniques sous-jacentes
distinctes.
72
H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans certains
cas supérieure à celle du modèle de jugement linéaire.
Les résultats soulignent que tous les modèles d’heuristiques formalisés arrivent à
mieux performer que le modèle linéaire, et ce, à plusieurs reprises : le modèle linéaire
constitue la meilleure stratégie que dans de rares cas. Il faut noter toutefois que ces
conclusions sont basées sur une analyse de la fréquence de gain et non pas d’une
performance moyenne. Par conséquent, il est difficile de se prononcer sur la généralisation
de ce résultat au-delà de l’échantillon observé. De plus, l’analyse des fréquences et de la
performance moyenne des stratégies indique qu’une stratégie unique ne permet pas
l’atteinte de la meilleure performance pour l’ensemble des séries temporelles de la
simulation. Ces résultats signifient donc qu’un individu qui appliquerait parfaitement la
bonne heuristique au bon moment lors de la prévision de ces séries temporelles atteindrait
une performance supérieure à celle du modèle normatif, ce qui est en accord avec la
rationalité écologique (Sturm, 2012) et le coffre à outils cognitif (Gigerenzer & Selten,
2001; Gigerenzer et al., 1999).
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
Dans le contexte de cette simulation, toutefois, les facteurs manipulés se révèlent
avoir un impact mineur sur la performance des modèles. En effet, bien que des variations
soient observées, la performance d’aucun des modèles ne semble modulée par le nombre
d’indices extrinsèques et la force d’association extrinsèque. Pour certains modèles,
l’absence d’effet de la qualité de la source extrinsèque sur la performance s’expliquerait par
l’utilisation unique d’indices de source intrinsèque. En effet, puisque ANC1, ANC2, ANC3
et L&V1 n’utilisent que des indices de source intrinsèque, il est normal que leur
performance ne soit pas affectée par la manipulation de facteurs associés à la source
extrinsèque, ce qui est conforme aux hypothèses H1a et H1b. Toutefois, dans un
environnement où la validité des indices de source intrinsèque serait réduite, ces stratégies
risquent d’être beaucoup moins performantes puisqu’elles ne peuvent pas compenser par
l’utilisation d’indices de source extrinsèque, potentiellement plus valides. Cela sera évalué
lors de la simulation suivante.
73
Toutefois, l’absence d’effet des deux facteurs associés à la qualité de la source
d’information extrinsèque sur la performance des modèles L&V2, L&V3 et ML1 se révèle
être une surprise, et inverse à l’hypothèse H1c, étant donné la pertinence de cette source
d’information pour ces derniers (Harvey, 2007; Hogarth & Karelaia, 2007). Par contre, ces
stratégies ont également la capacité d’intégrer les indices en provenance de source
intrinsèque. Ainsi, l’absence de résultats significatifs pour ces modèles pourrait s’expliquer
par le fait que ces modèles sont compensatoires (Bröder & Schiffer, 2006). Sous des
conditions de qualité diminuée des indices de source extrinsèque (comme c’est le cas dans
la présente simulation), ces modèles pourraient tout de même bien performer
conditionnellement à une validité élevée des indices de source intrinsèque. Deux analyses
appuient cette interprétation, c’est-à-dire l’analyse des coefficients de régressions du ML1
et la mesure d’association entre force d’autocorrélation et performance des modèles. En
effet, les coefficients de régressions du ML1 associés aux indices de source intrinsèque sont
en moyenne plus importants que ceux attribués aux indices de source extrinsèque. Cela
démontre que, pour diminuer l’erreur de prévision, le ML1 accorde plus d’importance aux
indices intrinsèques comparativement aux indices extrinsèques. L’analyse corrélationnelle
entre force d’autocorrélation et performance des modèles permet d’appuyer davantage cette
interprétation puisqu’elle indique que plus les indices intrinsèques sont fiables et valides,
telle que mesurée par la force de l’autocorrélation des critères, plus la performance des
modèles sera élevée. Ainsi, étant donné la validité élevée des indices intrinsèques dans la
présente simulation, tous les modèles ont la capacité de bien performer, incluant les
modèles non compensatoires.
Bien que cette simulation ne montre qu’un côté de la médaille (c’est-à-dire, indices
intrinsèque de qualité élevée seulement), les résultats appuient certains résultats empiriques
récents selon lesquels une stratégie non compensatoire peut mener à des performances
équivalentes, voire même supérieures à des stratégies compensatoires (Gigerenzer et al.,
1999; Hogarth & Kareleia, 2005, 2007). En effet, les modèles non compensatoires (c’est-à-
dire, ANC1, ANC2, ANC3 et L&V1) tirent particulièrement bien leur épingle du jeu sous
ces conditions comparativement aux modèles compensatoires. Par contre, ils risqueraient de
moins bien performer dans un environnement moins favorable, c’est-à-dire dans un
74
environnement où les indices intrinsèques seraient moins valides. Cette hypothèse sera
d’ailleurs explorée dans la deuxième simulation.
Simulation II
La seconde simulation explore à la fois l’impact de la qualité des indices de source
intrinsèque et des indices de source extrinsèque sur la performance des modèles. Elle vise à
discriminer davantage les modèles, particulièrement les modèles non compensatoires qui
sont basés uniquement sur des indices intrinsèques comparativement aux modèles
compensatoires qui utilisent à la fois les indices intrinsèques et extrinsèques. Concrètement,
les facteurs manipulés sont la force d’association extrinsèque et l’autocorrélation des séries
temporelles. Cette seconde simulation est justifiée par le fait que les sous-hypothèses H1a,
H1b et H1c ne sont que partiellement résolues. Bien que la performance des heuristiques
est parfois supérieure à celle du modèle de jugement linéaire (tel que prédit par l’hypothèse
H1), les conditions sous lesquelles cela est possible demeurent mal définies étant donné les
environnements compensatoires testés.
Le facteur retenu pour la manipulation de la qualité de la source extrinsèque est la
force d’association extrinsèque puisqu’elle est directement liée à la validité et la fiabilité
des indices de source extrinsèque (Seifert & Hadida, 2013) alors que le nombre d’indices
extrinsèque est davantage associé à la quantité. Il représente donc une meilleure indication
de la qualité de la source extrinsèque comparativement au nombre d’indices extrinsèques.
La force d’association extrinsèque est opérationnalisée comme dans la simulation
précédente. Elle correspond au maximum des corrélations linéaires absolues entre les
indices extrinsèques et le critère. Le nombre d’indices extrinsèques est tenu fixe pour la
deuxième simulation puisque son impact sur la performance des modèles lors de la
Simulation I était limité, voire inexistant.
L’autocorrélation des séries temporelles critères est manipulée dans le but de varier
la qualité de la source intrinsèque. Elle correspond à la corrélation des valeurs de la série
temporelle critère sur ses propres valeurs moins une latence d’une période.
L’autocorrélation du critère est un facteur critique dans l’adoption de stratégies alternatives
au modèle linéaire (Lawrence et al., 2006). En effet, plusieurs études observent que les
75
individus qui doivent prédire l’évolution d’une série temporelle auto corrélée ont tendance
à se comporter comme s’ils utilisaient une heuristique d’ancrage et ajustement (Andreassen
& Kraus, 1990; Lawrence & O’Connor, 1992; 1995; Reimers & Harvey, 2011). De plus,
Bolger et Harvey (1993) observent que la nature précise de l’heuristique employée est
différente en fonction de la force de l’autocorrélation, ce qui suggère que ce facteur est
déterminant dans le choix des stratégies employées. Finalement, au sein de la présente
thèse, la première simulation suggère que ce facteur serait un déterminant important de la
performance des stratégies modélisées.
MÉTHODE
La tâche et la procédure sont exactement les mêmes que lors de la première
simulation. La manipulation des facteurs association extrinsèque (min = .14, max = .1, m =
.61, ET = .29) et autocorrélation (min = .00, max = .1, m = .46, ET = .39) est réalisée sur
32 séries temporelles regroupées en quatre version de scénario. Les Figure 23, Figure 24,
Figure 25 et Figure 26 représentent la valeur de chacune des variables pour les 41 tours de
la simulation. Le Tableau 8 recense la force d’association et la force de l’autocorrélation
par série temporelle.
76
Tableau 8
Force d’association entre meilleur indice et critère et autocorrélation du critère.
Série Autocorrélation du critère (SI) Force d’association (SE)
1 0.93 0.96
2 0.89 0.83
3 0.93 0.96
4 0.90 0.86
5 0.85 0.85
6 0.89 0.68
7 0.81 0.86
8 0.62 0.85
9 0.99 0.33
10 1.00 0.36
11 0.72 0.63
12 0.80 0.43
13 0.85 0.43
14 0.30 0.56
15 0.98 0.63
16 0.43 0.43
17 0.01 0.88
18 0.01 1.00
19 0.01 1.00
20 0.01 1.00
21 0.00 1.00
22 0.04 0.99
23 0.33 0.36
24 0.38 0.36
25 0.04 0.25
26 0.17 0.34
27 0.08 0.34
28 0.30 0.14
29 0.02 0.18
30 0.43 0.34
31 0.04 0.36
32 0.11 0.36
77
Figure 23. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries est à la fois un critère et un
indice. Ces huit séries ont en moyenne une autocorrélation et une force d’association extrinsèque élevées.
Figure 24. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries est à la fois un critère et un
indice. Ces huit séries ont en moyenne une autocorrélation élevée et une force d’association extrinsèque faible.
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Val
eur
Période (t)
V01
V02
V03
V04
V05
V06
V07
V08
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Val
eur
Période (t)
V01
V02
V03
V04
V05
V06
V07
V08
78
Figure 25. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries est à la fois un critère et un
indice. Ces huit séries ont en moyenne une autocorrélation faible et une force d’association extrinsèque élevée.
Figure 26. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries est à la fois un critère et un
indice. Ces huit séries ont en moyenne une autocorrélation faible et une force d’association extrinsèque faible.
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Val
eur
Période (t)
V01
V02
V03
V04
V05
V06
V07
V08
0
2
4
6
8
10
12
14
16
18
20
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
t11
t12
t13
t14
t15
t16
t17
t18
t19
t20
t21
t22
t23
t24
t25
t26
t27
t28
t29
t30
t31
t32
t33
t34
t35
t36
t37
t38
t39
t40
t41
Vale
ur
Période (t)
V01
V02
V03
V04
V05
V06
V07
V08
79
ESTIMATION DES PARAMÈTRES
À l’instar de la simulation précédente, les paramètres des modèles sont estimés
grâce aux formules présentées précédemment. Les modèles effectuent leurs prévisions pour
l’ensemble des séries temporelles. Tout comme pour la première simulation, chaque
modèle fait systématiquement la même prévision lorsqu’il sera dans les mêmes conditions
environnementales. Il résulte donc de 32 séries de prévisions pour chaque modèle.
RÉSULTATS
Les données générées par la simulation II sont analysées en trois étapes. La
première consiste à évaluer la similarité des prévisions des modèles. Cette analyse vise à
évaluer si les conditions de simulation permettent de discriminer les modèles. La deuxième
étape consiste à comparer les deux classes de modèles – heuristiques (ANC1, ANC2,
ANC3, L&V1, L&V2, L&V3) et jugement linéaire (ML1) – afin d’évaluer si certaines
heuristiques arrivent à mieux performer que le modèle de jugement linéaire. Cette
comparaison est directement en lien avec l’hypothèse H1, c’est-à-dire :
H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans
certains cas supérieure à celle du modèle de jugement linéaire.
La troisième étape consiste à évaluer l’impact des facteurs expérimentaux sur la
performance des modèles. Cette analyse vise à identifier quelles sont les conditions qui
pourraient déterminer l’utilité des stratégies. L’étape trois est en lien avec l’objectif O1,
c’est-à-dire :
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
Cet objectif est lui-même associé à trois sous-hypothèses :
H1a : La performance de l’heuristique d’ancrage et ajustement sera supérieure à
celle du modèle de jugement linéaire dans les conditions où seule la qualité de la
source d’information intrinsèque est élevée.
80
H1b : La performance de l’heuristique de limites et vraisemblance (L&V1) sera
supérieure à celle du modèle de jugement linéaire dans les conditions où seule la
qualité de la source d’information intrinsèque est élevée.
H1c : La performance de l’heuristique de limites et vraisemblance (L&V2 et L&V3)
sera supérieure à celle du modèle de jugement linéaire dans les conditions où la
qualité des sources d’information intrinsèque et extrinsèque est élevée.
Similarité des modèles. Pour chaque série temporelle, un coefficient de corrélation
Pearson entre les prévisions des modèles est calculé. Plus le coefficient est prêt de un, plus
les prévisions des modèles comparés sont similaires. Le Tableau 9 rapporte le coefficient de
corrélation de Pearson moyen (écart-type) pour l’ensemble des séries temporelles.
Tableau 9
Moyenne (écart-type) des corrélations entre les prévisions des modèles.
ANC2 ANC3 L&V1 L&V2 L&V3 ML1
ANC1 .74 (.36) 1.00 (.00) .81 (.33) .67 (.45) .42 (.48) .30 (.53)
ANC2
.74 (.36) .51 (.58) .64 (.38) .67 (.33) .34 (.51)
ANC3
.81 (.33) .67 (.45) .42 (.48) .30 (.53)
L&V1
.69 (.36) .30 (.49) .37 (.47)
L&V2
.65 (.29) .41 (.42)
L&V3
.41 (.34)
Notez que, à l’instar de la première simulation, la corrélation moyenne entre ANC1
et ANC3 est de un, ce qui signifie que les prévisions réalisées par ces deux modèles sont
identiques en tout point pour l’ensemble des séries temporelles de l’expérience. Par
conséquent, pour les analyses subséquentes, ces deux modèles seront traités de façon
indifférenciée.
Comparaison des classes de modèles. Une ANOVA à mesures répétées sur la
performance en variable dépendante et le modèle comme facteur répété indique qu’en
moyenne, sur les 32 séries temporelles, aucun modèle ne permet l’atteinte de performance
supérieure aux autres F(5,155) = 2.251, non significatif. On ne peut donc pas rejeter
81
l’hypothèse nulle selon laquelle la performance moyenne des modèles est équivalente. La
moyenne de performance et l’écart-type des modèles sont rapportés dans le Tableau 10.
Tableau 10
PVE moyenne (écart-type) des modèles.
ANC1 ANC2 L&V1 L&V2 L&V3 ML1
PVE moyenne -.40 (1.05) -.31 (1.60) -.11 (.82) -.10 (.74) .15 (.70) -.05 (.89)
Bien qu’en moyenne, aucun modèle ne performe mieux que les autres, la
performance à chaque série temporelle est analysée. Afin de comparer les classes de
modèles et de vérifier si certains modèles d’heuristiques performent mieux que le modèle
linéaire, la différence entre la performance de chaque modèle d’heuristique et le modèle
linéaire est calculée. Pour chaque série temporelle, une différence positive indique que le
modèle d’heuristique performe mieux que le modèle linéaire. Le Tableau 11 indique la
fréquence de différence positive par heuristique.
Tableau 11
Fréquence de différence positive indiquant une performance supérieure au modèle
linéaire par modèle d’heuristique.
ANC1 ANC2 L&V1 L&V2 L&V3
Fréquence (/32) 13 22 15 12 20
Au total, il existe au moins un modèle d’heuristique qui performe mieux que le
modèle linéaire pour 25 des 32 séries temporelles. Les sept séries temporelles mieux
prédites par le modèle linéaire que par les autres modèles sont les séries 7, 8, 10, 14, 20, 21
et 23 (voir Figure 27). Le modèle le plus performant est identifié par série temporelle. Ils
sont rapportés dans le Tableau 12.
82
Tableau 12
Modèle le plus performant par série temporelle.
ANC1 ANC2 L&V1 L&V2 L&V3 ML
Séries 4, 15
1, 2, 3, 5, 6,
9, 12, 13,
26, 28, 29,
32
11, 16, 17,
18, 19, 22,
24, 25
27, 31 30 7, 8, 10, 14,
20, 21, 23
83
Figure 27. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle de tous les
modèles d’heuristiques et séries co-évoluant à celles-ci (grises).
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 1
Série 2
Série 3
Série 4
Série 5
Série 6
Série 7
Série 8
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 1
Série 2
Série 3
Série 4
Série 5
Série 6
Série 7
Série 8
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 9
Série 10
Série 11
Série 12
Série 13
Série 14
Série 15
Série 16
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 9
Série 10
Série 11
Série 12
Série 13
Série 14
Série 15
Série 16
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 17
Série 18
Série 19
Série 20
Série 21
Série 22
Série 23
Série 24
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 17
Série 18
Série 19
Série 20
Série 21
Série 22
Série 23
Série 24
0
2
4
6
8
10
12
14
16
18
20
t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40
Série 17
Série 18
Série 19
Série 20
Série 21
Série 22
Série 23
Série 24
84
Effet des facteurs expérimentaux sur la performance. Pour toutes les séries
temporelles et les modèles confondus, la moyenne (écart-type) de performance est égale à -
.17 (1.02) telle qu’estimée par la PVE. Notez que bien que la performance moyenne des
modèles est très basse au sein de la présente simulation, les observations sont caractérisées
par une grande variabilité, indiquant que la performance des modèles varie beaucoup d’une
série temporelle à l’autre. Une MANOVA avec la simulation comme facteur fixe et la
performance des modèles comme variable dépendante révèle que la performance des
stratégies à la Simulation 1 est statistiquement supérieure à celle obtenue par les mêmes
modèles lors de la Simulation 2 F(1,54) = 7.601, p < .01. Le Tableau 13 rapporte la
moyenne observée par simulation et par modèle.
Tableau 13
Moyenne (écart-type) de performance des modèles par simulation.
ANC1 ANC2 L&V1 L&V2 L&V3 ML1
Simulation 1 .89 (.12) .92 (.12) .84 (.21) .83 (.26) .91 (.04) .67 (.87)
Simulation 2 -.40 (1.05) -.31 (1.60) -.11 (.82) -.10 (.73) .15 (.70) -.05 (.89)
Pour estimer l’impact de la qualité des sources d’information sur la performance des
modèles, une série d’analyses de régression est réalisée sur la performance atteinte par
chaque modèle en VD et la force d’association extrinsèque ainsi que l’autocorrélation du
critère comme VIs. Pour mener ces analyses, toutes les formalisations des modèles n’ont
pas été retenues. À l’instar de la première simulation, ce choix est motivé par
l’augmentation des risques d’erreur de type I (c’est-à-dire le rejet erroné de l’hypothèse
nulle) avec l’augmentation du nombre de tests. Ainsi, pour limiter le nombre de tests, seul
un représentant des modèles d’ancrage et ajustement (ANC2) a été retenu. Il s’agit de la
version de l’heuristique qui obtient la meilleure performance de prévision moyenne. De
plus, les deux autres modèles de cette heuristique sont caractérisés par les mêmes sources
d’information que le modèle ANC2. Les trois modèles de limites et vraisemblance ont été
retenus puisqu’ils sont tous caractérisés par des sources d’information distinctes. Le ML1 a
aussi été retenu puisqu’il est le seul représentant du jugement linéaire. Finalement, une
correction Bonferroni a été réalisée pour éviter le gonflement de la probabilité d’erreur de
type I. Le seuil alpha étant fixé à .05 et le nombre de tests effectués étant égal à cinq, le
85
seuil alpha corrigé est égal à .01. Les prémisses de normalité, linéarité et
d’homoscédasticité des résidus ont été vérifiés avec SPSS EXAMINE et SPSS
REGRESSION. Étant donné la valeur extrême de performance du modèle ANC2,
l’observation correspondant à la série temporelle #10 (voir Tableau 8) a été retirée des
analyses. Il en est de même pour l’observation correspondant à la série temporelle #16 du
ML1. Les analyses ont été réalisées avec SPSS REGRESSION. La méthode de sélection
des facteurs se fonde sur un critère d’entrée statistique STEPWISE2. À l’inverse de la
Simulation I, les régressions sur la performance des modèles ANC2, L&V1, L&V2, L&V3
et ML1 indiquent que les R sont tous statistiquement significatifs.
La régression de l’autocorrélation du critère et de la force d’association extrinsèque
sur la performance du modèle ANC2 avec un critère statistique d’entrée inclut les deux
facteurs au sein de l’équation linéaire. Les statistiques relatives à la régression sont
rapportées dans le Tableau 14. Le R est statistiquement significatif F(2,28) = 110.64, p <
.01. Le R2 ajusté de .88 indique qu’environ 88% de la variance de la performance atteinte
par le modèle ANC2 est expliquée par la combinaison linéaire de l’autocorrélation et de la
force d’association extrinsèque. Plus précisément, les coefficients de régression
standardisés indiquent que l’impact de l’autocorrélation du critère sur la performance
( ) du modèle ANC2 est presque six fois plus important que celui de la force
d’association extrinsèque ( ).
Tableau 14
Régression linéaire de l’autocorrélation et de la force d’association extrinsèque sur la
performance du modèle ANC2.
Variable
ANC2
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI) B β
Autocorrélation .929 1.854 .910
Association .267 .122 .415 .156
Origine = -1.15
Moyenne -.06 .45 .62
Écart-type .78 .38 .29 R2 = .888
R2 ajusté = .880
R = .942**
** p < .01
2 Entré à F <= .05, sortie à F >= .10
86
La régression de l’autocorrélation et de la force d’association extrinsèque sur la
performance de L&V1 avec un critère statistique d’entrée incorpore les deux facteurs au
sein de l’équation linéaire. Les statistiques relatives à la régression sont rapportées dans le
Tableau 15. Le R est statistiquement significatif F(2,28) = 79.11, p < .01. Le R2 ajusté de
.84 indique qu’environ 84% de la variance de la performance atteinte par le modèle L&V1
est expliquée par la combinaison linéaire de l’autocorrélation et de la force d’association
extrinsèque. Plus précisément, les coefficients de régression standardisés indiquent que
l’impact de l’autocorrélation sur la performance du modèle L&V1 est environ trois fois
plus important que celui de la force d’association extrinsèque.
Tableau 15
Régression linéaire de l’autocorrélation et de la force d’association extrinsèque sur la
performance du modèle L&V1.
Variable
L&V1
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI) B β
Autocorrélation .878 1.824 .844
Association .385 .122 .800 .283
Origine = -1.439
Moyenne -.13 .45 .62
Écart-type .82 .38 .29 R2 = .850
R2 ajusté = .839
R = .922**
** p < .01
La régression de l’autocorrélation et de la force d’association extrinsèque sur la
performance du modèle L&V2 avec un critère statistique d’entrée inclut les deux facteurs
au sein de l’équation linéaire. Les statistiques relatives à la régression sont rapportées dans
le Tableau 16. Le R est statistiquement significatif F(2,28) = 110.006, p < .01. Le R2 ajusté
de .88 indique qu’environ 88% de la variance de la performance atteinte par le modèle
L&V2 est expliquée par la combinaison linéaire de l’autocorrélation et de la force
d’association extrinsèque. Plus précisément, les coefficients de régression standardisés
indiquent que l’impact de l’autocorrélation sur la performance est presque cinq fois plus
important que celui de la force d’association extrinsèque.
87
Tableau 16
Régression linéaire de l’autocorrélation et de la force d’association extrinsèque sur la
performance du modèle L&V2.
Variable
L&V2
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI) B β
Autocorrélation .924 1.79 .902
Association .293 .122 .469 .183
Origine = -1.192
Moyenne -.11 .45 .62
Écart-type .75 .38 .29 R2 = .887
R2 ajusté = .879
R = .942**
** p < .01
La régression de l’autocorrélation et de la force d’association extrinsèque sur la
performance du modèle L&V3 avec un critère statistique d’entrée inclut seulement le
facteur autocorrélation au sein du modèle final. Les statistiques relatives à la régression
sont rapportées dans le Tableau 17. Le R est statistiquement significatif F(2,29) = 23.876, p
< .01. Le R2
ajusté de .43 indique qu’environ 43% de la variance de la performance atteinte
par le modèle L&V3 est expliquée par l’autocorrélation du critère. Le rejet de la force
d’association extrinsèque comme prédicteur au sein de la régression indique que la
contribution de ce facteur dans l’explication de la variance de la performance du modèle
L&V3 est négligeable.
Tableau 17
Régression linéaire de l’autocorrélation sur la performance du modèle L&V3.
Variable
L&V3
(VD)
Autocorrélation
(SI) (VI)
B β
Autocorrélation .924 1.23 .672
Origine = -.427
Moyenne .12 .45
Écart-type .70 .38 R2 = .452
R2 ajusté = .433
R = .672**
** p < .01
La régression de l’autocorrélation et de la force d’association extrinsèque sur la
performance de ML1 avec un critère statistique d’entrée incorpore les deux facteurs au sein
de l’équation linéaire. Les statistiques relatives à la régression sont rapportées dans le
Tableau 18. Le R est statistiquement significatif F(2,28) = 19.279, p < .01. Le R2 ajusté de
.55 indique qu’environ 55% de la variance de la performance atteinte par le ML1 est
88
expliquée par la combinaison linéaire de l’autocorrélation et de la force d’association
extrinsèque. Plus précisément, les coefficients de régression standardisés indiquent que
l’impact de l’autocorrélation sur la performance de ML1 est environ deux fois plus
important que celui de la force d’association extrinsèque.
Tableau 18
Régression linéaire de l’autocorrélation et de la force d’association extrinsèque sur la
performance de ML1.
Variable
ML1
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI) B β
Autocorrélation 1.337 .663
Association .122 .888 .328
Origine = -1.143
Moyenne -.11 .45 .62
Écart-type .75 .38 .29 R2 = .579
R2 ajusté = .549
R = .761**
** p < .01
Finalement, le Tableau 19 résume les coefficients observés par modèle suite aux
analyses de régression.
Tableau 19
Résumé des coefficients de régression standardisés par source d’information et modèles.
Source ANC2 L&V1 L&V2 L&V3 ML1
Intrinsèque .910 .844 .902 .672 .663
Extrinsèque .156 .283 .183 0 .328
Autres analyses. Afin d’évaluer l’importance relative des sources d’information,
une analyse des coefficients de régression standardisés du ML1 a été réalisée. L’analyse
consiste à comparer la valeur moyenne des coefficients attribués aux indices de source
intrinsèque à ceux de source extrinsèque. La valeur absolue des coefficients est utilisée
puisque le signe ne qualifie pas l’importance d’un coefficient, mais plutôt sa direction. Un
test-t pour échantillons pairés révèle qu’on ne peut pas rejeter l’hypothèse nulle selon
laquelle la moyenne des coefficients standardisés absolus des indices de source intrinsèque
(m = .70, ET = 1.06) est égale à la moyenne des coefficients standardisés absolus des
indices de source extrinsèque (m = .50, ET = .63) t(31) = 1.18, non significatif.
89
Comparativement à la première simulation, les conditions de la deuxième
simulation mènent à des prévisions dissimilaires entre les modèles formalisés.
Globalement, la variété des propriétés qui caractérisent les séries temporelles génère une
plus grande variabilité en termes de prévisions, mais aussi en termes de performance. En
effet, les faibles moyennes de coefficients de corrélation qui estime l’association linéaire
entre les prévisions des modèles indiquent que dans l'ensemble, les prévisions faites par
chacun des modèles sont différentes l’une de l’autre. Ce résultat suggère que les conditions
de simulation permettront de bien discriminer les modèles en termes de performance. Par
contre, étonnamment et contrairement à cette observation générale, les modèles ANC1 et
ANC3 de l'heuristique d'ancrage et ajustement génèrent encore une fois des prévisions
complètement identiques pour l'ensemble des séries temporelles de la présente simulation.
Ce résultat indique que, bien qu’il existe une différence théorique entre ces deux modèles
de l’heuristique d’ancrage et ajustement (voir Andreassen, 1990; Andreassen & Kraus,
1990; Lawrence & O’Connor, 1995) l’approche de modélisation actuelle a du mal, dans les
conditions de la thèse, à discriminer leur comportement. Néanmoins, étant donné que ces
deux versions de modèles représentent l’heuristique d’ancrage et ajustement, elles sont
traitées de façon indifférenciée.
H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans certains
cas supérieur à celle du modèle de jugement linéaire.
En moyenne, la performance observée des modèles lors de cette simulation est
nettement inférieure à celle obtenue lors de la première. Toutefois, malgré la chute de
performance générale observée, les modèles d’heuristiques arrivent encore à mieux
performer que le modèle de jugement linéaire dans la majorité des cas. De plus, tout
comme dans la Simulation 1, l’utilisation d’un modèle unique ne permet pas l’atteinte de la
meilleure performance pour l’ensemble des séries temporelles de la simulation. Ce résultat
constitue un appui important au concept de rationalité écologique et du coffre à outils
cognitif (Gigerenzer & Selten, 2001; Gigerenzer et al., 1999; Strum, 2011).
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
90
Les analyses montrent que dans l’ensemble, la performance des modèles est affectée
par la variation de la qualité des sources d’information. Les niveaux élevés de variance
expliquée par les régressions (généralement autour de 88%) indiquent également que les
facteurs manipulés au sein de la thèse sont critiques pour la prévision des séries
temporelles. Particulièrement, la qualité des indices de source intrinsèque semble être un
facteur clé. En effet, les coefficients des régressions des facteurs sur la performance des
modèles indiquent que pour l’ensemble des stratégies modélisées, la performance est
davantage déterminée par la qualité de la source intrinsèque comparativement à la source
extrinsèque. L’analyse des coefficients du ML1 suggère que cela ne peut pas être
uniquement causé par la plus grande qualité des indices de source intrinsèque relativement
aux indices de source extrinsèque puisque aucune différence statistiquement significative
n’est observée dans la pondération de ceux-ci. Cet effet peut toutefois s’expliquer par le fait
que l’ensemble des stratégies modélisées emploient la source intrinsèque pour fonder leur
prévision.
Des analyses supplémentaires ont été réalisées en combinant les observations des
deux simulations. L’objectif de ces analyses est de vérifier quelles conditions favorisent un
gain de performance des modèles d’heuristique par rapport au modèle de jugement linéaire.
Alors que les données ont jusqu’à présent été analysées dans le but de comprendre
comment les conditions expérimentales font varier la performance des modèles, ces
analyses concernent davantage comment ces conditions les discriminent, c’est-à-dire dans
quelle mesure la variation de la qualité des indices de source intrinsèque et extrinsèque
mène à des patrons de performance distincts entre les modèles. Les données des deux
simulations sont combinées de façon à augmenter la puissance statistique et à pouvoir
comparer directement l’influence des trois facteurs au sein d’une même analyse.
Pour estimer l’impact de la qualité des sources d’information sur le gain de
performance des modèles d’heuristique comparativement au ML1, une série d’analyses de
régression est réalisée sur le gain de performance atteint par chaque modèle d’heuristique
en VD et la force d’association extrinsèque, le nombre d’indices extrinsèques et
l’autocorrélation comme VIs. Pour mener ces analyses, tous les modèles sont retenus à
l’exception du modèle ANC3 qui a un comportement identique à ANC1. Les prémisses de
91
normalité, linéarité et d’homoscédasticité des résidus ont été vérifiés avec SPSS EXAMINE
et SPSS REGRESSION. Les analyses ont été réalisées avec SPSS REGRESSION. La
méthode de sélection des facteurs est ENTER, ce qui force tous les facteurs à être
considérés par le modèle. L’objectif de ce critère d’entrée est de pouvoir comparer les bêtas
de chacun des facteurs, significatif ou non.
Gain de performance ANC1. Les statistiques relatives à la régression de
l’autocorrélation, du nombre d’indices extrinsèques et de la force d’association extrinsèque
sur le gain de performance du modèle ANC1 sont rapportées dans le Tableau 20. Le R est
statistiquement significatif F(3,53) = 5.29, p = .003. Le R2 ajusté de .20 indique qu’environ
20% de la variance du gain de performance atteint par le modèle ANC1 est expliquée par la
combinaison linéaire des trois facteurs. Plus précisément, les coefficients de régression
standardisés indiquent que l’impact de l’autocorrélation sur le gain de performance du
modèle ANC1 est le seul qui est statistiquement significatif (p < .001). Plus
l’autocorrélation est élevée, plus le modèle ANC1 obtient un gain de performance
important comparativement au modèle de jugement linéaire ML1.
Tableau 20
Régression linéaire de l’autocorrélation, du nombre d’indices et de la force d’association
extrinsèque sur le gain de performance du modèle ANC1.
Variable
ANC1
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI)
Nombre
d'indices
(SE) (VI) B β
Autocorrélation .440
.767 .522
Association -.075 .286
-.469 -.214
Nombre d'indices -.078 -.336 -.162
.025 .063
Origine = -.467
Moyenne -.12 .664 .69 6.41
Écart-type .56 .38 .26 1.43 R2 = .241
R2 ajusté = .196
R = .491*
* p = .003
Gain de performance ANC2. Les statistiques relatives à la régression de
l’autocorrélation, du nombre d’indices extrinsèques et de la force d’association extrinsèque
sur le gain de performance du modèle ANC2 sont rapportées dans le Tableau 21. Le R est
92
statistiquement significatif F(3,53) = 3.102, p = .035. Le R2 ajusté de .11 indique
qu’environ 11% de la variance du gain de performance atteint par le modèle ANC2 est
expliquée par la combinaison linéaire des trois facteurs. Plus précisément, les coefficients
de régression standardisés indiquent que l’impact de l’autocorrélation et de la force
d’association sur le gain de performance du modèle ANC2 sont les deux facteurs qui sont
statistiquement significatifs (p =.018 et p = .022 respectivement). À l’instar du modèle
ANC1, plus l’autocorrélation est élevée, plus le modèle ANC2 obtient un gain de
performance important comparativement au modèle de jugement linéaire ML1. De plus,
plus la force d’association extrinsèque est élevée, moins le gain de performance du modèle
ANC2 est élevé.
Tableau 21
Régression linéaire de l’autocorrélation, du nombre d’indices et de la force d’association
extrinsèque sur le gain de performance du modèle ANC2.
Variable
ANC2
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI)
Nombre
d'indices
(SE) (VI) B β
Autocorrélation .223
.463 .348
Association -.237 .286
-.636 -.321
Nombre d'indices .034 -.336 -.162
.035 .099
Origine = -.059
Moyenne .038 .664 .69 6.41
Écart-type .51 .38 .26 1.43 R2 = .157
R2 ajusté = .106
R = .396*
* p = .035
Gain de performance L&V1. Les statistiques relatives à la régression de
l’autocorrélation, du nombre d’indices extrinsèques et de la force d’association extrinsèque
sur le gain de performance de L&V1 sont rapportées dans le Tableau 22. Le R est non-
statistiquement significatif F(3,53) = 1.038, non significatif. Le R2 ajusté de .02 indique que
seulement 2% de la variance du gain de performance atteint par le modèle L&V1 est
expliquée par la combinaison linéaire des trois facteurs. Étant donnée la très faible
proportion de variance expliquée, l’effet d’aucun des facteurs sur le gain de performance du
modèle L&V1 n’est statistiquement significatif.
93
Tableau 22
Régression linéaire de l’autocorrélation, du nombre d’indices et de la force d’association
extrinsèque sur le gain de performance du modèle L&V1.
Variable
L&V1
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI)
Nombre
d'indices
(SE) (VI) B β
Autocorrélation .204
.382 .258
Association -.053 .286
-.258 -.117
Nombre d'indices -.007 -.336 -.162
.024 .061
Origine = -.267
Moyenne -.035 .664 .69 6.41
Écart-type .57 .38 .26 1.43 R2 = .059
R2 ajusté = .002
R = .242
N.S.
Gain de performance L&V2. Les statistiques relatives à la régression de
l’autocorrélation, du nombre d’indices extrinsèques et de la force d’association extrinsèque
sur le gain de performance du modèle L&V2 sont rapportées dans le Tableau 23. Le R est
statistiquement non significatif F(3,53) = 1.117, N.S. Le R2 ajusté de .01 indique que
seulement 1% de la variance du gain de performance atteint par le modèle L&V2 est
expliquée par la combinaison linéaire des trois facteurs. L’effet d’aucun des facteurs sur le
gain de performance du modèle L&V2 n’est statistiquement significatif.
Tableau 23
Régression linéaire de l’autocorrélation, du nombre d’indices et de la force d’association
extrinsèque sur le gain de performance du modèle L&V2.
Variable
L&V2
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI)
Nombre
d'indices
(SE) (VI) B β
Autocorrélation .155
.313. .224
Association -.142 .286
-.417 -.200
Nombre d'indices -.008 -.336 -.162
.013 .034
Origine = -.034
Moyenne -.030 .664 .69 6.41
Écart-type .54 .38 .26 1.43 R2 = .063
R2 ajusté = .007
R = .251
N.S.
94
Gain de performance L&V3. Les statistiques relatives à la régression de
l’autocorrélation, du nombre d’indices extrinsèques et de la force d’association extrinsèque
sur le gain de performance du modèle L&V3 sont rapportées dans le Tableau 24. Le R est
statistiquement significatif F(3,53) = 3.176, p = .032. Le R2 ajusté de .11 indique
qu’environ 11% de la variance du gain de performance atteint par le modèle L&V3 est
expliquée par la combinaison linéaire des trois facteurs. L’analyse par facteur indique que
seule la force d’association extrinsèque est significativement associée au gain de
performance du modèle L&V3 (p = .007). En effet, plus la force d’association extrinsèque
est élevée, moins le gain de performance du modèle L&V3 est élevé.
Tableau 24
Régression linéaire de l’autocorrélation, du nombre d’indices et de la force d’association
extrinsèque sur le gain de performance du modèle L&V3.
Variable
L&V3
(VD)
Autocorrélation
(SI) (VI)
Association
(SE) (VI)
Nombre
d'indices
(SE) (VI) B β
Autocorrélation -.148
-.043 -.025
Association -.397 .286
-.971 -.383
Nombre d'indices .111 -.336 -.162
.019 .041
Origine = .716
Moyenne .140 .664 .69 6.41
Écart-type .66 .38 .26 1.43 R2 = .160
R2 ajusté = .110
R = .400*
* p = .032
DISCUSSION
Alors que des résultats antérieurs ont déjà démontré que certaines heuristiques
permettaient l’atteinte de performances au moins équivalentes au jugement linéaire (par
exemple, Borges et al., 1999; Bolger & Harvey, 1993; Boyd, 2001; Lawrence & O’Connor,
1995; Ying Luo, 2013), les conditions qui favorisaient ce phénomène demeuraient floues et
sans cadre interprétatif clair (Todd & Gigerenzer, 2007), particulièrement dans un contexte
de prévision de séries temporelles. Les analyses présentées dans cette section permettent
d’estimer l’effet des facteurs manipulés (autocorrélation du critère, nombre d’indices
extrinsèques et force d’association extrinsèque) sur le gain de performance des modèles
95
d’heuristiques par rapport au modèle de jugement linéaire. L’analyse de la signification
statistique des régressions soulève que seul le gain de performance de trois modèles
d’heuristiques semble modulé de façon significative par la combinaison linéaire des trois
facteurs. Ces trois modèles sont ANC1, ANC2 et L&V3. Pour ces modèles, la proportion
de variance expliquée du gain de performance par les trois facteurs manipulés varie entre
10% et 20%. Cela ne signifie pas que les autres modèles ne représentent pas des stratégies
potentiellement meilleures que le jugement linéaire, mais seulement que les conditions sous
lesquelles le gain de performance varie ne sont pas manipulées dans le contexte de la
présente thèse.
L’analyse des facteurs mène à plusieurs observations intéressantes. En premier lieu,
l’effet du nombre d’indices extrinsèques sur le gain de performance des modèles
d’heuristiques n’est jamais significatif. Cette observation indique que sous les conditions de
la thèse, le nombre d’indices extrinsèques n’était pas un facteur discriminant de
performance entre les heuristiques et le jugement linéaire. Ce résultat est particulièrement
intéressant puisqu’il a été démontré dans d’autres contextes que l’augmentation du nombre
d’indices menait à un abandon d’une règle de jugement linéaire par les participants
(Hogarth & Karelaia, 2008). Puisque le nombre d’indices ne serait pas lié à un gain de
performance par rapport au jugement linéaire, cela indique que la cause de l’abandon du
modèle linéaire, selon un cadre d’interprétation coûts/bénéfices (voir Beach & Mitchell,
1978; Christensen-Szalanski, 1978; Payne et al., 1988, 1993; Smith & Walker, 1993), serait
probablement davantage liée aux coûts en termes d’efforts cognitifs qu’aux bénéfices en
termes de gain de performance. Les résultats observés dans la présente thèse sont donc
cohérants avec l’interprétation généralement avancée dans la littérature. Étant donné que le
modèle de jugement linéaire a la capacité d’intégrer des informations provenant d’une
multitude d’indices extrinsèques et que la majorité des heuristiques ne le pouvaient pas,
cela indique que le modèle de jugement linéaire ne bénéficiait pas de cet « avantage » sous
les conditions de la thèse. Cette observation s’explique probablement par le fait que la
validité des indices extrinsèques n’est aucunement associée à leur quantité. En effet, ce
n’est pas parce que le nombre d’indices augmente que leur validité est meilleure.
96
Une seconde observation en lien avec les facteurs expérimentaux montre que la
force d’association extrinsèque (directement associée à la validité des indices extrinsèques)
est négativement associée au gain de performance des modèles d’heuristique pour
l’ensemble des régressions exécutées (qu’elles soient significatives ou non). Ces résultats
suggèrent que le modèle de jugement linéaire est avantagé comparativement à l’ensemble
des modèles d’heuristiques lorsque les indices extrinsèques augmentent en validité.
Conformément à l’hypothèse H1a, cela n’est pas une surprise par rapport à l’heuristique
d’ancrage et ajustement (Lawrence & O’Connor, 1995; Bolger & Harvey, 1993) et,
conformément à l’hypothèse H1b, au modèle L&V1 (Becker & Leopold-Wildburger, 1996)
de limites et vraisemblance, car ces derniers n’utilisent aucunement les indices de sources
extrinsèques pour faire leurs prévisions. Cela est par contre plus surprenant, et en
opposition avec l’hypothèse H1c, en ce qui concerne les modèles L&V2 et L&V3 de
limites et vraisemblance puisque ces derniers ont également la capacité d’utiliser les indices
de source extrinsèque pour faire leurs prévisions (Becker et al., 2005; 2007). Toutefois, la
nature de la pondération des indices est distincte entre l’heuristique de limites et
vraisemblance et le modèle de jugement linéaire. Il est donc possible que la pondération
linéaire de ML1 soit plus efficace, menant ainsi à une augmentation de la performance
comparativement à L&V2 et L&V3. Une autre explication plausible de ce résultat est
l’utilisation d’indices « extraits » des séries temporelles par L&V2 et L&V3 plutôt que
l’utilisation des valeurs explicites de ces séries comme le fait ML1 (Tucker, 1964). En
effet, il est possible que la force d’association extrinsèque des séries temporelles ne soit pas
liée à la validité des indices extraits par l’heuristique de limites et vraisemblance.
Davantage d’études variant systématiquement la validité des indices extraits et explicites
seraient nécessaires afin de vérifier si cette explication est bonne.
En ce qui concerne l’autocorrélation du critère, conformément à l’hypothèse H1a,
les résultats suggèrent que le gain de performance des deux modèles d’ancrage et
ajustement sont significativement affectés par celle-ci. En effet, plus le critère est
autocorrélé, plus le gain de performance des modèles ANC1 et ANC2 est élevé. Cette
observation n’est pas complètement surprenante puisque l’heuristique d’ancrage et
ajustement mise uniquement sur la source d’information intrinsèque pour faire ses
prévisions. Toutefois, le modèle de jugement linéaire utilise également cette source
97
d’information. Ainsi, l’avantage conféré par une autocorrélation élevée à l’heuristique
d’ancrage et ajustement comparativement au modèle de jugement linéaire n’est pas si
évident a priori. Une explication possible de ce résultat réside donc dans la nature de
l’utilisation des indices intrinsèques. En effet, l’heuristique d’ancrage et ajustement telle
que décrite par Lawrence et O’Connor (1995) ainsi que Bolger et Harvey (1993) utilise la
dernière valeur observée pour réaliser sa prévision. Inversement, le modèle de jugement
linéaire base son estimation sur l’ensemble des données observées jusqu’à présent (Tucker,
1964). Dans le contexte de la thèse, la manipulation de l’autocorrélation concerne
précisément la corrélation du critère avec lui-même sur la dernière valeur observée et non
pas l’ensemble des valeurs passées. Ce résultat sera davantage discuté dans les sections
subséquentes.
Globalement, ces résultats empiriques indiquent que les normes de la rationalité ne
devraient pas être valides indépendamment du contexte dans lequel elles sont appliquées
(Sturm, 2012). Particulièrement, ils montrent que la qualité des indices intrinsèques et la
qualité des indices extrinsèques (Harvey, 2007) permettent en partie de décrire le contexte
dans lequel certaines heuristiques sont adaptées pour la prévision de séries temporelles. Par
contre, la proportion de variance expliquée demeure somme toute assez faible (entre 10% et
20%) pour les modèles significatifs et l’origine du gain de performance de plusieurs
modèles d’heuristiques demeure inexpliquée. Cela suggère que davantage d’études sont
nécessaires pour mieux cartographier les conditions qui favorisent une bonne performance
des heuristiques comparativement au modèle de jugement linéaire.
Discussion du Chapitre II
L’objectif de ce chapitre était de développer et simuler des stratégies cognitives de
prévision de séries temporelles dans le but de comparer leur performance sous différentes
conditions. Cette méthode est similaire à celle employée par plusieurs auteurs qui cherchent
à comparer différents modèles de jugement et de prise de décision (Bergert & Nosofsky,
2007; Bolger & Harvey, 1993; Shanteau & Thomas, 2000). Les stratégies modélisées
appartenaient à deux classes distinctes : c’est-à-dire les heuristiques et le jugement linéaire.
Ces deux classes ont dominé la recherche sur le jugement et la prise de décision pour
98
plusieurs décennies (Karelaia & Hogarth, 2008). Les heuristiques étudiées étaient celles
d’ancrage et ajustement (par exemple, Goodwin & Wright, 1994; Harvey, 2007; Lawrence
et al., 2006; Lawrence & O’Connor, 1995; Reimers & Harvey, 2011) et limites et
vraisemblance (par exemple, Becker & Leopold-Wildburger, 1996; Becker et al., 2007). Le
modèle de jugement linéaire était le modèle lentille (ML; Anderson, 1981; Brehmer, 1994;
Hammond, 1996). Finalement, les conditions évaluées concernaient la qualité de sources
d’information, c’est-à-dire la source intrinsèque et la source extrinsèque (Harvey, 2007).
H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans certains
cas supérieure à celle du modèle de jugement linéaire.
Les résultats obtenus dans les deux simulations appuient l’hypothèse H1. La
démonstration de l’atteinte de performance supérieure par les heuristiques, particulièrement
les heuristiques non compensatoires, comparativement au modèle linéaire normatif jouissait
déjà d’un certain niveau d’appuis empiriques (Gigerenzer & Goldstein, 1996). Toutefois,
certains auteurs critiquaient le caractère idiosyncratique de la démonstration et souhaitaient
une évaluation plus systématique de la performance des modèles de jugement (Bröder,
2003; Lipshitz, 2000). Entre autres, la prévision de séries temporelles constitue une tâche
pour laquelle la démonstration était toujours fragmentaire (par exemple, Becker et al.,
2000; 2004; 2007) et qui demande davantage d’exploration (Harvey, 2007). Les résultats
obtenus dans les deux simulations montrent que tous les modèles d’heuristiques ont la
capacité de mieux performer que le modèle de jugement linéaire. Comparativement à
Becker et ses collègues (2000; 2004; 2007), la présente étude le démontre au-delà de
l’heuristique de limites et vraisemblance, en incluant également l’heuristique d’ancrage et
ajustement, et permet de généraliser à une grande variété de séries temporelles. Cette
observation constitue un appui empirique supplémentaire de la capacité des heuristiques à
bien performer comparativement au jugement linéaire.
O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la
performance des différentes stratégies modélisées.
Au-delà de cette démonstration, une observation critique associée aux deux
simulations est qu’aucune stratégie unique (linéaire ou heuristique) n’est la plus
99
performante pour la prévision de l’ensemble des séries temporelles. Ce résultat est
fondamental puisqu’il démontre que le modèle de jugement linéaire ne représente pas une
norme absolue de jugement optimal dans ce contexte et que l’utilisation de plusieurs
stratégies, et donc la nécessité d’adapter ses stratégies, est critique pour l’atteinte de
performance optimale. Le principe du coffre à outils cognitif suggère que la force des
heuristiques repose sur l’aspect varié, modulaire et simple de ces stratégies, qui peuvent
être utilisées dans différents contextes de manière adaptée, individuellement ou en
combinaison (Gigerenzer & Selten, 2001; Gigerenzer et al., 1999). Les simulations
effectuées dans la présente thèse démontrent la possibilité et la force potentielle d’une telle
approche dans un contexte de prévision de séries temporelles complexes. Alors que les
travaux antérieurs dans ce contexte démontraient bien que certaines heuristiques
permettaient l’atteinte de performances respectables (par exemple, Becker et al., 2000;
2004; 2007), il s’agit de la première démonstration de la pertinence d’un coffre à outil
cognitif dans ce contexte.
Comme le mentionnent Rieskamp et Otto (2006), l’utilisation de plusieurs stratégies
de manière adaptée requiert toutefois un mécanisme de sélection de stratégie.
Essentiellement, les modèles associés à ce mécanisme proposent que les stratégies soient
sélectionnées sur la base d’un compromis entre les coûts (c’est-à-dire, l’effort cognitif
requis pour le traitement de l’information) et les bénéfices (c’est-à-dire, la performance
atteinte par la stratégie) (Payne et al., 1993; Rieskamp & Otto, 2006; Smith & Walker,
1993). L’étude de la performance des stratégies de jugement en lien avec les
caractéristiques des séries temporelles est donc d’une importance capitale pour comprendre
la sélection des stratégies dans ce contexte (Dieckmann & Rieskamp, 2007; Rieskamp &
Otto, 2006; Rieskamp & Reimer, 2007). Les simulations effectuées dans le cadre de la
thèse visaient donc à étudier le rôle de deux facteurs critiques pour la performance des
stratégies, c’est-à-dire la qualité des sources d’information intrinsèque et extrinsèque
(Harvey, 2007).
La première simulation donne toutefois très peu d’indices sur la nature des
conditions susceptibles d’affecter la performance des stratégies utilisées. En effet, il semble
que la qualité de la source extrinsèque (manipulée au sein de la première simulation)
100
n’affecte pas la performance des stratégies malgré l’importance présumée de cette source
dans l’utilisation de certaines heuristiques (Harvey, 2007). De plus, l’ensemble des
stratégies arrivent à très bien prédire l’évolution des séries temporelles. Cela s’expliquerait
notamment par le caractère compensatoire de certaines stratégies. Une stratégie est
compensatoire lorsqu’un jugement basé sur un indice peut être fait à l’aide d’un autre
indice sans perte de performance. À l’inverse une stratégie non compensatoire ne peut pas
utiliser un autre indice sans diminuer sa performance (Elrod et al., 2005; Payne et al.,
1993). Ainsi dans le contexte de la première simulation, toutes les stratégies non
compensatoires utilisaient seulement les indices intrinsèques et toutes les stratégies
compensatoires ont également la capacité de les utiliser. Conséquemment, puisque toutes
les stratégies ont la capacité d’utiliser les indices intrinsèques, la variation de la qualité des
indices de la source extrinsèque n’a pas eu d’impact sur leur performance. Les
performances des modèles étaient donc toutes très élevées.
La manipulation de la qualité des deux sources d’information lors de la deuxième
simulation permet d’appuyer davantage cette interprétation puisqu’elle mène à des
variations de performance pour l’ensemble des stratégies modélisées. Particulièrement, les
coefficients des régressions sur la performance des modèles de la deuxième simulation
suggèrent que la performance des stratégies non compensatoires sera fortement dégradée
avec la diminution de la qualité de la source intrinsèque alors que celle des stratégies
compensatoires le sera moins, ce qui est cohérent.
Considérées ensemble, les simulations 1 et 2 indiquent que des heuristiques simples
surpassent fréquemment un modèle complexe de jugement linéaire. Certains pourraient
argumenter que les heuristiques y arrivent parce que les séries temporelles à prédire sont
simples. Toutefois, la qualité générale relativement faible des prévisions, particulièrement
au sein de la deuxième simulation, indique que ce n’est pas le cas. Il est possible toutefois
que le modèle de jugement linéaire jouisse d’une moins grande flexibilité que les
heuristiques, ce qui le pénaliserait par rapport à ces dernières. En effet, le modèle de
jugement linéaire utilise l’ensemble des observations passées pour estimer une association
linéaire entre un indice et un critère. Les heuristiques, quant à elles, n’utilisent qu’un sous-
ensemble des données. Ainsi, si la relation entre les indices et le critère change dans le
101
temps, la règle de jugement linéaire verra la précision de ses prévisions diminuées
(Clements & Hendry, 2002; Lewis, 1989; Stekler, 2007). À l’inverse, la performance des
heuristiques n’en sera pas affectée. Dans un environnement dynamique complexe tel que
ceux étudiés dans la thèse, ces changements dans la nature de la relation entre les variables
sont fréquents (Seifert & Hadida, 2013), ainsi le caractère flexible des heuristiques
pourraient permettre l’atteinte de performance surpassant celle du modèle de jugement
linéaire. Certains auteurs mentionnent d’ailleurs que des modifications dans la nature des
relations entre les variables pourraient négativement affecter la performance de modèles
normatifs (Lewis, 1989; Stekler, 2007). Le jugement linéaire suppose également que la
relation entre les indices et critères est bien représentée par une droite monotone linéaire.
Toutefois, comme certains auteurs le mentionnent, cette prémisse constitue une contrainte
souvent non nécessaire (Dougherty & Thomas, 2012). En effet, selon ces auteurs,
l’utilisation de modèles plus simples, abandonnant la prémisse de linéarité et ne conservant
que celle de monotonie, permet généralement un jugement plus robuste au sein
d’environnement hautement non linéaire.
Au-delà de la performance des stratégies, les résultats des simulations ont permis
d’étudier quelles conditions favorisent un gain de performance des modèles d’heuristiques
par rapport au modèle de jugement linéaire. Ces analyses démontrent que de manière
générale, la force d’association extrinsèque serait négativement associée au gain de
performance des heuristiques alors qu’à l’inverse, l’autocorrélation serait positivement
associée au gain de performance de certaines heuristiques. Le nombre d’indices
extrinsèques, quant à lui, ne serait pas un facteur déterminant du gain de performance des
heuristiques modélisées dans le contexte de la thèse. Les raisons qui expliquent ces gains
sont toutefois plus nébuleuses. Deux explications complémentaires nécessiteraient
davantage de recherches. Premièrement, la nature des indices pourraient potentiellement
expliquer une partie des résultats observés. En effet, certains indices sont explicitement
disponibles dans l’environnement alors que d’autres sont extraits, c’est-à-dire qu’ils
résultent d’une transformation quelconque de l’information (par exemple, la tendance de la
série temporelle doit être extraite de la combinaison des observations individuelles). Les
effets différentiels observés entre les modèles utilisant des indices extraits par rapport à
ceux utilisant des indices explicites portent à croire que ce facteur pourrait avoir un impact
102
sur le gain de performance. Deuxièmement, la nature de l’utilisation des indices pourrait
aussi expliquer une partie des résultats. C’est le cas, par exemple, du modèle L&V3 qui est
négativement associé à la force d’association extrinsèque. Ce résultat est étonnant puisque
ce modèle a techniquement la capacité d’intégrer des informations d’origine extrinsèque
pour réaliser ses prévisions, tout comme le modèle linéaire. Par contre, la nature de
l’intégration des indices entre les deux stratégies est différente et pourrait expliquer l’effet
observé.
Certaines limites associées aux simulations présentées doivent toutefois nuancer
l’interprétation des résultats. Une limite potentielle est le caractère artificiel des séries
temporelles étudiées. Il est vrai que les séries temporelles utilisées ne visent pas à
reproduire les caractéristiques des séries temporelles « naturelles ». Ces dernières sont en
effet caractérisées, en moyenne, par certaines propriétés telles qu’une légère pente positive
et un niveau modéré d’autocorrélation (Harvey, 2007). Toutefois, l’objectif de la présente
thèse est de varier systématiquement certaines propriétés des séries temporelles pour
comprendre leur impact sur la performance des stratégies. Elle ne s’intéresse pas en soi
directement à la performance des stratégies. En d’autres mots, la thèse ne cherche pas à
évaluer si les stratégies sont performantes de façon absolue, mais plutôt de façon relative
par rapport au modèle de jugement linéaire.
Une autre limite concerne les choix dans la formalisation des stratégies. En effet,
plusieurs paramètres sont sujets à interprétation lors de la formalisation des stratégies de
jugement. C’est le cas, par exemple, de la stratégie d’ancrage et ajustement. Bien que le
concept d’ancrage et ajustement soit bien défini, son opérationnalisation peut susciter des
choix qui peuvent sembler arbitraires. Quelle est la référence utilisée pour constituer
l’ancre? Comment évaluer la valeur et la direction de l’ajustement? Pour mitiger cette
limite, plusieurs versions de chaque heuristique ont été formalisées. De plus, ces versions
sont calquées de la littérature et bénéficient d’appuis empiriques (voir Anderson, 1981;
Becker & Leopold-Wildburger, 1996; Becker et al., 2007; Brehmer, 1994; Goodwin &
Wright, 1994; Hammond, 1996; Harvey, 2007; Lawrence et al., 2006; Lawrence &
O’Connor, 1995; Reimers & Harvey, 2011).
103
En conclusion, malgré certaines limites, les résultats des simulations permettent de
se prononcer quant à la possibilité d’une approche écologique de la rationalité. Ils
démontrent que le choix adapté de stratégies de jugement cognitivement raisonnables dans
un contexte de prévision de séries temporelles (l’utilisation de la plupart de ces stratégies
par des humains a été démontrée lors d’études antérieures) peut théoriquement mener à une
performance supérieure à celle du modèle linéaire normatif. Les analyses révèlent
également une partie des facteurs responsables du gain de performance de certaines
heuristiques par rapport au jugement linéaire. C’est le cas notamment de l’autocorrélation
de la série temporelle critère et de la force d’association extrinsèque. Les résultats
soulignent aussi que le nombre d’indices extrinsèques ne serait pas un facteur critique dans
la différenciation des modèles, malgré que ce facteur soit typiquement associé à la sélection
ou l’abandon d’une règle de jugement linéaire chez les individus faisant des tâches de
prévision. Toutefois, bien que les simulations réalisées dans ce chapitre démontrent la
plausibilité de l’approche de rationalité écologique, elle ne démontre en rien l’adoption de
cette approche par les individus. Le Chapitre III étudie donc dans quelle mesure les
humains adhèrent à une rationalité écologique.
105
CHAPITRE III
PREVISION DE SÉRIES TEMPORELLES : HUMAIN, STRATÉGIE
ET ENVIRONNEMENT
106
Le principe de rationalité écologique postule notamment que les individus adaptent
leur stratégie en fonction du contexte environnemental, et que cette adaptation permet
l’atteinte de performance supérieure à celle qui serait obtenue s’ils appliquaient le modèle
normatif rationnel (Dieckmann & Rieskamp, 2007; Rieskamp & Otto, 2006; Rieskamp &
Reimer, 2007). Ce phénomène manque toutefois d’appuis empiriques, particulièrement
dans un contexte de prévision de séries temporelles, et demeure ainsi spéculatif (Bröder,
2003; Harvey, 2007). Premièrement, aucune étude ne montre un changement de stratégie
du même participant en fonction des caractéristiques des séries temporelles à prédire. Bien
qu’il ait été démontré dans différentes études que les individus se comportent comme s’ils
utilisaient une stratégie d’ancrage et ajustement (Andreassen, 1990; Andreassen & Kraus,
1990; Harvey, 1988; Lawrence & O’Connor, 1992) ou celle de limites et vraisemblance
(Becker & Leopold-Wildburger, 1996; Becker et al., 2007) ou de jugement linéaire
(Bisantz et al., 2000), aucune étude n’a permis de comparer directement la représentativité
de ces stratégies par rapport au comportement humain. Pourtant, les chercheurs soulignent
l’aspect crucial de la comparaison de plusieurs modèles de stratégies pour l’étude du
comportement humain dans ce contexte (Bröder, 2003; Gigerenzer & Gaissmaier, 2011).
Une telle comparaison nécessiterait également un devis expérimental intra-participant
(Bröder, 2003; Payne et al., 1988). Deuxièmement, la démonstration computationnelle de la
plausibilité de la rationalité écologique réalisée dans certaines études (par exemple, Becker
& Leopold-Wildburger, 1996; présente thèse, Chapitre II) ne signifie pas que les humains y
adhèrent (Bröder, 2003). Ainsi, deux lacunes actuelles en lien avec la rationalité écologique
dans un contexte de prévision de séries temporelles subsistent : c’est-à-dire (1) l’absence de
démonstration d’un changement de stratégie des individus et (2) l’absence de
démonstration que ce changement est adapté. L’objectif de ce chapitre est directement en
lien avec la correction de ces lacunes : il vise à identifier si les individus changent de
stratégie de manière adaptée.
Malgré l’absence de preuves d’une transition entre deux stratégies, plusieurs études
ont toutefois démontré que l’adoption d’une stratégie particulière est favorisée par certaines
conditions environnementales : c’est le cas, par exemple, (1) du nombre d’indices présent
dans la situation (Karelaia & Hogarth, 2008), (2) de la force de l’autocorrélation des séries
temporelles à prédire (Bolger & Harvey, 1993; Lawrence et al., 2006) et (3) de la qualité
107
des indices externes à la série critère (Harvey, 1995; Harvey et al., 1997; Lim & O’Connor,
1996).
Le nombre d’indices est critique dans l’étude des situations complexes et
dynamiques. Bien qu’il ne soit pas proportionnellement associé à la complexité d’une
situation (Funke, 1988), plusieurs auteurs indiquent qu’un nombre d’indices élevé constitue
une caractéristique clé des situations complexes (Gonzalez et al., 2005). En effet, ces
situations sont caractérisées par une quantité importante d’information pertinente ou non
pertinente souvent tenue responsable d’une partie des difficultés vécues par les individus en
charge de leur contrôle ou de leur prévision (voir Brehmer, 1992; Osman, 2010; Sterman,
2006). Cela est généralement interprété à la lumière des limitations cognitives
fondamentales en termes de capacité de traitement de l’information et de limites en
mémoire active (Payne et al., 1993). Particulièrement, le nombre d’indices extrinsèques est
un facteur connu pour avoir un impact sur l’abandon d’un jugement linéaire. En effet, au-
delà de trois variables à considérer comme indices lors d’un jugement, les individus
semblent avoir beaucoup de difficulté à appliquer une règle de jugement linéaire (Karelaia
& Hogarth, 2008). Toutefois, bien que le nombre d’indices soit un facteur connu dans
l’étude des situations complexes dynamiques de façon générale, l’effet de ce facteur n’a pas
été étudié dans un contexte précis de prévision de séries temporelles, particulièrement
concernant son impact sur la sélection de stratégie de prévision.
À l’inverse, l’autocorrélation de la série critère est un facteur fréquemment étudié au
sein du paradigme de prévision de série temporelle. L’autocorrélation réfère à la validité de
la valeur actuelle d’une variable dans la prévision de sa propre valeur future. Contrairement
au nombre d’indices, l’autocorrélation du critère n’est pas directement étudiée au sein
d’autres tâches de prise de décision complexe dynamique. Toutefois, ce dernier peut
raisonnablement être associé à un facteur connexe, c’est-à-dire la complexité dynamique
d’une situation (Diehl & Sterman, 1995; Gonzalez et al., 2005; Sterman, 1994). La
complexité dynamique réfère à l’occurrence de patrons dynamiques non linéaires qui
émergeraient en raison de délais d’influence entre les variables de la situation, qui
limiteraient l’apprentissage et qui rendraient le contrôle de ces situations difficile. Pour
toutes ces raisons, la complexité dynamique est reconnue comme étant un facteur de très
108
grande importance influençant la cognition au sein des situations complexes (Cronin,
Gonzalez, & Sterman, 2009). Au sein des séries temporelles, la présence de patron
d’évolution non linéaire sera caractérisée par une faible autocorrélation des variables, c’est-
à-dire que la valeur actuelle d’une variable ne sera pas un indice valable pour la prévision
de sa valeur future. Dans ce contexte, l’autocorrélation serait un facteur critique entre autres
dans l’adoption de l’heuristique d’ancrage et ajustement (Lawrence et al., 2006). En effet,
plusieurs études observent que les individus qui doivent prédire l’évolution d’une série
temporelle fortement auto corrélée ont tendance à adopter une heuristique d’ancrage et
ajustement (Andreassen & Kraus, 1990; Lawrence & O’Connor, 1992; 1995; Reimers &
Harvey, 2011). De plus, Bolger et Harvey (1993) observent que la version précise de
l’heuristique d’ancrage et ajustement employée est différente en fonction de la force de
l’autocorrélation, ce qui suggère que ce facteur est déterminant dans le choix des stratégies
employées.
La qualité des indices externes réfère à l’utilité des indices pour prédire le critère.
Les études démontrent que la manipulation de la qualité des indices a un impact significatif
sur la performance aux tâches réalisées au sein de situations complexes et dynamiques. Un
de ces facteurs associé à la qualité des indices extrinsèque est la nature des relations entre
les variables d’une situation (Gonzalez et al., 2005). En effet, plusieurs études démontrent
que les relations d’influences non linéaires entre les variables d’une situation,
particulièrement lorsque ces relations sont non monotones, nuisent à la qualité de la
représentation qu’en ont les individus et au contrôle qu’ils peuvent exercer sur cette
dernière (par exemple, Funke, 1988; Karelaia & Hogarth, 2008). Les études démontrent
aussi que la manipulation de la qualité des indices a un impact sur la performance à la tâche
de prévision de séries temporelles (par exemple, Lim & O’Connor, 1996; Chapitre II de la
présente thèse) et sur l’adoption d’heuristiques simplificatrices (par exemple, Bröder &
Schiffer 2003, 2006; Harvey, 1995; Harvey et al., 1997; Lim & O’Connor, 1996). De plus,
bien que les individus semblent sous-échantillonner les indices peu importe leur qualité, il
semble que, dans un contexte de prévision de séries temporelles, le sous-échantillonnage
soit exacerbé lorsque la qualité des indices est faible (Lim & O’Connor, 1996).
109
Ces facteurs sont associés aux sources d’information utilisées lors de prévision de
séries temporelles (Harvey, 2007). Le nombre d’indices est associé à la source extrinsèque
d’information puisqu’il concerne l’utilisation d’autres séries temporelles pour prédire le
critère. La qualité des indices externes est associée à la source extrinsèque d’information
puisqu’elle concerne l’utilité d’autres séries temporelles pour prédire le critère. Finalement,
l’autocorrélation de la série critère est associée à la source intrinsèque d’information
puisqu’elle concerne directement le critère. Étant donné que les modèles d’heuristiques et
de jugement linéaire sont basés sur des sources d’information distinctes (unique ou en
combinaison), leur performance est susceptible de varier différemment en fonction de la
qualité de ces dernières. Cela a d’ailleurs été démontré lors du précédent chapitre. Les
facteurs associés à la qualité de l’information des sources intrinsèques et extrinsèques,
c’est-à-dire force d’autocorrélation du critère, force d’association extrinsèque et nombre
d’indices, affecteraient ainsi à la fois la performance relative des stratégies de prévision de
séries temporelles (heuristiques et jugement linéaire) et leur adoption (par exemple,
Lawrence et al., 2006; Reimers & Harvey, 2011). Aucune étude ne permet toutefois de dire
que le changement de stratégie sous des conditions spécifiques concorde avec l’adoption de
la stratégie la plus performante sous ces mêmes conditions.
Objectif
Le présent chapitre étudie le comportement humain dans l’adoption de stratégies
cognitives, heuristiques ou jugement linéaire, pour la prévision de séries temporelles
complexes sous des conditions variées de qualité d’information. Précisément, l’objectif du
présent chapitre est d’explorer si dans certains contextes, les individus utilisent des
stratégies simplificatrices de manière adaptées, menant à des performances au moins
équivalentes au modèle de jugement linéaire. Conformément à la position de l’auteur, trois
hypothèses seront testées:
H2 : La performance des participants à la tâche de prévision sera supérieure à
celle atteinte par le modèle de jugement linéaire.
110
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle
donnée variera significativement en fonction des caractéristiques de la tâche de
prévision.
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif
du comportement d’un participant correspond au modèle le plus performant) sera
supérieure au hasard.
Méthode Générale
Pour tester ces hypothèses, des participants humains ont réalisé une tâche simulée
de prévision de séries temporelles. Cette tâche est implémentée au sein d’un micromonde
dont le but est de reproduire les caractéristiques essentielles des séries temporelles en
laboratoire tout en permettant un niveau élevé de contrôle expérimental ainsi qu’une
collecte de données objective (Gonzalez et al., 2005). Les séries temporelles sont variées en
termes de qualité de source extrinsèque et de source intrinsèque d’information. Ces
manipulations sont réalisées puisque ces facteurs ont démontré leur capacité à moduler la
stratégie employée pour la prévision de séries temporelles et pour leur impact sur la
performance des stratégies modélisées en plus d’être particulièrement pertinentes pour
l’étude de la cognition en situations complexes et dynamiques de façon générale.
MATÉRIEL
Les participants réalisent la tâche à l’aide de CODEM, une plateforme
expérimentale destinée à étudier le comportement humain dans la prise de décision en
situation dynamique complexe (Lafond & DuCharme, 2011). Il s’agit d’un programme en
langage Java qui est exécuté sur un poste informatique dont le système d’exploitation est
Windows 7 édition 64-bits. Le poste est muni d’un écran ACL en format 4:3 de 22 pouces,
d’un clavier et d’une souris d’ordinateur.
TÂCHE
La tâche des participants consiste à prédire la valeur numérique d’un ensemble de
critères (4 ou 8 séries temporelles, dépendamment de la condition expérimentale en cours)
111
pour la période suivante t+1. Il s’agit de la même tâche que celle réalisée par les modèles
formalisés au chapitre précédent. C’est-à-dire que les participants humains disposent
exactement des mêmes informations que les modèles pour faire leurs prévisions et que les
séries temporelles à prédire sont exactement les mêmes. Les participants qui complètent la
tâche ont pour consigne de minimiser l’écart entre la valeur prédite et la valeur réelle. Pour
y arriver, les participants ont accès à l’ensemble des valeurs passées et actuelles de toutes
les variables. Pour éviter l’influence potentielle de connaissance a priori sur les jugements
des participants, les noms de variables n’ont aucune sémantique associée. Bien qu’il est
connu que la pression temporelle peut avoir un impact sur l’adoption de stratégie de
jugement (Hilbig et al., 2012; Pachur & Hertwig, 2006; Pachur et al., 2009), la présente
tâche exclut ce facteur pour se concentrer uniquement sur ceux mentionnés précédemment.
L’information est présentée aux participants sous la forme d’une gauge et sous forme
numérique (voir Figure 28). Les valeurs présentées aux participants ne comportent pas
d’incertitude, c’est-à-dire que les participants ont accès à une information juste et précise
sur la valeur actuelle et les valeurs passées de toutes les variables de la situation.
Les prévisions sont inscrites par les participants sous forme numérique dans l’onglet
« Prédiction » (Figure 29). Cet onglet affiche la valeur actuelle de toutes les variables et
permet aux participants d’entrer numériquement chacune de leur prévision. Une fois toutes
les prévisions faites, les participants ont la possibilité de passer à la période suivante en
cliquant sur « Done ». Tant que les participants n’ont pas cliqué sur « Done » il leur est
toujours possible de consulter l’onglet « Situation » et de changer les valeurs de leurs
prévisions.
112
Figure 28. Interface de CODEM. L’onglet « Situation » permet aux participants d’accéder aux informations
relatives aux valeurs actuelles et passées de toutes les variables de la situation. Ces valeurs sont présentées
sous forme graphique et numérique. Pour consulter les valeurs passées, les participants doivent glisser la
poignée située au bas à droite de l’interface vers la gauche.
Figure 29. Interface de CODEM. L’onglet « Prédiction » permet aux participants d’entrer la valeur numérique
de leurs prévisions ainsi que d’indiquer leur niveau de confiance moyen pour la période actuelle sur une
échelle de 1 à 5.
113
Une fois les prévisions entrées, au moment où les participants appuient sur
« Done », deux fenêtres de rétroaction sont affichées (Figure 30). Ces fenêtres indiquent
l’évolution de la série temporelle et l’erreur de la dernière prévision. Une fois la rétroaction
consultée, le participant procède à la période suivante. La simulation dure 41 périodes, mais
le participant n’émet des prédictions que pour 40 puisqu’il ne doit pas en fournir pour le
premier tour. Finalement, les participants devaient fournir un niveau de confiance envers la
précision de leurs prévisions à chaque tour. Cette information n’a pas été considérée dans le
contexte de la présente thèse.
Figure 30. Interface de CODEM. Les écrans de rétroaction fournissent des informations sur les changements
dans les valeurs réelles des variables (haut) et sur la direction et l’amplitude des erreurs de prévision (bas).
114
MODÈLES
Les modèles de prévisions de séries temporelles qui sont comparés aux prévisions des
participants sont les mêmes que ceux employés dans le chapitre précédent (voir Tableau
25). Cette comparaison est possible puisque la tâche des participants est identique à celle
réalisée par les modèles. Deux modèles représentent la stratégie d’ancrage et ajustement qui
consiste à partir d’une valeur initiale (c’est-à-dire, l’ancrage) et de l’ajuster dans le but
d’émettre une prévision avec une caractéristique importante de la série. Cette
caractéristique peut être la pente récente, ou la pente à long terme, par exemple. Ces
modèles sont nommés ANC1 et ANC2. Le modèle ANC3 est retiré puisqu’il est identique
en tous points à ANC1, et donc non discriminable. Trois modèles représentent la stratégie
de limites et vraisemblance. Cette heuristique consiste à extraire des caractéristiques de la
ou des série(s) temporelle(s) d’intérêt et d’intégrer ces nouveaux indices au sein d’une
représentation linéaire pour prédire le critère. Ces modèles sont nommés L&V1, L&V2 et
L&V3. Finalement, la norme rationnelle est représentée par le jugement linéaire. Un seul
modèle représente cette stratégie, le ML1.
Tableau 25
Sources d’information par modèle.
SI SE
Stratégie Modèle Explicite Extraite Unique Multiple
Ancrage et
ajustement
(heuristique)
ANC1 X
ANC2 X
ANC3* X
Limites et
vraisemblance
(heuristique)
L&V1 X
L&V2 X X
L&V3 X X
Jugement
linéaire ML1 X X
* Les prévisions du modèle ANC3 ne sont pas comparées à celles des participants
puisqu’elles sont identiques à celles de ANC1.
115
MESURES
Performance. La performance des participants et l’adéquation du comportement des
participants aux prévisions des modèles sont mesurées à l’aide de la PVE (initialement
popularisée par Hays, 1963). Cet indice, tel que formulé entre autres par Stevens (2013; Eq.
14), tient compte à la fois de l’erreur moyenne des prévisions et de la prévision de la
variation des séries temporelles (O’Grady, 1982). Essentiellement, cet indice correspond à
l’erreur de prévision, pondérée par la variance de la série critère. La PVE peut
théoriquement varier de -∞ à +1, ce qui implique ironiquement qu’il ne s’agit pas d’une
proportion à proprement parler (Fairchild et al., 2009). Plus la valeur de la PVE est proche
de un, plus la prévision de la série temporelle est bonne. Une PVE négative signifie que les
prévisions réalisées ajoutent de la variance à la variance réelle de la série.
Gain de performance et fréquence de gain. Afin de comparer les données des
participants au modèle linéaire, la performance atteinte par ce dernier est soustraite de celle
des participants. Une différence positive indique qu’un participant a obtenu une
performance de prévision supérieure au modèle linéaire. Cette mesure est utilisée afin de
mitiger l’impact de l’échelle de la PVE (-∞ à +1) qui a pour effet de décentrer la
distribution des scores de performance vers le négatif; or, dans le contexte de la thèse, il ne
s’agit pas de qualifier l’ampleur de l’erreur de performance, mais simplement de déterminer
si erreur il y a comparativement à un modèle normatif. Pour cette raison, l’utilisation d’une
mesure de fréquence de gain permet de répondre aux questions de recherche. Dans ce
contexte, la mesure de performance PVE est tout de même rapportée puisqu’elle permet de
décrire les résultats obtenus de manière plus exhaustive, et ainsi, de mieux apprécier les
limites de la thèse. Le gain moyen de performance par rapport au modèle linéaire n’est
toutefois pas représentatif d’une stratégie particulière. Pour cette raison, la fréquence à
laquelle chaque participant obtient une performance supérieure à celle du modèle linéaire
est également calculée.
Fréquence et proportion de représentativité des modèles. Pour chacune des séries
temporelles et chacun des participants, les prévisions des six modèles (ANC1, ANC2,
L&V1, L&V2, L&V3 et ML1) sont comparées aux prévisions des participants à l’aide d’un
test-t pour échantillons pairés. Un test significatif indique que les prévisions du participant
116
sont différentes des prévisions du modèle testé pour une série temporelle donnée. Le seuil
alpha fixé pour cette analyse est de p = .1 afin de favoriser l’identification de différence
significative entre les prévisions des modèles et les prévisions des participants. Ce seuil
libéral permet ainsi une plus grande discrimination des modèles, puisqu’une déviation
légère des réponses du participant par rapport au modèle suffira pour rejeter le modèle.
L’inflation de l’erreur alpha ne constitue pas un problème en soi puisque le rejet erroné des
modèles devrait être distribué également entre les modèles. Une deuxième étape consiste à
discriminer les modèles restant grâce à la PVE. Encore une fois, pour favoriser une
discrimination des modèles, un critère sévère est adopté. Le degré d’association entre les
prévisions du participant et les prévisions du modèle, tel que mesuré par la PVE, doit être
supérieure à .95 pour que le modèle soit jugé comme représentatif du comportement du
participant. Ce seuil est très sévère puisqu’il a été démontré que le ML1 expliquait en
moyenne environ 64% de la variance du comportement des individus dans des contextes
similaires à celui de la présente thèse (par exemple, catégorisation, prévision de critère
dichotomique). L’objectif de ce seuil sévère est de s’assurer que les modèles retenus sont
représentatifs du comportement des participants.
Une fois ces deux critères rencontrés, il est estimé que le modèle est représentatif et
donc plausiblement employé pour la prévision de la série temporelle. Cette méthode pour la
discrimination des modèles combine à la fois un critère de signification statistique et une
évaluation de la variance expliquée. Cette combinaison est réalisée afin de combler les
limites associées au test de signification statistiques (voir Cohen, 1990) et de la proportion
de variance expliquée (voir O’Grady, 1982). Par contre, dans certains cas, cette procédure
ne permet pas de discriminer entre deux ou plusieurs modèles. Dans ces circonstances,
ceux-ci sont simultanément considérés comme plausibles pour les fins des analyses. De
plus, même si un seul modèle est retenu, cette procédure ne permet pas de juger de
l’utilisation de la stratégie, mais seulement de la représentativité d’un modèle en lien avec
le comportement humain. Même dans le cas où un modèle expliquerait 100% de la variance
des prévisions d’un participant, il est seulement possible de dire que le participant se
comporte « comme s’il » utilisait cette stratégie (Sterman, 1989; Hogarth & Karelaia,
2007). C’est pourquoi, tout au long de la thèse, on réfère à la représentativité des modèles
plutôt qu’à leur utilisation.
117
La fréquence de représentativité des modèles indique le nombre de fois où chaque
modèle est représentatif du comportement humain. Les fréquences sont ensuite
transformées en proportion de représentativité en les divisant par le nombre de séries
temporelles au sein d’une condition (4 ou 8 selon la condition). Cette proportion est
calculée par condition expérimentale.
Adaptabilité. L’adaptabilité réfère à quel point la sélection de stratégie des
participants est optimale. Elle correspond à la proportion des séries temporelles qui étaient
prédites à l’aide de la stratégie la plus performante dans ce contexte. Les simulations du
chapitre précédent ont permis l’identification du modèle le plus performant pour prédire
chaque série temporelle (voir Tableau 26). L’adaptabilité réfère à la proportion à laquelle
les modèles représentatifs du comportement humain correspondent au modèle le plus
performant par condition expérimentale.
118
Tableau 26
Modèle le plus performant par série temporelle, défini par simulation.
XP1 XP2
Série 1 ANC2 Série 1 ANC2
Série 2 ANC2 Série 2 ANC2
Série 3 ANC2 Série 3 ANC2
Série 4 ML1 Série 4 ANC1
Série 5 ML1 Série 5 ANC2
Série 6 L&V1 Série 6 ANC2
Série 7 ML1 Série 7 ML1
Série 8 ANC1 Série 8 ML1
Série 9 ANC2 Série 9 ANC2
Série 10 ML1 Série 10 ML1
Série 11 ANC2 Série 11 L&V1
Série 12 ANC2 Série 12 ANC2
Série 13 ANC2 Série 13 ANC2
Série 14 ANC2 Série 14 ML1
Série 15 ANC2 Série 15 ANC1
Série 16 ANC2 Série 16 L&V1
Série 17 ANC1 Série 17 L&V1
Série 18 ANC1 Série 18 L&V1
Série 19 ANC2 Série 19 L&V1
Série 20 ANC2 Série 20 ML1
Série 21 L&V1 Série 21 ML1
Série 22 ANC2 Série 22 L&V1
Série 23 ANC2 Série 23 ML1
Série 24 ANC2 Série 24 L&V1
Série 25 L&V1
Série 26 ANC2
Série 27 L&V2
Série 28 ANC2
Série 29 ANC2
Série 30 L&V3
Série 31 L&V2
Série 32 ANC2
119
Expérience I
Cette expérience a pour objectif d’étudier le comportement humain dans l’adoption
de stratégies cognitives, heuristiques ou jugement linéaire, pour la prévision de séries
temporelles complexes sous des conditions variées de qualité d’information de source
extrinsèque. Les facteurs manipulés au sein de l’Expérience 1 sont le nombre d’indices
extrinsèques et la force d’association extrinsèque. Ces deux facteurs sont associés à la
source extrinsèque d’information. Le nombre d’indices extrinsèques correspond au nombre
de séries temporelles qui co-évoluent avec la série critère. En effet, la valeur des séries qui
co-évoluent avec la série critère est la seule information extrinsèque explicitement
disponible aux participants pour émettre leur prévision. La force d’association extrinsèque
correspond à la corrélation linéaire absolue maximum entre les indices extrinsèques et le
critère. Ces facteurs n’ont montré aucun impact sur la performance des modèles lors de la
première simulation du chapitre précédent, toutefois, ils sont parfois associés à la sélection
de stratégie utilisée pour faire les prévisions. Les hypothèses testées dans le cadre de cette
expérience sont les suivantes :
H2 : La performance des participants à la tâche de prévision sera supérieure à
celle atteinte par le modèle de jugement linéaire.
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle
donnée variera significativement en fonction des caractéristiques de la tâche de
prévision.
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif
du comportement d’un participant correspond au modèle le plus performant) sera
supérieure au hasard.
MÉTHODE
Participants. L’échantillon se compose de 24 étudiant(e)s de l’Université Laval,
soit 10 hommes et 14 femmes. Une compensation financière de 10$ par session
120
expérimentale est remise aux participants (donc 40$ pour les quatre sessions). Tous les
participants rapportent une vision normale ou corrigée.
Devis expérimental. Le nombre d’indices extrinsèques (3 ou 7) et la force
d’association extrinsèque (faible [m = .65; ET = .14] ou élevée [m = .91; ET = .06])
engendre un plan à mesures répétées 2 × 2. Tous les participants complètent la tâche de
prévision de séries temporelles au sein de quatre versions de scénario. Les vingt-quatre
séries temporelles utilisées pour cette expérience sont les mêmes que celles employées pour
la première simulation rapportée dans le chapitre précédent (voir Erreur ! Source du
renvoi introuvable.).
Procédure. Le Tableau 27 montre la procédure suivie par les participants au cours
des quatre sessions tests. Lors de la première session, les participants sont d’abord invités à
lire et remplir le formulaire de consentement. Par la suite, ceux-ci procèdent à un scénario
de pratique dont l’objectif était de les familiariser avec les contrôles de la plateforme
expérimentale. L’ensemble des participants réalisent le même scénario pratique. Suite à la
pratique, les participants sont invités à compléter la première version du scénario
expérimental. Par la suite, chaque session expérimentale est dédiée à la réalisation d’une
autre version du scénario. L’ordre de présentation des différentes versions de scénarios est
contrebalancé entre les participants.
Tableau 27
Déroulement des sessions expérimentales.
Étape Session 1 Session 2 Session 3 Session 4
Étape 1 Formulaire de
consentement
Prévision de
séries
temporelles
Prévision de
séries
temporelles
Prévision de
séries
temporelles
Étape 2 Pratique
Étape 3
Prévision de
séries
temporelles
121
Les instructions données aux participants avant la réalisation de chaque scénario
sont présentées dans la Figure 31. Ces instructions exposaient l’objectif des participants,
c’est-à-dire de trouver le plus précisément possible la valeur des différentes variables au
tour suivant. Les instructions mettaient également le participant en contexte, c’est-à-dire
qu’ils incarnaient un astronaute perdu sur des planètes inconnues. L’objectif de cette mise
en contexte était de s’assurer que les participants n’appliquent aucune connaissance a priori
lorsqu’ils réalisaient la tâche. En effet, cette source d’information décrite par Harvey (2007)
pourrait avoir une influence sur la précision des prévisions et a donc été retirée des études
réalisées dans cette présente thèse. Finalement, les instructions insistaient sur le fait que la
tâche est particulièrement difficile et que seules les personnes qui déploient des efforts
importants arrivent à bien prédire la valeur des variables. Cela était mentionné pour ne pas
que les participants perdent leur motivation en cours d’expérimentation et aussi pour
encourager les participants à bien faire la tâche.
Figure 31. Instructions présentées aux participants avant la tâche expérimentale.
RÉSULTATS
Les résultats sont organisés en quatre sections. La première consiste à décrire les
résultats de manière générale à justifier certains choix d’analyse. La seconde section
concerne l’analyse de la performance absolue des participants et relativement au jugement
linéaire. Cette seconde section est directement associée à l’hypothèse H2 :
122
H2 : La performance des participants à la tâche de prévision sera supérieure à
celle atteinte par le modèle de jugement linéaire.
La troisième section consiste en l’analyse de l’adéquation entre les prévisions des
participants et les prévisions des modèles en fonction des conditions expérimentales. Ces
analyses sont directement en lien avec l’hypothèse H3 :
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle
donnée variera significativement en fonction des caractéristiques de la tâche de
prévision.
Finalement, la quatrième section concerne l’analyse du niveau d’adaptabilité et est en lien
avec l’hypothèse H4 :
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif
du comportement d’un participant correspond au modèle le plus performant) sera
supérieure au hasard.
Description et justification. Pour les analyses statistiques de la présente thèse, la
correction de Greenhouse-Geisser est appliquée sur les degrés de liberté de tous les effets
intra-sujets pour lesquels la condition de sphéricité n'est pas respectée. De plus, une
correction Bonferroni est appliquée lorsque nécessaire pour limiter l’inflation de l’erreur
alpha. Toutes les statistiques rapportées ne concernent que les périodes t > 9 (participants et
modèles). Cela est causé par des limitations computationnelles des modèles de stratégies
qui requièrent dans certains cas un nombre minimal d’observations pour être exécutées. Par
exemple, le calcul du ML1 ne peut être réalisé lorsque la matrice de variance-covariance est
caractérisée par un niveau de colinéarité trop élevé ou lorsque le nombre de paramètres
excède le nombre d’observations.
La Figure 32 illustre un exemple des réponses données par certains participants par
rapport à une des séries temporelles à prédire. L’Annexe A comporte une série de figures
illustrant les prévisions de participants à certaines séries temporelles, ainsi que les prévision
des modèles ANC2 et ML.
123
Figure 32. Exemple des réponses données par un sous-ensemble de 13 participants (gris) comparativement à
la série temporelle critère (noire).
Les prévisions d’un sous-ensemble de 13 participants sont montrées en gris alors
que la série temporelle à prédire est représentée en noir. Notez que les prévisions ne sont
pas toutes exactes et qu’elles sont distribuées autour de la série temporelle critère. Une
distribution similaire des prévisions est observée pour l’ensemble des séries temporelles à
prédire. C’est l’écart entre les prévisions des participants et la série temporelle critère qui
correspond à la performance de prévision. Ce critère de performance est employé puisqu’il
correspond aux consignes qui sont données aux participants lors de l’expérience. Tel que
mentionné précédemment, l’ampleur de l’écart n’est pas critique à l’atteinte des objectifs de
la thèse. Plutôt, ce qui importe concerne davantage si la stratégie employée par les
participants est meilleure ou non comparativement à une norme donnée. Néanmoins,
l’ampleur de l’écart est tout de même analyser afin de décrire les observations de manière
exhaustive.
Performance comparative au modèle linéaire. Une première analyse se concentre
d’abord sur la performance des participants, puis sur la comparaison de celle-ci avec celle
d’un jugement linéaire. Les données d’un participant ont été retirées puisque sa
performance pour une des conditions était à plus de trois écart-types sous la moyenne. Les
moyennes et erreurs quadratiques moyennes par condition expérimentale sont représentées
0
2
4
6
8
10
12
14
16
18
20
t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40
124
dans la Figure 33. Suite à une première inspection visuelle, on note que l’erreur moyenne
pour l’ensemble des conditions est très faible, ce qui suggère que les réponses des
participants sont assez homogènes. De plus, la performance atteinte est très élevée à
l’exception de la condition 7 indices – association extrinsèque faible.
Une ANOVA à mesures répétées 2 2 est effectuée sur la performance selon le
nombre d’indices extrinsèques et la force d’association extrinsèque. Les résultats montrent
des effets significatifs du nombre d’indices extrinsèques F(1,22) = 84.04, p < .001, =
.793; de la force d’association extrinsèque F(1,22) = 89.38, p < .001, = .802; et de
l’interaction entre les facteurs F(1,22) = 206.74, p < .001, = .904 sur la performance.
Figure 33. Performance moyenne des participants par condition expérimentale (nombre d’indices et force
d’association extrinsèque). La performance correspond à la proportion de variance expliquée des séries
temporelles par les prévisions des participants.
Des comparaisons pairées multiples sont effectuées pour décomposer l’interaction
(voir Tableau 28). Les résultats montrent que la performance augmente entre forte et faible
association extrinsèque lorsque le nombre d’indices est de trois, mais qu’elle diminue entre
forte et faible association extrinsèque lorsque le nombre d’indices est de sept. De plus, la
125
performance augmente de trois à sept indices lorsque la force d’association extrinsèque est
forte, mais diminue lorsque la force d’association est faible. Malgré ces effets significatifs,
les tailles d’effets indiquent que le principal effet d’importance est la diminution de la
performance lorsque le nombre d’indices est de trois en combinaison avec une force
d’association extrinsèque faible comparativement aux autres conditions.
Tableau 28
Décomposition de l’interaction performance PVE.
Comparaison t dl p d’
Forte - 3 Indices vs. Faible - 3 Indices 8.46 22 < .001 1.76
Forte - 7 Indices vs. Faible - 7 Indices 12.38 22 < .001 2.58
Forte - 3 Indices vs. Forte - 7 Indices 3.27 22 .004 .68
Faible - 3 Indices vs. Faible - 7 Indices 12.85 22 < .001 2.67
Gain de performance. Le gain de performance par condition est représenté dans la
Figure 34. Suite à une inspection visuelle, on constate que la seule condition pour laquelle
le gain de performance moyen est potentiellement supérieur à zéro est la condition 7 indices
– association extrinsèque faible. Un test-t est réalisé afin de vérifier si le gain de
performance moyen observé pour la condition 7 Indices – Association extrinsèque faible est
différente de zéro. Le test-t révèle que la différence est non-statistiquement significative
t(22) = .578, non-significatif. On ne peut donc pas rejeter l’hypothèse nulle selon laquelle le
gain de performance moyen est différent de zéro.
126
Figure 34. Gain de performance moyen des participants par condition expérimentale (nombre d’indices et
force d’association extrinsèque). Le gain de performance correspond à la différence entre la performance des
participants et celle obtenue par l’application parfaite du modèle de jugement linéaire.
Une ANOVA à mesures répétées 2 2 est effectuée sur le gain de performance
moyen selon le nombre d’indices extrinsèques et la force d’association extrinsèque. Les
données d’un participant ont été retirées puisque sa performance pour une des conditions
était à plus de trois écart-types sous la moyenne. Les résultats montrent que seul l’effet de
la force d’association extrinsèque sur l’ampleur moyen du gain est statistiquement
significatif F(1,22) = 7.55, p = .012, = .256. En effet, le gain moyen de performance est
supérieur lorsque la force d’association extrinsèque est faible comparativement à
lorsqu’elle est élevée. Les effets du nombre d’indices extrinsèques et de l’interaction des
facteurs sont non significatifs.
Fréquence de gain. La Figure 35 représente la fréquence de gain de performance par
participant. Les participants sont ordonnés en rang et la fréquence maximum est de 24 (24
séries temporelles).
127
Figure 35. Fréquence de gain de performance par participant. Tous les participants ont obtenus une
performance supérieure à celle du modèle de jugement linéaire à au moins sept reprises sur une possibilité de
vingt-quatre.
La fréquence par participant et par condition expérimentale est ensuite calculée et
divisée par le maximum possible (c’est-à-dire, 24, le nombre de séries temporelles). Les
fréquences sont ainsi standardisées et représentées entre zéro et un. Une série de tests-t est
réalisée afin de vérifier si la fréquence de gain standardisée moyenne est différente de zéro.
Les tests-t révèlent que toutes les différences sont statistiquement significatives (voir
Tableau 29).
Tableau 29
Test-t à un échantillon entre fréquences moyennes de gain standardisées et valeur test de
zéro.
Condition t dl p
Force d'association élevée - 3 Indices 15.27 23 < .001
Force d'association faible - 3 Indices 11.02 23 < .001
Force d'association élevée - 7 Indices 14.95 23 < .001
Force d'association faible - 7 Indices 21.52 23 < .001
0
4
8
12
16
20
24
11 14 21 19 24 16 5 10 13 18 3 8 15 17 7 20 23 1 12 6 2 22 4 9
Fré
qu
en
ce d
e g
ain
(/2
4)
Participant
128
Une ANOVA à mesures répétées 2 2 est effectuée sur la fréquence de gain
standardisée moyenne selon le nombre d’indices extrinsèques et la force d’association
extrinsèque. Les résultats montrent que seul l’effet du nombre d’indices extrinsèques sur la
fréquence standardisée de gain est statistiquement significatif F(1,23) = 8.87, p = .007, =
.278. En effet, la moyenne de fréquence de gain standardisée est supérieure lorsque le
nombre d’indices extrinsèques est de sept comparativement à lorsqu’il est de trois. Les
effets de la force d’association extrinsèque et de l’interaction des facteurs sont non
significatifs (voir Figure 36).
Figure 36. Fréquence de gain standardisée moyenne par condition expérimentale (nombre d’indices et force
d’association extrinsèque). Les tests-t révèlent que les fréquences sont supérieure à 0 pour l’ensemble des
conditions expérimentales.
Adéquation aux modèles. Les analyses d’adéquation aux modèles comportent
quatre étapes. La première consiste à comparer l’adéquation entre les prévisions des
participants un à un avec les prévisions de chacun des modèles de stratégie dans le but
d’identifier quels sont les modèles les plus représentatifs du comportement humain. La
seconde étape consiste à comparer la représentativité globale des modèles, sans égard aux
129
conditions expérimentales. La troisième étape consiste à estimer l’impact des conditions
expérimentales sur la représentativité des modèles. Cela permettra d’évaluer si les
participants adaptent leur stratégie en fonction des conditions environnementales.
Finalement, la dernière étape vise à évaluer si la représentativité des modèles est adaptée,
c’est-à-dire si elle permet l’atteinte de performances équivalentes ou supérieures au modèle
de jugement linéaire.
Représentativité des modèles. Pour chacune des 24 séries temporelles et chacun des
24 participants, les prévisions des six modèles sont comparées aux prévisions des
participants avec un test-t pour échantillons pairés (donc = 3456 comparaisons).
Ce premier effort de sélection permet de réduire le nombre moyen de modèles plausibles à
3.56 par série temporelle. En d’autres mots, suite à cette sélection, il reste en moyenne
environ entre trois et quatre modèles plausibles pour expliquer le comportement des
participants dans la prévision d’une seule série temporelle. Un effort supplémentaire de
sélection de modèle est donc nécessaire. Ainsi, l’adéquation entre le comportement des
participants et celui du modèle telle que mesurée par la PVE doit être supérieure à .95 pour
que le modèle soit considéré comme plausible. La sélection finale réduit le nombre
plausible de modèles à 1.12 par série temporelle. Le
130
Tableau 30 montre la fréquence de représentativité de chacun des modèles pour
l’ensemble des 24 séries temporelles par participant. Notez que la somme de la
représentativité par participant n’égale pas nécessairement le nombre total de séries
temporelles pour les raisons mentionnées précédemment.
131
Tableau 30
Fréquence de représentativité des modèles par participant.
Participant ANC1 ANC2 L&V1 L&V2 L&V3 ML1
P1 3 11 3 2 0 10
P2 5 8 5 3 1 7
P3 4 8 4 2 1 7
P4 3 11 5 2 0 9
P5 7 7 5 4 1 9
P6 4 12 3 2 0 10
P7 3 12 2 2 1 9
P8 5 10 5 2 0 10
P9 4 10 4 3 0 7
P10 3 7 3 1 0 7
P11 4 6 3 3 1 3
P12 5 11 5 2 0 10
P13 6 10 6 4 0 12
P14 3 5 2 2 0 4
P15 4 9 4 3 1 5
P16 4 6 3 3 1 6
P17 2 9 1 0 1 8
P18 5 8 5 1 0 9
P19 4 8 4 3 0 7
P20 6 11 5 2 0 12
P21 2 2 2 1 0 5
P22 3 10 3 3 0 7
P23 2 10 4 2 0 10
P24 4 8 3 3 1 6
Moyenne 3.96 8.71 3.71 2.29 0.38 7.88
132
Représentativité des modèles. Une série de tests-t pour échantillons uniques est
exécutée afin de vérifier si la fréquence de représentativité moyenne des modèles est
différente de zéro. Les analyses révèlent que les fréquences moyennes sont toutes
différentes de zéro (voir Tableau 31).
Tableau 31
Test-t à un échantillon entre fréquence de représentativité et valeur test de zéro.
Modèle t dl p
ANC1 14.90 23 < .001
ANC2 17.74 23 < .001
L&V1 14.33 23 < .001
L&V2 11.76 23 < .001
L&V3 3.71 23 .001
ML 16.314 23 < .001
Une ANOVA à mesures répétées sur la fréquence de représentativité des modèles
avec la version du modèle comme facteur répété (6 niveaux) est réalisée afin de vérifier s’il
existe une différence significative dans la représentativité entre les modèles,
indépendemment de la condition expérimentale. Les résultats montrent que l’effet du
modèle sur la fréquence de représentativité est statistiquement significatif F(5,115) =
126.92, p < .001, = .847. Afin de localiser la source de cette différence, une série de
comparaisons pairées est réalisée. Une correction Bonferroni est appliquée pour éviter
l’inflation des risques d’une erreur alpha. L’analyse, résumée dans le Tableau 32, révèle
que seuls les modèles ANC1 vs L&V1 et ANC2 vs ML1 ont une fréquence de
représentativité non-statistiquement différente.
133
Tableau 32
Différences absolues de fréquence moyenne d’utilisation entre les modèles. Les différences
non significatives sont ombragées.
ANC2 L&V1 L&V2 L&V3 ML
ANC1 4.75* 0.25 1.67* 3.58* 3.92*
ANC2
5.00* 6.42* 8.33* 0.83
L&V1
1.42* 3.33* 4.17*
L&V2
1.92* 5.58*
L&V3
7.50*
* p < .001 avec correction Bonferroni
Impact des conditions expérimentales sur la représentativité des modèles. Les
proportions moyennes de représentativité (les barres d’erreur représentent l’erreur
quadratique moyenne) par condition et modèle sont rapportées dans la Figure 37. Pour
chacun des modèles à l’exception de L&V3, une ANOVA à mesures répétées 2 2 est
effectuée sur la proportion de représentativité selon le nombre d’indices extrinsèques et la
force d’association extrinsèque. Le seuil de signification est fixé à .01 (.05/5) pour éviter
l’inflation du nombre d’erreur de type I.
134
Figure 37. Proportion moyenne de représentativité des modèles par condition expérimentale (nombre
d’indices et force d’association extrinsèque) et modèle.
ANC1. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité
du modèle ANC1 selon le nombre d’indices extrinsèques et la force d’association
extrinsèque. L’analyse montre que l’effet du nombre d’indices sur la représentativité est
statistiquement significatif F(1,23) = 57.06, p < .001, = .713. En effet, la représentativité
135
du comportement humain par le modèle ANC1 est significativement plus élevée au sein des
conditions à 7 indices comparativement aux conditions à 3 indices. Ni l’effet de la force
d’association F(1,23) = 2.76, ni celui de l’interaction des facteurs F(1,23) = 2.16 sur la
représentativité du comportement par le modèle ANC1 ne sont significatifs.
ANC2. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité
du modèle ANC2 selon le nombre d’indices extrinsèques et la force d’association
extrinsèque. L’analyse montre que l’effet de la force d’association extrinsèque sur la
représentativité du comportement par le modèle ANC2 est statistiquement significatif
F(1,23) = 18.44, p < .001, = .445. En effet, la représentativité du modèle ANC2 est
significativement plus élevée au sein des conditions à force d’association extrinsèque forte
comparativement aux conditions avec force d’association extrinsèque faible. L’effet du
nombre d’indices sur la représentativité du modèle ANC2 est également significatif F(1,23)
= 11.32, p = .003, = .330. Cet effet est le même que pour le modèle ANC1, c’est-à-dire
que la représentativité du comportement humain par le modèle ANC2 est plus élevée au
sein des conditions à sept indices comparativement aux conditions à trois indices.
Finalement, l’effet d’interaction des facteurs sur la représentativité du modèle ANC2 est
non significatif F(1,23), p = .033, = .183.
L&V1. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité de
L&V1 selon le nombre d’indices extrinsèques et la force d’association extrinsèque. Les
résultats montrent que l’effet du nombre d’indices F(1,23) = 34.77, p < .001, = .602, de
la force d’association extrinsèque F(1,23) = 14.57, p < .001, = .388, et de l’interaction
des facteurs F(1,23) = 15.65, p < .001, = .405, sur la représentativité du comportement
des participants par le modèle L&V1 sont significatifs. Des comparaisons multiples sont
effectuées pour décomposer l’interaction (voir Tableau 33). Les résultats des comparaisons
montrent que la représentativité du comportement des participants par le modèle L&V1 est
plus élevée lorsque l’association extrinsèque est forte, mais seulement lorsque le nombre
d’indices est de sept.
136
Tableau 33
Décomposition de l’interaction L&V1.
Comparaison t dl p d’
Forte - 3 Indices vs. Faible - 3 Indices 0.49 23 0.63 .10
Forte - 7 Indices vs. Faible - 7 Indices 7.4 23 < .001 1.51
Forte - 3 Indices vs. Forte - 7 Indices 5.86 23 < .001 1.20
Faible - 3 Indices vs. Faible - 7 Indices 1.62 23 0.12 .33
L&V2. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité
du modèle L&V2 selon le nombre d’indices extrinsèques et la force d’association
extrinsèque. Les résultats montrent que l’effet du nombre d’indices F(1,23) = 24.31, p <
.001, = .514, de la force d’association extrinsèque F(1,23) = 38.52, p < .001,
= .626,
et de l’interaction des facteurs F(1,23) = 24.45, p < .001, = .515, sur la représentativité
de L&V2 sont significatifs. Des comparaisons pairées multiples sont effectuées pour
décomposer l’interaction (voir Tableau 34). Les résultats, pratiquement identiques à ceux
obtenus pour la même analyse L&V1, montrent que la représentativité de L&V2 est plus
élevée lorsque l’association extrinsèque est forte, mais seulement lorsque le nombre
d’indices est de sept.
Tableau 34
Décomposition de l’interaction L&V2.
Comparaison t dl p d’
Forte - 3 Indices vs. Faible - 3 Indices 0.62 23 0.54 .13
Forte - 7 Indices vs. Faible - 7 Indices 9.93 23 < .001 2.03
Forte - 3 Indices vs. Forte - 7 Indices 5.27 23 < .001 1.08
Faible - 3 Indices vs. Faible - 7 Indices 0.37 23 0.71 .08
ML1. Finalement, une ANOVA à mesures répétées 2 2 est effectuée sur la
représentativité du comportement des participants par le modèle ML1 selon le nombre
d’indices extrinsèques et la force d’association extrinsèque. Les résultats montrent que
l’effet du nombre d’indices F(1,23) = 78.50, p < .001, = .773, de la force d’association
extrinsèque F(1,23) = 15.02, p < .001, = .395, et de l’interaction des facteurs F(1,23) =
26.73, p < .001, = .537, sur la représentativité de ML1 sont significatifs. Des
137
comparaisons pairées multiples sont effectuées pour décomposer l’interaction (voir Tableau
35). Les résultats des analyses comparaisons montrent que la représentativité du ML1 n’est
pas différente en fonction de la force d’association extrinsèque, mais seulement dans le cas
où le nombre d’indices est égal à trois. Toutes les autres différences observées sont
significatives.
Tableau 35
Décomposition de l’interaction ML1.
Comparaison t dl p d’
Forte - 3 Indices vs. Faible - 3 Indices 0.96 23 0.35 .20
Forte - 7 Indices vs. Faible - 7 Indices 11.02 23 < .001 2.25
Forte - 3 Indices vs.Forte - 7 Indices 4.27 23 < .001 .87
Faible - 3 Indices vs.Faible - 7 Indices 9.36 23 < .001 1.91
Adaptabilité. La proportion à laquelle le modèle le plus représentatif du
comportement d’un participant correspond au modèle le plus performant par condition
expérimentale est utilisée comme mesure d’adaptabilité des participants. Une analyse de
corrélation révèle que la mesure d’adaptabilité est corrélée avec la fréquence moyenne de
gain r(22) = .61, p < .001 et le gain moyen3 r(21) = .70, p < .001. Une analyse par condition
expérimentale est également effectuée afin d’établir si le niveau d’adaptabilité est affecté
par celles-ci. La Figure 38 représente l’adaptabilité par condition expérimentale. Une
ANOVA à mesures répétées 2 2 est effectuée sur la mesure d’adaptabilité selon le
nombre d’indices extrinsèques et la force d’association extrinsèque. Les résultats montrent
que seul l’effet d’interaction des facteurs est significatif F(1,23) = 48.16, p < .001, =
.677. Les effets de la force d’association extrinsèque et du nombre d’indices sur
l’adaptabilité sont non significatifs. Des comparaisons pairées multiples sont effectuées
pour décomposer l’interaction (voir Tableau 36). L’analyse montre que l’adaptabilité
augmente entre association forte et faible lorsque le nombre d’indices est de trois, mais
qu’elle diminue lorsque le nombre d’indices est de sept.
3 Les données d’un participant ont été retirées pour cette analyse puisque leur score était à plus de trois écart-
types sous la moyenne.
138
Tableau 36
Décomposition de l’interaction sur adaptabilité.
Comparaison t dl p d’
Forte - 3 Indices vs. Faible - 3 Indices 5.12 23 < .001 1.05
Forte - 7 Indices vs. Faible - 7 Indices 5.36 23 < .001 1.09
Forte - 3 Indices vs. Forte - 7 Indices 3.83 23 .001 .78
Faible - 3 Indices vs. Faible - 7 Indices 5.41 23 < .001 1.10
Figure 38. Adaptabilité par condition expérimentale (nombre d’indices et force d’association extrinsèque).
DISCUSSION
L’objectif de ce chapitre est d’évaluer si la performance des participants est égale ou
supérieure à celle du modèle de jugement linéaire, identifier quelles sont les stratégies
employées par les participants et vérifier si ces stratégies sont adaptées. À cet égard, la
première expérience s’intéresse à ces objectifs en lien avec la qualité des indices
extrinsèques dans la prévision de séries temporelles. Précisément, deux facteurs associés à
la qualité des indices extrinsèques sont manipulés : le nombre d’indices extrinsèques et la
force d’association extrinsèque.
139
H2 : La performance des participants à la tâche de prévision sera supérieure à celle
atteinte par le modèle de jugement linéaire.
La fréquence de gain moyenne est relativement élevée pour l’ensemble des
conditions expérimentales, ce qui indique que les participants ont la capacité de faire des
prévisions dont la précision est supérieure à celle d’un modèle de jugement linéaire. La
démonstration que dans certaines situations l’adoption d’heuristiques simples mènent à des
performances au moins équivalentes au modèle normatif de référence n’est pas nouvelle.
Par exemple, Borges et ses collègues (1999) ont démontré que l’heuristique de disponibilité
a permis l’atteinte de performance financière supérieure à la moyenne, mais seulement au
sein d’un marché fort (Boyd, 2001). Ying Luo (2013) observe aussi qu’une heuristique de
représentativité permet l’atteinte de performances financières au moins équivalentes à un
modèle rationnel, mais seulement lorsque l’environnement à prédire comporte une part
élevée de hasard. Les résultats de la présente étude élargissent l’éventail des conditions
sous lesquelles cela est possible.
Par contre, les données observées indiquent que le gain moyen par rapport au
jugement linéaire est minimal puisqu'il n’est positif que dans une des conditions
expérimentales. Une explication possible de cette apparente contradiction est que le gain
potentiel des heuristiques comparativement au modèle linéaire est relativement limité
puisque ce dernier obtient généralement une bonne performance. La performance élevée du
modèle de jugement linéaire est d’ailleurs un argument clé de son statut de modèle normatif
(Karelaia & Hogarth, 2008). Toutefois, à l’inverse, une stratégie inefficace peut être
nettement sous la performance d’un jugement linéaire, particulièrement avec l’utilisation
d’une échelle de performance variant de -∞ à +1. Ainsi, la moyenne des « gains » pourrait
être grandement diminuée par quelques mauvaises prévisions, particulièrement dans les
conditions où la performance du modèle de jugement linéaire est élevée. Pour ces raisons,
la fréquence de gain moyenne constitue un meilleur indicateur de l’adaptabilité des
participants que l’amplitude du gain.
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle donnée
variera significativement en fonction des caractéristiques de la tâche de prévision.
140
Un gain de performance n’est toutefois pas nécessairement causé par un
changement adapté de stratégie. Est-ce que le gain de performance peut être attribué à la
sélection adaptée de stratégies cognitives, ou résulte-t-il simplement d’une variation de la
performance du modèle linéaire? En effet, si les participants emploient toujours la même
stratégie, mais seulement sous certaines conditions, cette stratégie est plus adaptée que le
modèle linéaire, il en résultera un gain, mais non causé par une sélection adaptée de
stratégie. Les résultats suggèrent toutefois que les participants adaptent leur stratégie.
Premièrement, la fréquence moyenne de gain est modulée par le nombre d’indices
extrinsèques, mais pas par la force d’association extrinsèque, or, le chapitre précédent a
démontré que sous ces conditions, le nombre d’indices n’a pas d’impact sur la performance
du modèle linéaire, ni même des autres modèles. Ainsi, le simple fait de toujours conserver
la même stratégie ne devrait pas moduler la différence de performance entre celle-ci et une
stratégie distincte. Deuxièmement, les résultats suggèrent que les individus ont la capacité
de se comporter comme l’ensemble des stratégies modélisées, du moins sous certaines
conditions. Cette observation constitue un appui empirique supplémentaire à l’utilisation
des heuristiques d’ancrage et ajustement (Goodwin & Wright, 1994; Harvey, 2007;
Lawrence et al., 2006; Lawrence & O’Connor, 1995; Reimers & Harvey, 2011), de limites
et vraisemblance (Becker & Leopold-Wildburger, 1996; Becker et al., 2007), et de
jugement linéaire dans un contexte de prévision de séries temporelles. Troisièmement, la
variation des facteurs associés à la source extrinsèque d’information semble moduler le
comportement des participants. Par exemple, l’augmentation du nombre d’indices a
généralement pour effet d’éloigner le comportement des participants de celui du jugement
linéaire. De plus, les modèles d’heuristiques augmentent en représentativité du
comportement humain avec l’augmentation du nombre d’indices. Ainsi, il y a donc un
abandon d’une stratégie similaire au jugement linéaire pour favoriser des stratégies
similaires aux heuristiques modélisées. Cette observation était attendue, puisqu’il a été
souvent observé que les individus abandonnent la stratégie de jugement linéaire lorsque le
nombre d’indices dépasse trois (Hogarth & Karelaia, 2008). Ce phénomène est
généralement attribué aux limites cognitives fondamentales en mémoire active qui rendrait
impossible le calcul d’interactions à plus de trois variables pour la plupart des individus
(Halford et al., 2005 ; Halford et al., 1998). De plus, cette observation est cohérente avec
141
l’idée selon laquelle l’adoption d’heuristiques résulte d’un abandon de règle normative trop
complexe pour être réalisée adéquatement (Todd & Gigerenzer, 2000; Goldstein &
Gigerenzer, 2009; Gigerenzer et al., 1999; Kahneman et al., 1982). Ces résultats ne
signifient pas, toutefois, que le jugement linéaire est toujours un mauvais représentant de la
stratégie des participants. Au contraire, selon une analyse de comparaison de la fréquence
de représentativité des modèles, la fréquence à laquelle les participants se comportent
comme cette règle rivalise avec l’instance la plus populaire des heuristiques.
Particulièrement, le modèle de jugement linéaire représente bien la stratégie des
participants dans les conditions où le nombre d’indices extrinsèques est égal à trois et où la
force d’association extrinsèque est élevée.
Dans l’ensemble il y a un abandon de l’ensemble des stratégies modélisées
(heuristiques et jugement linéaire) au sein de la condition à sept indices et dont
l’association extrinsèque des indices est faible. Les raisons possibles qui expliquent ce
résultat seront discutées dans la discussion générale du chapitre, mais ce résultat ne reflète
probablement pas l’absence de stratégie puisque c’est également au sein de cette condition
qu’on observe le gain de performance et la fréquence de gain les plus élevés. Ce résultat
pourrait être causé par l’application inconstante d’une même heuristique (par exemple,
Karelaia & Hogarth, 2008) ou encore de l’application de plusieurs stratégies pour la
prévision d’une même série temporelle. Ainsi, bien que la stratégie adoptée (ou la
combinaison de stratégies) ne soit représentée par aucun des modèles de la thèse, elle n’en
demeure pas moins adaptée et performante.
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif du
comportement d’un participant correspond au modèle le plus performant) sera supérieure
au hasard.
Le changement de stratégies des participants semble d’ailleurs être proche de
l’optimal dans une grande proportion des cas. En effet, la mesure d’adaptabilité est
relativement élevée pour l’ensemble de l’expérience. Toutefois, comme cette mesure n’est
basée que sur les modèles formalisés dans la présente thèse, elle ne peut identifier les cas
où d’autres stratégies (ou combinaison de stratégies) seraient plus optimales. Néanmoins,
142
l’adaptabilité est fortement corrélée avec le gain de performance, ce qui suggère qu’elle
représente bien la capacité des participants à changer de stratégie de manière adaptée.
Les conclusions portées suite à cette expérience doivent toutefois être nuancées
puisque l’ensemble des stratégies modélisées dans le contexte de la thèse ont la capacité de
bien performer sous ces conditions. Cet environnement est donc très favorable à l’atteinte
de performance supérieure au modèle de jugement linéaire. En effet, tel que discuté
précédemment, le niveau d’autocorrélation des séries temporelles employées dans cette
première expérience est élevé et permet l’application de l’ensemble des stratégies sans
impact important sur la performance. Cela était possible parce que toutes les stratégies non
compensatoires modélisées se fondent sur la source intrinsèque d’information
(particulièrement ANC2 qui constitue le modèle le plus représentatif du comportement
humain avec le jugement linéaire au sein de la présente expérience) alors que les stratégies
compensatoires ont la capacité d’utiliser cette source d’information dans les cas où la
source extrinsèque serait trop dégradée.
Il serait particulièrement intéressant d’évaluer si des conditions dégradées de
validité des indices de source intrinsèque combinées à un nombre d’indices élevé
permettraient l’atteinte de performance supérieure au jugement linéaire. En effet, sous ces
conditions, l’application du modèle ANC2 résulte en une performance réduite alors que
l’application du ML semble contrainte par des limites cognitives. Ainsi, ces conditions
favoriseront probablement un changement de stratégie, mais représenteront un défi
important pour l’atteinte d’un gain de performance par rapport au modèle de jugement
linéaire.
Expérience II
La seconde expérience explore à la fois l’impact de la qualité des indices
intrinsèques et extrinsèques sur les stratégies de prévision des participants et leur
adaptabilité. En manipulant la source intrinsèque et extrinsèque d’information, l’expérience
vise à vérifier si les participants sont capables d’adapter leurs stratégies fortement basées
sur la source intrinsèque d’information vers des stratégies qui se fonderaient sur la source
extrinsèque d’information. De plus, les conditions de cette expérience favorisent l’abandon
143
de modèle de jugement linéaire par les participants en fixant le nombre d’indices
extrinsèques à sept. En effet, l’expérience précédente démontre que la représentativité du
modèle de jugement linéaire est négativement affectée par une augmentation du nombre
d’indices extrinsèques.
Les facteurs manipulés sont la force d’association extrinsèque et l’autocorrélation
des séries temporelles. La force d’association extrinsèque est opérationnalisée comme dans
l’expérience précédente. Elle correspond au maximum des corrélations linéaires absolues
entre les indices extrinsèques et le critère. La force d’association est manipulée pour faire
varier la qualité de la source extrinsèque. L’autocorrélation est opérationnalisée avec la
corrélation des valeurs de la série temporelle sur ses propres valeurs moins une latence de
d’une période (Lawrence et al., 2006). Bien que l’autocorrélation puisse être
opérationnalisée avec une latence plus grande (c’est-à-dire, pour une période > 1), Bolger et
Harvey (1993) démontrent que les individus se fient systématiquement davantage à l’indice
de la période précédente (c’est-à-dire, t-1) qu’à ceux des périodes antérieures (par exemple,
t-2, t-3, etc.). L’objectif de cette manipulation est de dégrader la qualité des indices
intrinsèques. Cette dégradation diminuera fortement la précision d’une stratégie d’ancrage
et ajustement (la stratégie la plus représentative des participants lors de l’Expérience 1) et
les forcera ainsi à adopter une stratégie alternative. Les hypothèses testées sont les mêmes
que celles de l’Expérience 1 :
H2 : La performance des participants à la tâche de prévision sera supérieure à
celle atteinte par le modèle de jugement linéaire.
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle
donnée variera significativement en fonction des caractéristiques de la tâche de
prévision.
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif
du comportement d’un participant correspond au modèle le plus performant) sera
supérieure au hasard.
144
MÉTHODE
Participants. L’échantillon se compose de 24 étudiant(e)s de l’Université Laval,
soit 10 hommes et 14 femmes. Une compensation financière de 10$ par session
expérimentale est remise aux participants (donc 40$ pour les quatre sessions). Tous les
participants rapportent une vision normale ou corrigée.
Devis expérimental. La manipulation des facteurs intra-sujets force d’association
extrinsèque (faible [m = .44, SD = .17]; élevée [m = .86, SD = .15]) et autocorrélation du
critère (faible [m = .12, SD = .13]; élevée [m = .81, SD = .18]) engendre un plan
expérimental à mesures répétées 2 × 2. Les participants réalisent l’ensemble des conditions
expérimentales. Le nombre d’indices extrinsèques est tenu fixe à sept. Les conditions sont
contrebalancées entre les participants. La Erreur ! Source du renvoi introuvable.
représente la valeur de chacune des variables pour les 41 tours de la simulation en fonction
de la condition expérimentale.
Procédure. La procédure est la même que celle employée lors de l’Expérience 1
décrite précédemment.
RÉSULTATS
À l’instar de l’Expérience 1, les résultats sont organisés en quatre sections. La
première consiste à décrire les résultats de manière générale. La seconde section concerne
quant à elle à l’analyse de la performance des participants, tant absolue que relative au
jugement linéaire. Cette seconde section est directement associée à l’hypothèse H2 :
H2 : La performance des participants à la tâche de prévision sera supérieure à
celle atteinte par le modèle de jugement linéaire.
La troisième section concerne l’analyse de l’adéquation entre les prévisions des participants
et les prévisions des modèles en fonction des conditions expérimentales. Comparativement
à l’Expérience 1, les facteurs manipulés dans l’Expérience 2 ont démontrés, lors de
simulation computationnelles, qu’ils ont un impact significatif sur la performance des
stratégies. Conséquemment, une modulation de stratégie des participants serait
145
particulièrement pertinente dans ce contexte. Ces analyses sont directement en lien avec
l’hypothèse H3 :
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle
donnée variera significativement en fonction des caractéristiques de la tâche de
prévision.
Finalement, la quatrième section concerne l’analyse du niveau d’adaptabilité et est en lien
avec l’hypothèse H4 :
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif
du comportement d’un participant correspond au modèle le plus performant) sera
supérieure au hasard.
Description. La Figure 39 illustre un exemple de prévision des participants en
comparaison avec la série temporelle critère.
Figure 39. Exemple des réponses données par un sous-ensemble de 13 participants (gris) comparativement à
la série temporelle critère (noire).
0
2
4
6
8
10
12
14
16
18
20
t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40
146
Les prévisions d’un sous-ensemble de 13 participants sont montrées en gris alors
que la série temporelle à prédire est représentée en noir. Notez que les prévisions sont loin
d’être exactes et qu’elles sont distribuées autour de la série temporelle critère,
particulièrement en comparaison à celles de l’Expérience 1. Une distribution similaire des
prévisions est observée pour l’ensemble des séries temporelles à prédire. C’est l’écart entre
les prévisions des participants et la série temporelle critère qui correspond à la performance
de prévision.
Performance comparative au modèle linéaire. Une première analyse se concentre
d’abord sur la performance des participants, puis sur la comparaison de celle-ci avec celle
d’un jugement linéaire. Les données de deux participants ont été retirées puisque leur
performance était à plus de trois écart-types sous la moyenne. Les moyennes et erreurs
quadratiques moyennes par condition expérimentale sont représentées dans la Figure 40.
Suite à une première inspection visuelle, on remarque que la performance semble nettement
inférieure dans les conditions où l’autocorrélation est faible comparativement à celles où
elle est forte.
Une ANOVA à mesures répétées 2 2 est effectuée sur la performance selon le la
force d’autocorrélation et la force d’association extrinsèque. Les résultats montrent un effet
significatif de la force d’autocorrélation sur la performance F(1,21) = 124.03, p < .001,
= .855. La performance moyenne observée est clairement plus faible dans les conditions
d’autocorrélation faible comparativement aux conditions d’autocorrélation élevée. L’effet
de la force d’association extrinsèque sur la performance est également significatif F(1,21) =
12.57, p = .002, = .374. La performance est moins élevée dans les conditions de force
d’association extrinsèque faible comparativement aux conditions de force d’association
extrinsèque élevée. L’effet de l’interaction des facteurs sur la performance est non
significatif F(1,21) < 1, N.S.
147
Figure 40. Performance moyenne des participants par condition expérimentale (force d’autocorrélation et
force d’association extrinsèque). La performance correspond à la proportion de variance expliquée des séries
temporelles par les prévisions des participants.
Gain de performance. Deux analyses sont effectuées : la première consiste à
analyser l’ampleur du gain de performance (représentée par condition dans la Figure 41)
alors que la seconde se concentre sur la fréquence à laquelle les participants sont meilleurs
que le modèle linéaire. Suite à une inspection visuelle, on constate que seules les conditions
d’autocorrélation forte affichent une moyenne supérieure à zéro. Un test-t est réalisé afin de
vérifier si les gains de performance moyens observés pour ces conditions sont différents de
zéro. Le test-t révèle que la différence pour la condition autocorrélation forte – association
extrinsèque forte est non-statistiquement significative t(21) = 1.69, non significatif. Donc
on ne peut rejeter l’hypothèse nulle selon laquelle la moyenne du gain de performance pour
cette condition est différente de zéro. La moyenne de gain de performance pour la condition
autocorrélation forte – association extrinsèque faible est significativement différente de
zéro t(21) = 3.77, p = .001. On peut donc rejeter l’hypothèse nulle selon laquelle la
moyenne de gain de performance pour cette condition est différente de zéro.
148
Figure 41. Gain de performance moyen des participants par condition expérimentale (autocorrélation et force
d’association extrinsèque). Le gain de performance correspond à la différence entre la performance des
participants et de celle obtenue par l’application parfaite du modèle de jugement linéaire.
Une ANOVA à mesures répétées 2 2 est effectuée sur le gain moyen selon le
nombre d’indices extrinsèque et la force d’association extrinsèque. Les données de deux
participants ont été retirées puisque leur performance pour deux des conditions était à plus
de trois écart-types sous la moyenne. Les résultats montrent que l’effet de la force
d’association extrinsèque F(1,21) = 30.26, p < .001, = .590 et de la force
d’autocorrélation F(1,21) = 21.52, p < .001, = .506 sur la moyenne du gain de
performance sont statistiquement significatifs. En effet, le gain moyen de performance est
supérieur lorsque la force d’association extrinsèque est faible comparativement à
lorsqu’elle est élevée et est plus élevée lorsque la force d’autocorrélation est forte
comparativement à lorsqu’elle est faible. L’effet de l’interaction des facteurs est non
significatif. La Figure 42 représente la fréquence de gain de performance par participant.
Les participants sont ordonnés en rang et la fréquence maximum est de 32 (32 séries
temporelles).
149
Figure 42. Fréquence de gain de performance par participant. Tous les participants ont obtenus une
performance supérieure à celle du modèle de jugement linéaire à au moins neuf reprises sur une possibilité de
trente-deux.
La fréquence par participant et par condition expérimentale est ensuite calculée et
divisée par le maximum possible (c’est-à-dire, 32, le nombre de séries temporelles). Les
fréquences sont donc représentées entre zéro et un. Une série de tests-t est réalisée afin de
vérifier si la fréquence moyenne de gain obtenue par les participants est différente de zéro.
Les tests-t révèlent que toutes les différences sont statistiquement significatives (voir
Tableau 37).
Tableau 37
Test-t à un échantillon entre fréquence de gain et valeur test de zéro.
Condition t dl p
Force d'association forte – Autocorrélation forte 20.46 23 < .001
Force d'association faible - Autocorrélation forte 12.62 23 < .001
Force d'association forte - Autocorrélation faible 6.13 23 < .001
Force d'association faible - Autocorrélation faible 6.81 23 < .001
Une ANOVA à mesures répétées 2 2 est effectuée sur la fréquence moyenne de
gain selon la force d’autocorrélation et la force d’association extrinsèque. Les résultats
montrent que seul l’effet de la force d’autocorrélation sur la fréquence de gain est
statistiquement significatif F(1,23) = 39.27, p < .001, = .631. En effet, la fréquence de
0
4
8
12
16
20
24
28
32
p1
8
p1
p9
p2
0
p7
p1
4
p2
3
p2
p1
3
p1
7
p8
p1
2
p1
6
p4
p2
4
p1
1
p1
0
p1
9
p2
1
p5
p6
p1
5
p2
2
p3
Fré
qu
en
ce d
e g
ain
(/3
2)
Participant
150
gain est supérieure lorsque la force d’autocorrélation est élevée, comparativement à
lorsqu’elle est faible. Les effets de la force d’association extrinsèque et de l’interaction des
facteurs sont non significatifs (voir Figure 43).
Figure 43. Fréquence de gain standardisée par condition expérimentale (force d’autocorrélation et force
d’association extrinsèque). Les tests-t révèlent que les fréquences sont supérieures à zéro pour l’ensemble des
conditions expérimentales.
Adéquation aux modèles. Pour chacune des 32 séries temporelles et chacun des 24
participants, les prévisions des six modèles sont comparées aux prévisions des participants
avec un test-t pour échantillons pairés (donc = 4608 comparaisons). Ce premier
effort de sélection permet de réduire le nombre moyen de modèles plausibles à 4.11 par
série temporelle. En d’autres mots, suite à cette sélection, en moyenne environ quatre
modèles demeurent représentatifs du comportement des participants pour la prévision d’une
seule série temporelle. Un effort supplémentaire de sélection de modèle est donc nécessaire.
Ainsi, la PVE doit être supérieure à .95 pour que le modèle soit conservé. La sélection
finale réduit le nombre plausible de modèles à 0.22 par série temporelle. Le Tableau 38
montre la fréquence de représentativité de chacun des modèles pour l’ensemble des 32
séries temporelles par participant. Notez que la somme de représentativité des modèles par
151
participant n’égale pas nécessairement le nombre total de séries temporelles pour les
raisons mentionnées précédemment.
Tableau 38
Fréquence de représentativité des modèles par participant.
Participant ANC1 ANC2 L&V1 L&V2 L&V3 ML
P1 0 1 0 0 0 0
P2 2 3 2 1 0 1
P3 1 4 0 1 0 5
P4 1 0 1 1 0 2
P5 0 3 0 1 0 4
P6 1 4 1 0 0 2
P7 0 2 0 1 0 1
P8 1 4 1 1 0 1
P9 0 3 0 1 0 2
P10 1 4 1 1 0 2
P11 1 3 1 1 0 1
P12 0 4 0 0 0 2
P13 0 1 0 1 0 3
P14 1 4 1 0 0 1
P15 0 4 0 1 0 3
P16 2 5 2 1 0 1
P17 2 2 2 1 0 1
P18 1 3 1 0 0 0
P19 1 3 1 1 0 3
P20 0 3 0 0 0 1
P21 2 6 2 1 0 4
P22 0 2 0 0 0 1
P23 0 4 0 1 0 1
P24 1 2 1 1 0 1
Moyenne 0.75 3.08 0.71 0.71 0.00 1.79
Représentativité des modèles. Notez que le modèle L&V3 n’est jamais représentatif
du comportement des participants au cours de l’expérience. Pour cette raison, il sera retiré
des analyses subséquentes. Une série de tests-t pour échantillons uniques est exécutée afin
152
de vérifier si la fréquence de représentativité des autres modèles est différente de zéro. Les
analyses révèlent que les fréquences sont toutes différentes de zéro (voir Tableau 39).
Tableau 39
Test-t à un échantillon entre fréquence d’utilisation des modèles et valeur test de zéro.
Modèle t dl p
ANC1 4.98 23 < .001
ANC2 11.20 23 < .001
L&V1 4.62 23 < .001
L&V2 7.47 23 < .001
ML 6.83 23 < .001
Une ANOVA à mesures répétées sur la fréquence de représentativité des stratégies
avec le modèle comme facteur répété (5 niveaux) est réalisée afin de vérifier si il existe une
différence significative dans la représentativité des modèles, indépendemment de la
condition expérimentale. Les résultats montrent que l’effet du modèle sur la fréquence de
représentativité est statistiquement significatif F(4,92) = 34.225, p < .001, = .598. Afin
de localiser la source de cette différence, une série de comparaisons pairées est réalisée.
Une correction Bonferroni est appliquée pour éviter l’inflation des risques d’une erreur
alpha. L’analyse, résumée dans le Tableau 40, révèle que seuls les modèles ANC2 et ML
sont significativement plus représentatifs du comportement humain comparativement aux
autres modèles. De plus, ANC2 est significativement plus représentatif du comportement
humain que le ML. La représentativité des modèles ANC1, L&V1 et L&V2 n’est pas
significativement différente entre eux.
153
Tableau 40
Différences moyennes absolues de la fréquence de représentativité des modèles. Les
différences non significatives sont ombragées.
ANC2 L&V1 L&V2 ML
ANC1 2.33** 0.04 0.04 1.04*
ANC2
2.38** 2.38** 1.29**
L&V1
0.00 1.08*
L&V2
1.08**
* p < .05
** p < .01
Impact des conditions expérimentales sur la représentativité des modèles. La
proportion de représentativité correspond au nombre de fois où un modèle est représentatif
du comportement humain divisé par le nombre de fois maximum où cela pourrait se
produire (par condition expérimentale). Les proportions moyennes de représentativité du
comportement des participants par condition et modèle sont rapportées dans la Figure 44
(les barres d’erreur indiquent l’erreur quadratique moyenne).
Pour chacun des modèles à l’exception de L&V3, une ANOVA à mesures répétées
2 2 est effectuée sur la proportion de représentativité selon le nombre d’indices
extrinsèques et la force d’association extrinsèque. Le seuil de signification est fixé à .01
(.05/5) pour éviter l’inflation du nombre d’erreur alpha.
ANC1. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité
du modèle ANC1 selon le nombre d’indices extrinsèque et la force d’association
extrinsèque. L’analyse montre que l’effet de l’autocorrélation sur la représentativité est
statistiquement significatif F(1,23) = 18.76, p < .001, = .449. En effet, la proportion de
représentativité du modèle ANC1 est significativement plus élevée lorsque
l’autocorrélation est élevée que lorsqu’elle est faible. Ni l’effet de la force d’association
F(1,23) < 1, ni celui de l’interaction des facteurs F(1,23) < 1 ne sont significatifs.
154
Figure 44. Proportion moyenne de représentativité des modèles par condition expérimentale (autocorrélation
et force d’association extrinsèque) et modèle.
ANC2. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité
du modèle ANC2 selon l’autocorrélation et la force d’association extrinsèque. L’analyse
montre que l’effet de l’autocorrélation sur la représentativité du modèle est statistiquement
significatif F(1,23) = 125.45, p < .001, = .845. En effet, les résultats montrent que le
155
modèle ANC2 n’est jamais représentatif du comportement humain dans les conditions de
faible autocorrélation alors qu’une proportion significative est observée dans les conditions
d’autocorrélation forte. L’effet de la force d’association sur la représentativité du modèle
ANC2 est aussi significatif F(1,23) = 21.29, p < .001, = .481, la proportion de
représentativité du modèle ANC2 étant supérieure dans les conditions de force
d’association extrinsèque élevée comparativement aux conditions de force d’association
faible. L’effet d’interaction des facteurs est également significatif F(1,23) = 21.29, p <
.001, = .481. Cet effet s’explique par l’absence totale de représentativité de ce modèle
dans les conditions d’autocorrélation faible. Pour cette raison, une diminution de la
proportion de représentativité du modèle ANC2 est observée entre force d’association forte
à faible, mais seulement dans les cas où l’autocorrélation est forte.
L&V1. Une ANOVA à mesures répétées 2 2 est effectuée sur la proportion de
représentativité du modèle L&V1 selon l’autocorrélation et la force d’association
extrinsèque. Les résultats montrent que seul l’effet d’autocorrélation est significatif F(1,23)
= 21.37, p < .001, = .482. La représentativité du modèle L&V1 est significativement
plus faible dans les conditions d’autocorrélation faible comparativement aux conditions
d’autocorrélation forte. L’effet de la force d’association extrinsèque F(1,23) < 1 et de
l’interaction des facteurs F(1,23) < 1, sur la proportion de représentativité du modèle L&V1
sont non significatifs.
L&V2. Une ANOVA à mesures répétées 2 2 est effectuée sur la proportion de
représentativité du modèle L&V2 selon l’autocorrélation et la force d’association
extrinsèque. Les résultats montrent que l’effet de l’autocorrélation F(1,23) = 55.86, p <
.001, = .708, de la force d’association extrinsèque F(1,23) = 55.86, p < .001,
= .708,
et de l’interaction des facteurs F(1,23) = 55.86, p < .001, = .708, sur la proportion de la
représentativité du modèle L&V2 sont significatifs. Ce patron de résultat (c’est-à-dire, Fs
identiques), est causé par le fait qu’on observe une représentativité non nulle du modèle
L&V2 pour une des quatre conditions. Ainsi, la représentativité de ce modèle n’est
significativement différente de zéro que dans le cas où l’autocorrélation est forte et que
l’association extrinsèque est faible.
156
ML1. Une ANOVA à mesures répétées 2 2 est effectuée sur la proportion de
représentativité du ML1 selon l’autocorrélation et la force d’association extrinsèque. Les
résultats montrent que l’effet de l’autocorrélation F(1,23) = 19.12, p < .001, = .454, de
la force d’association extrinsèque F(1,23) = 36.58, p < .001, = .614, et de l’interaction
des facteurs F(1,23) = 25.71, p < .001, = .528, sur la proportion de représentativité du
ML1 sont significatifs. Des comparaisons pairées multiples sont effectuées pour
décomposer l’interaction (voir Tableau 41).
Tableau 41
Décomposition de l’interaction ML1.
Comparaison t dl p d’
Force d'association forte – Autocorrélation forte vs.
Force d'association faible – Autocorrélation forte 5.89 23 < .001 1.20
Force d'association forte - Autocorrélation faible vs.
Force d'association faible – Autocorrélation faible 0 23 1.000 0
Force d'association forte - Autocorrélation forte vs
Force d'association forte – Autocorrélation faible .569 23 .575 .12
Force d'association faible - Autocorrélation forte vs
Force d'association faible - Autocorrélation faible 6.73 23 < .001 1.37
Les résultats montrent que la proportion de représentativité du ML1 augmente entre
force d’association forte à faible, mais seulement lorsque l’autocorrélation est forte. De
plus, la proportion de représentativité du ML1 est significativement plus élevée lorsque
l’autocorrélation est forte, mais seulement lorsque la force d’association extrinsèque est
faible.
Adaptabilité. La proportion à laquelle les modèles représentatifs correspondent au
modèle le plus performant est utilisée comme mesure d’adaptabilité des participants. Une
analyse de corrélation révèle que la mesure d’adaptabilité est corrélée avec la fréquence
moyenne de gain r(22) = .65, p < .001 et le gain moyen4 r(20) = .48, p = .025. Une analyse
par condition expérimentale est également effectuée afin d’établir si le niveau
4 Les données de deux participants ont été retirées pour cette analyse parce que leur score était à plus de trois
écart-types sous la moyenne.
157
d’adaptabilité est affecté par celles-ci. La Figure 45 représente l’adaptabilité par condition
expérimentale. Une ANOVA à mesures répétées 2 2 est effectuée sur la mesure
d’adaptabilité selon l’autocorrélation et la force d’association extrinsèque. Les résultats
montrent que l’effet de l’autocorrélation F(1,23) = 44.24, p < .001, = .658, de la force
d’association extrinsèque F(1,23) = 11.5, p = .003, = .333 et l’effet d’interaction des
facteurs F(1,23) = 13.07, p < .001, = .362 sur l’adaptabilité sont significatifs.
Figure 45. Adaptabilité par condition expérimentale (autocorrélation et force d’association extrinsèque).
Des comparaisons pairées multiples sont effectuées pour décomposer l’interaction
(voir Tableau 42). L’analyse montre que l’adaptabilité diminue entre association forte et
faible seulement lorsque l’autocorrélation est forte. De plus, l’adaptabilité est plus élevée
lorsque l’autocorrélation est forte comparativement à lorsqu’elle est faible, peu importe la
force d’association extrinsèque.
158
Tableau 42
Décomposition de l’interaction adaptabilité.
Comparaison t dl p d’
Force d'association forte – Autocorrélation forte vs.
Force d'association faible – Autocorrélation forte 3.89 23 .001 .79
Force d'association forte - Autocorrélation faible vs.
Force d'association faible – Autocorrélation faible 0 23 1.000 0
Force d'association forte - Autocorrélation forte vs
Force d'association forte – Autocorrélation faible 6.382 23 < .001 1.30
Force d'association faible - Autocorrélation forte vs
Force d'association faible - Autocorrélation faible 3.680 23 .001 .75
DISCUSSION
H2 : La performance des participants à la tâche de prévision sera supérieure à celle
atteinte par le modèle de jugement linéaire.
H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle donnée
variera significativement en fonction des caractéristiques de la tâche de prévision.
La présente expérience manipule la qualité des indices intrinsèques et extrinsèques,
de façon à vérifier si les participants sont capables d’adapter leurs stratégies. À cet égard, la
représentativité des prévisions des participants par les modèles formalisés dans la présente
thèse est passablement faible comparativement à l’Expérience 1. Entre autres, une des
instances de l’heuristique de limites et vraisemblance (L&V3) n’est représentative d’aucune
des prévisions des participants dans le cadre de la présente expérience. En fait, les seules
conditions dans lesquelles les modèles formalisés sont représentatifs des prévisions
humaines sont celles qui sont caractérisées par un niveau d’autocorrélation élevé. Aucun
des modèles d’heuristique n’est représentatif du comportement humain lorsque
l’autocorrélation du critère est faible, alors que le ML1 l’est très faiblement. Toutefois, cela
ne signifie pas que les prévisions des participants sont moins performantes qu’une règle de
jugement linéaire. D’ailleurs, la fréquence de gain montre que les participants arrivent tout
de même à mieux performer qu’une règle de jugement linéaire même dans les conditions de
faible autocorrélation.
159
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif du
comportement d’un participant correspond au modèle le plus performant) sera supérieure
au hasard.
Il semble aussi toujours y avoir un certain niveau d’adaptation des stratégies
employées. En effet, lorsque le niveau d’autocorrélation du critère est élevée, une
diminution de la force d’association extrinsèque mène à une diminution de la
représentativité des prévisions des participants par les heuristiques n’utilisant que la source
intrinsèque d’information au profit des stratégies qui misent à la fois sur la source
intrinsèque et la source extrinsèque (c’est-à-dire, L&V2 et ML). L’adoption de stratégies
basées en partie sur la source extrinsèque d’information alors que la qualité de cette
dernière diminue est particulièrement difficile à expliquer. Le modèle de sélection de
stratégie de Rieskamp et Otto (2006) apporte toutefois une explication potentielle. En effet,
selon ce modèle, les individus compareraient l’utilité de la stratégie actuelle par rapport à
l’utilité attendue des autres stratégies possibles. Ils changeraient de stratégie lorsque l’utilité
attendue d’une stratégie dépasserait l’utilité de la stratégie actuelle, or, l’utilité de toutes les
stratégies dans le contexte de cette expérience était limitée, ainsi il est probable que les
participants changent de stratégie en espérant en adopter une meilleure.
Les stratégies adoptées pour les conditions où la qualité des indices intrinsèques et
extrinsèques est faible demeurent toutefois nébuleuses. Il semble bien que les stratégies
adoptées soient adaptées étant donné le gain de performance, mais les faibles niveaux de
représentativité de l’ensemble des modèles et le faible niveau d’adaptabilité suggèrent que
les stratégies modélisées dans le cadre de la présente thèse ne permettent pas d’expliquer la
stratégie employée par les participants dans ce contexte. Ce patron de résultats mixte
indique qu’il semble y avoir, dans un nombre de cas plus limité que l’Expérience 1, un gain
de performance par rapport à une règle de jugement linéaire, qui est partiellement
attribuable à la sélection adaptée des stratégies modélisées, mais que d’autres stratégies (ou
combinaison de stratégies) non identifiées sont probablement en jeu ou encore que les
individus appliquent leur stratégie de manière inconstante.
160
Discussion Chapitre III
Le présent chapitre étudie l’adoption de stratégies cognitives (heuristiques ou
jugement linéaire) pour la prévision de séries temporelles sous des conditions variées de
qualité d’information. L’objectif est d’explorer si dans certains contextes, les individus
utilisent des stratégies simplificatrices de manière adaptée, menant à des performances au
moins équivalentes au modèle de jugement linéaire. Trois sous-objectifs sont étudiés :
évaluer si la performance des participants est égale ou supérieure à celle du modèle de
jugement linéaire; identifier quelles sont les stratégies employées par les participants; et
vérifier si ces stratégies sont adaptées.
H2 : La performance des participants à la tâche de prévision (telle que mesurée par la
proportion de variance expliquée) sera supérieure à celle atteinte par le modèle de
jugement linéaire.
Les Expériences 1 et 2 suggèrent que la performance des individus dans la prévision
de séries temporelles complexes n’est pas toujours inférieure ou égale à celle obtenue grâce
à l’application d’une règle de jugement linéaire, postulée comme la norme rationnelle dans
ce contexte (Muth 1961; Hogarth & Karelaia, 2008). Par contre, bien que ce phénomène se
produise à plusieurs reprises, le gain de performance par rapport au jugement linéaire est
minime. Ces observations indiquent que, bien qu’il soit possible d’atteindre une
performance équivalente ou supérieure au modèle de jugement linéaire dans la prévision de
séries temporelles, les heuristiques peuvent aussi mener à des performances nettement sous
optimales si elles sont utilisées au mauvais moment (voir aussi Boyd, 2001; Ying Luo,
2013).
H3 : L’adéquation moyenne (telle que mesurée par la proportion de variance expliquée)
des prévisions humaines pour une stratégie décisionnelle donnée variera significativement
en fonction des caractéristiques de la tâche de prévision.
Un autre résultat clé relativement aux objectifs est que les modèles représentatifs du
comportement humain dans ce contexte sont variés. En effet, tous les modèles formalisés
sont représentatifs du comportement humain à un moment ou à un autre. Ceci constitue un
161
appui empirique à l’utilisation de l’heuristique d’ancrage et ajustement (Goodwin &
Wright, 1994; Harvey, 2007; Lawrence et al., 2006; Lawrence & O’Connor, 1995; Reimers
& Harvey, 2011), de limites et vraisemblance (Becker & Leopold-Wildburger, 1996;
Becker et al., 2007) et du jugement linéaire (Hogarth & Karelaia, 2008) pour la prévision
de séries temporelles complexes. De plus, les résultats indiquent que dans les conditions
reproduites dans les Expériences 1 et 2, les participants se comportent le plus souvent
comme s’ils utilisaient une heuristique d’ancrage et ajustement, puis une règle de jugement
linéaire et finalement une heuristique de limites et vraisemblances. Plus précisément, les
données suggèrent que le modèle de l’heuristique d’ancrage et ajustement la plus
fréquemment représentative du comportement humain est celle de Bolger et Harvey (1993).
Dans ce modèle, l’ancrage est constitué de la dernière observation alors que l’ajustement
est composé d’une proportion de la différence entre la plus récente observation et la
précédente. Cela n’est pas surprenant puisque cette version de l’heuristique serait
particulièrement adaptée aux séries temporelles non-stationnaires, ces dernières constituant
la grande majorité des séries au sein de la thèse. Toutefois, les résultats ne permettent pas
de discriminer les deux autres modèles de l’heuristique d’ancrage et ajustement, c’est-à-dire
ceux d’Andreassen (1990) et Lawrence et O’Connor (1993), puisqu’ils mènent toujours aux
mêmes prévisions. Plus de travaux seraient nécessaires afin de bien les discriminer.
En ce qui concerne l’heuristique de limites et vraisemblances, deux modèles
semblent être représentatifs du comportement humain dans le contexte de la thèse. Becker
et ses collègues (1996; 2007) proposent plusieurs modèles de l’heuristique variant
essentiellement sur le nombre d’indices extrinsèques intégrés au sein d’une règle linéaire.
D’ailleurs, cette représentation linéaire des indices constitue une sérieuse limite à
l’application de cette « heuristique » puisque la complexité augmente à chaque nouvel
indice intégré jusqu’à être au moins aussi complexe qu’une règle pure de jugement linéaire.
Les deux versions représentatives du comportement humain sont d’ailleurs celles qui ont un
nombre limité d’indices intégrés (un ou deux) alors que la version non représentative en
comporte huit. Les seules rares occasions où ce modèle représente le comportement humain
sont lorsque le nombre d’indice est de quatre. Considérant les limites cognitives humaines
en mémoire active (Halford et al., 1998; Halford et al., 2005), Becker, Leitner et Leopold-
Wildburger, 2007 prévoyaient eux-mêmes une chute de la représentativité de leur modèle
162
au-delà de quatre indices. Les résultats de la thèse constituent donc un appui empirique à
leur hypothèse. Une autre observation impliquant cette heuristique concerne sa faible
représentativité du comportement humain de façon générale comparativement aux autres
stratégies modélisées alors que certaines études ont observé un niveau élevé d’adéquation
aux prévisions humaines (Becker et al., 2007). Une explication possible est que cette
heuristique repose sur l’extraction rapide de propriétés gestaltiques visuelles des séries
temporelles (Becker & Leopold-Wildburger, 1996). En effet, selon la proposition initiale,
les indices extraits de la série temporelle (par exemple, le nombre de maximum locaux
passés) le sont facilement lorsque la série temporelle est représentée visuellement alors
qu’elles ne sont pas facilement extraites lorsque celle-ci est représentée numériquement, or,
dans la présente thèse le format de présentation des séries n’était pas favorable à
l’utilisation de cette heuristique. Il est donc possible que cette différence dans le format de
présentation des données mène à une représentativité réduite de cette heuristique.
Les résultats montrent aussi que les participants se comportent relativement
fréquemment comme s’ils utilisaient une règle de jugement linéaire, particulièrement
lorsque le nombre d’indices est faible. Ce résultat est cohérant, toujours en considérant les
limites fondamentales en mémoire active (Halford et al., 1998; Halford et al., 2005). La
forte représentativité de cette stratégie démontre que malgré l’importance des heuristiques
simplificatrices (Todd & Gigerenzer, 2000; Goldstein & Gigerenzer, 2009; Gigerenzer et
al., 1999), le jugement linéaire demeure une stratégie représentative du comportement
humain, et ce, même au sein d’une tâche relativement complexe comme celle étudiée dans
la présente thèse. À la lumière d’une approche de rationalité écologique, ce résultat indique
qu’il ne faut pas rejeter les modèles « rationnels » traditionnels comme le jugement linéaire,
mais plutôt que ceux-ci font partie intégrante du coffre à outils cognitif des humains. Ces
modèles demeurent représentatifs d’une bonne proportion des prévisions humaines dans le
contexte de la thèse en plus d’être performant sous certaines conditions, à l’instar des
heuristiques plus simples.
Les résultats suggèrent également que le comportement des individus change en
fonction de la qualité des sources d’information disponibles pour réaliser le jugement. Ce
changement de stratégie en fonction des caractéristiques de l’environnement constitue la
163
base d’une approche de coffre à outils cognitif (Todd & Gigerenzer, 2000; Goldstein &
Gigerenzer, 2009; Gigerenzer et al., 1999), or, dans la présente thèse, la représentativité de
l’ensemble des modèles varie en fonction des conditions expérimentales. Entres autres, une
diminution de la qualité des indices de source intrinsèque mène à une diminution marquée
de la représentativité de l’ensemble des modèles (heuristiques et jugement linéaire) pour la
prévision des séries temporelles. Les stratégies employées par les participants dans ces
conditions (c’est-à-dire, lorsque la qualité des indices intrinsèques est faible) demeurent
inconnues et davantage de travaux seraient nécessaires pour les identifier.
H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif du
comportement d’un participant correspond au modèle le plus performant) sera supérieure
au hasard.
Le patron de résultat suggère que les participants ont bel et bien appliqué une
stratégie et n’ont pas fait de prévision au hasard. En effet, le changement de stratégie, que
la stratégie soit identifiée ou non, semble adaptée, permettant l’atteinte de performances au
moins équivalentes au jugement linéaire dans plusieurs cas. Cela est essentiel et constitue la
pierre angulaire de la rationalité écologique (Dieckmann & Rieskamp, 2007; Rieskamp &
Otto, 2006; Rieskamp & Reimer, 2007). Selon le principe de rationalité écologique, il ne
suffit pas de moduler ses stratégies en fonction des caractéristiques de l’environnement,
mais il faut en plus que ce changement soit adapté, permettant l’atteinte de performance
supérieure. La proportion relativement élevée d’adaptabilité des participants dans
l’Expérience 1 et la corrélation entre cette mesure et le gain de performance indique que les
individus ont sélectionné la stratégie optimale pour faire leur prévision et que cette stratégie
était souvent parmi celles modélisées dans la thèse. Par contre, bien que la mesure
d’adaptabilité soit toujours fortement corrélée avec le gain de performance au sein de
l’Expérience 2, la faible proportion d’adaptabilité observée montre que les stratégies
utilisées pour être meilleur que le modèle de jugement linéaire ne font pas parti de celles
modélisées dans la présente thèse. Tel que discuté précédemment, une explication possible
de ce résultat est que les stratégies modélisées misent toutes sur l’utilisation (partiellement
ou en totalité) de la source intrinsèque d’information, or, au sein de la seconde expérience,
164
la qualité de cette source d’information est manipulée de manière à rendre ces stratégies
inefficaces.
165
CHAPITRE IV
RATIONALITÉ ÉCOLOGIQUE ET PRÉVISION
166
Rappel des principaux résultats
L’objectif de la thèse est de combler les lacunes actuelles dans la démonstration du
concept de rationalité écologique en contexte de prévision de séries temporelles.
Précisément, dans un contexte de prévision de séries temporelles complexes, elle cherche à
démontrer (1) la plausibilité de la rationalité écologique (et sous quelles conditions cela est
possible), (2) que les individus changent de stratégies et (3) que ce changement permet
l’atteinte de performance supérieure à la norme rationnelle attendue, c’est-à-dire le modèle
de jugement linéaire.
Le Chapitre II se centre d’abord sur l’atteinte du premier objectif, c’est-à-dire sur
l’établissement de la plausibilité d’une approche de rationalité écologique dans un contexte
de prévision de séries temporelles et sur l’identification des conditions dans lesquelles une
telle approche est possible. À cet égard et en appui à l’hypothèse H1, les résultats des
simulations I et II démontrent que la prévision de la plupart des séries temporelles est plus
précise lorsque faite par des heuristiques simplificatrices (par exemple, Becker et al., 2007;
Gigerenzer & Sturm, 2011; Reimers & Harvey, 2011), comparativement à une stratégie de
jugement linéaire (voir Karelaia & Hogarth, 2008; Hogarth & Karelaia, 2007), remettant
ainsi son statut de norme rationnelle dans ce contexte (initialement établie par Muth, 1961).
De plus, ces simulations constituent une comparaison systématique de la précision de
plusieurs heuristiques en lien avec la qualité des sources d’information présentes dans une
tâche de prévision de séries temporelles (Harvey, 2007). Particulièrement, les simulations
soulignent l’importance de la qualité de la source d’information intrinsèque
comparativement à la source extrinsèque pour la formulation de prévisions précises par la
plupart des stratégies. Cela appuie, dans une certaine mesure, les études antérieures qui
accordaient une importance élevée aux modèles de prévision basés sur cette source
d’information (par exemple, Goodwin & Wright, 1994; Harvey, 2007; Lawrence et al.,
2006; Lawrence & O’Connor, 1995; Reimers & Harvey, 2011). Finalement, ces
simulations permettent de se prononcer sur les conditions dans lesquelles les heuristiques
sont plus performantes que le modèle de jugement linéaire, ou en d’autres mots, de
cartographier le lien entre les heuristiques et les caractéristiques environnementales (Sturm,
2012). Cela est critique pour l’atteinte de l’objectif O1. Particulièrement, les résultats
167
permettent de juger empiriquement de l’importance de l’auto corrélation, de la force
d’association et du nombre d’indices extrinsèques sur l’adaptabilité des heuristiques
comparativement au modèle de jugement linéaire. En effet, une série d’analyses de
régression démontrent (1) qu’un gain de performance de l’heuristique d’ancrage et
ajustement est associée positivement à la force de l’auto corrélation du critère, (2) que la
force d’association extrinsèque est négativement associé au gain de performance de
l’ensemble des heuristiques, et (3) que le nombre d’indices extrinsèques n’a pas
d’incidence sur le gain de performance des heuristiques modélisées. Dans ce contexte, la
norme rationnelle serait ainsi mieux définie par la sélection adaptée et l’application de
stratégies de prévisions simples en fonction des contraintes environnementales, que par
l’adoption d’une règle linéaire unique plus complexe (Gigerenzer & Sturm, 2011).
La démonstration de la plausibilité d’une telle approche par les simulations ne
permet en rien de se prononcer sur son exécution par des humains (Bröder, 2003). Ainsi,
une deuxième collecte empirique, cette fois-ci impliquant des participants humains, visait à
atteindre les objectifs deux et trois, c’est-à-dire (1) d’évaluer si les individus changent de
stratégie et (2) si ce changement permet l’atteinte de performances supérieures au modèle
de jugement linéaire. Les résultats montrent que les participants utiliseraient, dans certains
cas, des stratégies de manières adaptées. En effet, les résultats indiquent d’abord que la
plupart des prévisions réalisées par les participants sont, à l’occasion, plus précises que
celles réalisées à l’aide de l’application pure d’une règle de jugement linéaire (appuie à
H2). Les résultats montrent également que ce gain de performance serait probablement
attribuable au changement adapté de stratégie de prévision par les participants, et ce,
malgré certaines contraintes du traitement cognitif des individus (par exemple, Halford et
al., 2005; Payne et al., 1993; Simon, 1956) (appuie à H3 et H4). En effet, le patron de
représentativité des stratégies suggère que les participants emploieraient des stratégies
différentes selon les caractéristiques environnementales. Le bassin de stratégies disponibles
serait toutefois contraint par le nombre de paramètres au sein des stratégies individuelles.
Plus précisément, la qualité des indices de source intrinsèque et extrinsèque modulerait la
nature de la stratégie employée pour réaliser la tâche, mais les stratégies nécessitant
l’intégration de huit indices seraient inapplicables. Bien que Harvey (2007) discute de
l’influence des sources d’information dans la sélection d’heuristiques, aucune étude n’a
168
testé cette hypothèse directement au sein d’une tâche de prévision temporelle. En effet, les
études antérieures ne comparaient pas plusieurs stratégies simultanément (par exemple,
Bolger & Harvey, 1993), étaient basées sur des données simulées (par exemple, Becker et
al., 2007) ou n’impliquaient pas un devis intra-participant (par exemple, Lawrence et al.,
2006). De plus, la thèse montre l’importance de considérer à la fois les caractéristiques de
l’environnement, les stratégies et les limites cognitives des individus dans l’étude des
prévisions de situations complexes dynamiques. Un autre résultat qui indique que le
changement adapté des stratégies serait responsable du potentiel gain de performance par
rapport au jugement linéaire est le niveau relativement élevé du niveau d’adaptabilité
observé au sein de l’Expérience I. En effet, cette mesure est une indication de la proportion
de séries temporelles prédites par les participants pour lesquelles la stratégie la plus
représentative est aussi la plus performante dans ce contexte. Sans surprise, cette mesure est
fortement corrélée avec le gain de performance. Les moyennes observées pour cette mesure
sont toutefois plus faible lors de l’Expérience II. Les raisons possibles qui expliquent la
diminution de cette mesure malgré le gain de performance observé sont décrites plus loin
dans la discussion.
Contributions théoriques
La rationalité écologique considère que la norme rationnelle attendue d’une tâche
donnée doit être établie de manière relative plutôt qu’absolue en lien avec les
caractéristiques environnementales (Gigerenzer & Sturm, 2011; Sturm, 2012). Selon cette
vision de la rationalité, les contraintes environnementales jouent un rôle important dans le
façonnement du comportement humain. Une règle de jugement optimale est adaptée en ce
sens où elle permet de compenser pour les contraintes environnementales et ainsi atteindre
une performance efficace dans ce contexte précis (Vuckovic et al., 2013). Les résultats de
la présente thèse s’inscrivent dans cette vision de la rationalité puisqu’ils remettent en
question le caractère absolu de la norme rationnelle attendue du jugement linéaire (Muth,
1961) et suggèrent que la performance optimale ne peut être obtenue par l’adoption d’une
stratégie unique, mais plutôt par le changement adapté de plusieurs stratégies
simplificatrices.
169
NORME RATIONELLE
À la lumière des résultats de la présente thèse le caractère normatif du jugement
linéaire (Anderson, 1981; Brehmer, 1994; Brunswik, 1952; 1955; Hammond, 1996;
Hogarth & Karelaia, 2007; Karelaia & Hogarth, 2008; Tucker, 1964) dans un contexte de
prévision de séries temporelles (Muth, 1961) est remis en question. Particulièrement, les
résultats des simulations suggèrent que la stratégie la plus performante pour réaliser la
tâche de prévision est rarement la règle de jugement linéaire généralement considérée
comme la norme rationnelle attendue dans ce contexte, que les stratégies les plus
performantes sont fréquemment plus simples (en termes de nombre de paramètres)
comparativement à la stratégie de jugement linéaire et qu’il n’existe pas une stratégie
unique qui permet l’atteinte de performance optimale pour l’ensemble des séries
temporelles à prédire. Ainsi, il semble que la norme rationnelle varie en fonction des
contraintes environnementales, tel que postulé par les tenants de la rationalité écologique
(Gigerenzer & Sturm, 2011; Sturm, 2012).
Comment est-ce possible? C’est-à-dire, comment des stratégies simples, souvent
non compensatoires, peuvent supplanter une stratégie compensatoire complexe? Bien que
cette observation ne soit pas nouvelle (par exemple, Hogarth & Kareleia, 2005, 2007) elle
constitue la base de la rationalité écologique et devait être démontrée dans un contexte de
prévision de séries temporelles. Selon Gigerenzer et Gaissmaier (2011), le caractère adapté
des heuristiques serait attribuable à leur simplicité et par leur modularité. En effet, étant
donné le nombre limité de paramètres au sein de ces stratégies, elles requièrent peu
d’information de l’environnement, peu de connaissances en mémoire sur la structure de
l’environnement, et demande peu de ressources cognitives pour leur exécution (par
exemple, Gigerenzer, 2004; Pohl et al., 2013). En termes de nombre de paramètres, elles
sont donc très simples. Ces caractéristiques semblent bien adaptées aux contraintes des
environnements complexes dynamiques tels que ceux étudiés dans le contexte de la
présente thèse. En effet, les individus qui doivent composer avec de tels environnements
sont contraints par des indices de faible validité (Osman, 2010), des connaissances a priori
sur le système souvent négligeables (Kurtz & Snowden, 2010) et une quantité
d’information à considérer qui excède souvent leurs capacités (Funke, 2001).
170
La diminution du nombre de paramètres au sein d’une règle de jugement sera par
contre associée à une diminution de sa flexibilité (Gigerenzer & Gaissmaier, 2011). Ainsi,
les heuristiques simplificatrices, particulièrement les non compensatoires, seraient moins
flexibles qu’une règle compensatoire de jugement linéaire plus complexe. Plus une
heuristique sera simple, moins elle tentera d’optimiser l’adéquation avec les données
disponibles et plus ses prévisions seront prévisibles, systématiques (Tversky & Kahneman,
1974). Par conséquent, les conditions sous lesquelles une heuristique est performante sont
réduites et précises. En déviant de ces conditions, les heuristiques seront biaisées et
nettement moins performantes qu’une règle plus complexe. Les écart-types de performance
des modèles lors de la seconde simulation illustrent bien ce phénomène en suggérant que
les modèles obtiennent des performances très différentes selon les séries temporelles à
prédire. Ce manque de flexibilité peut a priori sembler être contraire à ce qui serait attendu
d’une norme rationnelle, mais serait en partie compensée par un bassin de stratégies variées
(Bröder & Newell, 2008; Gigerenzer, Todd et al., 1999). En effet, si les individus ont accès
à un bassin de plusieurs stratégies simples variées misant sur des informations différentes, il
leur suffirait de sélectionner la bonne stratégie adaptée au contexte. Les résultats des
simulations montrent d’ailleurs que l’utilisation de stratégies variées permettrait l’atteinte
de performance supérieure à l’utilisation d’une règle unique plus complexe de jugement
linéaire. La sélection de l’heuristique appropriée n’est toutefois pas si évidente. En effet,
une telle sélection présuppose que les caractéristiques environnementales permettent de
discriminer les stratégies en termes de performance (Marewski & Schooler, 2011).
STRATÉGIES ET ENVIRONNEMENT
La vision écologique de la rationalité est basée sur la prémisse que l’efficacité des
stratégies sera déterminée par l’adéquation entre leurs caractéristiques propres et les
caractéristiques de l’environnement (Dieckmann & Rieskamp, 2007; Gigerenzer &
Gaissmaier, 2011; Rieskamp & Otto, 2006; Rieskamp & Reimer, 2007; Todd &
Gigerenzer, 2007). Les simulations présentées dans cette thèse visaient essentiellement à
cartographier ce lien entre les caractéristiques environnementales et les stratégies de
prévisions les plus étudiées en lien avec la prévision de séries temporelles. La cartographie
de ce lien est une entreprise empirique encore à ses balbutiements (Sturm, 2012; Gigerenzer
171
& Gaissmaier, 2011), particulièrement dans un contexte de prévision de séries temporelles
(Bröder, 2003).
Performance des modèles. Les résultats montrent que la précision des stratégies à la
tâche de prévision de séries temporelles est influencée significativement par certaines
caractéristiques environnementales, particulièrement par la qualité des sources
d’information disponible. À l’inverse, le nombre d’indices extrinsèques n’est toutefois pas
associé à la performance des modèles. La forte proportion de variance expliquée par les
régressions sur la performance des modèles indique que les facteurs manipulés au sein de la
thèse, à l’exception du nombre d’indices extrinsèques, sont critiques. Précisément, une
qualité élevée des indices de source intrinsèque est associée à une performance moyenne
supérieure des stratégies comparativement à une qualité plus faible des indices de source
intrinsèque. L’effet de la qualité des indices de source extrinsèque est similaire, mais plus
modéré. En effet, une qualité élevée des indices de source extrinsèque est associée à une
performance moyenne supérieure des stratégies comparativement à une qualité faible des
indices extrinsèques. Toutefois, les coefficients de régression standardisés indiquent que
l’importance de ce facteur sur la performance des stratégies serait au moins trois fois
moindre que la qualité des indices de source intrinsèque. Dans certains cas (c’est-à-dire,
L&V3), l’effet de la qualité des indices extrinsèques est même nul. De plus, lorsque la
qualité des indices de source intrinsèque est élevée, l’impact d’une faible qualité des indices
de source extrinsèque semble annulé, tel qu’en témoigne les résultats de la première
simulation. L’analyse des coefficients du ML1 suggère que cela ne peut pas être
uniquement causé par la plus grande qualité des indices de source intrinsèque relativement
aux indices de source extrinsèque puisque aucune différence statistiquement significative
n’est observée dans la pondération de ceux-ci. C’est-à-dire qu’en moyenne, les indices
intrinsèques et extrinsèques sont aussi valides en lien avec la prévision du critère au sein du
ML1. Ces résultats ne sont pas surprenants puisque la qualité des sources d’information
était théoriquement associée à la discrimination des heuristiques et du modèle de jugement
linéaire dans un contexte de prévision de séries temporelles (Harvey, 2007). De plus, Todd,
Gigerenzer et collaborateurs (2011) identifient dans un contexte plus général de jugement,
mais tout de même similaire à la prévision de séries temporelles, quatre facteurs associés à
la structure de l’environnement susceptibles de moduler la performance des stratégies,
172
parmi lesquels on retrouve la qualité des indices. Ces auteurs identifient aussi la distribution
de la qualité des indices comme étant un facteur potentiellement associé à la performance
des stratégies. Ce facteur est indirectement étudié au sein de la présente thèse puisque la
qualité des indices est variée selon l’origine de ceux-ci (intrinsèque et extrinsèque) plutôt
que par indice. Ainsi, la qualité des indices peut être élevée pour les deux sources, une
seule des deux ou aucune. Tel que mentionné précédemment, aucune étude ne démontrait
systématiquement l’influence des facteurs manipulés au sein de la thèse sur la performance
des stratégies dans un contexte de prévision de séries temporelles (Bröder, 2003).
La principale explication de l’importance des indices de source intrinsèque réside
dans le caractère compensatoire ou non compensatoire des stratégies modélisées. Une
stratégie compensatoire a la possibilité d’utiliser plusieurs sources distinctes d’information
(Bröder & Schiffer, 2006). Ainsi, si la validité d’une des sources d’information est
compromise, une telle stratégie pourra compenser avec une autre source d’information et
obtenir une performance raisonnable. À l’inverse, une stratégie non compensatoire n’a pas
la capacité d’intégrer plusieurs sources d’information distinctes (Elrod et al., 2005; Payne
et al., 1993). Par conséquent, si la validité de la source d’information sur laquelle elle se
base est compromise, une telle stratégie ne pourra pas compenser avec une autre source et
sa performance sera donc elle aussi compromise.
Stratégies non compensatoires. Toutes les stratégies non compensatoires étaient
dans l’incapacité d’utiliser des indices de sources extrinsèques. En effet, les modèles non
compensatoires d’ancrage et ajustement (ANC1, ANC2 et ANC3) et de limites et
vraisemblance (L&V1) sont uniquement basés sur les indices de source intrinsèque. Par
conséquent, la variation de la qualité des indices intrinsèques a un impact important sur la
performance de ceux-ci. Par contre, il est étonnant d’observer un impact, quoique limité, de
la qualité des indices de source extrinsèque sur la performance de ces modèles.
Théoriquement, puisque ces modèles n’utilisent aucunement les indices de source
extrinsèque, la variation de la qualité de ces derniers ne devrait par avoir d’impact sur leur
performance. Cela s’explique potentiellement par le fait que les facteurs manipulés ne sont
pas parfaitement orthogonaux, malgré un niveau de contrôle expérimental le plus élevé
possible (et confirmé par l’analyse des coefficients de ML1). Toutefois, peu importe
173
l’origine de cette observation, la qualité des indices intrinsèques sur la performance du
modèle ANC2 explique 86% de la variance alors que la qualité des indices extrinsèques
n’explique que 2%. Pour la performance de L&V1, 76% de la variance expliquée est
attribuable à la qualité des indices intrinsèques alors que seulement 8% est attribuable à la
qualité des indices extrinsèques. Bref, ces résultats montrent que la stratégie d’ancrage et
ajustement performe nettement mieux dans des environnements ou la qualité des indices
intrinsèques, et plus particulièrement la force d’auto corrélation, est élevée. Cette
observation constitue un appui supplémentaire à la pertinence de cette heuristique dans les
environnements autocorrélés comme c’est fréquemment le cas pour la prévision de séries
temporelles (Goodwin & Wright, 1994; Lawrence et al., 2006; Lawrence & O’Connor,
1995; Reimers & Harvey, 2011). Ces résultats montrent que c’est aussi le cas pour la
version non compensatoire de l’heuristique de limites et vraisemblance (c’est-à-dire,
L&V1).
Stratégies compensatoires. Tous les autres modèles intégrés dans le contexte de la
présente thèse (L&V2, L&V3 et ML1) étaient compensatoires, c’est-à-dire qu’ils avaient la
capacité d’intégrer des indices de source intrinsèque et extrinsèque. Ainsi, une diminution
de la qualité de l’une ou l’autre des sources d’information pourrait théoriquement être
compensée par l’utilisation d’informations plus valides. Toutefois, les résultats des
simulations suggèrent que la qualité des indices intrinsèques demeure plus importante que
la qualité des indices extrinsèques. Tel que discuté précédemment, il est peu probable que
cela soit causé par une validité plus élevée des indices de source intrinsèque
comparativement aux indices de source extrinsèque puisque l’analyse des coefficients de
régression du ML1 indique qu’il n’y avait pas de différence significative dans les poids
moyens attribués à ces deux sources d’information. Cela pourrait donc être expliqué par la
nature de l’intégration des indices de source extrinsèque et par la nature de
l’opérationnalisation de la force d’association extrinsèque. En effet, les coefficients de
régression indiquent que l’effet de la qualité de la source extrinsèque sur la performance
des modèles L&V2 et L&V3 est inférieure comparativement à l’influence de ce même
facteur sur la performance du ML1, or, ces deux classes de modèles (limites et
vraisemblance et jugement linéaire), n’utilisent pas les indices extrinsèques de la même
façon en plus de les pondérer différemment. En effet, l’heuristique de limites et
174
vraisemblance extrait des indices extrinsèques alors que le jugement linéaire utilise la
valeur explicitement disponible des indices extrinsèques. Par conséquent, il est possible que
l’opérationnalisation actuelle de la qualité des indices extrinsèque (déterminée à partir des
valeurs explicitement disponibles) ne soit pas directement associée à la qualité des indices
extraits. Étant donné que la liste actuelle des facteurs modulant la performance des
stratégies est limitée (Gigerenzer & Gaissmaier, 2011; Todd et al., 2011), cette observation
est critique puisqu’elle souligne ainsi l’existence potentielle d’un facteur, c’est-à-dire la
validité des indices extraits.
Nombre d’indices extrinsèques. Contrairement aux autres facteurs manipulés, le
nombre d’indices extrinsèques ne semble pas être un facteur qui influence la performance
des stratégies modélisées dans le contexte de la thèse. Ce résultat est intéressant puisqu’il
signifie que les stratégies qui utilisent plusieurs indices extrinsèques (c’est-à-dire, L&V3 et
ML) ne bénéficient pas de cette option par rapport aux autres stratégies. Toutefois, il ne
faut pas invalider ce facteur comme déterminant de la performance des stratégies. En effet,
le nombre limité d’observations (c’est-à-dire, 40 périodes par série temporelle) est
relativement peu élevé comparativement au nombre d’indices intégrés (c’est-à-dire, huit
indices) au sein des modèles L&V3 et ML1 (Todd et al., 2011). De plus, la force et la
nature des relations entre les variables des situations complexes et dynamiques sont souvent
changeantes (Kurtz & Snowden, 2010). Cela signifie, concrètement, que la valeur d’un
index de corrélation entre deux séries temporelles sera instable dans le temps. Par exemple
pour les 10 premières périodes, une corrélation entre deux séries temporelles pourrait
indiquer une valeur positive, alors qu’elle pourrait être négative pour les 10 périodes
suivantes. Cela limite d’autant plus le nombre d’observations pour lesquelles les données
sont valides. Pour ces raisons, ce facteur risque d’être peu déterminant de la performance
des modèles au sein des situations complexes et dynamiques telles que celles étudiées dans
la présente thèse, toutefois, il pourrait bien se révéler important dans des situations plus
régulières (Karelaia, 2006).
À la lumière de ces résultats, il semble clair que la performance des modèles est
affectée par les facteurs associés à la qualité des indices. Toutefois, les défenseurs de la
rationalité écologique soulignent que non seulement la performance des stratégies est
175
déterminée en fonction des contraintes environnementales (Dieckmann & Rieskamp, 2007;
Gigerenzer & Gaissmaier, 2011; Rieskamp & Otto, 2006; Rieskamp & Reimer, 2007; Todd
& Gigerenzer, 2007), mais que la performance atteinte par des stratégies simples peut être
supérieure à celle obtenue par des stratégies complexes normatives tel que le jugement
linéaire (Sturm, 2012; Gigerenzer & Gaissmaier, 2011).
Discrimination des classes de modèle. Une série d’analyses visait ainsi à évaluer si
les contraintes environnementales permettaient de discriminer les classes de modèles (c’est-
à-dire heuristiques et jugement linéaire) en termes de performance à la tâche de prévision
de série temporelle. Alors que des résultats antérieurs ont déjà démontré que certaines
heuristiques permettaient l’atteinte de performances au moins équivalentes au jugement
linéaire (par exemple, Borges et al., 1999; Boyd, 2001; Ying Luo, 2013; Bolger & Harvey,
1993; Lawrence & O’Connor, 1995), les conditions qui favorisent ce phénomène
demeurent floues et sans cadre interprétatif clair (Todd & Gigerenzer, 2007). Les analyses
soulèvent que seul le gain de performance de trois modèles d’heuristiques semble modulé
de façon significative par les facteurs expérimentaux, c’est-à-dire la force de l’auto
corrélation du critère, la force d’association extrinsèque et le nombre d’indices
extrinsèques. Ces trois modèles sont ANC1, ANC2 et L&V3 (il y a donc quatre modèles,
implicitement, puisque ANC1 et ANC3 ont un comportement identique). Pour ces modèles,
la proportion de variance expliquée par la régression des trois facteurs manipulés sur le gain
de performance varie entre 10% et 20%. Cela ne signifie pas que les autres modèles ne
représentent pas des stratégies potentiellement meilleures que le jugement linéaire, mais
seulement que les conditions sous lesquelles le gain de performance varie ne sont pas
manipulées dans le contexte de la présente thèse. Les paragraphes suivants discutent de
l’implication de chacun des facteurs manipulés dans la discrimination des modèles.
Nombre d’indices extrinsèques. Parmi les observations critiques, on constate que
l’effet du nombre d’indices extrinsèques sur le gain de performance des modèles
d’heuristiques n’est jamais significatif. Sous les conditions de la thèse, le nombre d’indices
extrinsèques n’était pas un facteur discriminant de performance entre les classes de modèle.
Dans un cadre d’interprétation coûts/bénéfices (voir Beach & Mitchell, 1978; Christensen-
Szalanski, 1978; Payne, Bettman, & Johnson, 1988, 1993; Smith & Walker, 1993), ce
176
résultat suggère que la cause de l’abandon du modèle linéaire observé dans plusieurs études
serait probablement davantage liée aux coûts en termes d’efforts cognitifs qu’aux bénéfices
en termes de gain de performance. Ce résultat sera discuté davantage dans la prochaine
section traitant des limites cognitives des individus.
Force d’association extrinsèque. La force d’association extrinsèque est
négativement associée au gain de performance de l’ensemble des modèles de la classe des
heuristiques. Cela suggère que le modèle de jugement linéaire est avantagé
comparativement à l’ensemble des modèles d’heuristiques lorsque les indices extrinsèques
augmentent en validité. Cela n’est généralement pas une surprise en ce qui concerne les
modèles non compensatoires d’ancrage et ajustement (Lawrence & O’Connor, 1995;
Bolger & Harvey, 1993) et L&V1 (Becker & Leopold-Wildburger, 1996) et de limites et
vraisemblance, car ces derniers n’utilisent pas les indices extrinsèques. À l’inverse, ce
résultat est plus surprenant en ce qui concerne les modèles compensatoires, c’est-à-dire les
modèles L&V2 et L&V3 de limites et vraisemblance (Becker et al., 2005; 2007). Toutefois,
comme mentionné précédemment, les modèles de limites et vraisemblance utilisent des
indices extraits plutôt qu’explicitement disponibles au sein de l’environnement en plus de
pondérer les indices de façon différente au ML1. Ces différences pourraient être ce qui
explique la performance supérieure de ML1 comparativement à L&V2 et L&V3.
Auto corrélation du critère. Bien que l’auto corrélation du critère soit fortement
associée à la performance de tous les modèles, est-ce que ce facteur permet également de
les discriminer? Les résultats suggèrent que oui. En effet, plus le critère est auto corrélé,
plus la performance des modèles ANC1 et ANC2 est élevée comparativement au modèle de
jugement linéaire. L’heuristique d’ancrage et ajustement (Bolger & Harvey, 1993;
Lawrence & O’Connor, 1995) utilise la dernière valeur observée pour réaliser sa prévision
alors que le modèle de jugement linéaire base son estimation sur l’ensemble des données
observées jusqu’à présent (Tucker, 1964). Toutefois, comme mentionné précédemment, les
relations entre les variables au sein des environnements complexes et dynamiques sont
souvent changeantes, ce qui limite la validité des observations passées pour la prévision du
futur, or, étant donné que les modèles ANC1 et ANC2 se basent uniquement sur la dernière
177
valeur observée pour réaliser leurs prévisions, ces modèles sont moins vulnérables au
changement de relations que le ML1 (Karelaia 2006).
Territoire non cartographié. En plus de cartographier le lien entre la qualité des
indices et la performance de plusieurs modèles existants, l’étude des caractéristiques des
modèles de jugement en lien avec les caractéristiques de l’environnement a mené
essentiellement à deux constats. Premièrement, il y a un certain vide dans les modèles
proposés, à savoir des modèles non compensatoires misant exclusivement sur des indices
de source extrinsèque. En effet, la plupart des études réalisées en lien avec la prévision de
séries temporelles se concentrent uniquement sur une source unique intrinsèque
d’information (par exemple, Becker & Leopold-Wildburger, 1996; Lawrence & O’Connor,
1995; Bolger & Harvey, 1993). Il est donc normal, dans ce contexte, de suggérer des
modèles qui ne misent que sur cette source d’information. Néanmoins, les individus en
charge des prévisions de séries temporelles au sein de domaines de travail réel, notamment
en finance et en gestion des stocks d’inventaires, ont accès à plusieurs sources
d’information extrinsèque (Leitner & Leopold-Wildburger, 2011). Malgré le fait que
certains auteurs croient que suffisamment de modèles ont été proposés pour expliquer le
comportement humain dans ce contexte (Bröder, 2003), la présente thèse suggère que la
proposition de nouveaux modèles non compensatoires serait justifiée à la fois par la
pertinence écologique et méthodologique. Deuxièmement, les facteurs étudiés dans le
contexte de la thèse étaient d’une importance majeure pour la détermination de la
performance des stratégies. En effet, la qualité des indices intrinsèques et extrinsèques
permettent d’expliquer jusqu’à 90% de la variance des modèles étudiés. Toutefois, ces
mêmes facteurs ne permettent pas d’expliquer une grande proportion de la différence
observée entre la performance du jugement linéaire et des heuristiques (c’est-à-dire,
seulement jusqu’à 20%). Cela peut s’expliquer en partie par la grande similarité des
prévisions entre les modèles. En effet, dans le contexte de la thèse, les modèles mènent à
des prévisions très similaires. Tel que discuté précédemment, cela n’est pas très surprenant
puisqu’il est normal que des stratégies toutes conçues pour réaliser la même tâche y arrivent
au moins avec un certain degré de performance. Par contre, cela signifie aussi que les
différences entre les modèles résultent probablement de patrons d’évolution temporelle
178
spécifiques qui ne sont pas bien représentés par les facteurs manipulés au sein de la thèse.
L’identification de ces conditions précises pourra faire l’objet d’études futures.
Une autre observation discutée n’est pas directement en lien avec les hypothèses de
la thèse, mais est néanmoins importante puisqu’elle permet de situer l’ensemble des
résultats dans leur contexte. Les conditions de prévisions évaluées dans le contexte de la
présente thèse étaient très variées en termes de difficulté. C’est-à-dire que dans certains cas,
la performance des modèles et des participants était très élevée, mais que dans d’autres cas,
cette performance était très faible. Notamment, dans les conditions les plus difficiles, les
prévisions moyennes des participants n’expliquent pas la variance du critère à prédire, mais
comportent même davantage de « bruit » que la série temporelle elle-même (cela est
indiqué par une PVE négative). Dans ces circonstances, on peut considérer que les modèles
et individus sont complètement inefficaces à prédire leur environnement. Qu’en est-il, dans
ce cas, du concept de rationalité? Peut-on vraiment parler de réponse optimale dans ce
contexte ou s’il ne s’agit pas plutôt d’un moindre mal? Cette limite importante pourrait être
associée à un mur de la complexité, c’est-à-dire un point à partir duquel la compréhension
de la situation est impossible pour l’humain. Kurtz et Snowden (2003) ont également
soulevé cette limite et considèrent que ces environnements pour lesquels aucune relation de
cause à effet ne peut être perçue sont chaotiques. Selon leur cadre interprétatif, ces
environnements requièrent un ensemble distinct de stratégies décisionnelles
comparativement aux situations dites complexes. Bien qu’ils ne suggèrent pas
explicitement de stratégies décisionnelles applicables au contexte de la thèse, il serait
intéressant de traduire leurs idées en stratégies modélisables afin de tester si des
performances supérieures peuvent être atteintes.
STRATÉGIES ET INDIVIDU
Bien que les simulations démontrent que des stratégies simples peuvent être plus
adaptées que des stratégies complexes, elles ne permettent pas de se prononcer sur
l’adoption de ces stratégies par les humains (Bröder, 2003). De plus, comme le mentionne
Simon (1992), s’il ne suffisait que d’étudier les caractéristiques de l’environnement pour
comprendre le comportement humain, l’étude des heuristiques serait obsolète. En fait, dans
l’optique du coffre à outils cognitif (Gigerenzer & Selten, 2001; Gigerenzer et al., 1999),
179
l’étude des caractéristiques des stratégies en lien avec les contraintes individuelles permet
d’établir quel est le bassin de stratégies disponibles pour réaliser une tâche donnée. Il est
donc critique de bien caractériser les limites cognitives fondamentales des individus,
puisque celles-ci auront un impact important sur le jugement humain.
Limites cognitives. Les simulations ont démontré que le nombre d’indices
extrinsèques n’était pas un facteur déterminant de la performance, ni du gain de
performance des heuristiques par rapport au jugement linéaire, ni des stratégies modélisées.
Néanmoins, le nombre d’indices semble être un facteur déterminant dans la modulation des
stratégies représentatives du comportement des participants dans le contexte de la présente
thèse. Plus précisément, l’augmentation du nombre d’indices extrinsèques mène à une
diminution de la représentativité du modèle de jugement linéaire et du modèle L&V3 de
limites et vraisemblance conjointement à l’augmentation générale de la représentativité des
autres heuristiques modélisées. Au sein de la thèse, les modèles de jugement linéaire et
L&V3 sont les seuls qui nécessitent l’intégration de tous les indices disponibles. Tel que
mentionné précédemment, ce résultat n’est pas surprenant. La littérature attribue
généralement ce phénomène aux limites fondamentales des individus en termes de
traitement de l’information. En effet, plusieurs travaux de domaines variés indiquent qu’au-
delà d’un certain nombre d’indices (Payne et al., 1993) ou de facteurs en interaction
(Halford et al., 2005), les individus n’arrivent plus à exécuter des règles décisionnelles
complexes rationnelles et utilisent donc des heuristiques simplificatrices (Karelaia &
Hogarth, 2008). Cette vision de l’adoption d’heuristiques simplificatrices correspond
davantage à la rationalité contrainte de Simon (1955; 1956) selon laquelle les individus sont
caractérisés par des limites cognitives fondamentales et par conséquent, ne pourraient pas
adopter de règles décisionnelles optimales. Dans une perspective de rationalité écologique
(Sturm, 2012), ces limites viennent contraindre le bassin de stratégies accessibles aux
individus et doivent être considérées dans l’analyse du jugement humain dans ce contexte.
Forces cognitives. Malgré le bassin contraint des individus, les résultats montrent
également que plusieurs stratégies demeurent accessibles. Bref, la thèse valide la pertinence
cognitive des modèles d’ancrage et ajustement (ANC1, ANC2 et ANC3), de certains
modèles de limites et vraisemblance (L&V1 et L&V2) et même du modèle de jugement
180
linéaire lorsque le nombre d’indices se limite à quatre. Les résultats montrent également
que certaines heuristiques sont peut-être manquantes pour bien décrire le comportement
humain dans un contexte de prévision de séries temporelles. En effet, au sein des conditions
expérimentales les plus complexes, la représentativité générale des stratégies modélisées
chute drastiquement. Ainsi, il existe plusieurs situations où aucune stratégie modélisée ne
représente le comportement humain. Il est possible que les critères sévères de
représentativité employés dans la présente thèse soient responsables de ce résultat. En effet,
pour être jugé représentatif, un modèle doit entre autres expliquer 95% et plus de la
variance du comportement d’un individu, or, il a été démontré que le jugement de individus
devenait de plus en plus inconstant avec la diminution de la prévisibilité d’un
environnement (Karelaia & Hogarth, 2008). Bien que les causes demeurent sujettes à
discussion, cette incohérence pourrait être due à l’essai de plusieurs stratégies différentes
lors de l’exécution de la tâche. Cela serait observé au sein d’environnements difficilement
prévisibles parce que l’atteinte de performance faible influencerait le processus
d’alternance entre les stratégies, les individus obtenant une performance médiocre
souhaiteraient l’améliorer en changeant de stratégie (Rieskamp & Otto, 2006). Au sein de
la présente thèse, une telle adaptation signifierait que les individus alterneraient de
stratégies pendant la prévision d’une même série temporelle plutôt qu’entre les séries
temporelles (voir Anufriev & Hommes, 2012). Étant donné que l’adéquation entre
comportement et modèles de stratégies est calculée par série temporelle, cela aurait pour
effet de diminuer la représentativité de l’ensemble des modèles. Bien que ce soit au-delà
des objectifs de la présente thèse, le développement et la validation d’un modèle de
sélection de stratégies permettant l’alternance de stratégies pendant la prévision d’une
même série temporelle permettrait peut-être de vérifier cette hypothèse. Il est également
possible que la faible représentativité des modèles soit causée par l’absence de modèles clés
pour expliquer le comportement humain dans ces situations. Notamment, tel que mentionné
précédemment, aucun modèle ne concerne l’utilisation unique des indices de source
extrinsèque. La présente thèse ne visait toutefois pas à proposer de nouveaux modèles, mais
plutôt à cartographier la performance des modèles existants. Ainsi, elle souligne l’existence
d’un vide potentiel dans la formalisation des stratégies humaines de prévision de séries
temporelles. Néanmoins, malgré ce « vide », les niveaux moyens de représentativité des
181
modèles sont relativement élevés, ce qui signifie qu’une part raisonnable du comportement
humain est décrite par les modèles actuels. De ce fait, sur la base des stratégies modélisées,
il semble que celles qui soient accessibles en termes cognitifs sont fréquemment les plus
performantes pour la prévision des séries temporelles. La force de la rationalité écologique
réside alors dans la modularité de ces stratégies et dans la sélection adaptée de celles-ci
(Todd & Gigerenzer, 2007), or, les résultats de la thèse appuient fortement que les
individus seraient capables d’adapter leur stratégie de manière efficace en fonction des
caractéristiques environnementales. En effet, les résultats montrent que la fréquence à
laquelle les individus performent mieux que le modèle de jugement linéaire est très élevée
peu importe la condition expérimentale. De plus, particulièrement au sein de la première
expérience, la mesure d’adaptabilité indique que les participants sélectionnent souvent la
stratégie modélisée la plus adaptée dans ce contexte. Ces résultats peuvent sembler
contradictoires en lien avec les travaux antérieurs sur les heuristiques qui ont souvent
démontré que l’utilisation d’heuristiques menait à des biais et des erreurs systématiques
(par exemple, Becker & Leopold-Wildburger, 1996; Becker et al., 2007; Bolger & Harvey,
1993; Eggleton, 1982; Harvey, 2007; Lawrence & Makridakis, 1989; O’Connor et al.,
1997; Reimers & Harvey, 2011; Ying Luo, 2013). Toutefois, de manière absolue, la
performance des individus chute généralement dans les mêmes conditions où il y a abandon
de la représentativité du modèle de jugement linéaire. De plus, la performance relative des
individus par rapport au modèle linéaire reste stable ou même augmente dans ces mêmes
conditions. C’est donc dire que les caractéristiques des environnements dynamiques
complexes sont les principaux facteurs qui influencent la performance des individus, au-
delà des stratégies employées. Cela s’explique par le fait (tel que démontré par les
simulations) que l’application pure du jugement linéaire au sein de ces conditions n’aurait
pas mené à une performance supérieure à l’application d’heuristiques de manière adaptée.
En d’autres mots, bien que les heuristiques mènent à des biais et erreurs systématiques,
elles permettent tout de même une performance au moins équivalente au jugement linéaire.
Néanmoins, en guise de réflexion, il est aussi intéressant de noter que le modèle de
jugement linéaire n’est pas complètement écarté et qu’il possède toujours certaines qualités
comparativement au modèle de rationalité écologique. Particulièrement, le problème de
sélection de stratégie ne se pose pas en ce qui concerne le modèle de jugement linéaire.
182
D’un point de vue théorique, cela représente un avantage non-négligeable. En effet, le
fonctionnement par procuration de ce modèle proposé par Brunswick (1952) décrit
justement cette capacité à se comporter à la fois comme plusieurs stratégies décisionnelles.
Bien que sa capacité en termes de flexibilité est ultimement plus limitée qu’un coffre à outil
de d’heuristiques, le modèle de jugement linéaire arrive tout de même à représenter le
jugement humain raisonnablement dans une grande variété de contextes. De plus, le modèle
de jugement linéaire y arrive avec un nombre de paramètres inférieurs au nombre total de
paramètres incluent dans l’ensemble des heuristiques individuellement. Bref, la présente
thèse souligne la plausibilité d’un modèle de rationalité écologique dans un contexte de
prévision de séries temporelles dynamiques et complexes, mais ne permet en rien d’exclure
le modèle de jugement linéaire du débat.
Implications pratiques
La gestion des inventaires et le marché financier sont deux domaines
particulièrement liés à la tâche étudiée dans la présente thèse (Worthen, 2003; Wang &
Chen, 2009). Il semble donc réaliste de dire que les résultats observés dans le contexte de la
thèse, et particulièrement les implications pratiques de ces résultats, s’appliquent à ces
domaines. Toutefois, le paradigme de prévision de séries temporelles possède plusieurs
propriétés qui caractérisent les situations dynamiques complexes de façon plus générale
(Harvey, 2007). Par exemple, elles sont caractérisées par plusieurs éléments en relation qui
évoluent dans le temps de façon autonome (Brehmer, 1992; Edwards, 1962), la structure
sous-jacente est opaque, c’est-à-dire qu’elle n’est pas explicitement disponibles (Gonzalez,
Vanyukov, & Martin, 2005), les patrons d’évolution temporelle ne se répètent que très
rarement ce qui laisse peu de place pour l’apprentissage (Kurtz & Snowden, 2010; Sterman,
2006), les influences entre les variables qui composent le système sont délayées dans le
temps, ce qui augmente l’incertitude et limite la compréhension des individus (Diehl &
Sterman, 1995), etc. Il semble donc raisonnable de penser que les phénomènes observés
dans le contexte de la thèse puissent être représentatifs de ceux qui se produisent dans des
situations dynamiques complexes autres que la prévision de séries temporelles. D’ailleurs,
des études récentes suggèrent que les individus utiliseraient des heuristiques de manière
183
adaptée dans des contextes de prise de décision en situations complexes dynamiques (par
exemple, la gestion du trafic aérien; Vuckovic et al., 2013).
Plusieurs chercheurs développent des procédures, systèmes d’aide à la décision (par
exemple, Lizotte et al., 2008) ou encore des entraînements cognitifs (par exemple, Faghihi
et al., 2011) dont l’objectif est d’améliorer la performance des individus en charge de telles
situations complexes dynamiques. Plusieurs systèmes experts utilisent entre autres la
technique du « bootstrapping » (par exemple, Lafond et al., 2013; O'Connor et al., 2005).
Cette technique est possible puisqu’un modèle linéaire des décisions d’un individu sera
généralement plus performant que les décisions réelles de ce même individu (Camerer,
1981; Karelaia & Hogarth, 2008). Cela s’explique par le fait qu’un modèle linéaire n’est
pas susceptible d’être influencé par des facteurs externes nuisibles ou une présence accrue
et soudaine de bruit dans les données alors que les individus sont susceptibles de l’être. Par
exemple, un individu pourra être momentanément distrait et omettre de considérer un
indice important, ce que le modèle linéaire ne fera pas. Toutefois, certaines conditions ne
sont pas propices à l’utilisation de cette technique, telles que celles observées dans le
contexte de la présente thèse. En effet, lorsque la qualité des indices est dégradée, ou encore
que la nature de la relation entre les indices et le critère est changeante, une telle approche
ne permettra pas l’atteinte de performance supérieure à celle d’un humain sans aide
(Karelaia & Hogarth, 2008). La raison principale qui explique la diminution des modèles
« bootstraping » sous ces conditions est que la performance des décisions passées n’est pas
garante de la performance des décisions futures étant donné la nature changeante des
relations entre les indices et les critères, or, la présente thèse suggère que dans ces
environnements, l’utilisation adaptée d’un bassin d’heuristiques permet l’atteinte de
performance souvent supérieure au jugement linéaire. Ainsi, il serait pertinent d’évaluer la
faisabilité d’un modèle basé sur le principe du « bootstraping », mais dont l’objet serait la
sélection adaptée de stratégies plutôt que le raffinement de la pondération linéaire des
indices.
Un autre résultat clé de la thèse concerne les limites fondamentales des individus
qui limiteraient le bassin de stratégies disponibles pour la réalisation de leurs tâches. Bien
que ce résultat ne soit pas nouveau en soi (Halford et al., 2005), il confirme l’importance de
184
considérer cet élément en plus des caractéristiques environnementales dans l’étude des
stratégies décisionnelles. Ce résultat est pertinent pour le développement de systèmes
d’aide à la décision puisqu’il indique quelles sont les failles des stratégies actuelles
disponibles aux individus qui doivent être palliées (Arias-Hernandez et al., 2012). Le
développement de stratégies supplémentaires qui ne pourraient pas être exécutées par les
individus en raison de leurs limites cognitives permettrait ainsi d’élargir le bassin de
stratégies disponibles. Par exemple, contextuellement à la présente thèse, un système d’aide
à la décision pourrait consister en une régression linéaire intégrant l’ensemble des indices.
Cette stratégie est difficilement réalisable par les individus, tel qu’observé dans la présente
thèse, mais l’est facilement par un ordinateur, et pourrait permettre, sous certaines
conditions, à l’atteinte d’une performance optimale. Le rôle des individus au sein de tels
systèmes d’aide, serait davantage de sélectionner la stratégie adéquate, qu’elle soit
implémentée dans la technologie, ou disponible en mémoire. Pertinemment à ce rôle de
sélection de stratégie, l’entraînement cognitif des individus en charge de la prévision de
situations dynamiques complexes telles que celles étudiées dans la présente thèse devrait se
concentrer sur la sélection adaptée de stratégies plutôt que sur l’apprentissage de stratégies
(trop) complexes pour être appliquées dans un environnement opérationnel.
Contributions méthodologiques
Comme le mentionnent Gigerenzer et Gaissmaier (2011), « formal models of
heuristics are indispensable for progress, yet remain the exception in psychology ». La
modélisation formelle des stratégies permet de faire des prédictions précises sur leur
comportement dans différents contextes et de les comparer entre elles. Dans le cadre de la
thèse actuelle, cette approche de modélisation est combinée à une approche expérimentale
classique impliquant des sujets humains. Ainsi, il est également possible de comparer le
comportement des individus à celui des modèles simulés afin d’estimer la représentativité
de ces derniers.
Cette approche méthodologique comporte certains avantages comparativement à
l’approche du suivi de processus, par exemple. Le suivi des processus consiste à observer
toutes les actions du participant qui précèdent son jugement dans le but d’établir quelles
185
sont les informations consultées (par exemple, Billings & Marcus, 1983; Matsuka & Corter,
2008; Sayeki, 1969; Sundström, 1987). Le suivi de processus comporte certaines limites,
notamment le fait que ce n’est pas parce qu’une information est consultée qu’elle est
utilisée au sein de la stratégie de prévision. Dans le contexte de la thèse, on compare les
prévisions faites par le participant à celles de plusieurs modèles afin d’évaluer lequel de ces
modèles est représentatif des prévisions humaines. Ainsi, peu importe la nature des
informations consultées, il est possible d’estimer l’adéquation aux différents modèles. De
plus, le suivi des processus ne permet pas toujours d’opérationnaliser avec précision les
stratégies cognitives d’intérêt. Par exemple, elle ne permettra pas de discriminer deux
stratégies qui utilisent les mêmes informations, mais qui les pondèrent de façon différente
(Bröder, 2000, 2003). Avec la technique employée dans la présente thèse, il est possible de
discriminer entre deux stratégies en autant que les prévisions faites par les modèles de ces
stratégies ne soient pas identiques.
Par son approche méthodologique, la présente thèse pourrait également être
bénéfique à certains domaines de recherche connexes, notamment l’étude de la prise de
décision dynamique (voir Brehmer, 1992; Busemeyer, 1999; Gonzalez et al., 2005). En
effet, deux problématiques importantes dans l’étude de la prise de décision dynamique
peuvent potentiellement être mitigées par l’adoption d’une méthodologie semblable à celle
adoptée dans la présente thèse. La première problématique est la perte du contrôle
expérimental sur certaines caractéristiques associées à la complexité causée par l’évolution
distincte des simulations en fonction des décisions de chaque participant. En effet, dans une
tâche de prise de décision dynamique, les décisions des participants ont un impact sur
l’évolution de la situation, si bien que chaque série de décision mènera à une instance
spécifique de la simulation. Cela constitue un problème puisque les caractéristiques
associées à la complexité de la simulation peuvent aussi, dans ces conditions, changer en
cours de simulation. Dans ces conditions, le contrôle expérimental sur ces caractéristiques
est difficile et constitue ainsi une limite de ces études puisqu’il devient difficile d’adopter
un plan expérimental factoriel. La méthodologie employée dans cette thèse est différente
puisque les tâches des participants n’ont pas d’impact sur l’évolution de la situation. Ainsi,
le contrôle des caractéristiques associées à la complexité est possible tout au long de la
simulation puisque l’évolution de la situation sera toujours la même, indépendamment des
186
prévisions faites par les participants. La seconde problématique concerne l’évaluation de la
performance des participants. En effet, en prise de décision dynamique, la performance doit
être évaluée en fonction de l’atteinte des objectifs des participants en termes de contrôle de
la situation (Brehmer, 1992; Rigas et al., 2002). C’est-à-dire que dans la prise de décision
dynamique, les participants ont des valeurs cibles à atteindre pour une ou plusieurs
variables et doivent influencer l’évolution du système vers ces cibles. Toutefois, puisque
l’évolution de la situation dépend entre autres des décisions passées des participants, il est
difficile d’évaluer la performance de ceux-ci de façon ponctuelle. La raison est qu’une
décision qui peut sembler sous-optimale de manière ponctuelle peut être optimale en termes
d’atteinte des objectifs à long terme. À l’inverse, une décision optimale ponctuelle peut être
associée à une performance globale sous-optimale (Gureckis & Love, 2009). De plus,
l’impact des décisions initiales dans ce type de situation peut être nettement supérieur à
celui des décisions subséquentes. Dans ce contexte, une quantité équivalente de bonnes et
de mauvaises décisions réalisées par deux participants différents pourra mener à des
performances complètement différentes. Encore une fois, l’utilisation du paradigme des
prévisions de séries temporelles peut constituer une part de solution à ce problème puisque
la précision des prévisions est indépendante des objectifs associés au contrôle de la
situation. En demandant au participant de faire des prévisions sur l’évolution de la situation
(avec ou sans décision qui ont une influence l’évolution de la situation), on arrive à mesurer
leur compréhension de la situation sans interférence associée à la difficulté du contrôle de
celle-ci à un moment donné.
LIMITES
Certaines limites sont toutefois associées à cette méthodologie. Par exemple, elle ne
permet pas de quantifier la représentativité de modèles de jugement qui ne sont pas
formalisés, ni même a priori d’extraire de nouveaux modèles. En effet, la représentativité
des modèles ne peut être évaluée que pour les modèles formalisés. Par exemple, Anufriev et
Hommes (2012) suggèrent d’autres modèles de prévision de séries temporelles basés sur
l’utilisation des indices de sources intrinsèques. Dans le contexte de la présente thèse, cela a
mené à l’absence de modèles non compensatoires basé uniquement sur les indices de
sources extrinsèques. Ainsi, il serait possible que certains modèles soient davantage
187
représentatifs du jugement humain que ceux identifiés dans le contexte de la présente thèse.
Notamment, dans les conditions où la qualité des indices intrinsèques était faible, le niveau
de représentativité général était très bas, pourtant la performance atteinte par les
participants était souvent meilleure que celle qui serait obtenue par l’application pure d’une
règle de jugement linéaire. Pour cette raison, il est difficile de se prononcer sur la stratégie
employée par les participants dans ce contexte. Toutefois, bien qu’il ne soit pas possible
d’identifier avec certitude quelles sont les stratégies employées à tout moment, les résultats
permettent tout de même de dire si les stratégies sont adaptées comparativement au modèle
de jugement linéaire. En effet, comme la performance du modèle de jugement linéaire est
connue, il suffit de comparer la performance observée des individus à celle du modèle de
jugement linéaire. Dans ce contexte, la performance des individus est fréquemment
supérieure à celle du jugement linéaire, ce qui suggère que leur stratégie est adaptée, même
si elle n’est pas toujours identifiable.
Une autre limite associée à cette méthodologie est la possibilité que deux modèles
soient si similaires, en termes de prévision produites, qu’il soit impossible de les
discriminer. C’est le cas, dans la présente thèse des modèles ANC1 et ANC3. Ces modèles
traitent l’information de façon différente, mais arrivent toujours aux mêmes prévisions
numériques au sein des environnements simulés dans la présente thèse. Ainsi, il est
impossible de dire si un individu se comporte davantage comme l’un ou l’autre de ces
modèles. Pour contrer ce problème méthodologique, le paradigme de comparaison de
modèles (par exemple, Bergert & Nosofsky, 2007; Bolger & Harvey, 1993; Shanteau &
Thomas, 2000) pourrait être combiné avec le paradigme de suivi des processus (Billings &
Marcus, 1983; Matsuka & Corter, 2008; Sayeki, 1969; Sundström, 1987). Cela permettrait
de connaître quelles informations ont été consultées par les participants avant de faire leur
prévision et ainsi peut-être de discriminer l’utilisation des modèles.
La présente thèse est également limitée par l’utilisation de la fréquence de gain de
performance plutôt que par le gain de performance moyen. L’utilisation d’une telle
métrique rend difficile la généralisation des résultats au-delà du contexte précis de la thèse.
Par conséquent, l’interprétation des résultats de la thèse doit être mise en contexte et
demanderait une validation empirique supplémentaire.
188
Finalement, une limite de la présente thèse est l’adoption du modèle de jugement
linéaire comme étant la norme rationnelle. En effet, il existe une panoplie d’autres types de
modèles tel que la logique formelle ou encore le jugement bayésien, qui pourrait constituer
la norme rationnelle comparative. Puisque plusieurs des hypothèses testées reposent sur la
prémisse que le jugement linéaire constitue la norme rationnelle, les conclusions qui sont
tirées ne sont aussi fortes que la prémisse sur laquelle elles reposent. Néanmoins, tel que
discuté précédemment, le modèle de jugement linéaire satisfait l’ensemble de conditions
émises par Hastie et Dawes (2010) pour qualifier une stratégie décisionnelle comme étant
rationnelle. De plus, l’une des hypothèses les plus critiques pour l’appui à la rationalité
écologique, c’est-à-dire l’hypothèse selon laquelle l’adéquation aux différentes stratégies
modélisées varie en fonction des conditions expérimentales, ne dépend pas directement de
cette prémisse.
TRAVAUX FUTURS
Dans le contexte des limites liées à la présente thèse, et plus particulièrement la
limite associée à l’utilisation du modèle de jugement linéaire comme norme rationnelle, il
serait pertinent de répliquer ces résultats en les comparant à une norme rationnelle
différente. Particulièrement, le jugement bayésien et la logique formelle seraient deux
avenues pertinentes à envisager. En fait, une telle comparaison permettrait de mieux situer
l’approche de la boîte à outil dans le paysage de la rationalité. La présente thèse propose
une analyse de la rationalité humaine dans un contexte de prévision de situations complexes
dynamiques. Elle soulève néanmoins plusieurs questions pertinentes qui méritent qu’on s’y
attarde davantage, mais qui vont au-delà de la portée de la présente thèse. Entre autres, bien
qu’elle mette en lumière l’importance de certaines caractéristiques environnementales dans
la détermination de la performance des stratégies de jugement, une proportion importante
de la variance du gain de performance des stratégies par rapport au jugement linéaire
demeure inexpliquée. Les caractéristiques des modèles de la présente thèse indiquent que la
validité des indices extraits pourrait représenter un facteur discriminant dans la
performance des stratégies. Toutefois, davantage de travaux seraient requis pour explorer
cette hypothèse. D’autres caractéristiques environnementales sont également suggérées,
mais n’ont pas été testées dans le contexte de la présente thèse. Par exemple, Todd et ses
189
collaborateurs (2011) suggèrent que les caractéristiques environnementales qui déterminent
l’efficacité d’une stratégie donnée sont l’incertitude, la redondance entre les indices, la
taille de l’échantillon et la distribution des poids des indices. La plateforme expérimentale
utilisée dans le cadre de cette thèse, CODEM, est particulièrement efficace pour la
manipulation de plusieurs de ces facteurs. Par exemple, la plateforme permet rapidement de
représenter les données sous forme de graphique plutôt que sous forme numérique, ce qui
est connu pour avoir une incidence sur la sélection des stratégies de prévision dans ce
contexte (Lawrence et al., 2006).
Un autre aspect connexe à la thèse concerne la sélection de stratégie à proprement
parlé. La présente thèse suggère que la sélection de stratégie est déterminée entre autres par
les caractéristiques environnementales, les stratégies et les contraintes cognitives
fondamentales des individus. Les individus sélectionneraient une stratégie adaptée aux
contraintes environnementales et cognitives parmi un ensemble de stratégies disponibles,
un peu à l’image d’un ouvrier qui sélectionne l’outil le plus adapté dans sa boîte à outils.
Par contre, une telle conception de la cognition nécessite un processus de sélection de
stratégie et résulte potentiellement du problème de l’homonculus. Ainsi, plusieurs travaux
se concentrent sur la modélisation d’un tel processus de sélection (Anufriev & Hommes;
2012; Marewski & Scholler, 2011; Pohl et al., 2013; Roberts & Newton, 2001; Rieskamp
& Otto, 2006). Il serait intéressant d’évaluer la pertinence des modèles de sélection
existants dans le contexte de la tâche et des modèles utilisés dans le contexte de la présente
thèse.
191
CONCLUSION GÉNÉRALE
192
La prévision de situations dynamiques complexes est une tâche particulièrement
difficile. Ces situations sont caractérisées par de nombreux éléments en relation. Ces
relations sont souvent changeantes, inconnues et non-linéaires, menant à une évolution
hautement non-linéaire. Les individus en charge de prévoir ou de contrôler de telles
situations ont beaucoup de mal à y arriver, malgré l’importance de leur tâche. Pour
expliquer les erreurs des humains dans ce contexte, plusieurs chercheurs suggèrent que les
individus sont cognitivement limités et que, pour cette raison, ils ne peuvent pas appliquer
les règles normatives rationnelles menant à des performances optimales. D’autres auteurs
suggèrent toutefois que l’utilisation de règles plus simples – nommées heuristiques - est
adaptée puisque la norme ne devrait être établie qu’en lien avec les caractéristiques
environnementales. En d’autres mots, une heuristique pourrait être autant sinon plus
performante que la norme rationnelle sous certaines conditions. Les individus seraient
capables d’adapter l’utilisation des heuristiques en fonction de ces caractéristiques
environnementales et pourraient ainsi performer raisonnablement comparativement à la
norme rationnelle. La présente thèse suggère que c’est seulement à la lumière des
caractéristiques des stratégies, de l’environnement, des individus et de leur interaction, qu’il
est possible de déterminer dans quel contexte une stratégie sera efficace et utilisable. Elle
montre que les heuristiques, quoique biaisées et menant à des erreurs systématiques,
permettent l’atteinte de performances au moins équivalentes à la norme rationnelle de
jugement linéaire dans un contexte de prévision de séries temporelles. De plus, elle spécifie
les limites cognitives en termes de nombre d’indices à considérer qui contraignent les
individus dans l’adoption de stratégies cognitives. Finalement, elle souligne l’importance
de la qualité des indices, particulièrement des indices intrinsèques, dans la détermination de
la performance des stratégies dans un contexte de prévision de séries temporelles et, de
manière plus importante, dans la discrimination des heuristiques et du jugement linéaire.
Ces résultats tempèrent les propos selon lesquels l’utilisation des heuristiques est
irrationnelle en appuyant plutôt une vision écologique de la rationalité selon laquelle la
norme rationnelle est établie selon le contexte environnemental. La réalisation de travaux
supplémentaires est toutefois nécessaire afin de bien documenter le lien entre
caractéristiques environnementales et stratégies, et pour développer et tester des modèles de
sélection de stratégies.
193
RÉFÉRENCES
Abelson, R. P., & Levi, A. (1985). Decision making and decision theory. In G. Lindzey &
E. Aronson (Eds.), Handbook of social psychology. HiIIsdale, NJ: Erlbaum.
Amalberti, R., & Deblon, F. (1992). Cognitive modeling of fighter aircraft process control:
A step towards an intelligent on-board assistance system. International Journal of
Man-Machine Studies, 36(5), 639-671.
Anderson, N. H. (1981). Foundations of information integration theory. New York:
Academic Press.
Anderson, N.H. (1991). A Cognitive Theory of Judgment and Decision. In N.H. Anderson
(Ed.), Contributions to Information Integration Theory Volume I: Cognition, Hillsdale,
NJ: Erlbaum, 105-142.
Anderson, C. A., Lepper, M. R., & Ross, L. (1980). Perseverance of social theories: The
role of explanation in the persistence of discredited information. Journal of
Personality and Social Psychology, 39, 1037 – 1049.
Anderson, T. W. (2011). The statistical analysis of time series (Vol. 19). John Wiley &
Sons.
Andreassen, P. B. (1990). Judgmental extrapolation and market overreaction: on the use
and disuse of news. Journal of Behavioral Decision Making, 3, 153–174.
Andreassen, P. B., & Kraus, S. J. (1990). Judgmental extrapolation and the salience of
change. Journal of Forecasting, 9, 347–372.
Anufriev, M., & Hommes, C. (2012). Evolutionary Selection of Individual Expectations
and Aggregate Outcomes in Asset Pricing Experiments. American Economic Journal:
Microeconomics, 4(4), 35–64. doi:http://dx.doi.org/10.1257/mic.4.4.35
Arias-Hernandez, R., Green, T. M., & Fisher, B. (2012). From Cognitive Amplifiers to
Cognitive Prostheses: Understandings of the Material Basis of Cognition in Visual
Analytics. Interdisciplinary Science Reviews, 37(1), 4–18.
doi:10.1179/0308018812Z.0000000001
Beach, L., & Mitchell, T. R. (1978). A contingency model for the selection of decision
strategies. Academy of Management Review, 3(3), 439–449. Retrieved from
http://www.jstor.org/stable/10.2307/257535
Becker, O., & Leopold-Wildburger, U. (1996). The bounds and likelihood-procedure – a
simulation study concerning the efficiency of visual forecasting techniques. Central
European Journal of Operations Research and Economics 4, 223–229.
194
Becker, O., Leitner, J., Leopold-Wildburger, U. (2005). Modelling judgmental forecasts
under tabular and graphical data presentation formats. In Schmidt, U., Traub, S.
(Eds.), Advances in Public Economics: utility, Choice and Welfare. Springer, pp. 255–
266.
Becker, O., Leitner, J., & Leopold-Wildburger, U. (2007). Heuristic modeling of
expectation formation in a complex experimental information environment. European
Journal of Operational Research, 176(2), 975–985. doi:10.1016/j.ejor.2005.09.003
Becker, O., Leitner, J., & Leopold-Wildburger, U. (2008). Modeling expectation formation
involving several sources of information. German Economic Review 9, 96–112.
Becker, O., Leitner, J., & Leopold-Wildburger, U. (2009). Expectation formation and
regime switches. Experimental Economics 12 (3), 350-364. doi: 10.1007/s10683-009-
9213-0.
Bergert, F. B., & Nosofsky, R.M. (2007). A response time approach to comparing
generalized rational and take-the-best models of decision making. Journal of
Experimental Psychology: Learning, Memory, and Cognition, 33, 107–129.
Billings, R. S., & Marcus, S. (1983). Measures of compensatory and noncompensatory
models of decision behavior: Process tracing versus policy capturing. Organizational
Behavior and Human Performance, 31(3), 331–352. doi:10.1016/0030-
5073(83)90129-0
Bisantz, M., Kirlik, A., Gay, P., Phipps, D., Walker, N., & Fisk, D. (2000). Modeling and
analysis of a dynamic judgment task using a lens model approach. IEEE Transactions
on Systems, Man, and Cybernetics - Part A: Systems and Humans, 30(6), 605–616.
doi:10.1109/3468.895884
Blech, C., & Funke, J. (2005). Dynamis review: An overview about applications of the
Dynamis approach in cognitive psychology. … . 2006): http://www. die-bonn. de/ ….
Retrieved from http://www.psychologie.uni-
heidelberg.de/ae/allg_en/forschun/dynamis/dynamis_review_08-2005.pdf
Bolger, F., & Harvey, N. (1993). Context-sensitive heuristics in statistical reasoning. The
Quarterly Journal of Experimental Psychology Section A, 46(4), 779–811.
Borges, B., Goldstein, D. G., Ortmann, A., & Gigerenzer, G. (1999). Can ignorance beat
the stock market. In G. Gigerenzer, P. M. Todd, & The ABC Research Group (Eds.),
Simple heuristics that make us smart (pp. 59 – 72). Oxford, UK: Oxford University
Press.
Box, G. E., Jenkins, G. M., & Reinsel, G. C. (2013). Time series analysis: forecasting and
control. John Wiley & Sons.
195
Boyd, M. (2001). On ignorance, intuition and investing: A bear market test of the
recognition heuristic. The Journal of Psychology and Financial Markets, 2, 150 – 156.
Brehmer, B., & Allard, R. (1991). Dynamic decision making: The effects of task
complexity and feedback delay. In J. Rasmussen, B. Brehmer, & J. Leplat (Eds.),
Distributed decision making: Cognitive models for cooperative work (pp. 319–334).
Brisbane, Queensland, Australia: Wiley.
Brehmer, B. (1992). Dynamic decision making: human control of complex systems. Acta
psychologica, 81(3), 211–41. Retrieved from
http://www.ncbi.nlm.nih.gov/pubmed/1462786
Brehmer, B. (1994). The psychology of linear judgement models. Acta Psychologica, 87,
137–154.
Bröder, A. (2000). Assessing the empirical validity of the “Take-the-Best” heuristic as a
model of human probabilistic inference. Journal of Experimental Psychology:
Learning, Memory, and Cognition, 26, 1332– 1346.
Bröder, A. (2003). Decision making with the “adaptive toolbox”: Influence of
environmental structure, intelligence, and working memory load. Journal of
Experimental Psychology: Learning, Memory, and Cognition, 29(4), 611–625.
doi:10.1037/0278-7393.29.4.611
Bröder, A., & Schiffer, S. (2006). Adaptive flexibility and maladaptive routines in selecting
fast and frugal decision strategies. Journal of experimental psychology. Learning,
memory, and cognition, 32(4), 904–18. doi:10.1037/0278-7393.32.4.904
Brunswik, E. (1952). The conceptual framework of psychology. Chicago: University of
Chicago Press.
Brunswik, E. (1955). Representative design and probabilistic theory in a functional
psychology. Psychological Review, 62, 193–217.
Burns, B. D., & Vollmeyer, R. (2002). Goal specificity effects on hypothesis testing in
problem solving. Quarterly Journal of Experimental Psychology: Human
Experimental Psychology, 55(A), 241–261.
Busemeyer, J. R., & Pleskac, T. J. (2008). Theoretical tools for understanding and aiding
dynamic decision making. Journal of Mathematical Psychology, 53(3), 126–138.
doi:10.1016/j.jmp.2008.12.007
Busemeyer, J. (1999). Dynamic decision making. International Encyclopedia of the Social
and Behavioral Sciences: Methodology. Mathematics and Computer science. (pp. 1–
17). Amsterdam: Pergamon. Retrieved from
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.132.4256
196
Camerer, C. F. (1981). General conditions for the success of bootstrapping models.
Organizational Behavior and Human Performance, 27, 411– 422.
Carroll, J. S. (1978). The effect of imagining an event on expectations for the event: An
interpretation in terms of the availability heuristic. Journal of Experimental Social
Psychology, 14, 88 – 96.
Chatfield, C. (2013). The analysis of time series: an introduction. CRC press.
Chopra, N., Lakonishok, J., & Ritter, J.R., (1992). Measuring abnormal performance: do
stocks overreact? Journal of Financial Economics 31, 235–268.
Christensen-Szalanski, J. (1978). Problem solving strategies: A selection mechanism, some
implications, and some data. Organizational Behavior and Human, 323, 307–323.
Retrieved from http://www.sciencedirect.com/science/article/pii/0030507378900193
Clements, M. P.,& Hendry, D. F. (2002). Explaining forecast failure. In Michael P.
Clements&David F. Hendry (Eds.), A Companion to Economic Forecasting (pp.
539−571). Oxford, UK: Blackwell Publishers.
Cronin, M., Gonzalez, C., & Sterman, J. D. (2009). Why don’t well-educated adults
understand accumulation? A challenge to researchers, educators, and citizens.
Organizational Behavior and Human Decision Processes, 108(1), 116–130.
doi:10.1016/j.obhdp.2008.03.003
Czerlinski, J., Gigerenzer, G., & Goldstein, D. G. (1999). How good are simple heuristics?
In: Gigerenzer G, Todd PM, the ABC Research Group (eds) Simple heuristics that
make us smart. Oxford University Press, New York, pp 97–118.
Danner, D., Hagemann, D., Holt, D. V., Hager, M., Schankin, A., Wüstenberg, S., &
Funke, J. (2011). Measuring Performance in Dynamic Decision Making. Journal of
Individual Differences, 32(4), 225–233. doi:10.1027/1614-0001/a000055
Dawes, R., & Hastie, R. (2001). Rational choice in an uncertain world: The psychology of
judgment and decision making. Thousand Oaks, CA: Sage.
De Bondt, W. F. M.,& Thaler, R. H. (2002). Doanalysts overreact? In T. Gilovich, D.
Griffin,& D. Kahneman (Eds.), Heuristics and biases: The psychology of intuitive
judgement (pp. 678 – 685). Cambridge, UK: Cambridge University Press.
Desanctis, G., & Jarvenpaa, S. L. (1989). Graphical presentation of accounting data for
financial forecasting: An experimental investigation. Accounting, Organizations and
Society, 14(5,6), 5–9.
Dieckmann, A, & Rieskamp, J. (2007). The influence of information redundancy on
probabilistic inferences. Memory & Cognition. 35, 1801–13.
197
Diehl, E., & Sterman, J. D. (1995). Effects of feedback complexity on dynamic decision
making. Organizational Behavior and Human Decision Processes, 62, 198–215.
Dörner, D. (1996). The logic of failure: Recognizing and avoiding error in complex
situations. Reading, MA: Addison-Wesley.
Dougherty, M. R., & Thomas, R. P. (2012). Robust decision making in a nonlinear world.
Psychological review, 119(2), 321–44. doi:10.1037/a0027039
Edmundson, R. H., Lawrence, M. J., & O'Connor, M. (1988), The use of non-time series
information in sales forecasting: A case study, Journal of Forecasting, 7, 201-211.
Edwards, W. (1962). Dynamic decision theory and probabilistic information processing.
Human Factors, 4, 59–73.
Eggleton, I. R. C. (1982). Intuitive time-series extrapolation. Journal of Accounting
Research, 20, 68 – 102.
Einhorn, H. J., Kleinmuntz, D. N., & Kleinmuntz, B. (1979). Linear regression and process
tracing models of judgment. Psychological Re view, 86, 465–485.
Elrod, T., Johnson, R. D., & White, J. (2005). A new integrated model of noncompensatory
and compensatory decision strategies. Organizational Behavior and Human Decision
Processes, 95, 1–19.
Endsley, M. R. (1995). Toward a theory of situation awareness in dynamic systems. Human
Factors: The Journal of the Human Factors and Ergonomics Society, 37(1), 32-64.
Endsley, M. R. (2000). Theoretical underpinnings of situation awareness: A critical
review. Situation awareness analysis and measurement, 3-32.
Faghihi, U., Fournier-Viger, P., & Nkambou, R. (2011, January). A cognitive tutoring agent
with episodic and causal learning capabilities. In Artificial Intelligence in
Education (pp. 72-80). Springer Berlin Heidelberg.
Fairchild, A. J., MacKinnon, D. P., Taborga, M. P., & Taylor, A. B. (2009). R 2 effect-size
measures for mediation analysis. Behavior research methods, 41(2), 486-498. doi:
10.3758/BRM.41.2.486
Fildes, R., Goodwin, P., Lawrence, M., & Nikolopoulos, K. (2009). Effective forecasting
and judgmental adjustments: an empirical evaluation and strategies for improvement
in supply-chain planning. International Journal of Forecasting, 25(1), 3–23.
doi:10.1016/j.ijforecast.2008.11.010
Fildes, R., & Stekler, H. (2002). The state of macroeconomic forecasting. Journal of
Macroeconomics, 24, 435−468.
198
Fildes, R., & Goodwin, P. (2007). Against Your Better Judgment? How Organizations Can
Improve Their Use of Management Judgment in Forecasting. Interfaces, 37(6), 570–
576. doi:10.1287/inte.1070.0309
Fildes, R., Goodwin, P., Lawrence, M., & Nikolopoulos, K. (2009). Effective forecasting
and judgmental adjustments: an empirical evaluation and strategies for improvement
in supply-chain planning. International Journal of Forecasting, 25(1), 3–23.
doi:10.1016/j.ijforecast.2008.11.010
Forrester, J. W. (1961). System Behavior and Causal Loop Diagrams. System, 1–14.
Funke, J. (2001). Dynamic systems as tools for analyzing human judgment. Thinking and
Reasoning, 7, 69–89.
Gibson, F. P. (2007). Learning and transfer in dynamic decision environments.
Computational and Mathematical Organization Theory, 13(1), 39–61.
doi:10.1007/s10588-006-9010-7
Gibson, F. P., Fichman, M., & Plaut, D. C. (1997). Learning in Dynamic Decision Tasks:
Computational Model and Empirical Evidence. Organizational Behavior and Human
Decision Processes, 71(1), 1–35. doi:10.1006/obhd.1997.2712
Gigerenzer, G. (2004). Fast and frugal heuristics: The tools of bounded
rationality. Blackwell handbook of judgment and decision making, 62-88.
Gigerenzer, G., & Gaissmaier, W. (2011). Heuristic decision making. Annual review of
psychology, 62, 451–82. doi:10.1146/annurev-psych-120709-145346
Gigerenzer, G., & Goldstein, D. G. (1996). Reasoning the fast and frugal way: models of
bounded rationality. Psychological review, 103(4), 650–69. Retrieved from
http://www.ncbi.nlm.nih.gov/pubmed/8888650
Gigerenzer, G., & Goldstein, D. G. (1999). Betting on one good reason: The take the best
heuristic. In G. Gigerenzer, P. M. Todd, & The ABC Research Group (Eds.), Simple
heuristics that make us smart (pp. 75 – 95). Oxford, UK: Oxford University Press.
Gigerenzer, G., & Selten, R. (2001). Bounded Rationality: the adaptive toolbox (Vol. 84).
Gigerenzer, G., Todd, P. M., & The ABC Research Group (1999). Simple heuristics that
make us smart. (O. U. Press, Ed.)of Social PsychologyThousand Oaks CA Sage (Vol.
21, p. 416). Oxford University Press. doi:10.1016/S1090-5138(00)00044-1
Goldstein, D. G., & Gigerenzer, G. (1999). The recognition heuristic: How ignorance
makes us smart. In G. Gigerenzer, P.M. Todd, & The ABC Research Group (Eds.),
Simple heuristics that make us smart (pp. 37 – 58). Oxford, UK: Oxford University
Press.
199
Goldstein, D. G., & Gigerenzer, G. (2009). Fast and frugal forecasting. International
Journal of Forecasting, 25(4), 760–772. doi:10.1016/j.ijforecast.2009.05.010
Gonzalez, C., Thomas, R., & Vanyukov, P. (2005). The relationships between cognitive
ability and dynamic decision making. Intelligence, 33(1), 169–186.
doi:10.1016/j.intell.2004.10.002
Gonzalez, C., Vanyukov, P., & Martin, M. (2005). The use of microworlds to study
dynamic decision making. Computers in Human Behavior, 21(2), 273–286.
doi:10.1016/j.chb.2004.02.014
Goodwin, P., & Wright, G. (1994). Heuristics, biases and improvement strategies in
judgmental time series forecasting. Omega, 22(6), 553–568. doi:10.1016/0305-
0483(94)90047-7
Goodwin, P. (2005). How to integrate management judgment with statistical
forecasts. Foresight: The International Journal of Applied Forecasting, (1), 8-12.
Gureckis, T. M., & Love, B. C. (2009). Short-term gains, long-term pains: how cues about
state aid learning in dynamic environments. Cognition, 113(3), 293–313.
doi:10.1016/j.cognition.2009.03.013
Halford, G. S., Baker, R., McCredden, J. E., & Bain, J. D. (2005). How many variables can
humans process? Psychological science : a journal of the American Psychological
Society / APS, 16(1), 70–6. doi:10.1111/j.0956-7976.2005.00782.x
Hammond, K. R. (1996). Human judgment and social policy: Irreducible uncertainty,
inevitable error, unavoidable injustice. Oxford, United Kingdom: Oxford University
Press.
Harvey, N. (2007). Use of heuristics: Insights from forecasting research. Thinking &
reasoning, 13(1), 37–41. doi:10.1080/13546780600872502
Harvey, N. (1988). Judgemental forecasting of univariate time series. Journal of Behavioral
Decision Making, I, 95 – 110.
Harvey, N. (1995). Why Are Judgments Less Consistent in Less Predictable Task
Situations? Organizational Behavior and Human Decision Processes, 63(3), 247–263.
doi:10.1006/obhd.1995.1077
Harvey, N., & Bolger, F. (1996). Graphs versus tables: Effects of data presentation format
on judgemental forecasting. International Journal of Forecasting, 12, 119 – 137.
Harvey, N., Bolger, F., & McClelland, A. (1994). On the nature of expectations. British
Journal of Psychology, 85(2), 203–229. doi:10.1111/j.2044-8295.1994.tb02519.x
200
Harvey, N., Ewart, T., & West, R. (1997). Effects of Data Noise on Statistical Judgement.
Thinking & Reasoning, 3(2), 111–132. doi:10.1080/135467897394383
Hastie, R., & Dawes, R. M. (2010). Rational Choice in an Uncertain World: The
Psychology of Judgment and Decision Making. SAGE Publications.
Hays, W. L. (1963). Statistics for Psychologists. New York: Holt, Rinehart and Winston.
Hilbig, B. E., Erdfelder, E., & Pohl, R. F. (2012). A matter of time: Determinants of one-
reason decision making based on recognition. Acta Psychologica, 141,9-16.
doi:10.1016/j.actpsy.2012.05.006
Hogarth, R. M., & Karelaia, N. (2007). Heuristic and linear models of judgment: matching
rules and environments. Psychological review, 114(3), 733–58. doi:10.1037/0033-
295X.114.3.733
Hogarth, R. M., & Karelaia, N. (2005). Simple models for multi-attribute choice with many
alternatives: When it does and does not pay to face trade-offs with binary attributes.
Management Science, 51, 1860–1872.
Huarng, K.-H., Moutinho, L., & Yu, T. H.-K. (2007). An advanced approach to forecasting
tourism demand in Taiwan. Journal of Travel and Tourism Marketing, 21(4).
Hutchinson J. M. C., & Gigerenzer G. 2005. Simple heuristics and rules of thumb: where
psychologists and behavioural biologists might meet. Behavioural Processes, 69, 87–
124.
Jilani, T. A., & Burney, S. M. A. (2007). M-factor high order fuzzy time series forecasting
for road accident data: Analysis and design of intelligent systems using soft computing
techniques. Advances in Soft Computing, 41, 246–254.
Jilani, T. A., Burney, S. M. A., & Ardil, C. (2008). Fuzzy metric approach for fuzzy time
series forecasting based on frequency density based partitioning. International Journal
of Computational Intelligence, 4(2), 112–117.
Kahneman, D., Slovic, P., & Tversky, A. (1982). Judgement under uncertainty: Heuristics
and biases. Cambridge, UK: Cambridge University Press.
Karelaia, N. (2006). Thirst for confirmation in multi-attribute choice: Does search for
consistency impair decision performance?. Organizational Behavior and Human
Decision Processes, 100(1), 128-143.
Karelaia, N., & Hogarth, R. M. (2008). Determinants of linear judgment: a meta-analysis of
lens model studies. Psychological bulletin, 134(3), 404–26. doi:10.1037/0033-
2909.134.3.404
201
Kleinmuntz, B. (1990). Why we still use our heads instead of formulas: Toward an
integrative approach. Psychological Bulletin, 107, 296–310.
Kurtz, C., & Snowden, D. (2003). The new dynamics of strategy: Sense-making in a
complex and complicated world. IBM Systems Journal, 42(3). Retrieved from
http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5386804
Kurtz, C., & Snowden, D. J. (2010). The new dynamics of strategy: Sense-making in a
complex and complicated world. IBM Systems Journal, 42(3). Retrieved from
http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5386804
Lafond, D., & DuCharme, M. B. (2011). Complex decision making experimental platform
(CODEM): A counter-insurgency scenario. 2011 IEEE Symposium on Computational
Intelligence for Security and Defense Applications (CISDA) (pp. 72–79). Paris.
doi:10.1109/CISDA.2011.5945940
Lafond, D., Tremblay, S., & Banbury, S. (2013). Cognitive shadow: A policy capturing tool
to support naturalistic decision making. 2013 IEEE International Multi-Disciplinary
Conference on Cognitive Methods in Situation Awareness and Decision Support
(CogSIMA), 139–142. doi:10.1109/CogSIMA.2013.6523837
Langer, E. J. (1975). Illusion of control. Journal of Personality and Social Psychology, 32,
311–328.
Lawrence, M. J., & Makridakis, S. (1989). Factors affecting judgemental forecasts and
confidence intervals. Organizational Behavior and Human Decision Processes, 42, 172
– 187.
Lawrence, M. J., & O’Connor, M. (1992). Exploring judgmental forecasting. International
Journal of Forecasting, 8, 15-26.
Lawrence, M. J., & O’Connor, M. (1995). The anchor and adjustment heuristic in
time‐series forecasting. Journal of Forecasting, 14(November 1993), 443–451.
Retrieved from http://onlinelibrary.wiley.com/doi/10.1002/for.3980140504/abstract
Lawrence, M., Goodwin, P., O'Connor, M., & Önkal, D. (2006). Judgmental forecasting: A
review of progress over the last 25years. International Journal of Forecasting, 22(3),
493-518.
Lewis, K. (1989). Changing beliefs and systematic rational forecast errors with evidence
from foreign exchange. American Economic Review, 79, 621−636.
Lichtenstein, S., Slovic, P., Fischhoff, B., Layman, M., & Combs, B. (1978). Judged
frequency of lethal events. Journal of experimental psychology: Human learning and
memory, 4(6), 551.
202
Lim, J., & O’Connor, M. (1996). Judgmental forecasting with time series and causal
information. International Journal of Forecasting, 12, 139–153. Retrieved from
http://www.sciencedirect.com/science/article/pii/0169207095006354
Lipshitz, R. (2000). Two cheers for bounded rationality. Behavioral & Brain Sciences, 23,
756–757.
Lizotte, M., Bernier, F., Mokhtari, M., Boivin, E., DuCharme, M. B., & Poussart, D.
(2008). Image: Simulation for understanding complex situations and increasing future
force agility, Au 26ème Army Science Conference, Dec. 1-4, Orlando, FL.
Ying Luo, G. (2013). Can representativeness heuristic traders survive in a competitive
securities market? Journal of Financial Markets, 16(1), 152–164.
doi:10.1016/j.finmar.2012.05.001
Machuca, J. A. D., Ruiz, J., Domingo, M., & González, M. (1998). Our ten years of work
on transparent box business simulation. Proceedings of the Sixteenth International
Conference of the System Dynamics Society, Québec City (p. 5). Retrieved from
http://www.systemdynamics.org/conferences/1998/PROCEED/00064.PDF
Marewski, J. N., & Schooler, L. J. (2011). Cognitive niches: An ecological model of
strategy selection. Psychological review, 118(3), 393–437. doi:10.1037/a0024143
Matsuka, T., & Corter, J. E. (2008). Observed attention allocation processes in category
learning. The Quarterly Journal of Experimental Psychology, 61(7), 1067–1097.
doi:10.1080/17470210701438194
Maule, A. J. (1994). A componential investigation of the relation between structural
modelling and cognitive accounts of human judgement. Acta Psychologica, 87, 199–
216.
McNees, S.K., 1990. The role of judgment in macroeconomic forecasting accuracy.
International Journal of Forecasting 6, 287–299.
Muth, J. (1961). Rational expectations and the theory of price movements. Econometrica:
Journal of the Econometric Society, 29(3), 315–335. Retrieved from
http://medcontent.metapress.com/index/A65RM03P4874243N.pdf
O’Connor, M., Remus, W., & Griggs, K. (1997). Going up-going down: How good are
people at forecasting trends and changes in trends? Journal of Forecasting, 16(3),
165–176.
O'Connor, M., Remus, W., & Lim, K. (2005). Improving judgemental forecasts with
judgemental bootstrapping and task feedback support. Journal of Behavioral Decision
Making, 18, 247−260.
203
O’Grady, K. E. (1982). Measures of explained variance: Cautions and limitations.
Psychological Bulletin, 92(3), 766–777. doi:10.1037//0033-2909.92.3.766
Osman, M. (2010). Controlling uncertainty: a review of human behavior in complex
dynamic environments. Psychological bulletin, 136(1), 65–86. doi:10.1037/a0017815
Osman, M., & Speekenbrink, M. (2012). Prediction and control in a dynamic environment.
Frontiers in psychology, 3(March), 68. doi:10.3389/fpsyg.2012.00068
Pachur, T., & Hertwig, R. (2006). On the psychology of the recognition heuristic: retrieval
primacy as a key determinant of its use. Journal of experimental psychology.
Learning, memory, and cognition, 32(5), 983–1002. doi:10.1037/0278-7393.32.5.983
Pachur, T., Mata, R.,& Schooler, L. J. (2009). Cognitive aging and the adaptive use of
recognition in decision making. Psychology and Aging, 24, 901-915.
doi:10.1037/a0017211
Paich, M., & Sterman, J. D. (1993). Boom, bust, and failures to learn in experimental
markets. Management Science, 39(12), 1439–1458. Retrieved from
http://www.jstor.org/stable/2633062
Payne, J. W., Bettman, J. R., & Johnson, E. J. (1988). Adaptive strategy selection in
decision making. Journal of Experimental Psychology: Learning, Memory, and
Cognition, 14, 534–552.
Payne, J. W., Bettman, J. R., & Johnson, E. J. (1993). The adaptive decision maker. New
York: Cambridge University Press.
Pezzulo, G. (2008). Anticipation and Anticipatory Systems : and Introduction The Power of
Anticipation : From Reactivity to Proactivity. In G. Pezzulo (Ed.), The Challenge of
Anticipation: A Unifying Framework for the Analysis and Design of Artificial
Cognitive Systems (Goebel, R., pp. 1–5). Heidelberg, Berlin: Springer-Verlag.
Pohl, R. F., Erdfelder, E., Hilbig, B. E., Liebke, L., & Stahlberg, D. (2013). Effort reduction
after self-control depletion: The role of cognitive resources in use of simple heuristics.
Journal of Cognitive Psychology, (January 2013), 1–10.
doi:10.1080/20445911.2012.758101
Poli, R. (2010). An introduction to the ontology of anticipation. Forthcoming in Futures,
42(7), 769–776. doi:10.1016/j.futures.2010.04.028
Reimers, S., & Harvey, N. (2011). Sensitivity to autocorrelation in judgmental time series
forecasting. International Journal of Forecasting, 27(4), 1196–1214.
doi:10.1016/j.ijforecast.2010.08.004
204
Rieskamp, J., & Otto, P. E. (2006). SSL: a theory of how people learn to select strategies.
Journal of experimental psychology. General, 135(2), 207–36. doi:10.1037/0096-
3445.135.2.207
Rieskamp, J., & Reimer, T. (2007). Ecological rationality. Encyclopedia of social
psychology, 273-275.
Rigas, G., Carling, E., & Brehmer, B. (2002). Reliability and validity of performance
measures in microworlds. Scenario, 30, 463 – 480.
Ross, L. D., Lepper, M. R., Strack, F., & Steinmetz, J. (1977). Social explanation and social
expectation: Effects of real and hypothetical explanations on subjective
likelihood. Journal of Personality and Social Psychology, 35(11), 817.
Sanders, N., & Ritzman, L. (1992). The need for contextual and technical knowledge in
judgmental forecasting. Journal of Behavioral Decision Making, 5, 39–52.
Sanders, N. (1992). Accuracy of judgmental forecasts: A comparison. Omega, 20(3), 353–
364. doi:10.1016/0305-0483(92)90040-E
Sayeki, Y. (1969). Information seeking for object identification. Organizational Behavior
and Human Performance. Retrieved from
http://www.sciencedirect.com/science/article/pii/0030507369900105
Seifert, M., & Hadida, A. L. (2013). On the relative importance of linear model and human
judge (s) in combined forecasting. Organizational Behavior and Human Decision
Processes, 120(1), 24-36.
Shanteau, J., & Thomas, R. P. (2000). Fast and frugal heuristics: What about unfriendly
environments?. Behavioral and Brain Sciences, 23(05), 762-763.
Simon, H. A. (1955). A behavioral model of rational choice. The quarterly journal of
economics, 69(1), 99-118.
Simon, H. A. (1956). Rational choice and the structure of the environment. (M. Egidi & R.
Marris, Eds.)Psychological Review, 63(2), 129–138. Retrieved from
http://www.ncbi.nlm.nih.gov/pubmed/13310708
Simon, H. A. (1992). What is an “explanation” of behavior?. Psychological Science, 3(3),
150-161.
Smith, V.L., Walker, J., 1993. Monetary rewards and decision cost in experimental
economics. Economic Inquiry 31, 245-261. doi: 10.1111/j.1465-7295.1993.tb00881.x.
Stanley, W. B., Mathews, R. C., Buss, R. R., & Kotler-Cope, S. (1989). Insight without
awareness: On the interaction of verbalization, instruction, and practice in a simulated
205
process control task. Quarterly Journal of Experimental Psychology: Human
Experimental Psychology, 41(A), 553–577.
Stekler, H. O. (2007). The future of macroeconomic forecasting: Understanding the
forecasting process. International Journal of Forecasting, 23(2), 237–248.
doi:10.1016/j.ijforecast.2007.01.002
Sterman, J. D. (1994). Learning in and about complex systems. System, 10(February), 291–
330.
Sterman, J. D. (2000). Business Dynamics: Systems Thinking and Modeling for a Complex
World. Boston, MA: Irwin/ McGraw-Hill
Sterman, J. D. (2010). Does formal system dynamics training improve people's
understanding of accumulation?. System Dynamics Review, 26(4), 316-334.
Stevens, J. P. (2013). Intermediate statistics: A modern approach. Routledge Academic.
Sturm, T. (2012). The “Rationality Wars” in Psychology: Where They Are and Where They
Could Go. Inquiry, 55(1), 66–81. doi:10.1080/0020174X.2012.643628
Sundström, G. (1987). Information search and decision making: The effects of information
displays. Acta Psychologica, 65, 165–179. Retrieved from
http://www.sciencedirect.com/science/article/pii/0001691887900254
Tabachnick, B. G., & Fidell, L. S. (2012). Using Multivariate Statistics. Pearson Education,
Limited.
Teddy, S. D., & Ng, S. K. (2011). Forecasting ATM cash demands using a local learning
model of cerebellar associative memory network. International Journal of
Forecasting, 27(3), 760–776. doi:10.1016/j.ijforecast.2010.02.013
Todd, P. M., & Gigerenzer, G. (2000). Précis of Simple heuristics that make us smart. The
Behavioral and brain sciences, 23(5), 727–41; discussion 742–80. Retrieved from
http://www.ncbi.nlm.nih.gov/pubmed/11301545
Todd, P. M., Gigerenzer, G., & The ABC Research Group (2011). Ecological Rationality:
Intelligence in the World. New York: Oxford Univ. Press
Tucker, L. R. (1964). A suggested alternative formulation in the developments by Hursch,
Hammond, and Hursch and by Hammond, Hursch, and Todd. Psychological Review,
71, 528–530.
Tversky, A., & Kahneman, D. (1973). Availability: A heuristic for judging frequency and
probability. Cognitive psychology, 207–232. Retrieved from
http://www.sciencedirect.com/science/article/pii/0010028573900339
206
Vicente, K. (2003). Beyond the lens model and direct perception: Toward a broader
ecological psychology. Ecological Psychology, 15(3), 241–267.
doi:10.1207/S15326969ECO1503
Vollmeyer, R., Burns, B. D., & Holyoak, K. J. (1996). The impact of goal specificity and
systematicity of strategies on the acquisition of problem structure. Cognitive Science,
20, 75–100.
Vuckovic, A., Kwantes, P. J., & Neal, A. (2013). Adaptive decision making in a dynamic
environment: a test of a sequential sampling model of relative judgment. Journal of
experimental psychology. Applied, 19(3), 266–84. doi:10.1037/a0034384
Wang, N.-Y., & Chen, S.-M. (2009). Temperature prediction and TAIFEX forecasting
based on automatic clustering techniques and two-factors high-order fuzzy time series.
Expert Systems with Applications, 36(2 Pt 1), 2143–2154.
Welch, E., Bretschneider, S., & Rohrbaugh, J. (1998). Accuracy of judgmental
extrapolation of time series data Characteristics , causes , and remediation strategies
for forecasting, 14, 95–110.
Woike, J. K., Hoffrage, U., & Hertwig, R. (2012). Estimating Quantities : Comparing
Simple Heuristics and Machine Learning Algorithms, 483–490.
Worthen, B. (2003). Future results not guaranteed; contrary to what vendors tell you,
computer systems alone are incapable of producing accurate forecasts. CIO, 16(19), 1.
Young, P. C. (2011). Recursive estimation and time-series analysis: an introduction for the
student and practitioner. Springer.
207
ANNEXE A
Figure 46. Exemple de prévisions de participants et de modèles pour une série critère avec 3 indices extrinsèques,
autocorrélation élevée et force d’association élevée. Prévisions de deux participants (9 et 11, en bleues), de deux modèles
(ANC2 et ML1, en jaune et vert), la série critère (en rouge) et les séries extrinsèques (en grises).
0
5
10
15
20
t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40 t41
Val
eu
r
Période (t)
Extrinsèque 1 Extrinsèque 2Extrinsèque 3 ANC2ML1 Participant 9Participant 11 Série Critère
208
Figure 47. Exemple de prévisions de participants et de modèles pour une série critère avec 7 indices extrinsèques,
autocorrélation élevée et force d’association élevée. Prévisions de deux participants (9 et 11, en bleues), de deux modèles
(ANC2 et ML1, en jaune et vert), la série critère (en rouge) et les séries extrinsèques (en grises).
0
5
10
15
20
t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40 t41
Val
eu
r
Période (t)
Extrinsèque 1 Extrinsèque 2Extrinsèque 3 Extrinsèque 4Extrinsèque 5 Extrinsèque 6Extrinsèque 7 ANC2ML1 Participant 9Participant 11 Série Critère
209
Figure 48. Exemple de prévisions de participants et de modèles pour une série critère avec 7 indices extrinsèques,
autocorrélation élevée et force d’association élevée. Prévisions de deux participants (13 et 18, en bleues), de deux modèles
(ANC2 et ML1, en jaune et vert), la série critère (en rouge) et les séries extrinsèques (en grises).
0
5
10
15
20
t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40 t41
Val
eu
r
Période (t)
Extrinsèque 1 Extrinsèque 2Extrinsèque 3 Extrinsèque 4Extrinsèque 5 Extrinsèque 6Extrinsèque 7 ANC2ML1 Participant 3Participant 18 Série Critère
210
Figure 49. Exemple de prévisions de participants et de modèles pour une série critère avec 7 indices extrinsèques,
autocorrélation élevée et force d’association faible. Prévisions de deux participants (13 et 16, en bleues), de deux modèles
(ANC2 et ML1, en jaune et vert), la série critère (en rouge) et les séries extrinsèques (en grises).
0
5
10
15
20
t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40 t41
Val
eu
r
Période (t)
Extrinsèque 1 Extrinsèque 2Extrinsèque 3 Extrinsèque 4Extrinsèque 5 Extrinsèque 6Extrinsèque 7 ANC2ML1 Participant 13Participant 16 Série Critère