Prévision humaine de séries temporelles

Prévision humaine de séries temporelles

Thèse

Jean-François Gagnon

Doctorat en Psychologie

Philosophiae Doctor (Ph.D)

Québec, Canada

© Jean-François Gagnon, 2014

iii

RÉSUMÉ

La fonction cognitive de prévision est à la base du processus de décision dans

plusieurs domaines de travail tels que les finances, la gestion des inventaires et la médecine.

Les individus en charge de prendre des décisions quant à l’évolution de situations

dynamiques complexes commettent régulièrement des erreurs, généralement attribuées à

l’utilisation de stratégies décisionnelles simplificatrices : les heuristiques. Ces heuristiques

sont décrites comme irrationnelles puisqu’elles ne tiennent pas compte de l’ensemble des

informations disponibles pour porter un jugement sur l’évolution future d’une situation. À

l’inverse, la classe de modèle du jugement linéaire constituerait la norme rationnelle dans

ce contexte. Les modèles de jugement linéaire stipulent qu’un jugement optimal rationnel

intègre et pondère linéairement l’ensemble des indices disponibles pour la prévision d’un

critère au sein d’une seule représentation. Plus le jugement d’une personne s’écarterait du

jugement linéaire, plus il serait irrationnel. La thèse remet cet énoncé en question et tente

de valider une vision plus adaptative de la rationalité dans un contexte de prévision de

situations dynamiques complexes. La rationalité dite écologique considère que la norme

rationnelle ne doit pas être absolue, mais plutôt définie en fonction des contraintes

environnementales. Selon cette vision de la rationalité, il est possible que dans un

environnement favorable, une heuristique donnée soit plus performante que l’application

d’une règle de jugement linéaire. Les individus sélectionneraient ainsi la stratégie la plus

adaptée au contexte à partir d’un bassin de stratégies disponibles en mémoire à long terme.

Or, à l’aide de simulations, la présente thèse démontre qu’il est possible que des

heuristiques simplificatrices performent mieux que le jugement linéaire et que cette

modulation dépend en partie des contraintes environnementales. La thèse suggère ensuite

que les individus appliquent différentes stratégies en fonction des contraintes

environnementales et que la stratégie appliquée est généralement adaptée à la nature de la

situation. Finalement, la thèse indique que certaines limites cognitives ont également un

impact sur la sélection de stratégies de prévision. Dans l’ensemble, ce patron de résultats

appuie une vision écologique de la rationalité, mais souligne également que les limites

cognitives fondamentales des individus contraignent le bassin de stratégies disponibles.

v

TABLE DES MATIÈRES

RÉSUMÉ...................................................................................................................................................... III

TABLE DES MATIÈRES .................................................................................................................................. V

LISTE DES TABLEAUX ................................................................................................................................. VII

LISTE DES FIGURES ...................................................................................................................................... IX

REMERCIEMENTS ..................................................................................................................................... XIII

AVANT-PROPOS ........................................................................................................................................ XV

INTRODUCTION GÉNÉRALE .......................................................................................................................... 1

CHAPITRE I .................................................................................................................................................. 5

CONTEXTE THÉORIQUE ET PROBLÉMATIQUE ............................................................................................................. 6

OBJECTIF DE LA THÈSE ........................................................................................................................................ 30

MÉTHODE GÉNÉRALE ......................................................................................................................................... 31

CHAPITRE II ................................................................................................................................................37

OBJECTIF ......................................................................................................................................................... 40

FORMALISATION DES STRATÉGIES ........................................................................................................................ 41

SIMULATION I .................................................................................................................................................. 56

SIMULATION II ................................................................................................................................................. 74

DISCUSSION DU CHAPITRE II ............................................................................................................................... 97

CHAPITRE III ............................................................................................................................................. 105

OBJECTIF ....................................................................................................................................................... 109

MÉTHODE GÉNÉRALE ...................................................................................................................................... 110

EXPERIENCE I ................................................................................................................................................. 119

EXPERIENCE II ................................................................................................................................................ 142

DISCUSSION CHAPITRE III ................................................................................................................................. 160

CHAPITRE IV ............................................................................................................................................. 165

RAPPEL DES PRINCIPAUX RÉSULTATS ................................................................................................................... 166

CONTRIBUTIONS THÉORIQUES ........................................................................................................................... 168

IMPLICATIONS PRATIQUES ................................................................................................................................ 182

CONTRIBUTIONS MÉTHODOLOGIQUES ................................................................................................................ 184

CONCLUSION GÉNÉRALE ........................................................................................................................... 191

RÉFÉRENCES ............................................................................................................................................. 193

ANNEXE A ................................................................................................................................................. 207

vii

LISTE DES TABLEAUX

Tableau 1 Sources d’information et modèles ....................................................................... 55 Tableau 2 Nombre d’indices extrinsèques, force d’association entre meilleur indice et

critère, et autocorrélation du critère ...................................................................................... 61 Tableau 3 Moyenne (écart-type) des corrélations entre les prévisions des modèles ............ 67

Tableau 4 PVE moyenne (écart-type) des modèles .............................................................. 68 Tableau 5 Fréquence de différence positive indiquant une performance supérieure au

modèle linéaire par modèle ................................................................................................... 68 Tableau 6 Modèle le plus performant par série temporelle .................................................. 69

Tableau 7 Coefficient de corrélation de Pearson entre autocorrélation du critère et

performance des modèles ...................................................................................................... 71 Tableau 8 Force d’association entre meilleur indice et critère et autocorrélation du critère 76 Tableau 9 Moyenne (écart-type) des corrélations entre les prévisions des modèles ............ 80

Tableau 10 PVE moyenne (écart-type) des modèles ............................................................ 81

Tableau 11 Fréquence de différence positive indiquant une performance supérieure au

modèle linéaire par modèle d’heuristique ............................................................................. 81

Tableau 12 Modèle le plus performant par série temporelle ................................................ 82 Tableau 13 Moyenne (écart-type) de performance des modèles par simulation .................. 84 Tableau 14 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque

sur la performance du modèle ANC2 ................................................................................... 85 Tableau 15 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque

sur la performance du modèle L&V1 ................................................................................... 86 Tableau 16 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque

sur la performance du modèle L&V2 ................................................................................... 87 Tableau 17 Régression linéaire de l’autocorrélation sur la performance du modèle L&V3 87

Tableau 18 Régression linéaire de l’autocorrélation et de la force d’association extrinsèque

sur la performance de ML1 ................................................................................................... 88 Tableau 19 Résumé des coefficients de régression standardisés par source d’information et

modèles ................................................................................................................................. 88 Tableau 20 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force

d’association extrinsèque sur le gain de performance du modèle ANC1 ............................. 91 Tableau 21 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force

d’association extrinsèque sur le gain de performance du modèle ANC2 ............................. 92 Tableau 22 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force

d’association extrinsèque sur le gain de performance du modèle L&V1 ............................. 93 Tableau 23 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force

d’association extrinsèque sur le gain de performance du modèle L&V2 ............................. 93

Tableau 24 Régression linéaire de l’autocorrélation, du nombre d’indices et de la force

d’association extrinsèque sur le gain de performance du modèle L&V3 ............................. 94 Tableau 25 Sources d’information par modèle ................................................................... 114 Tableau 26 Modèle le plus performant par série temporelle, défini par simulation ........... 118 Tableau 27 Déroulement des sessions expérimentales ....................................................... 120

Tableau 28 Décomposition de l’interaction performance PVE .......................................... 125

Tableau 29 Test-t à un échantillon entre fréquences moyennes de gain standardisées et

valeur test de zéro ............................................................................................................... 127

viii

Tableau 30 Fréquence de représentativité des modèles par participant ............................. 131 Tableau 31 Test-t à un échantillon entre fréquence de représentativité et valeur test de zéro

............................................................................................................................................ 132

Tableau 32 Différences absolues de fréquence moyenne d’utilisation entre les modèles. Les

différences non significatives sont ombragées ................................................................... 133 Tableau 33 Décomposition de l’interaction L&V1 ............................................................ 136 Tableau 34 Décomposition de l’interaction L&V2 ............................................................ 136 Tableau 35 Décomposition de l’interaction ML1 .............................................................. 137

Tableau 36 Décomposition de l’interaction sur adaptabilité .............................................. 138 Tableau 37 Test-t à un échantillon entre fréquence de gain et valeur test de zéro ............. 149 Tableau 38 Fréquence de représentativité des modèles par participant ............................. 151

Tableau 39 Test-t à un échantillon entre fréquence d’utilisation des modèles et valeur test

de zéro ................................................................................................................................ 152 Tableau 40 Différences moyennes absolues de la fréquence de représentativité des modèles.

Les différences non significatives sont ombragées ............................................................ 153

Tableau 41 Décomposition de l’interaction ML1 .............................................................. 156

Tableau 42 Décomposition de l’interaction adaptabilité .................................................... 158

ix

LISTE DES FIGURES

Figure 1. Modèle computationnel de prise de décision dynamique de Gibson et

collaborateurs (1997). Selon ce modèle, la prévision de l’évolution de la situation est une

composante importante dans le processus de prise de décision, mais demeure distincte de

cette dernière. Ainsi, la prévision de l’évolution peut, mais ne doit pas, inclure l’action. ..... 7 Figure 2. Illustration de trois séries temporelles. Dans ce cas précis, où la Variable 3 à la

période t = 26 serait le critère, et où aucune connaissance du domaine n’est possible, les

indices disponibles peuvent être de deux sources distinctes. La source extrinsèque concerne

la valeur des autres variables explicitement disponibles dans l’environnement. Dans ce cas-

ci, la valeur de la Variables 1 et de la Variable 2 aux périodes t <= 25 seraient des indices

de source extrinsèque possibles pour prédire le critère. La source intrinsèque serait la valeur

du critère lui-même (c’est-à-dire Variable 3) aux périodes passées t <= 25. ....................... 10 Figure 3. Welch, Bretschneider et Rohrbaugh (1998) manipulent entre autres la tendance à

long terme des séries temporelles. La série (a) représente une croissance moyenne de 20 par

période alors que la série (b) est caractérisée par une croissance moyenne de 10 par période.

Les participants doivent prédire la valeur de la série temporelle au temps t+n à plusieurs

reprises. ................................................................................................................................. 13 Figure 4. Welch, Bretschneider et Rohrbaugh (1998) ont aussi manipulé les indices

disponibles aux participants pour réaliser leur prévision. La condition (a) ne comportait

seulement que la valeur actuelle du critère alors que la condition (b) présentait certaines

informations relatives aux valeurs passées du critère. .......................................................... 14 Figure 5. Selon le ML, un environnement (composé d’un ensemble de critères Ye) peut être

prédit par une combinaison linéaire d’un ensemble d’indices (Xi). Le jugement (Ys) peut

également être modélisé par une pondération linéaire des indices. ...................................... 17 Figure 6. Diagramme du ML. Dans “Heuristic and Linear Models of Judgment: Matching

Rules and Environments” par R. M. Hogarth et Karelaia, 2007, Psychological Review, 114,

p. 734. Copyright 2007 de American Psychological Association. ....................................... 18 Figure 7. Exemple du comportement du modèle ANC1 lors de la prévision d’une série

temporelle critère de référence. ............................................................................................ 43 Figure 8. Exemple du comportement du modèle ANC2 lors de la prévision d’une série

temporelle critère de référence. On remarque entre autres que pour la période t = 17, la

prévision du modèle est parfaitement ajustée au critère alors qu’elle ne l’était pas lors de

l’application du modèle ANC1. ............................................................................................ 44

Figure 9. Exemple du comportement du modèle ANC3 lors de la prévision d’une série

temporelle critère de référence. Pour la prévision de cette série, les réponses produites par

ANC3 sont très similaires à ANC2 et identiques à ANC1. .................................................. 45 Figure 10. Exemple du comportement du modèle L&V1 lors de la prévision d’une série

temporelle critère de référence. Notez que les prévisions faites à l’aide de ce modèle sont

relativement différentes de celles faites par les modèles d’ancrage et ajustement. .............. 48 Figure 11. Exemple du comportement du modèle L&V2 lors de la prévision d’une série

temporelle critère de référence. Ce modèle est le premier, parmi ceux décrits, qui utilise des

informations de source extrinsèque (ces séries ne sont pas montrées dans la figure). Cela a

x

pour effet de modifier les prévisions par rapport à L&V1, notamment pour les périodes t >

1 et t < 9. ............................................................................................................................... 50 Figure 12. Exemple du comportement du modèle L&V3 lors de la prévision d’une série

temporelle critère de référence. Ce modèle extrait, intègre et pondère l’ensemble des

indices disponibles. Bien que la méthode de pondération soit simplifiée, ce modèle demeure

néanmoins le plus complexe parmi ceux présentés et constitue probablement une stratégie

hors de la portée cognitive humaine. .................................................................................... 51 Figure 13. Exemple du comportement du ML1 lors de la prévision d’une série temporelle

critère de référence. Ce modèle constitue la norme rationnelle dans ce contexte. Dans ce cas

précis, on observe que les prévisions de ML1 semblent relativement bien ajustées au

critère, mais que le niveau d’ajustement semble moindre à celui de certains modèles

d’heuristiques décrits précédemment. .................................................................................. 53 Figure 14. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces

séries est à la fois un critère et un indice. ............................................................................. 59 Figure 15. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces

séries est à la fois un critère et un indice. ............................................................................. 59

Figure 16. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries

est à la fois un critère et un indice. ....................................................................................... 60 Figure 17. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries

est à la fois un critère et un indice. ....................................................................................... 60 Figure 18. Facteur de relation entre la série temporelle critère Y2 et chacune des séries

temporelles K. Il n’y a pas de facteur de relation pour la série K2 puisqu’il s’agit de la série

critère et que ce paramètre n’est estimé que pour les séries extrinsèques. ........................... 63

Figure 19. Poids attribué aux indices Kn et Y pour la prévision de la série temporelle critère

Y2. Notez qu’au départ, le poids attribué à l’indice intrinsèque est le plus important, mais

qu’il cède éventuellement place à d’autres indices extrinsèques. ........................................ 64 Figure 20. Coefficients de régression non-standardisés des indices Kn et Y pour la prévision

de la série temporelle critère Y2. Notez qu’à l’inverse des poids calculés par le modèle

L&V3, le coefficient de l’indice intrinsèque (B 02) est d’abord faible, puis devient le plus

important par la suite. ........................................................................................................... 65

Figure 21. Prévisions de L&V3 et ML1 et valeurs réelles de la série temporelle critère

(nommée 7 ind ; faible – V2) pour les périodes [t > 9 : t <= 41]. Le critère est nommé « 7

ind » et « faible » puisqu’il est dans une condition où 7 indices extrinsèques sont

disponibles pour le prédire et où la force d’association extrinsèque avec ces indices est

faible.Les deux modèles génèrent des prévisions distinctes, et aucune n’arrive à prédire

parfaitement la série temporelle critère. ............................................................................... 65 Figure 22. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle

des modèles d’heuristiques formalisées et séries co-évoluant avec celles-ci (grises). ......... 69 Figure 23. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries

est à la fois un critère et un indice. Ces huit séries ont en moyenne une autocorrélation et

une force d’association extrinsèque élevées. ........................................................................ 77 Figure 24. Huit séries temporelles présentées lors de la Simulation 2. Chacune de ces séries

est à la fois un critère et un indice. Ces huit séries ont en moyenne une autocorrélation

élevée et une force d’association extrinsèque faible. ........................................................... 77



faible et une force d’association extrinsèque élevée. ........................................................... 78

xi



faible et une force d’association extrinsèque faible. ............................................................. 78

Figure 27. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle

de tous les modèles d’heuristiques et séries co-évoluant à celles-ci (grises). ....................... 83 Figure 28. Interface de CODEM. L’onglet « Situation » permet aux participants d’accéder

aux informations relatives aux valeurs actuelles et passées de toutes les variables de la

situation. Ces valeurs sont présentées sous forme graphique et numérique. Pour consulter

les valeurs passées, les participants doivent glisser la poignée située au bas à droite de

l’interface vers la gauche. ................................................................................................... 112 Figure 29. Interface de CODEM. L’onglet « Prédiction » permet aux participants d’entrer

la valeur numérique de leurs prévisions ainsi que d’indiquer leur niveau de confiance

moyen pour la période actuelle sur une échelle de 1 à 5. ................................................... 112 Figure 30. Interface de CODEM. Les écrans de rétroaction fournissent des informations sur

les changements dans les valeurs réelles des variables (haut) et sur la direction et

l’amplitude des erreurs de prévision (bas). ......................................................................... 113

Figure 31. Instructions présentées aux participants avant la tâche expérimentale. ............ 121 Figure 32. Exemple des réponses données par un sous-ensemble de 13 participants (gris)

comparativement à la série temporelle critère (noire). ....................................................... 123

Figure 33. Performance moyenne des participants par condition expérimentale (nombre

d’indices et force d’association extrinsèque). La performance correspond à la proportion de

variance expliquée des séries temporelles par les prévisions des participants. .................. 124 Figure 34. Gain de performance moyen des participants par condition expérimentale

(nombre d’indices et force d’association extrinsèque). Le gain de performance correspond à

la différence entre la performance des participants et celle obtenue par l’application parfaite

du modèle de jugement linéaire. ......................................................................................... 126 Figure 35. Fréquence de gain de performance par participant. Tous les participants ont

obtenus une performance supérieure à celle du modèle de jugement linéaire à au moins sept

reprises sur une possibilité de vingt-quatre. ........................................................................ 127 Figure 36. Fréquence de gain standardisée moyenne par condition expérimentale (nombre

d’indices et force d’association extrinsèque). Les tests-t révèlent que les fréquences sont

supérieure à 0 pour l’ensemble des conditions expérimentales. ......................................... 128

Figure 37. Proportion moyenne de représentativité des modèles par condition

expérimentale (nombre d’indices et force d’association extrinsèque) et modèle. .............. 134

Figure 38. Adaptabilité par condition expérimentale (nombre d’indices et force

d’association extrinsèque). .................................................................................................. 138 Figure 39. Exemple des réponses données par un sous-ensemble de 13 participants (gris)

comparativement à la série temporelle critère (noire). ....................................................... 145 Figure 40. Performance moyenne des participants par condition expérimentale (force

d’autocorrélation et force d’association extrinsèque). La performance correspond à la

proportion de variance expliquée des séries temporelles par les prévisions des participants.

............................................................................................................................................ 147 Figure 41. Gain de performance moyen des participants par condition expérimentale

(autocorrélation et force d’association extrinsèque). Le gain de performance correspond à la

différence entre la performance des participants et de celle obtenue par l’application

parfaite du modèle de jugement linéaire. ............................................................................ 148

xii

Figure 42. Fréquence de gain de performance par participant. Tous les participants ont

obtenus une performance supérieure à celle du modèle de jugement linéaire à au moins neuf

reprises sur une possibilité de trente-deux. ........................................................................ 149

Figure 43. Fréquence de gain standardisée par condition expérimentale (force

d’autocorrélation et force d’association extrinsèque). Les tests-t révèlent que les fréquences

sont supérieures à zéro pour l’ensemble des conditions expérimentales. .......................... 150 Figure 44. Proportion moyenne de représentativité des modèles par condition

expérimentale (autocorrélation et force d’association extrinsèque) et modèle. ................. 154

Figure 45. Adaptabilité par condition expérimentale (autocorrélation et force d’association

extrinsèque). ....................................................................................................................... 157 Figure 46. Exemple de prévisions de participants et de modèles pour une série critère avec

3 indices extrinsèques, autocorrélation élevée et force d’association élevée. Prévisions de

deux participants (9 et 11, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert), la

série critère (en rouge) et les séries extrinsèques (en grises). ............................................ 207 Figure 47. Exemple de prévisions de participants et de modèles pour une série critère avec


deux participants (9 et 11, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert), la

série critère (en rouge) et les séries extrinsèques (en grises). ............................................ 208 Figure 48. Exemple de prévisions de participants et de modèles pour une série critère avec


deux participants (13 et 18, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert),

la série critère (en rouge) et les séries extrinsèques (en grises). ........................................ 209 Figure 49. Exemple de prévisions de participants et de modèles pour une série critère avec

7 indices extrinsèques, autocorrélation élevée et force d’association faible. Prévisions de

deux participants (13 et 16, en bleues), de deux modèles (ANC2 et ML1, en jaune et vert),

la série critère (en rouge) et les séries extrinsèques (en grises). ........................................ 210

xiii

REMERCIEMENTS

J’aimerais d’abord remercier Dr Sébastien Tremblay, mon directeur de thèse, pour

son dévouement tout au long de mon cheminement. Sébastien m’a permis non seulement de

maîtriser les outils essentiels à la recherche, mais m’a aussi montré les qualités qui font

d’une personne un bon chercheur. Notamment, je lui suis reconnaissant pour son

dynamisme, sa curiosité intellectuelle et pour son humilité scientifique. Il m’a montré qu’il

est toujours possible de remettre les idées conçues en question, que ce soit les nôtres ou

celles d’autrui. Je le remercie également pour toutes les opportunités offertes qui m’ont

permis de réaliser cette thèse, mais aussi d’être impliqué dans une panoplie de projets

stimulants.

Je souhaite également remercier les Drs Robert Rousseau et Michel B. DuCharme

d’avoir accepté de siéger sur mon comité de thèse. Les discussions que j’ai eu la chance

d’avoir avec vous ont tantôt été stimulantes, tantôt inspirantes. Dans tous les cas, elles

auront été formatrices et m’auront fait apprécier le travail de recherche. J’aimerais aussi

faire une mention spéciale pour Dre Claudette Fortin qui m’a donné une première chance

alors que j’étais toujours au baccalauréat.

Je tiens aussi à souligner le soutient exceptionnel procuré par Dr Frédéric Dehais

lors de mon séjour à l’ISAE. Vous m’avez rapidement considéré comme un collègue,

témoignant ainsi de votre confiance envers moi, et je vous en suis reconnaissant. Je veux

aussi féliciter toute l’équipe du CAS pour la qualité de la recherche conduite dans votre

laboratoire. J’aimerais également profiter de cette occasion pour remercier cette équipe

pour leur accueil chaleureux et plus spécifiquement Frédéric Dehais, Mickaël Causse,

Nicolas Régis, Éric Menant, Gauthier Durantin et Louise Giraudet qui ont grandement

contribué à rendre mon expérience en France mémorable.

Cela me mène naturellement à saluer mes collègues et amis. Certaines amitiés se

sont créées au cours de mon cheminement, notamment celles de Rémi Gaudreault, Daniel

Lafond et Cindy Chamberland. Bien que récentes, ces amitiés sont toutes très importantes

pour moi. D’autres amitiés perdurent depuis des années, particulièrement Bruno-Alexandre

xiv

Veillette-Cossette, Maxime Beaulieu, Jean-Mathieu Leclerc et Mathieu Dupuis. Bien que

nos routes se soient séparées il y a déjà un bon moment, vous aurez toujours contribué de

façon significative à ce que je suis devenu. Je réserve un merci particulier à Charles Viau-

Quesnel, Paule Ellefsen-Gauthier et leur conjoint respectif Rosalie Bilodeau et Yann Wafer

pour leur complicité authentique concrétisée par les bons moments passés ensembles.

Je termine en remerciant mes proches pour le support qu’ils m’ont conférés au cours

de ces longues années. Merci d’abord à mes beaux-parents, je me sens privilégié d’être

votre gendre et de me sentir chez vous comme si j’étais chez moi. Un merci spécial à

Gaëtan, mon grand-père, pour m’avoir transmis sa curiosité intellectuelle qui représente

encore aujourd’hui le vecteur principal de ma passion pour la recherche. Mes frères,

Mathieu, Olivier, je serai toujours heureux de discuter avec vous, car la passion que vous

exprimez en parlant de vos activités respectives vous rallie. Évidemment, merci à mes

parents pour leur soutien sans faille, tant moral que matériel. Si je ne transmets qu’une

fraction de votre amour à Raphaël, je serai déjà le meilleur des pères. Raphaël, d’ailleurs,

que je remercie pour être le seul à ne pas me demander quand ma thèse sera terminée!

Finalement, merci à ma conjointe, Catherine. Sache que les sacrifices que tu as faits pour

me permettre de réaliser cette thèse ne sont pas vains puisqu’ils germent en mon cœur en

amour pour toi. Je te serai éternellement reconnaissant pour tout, merci.

xv

AVANT-PROPOS

La présente thèse est rédigée en français et présentée dans un format traditionnel.

Néanmoins, les résultats présentés dans la présente thèse ont été partiellement publiés lors

de la conférence annuelle de Cognitive Science Society. Les résultats de l’Expérience 1 ont

été publiés en 2011 à Boston alors que les résultats de la Simulation 2 et de l’Expérience 2

ont été publiés lors de la conférence de 2012 à Sapporo. Les références précises sont

présentées ci-dessous :

Gagnon, J.-F., St-Louis, M.-E., & Tremblay, S. (2012). Selection of decision rules in

dynamic decision making. Affiche présentée au 34ème

Annual Meeting of the

Cognitive Science Society, Sapporo, Japan.

Gagnon, J.-F., & Tremblay, S. (2011). Forecasting the evolution of a system: the role of

cognitive strategies in complexity discovery. Affiche présentée au 33ème

Annual

Meeting of the Cognitive Science Society, Boston, MA.

1

INTRODUCTION GÉNÉRALE

2

Les individus qui doivent prendre des décisions au sein d’un environnement

dynamique émettent constamment des prévisions sur l’évolution de la situation. Ces

prévisions permettent aux individus d’adapter leurs décisions afin de les rendre plus

efficaces (Pezzulo, 2008). Le processus de prévision est fondamental dans plusieurs

domaines, particulièrement dans un contexte où la complexité est élevée. Par exemple,

l’ajustement de politiques financières nécessite de prédire les changements dans la valeur

d’indicateurs macro-économiques. Les médecins doivent aussi se baser sur la prévision de

l’évolution de marqueurs physiologiques pour ajuster une intervention médicale (par

exemple, Busemeyer, 1999). Finalement, les investissements financiers sont largement

déterminés par la prévision des indices boursiers (par exemple, Lawrence et al., 2006;

Stekler, 2007; Teddy & Ng, 2011). De telles situations sont caractérisées par un niveau

élevé de complexité dynamique et d’opacité. Essentiellement, cela signifie qu’elles sont

déterminées par un nombre important de facteurs en interactions, dont émergent des patrons

d’évolution temporelle non linéaires, en plus d’être difficilement observables (Gonzalez et

al., 2005). Plusieurs études démontrent que les individus qui, de par leur fonction, doivent

tenter de contrôler et/ou prédire l’évolution de ces situations y arrivent difficilement, voire

pas du tout (par exemple, Blech & Funke, 2005; Diehl & Sterman, 1995).

La connaissance des sources de ces difficultés est critique puisque les dommages

qui sont associés à une prévision inefficace sont substantiels. Par exemple, la compagnie

Nike a reconnu qu’une erreur de prévision de son inventaire est à l’origine de pertes

évaluées à 400 millions de dollars (Worthen, 2003). Conséquemment, les efforts déployés

pour développer des modèles statistiques capables de prédire ces situations sont

considérables. Des modèles statistiques de prévision ont été appliqués avec succès entre

autres aux domaines du recrutement de personnel (par exemple, Jilani et al., 2008), des

indices financiers (par exemple, Wang & Chen, 2009), de la demande touristique (par

exemple, Huarng et al., 2007) et des accidents de véhicules routiers (par exemple, Jilani &

Burney, 2007). Néanmoins, malgré les efforts importants accomplis par la communauté de

chercheurs dans le domaine pour développer de tels modèles, le processus de prévision est

indissociable du jugement humain pour différentes raisons. Premièrement, plusieurs

travaux démontrent qu’un ajustement fait par un humain des prévisions calculées par les

3

modèles statistiques permet d’améliorer la précision des estimations (Goodwin, 2005;

McNees, 1990). Une des raisons mise de l’avant pour expliquer ce résultat étonnant est que

le prédicteur humain n’est pas contraint à un ensemble de facteurs prédéterminés et peut

donc intégrer des facteurs exogènes inexploités par le modèle statistique (Edmundson et al.,

1988; Sanders & Ritzman, 1992). Deuxièmement, les modèles statistiques peuvent être

perçus comme des boîtes noires dont les mécanismes sont mal compris et, par conséquent,

les décideurs peuvent souhaiter conserver un « droit de regard » sur les résultats

(Kleinmuntz, 1990; Langer, 1975). Finalement, derrière le développement de tout modèle

statistique, des jugements humains doivent être portés. Par exemple, lors du choix des

facteurs à intégrer au modèle (Stekler, 2007).

Le rôle central du jugement humain dans la prévision de situations dynamiques

complexes pousse plusieurs auteurs à dire que des recherches plus approfondies sur les

processus cognitifs impliqués dans l’exécution de cette tâche sont requises (Fildes &

Stekler, 2002; Stekler, 2007). Toutefois, toujours selon ces auteurs, seules de rares études

se sont intéressées aux processus cognitifs impliqués dans l’exécution de cette tâche.

Plusieurs auteurs (Gigerenzer & Gaissmaier, 2011; Stekler, 2007) suggèrent que pour

acquérir de telles connaissances, il faudrait développer et tester des modèles de prévision,

or, c’est précisément la méthode employée par la présente thèse. En effet, la thèse compare

plusieurs modèles en lien avec le comportement humain afin d’identifier quelles sont les

stratégies employées par les individus pour prédire les situations dynamiques complexes.

Entre autres, cette comparaison permettra d’établir si les individus sont irrationnels dans ce

contexte, c’est-à-dire s’ils emploient des stratégies sous optimales comparativement à une

norme établie.

La thèse explore le concept de « rationalité écologique » dans un contexte de

prévision. La rationalité écologique postule que l’adoption de règles simplifiées et rapides –

ou heuristiques – n’est pas intrinsèquement irrationnelle, mais qu’elle serait même

préférable, sous certaines conditions, à l’application stricte d’une logique formelle ou de la

théorie de la probabilité considérées comme rationnelles (Dieckmann & Rieskamp, 2007;

Rieskamp & Otto, 2006; Rieskamp & Reimer, 2007). Les conditions où de telles

4

heuristiques seraient performantes demeurent toutefois mal définies, particulièrement dans

un contexte de prévision de situation dynamique complexe. La thèse s’intéresse donc à ces

conditions, au sein d’une tâche de prévision, sous lesquelles l’adoption d’heuristiques est

adaptée.

La thèse se divise en quatre chapitres. Le premier chapitre présente une recension

des écrits dans laquelle sont décrits les principaux travaux empiriques portant sur les

facteurs associés à la qualité des prévisions humaines de situations dynamiques complexes.

Le chapitre se poursuit avec la présentation des principaux modèles théoriques qui

expliquent le jugement humain dans ce contexte. Il se conclut avec l’élaboration des

objectifs et hypothèses de la thèse. Le deuxième chapitre constitue un effort de simulation

computationnelle de stratégies cognitives de prévision. Ce chapitre évalue la performance

de modèles d’heuristiques comparativement à la norme rationnelle attendue de jugement

linéaire (Brunswick, 1952) sous plusieurs conditions. Ces conditions visent à faire varier la

qualité des informations dont disposent les modèles pour faire leurs prévisions. Les

simulations démontrent que les heuristiques performent mieux que le modèle de jugement

linéaire dans une grande variété de conditions. Le troisième chapitre concerne l’étude de la

prévision humaine de situations dynamiques complexes. Il étudie la performance humaine,

mais également les stratégies employées par les individus pour faire leurs prévisions. Les

expériences qui y sont décrites tentent de démontrer que la stratégie adoptée peut être plus

performante qu’une stratégie considérée comme rationnelle. En effet, les résultats

démontrent que les individus adaptent leur stratégie selon les caractéristiques de

l’environnement, ce qui permet fréquemment l’atteinte de performances supérieures à

celles obtenues par un modèle linéaire « rationnel ». Enfin, le dernier chapitre présente une

intégration théorique des deux chapitres empiriques de la thèse afin de mettre en lumière

l’ensemble des résultats observés. Les résultats sont principalement interprétés à la lumière

de la rationalité écologique.

5

CHAPITRE I

JUGEMENT HUMAIN DANS LA PRÉVISION DE SÉRIES

TEMPORELLES

6

Contexte théorique et problématique

Une prévision est une estimation de l’état futur d’une situation (Poli, 2010). Le

processus de prévision est fondamental dans plusieurs domaines d’application, notamment

dans un contexte où la complexité est élevée. Par exemple, des décideurs doivent prédire

l’évolution d’un feu de forêt pour allouer les ressources requises aux bons endroits

(Brehmer & Allard, 1991), ou encore prévoir quels seront les stocks d’inventaires de

chaînes d’approvisionnement pour éviter des effets indésirables comme le « bullwhip

effect ». Cet effet initialement décrit par Forrester (1961) consiste en des fluctuations

d’inventaires de plus en plus importantes et dissociées de la demande réelle du marché, qui

mènent à des coûts importants pour les entreprises en charge de la production et de la

distribution de biens (par exemple, Lawrence et al., 2006). De telles situations

dynamiquement complexes sont déterminées par un nombre important de facteurs en

interactions, dont émergent des patrons d’évolution temporelle non linéaires, en plus d’être

difficilement observables (Gonzalez et al., 2005). De plus, ces patrons temporels se

répètent rarement ce qui limite grandement la possibilité d’apprentissage (Kurtz &

Snowden, 2010; Sterman, 2010). Ces situations retiennent particulièrement l’attention des

chercheurs depuis quelques décennies puisqu’elles représentent un défi important pour les

humains en charge de les contrôler et de les prédire (pour une série d’exemples éloquents,

voir Dörner, 1996).

PRÉVISIONS ET DÉCISIONS

L’importance du processus de prévision dans la prise de décision ne fait aucun

doute (Osman & Speekenbrink, 2012). En effet, les prévisions sont requises dans la

planification des interventions pour l’atteinte efficace des objectifs (Burns & Vollmeyer,

2002; Gibson, 2007; Osman, 2010; Vollmeyer et al., 1996). Par exemple, certains

chercheurs ont observé qu’une proportion significative de temps est allouée par les pilotes

de ligne expérimentés à la prévision d’occurrences futures possibles lors du pilotage

(Amalberti & Deblon, 1992). Le processus de prévision fait d’ailleurs partie de plusieurs

modèles cognitifs qui tentent d’expliquer la prise de décision au sein d’environnements

dynamiques complexes. C’est le cas entre autres du modèle de la conscience de la situation

d’Endsley (1995), qui décrit la projection comme étant l’habileté à prévoir les évènements

7

et la dynamique future de la situation. Selon ce modèle, la projection constitue le plus haut

niveau de compréhension qu’un individu puisse avoir d’une situation et permettrait une

prise de décision adaptée en temps opportun (Endsley, 1995; 2000). L’utilité de telles

prévisions a d’ailleurs été testée par Gibson, Fichman et Plaut (1997) qui, au sein d’une

tâche de prise de décision dynamique (Sugar Production Factory; voir Stanley et al., 1989),

ont comparé des données humaines à des données simulées par un modèle de prise de

décision composé de deux sous-modèles : un sous-modèle d’action et un sous-modèle de

prévisions (voir Figure 1). Le sous-modèle de prévision a pour rôle de prédire l’utilité des

décisions dans un contexte donné. Les auteurs ont observé que le modèle représentait bien

plusieurs aspects des données humaines, notamment la performance à la tâche et la capacité

de transfert vers de nouveaux objectifs.

Figure 1. Modèle computationnel de prise de décision dynamique de Gibson et collaborateurs (1997). Selon

ce modèle, la prévision de l’évolution de la situation est une composante importante dans le processus de

prise de décision, mais demeure distincte de cette dernière. Ainsi, la prévision de l’évolution peut, mais ne

doit pas, inclure l’action.

Évolution prédite t+1 (F)

Évolution réelle t+1 (Y)

Objectif État actuel au temps t

Prévisions

Action

Modèle de prévision

Modèle d’action

8

Un autre consensus qui se dégage cette fois-ci des études sur la prévision en milieu

écologique est celui du rôle central du jugement humain pour réaliser cette tâche

comparativement à l’utilisation seule de modèles statistiques. Par exemple, la correction

des prévisions des modèles statistiques par des humains constitue la principale méthode

employée pour la prévision des niveaux d’inventaires dans les entreprises responsables de

chaînes d’approvisionnement (Fildes et al., 2009). Fildes et Goodwin (2007) ont réalisé des

entrevues auprès de 149 praticiens d’industries variées (par exemple, des gestionnaires de

haut niveau, des directeurs d’entreprises) dans le but de connaitre les méthodes employées

pour faire des prévisions dans un contexte écologique. Les praticiens étaient recrutés lors de

conférences internationales sur la prévision et représentaient plusieurs industries comme

l’alimentation, les télécommunications, les assurances, les banques, les produits

pharmaceutiques, le transport, le marché immobilier et les cosmétiques. Sur la base de ces

entrevues, les auteurs estiment que 75% des prévisions réalisées au sein de ces industries

impliquent une part de jugement humain. Seules 25% des prévisions seraient basées

exclusivement sur des modèles statistiques. De plus, bien que des prévisions puissent être

réalisées en partie par des algorithmes automatisés, il a été démontré à plusieurs reprises

que la précision des prévisions faites par ces modèles bénéficie d’un ajustement de la part

d’un analyste humain (par exemple, Goodwin, 2005; McNees, 1990). Entre autres, Fildes,

Goodwin, Lawrence et Nikolopoulos (2009) ont observé qu’en moyenne, sur 60 000

prévisions réelles tirées de quatre compagnies de chaîne d’approvisionnement, les

ajustements réalisés par des humains sur les prévisions statistiques ont permis d’accroître

leur précision. Ce résultat est surprenant étant donné les limites cognitives fondamentales

humaines, mais s’expliquerait par le fait que la combinaison humain machine pour la

réalisation de cette tâche permettrait de combler les faiblesses de l’une et l’autre des

approches pour l’atteinte d’un résultat supérieur (Goodwin, 2005).

Les modèles théoriques et les résultats empiriques cités précédemment démontrent

l’importance de la prévision dans la prise de décision dynamique. Ces observations sont

d’autant plus pertinentes que le jugement humain joue un rôle central dans la prévision de

situations dynamiques complexes. En effet, les méthodes statistiques semblent souvent

insuffisantes pour réaliser adéquatement cette tâche et sont ainsi peu utilisées seules.

L’importance des prévisions dans une panoplie de contextes et le manque d’études

9

intéressées à comprendre les processus cognitifs impliqués dans la prévision poussent

plusieurs auteurs à dire que des recherches plus approfondies sur ce sujet sont requises (par

exemple, Fildes & Stekler, 2002; Stekler, 2007). C’est donc dans ce contexte que la

présente thèse s’y intéresse.

Ce chapitre est organisé en quatre sections : (1) la description du paradigme

employé pour étudier la prévision de situations dynamiques complexes au sein de la

présente thèse (c’est-à-dire la prévision de séries temporelles) et des résultats clés qui en

émanent; (2) la description des principaux modèles du jugement humain applicables à la

prévision de séries temporelles; (3) une exposition des lacunes actuelles et des pistes de

réconciliation, notamment la rationalité écologique; et (4) une exposition des méthodes,

objectifs et hypothèses de la présente thèse.

PRÉVISION DE L’ÉVOLUTION DE SITUATIONS DYNAMIQUES COMPLEXES

Une prévision est tout jugement porté sur le futur (Clements & Hendry, 2002). Dans

un contexte de jugement, on réfère à la variable à prédire en tant que critère alors qu’on

réfère aux informations employées pour porter le jugement en tant qu’indices. Selon

Harvey (2007), trois types d’indices (ou source d’information) peuvent être utilisés afin de

réaliser ce jugement. Pour référence, ils seront nommés source mémoire (SM), source

extrinsèque (SE) et source intrinsèque (SI). La source mémoire ne concerne pas les données

explicitement disponibles dans l’environnement, mais plutôt les connaissances a priori

contenues en mémoire qui sont en lien avec la situation à prédire. Par exemple, un analyste

financier pourrait avoir une certaine représentation mentale du comportement du produit

intérieur brut d’un pays donné même s’il n’a pas accès à ces informations explicitement.

Lors d’un cours à l’université, il pourrait avoir acquis certaines connaissances sur le

comportement du produit intérieur brut en temps de crise économique sans pour autant en

avoir fait l’expérience dans sa pratique. Ces connaissances pourraient être employées pour

réaliser une prévision. La source extrinsèque concerne les valeurs d’autres variables

présentes dans l’environnement. Par exemple, dans la Figure 2, un jugement basé sur ce

type d’indice dans la prévision de la Variable 3 à la période t = 25 (donc pour la période t =

26), serait informé par la valeur de la Variable 1 et la Variable 2 aux périodes t <= 25.

Finalement, la source intrinsèque concerne les valeurs passées explicitement disponibles du

10

critère lui-même. Le critère est ainsi également son propre indice. Par exemple, dans la

Figure 2, la prévision de la Variable 3 à la période t = 25 (donc pour période t = 26), serait

informé par l’ensemble des valeurs de la Variable 3 aux périodes t <= 25. Ces sources

d’information ne sont pas mutuellement exclusives, chaque source pouvant être utilisée

individuellement ou en combinaison (Harvey et al., 1994). Par exemple, un individu

pourrait déterminer le niveau de base d’une variable avec la moyenne des instances passées

et ajuster la prévision selon la valeur d’une autre variable.

Figure 2. Illustration de trois séries temporelles. Dans ce cas précis, où la Variable 3 à la période t = 26 serait

le critère, et où aucune connaissance du domaine n’est possible, les indices disponibles peuvent être de deux

sources distinctes. La source extrinsèque concerne la valeur des autres variables explicitement disponibles

dans l’environnement. Dans ce cas-ci, la valeur de la Variables 1 et de la Variable 2 aux périodes t <= 25

seraient des indices de source extrinsèque possibles pour prédire le critère. La source intrinsèque serait la

valeur du critère lui-même (c’est-à-dire Variable 3) aux périodes passées t <= 25.

Le terme prévision peut toutefois être très englobant si on suppose qu’il concerne

tout jugement sur le futur, or, la présente thèse se concentre sur les situations dynamiques

complexes telles que la gestion de portefeuilles financiers ou la prévision de stocks

d’inventaire. Ces situations sont caractérisées par certaines propriétés qui spécifient la tâche

de prévision étudiée dans le cadre de la présente thèse. En effet, une situation est

dynamiquement complexe lorsque ses interrelations génèrent des patrons d’évolution non

0

50

100

150

200

250

300

350

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25

Val

eu

r

Période

Variable 1

Variable 2

Variable 3

Prévisions

11

linéaires dans le temps (voir Busemeyer & Pleskac, 2008; Gibson, 2007; Gonzalez et al.,

2005; Osman, 2010; Sterman, 2000). Selon Kurtz et Snowden (2010), ces patrons

temporels peuvent se répéter, mais leur évolution est incertaine. Conséquemment,

l’occurrence d’un patron spécifique dans le passé n’est pas garante de sa répétition dans le

futur. Typiquement, ces patrons non linéaires sont causés par des boucles de rétroactions

positives et des délais au sein de la structure causale d’un système (voir Forrester, 1961).

Toutefois, la nature des relations entre les variables impliquées dans une telle situation n’est

pas toujours accessible, c’est-à-dire que la situation est opaque (voir Brehmer, 1992;

Gonzalez et al., 2005; Machuca et al., 1998; Paich & Sterman, 1993; Sterman, 2002; 2006).

Les causes de l’opacité sont multiples, mais Sterman (1994) souligne que la principale

cause est la présence de délais de rétroaction qui limite l’apprentissage de telles relations.

Ces caractéristiques propres aux environnements dynamiques complexes sont critiques

puisqu’elles affectent la validité et la fiabilité des indices (en mémoire, intrinsèques et

extrinsèques) pour la prévision des critères (Seifert & Hadida, 2013). Ainsi, même si un

environnement est parfaitement déterminé par une structure causale bien définie, il peut

être perçu comme étant probabiliste, particulièrement par des individus non-familiers avec

l’environnement concerné (Vincente, 2003). Finalement, les indices et les critères

impliqués dans de telles situations sont fréquemment continus. Cette caractéristique est

importante puisqu’elle a un impact significatif sur la nature de la tâche à réaliser. En effet,

c’est une chose de prévoir si une cote boursière augmentera ou diminuera, mais il en est

une autre d’estimer la valeur du changement.

L’impact négatif de ces caractéristiques sur l’apprentissage des relations entre les

éléments de la situation est bien documenté (voir Dörner, 1996; Sterman, 2002; 2006).

Étant donné le peu d’apprentissage possible, la plupart des individus n’ont peu ou pas

d’information a priori en mémoire sur laquelle ils peuvent se baser lorsqu’ils émettent un

jugement de prévision. Ils doivent donc se baser sur les valeurs passées du critère et/ou la

valeur d’autres variables explicitement disponibles dans l’environnement. Pour reprendre

les termes de Harvey (2007), les individus doivent se baser sur les sources intrinsèques et

extrinsèques d’information. Ces sources d’information combinées à la nature continue des

variables impliquées dans ces situations sont des caractéristiques importantes qui sont

12

représentées au sein d’une tâche de prévision de séries temporelles, ce qui en fait un

paradigme de choix pour l’étude des prévisions de situations dynamiques complexes.

Tâche de prévision de séries temporelles. La tâche de prévision de séries

temporelles constitue un candidat intéressant pour l’étude de la prévision de situations

dynamiques complexes puisqu’elle en représente certains des aspects critiques (Lawrence

et al., 2006; Seifert & Hadida, 2013). Par exemple, elle comporte les mêmes sources

d’information et le critère est défini par des valeurs continues, non catégorielles. Cette

tâche consiste typiquement en la présentation d’une ou de plusieurs séries temporelles pour

lesquelles les participants doivent prédire la valeur pour la période suivante (t+1) ou une

période plus éloignée (t+n). Dans le paradigme de prévision de séries temporelles, le

participant est uniquement un observateur de la situation, c’est-à-dire que la situation

évoluera de la même façon, peu importe les prévisions faites par le participant. De plus, la

prévision de séries temporelles n’implique aucune pression temporelle. À l’inverse, dans

une tâche de prise de décision dynamique, les interventions du participant influenceront

l’évolution de la situation en plus de devoir composer avec une évolution autonome et en

temps réel de celle-ci (Brehmer, 1992; Edwards, 1962). Les différences entre la prévision

de séries temporelles et les situations dynamiques à proprement parlé sont importantes et

pourraient avoir une incidence sur la façon dont ces tâches sont réalisées. Néanmoins, sur

un continuum entre une situation purement statique et une situation dynamique, la prévision

de séries temporelles, se rapproche davantage des caractéristiques dynamiques étant donné

l’évolution temporelle des séries. Au sein du paradigme de prévision de séries temporelles,

les caractéristiques propres aux séries diffèrent en fonction des objectifs expérimentaux,

mais la valeur à prédire est continue, contrairement à une tâche de catégorisation d’objets,

par exemple, où le critère est souvent catégoriel. La Figure 3 montre deux exemples de

séries temporelles présentées par Welch, Bretschneider et Rohrbaugh (1998) à leurs

participants.

13

Figure 3. Welch, Bretschneider et Rohrbaugh (1998) manipulent entre autres la tendance à long terme des

séries temporelles. La série (a) représente une croissance moyenne de 20 par période alors que la série (b) est

caractérisée par une croissance moyenne de 10 par période. Les participants doivent prédire la valeur de la

série temporelle au temps t+n à plusieurs reprises.

Pour réaliser les prévisions, les participants ont typiquement accès à différentes

sources d’information, pouvant toutes être catégorisées selon les types d’indices

mentionnés précédemment (c’est-à-dire, SM, SE et SI; Harvey, 2007). Par exemple, Welch,

Bretschneider et Rohrbaugh (1998) ont manipulé les indices présentés aux participants

selon la condition de disponibilité de l’information à laquelle ils étaient assignés (voir

Figure 4). Dans la condition A, les participants avaient accès seulement à la valeur actuelle

du critère alors que dans la condition B, les participants avaient également accès à la valeur

actuelle du critère, ainsi qu’à certaines informations concernant ces valeurs passées. Par

exemple, ils avaient accès à la moyenne des trois dernières périodes et au changement

moyen par période.

14

Figure 4. Welch, Bretschneider et Rohrbaugh (1998) ont aussi manipulé les indices disponibles aux

participants pour réaliser leur prévision. La condition (a) ne comportait seulement que la valeur actuelle du

critère alors que la condition (b) présentait certaines informations relatives aux valeurs passées du critère.

Les données présentées aux participants le sont parfois sous forme graphique (par

exemple, Lim & O’Connor, 1996; Welch et al., 1998) et parfois sous forme numérique, au

sein d’un tableau (par exemple, Desanctis & Jarvenpaa, 1989; Harvey & Bolger, 1996). Ces

formats ont été testés puisqu’ils sont typiquement utilisés dans les tâches écologiques de

prévision telle que la gestion de portefeuilles financiers. La plupart des chercheurs adoptent

un mode graphique de présentation des données qui privilégierait une meilleure estimation

de la tendance des séries temporelles comparativement à la forme numérique au sein d’un

tableau (Lawrence et al., 2006).

Observations empiriques. Le principal consensus qui se dégage de l’étude du

jugement humain avec le paradigme de prévision de séries temporelles est que le jugement

humain est sujet à des biais et des erreurs systématiques attribués à l’adoption de règles

irrationnelles (par exemple, Becker & Leopold-Wildburger, 1996; Becker et al., 2007;

Bolger et Harvey, 1993; Eggleton, 1982; Harvey, 2007; Lawrence & Makridakis, 1989;

Ying Luo, 2013; O’Connor et al., 1997; Reimers & Harvey, 2011). Un jugement est

généralement considéré comme rationnel lorsqu’il est raisonné (ou choisi explicitement) et

15

qu’il correspond à la méthode considérée comme optimale pour l’atteinte des objectifs

(Sturm, 2012). Un jugement optimal est considéré comme le plus favorable à l’atteinte d’un

objectif, dans ce cas-ci, l’objectif étant de minimiser l’erreur de prévision. Par exemple,

lors d’une tâche de prévision basée sur un lien probabiliste entre les indices et le critère, le

modèle rationnel attendu correspond à un jugement linéaire où l’ensemble des indices sont

intégrés et pondérés de façon linéaire au critère, et ce au sein d’une même représentation

(Anderson, 1981; Brehmer, 1994; Hammond, 1996; Muth, 1961). Un jugement est donc

irrationnel s’il n’est pas raisonné ou optimal par rapport à une norme donnée, dans ce cas-ci

le jugement linéaire (Muth, 1961). Selon ces prémisses, les résultats observés en ce qui

concerne la rationalité des individus ne sont toujours pas concluants (voir Stekler, 2002;

2007). Dans certains cas, souligne Stekler, le même individu réalisera des prévisions

cohérentes avec le modèle rationnel pour une variable donnée et incohérentes pour une

autre variable.

Parmi les biais observés, il semble que les individus sous-estiment les pentes des

séries temporelles, autant positives que négatives (Eggleton, 1982; Lawrence &

Makridakis, 1989; O’Connor et al., 1997). Bolger et Harvey (1993) observent également

que (1) le choix de l’heuristique dépend du type de série temporelle, que (2) les heuristiques

adoptées n’étaient pas paramétrées de façon optimale et que (3) c’est ce qui expliquerait en

partie la performance médiocre observée. Ce dernier point est essentiel puisqu’il attribue

une partie de la performance humaine aux stratégies employées pour faire un jugement,

comparativement aux caractéristiques individuelles, comme l’intelligence (Danner et al.,

2011). L’adoption de ces stratégies pourrait être modulée par les caractéristiques

environnementales, particulièrement selon la nature des sources d’information disponibles

(voir Harvey, 2007). Les connaissances sur les stratégies employées pour porter des

jugements sur les séries temporelles sont néanmoins encore fragmentaires et parfois

contradictoires, comme en témoigne le débat toujours actif de la rationalité des jugements

dans ce contexte (Stekler, 2002; 2007). Toutefois, plusieurs modèles d’heuristiques

pourraient s’appliquer à la prévision de séries temporelles et permettraient certainement

d’acquérir des connaissances sur les stratégies adoptées pour faire des prévisions (Fildes &

Stekler, 2002). Ces modèles sont décrits en détails dans les pages subséquentes.

16

MODÈLES DE JUGEMENT

La littérature sur le jugement humain est dominée par deux classes de modèles. La

première classe considère que les individus intègrent et pondèrent toutes les informations

disponibles au sein d’une représentation typiquement linéaire (Anderson, 1981; Brehmer,

1994; Hammond, 1996; Muth, 1961). Ce type de jugement est souvent considéré par

plusieurs comme étant la norme rationnelle, menant à une prévision optimale au sein des

environnements probabilistes comme la prévision de séries temporelles complexes.

D’ailleurs, Karelaia et Hogarth (2008) rapportent, dans une méta-analyse regroupant 249

études, un niveau élevé de prévisibilité des environnements linéaires et non linéaires à

l’aide de cette classe de modèle. La prévisibilité réfère à la capacité du jugement linéaire à

prédire le critère avec précision. Cette prévisibilité élevée constitue l’argument principal en

faveur du modèle linéaire comme étant la norme rationnelle dans ce type d’environnement.

La seconde classe de modèles considère que les individus sont intrinsèquement limités en

termes de traitement de l’information et que, par conséquent, ils adoptent des règles

simplificatrices, nommées heuristiques (Gigerenzer et al., 1999; Goldstein & Gigerenzer,

2009; Kahneman et al., 1982; Todd & Gigerenzer, 2000). Les heuristiques sont des

stratégies cognitives rapides et facilement exécutables, mais aussi simplificatrices

puisqu’elles ignorent une certaine partie de l’information disponible (Gigerenzer &

Gaissmaier, 2011). Les pages qui suivent contiennent une description de chacune de ces

classes de modèles et de leurs principaux représentants.

Jugement Linéaire. Le modèle le plus connu et le plus étudié du jugement linéaire

est le modèle lentille (ML) (Brunswik, 1952; 1955; puis Tucker, 1964; voir Figure 5). Bien

qu’il existe d’autres façons de modéliser le jugement linéaire, le ML représente la façon la

plus acceptée par la communauté scientifique. Selon le ML, un environnement (composé

d’un ensemble de critères Ye) peut être prédit par une combinaison linéaire d’un ensemble

d’indices (Xi). Ce modèle suppose également que le jugement humain (Ys) procède de cette

manière, c’est-à-dire par la pondération linéaire des indices.

17

JugementCritère

Indices

Figure 5. Selon le ML, un environnement (composé d’un ensemble de critères Ye) peut être prédit par une

combinaison linéaire d’un ensemble d’indices (Xi). Le jugement (Ys) peut également être modélisé par une

pondération linéaire des indices.

Le ML suppose donc que le lien entre les indices et le critère peut être décrit de

manière probabiliste et que cette façon de procéder représente bien la compréhension

qu’ont les humains de leur environnement (Brunswik, 1952; 1955). C’est-à-dire que la

compréhension de l’environnement passe par un jugement qui pondère la validité de chacun

des indices selon une probabilité de représentativité plutôt qu’une certitude. L’hypothèse

probabiliste ne peut toutefois pas être démontrée empiriquement puisqu’il est toujours

possible qu’une relation déterministe sous-jacente au comportement probabiliste existe.

Néanmoins, comme Vincente (2003) le souligne, il est tout à fait possible de décrire un

environnement déterminé par un modèle probabiliste. De plus, dans plusieurs situations

(par exemple, le marché de la bourse), les relations déterministes sont inconnues ou peut-

être même inexistantes. Par conséquent, ces situations ne peuvent pas être décrites par des

modèles déterministes, mais peuvent l’être par des modèles probabilistes comme le ML

(voir aussi Hammond, 1996).

Brunswik (1952) fut le premier à élaborer ce modèle probabiliste linéaire de

jugement humain, mais on attribue à Tucker (1964) sa formalisation en termes statistiques

(Figure 6). La partie gauche du ML constitue une description de l’environnement alors que

la partie droite du modèle concerne le jugement humain de ce même environnement. Selon

ce modèle, la prévisibilité de l’environnement (Re) et l’adéquation entre le modèle de

l’environnement et le modèle du jugement (G) sont deux déterminants importants de la

18

performance. La prévisibilité de l’environnement spécifie la limite supérieure de

performance qu’un individu peut atteindre (Vincente, 2003), alors que l’adéquation spécifie

le niveau auquel la règle de jugement linéaire est respectée. Selon une méta-analyse

récente, le ML explique environ 64% de la variance de l’environnement (Re2) et du

jugement humain (Rs2) (Karelaia & Hogarth, 2008).

X1

Xi

Xj

Xk

Jugement du participant = YsValeur du critère = Ye

Valeur prédite du critère = Ŷe

Prédiction du jugement du

participant = Ŷs

Indices

PYeX 1

PY

s X1

PYeX i PYsXi

PYeXj PYsX j

PY

e Xk PY

sXk

Prévisibilité du

jugement

Prévisibilité de

l’environnement

Index d’adéquation

Index de

performance

Figure 6. Diagramme du ML. Dans “Heuristic and Linear Models of Judgment: Matching Rules and

Environments” par R. M. Hogarth et Karelaia, 2007, Psychological Review, 114, p. 734. Copyright 2007 de

American Psychological Association.

Jugement Linéaire en tant que norme rationnelle. Il existe plusieurs définitions de

la rationalité. Bien qu’il existe probablement d’autres modèles de jugement qui pourraient

être considérés comme norme rationnelle dans ce contexte, le modèle de jugement linéaire,

qui a été largement étudié dans le domaine du jugement et de la prise de décision,

représente un candidat crédible car il répond aux principales conditions nécessaires pour

19

être considéré comme norme rationnelle. En effet, selon Hastie et Dawes (2010) la

rationalité se définit par quatre conditions :

(1) Elle est basée sur les capacités actuelles du juge, incluant son état cognitif,

physiologique, et émotif.

(2) Elle est basée sur les conséquences possibles du jugement.

(3) Lorsque les conséquences d’un jugement sont incertaines, les probabilités sont

évaluées en fonction des règles de base de la probabilité.

(4) Le jugement est adapté par rapport aux contraintes de ces probabilités et la

valeur des conséquences attribuées par le juge.

Dans ce contexte-ci, la première condition est satisfaite par le modèle de jugement

linéaire essentiellement pour deux raisons. La première concerne la pertinence

fonctionnelle du modèle comparativement à la cognition humaine, la seconde concerne

l’efficacité de ce modèle à représenter le jugement humain dans des situations dynamiques

complexes. Premièrement, la flexibilité du jugement linéaire constitue selon plusieurs

auteurs une caractéristique cruciale du jugement humain et devrait ainsi être représentée au

sein des modèles qui le représentent (Brehmer, 1994; Brunswick, 1952). Ce que Brunswick

appelle le fonctionnement par procuration du jugement humain, c’est sa capacité à être

flexible et interchangeable pour être adapté à une série de situations différentes. Cette

capacité serait critique pour faire face à des situations inconsistantes, inattendues ou

incomplètes. Cette similarité fonctionnelle du modèle de jugement linéaire en comparaison

avec le jugement humain se traduit également par un niveau élevé d’adéquation entre le

modèle et les jugements des individus (p.ex., Einhorn et al., 1979; Payne et al., 1993), ce

qui correspond au second argument en faveur de ce modèle comme norme rationnelle. En

effet, selon Karelaia et Hogarth (2008), le modèle de jugement linéaire expliquerait en

moyenne 64% de la variance du jugement des individus.

Dans le contexte de la thèse, les trois autres conditions sont aussi satisfaites,

notamment grâce à la nature de la tâche et aux mécanismes propres du jugement linéaire.

En effet, les « conséquences » possibles du jugement sont qu’il sera précis ou imprécis. Tel

qu’il sera décrit en détails plus loin dans le document, il n’y a pas d’autres conséquences

que de réussir ou échouer à prédire le critère. Le jugement doit donc nécessairement être

20

basé sur ces conséquences. De plus, les « conséquences » peuvent être évaluées en fonction

des règles de la probabilité. Le modèle de jugement linéaire est essentiellement basé sur

une optimisation de la combinaison linéaire pour prédire le critère et correspond donc à une

implémentation tout à fait viable des règles de base des probabilités. En effet, le modèle de

jugement linéaire a déjà démontré à plusieurs reprises sa capacité à représenter des

environnements complexes et dynamiques, et ce même lorsque ceux-ci sont caractérisés par

un certain niveau de non-linéarité. En effet, la méta-analyse de Karelaia et Hogarth (2008)

soulève que le modèle de jugement linéaire explique la variance de l’environnement entre

50% et 71%, dépendamment du contexte. En effet, même au sein d’environnements

défavorables, par exemple lorsqu’il n’y a pas de possibilité pour l’apprentissage ou dans un

environnement ou le lien entre les indices et les critères est non-linéaire, le modèle de

jugement linéaire arrive à bien expliquer la variance. Ce n’est d’ailleurs pas surprenant si le

modèle linéaire général est utilisé en mathématiques statistiques comme outil de

modélisation générique, étant donné sa grande flexibilité (Tabachnick & Fidell, 2007). De

plus, les modèles linéaires (souvent autorégressifs) sont fréquemment utilisés pour la

prévision de séries temporelles (p.ex., Anderson, 2011; Box et al., 2013; Chatfield, 2013;

Young, 2011).

Finalement, la quatrième condition est respectée étant donné la nature de la tâche,

qui attribue une valeur supérieure aux prévisions précises comparativement aux prévisions

imprécises. Le modèle de jugement linéaire tentera de minimiser l’erreur de prévision sur la

base de l’ampleur de l’erreur.

En résumé, selon ces critères, le modèle de jugement linéaire se qualifie comme

étant rationnel pour la prévision de séries temporelles et constituera la norme rationnelle

dans le contexte de la présente thèse. Il existe d’autres types de modèles, notamment le

jugement bayésien, qui pourraient également constituer la norme rationnelle dans ce

contexte, mais le modèle est jugé comme étant suffisant pour les besoins de la présente

thèse. En tant que norme rationnelle, il est attendu que les individus qui effectuent un

jugement de prévision de séries temporelles se comportent de manière similaire à ce dernier

pour l’atteinte de performance optimale.

21

Heuristique. Bien que le modèle de jugement linéaire représente la norme

rationnelle dans le contexte de cette thèse, il existe des situations qui mènent clairement à

des jugements mieux décrits par des règles non linéaires telles que certaines heuristiques

(par exemple, Anufriev & Hommes, 2012). Une heuristique est une stratégie cognitive

économe et rapide que les humains et même certains animaux utilisent (voir Hutchinson &

Gigerenzer, 2005). Elles sont qualifiées d’économes parce qu’elles ignorent généralement

une partie de l’information disponible pour faire un jugement. Elles sont considérées

comme rapides comparativement à des stratégies plus intégratives. À l’opposé des

stratégies intégratives comme le jugement linéaire, les heuristiques ne représenteraient pas

un traitement optimal de l’information lors d’une tâche de jugement ou de prise de décision

et ainsi, représenteraient une décision irrationnelle (par exemple, Dawes & Hastie, 2001;

Harvey, 2007). Néanmoins, selon certains auteurs, les humains seraient enclins à utiliser de

telles stratégies cognitives puisqu’elles représenteraient un bon compromis entre efforts et

résultats (par exemple, Beach & Mitchell, 1978; Smith & Walker, 1993). En effet, ces

stratégies sont faciles à implémenter et produisent des résultats suffisamment bons dans la

plupart des contextes. Selon Simon (1955; 1956), pionnier dans le domaine, les humains

ont une rationalité contrainte par leurs limitations cognitives, ce qui les pousseraient à

adopter des heuristiques.

On attribue à Kahneman, Slovic et Tversky (1982) l’origine du programme de

recherche sur les heuristiques et les biais qui en découlent, bien que certains travaux

antérieurs s’y étaient intéressés sans pour autant les nommer ainsi (par exemple, Anderson

et al., 1980; Carroll, 1978; Lichtenstein et al., 1978; Ross et al., 1977). Néanmoins,

Kahneman et ses collègues définissent trois heuristiques, (1) disponibilité, (2)

représentativité et (3) ancrage et ajustement, qui constituent encore aujourd’hui le cheval de

bataille des défenseurs du jugement rapide et économe. Ces heuristiques ont été observées

dans une grande variété de contextes et, récemment, Harvey (2007) discute de leur

implication dans la formulation des jugements de prévision de séries temporelles en lien

avec les sources d’information disponibles. Selon cet auteur, les sources d’information

présentes dans l’environnement guideront la sélection de l’une ou l’autre de ces stratégies.

Sommairement, il attribue l’adoption de l’heuristique de disponibilité d’information en

22

mémoire; l’heuristique de représentativité aux informations extrinsèques; et l’heuristique

d’ancrage et ajustement aux informations intrinsèque.

Heuristique de disponibilité. L’heuristique de disponibilité est basée sur la prémisse

que la facilité d’effectuer le rappel d’un évènement en mémoire est associée à la probabilité

réelle d’occurrence de cet évènement et peut donc constituer un indice unique pour la

prévision de ce dernier (voir Kahneman et al., 1982; Tversky & Kahneman, 1973). Cette

heuristique est similaire à celle de reconnaissance qui stipule que parmi deux options, si

une seule d’entre elles est reconnue, ce sera celle retenue (Goldstein & Gigerenzer, 1999).

Pour une discussion sur les similarités et différences de ces deux heuristiques, voir Harvey

(2007). Pour les besoins de la discussion, toutefois, ces deux heuristiques seront traitées

indifféremment puisqu’elles exploitent les mêmes informations en mémoire. Dans le but de

vérifier si les individus utilisent l’heuristique de disponibilité, Carroll (1978) a manipulé la

disponibilité d’un évènement en mémoire en demandant à des participants d’imaginer un

scénario bien défini dans lequel les Démocrates (participants du groupe A) ou les

Républicains (participant du groupe B) remportaient les élections. Par la suite, les

participants devaient prédire le résultat de la prochaine élection. Les résultats montrent que

les deux groupes étaient plus susceptibles de prévoir une victoire du parti qu’on leur avait

demandé d’imaginer. Ainsi, plus un évènement était disponible en mémoire, plus il était

jugé comme susceptible de survenir. Selon Harvey (2007), il est fortement probable que les

individus emploient cette heuristique lors de jugement de prévision puisque ce dernier

permet l’atteinte de performances qui excèdent parfois celle de modèles normatifs. Pour

appuyer ses propos, il discute d’une étude réalisée par Borges, Goldstein, Ortmann et

Gigerenzer (1999) dans laquelle les auteurs démontrent qu’un portfolio d’actions boursières

composé de titres ayant été reconnus (donc facilement accessibles en mémoire) surpasse les

indices moyens du marché. Toutefois, ces résultats n’ont pas persisté dans le temps suite à

des changements dans les conditions environnementales : c’est-à-dire lors du passage d’un

marché fort vers un marché plus faible (Boyd, 2001). Il faut également noter qu’une

condition sine qua non pour l’utilisation de cette heuristique est la disponibilité

d’information en mémoire. Conséquemment, un environnement complètement nouveau

pour un individu rendra impossible l’utilisation d’une telle stratégie, or, dans la présente

thèse, les situations dynamiques complexes d’intérêts sont caractérisées par des patrons

23

d’évolution qui ne se répètent pas dans le temps et qui sont ainsi toujours nouveaux du

point de vu d’un observateur (Kurtz & Snowden, 2010). Par conséquent, bien que l’étude

de cette source d’information et des heuristiques qui lui sont associées soit très intéressante,

elle ne constitue pas le point focal de la présente thèse.

Heuristique de représentativité. Une seconde heuristique potentiellement employée

par les individus lors de jugement de prévision est la représentativité. Selon Tversky et

Kahneman (1973) un évènement est jugé probable par la mesure où il représente les

caractéristiques essentielles (1) d’un évènement parent et (2) du procédé par lequel il est

généré. L’heuristique de représentativité a été observée, entre autres, au sein du marché

financier (par exemple, De Bondt & Thaler, 2002; Chopra et al., 1992) et permettrait

l’atteinte de performances au moins équivalentes à des stratégies « rationnelles » dans des

conditions difficilement prévisibles (Ying Luo, 2013). En effet, l’heuristique de

représentativité performe aussi bien que les décideurs « rationnels » lorsque les données du

marché sont partiellement déterminées par des processus stochastiques, c’est-à-dire lorsque

la prévisibilité environnementale (Re) est faible. Dans un contexte d’estimation de série

temporelle en laboratoire, l’utilisation de l’heuristique de représentativité se traduit par une

diminution de l’auto-régression des prévisions sur les valeurs passées du critère puisque les

prévisions des individus qui adoptent cette heuristique y intègrent des informations

concernant d’autres variables ou composantes jugées représentatives. En d’autres mots, il y

a un abandon des informations de sources intrinsèques pour favoriser les informations de

sources extrinsèques. Par contre, bien que cette stratégie semble porter fruits dans certains

contextes, elle peut aussi introduire des biais qui ont un effet néfaste sur la performance.

Considérez l’exemple suivant (de Harvey, 2007) : Si vous dites à un individu qu’un paquet

de cartes bien brassé contient 80% de cartes rouges et 20% de cartes bleues, les chances

sont que, s’il utilise l’heuristique de représentativité, il prédise une carte rouge dans 80% et

une carte bleue dans 20% de ses jugements. Ce faisant, l’individu cherche à être

représentatif du paquet duquel les cartes sont tirées. Néanmoins, en procédant ainsi, le

jugement sera juste dans 68% des cas en moyenne alors que s’il ne prédit que des cartes

rouges, son jugement sera juste dans 80% des cas. Dans un contexte de prévision de séries

temporelles, les individus intègreront aussi un certain niveau d’incertitude dans leur

prévision correspondant au niveau d’incertitude de la série jusqu’à présent. En effet, les

24

prévisions seront distribuées aléatoirement autour de la pente de la série plutôt qu’être

situées directement dessus. De plus, plus la série est incertaine, plus la distribution autour

de la pente sera large (Harvey, 1995; Harvey et al., 1997).

D’autres auteurs suggèrent une autre heuristique, celle de limites et vraisemblance

(Becker & Leopold-Wildburger, 1996; Becker et al., 2007) qui se base également sur les

informations disponibles à même la série temporelle critère et les séries associées qui co-

évoluent avec celle-ci. Pour cette raison, il semble raisonnable de catégoriser la stratégie de

limites et vraisemblance comme étant une spécification de l’heuristique de représentativité

puisqu’elle tente d’être représentative des sources extrinsèques d’information. Les indices

utilisés par cette heuristique sont toutefois extraits des séries temporelles puisqu’ils ne sont

pas explicitement disponibles a priori. Becker et ses collègues réfèrent à ces propriétés

comme étant des caractéristiques « gestaltiques » qui sont extraites visuellement des séries

temporelles. Ces propriétés sont les limites inférieures et supérieures des séries temporelles

ainsi que la probabilité que la prochaine période constitue un changement de direction.

Plusieurs versions de cette heuristique ont été développées. Dépendamment de la version,

les caractéristiques gestaltiques sont extraites de la série temporelle à prédire (donc une

information de source intrinsèque), et/ou peuvent également l’être des autres séries

temporelles qui co-évoluent avec celle-ci (donc une information de source extrinsèque).

Lorsque des caractéristiques sont extraites de plusieurs séries temporelles, elles sont ensuite

intégrées au sein d’une représentation linéaire afin d’émettre la prévision. Becker et ses

collègues (2007) soulignent que la capacité des individus à intégrer les indices générés au

sein d’une représentation linéaire est fort probablement limitée. Cet énoncé demeure

toutefois une hypothèse puisque les modèles de l’heuristique qui ont été testés se limitaient

à l’intégration de quatre indices. Becker et ses collègues (2000; 2004; 2007) rapportent une

série d’études dans lesquelles les participants devaient prédire l’évolution de séries

temporelles. Dépendamment de l’étude, les participants devaient prédire une série

temporelle seule, ou en se basant sur plusieurs autres séries temporelles plus ou moins

corrélées avec la série temporelle à prédire. Les auteurs rapportent des niveaux

d’adéquation entre les prévisions de l’heuristique et celles des participants, ce qui suggère

que cette heuristique serait représentative de la stratégie employée par les individus pour

prédire l’évolution de séries temporelles. De plus, les auteurs soulignent que cette

25

heuristique a également la capacité de mieux performer que l’hypothèse rationnelle

attendue dans ce contexte.

Heuristique d’ancrage et ajustement. Alors que l’heuristique de représentativité

expliquerait en partie pourquoi les individus intègrent une part d’information de source

extrinsèque dans leur jugement de séries temporelles, l’heuristique d’ancrage et ajustement

expliquerait comment les individus intègrent de l’information de source intrinsèque dans

leur jugement (Harvey, 2007). L’heuristique d’ancrage et ajustement consiste à fonder son

jugement sur une valeur initiale et ensuite de procéder à son ajustement pour produire un

jugement plus précis (Kahneman et al., 1982). Cette heuristique est probablement la plus

étudiée en lien avec la prévision de séries temporelles puisque plusieurs études démontrent

que les individus se comportent fréquemment comme s’ils utilisaient cette heuristique dans

ce contexte (Andreassen, 1990; Andreassen & Kraus, 1990; Harvey, 1988; Lawrence &

O’Connor, 1992). De plus, le propre de cette heuristique est d’intégrer des informations

ordonnées séquentiellement dans le temps (Anderson, 1981, 1991), ce qui est évidemment

pertinent dans un contexte de prévision de séries temporelles. Plusieurs variantes de cette

heuristique ont été suggérées, notamment concernant la nature de l’ancrage. Par exemple,

Bolger et Harvey (1993) proposent un modèle de l’heuristique qui utilise la dernière valeur

de la série temporelle comme ancrage alors que Lawrence et O’Connor (1992; 1995) et

Andreassen et Kraus (1990) proposent un modèle dans lequel le point d’ancrage est la

moyenne estimée des valeurs passées de la série temporelle. Un biais souvent associé à

l’utilisation de cette heuristique concerne la sous-estimation des pentes positives ou

négatives des séries, conséquence directe d’un sous-ajustement à partir du point d’ancrage

(Bolger & Harvey, 1993; Eggleton, 1982; Harvey & Bolger, 1996; Lawrence &

Makridakis, 1989; Sanders, 1992). Plusieurs raisons sont mises de l’avant pour expliquer le

sous-ajustement des prévisions. Par exemple, certains auteurs suggèrent que le choix d’un

point d’ancrage activerait les valeurs proches de ce dernier, ce qui augmenterait la

probabilité de les intégrer au jugement (voir Chapman & Johnson, 1999; Jacowitz &

Kahneman, 1995; Mussweiler & Strack, 1999). Une autre explication plausible de ce biais

présume que les séries temporelles « naturelles » seraient caractérisées par des propriétés

qui, globalement, favoriseraient cette stratégie. Supportant cette interprétation, Lawrence et

O’Connor (1995) ont utilisé 111 séries temporelles tirées de véritables séries présentes dans

26

la nature et ont observé qu’en moyenne, les participants ne présentaient pas de biais de

sous-ajustement lors de leur prévision, probablement parce que les séries temporelles

évoluaient de façon à favoriser cette stratégie.

Dans un contexte de prévision de séries temporelles, le comportement humain

semble particulièrement bien représenté par les modèles d’heuristiques comparativement au

modèle de jugement linéaire. En effet, la plupart des études qui s’intéressent aux stratégies

utilisées pour la prévision de séries temporelles indiquent que les individus se comportent

comme s’ils utilisaient l’heuristique d’ancrage et ajustement (Andreassen, 1990;

Andreassen & Kraus, 1990; Harvey, 1988; Lawrence & O’Connor, 1992) ou de limites et

vraisemblance (Becker & Leopold-Wildburger, 1996; Becker et al., 2007; 2008; 2009).

L’utilisation de ces stratégies simplificatrices seraient à l’origine de biais systématiques,

menant à des performances sous-optimales (Bolger & Harvey, 1993; Harvey & Bolger,

1996; Sanders, 1992) et serait par conséquent irrationnelle.

PROBLÉMATIQUE

Certains auteurs remettent toutefois le caractère irrationnel des heuristiques en

question (Dieckmann & Rieskamp, 2007; Goldstein & Gigerenzer, 2009; Rieskamp & Otto,

2006; Rieskamp & Reimer, 2007; Todd & Gigerenzer, 2000; Todd & Gigerenzer, 2007).

Est-ce que l’utilisation d’heuristiques est vraiment irrationnelle, ou est-ce que leur

utilisation mène à des performances équivalentes ou même supérieures au jugement

linéaire? Les heuristiques ont démontré leur utilité dans une grande variété de contextes,

performant souvent au moins aussi bien que la stratégie rationnelle (Dieckmann &

Rieskamp, 2007; Rieskamp & Otto, 2006). Par exemple, l’utilisation de l’heuristique

d’ancrage et ajustement est associée à un biais de sous-ajustement des pentes des séries

temporelles (Harvey & Bolger, 1996), mais il est également suggéré que ce biais soit en fait

adapté aux séries temporelles « naturelles » (Lawrence & O’Connor, 1995). Ces stratégies

étant donc potentiellement plus adaptées dans certains contextes, plusieurs auteurs

questionnent la définition classique de la rationalité et proposent une vision « écologique »

de la rationalité (Dieckmann & Rieskamp, 2007; Goldstein & Gigerenzer, 2009; Rieskamp

& Otto, 2006; Rieskamp & Reimer, 2007; Todd & Gigerenzer, 2000). Comme le résume

Sturm (2012), la théorie de la probabilité et le modèle linéaire ne devraient pas être

27

considérés comme une norme rationnelle applicable à tous les contextes. Au contraire, les

normes de la rationalité ne devraient pas être valides indépendamment du contexte dans

lequel elles sont appliquées. Toujours selon Sturm (2012), l’établissement du lien entre

normes et contexte est une entreprise empirique.

De plus, malgré son statut de stratégie rationnelle, le ML est tout de même

caractérisé par une limite supérieure d’efficacité (Hogarth & Karelaia, 2008; Tucker,

1964). En effet, la prévisibilité de l’environnement (Re) spécifie la proportion de variance

de l’environnement expliquée par un modèle de jugement linéaire et correspond ainsi à la

limite théorique supérieure de performance des individus qui adoptent une stratégie de

jugement linéaire. Alors, même si la plupart des environnements sont raisonnablement

prédit par le ML, il sera possiblement défaillant dans certains contextes, notamment lorsque

la qualité des sources d’information est dégradée.

Face à ces observations, plusieurs auteurs suggèrent que la force des heuristiques

repose sur l’aspect varié, modulaire et simple de ces stratégies, qui peuvent, à l’image d’un

coffre à outil, être utilisées dans différents contextes de manière adaptée, individuellement

ou en combinaison (Gigerenzer & Gaissmaier, 2011; Gigerenzer & Selten, 2001;

Gigerenzer et al., 1999). Selon cette perspective du coffre à outil, une heuristique n’est pas

bonne ou mauvaise en soi, mais sa performance est plutôt déterminée par les

caractéristiques de l’environnement telles que la qualité des sources d’information

disponibles (par exemple, Marewski & Schooler, 2011). Cela représente un ajout par

rapport à la rationalité contrainte de Simon (1956) puisque la stratégie cognitive employée

n’est plus uniquement fonction des contraintes cognitives de l’individu, mais aussi des

caractéristiques environnementales. À titre d’exemples, les heuristiques définies

précédemment ont fait l’objet de résultats en apparence contradictoires : l’heuristique de

disponibilité a permis l’atteinte de performance financière supérieure à la moyenne (Borges

et al., 1999), mais seulement au sein d’un marché fort (Boyd, 2001); l’heuristique de

représentativité permet également l’atteinte de performances financières au moins

équivalentes à un modèle rationnel, mais seulement lorsque l’environnement à prédire

comporte une part élevée de hasard (Ying Luo, 2013); l’heuristique d’ancrage et ajustement

mène à des prévisions biaisées pour des séries temporelles artificielles (par exemple, Bolger

28

& Harvey, 1993), mais à des prévisions adaptées pour la prévision d’un ensemble de 111

séries temporelles naturelles représentatives de l’écologie réelle (Lawrence & O’Connor,

1995). Ces observations demeurent parcellaires puisqu’aucun cadre intégratif n’est suggéré.

Comme le mentionnent Todd et Gigerenzer (2007), les chercheurs ont commencé à mettre

en place un vocabulaire pour décrire les structures de l’environnement, par exemple, en

termes de validité des indices et de leur distribution, mais cet effort est toutefois encore

incomplet et incohérent. Basé sur la taxinomie de Harvey (2007), la présente thèse propose

donc une série de facteurs associés à la qualité des sources d’information qui sont

susceptibles de faire varier la performance des heuristiques et ainsi créer des situations dans

lesquelles deux stratégies performeront différemment. Ces facteurs sont décrits ci-dessous

et regroupés selon qu’ils soient associés à la qualité des indices extrinsèques ou

intrinsèques.

Source extrinsèque. Dans le cadre de la thèse, deux facteurs sont associés à la source

extrinsèque d’information : le nombre d’indices extrinsèques et la force d’association

extrinsèque. Le nombre d’indices extrinsèques est un facteur dont l’impact sur l’adoption

des stratégies de jugement est bien documenté (Halford et al., 2005; Payne et al., 1993).

Plus précisément, les individus semblent avoir beaucoup de difficulté à appliquer une règle

de jugement linéaire au-delà de trois variables à considérer dans la production d’un

jugement (Karelaia & Hogarth, 2008). La force d’association extrinsèque est un indicateur

de validité et de fiabilité des indices extrinsèques pour la prévision du critère (Seifert &

Hadida, 2013). Dans le cas où la force d’association extrinsèque est faible, une prévision

fondée uniquement sur le meilleur indice sera moins précise que si la force d’association

était élevée. Pour améliorer la précision de la prévision, il faudra intégrer de nouveaux

indices et ainsi complexifier la stratégie cognitive. Bien que des études antérieures

démontrent que la manipulation de la validité des indices a un impact significatif sur la

performance à la tâche de prévision humaine de séries temporelles (par exemple, Lim &

O’Connor, 1996), son impact spécifique sur la performance des modèles formalisés dans la

présente thèse n’a pas été étudié.

Source intrinsèque. Un seul facteur, dans le contexte de la présente thèse, est associé

à la qualité des indices de source intrinsèque : l’autocorrélation du critère. Une

29

autocorrélation est la corrélation croisée de la série temporelle avec elle-même. C’est un

critère est un facteur critique dans l’adoption de stratégies alternatives au modèle de

jugement linéaire (Lawrence et al., 2006). En effet, plusieurs études observent que les

individus qui doivent prédire l’évolution d’une série temporelle auto corrélée ont tendance

à adopter une heuristique d’ancrage et ajustement (Andreassen & Kraus, 1990; Lawrence &

O’Connor, 1992; 1995; Reimers & Harvey, 2011). De plus, Bolger et Harvey (1993)

observent que la version de l’heuristique d’ancrage et ajustement employée est différente en

fonction de la force de l’autocorrélation du critère, ce qui suggère que ce facteur est

déterminant dans le choix des stratégies employées.

La rationalité écologique (Dieckmann & Rieskamp, 2007; Rieskamp & Otto, 2006;

Rieskamp & Reimer, 2007) est l’étude des caractéristiques environnementales, des

caractéristiques des stratégies cognitives, et de l’adéquation entre les deux (Todd &

Gigerenzer, 2007; Goldstein & Gigerenzer, 2009). L’objectif est de comprendre comment

la performance des heuristiques et des règles de jugement linéaire sont affectées par les

caractéristiques environnementales et comment cela guide leur sélection lors d’une tâche de

jugement. Dans le cadre de la présente thèse, ces caractéristiques environnementales

réfèrent aux facteurs associés à la qualité des sources d’information. Le concept de

rationalité écologique est plus englobant que celui du coffre à outils cognitif puisqu’il inclut

également les modèles de jugement plus complexes comme le ML, par exemple. Le

concept de la rationalité écologique se résume en trois aspects :

(1) Il existe une combinaison de stratégies quelconque pour laquelle la prévisibilité

de l’environnement est supérieure à celle du ML normalement considéré comme

la norme rationnelle;

(2) Les individus changent leur stratégie en fonction des caractéristiques de

l’environnement; et

(3) Le changement est adapté, c’est-à-dire qu’il permet l’atteinte de performance

optimale dans le contexte.

L’application humaine de la rationalité écologique demeure toutefois spéculative et

manque d’appuis empiriques, particulièrement dans un contexte de prévision de séries

temporelles (Bröder, 2003). Premièrement, plusieurs études computationnelles démontrent

30

que l’utilisation d’heuristiques peut mener à des performances supérieures à une norme

rationnelle (par exemple, Czerlinski et al., 1999; Gigerenzer & Goldstein, 1996, 1999;

Woike et al., 2012). Par contre, elles concernent des environnements statiques et ne

fournissent aucune preuve de la plausibilité d’une rationalité écologique pour la prévision

des séries temporelles. De plus, elles spécifient très rarement quelles sont les conditions

sous lesquelles les heuristiques performent mieux qu’une règle de jugement linéaire (Todd

& Gigerenzer, 2007). Deuxièmement, bien qu’il ait été démontré dans différentes études

que les individus se comportent comme s’ils utilisaient une stratégie d’ancrage et

ajustement (Andreassen, 1990; Andreassen & Kraus, 1990; Harvey, 1988; Lawrence &

O’Connor, 1992), de limites et vraisemblance (Becker & Leopold-Wildburger, 1996;

Becker et al., 2007) et de jugement linéaire (Bisantz et al., 2000), aucune de ces études ne

montre un changement de stratégie du même participant en fonction des caractéristiques

des séries temporelles à prédire. En effet, pour évaluer le changement de stratégies, celles-

ci doivent être comparées au sein d’un même devis expérimental intra-participants (Bröder,

2003; Payne et al., 1988). Une telle étude, manipulant des facteurs associés à ces stratégies

telle que la qualité des sources d’information permettrait d’évaluer si les individus changent

de stratégie. Troisièmement, la démonstration computationnelle de la plausibilité de la

rationalité écologique ne signifie pas que les humains y adhèrent (Bröder, 2003). Il est donc

critique de faire la démonstration empirique que les humains changent de stratégie de

manière adaptée, particulièrement dans la prévision de séries temporelles.

Objectif de la thèse

L’objectif de la thèse est de combler les lacunes actuelles dans la démonstration du

concept de rationalité écologique en contexte de prévision de séries temporelles.

Précisément, elle cherche à démontrer dans un contexte de prévision de séries temporelles

complexes (1) la plausibilité de la rationalité écologique (et sous quelles conditions cela est

possible), (2) que les individus changent de stratégies et (3) que ce changement permet

l’atteinte de performances supérieures au modèle de jugement linéaire. La position adoptée

et testée au sein de la présente thèse est que la rationalité écologique est plausible, que les

individus changent de stratégies en fonction des caractéristiques de la tâche de prévision et

31

que ces changements permettent l’atteinte de performances supérieures au modèle de

jugement linéaire.

Méthode générale

Typiquement, deux méthodes sont employées pour étudier l’utilisation des

stratégies cognitives dans une tâche : (1) le suivi des processus et (2) la comparaison des

prévisions de modèles computationnels et de participants humains. Le suivi des processus

consiste à observer toutes les actions du participant qui précèdent son jugement dans le but

d’établir quelles sont les informations consultées. Par exemple, l’interface d’une tâche

appliquant cette méthodologie peut cacher les informations pertinentes et les rendre

accessibles seulement sur demande (par exemple, Billings & Marcus, 1983; Matsuka &

Corter, 2008; Sayeki, 1969; Sundström, 1987). Ainsi, il est possible de « suivre » la

démarche du participant en termes d’information consultées et de l’ordre dans lequel cette

information est consultée. Cette technique présente par contre certaines lacunes.

Premièrement, la concordance entre la consultation de l’information et l’intégration de

l’information n’est pas garantie (Abelson & Levi, 1985; Billings & Marcus, 1983; Maule,

1994). Deuxièmement, cette technique ne permet pas toujours d’opérationnaliser avec

précision les stratégies cognitives d’intérêt. En effet, elle ne permettra pas de discriminer

deux stratégies qui utilisent les mêmes informations, mais qui les pondèrent de façons

différentes (Bröder, 2000; Bröder, 2003). Pour ces raisons, la méthode principale employée

dans le cadre de la thèse sera la comparaison de la performance des stratégies par

simulation de modèles computationnels et par l’étude du comportement humain dans la

prévision de séries temporelles en lien avec les heuristiques et le jugement linéaire.

STRUCTURE ET HYPOTHÈSES

La technique employée consiste à formaliser les stratégies cognitives d’intérêt en

modèles computationnels et de les simuler sous différentes conditions dans une tâche de

prévision de séries temporelles. Cette technique permet l’identification des conditions qui

sont appropriées ou inappropriées pour les heuristiques modélisées (Todd & Gigerenzer,

2007). Ces modèles peuvent également être simulés dans les mêmes environnements où les

participants humains effectuent leur tâche de prévision (Bolger & Harvey, 1993; Bergert &

32

Nosofsky, 2007; Shanteau & Thomas, 2000). Il est donc possible de comparer la

performance des participants par rapport à celle d’un modèle rationnel et ainsi quantifier

l’écart à la rationalité. Cette technique permet aussi de comparer directement les réponses

des participants à celles des modèles d’heuristiques et ainsi déterminer quelles sont les

stratégies représentatives de leur comportement. Par exemple, Bergert et Nosofsky (2007)

ont démontré, dans un contexte différent mais similaire à la prévision de séries temporelles,

que le comportement humain est mieux expliqué par l’utilisation d’heuristiques que d’un

processus complexe d’intégration et de pondération linéaire de l’information. De plus,

selon Goldstein et Gigerenzer (2009), l’utilisation de cette technique pourrait également

permettre de démontrer que l’utilisation de ces heuristiques peut être adaptée et

écologiquement rationnelle.

Dans le contexte de la présente thèse, la qualité de deux sources d’information

identifiées par Harvey (2007) sont manipulées au sein du paradigme de prévision de séries

temporelles pour faire varier la performance des stratégies (heuristiques et jugement

linéaire) et des participants. Les prévisions des modèles et des participants sont comparées

entre elles. La qualité de ces sources serait associée à la performance des stratégies puisque

ces dernières les utilisent pour estimer leur prévision. La manipulation de la qualité des

sources d’information permettra d’étudier les situations où certaines heuristiques seraient

plus performantes que le jugement linéaire et les conditions sous lesquelles les individus

adoptent de telles heuristiques (Todd & Gigerenzer, 2007). Précisément, la qualité des

sources d’information intrinsèque et extrinsèque seront manipulées. La source mémoire ne

sera pas variée dans le contexte de la présente thèse malgré l’intérêt de celle-ci. Ce facteur

est exclu puisque les situations complexes d’intérêts dans la présente thèse sont les

situations complexes nouvelles pour la personne en charge de sa prévision et qui sont entre

autres caractérisées par des patrons complexes d’évolution qui ne se répètent pas ou peu

dans le temps (Kurtz & Snowden, 2010). Par conséquent, la source mémoire n’est d’aucune

utilité dans ce contexte. Concrètement, la méthode employée sera opérée en trois chapitres :

Le Chapitre II étudie comment différentes stratégies performent sous différentes

conditions environnementales au sein du paradigme de la prévision de séries temporelles.

Précisément, il vise à comprendre l’effet de la qualité des différentes sources d’information

33

sur la performance des modèles de façon générale et comparativement au modèle de

jugement linéaire. Cette étude est réalisée par la modélisation computationnelle et la

simulation des stratégies de jugement appartenant aux deux classes (c’est-à-dire,

heuristiques et jugement linéaire) au sein de conditions variées de qualité des sources

intrinsèques et extrinsèques d’information. La tâche simulée consiste à prédire l’évolution

de plusieurs séries temporelles variant en termes de qualité des sources d’information sur

un horizon de quarante périodes. Dans une perspective de rationalité écologique, cela

permettra d’évaluer la plausibilité de l’approche dans ce contexte. Précisément, si la

rationalité écologique est plausible, les résultats devraient montrer que l’utilisation

d’heuristiques permet de supplanter l’application pure d’une règle de jugement linéaire.

Conformément à la position défendue par l’auteur, l’hypothèse associée à cette étude est

que :

H1 : La performance des heuristiques à la tâche de prévision temporelle sera

supérieure à celle du modèle de jugement linéaire.

Cette étude permettra également d’identifier les conditions sous lesquelles la

rationalité écologique est possible. En d’autres mots, les simulations réalisées dans ce

chapitre permettront de cartographier le paysage d’efficacité des stratégies de jugement en

lien avec la qualité des sources d’information. Ces analyses sont associées à un objectif

exploratoire de la présente thèse, c’est-à-dire :

O1 : Cartographier le lien entre les caractéristiques de la tâche de prévision et la

performance des différentes stratégies modélisées.

Le Chapitre III étudie ensuite dans quelle mesure les individus changent leurs

stratégies de manière adaptée en fonction de la qualité des sources d’information. Cette

évaluation sera conduite au sein du paradigme de la prévision de séries temporelles. Tout

comme lors des simulations des modèles computationnels, la tâche des participants est de

prédire l’évolution de plusieurs séries temporelles caractérisées par des niveaux variés de

qualité des sources d’information sur un horizon de quarante périodes. La tâche des

participants est exactement la même que celle réalisée par les modèles de stratégies

(heuristiques et jugement linéaire) dans le Chapitre II. Cette étude se fera en trois temps.

34

Premièrement, la précision des prévisions des individus est comparée à celle de la norme

rationnelle, c’est-à-dire le jugement linéaire. Dans une perspective de rationalité

écologique, cela permettra de vérifier si les stratégies des individus sont plus adaptées que

l’application pure du jugement linéaire. Conformément à la position adoptée par l’auteur

l’hypothèse suivante est formulée :

H2 : La performance des participants à la tâche de prévision sera supérieure à

celle atteinte par le modèle de jugement linéaire.

Deuxièmement, l’adéquation entre les prévisions des participants et celles des

modèles de jugements (c’est-à-dire, heuristiques et jugement linéaire) est calculé. Cela est

réalisé pour identifier si les participants se comportent de manière équivalente aux modèles.

Dans une perspective de rationalité écologique, cela permettra de vérifier si les individus

changent leurs stratégies en fonction de la qualité des sources d’information. L’hypothèse

associée à cet objectif est la suivante :

H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle

donnée variera significativement en fonction des caractéristiques de la tâche de

prévision.

Finalement, dans le cas où les participants changeraient de stratégie, se comportent-

ils comme les stratégies les plus performantes? Dans une perspective de rationalité

écologique, cela permettra d’évaluer si le changement de stratégie est adapté.

H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif

du comportement d’un participant correspond au modèle le plus performant) sera

supérieure au hasard.

Finalement, le Chapitre IV intègrera l’ensemble des observations faites au sein du

paradigme de la prévision de séries temporelle dans les Chapitre I et II. La pertinence de

l’application d’une rationalité écologique dans un contexte de prévision de séries

temporelles sera discutée. Particulièrement, les conditions sous lesquelles la rationalité

écologique est pertinente seront décortiquées de manière critique dans une perspective de

généralisation des résultats au-delà du paradigme employé dans la présente thèse. Des

35

implications pratiques concernant les résultats de la thèse seront aussi élicitées, notamment

en lien avec le développement de systèmes d’aide à la décision basés sur la technique du

« bootstraping ». Finalement, les contributions méthodologiques de la présente thèse et

inversement, les limites associées à la méthodologie, sont présentées en lien avec les

travaux futurs.

37

CHAPITRE II

PREVISION DE SÉRIES TEMPORELLES : CARTOGRAPHIE DE

L’EFFICACITE DES MODELES DE JUGEMENT

38

Deux classes de modèles ont guidé la recherche récente sur le jugement humain.

L’une de ces classes, considérée comme la norme rationnelle, consiste à intégrer l’ensemble

des informations disponibles au sein d’une représentation unique dans laquelle les

informations sont combinées et pondérées de manière linéaire (Anderson, 1981; Brehmer,

1994; Hammond, 1996; Muth, 1961). L’autre classe, les heuristiques, présume plutôt que

les individus fondent leur jugement en fonction des limites fondamentales du système

cognitif, par exemple la limite en mémoire active, et serait donc mieux représentés par des

modèles de jugements simplifiés et rapides distant de la norme rationnelle (Gigerenzer et

al., 1999; Goldstein & Gigerenzer, 2009; Kahneman et al., 1982; Todd & Gigerenzer,

2000). Ces heuristiques sont-elles vraiment irrationnelles? Mènent-elles réellement à des

performances inférieures au jugement linéaire? Peut-être pas. Il a été démontré que les

heuristiques peuvent surpasser la performance attendue par la norme rationnelle dans

plusieurs contextes et seraient ainsi parfois plus adaptées à leur environnement (Dieckmann

& Rieskamp, 2007; Goldstein & Gigerenzer, 2009; Rieskamp & Otto, 2006; Rieskamp &

Reimer, 2007; Todd & Gigerenzer, 2000). Toutefois, le fait que certaines heuristiques

puissent être meilleures que la norme rationnelle sous certaines conditions ne signifie pas

que les individus évoluant sous ces mêmes conditions savent reconnaître et adopter la

stratégie la plus adaptée (Bröder, 2003).

Un domaine où l’utilisation d’heuristiques est particulièrement convaincante est

celui de la prévision de séries temporelles. En effet, plusieurs études indiquent que les

heuristiques d’ancrage et ajustement (Andreassen, 1990; Andreassen & Kraus, 1990;

Harvey, 1988; Lawrence & O’Connor, 1992) ou encore de limites et vraisemblance (Becker

& Leopold-Wildburger, 1996; Becker et al., 2005; Becker et al., 2007) sont représentatives

du comportement des individus lorsqu’ils doivent prédire l’évolution de séries temporelles.

Ces études considèrent généralement l’utilisation de ces heuristiques comme une limite

menant à des erreurs systématiques. Toutefois, ces études se sont rarement intéressées aux

facteurs associés à la prévision de séries temporelles qui affectent la performance des

heuristiques. En effet, bien que certaines études affirment que certaines heuristiques

performent mieux que le modèle de jugement linéaire (Leitner, & Leopold-Wildburger,

2007), plusieurs heuristiques demeurent non-testées et les conditions sous lesquelles ce

phénomène est observé ne sont pas spécifiées (Todd & Gigerenzer, 2007). Bref, la

39

cartographie des environnements favorables à l’emploi d’heuristiques demeure largement

incomplète.

Le domaine de rationalité écologique s’intéresse à cette cartographie. Il réfère à

l’étude du lien entre l’efficacité des stratégies de jugement et les différents contextes dans

lesquels le jugement a lieu. Selon les tenants de la rationalité écologique, le modèle de

jugement linéaire ne devrait pas être considéré comme une norme rationnelle applicable à

tous les contextes. À l’inverse, la norme rationnelle devrait être établie empiriquement

selon le contexte dans lequel le jugement prend place (Sturm, 2012). L’utilisation adaptée

de stratégies de prévision incluant le jugement linéaire et certaines heuristiques pourrait

donc, selon certains auteurs, constituer une méta-stratégie plus efficace que celle du

jugement linéaire seul (Rieskamp & Otto, 2006; Todd & Gigerenzer, 2007).

Tel que stipulé précédemment, l’étude de la rationalité écologique consiste à établir

le lien entre les conditions environnementales et la performance de différentes stratégies.

Cette entreprise doit être empirique et passe entre autres par la comparaison de modèles

formels de stratégies évoluant sous des conditions variées (Sturm, 2012). L’identification

des conditions favorables et défavorables aux différentes stratégies (par exemple, les

heuristiques et le jugement linéaire) permet d’évaluer les stratégies adaptées dans un

contexte donné et ainsi d’établir la nouvelle « norme » rationnelle. Tel que mentionné par

certains auteurs, il n’existe pas encore de cadre interprétatif clair qui permettrait d’organiser

la recherche dans ce domaine, essentiellement étant donné le caractère nouveau de celle-ci

(Todd & Gigerenzer, 2007). Ces mêmes auteurs, et leur équipe de recherche, proposent

ainsi certains éléments associés à la structure de l’environnement qui pourraient constituer

une base de cadre interprétatif (Todd et al., 2011). Ces éléments concernent essentiellement

la qualité des informations disponibles pour effectuer un jugement. Précisément, ils

concernent la qualité associée à un indice, la redondance entre les indices, la taille

d’échantillonnage et la distribution de la qualité entre les indices.

Dans une perspective différente, mais pertinente à cette approche, Harvey (2007)

discute du lien potentiel entre trois sources d’information disponibles lors de la prévision

de séries temporelles et les heuristiques pertinentes dans ce contexte. Alors que Todd et ses

collègues discutent davantage de la nature des indices, Harvey (2007) discute davantage de

40

la provenance de ces derniers. Les individus en charge de prédire l’évolution de séries

temporelles se baseraient essentiellement, individuellement ou en combinaison, sur les

indices en mémoire, les indices directement associés à la série temporelle critère (nommés

indices de source intrinsèque) et sur les indices coexistant à la série critère, mais distinct de

celle-ci (nommés indices de source extrinsèque). Puisque les différentes stratégies

potentielles misent sur des sources d’information différentes pour prédire l’évolution de la

série temporelle critère, il est logique de penser qu’elles seraient influencées différemment

par la variation de la qualité des indices provenant des sources d’information. Bref, le

présent chapitre s’intéresse à la qualité des indices, proposée par Todd et ses collègues

(2011), et les sources d’information, proposée par Harvey (2007). Précisément, ce chapitre

étudie la performance des stratégies en lien avec la qualité de deux sources d’information:

c’est-à-dire les sources intrinsèque et extrinsèque.

Objectif

Ce chapitre évalue la performance de modèles de stratégies de prévision, ancrage et

ajustement, limites et vraisemblance et jugement linéaire, sous des conditions variées de

qualité d’information de sources intrinsèque et extrinsèque. L’objectif est de juger si

l’application de stratégies supplantant le jugement linéaire est possible et de déterminer

quelles conditions favorisent ce phénomène. Deux heuristiques pertinentes à la prévision de

séries temporelles, ancrage et ajustement ainsi que limites et vraisemblance, sont

formalisées en modèles computationnels en plus du modèle de jugement linéaire. Ils seront

simulés sous des conditions variables de qualité des indices provenant des sources

d’information intrinsèques et extrinsèques. La mesure employée pour estimer la précision

des modèles sera la proportion de variance expliquée (PVE; Hays, 1963; Stevens, 2013).

Cette mesure tient compte à la fois de la précision des stratégies en termes d’erreur et de la

direction de la prévision de la stratégie par rapport à la série temporelle à prédire.

L’hypothèse testée dans ce chapitre est la suivante :

H1 : La performance des heuristiques à la tâche de prévision temporelle sera

supérieure à celle du modèle de jugement linéaire.

Ce chapitre concerne également l’atteinte d’un objectif exploratoire, c’est-à-dire :

41



Dans un premier temps, la formalisation des stratégies est présentée. Cette section

détaille précisément le ou les modèles computationnels qui représentent les stratégies de

prévision (ancrage et ajustement, limites et vraisemblance, jugement linéaire). Ces modèles

sont tirés de la littérature sur le jugement humain. Dans un deuxième temps, les résultats de

la simulation de ces modèles sont documentés. La première simulation s’intéresse d’abord à

l’influence de la source extrinsèque d’information alors que la seconde évalue l’impact

combiné des sources intrinsèque et extrinsèque d’information sur la performance des

modèles.

Formalisation des stratégies

Bien qu’il existe plusieurs formalisations possibles pour les stratégies employées

lors de prévision de séries temporelles, le sous-ensemble suivant a été retenu parce que

leurs paramètres sont bien documentés dans la littérature et leur plausibilité cognitive est

élevée. En effet, tous ces modèles (à l’exception du modèle L&V3 de limites et

vraisemblance) ont été rapportés comme ayant un certain niveau de représentativité du

comportement humain dans un contexte de prévision de séries temporelles.

ANCRAGE ET AJUSTEMENT

L’heuristique d’ancrage et ajustement a grandement été étudiée dans un contexte de

prévision de séries temporelles et plusieurs versions différentes existent (par exemple,

Goodwin & Wright, 1994; Harvey, 2007; Lawrence et al., 2006; Lawrence & O’Connor,

1995; Reimers & Harvey, 2011). Dans son essence, cette stratégie consiste à partir d’une

valeur initiale (c’est-à-dire, l’ancrage) et de l’ajuster dans le but d’émettre une prévision

avec une caractéristique importante de la série (c’est-à-dire, l’ajustement). Il y a très peu de

doutes que les individus se comportent comme s’ils utilisaient cette heuristique,

particulièrement dans les cas où les séries temporelles sont fortement auto corrélées (Bolger

& Harvey, 1993). Trois modèles de l’heuristique sont développés : ANC1, ANC2 et ANC3.

42

ANC1. Le premier modèle de l’heuristique d’ancrage et ajustement (Eq. 1) est

récupéré des travaux de Lawrence et O’Connor (1995). Dans cette version de l’heuristique,

l’ancrage est constitué de la moyenne à long terme de la série temporelle alors que

l’ajustement prend la forme d’une proportion ( de la différence entre la moyenne à long

terme de la série et la dernière observation :

(1)

où

La prévision pour la période t+1,

La moyenne de la série temporelle,

L’observation au temps t.

La proportion ( est un paramètre modulable par participant. Par contre, au sein du

modèle, par souci de parcimonie, ce paramètre est fixe pour l’ensemble des prévisions

associées à une série temporelle (c’est-à-dire qu’il ne peut pas être ajusté dynamiquement)

et est fixé de manière à réduire l’erreur quadratique moyenne au minimum pour l’ensemble

de la série prédite. Cela constitue une limite de la présente formalisation, puisqu’il est

connu que les individus qui se comportent comme s’ils utilisaient cette heuristique ont

tendance à mal estimer la proportion ( de la différence entre la moyenne à long terme de

la série et la dernière observation (c’est-à-dire à estimer une valeur de ce paramètre qui

mène à des prévisions sous-optimales; Bolger & Harvey, 1993). La version actuelle

constitue donc la limite supérieure de performance atteinte par cette stratégie. Lawrence et

O’Connor (1995) ont démontré que cette heuristique performe particulièrement bien dans le

cas où les séries temporelles sont relativement stationnaires (c’est-à-dire avec pente nulle)

et auto corrélées. La Figure 7 illustre un exemple du comportement du modèle ANC1 par

rapport à une série temporelle critère de référence (un critère de référence, nommé Variable

1 dans les figures subséquentes, est employé pour illustrer les prévisions distinctes des

modèles). Notez que l’abscisse ne comporte que 32 valeurs puisqu’elle ne représente que

les périodes pour lesquelles les prévisions sont considérées dans la thèse. Les premières

43

périodes de chaque série temporelle étaient en effet retirées puisque tous les modèles ne

permettaient pas de faire des prévisions pour celles-ci.

Figure 7. Exemple du comportement du modèle ANC1 lors de la prévision d’une série temporelle critère de

référence.

ANC2. Le second modèle d’ancrage et ajustement (Eq. 2) – récupéré de Bolger et

Harvey (1993) – serait davantage adapté à la prévision de séries temporelles non-

stationnaires. Dans ce cas, l’ancrage est constitué de la dernière observation alors que

l’ajustement est composé d’une proportion ( de la différence entre la plus récente

observation et la précédente.

(2)

où

La prévision pour la période t+1,

Observation précédente au temps t,

L’observation au temps t.

Encore une fois par souci de parcimonie, le paramètre ( est fixe et minimise

l’erreur pour l’ensemble de la série temporelle. Basé sur des observations empiriques, ce

modèle serait davantage adapté à la prévision de séries temporelles avec pente (positive ou

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

ANC1-V1

44

négative), par contre, il a été observé que les participants ont tendance à se comporter

davantage de manière similaire à ANC1 en présence de séries temporelles fortement auto

corrélées (Bolger & Harvey, 1993). Une série fortement auto corrélée signifie que les

observations pour la période actuelle sont très similaires aux périodes précédentes. La

Figure 8 illustre un exemple du comportement du modèle ANC2 par rapport à la série

temporelle critère de référence.


référence. On remarque entre autres que pour la période t = 17, la prévision du modèle est parfaitement

ajustée au critère alors qu’elle ne l’était pas lors de l’application du modèle ANC1.

ANC3. La dernière formalisation computationnelle de l’heuristique d’ancrage et

ajustement (Eq. 3) nécessite une rétroaction sur l’erreur de prévision, ce qui est le cas dans

la présente thèse. Ce modèle est proposé par Andreassen (1990) ainsi que Andreassen et

Kraus (1990) qui suggèrent que la dernière prévision représente l’ancrage et que

l’ajustement est constitué d’une proportion ( de l’erreur de la dernière prévision.

(3)

où

erreur de la prévision précédente.

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

ANC2-V1

45

Le paramètre ( est tenu fixe et sa valeur est celle qui minimise l’erreur de

prévision pour l’ensemble de la série à prédire. Selon Andreassen (1990) et Andreassen et

Kraus (1990), ce modèle serait adapté aux séries temporelles relativement stationnaires,

mais les auteurs ne fournissent toutefois pas de preuves empiriques en lien avec cet énoncé.

La Figure 9 illustre un exemple du comportement du modèle ANC3 par rapport à la série



référence. Pour la prévision de cette série, les réponses produites par ANC3 sont très similaires à ANC2 et

identiques à ANC1.

LIMITES ET VRAISEMBLANCE

L’heuristique de limites et vraisemblance (Becker & Leopold-Wildburger, 1996) est

une des plus récentes suggérée et semble particulièrement bien représenter le comportement

humain dans la prévision de certaines séries temporelles et parfois même supplantant la

norme rationnelle (Becker et al., 2007). Cette stratégie est réalisée en deux temps. D’abord,

elle consiste à extraire des caractéristiques de la ou des série(s) temporelle(s) d’intérêt (par

exemple, les limites supérieures et inférieures passées). Ensuite, ces nouveaux indices sont

potentiellement (dépendamment de la version de l’heuristique) intégrés au sein d’une

représentation linéaire pour prédire le critère. L’implication d’une forme de jugement

linéaire – différente du ML - au sein de cette heuristique constitue d’ailleurs une propriété

intéressante qui sera discutée plus en détails plus tard dans la thèse. Au total, Becker et ses

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

ANC3-V1

46

collègues proposent six modèles de l’heuristique, variant essentiellement le nombre de

séries temporelles considérées simultanément et la force d’association entre les séries. Dans

le contexte de la thèse, trois versions seront retenues : L&V1, L&V2 et L&V3. Elles sont

décrites ci-dessous :

L&V1. Le premier modèle représente la formalisation la plus simple de l’heuristique

de limites et vraisemblance. Ce modèle a été proposé initialement dans le cadre des travaux

de Becker et Leopold-Wildburger (1996) et repris plus tard (Becker et al., 2005; 2007). Ce

modèle ne considère que la série temporelle critère. Deux caractéristiques sont extraites de

la série : la variation moyenne et la probabilité d’un point tournant. La première prémisse

de ce modèle est que les limites à l’intérieur desquelles la prévision aura lieu sont

déterminées par la moyenne absolue de variation de la série critère (Eq. 4).

∑ | |

(4)

Les limites inférieures et supérieures des prévisions sont donc représentées par

[ ]. Le changement prédit dépend quant à lui de la vraisemblance que la valeur

actuelle de la série soit un point tournant (c’est-à-dire si la valeur de la série temporelle

augmente depuis plusieurs périodes et qu’elle se met à descendre, ou vice versa). Si la

valeur de la période actuelle est plus grande que la valeur de la période précédente (

) il s’agit d’un possible sommet. Dans ce cas, représente la probabilité que

soit un maximum local. Le nombre total de maximums locaux observés jusqu’à présent

( ) et le nombre de maximums locaux plus petits ou égaux à la valeur actuelle de la série

critère ( ) sont considérés dans le calcul de la probabilité. Par exemple, si tous les

maximums locaux observés jusqu’à présent sont plus petits que la valeur actuelle du critère,

il est fort probable que la série soit à un point tournant. Inversement, si la valeur de la

période actuelle est plus petite que la période précédente ( ), il s’agit d’un possible

creux. Dans ce cas, représente la probabilité que soit un minimum local ( ). La

logique est la même que celle des maximums locaux, c’est-à-dire que plus la valeur actuelle

de la série temporelle est inférieure ou égale aux minimums locaux observés jusqu’à

47

présent ( ), plus les probabilités que la série temporelle soit à un point tournant est

grande. Le calcul des probabilités est représenté dans l’équation (Eq. 5).

(5)

Dans l’éventualité où aucun extrême (maximum ou minimum local) ne soit survenu

encore, la procédure employée par Becker et Leopold-Wildburger (1996) consiste à fixer

les probabilités d’un point tournant positif et négatif à .5. Il s’agit d’une prémisse qui tente

de limiter le biais potentiel vers l’une ou l’autre des valeurs et constitue rarement une

situation observée dans la présente thèse étant donné le caractère hautement non-

stationnaire des séries temporelles étudiées. Finalement, si la valeur de la période actuelle

est égale à celle de la période précédente les probabilités d’un point tournant

positif et négatif sont combinées linéairement. L’ensemble de ces équations peuvent être

résumées en une seule (Eq. 6).

{

( )

(6)

La Figure 10 illustre un exemple du comportement de l’heuristique L&V1 par

rapport à une série temporelle critère de référence.

48

Figure 10. Exemple du comportement du modèle L&V1 lors de la prévision d’une série temporelle critère de

référence. Notez que les prévisions faites à l’aide de ce modèle sont relativement différentes de celles faites

par les modèles d’ancrage et ajustement.

L&V2. La deuxième formalisation de l’heuristique utilise également un indice

intrinsèque (Eq. 7), mais intègre aussi un indice extrinsèque ( ) provenant d’une autre

série temporelle (k) qui co-évolue avec la série critère (y). Cet indice est ajusté par un

facteur de relation ( ) pour tenir compte des propriétés propres à chaque série. La série

temporelle indice est celle qui a la plus grande corrélation avec la série temporelle critère

au temps t. L’indice est calculé à partir de cette série temporelle à l’aide de l’équation

suivante (Eq. 8) :

(7)

Le facteur de relation est déterminé de la façon suivante (Eq. 7) :

∑ | |

∑ | |

(8)

Ainsi, on se retrouve avec deux indices pour faire le jugement de prévision : et .

Le premier découle directement de la série temporelle critère (il s’agit donc d’un indice de

source intrinsèque) alors que le second découle d’une série temporelle qui co-évolue dans

le même environnement (il s’agit donc d’un indice de source extrinsèque). Si ces deux

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

L&V1-V1

49

indices sont inégaux, le modèle doit avoir un mécanisme de sélection ou de pondération. Le

mécanisme proposé par Becker et ses collègues (2007) consiste à pondérer chacun de ces

indices à l’aide d’un paramètre proportionnel à l’erreur absolue de prévision (Eq. 9)

et (Eq. 10).

∑|

|

(9)

où ,

(10)

où ,

Finalement, la prévision consiste en une combinaison linéaire des deux indices

pondérés par leur paramètre respectif (Eq. 11).

(11)

La Figure 11 illustre un exemple du comportement de l’heuristique L&V2 par


50


référence. Ce modèle est le premier, parmi ceux décrits, qui utilise des informations de source extrinsèque

(ces séries ne sont pas montrées dans la figure). Cela a pour effet de modifier les prévisions par rapport à

L&V1, notamment pour les périodes t > 1 et t < 9.

L&V3. Le troisième modèle de l’heuristique de limites et vraisemblance intègre les

indices ( ) provenant de l’ensemble des autres séries temporelles (k) qui co-évoluent avec

la série critère (y) en plus d’un indice de source intrinsèque déterminé de la même manière

que L&V1 et L&V2 (Eq. 6). À la manière de L&V2, ces indices sont ajustés par un facteur

de relation ( ) pour tenir compte des propriétés propres à chaque série, puis pondéré au

sein d’une représentation linéaire en fonction de leur erreur de prévision. Dépendamment

des conditions expérimentales, cette heuristique intègrera un total de quatre ( ,

ou huit ( , indices. Les indices sont pondérés

suivant la même équation que pour L&V2 (Eq. 9). Ce modèle de l’heuristique de limites et

vraisemblance est celui dont la complexité est la plus élevée en termes de nombre de

paramètres. Ainsi, ce modèle devrait mener à des prévisions précises de l’environnement,

quoique plusieurs études, entre autres dans le domaine de la prévision de séries temporelles,

démontrent que les modèles les plus complexes ne sont pas nécessairement les plus

performants (par exemple, Woike et al., 2012). Ce modèle est toutefois peu plausible d’un

point de vu cognitif, particulièrement lorsque huit indices doivent être intégrés. Pour cette

raison, ce modèle devrait être caractérisé par un faible niveau d’adéquation avec les

données expérimentales humaines (voir Chapitre 3). Cette hypothèse, basée sur les limites

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

L&V2-V1

51

cognitives humaines en mémoire active (Halford et al., 2005), est d’ailleurs émise par

Becker, Leitner et Leopold-Wildburger (2007) qui ont testé ce modèle seulement jusqu’à

l’intégration de cinq indices, ce qui demeure insuffisant pour se prononcer par rapport à

cette hypothèse. La Figure 12 illustre un exemple du comportement du modèle L&V3 par



référence. Ce modèle extrait, intègre et pondère l’ensemble des indices disponibles. Bien que la méthode de

pondération soit simplifiée, ce modèle demeure néanmoins le plus complexe parmi ceux présentés et constitue

probablement une stratégie hors de la portée cognitive humaine.

MODÈLE DE JUGEMENT LINÉAIRE

Le jugement linéaire constitue, dans le cadre de la thèse, la norme rationnelle. Afin

de comparer la performance du jugement linéaire aux modèles de la classe heuristique

spécifiés plus haut, une formalisation computationnelle est réalisée. Cette formalisation se

fonde sur le modèle lentille (ML). Une seule formalisation est réalisée en lien avec le

jugement linéaire puisque le ML constitue la référence incontestée de jugement linéaire

dans la littérature depuis plusieurs décennies.

ML1. Les prévisions du ML1 sont basées sur la régression de chaque critère à

chaque tour de la simulation sur l’ensemble des indices ( ) disponibles, c’est-à-dire

toutes les valeurs passées des séries temporelles de chaque condition expérimentale. Par

0

2

4

6

8

10

12

14

16

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

L&V3-V1

52

exemple, pour prédire la valeur de la série temporelle « V3 » à la période t = 5 une

régression serait effectuée sur les valeurs de cette série aux périodes t = 0 à t = 4 (donc le

critère) avec les valeurs de toutes les séries temporelles pour les périodes passées (donc les

indices). Comme de nouvelles observations sont disponibles à chaque période de la

simulation, une nouvelle régression est réalisée pour chaque période – permettant ainsi au

modèle d’ajuster ses paramètres. La fenêtre temporelle des indices intégrés dans le modèle

est l’ensemble des observations actuelles et passées. Ainsi, pour chaque période, la fenêtre

temporelle s’agrandit. Ces régressions spécifient les coefficients ( ) pour chaque indice et

permet ainsi le calcul d’une valeur prédite pour chaque tour.

La prévision du modèle pour chaque critère est une combinaison linéaire de tous les

indices pondérés incluant une auto régression du critère lui-même (Eq. 12). Les équations

utilisées pour obtenir les valeurs des variables dans l’équation sont détaillées ci-dessous. À

l’instar des autres modèles, le ML1 ne comporte pas de composante stochastique.

∑

(12)

Les coefficients de régression non-standardisés (B) sont obtenus en inversant la

matrice de corrélation des indices et en la multipliant par la matrice de corrélation entre

indices et critère (Eq. 13).

(13)

Finalement, pour obtenir les coefficients de régression standardisés (β), il faut

multiplier les coefficients standardisés par le ratio entre l’écart-type du critère ( et de

l’indice ( (Eq. 14).

(

) (14)

La Figure 13 illustre un exemple des prévisions du ML1 par rapport à une série


53

Figure 13. Exemple du comportement du ML1 lors de la prévision d’une série temporelle critère de référence.

Ce modèle constitue la norme rationnelle dans ce contexte. Dans ce cas précis, on observe que les prévisions

de ML1 semblent relativement bien ajustées au critère, mais que le niveau d’ajustement semble moindre à

celui de certains modèles d’heuristiques décrits précédemment.

Dans tous les cas, la première prévision est initialisée comme si les valeurs

précédentes (t-1) des séries temporelles étaient égales à zéro. Les prévisions faites par

l’ensemble des modèles sont arrondies à l’unité. De plus, la prévision la plus basse possible

est de zéro alors que la plus élevée est de 20. En effet, les valeurs des séries temporelles

sont des entiers et évoluent entre zéro et 20 inclusivement. Ces contraintes sont appliquées

puisque les participants humains (Chapitre III) y sont également soumis. Cela permet ainsi

de comparer justement les données humaines à celles des modèles computationnels.

Plusieurs autres modèles seraient formalisables. Notamment, il serait possible de

développer un modèle de jugement linéaire avec mémoire temporelle limitée ou encore un

modèle de jugement linéaire dans lequel seulement un sous-ensemble d’indices serait

considéré. Toutefois, la thèse se limite à des modèles (1) existants au sein de la littérature et

(2) qui permettent de répondre aux principales hypothèses de recherche.

SOURCES D’INFORMATION DES MODÈLES

Par l’analyse des modèles, il est possible d’identifier les sources d’information

(Harvey, 2007) sur lesquelles les modèles se fondent pour faire leur prévision. Tel que

0

2

4

6

8

10

12

14

16

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Val

eur

Période (t)

Variable 1

ML1-V1

54

décrit précédemment, la source intrinsèque concerne les informations qui sont associées au

critère lui-même. Par exemple, dans le présent contexte, les valeurs passées du critère

constituent un indice de source intrinsèque. À l’inverse, la source extrinsèque concerne les

informations qui sont associées aux autres séries temporelles. Par exemple, si on doit

prédire la série A, les valeurs des séries B, C et D constituent des indices de source

extrinsèque.

Ces sources peuvent être décomposées davantage en fonction des caractéristiques des

modèles formalisés dans la présente thèse. Les informations de source intrinsèque peuvent

être explicites, par exemple, la valeur du critère à la période t – 1, ou extraites, par exemple,

la probabilité d’un changement de direction dans le changement de la série temporelle.

Cette décomposition (entre extraite et explicite) a d’abord été suggérée par Karelaia et

Hogarth (2008) et se révèle pertinente puisque ces mêmes auteurs y associent des

différences en termes de performance de jugement dans un contexte différent, mais

similaire aux prévisions de séries temporelles. Dans ce contexte-ci, les modèles d’ancrage

et ajustement se fondent sur des indices explicites de source intrinsèque alors que les

modèles de limites et vraisemblance se fondent essentiellement sur des indices extraits de

source intrinsèque. La source extrinsèque peut aussi être décomposée selon que le modèle

se fonde sur un ou plusieurs indices. Cette décomposition est justifiée par le fait que le

nombre d’indices est une caractéristique importante qui serait associée à la performance du

jugement, mais aussi aux limites fondamentales des capacités cognitives humaines. C’est-à-

dire qu’il est démontré que les humains ont beaucoup de difficulté à adopter une stratégie

qui intègre plus de trois indices simultanément (voir Halford et al., 2005). Logiquement,

plus les sources d’information sur lesquelles un modèle se fonde sont de bonne qualité, plus

le modèle sera performant. C’est d’ailleurs pour cette raison que la qualité des sources

d’information est manipulée au sein des deux simulations à venir. Le Tableau 1 identifie les

sources d’information de chacune des versions des modèles.

55

Tableau 1

Sources d’information et modèles.

Intrinsèque Extrinsèque

Stratégie Modèle Explicite Extraite Unique Multiple

Ancrage et

ajustement

(heuristique)

ANC1 X

ANC2 X

ANC3 X

Limites et

vraisemblance

(heuristique)

L&V1 X

L&V2 X X

L&V3 X X

Jugement

linéaire ML1 X X

Sur la base des sources d’information employées par les modèles, il est raisonnable

d’avancer que les trois modèles d’ancrage et ajustement devraient se comporter

relativement de la même façon en fonction des variations dans la qualité des sources

d’information. En effet, ils misent tous sur des indices de source intrinsèque explicitement

disponibles. À l’inverse, les autres modèles (c’est-à-dire, ceux associés à l’heuristique de

limites et vraisemblance et au jugement linéaire) devraient avoir des patrons uniques de

performance en fonction de la qualité des sources d’information puisque chacun de ceux-ci

mise sur une combinaison différente de sources d’information.

Suite à cette analyse des modèles, il est possible de décomposer l’hypothèse H1 en

une série d’hypothèses plus précises, elles-mêmes associées à l’objectif O1 de cartographier

le lien entre les conditions environnementales et la performance des stratégies modélisées:

H1 : La performance des heuristiques à la tâche de prévision temporelle sera supérieure à

celle du modèle de jugement linéaire.

H1a : La performance de l’heuristique d’ancrage et ajustement sera supérieure à

celle du modèle de jugement linéaire dans les conditions où seule la qualité de la

source d’information intrinsèque est élevée.

56

H1b : La performance de l’heuristique de limites et vraisemblance (L&V1) sera

supérieure à celle du modèle de jugement linéaire dans les conditions où seule la

qualité de la source d’information intrinsèque est élevée.

H1c : La performance de l’heuristique de limites et vraisemblance (L&V2 et L&V3)

sera supérieure à celle du modèle de jugement linéaire dans les conditions où la

qualité des sources d’information intrinsèque et extrinsèque est élevée.

Simulation I

Ce chapitre vise à évaluer la performance des modèles de stratégie de prévision

(ancrage et ajustement, limites et vraisemblance et jugement linéaire) sous de conditions

variées de qualité d’information de sources intrinsèque et extrinsèque. L’objectif est de

juger si l’application de stratégies supplantant le jugement linéaire est possible et de

déterminer quelles conditions favorisent cette application. À cet égard, la première

simulation étudie l’influence de la qualité de la source extrinsèque d’information sur la

performance des stratégies formalisées. Par conséquent, la qualité de la source extrinsèque

est variée entre les séries temporelles alors que la qualité de la source intrinsèque est

contrôlée (c’est-à-dire qu’elle est maintenue à un niveau élevé pour l’ensemble des séries

temporelles). Les facteurs manipulés pour varier la qualité de la source extrinsèque sont le

nombre d’indices extrinsèques et la force d’association extrinsèque.

Le nombre d’indices extrinsèques correspond au nombre de séries temporelles qui

co-évoluent avec la série critère. Tel que discuté précédemment, le nombre d’indices est un

facteur bien connu pour avoir un impact sur l’adoption des stratégies de jugement. En effet,

au-delà de trois variables à considérer comme indices lors d’un jugement, les individus

semblent avoir beaucoup de difficulté à appliquer une règle de jugement linéaire et

adopteraient par conséquent des heuristiques simplificatrices (Karelaia & Hogarth, 2008).

Cet effet est généralement interprété à la lumière des limitations cognitives bien connues

des individus en termes de capacité de traitement de l’information et de limites en mémoire

active (Halford et al., 2005; Payne et al., 1993). C’est précisément ce seuil de trois indices

qui sera manipulé dans le cadre de la première simulation. En effet, les prévisions seront

réalisées selon deux conditions à l’égard du nombre d’indices à considérer. Dans la

57

première condition, le nombre d’indices sera de trois (donc équivalent au seuil établit par

Halford et ses collègues) alors quand dans l’autre, le nombre d’indices sera de sept (donc

supérieur au seuil établit).

La force d’association extrinsèque correspond au maximum des corrélations

linéaires absolues entre les indices extrinsèques et le critère. En d’autres mots, plus le

critère peut être prédit avec précision à l’aide d’un indice extrinsèque unique, plus la force

d’association extrinsèque est élevée. La force d’association extrinsèque réfère directement à

la validité et la fiabilité des indices (Seifert & Hadida, 2013). Certaines études démontrent

que la validité des indices influence la performance à une tâche de prévision de séries

temporelles (Lim & O’Connor, 1996), mais son impact spécifique sur la performance des

stratégies formalisées dans la présente thèse n’a pas été étudié. C’est-à-dire les heuristiques

d’ancrage et ajustement, et de limites et vraisemblance ainsi que la norme rationnelle de

jugement linéaire.

MÉTHODE

Tâche. La tâche consiste à prédire la valeur numérique d’un ensemble de séries

temporelles pour la période suivante t + 1. Ces séries temporelles évoluent sur 40 périodes.

Les paramètres des modèles sont fixés dans le but de minimiser l’erreur quadratique

moyenne entre les prévisions et la série temporelle critère. Les modèles ont accès à

l’ensemble des valeurs passées et actuelles de toutes les séries temporelles. Évidemment,

les modèles n’ont pas accès aux valeurs futures des séries temporelles. Les valeurs

présentées aux modèles ne comportent pas d’incertitude, c’est-à-dire qu’ils ont accès à une

information juste et précise sur la valeur actuelle et les valeurs passées de toutes les

variables de la situation.

Lorsque possible, les modèles sont simulés pour l’ensemble des 40 périodes de

chaque condition, néanmoins, toutes les statistiques rapportées ne concernent que les

périodes t > 9. Cela est causé par des limitations computationnelles de certaines stratégies

qui requièrent un nombre minimal d’observations pour être exécutées. Par exemple, le

calcul du ML1 ne peut être réalisé lorsque la matrice de variance-covariance est

caractérisée par un niveau de colinéarité trop élevé.

58

Procédure. Les heuristiques sont formalisées et simulées dans Excel alors que le

modèle linéaire l’est en partie dans SPSS (pour le calcul des coefficients de régression) et

en partie dans Excel (pour les prévisions finales). Les prévisions numériques réalisées par

les modèles sont consolidées dans un fichier Excel unique dans lequel l’adéquation par

rapport aux valeurs réelles des séries temporelles est calculée. L’adéquation est mesurée à

l’aide de la PVE. Cet indice de performance, tel que formulé (Hays, 1963; Stevens, 2013;

Eq. 14), tient compte à la fois de l’erreur moyenne des prévisions et de la prévision de la

variation des séries temporelles. Essentiellement, cet indice correspond à l’erreur de

prévision, pondérée par la variance de la série critère. La PVE peut théoriquement varier de

-∞ à +1. Plus la valeur de la PVE est proche de un, plus la prévision de la série temporelle

est bonne. Une PVE négative signifie que les prévisions réalisées ajoutent de la variance à

la variance réelle de la série.

∑ ̅ ∑

∑ ̅ (14)

La manipulation des facteurs nombre d’indices extrinsèques (3 et 7) et la corrélation

extrinsèque (telle que définie, cette valeur est absolue, donc nécessairement positive) (min

= .29, max = .98, m = .78, ET = .17) est réalisée sur 24 séries temporelles regroupées en

quatre versions de scénario. Les Figure 14, Figure 15, Figure 16 et Figure 17 représentent la

valeur de chacune des variables pour les 41 périodes de la simulation. Tel que décrit

précédemment, la qualité des indices de source intrinsèque a potentiellement un impact sur

la performance des heuristiques et du modèle de jugement linéaire. Pour cette raison, et

comme le centre focal de cette simulation concerne la qualité des indices de source

extrinsèque, ce facteur est contrôlé autant que possible. L’indice utilisé pour estimer la

qualité des indices de source intrinsèque est la force d’autocorrélation du critère. Plus

l’autocorrélation est élevée, plus la qualité des indices de source intrinsèque est élevée. Le

Tableau 2 recense la force d’association, le nombre d’indices extrinsèques et la force de

l’autocorrélation (facteur contrôlé) par série temporelle.

59

Figure 14. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un

indice.

Figure 15. Quatre séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un

indice.

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Val

eur

Période (t)

V01

V02

V03

V04

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Vale

ur

Période (t)

V01

V02

V03

V04

60

Figure 16. Huit séries temporelles présentées lors de la Simulation 1. Chacune de ces séries est à la fois un critère et un

indice.


indice.

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Val

eur

Période (t)

V01

V02

V03

V04

V05

V06

V07

V08

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Val

eur

Période (t)

V01

V02

V03

V04

V05

V06

V07

V08

61

Tableau 2

Nombre d’indices extrinsèques, force d’association entre meilleur indice et critère, et

autocorrélation du critère.

Manipulé Contrôlé

Série Nombre d’indices

extrinsèques (SE)

Force d’association

(SE)

Autocorrélation du

critère (SI)

1 3 0.96 0.99

2 3 0.64 0.99

3 3 0.96 0.99

4 3 0.75 1.00

5 3 0.89 0.90

6 3 0.89 0.96

7 3 0.59 0.97

8 3 0.61 0.97

9 7 0.94 0.93

10 7 0.84 0.95

11 7 0.83 0.98

12 7 0.29 1.00

13 7 0.98 0.98

14 7 0.98 0.98

15 7 0.83 0.98

16 7 0.94 0.99

17 7 0.76 0.83

18 7 0.59 0.92

19 7 0.84 0.99

20 7 0.72 0.98

21 7 0.76 0.91

22 7 0.58 0.75

23 7 0.84 0.98

24 7 0.64 0.98

62

ESTIMATION DES PARAMÈTRES DES MODÈLES

Les modèles effectuent leurs prévisions pour l’ensemble des séries temporelles.

Dans leur forme actuelle, chaque modèle fait systématiquement la même prévision lorsqu’il

sera dans les mêmes conditions environnementales, c’est-à-dire que les règles de prévision

des modèles sont complètement déterminées. Il résulte donc de 24 séries de prévisions pour

chaque modèle. Les figures suivantes (16 à 19) illustrent un exemple de l’évolution des

paramètres pour les modèles L&V3 et ML1 et des prévisions qui en découlent pour une des

séries temporelles critère. Aucun modèle d’ancrage et ajustement n’est montré en exemple

dans cette section puisque leur unique paramètre (α) est fixe pour l’ensemble des prévisions

associées à une série temporelle. Ce paramètre est fixé grâce à l’outil « Solver » du logiciel

Excel 2007 de Microsoft. Seul l’estimation des paramètres du modèle L&V3 de

l’heuristique de limites et vraisemblance est montrée en exemple puisqu’il s’agit de

l’instanciation la plus complexe des trois modèles de limites et vraisemblance et que

l’estimation de ses paramètres est identique à celle des modèles L&V1 et L&V2.

Finalement, l’estimation des paramètres de ML1 est montrée en exemple puisqu’il est le

seul représentant de sa classe de modèle (c’est-à-dire, le jugement linéaire). Notez que

toutes les statistiques rapportées ne concernent que les périodes t > 9. Cela est causé par des

limitations computationnelles de certains modèles qui requièrent un nombre minimal

d’observations pour être exécutés.

La Figure 18 montre l’évolution du paramètre facteur de relation entre la série

temporelle critère Y2 et chacune des séries temporelles de source extrinsèque Kn pour t > 9.

Ce paramètre est estimé pour le calcul des prévisions du modèle L&V3. Il s’agit d’un

paramètre qui évalue le degré d’association linéaire entre le critère et les indices, mis à jour

à chaque période pour y inclure les nouvelles observations. Tel que décrit précédemment,

ce paramètre estime une propriété gestaltique extraite des séries temporelles. Une fois

extrait, ce paramètre constitue un indice utilisé pour la prévision de la série temporelle

critère.

63

Figure 18. Facteur de relation entre la série temporelle critère Y2 et chacune des séries temporelles K. Il n’y a

pas de facteur de relation pour la série K2 puisqu’il s’agit de la série critère et que ce paramètre n’est estimé

que pour les séries extrinsèques.

L’utilisation du facteur de relation (illustré dans la Figure 18) dans le modèle L&V3

est pondérée en fonction de l’erreur des prévisions passées. La pondération de chaque

indice est inversement proportionnelle à l’erreur qui lui est attribuée. Cette pondération est

aussi ajustée à chaque période pour y inclure les nouvelles observations. La Figure 19

illustre l’évolution du poids de chaque indice pour la série temporelle critère Y2 (source

intrinsèque) et chacune des séries temporelles Kn (source extrinsèque).

0

0,5

1

1,5

2

2,5

3

3,5

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41

Fact

eu

r d

e r

ela

tio

n r

kt

Période (t)

Y2-K1

Y2-K3

Y2-K4

Y2-K5

Y2-K6

Y2-K7

Y2-K8

64

Figure 19. Poids attribué aux indices Kn et Y pour la prévision de la série temporelle critère Y2. Notez qu’au

départ, le poids attribué à l’indice intrinsèque est le plus important, mais qu’il cède éventuellement place à

d’autres indices extrinsèques.

La Figure 20 illustre la valeur des coefficients de régression non-standardisés par le

ML1 pour la même variable critère et les mêmes indices que ceux illustrés dans la Figure

19 pour le modèle L&V3.

La méthode utilisée pour estimer le poids des indices dans le modèle L&V3 (définie

dans Becker et al., 2007) diffère de celle employée par le ML1 pour le calcul des

coefficients de régression. De plus, les coefficients sont estimés sur des indices différents.

Ces différences résultent donc en des prévisions distinctes, telles qu’illustrées dans la

Figure 21.

0

0,05

0,1

0,15

0,2

0,25

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

Po

ids

αst

Période (t)

k1

k3

k4

k5

k6

k7

k8

Y (V2)

65

Figure 20. Coefficients de régression non-standardisés des indices Kn et Y pour la prévision de la série

temporelle critère Y2. Notez qu’à l’inverse des poids calculés par le modèle L&V3, le coefficient de l’indice

intrinsèque (B 02) est d’abord faible, puis devient le plus important par la suite.

Figure 21. Prévisions de L&V3 et ML1 et valeurs réelles de la série temporelle critère (nommée 7 ind ; faible

– V2) pour les périodes [t > 9 : t <= 41]. Le critère est nommé « 7 ind » et « faible » puisqu’il est dans une

condition où 7 indices extrinsèques sont disponibles pour le prédire et où la force d’association extrinsèque

avec ces indices est faible. Les deux modèles génèrent des prévisions distinctes, et aucune n’arrive à prédire

parfaitement la série temporelle critère.

-3

-2

-1

0

1

2

3

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

Val

eu

r d

es

coe

ffic

ien

ts d

e r

égr

ess

ion

Période (t)

B 01

B 02

B 03

B 04

B 05

B 06

B 07

B 08

0

2

4

6

8

10

12

14

16

18

20

t10 t12 t14 t16 t18 t20 t22 t24 t26 t28 t30 t32 t34 t36 t38 t40

Val

eu

r

Période (t)

7 ind; faible - V2

L&V3 - V2

ML1 - V2

66

RÉSULTATS

Les données générées par la simulation sont analysées en quatre étapes. La première

consiste à évaluer la similarité des prévisions des modèles. Cette analyse vise

essentiellement à évaluer si les conditions de simulation permettent de discriminer les

modèles. La deuxième étape consiste à comparer les deux classes de modèles – heuristiques

(ANC1, ANC2, ANC3, L&V1, L&V2, L&V3) et jugement linéaire (ML1) – afin d’évaluer

si certaines heuristiques arrivent à mieux performer que le modèle de jugement linéaire.

Cette comparaison est directement en lien avec l’hypothèse H1, c’est-à-dire :

H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans

certains cas supérieure à celle du modèle de jugement linéaire.

La troisième étape consiste à évaluer l’impact des facteurs expérimentaux sur la

performance des modèles. Cette analyse vise à identifier quelles sont les conditions qui

pourraient déterminer l’utilité des stratégies. Finalement, la dernière étape consiste à

explorer d’autres facteurs potentiels pour expliquer la variation de la performance des

modèles. Les étapes trois et quatre sont en lien avec O1, c’est-à-dire :



Cet objectif est lui-même associé à trois sous-hypothèses :










67

Similarité des modèles. Pour chaque série temporelle, un coefficient de corrélation

Pearson entre les prévisions des modèles est calculé. Plus le coefficient est prêt de un, plus

les prévisions des modèles comparées sont similaires. Le Tableau 3 rapporte le coefficient

de corrélation de Pearson moyen pour l’ensemble des séries temporelles et l’écart-type

entre les prévisions des modèles.

Tableau 3

Moyenne (écart-type) des corrélations entre les prévisions des modèles.

ANC2 ANC3 L&V1 L&V2 L&V3 ML1

ANC1 .99 (.01) 1.00 (0) .98 (.05) .95 (.19) .95 (.08) .94 (.08)

ANC2

.99 (.01) .97 (.06) .94 (.20) .93 (.07) .95 (.09)

ANC3

.98 (.05) .95 (.19) .95 (.08) .94 (.08)

L&V1

.96 (.11) .93 (.13) .94 (.09)

L&V2

.92 (.23) .92 (.15)

L&V3

.89 (.14)

Notez que la corrélation moyenne entre ANC1 et ANC3 est de un, ce qui signifie

que les prévisions réalisées par ces deux modèles sont identiques en tout point pour

l’ensemble des séries temporelles de la simulation. Par conséquent, pour les analyses

subséquentes, ces deux modèles de l’heuristique seront traités de façon indifférenciée.

Comparaison des classes de modèles. Une ANOVA à mesures répétées sur la

performance en variable dépendante et le modèle comme facteur répété indique qu’en

moyenne, sur les 24 séries temporelles, aucun modèle ne permet l’atteinte de performance

supérieure aux autres F(5,115) = 1.579, non significatif. Les résultats de l’analyse indiquent

qu’on ne peut rejeter l’hypothèse nulle selon laquelle la performance moyenne des modèles

est équivalente. La moyenne de performance et l’écart-type des modèles sont rapportés

dans le Tableau 4.

68

Tableau 4

PVE moyenne (écart-type) des modèles.


PVE moyenne .89 (.12) .92 (.12) .84 (.21) .83 (.26) .91 (.04) .67 (.87)

Bien qu’en moyenne, aucun modèle ne performe mieux que les autres, la

performance à chaque série temporelle est analysée. Afin de comparer les classes de

modèles et de vérifier si certaines heuristiques performent mieux que le ML, la différence

entre la performance de chaque modèle d’heuristiques et le ML1 est calculée. Ensuite,

selon que la différence est positive ou négative, les prévisions des modèles d’heuristiques

sont classifiées comme étant meilleure ou moins bonne que celles du ML1. Étant donné que

les modèles formalisés ne comportent pas de processus stochastiques, les prévisions pour

une série temporelle donnée ne comporteraient aucune variabilité s’ils étaient simulés à

plusieurs reprises. Ainsi, il est justifié de dire qu’un modèle est ou n’est pas plus

performant que le ML1 pour une série temporelle donnée, et ce, sans effectuer de test

statistique. Le Tableau 5 indique la fréquence de différence positive par modèle

d’heuristique.

Tableau 5

Fréquence de différence positive indiquant une performance supérieure au modèle

linéaire par modèle.

ANC1 ANC2 L&V1 L&V2 L&V3

Fréquence (/24) 10 18 9 7 10

Le modèle le plus performant est identifié par série temporelle. Ils sont rapportés

dans le Tableau 6. Au total, il existe au moins un modèle qui performe mieux que le ML1

pour 20 des 24 séries temporelles. Les quatre séries temporelles mieux prédites par ML1

sont les séries 4, 7, 9 et 10 (voir Figure 22).

69

Tableau 6

Modèle le plus performant par série temporelle.


Séries 8, 17, 18

1, 2, 3, 9,

11, 12, 13,

14, 15, 16,

19, 20, 22,

23, 24

6, 21

4, 5, 7, 10

Figure 22. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle des modèles

d’heuristiques formalisées et séries co-évoluant avec celles-ci (grises).

Effet des facteurs expérimentaux sur la performance. Pour toutes les conditions et

les modèles confondus, la moyenne (ET) de performance est égale à .85 (.36) telle

qu’estimée par la PVE. Pour estimer la performance des modèles en fonction des facteurs

expérimentaux, une série d’analyses de régression est réalisée sur la performance atteinte

0

2

4

6

8

10

12

14

16

18

20


Série 1

Série 2

Série 3

Série 4

0

2

4

6

8

10

12

14

16

18

20


Série 5

Série 6

Série 7

Série 8

0

2

4

6

8

10

12

14

16

18

20


Série 9

Série 10

Série 11

Série 12

Série 13

Série 14

Série 15

Série 160

2

4

6

8

10

12

14

16

18

20


Série 9

Série 10

Série 11

Série 12

Série 13

Série 14

Série 15

Série 16

Période (t)

Période (t) Période (t)

Période (t)

Val

eur

Val

eur

Val

eur

Val

eur

70

par chaque modèle en VD et le nombre d’indices extrinsèques (3 vs. 7) et la force

d’association extrinsèque comme VIs. Les régressions sont réalisées sur la performance

PVE afin de savoir sous quelles conditions chaque modèle est susceptible de bien

performer.

Tous les modèles n’ont pas été retenus pour faire les analyses. Ce choix est motivé

par l’augmentation des risques d’erreur de type I (c’est-à-dire rejet erroné de l’hypothèse

nulle) avec l’augmentation du nombre de tests. Ainsi, pour limiter le nombre de tests, seul

un représentant des modèles d’ancrage et ajustement (ANC2) a été retenu. Il s’agit de la

version de l’heuristique qui obtient la meilleure performance de prévision moyenne. De

plus, les deux autres versions de cette heuristique sont caractérisées par les mêmes sources

d’information que la version ANC2. Les trois modèles de l’heuristique de limites et

vraisemblance ont été retenus puisqu’ils sont tous caractérisés par des sources

d’information distinctes. Finalement, le ML1 a aussi été retenu puisqu’il est le seul

représentant du jugement linéaire. Finalement, une correction Bonferroni a été réalisée pour

éviter le gonflement de la probabilité d’erreur de type I. Le nombre de tests effectués étant

égal à cinq, le seuil alpha corrigé est égal à .01 (initialement .05).

Les prémisses de normalité, linéarité et d’homoscédasticité des résidus ont été

vérifiés avec SPSS EXAMINE et SPSS REGRESSION. Étant donné la valeur extrême de

performance de L&V2, l’observation correspondant à la série temporelle #12 (voir Tableau

2) a été retirée des analyses. Les analyses ont été réalisées avec SPSS REGRESSION. La

méthode de sélection des facteurs se fonde sur un critère d’entré statistique STEPWISE1.

Les régressions sur la performance d’ANC2, L&V1, L&V2, L&V3 et ML1 révèlent que les

R sont tous non-statistiquement significatifs.

Autres analyses. Bien que la qualité de la source intrinsèque d’information telle que

mesurée par l’autocorrélation du critère soit contrôlée et tenue relativement stable pour

l’ensemble des séries temporelles, il existe de légères variations qui pourraient expliquer les

variations de performance des modèles. Une analyse corrélationnelle a été effectuée afin

1 Entrée à F <= .05, sortie à F >= .10

71

d’évaluer l’impact potentiel de ce facteur. Le Tableau 7 rapporte les coefficients de

corrélation et leur niveau de signification statistique.

Tableau 7

Coefficient de corrélation de Pearson entre autocorrélation du critère et performance

des modèles.


R .945** .956** .814** .403 -.178 .431*

N 24 24 24 24 24 24

* Significatif à p < .05

** Significatif à p < .01

Afin de valider l’importance de l’autocorrélation, une analyse des coefficients de

régression standardisés du ML1 a été réalisée. L’analyse consiste à comparer la valeur

moyenne des coefficients attribués aux indices de source intrinsèque à ceux de source

extrinsèque. La valeur absolue des coefficients est utilisée puisque le signe ne qualifie pas

l’importance d’un coefficient, mais plutôt sa direction. Un test-t révèle que la moyenne des

coefficients standardisés absolus des indices de source intrinsèque (m = .83, ET = .25) est

statistiquement supérieure à la moyenne des coefficients standardisés absolus des indices de

source extrinsèque (m = .27, ET = .18) t(23) = 7.69, p < .01. Cela montre donc que le ML1

tient compte de la validité élevée des indices de source intrinsèque et les pondère ainsi de

manière plus importante que les indices de source extrinsèque pour faire ses prévisions.

DISCUSSION

De façon générale, les prévisions des modèles sont assez similaires. Cette similarité

s’explique par le fait que la performance moyenne des modèles dans le contexte de la

première simulation est très élevée. Ce résultat n’est toutefois pas une surprise puisqu’il est

raisonnable de s’attendre à ce que des modèles spécifiquement calibrés pour prédire des

séries temporelles arrivent à performer au moins modérément à la tâche. Les différences

entre les prévisions sont subtiles, mais tout même révélatrices de mécaniques sous-jacentes

distinctes.

72

H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans certains

cas supérieure à celle du modèle de jugement linéaire.

Les résultats soulignent que tous les modèles d’heuristiques formalisés arrivent à

mieux performer que le modèle linéaire, et ce, à plusieurs reprises : le modèle linéaire

constitue la meilleure stratégie que dans de rares cas. Il faut noter toutefois que ces

conclusions sont basées sur une analyse de la fréquence de gain et non pas d’une

performance moyenne. Par conséquent, il est difficile de se prononcer sur la généralisation

de ce résultat au-delà de l’échantillon observé. De plus, l’analyse des fréquences et de la

performance moyenne des stratégies indique qu’une stratégie unique ne permet pas

l’atteinte de la meilleure performance pour l’ensemble des séries temporelles de la

simulation. Ces résultats signifient donc qu’un individu qui appliquerait parfaitement la

bonne heuristique au bon moment lors de la prévision de ces séries temporelles atteindrait

une performance supérieure à celle du modèle normatif, ce qui est en accord avec la

rationalité écologique (Sturm, 2012) et le coffre à outils cognitif (Gigerenzer & Selten,

2001; Gigerenzer et al., 1999).



Dans le contexte de cette simulation, toutefois, les facteurs manipulés se révèlent

avoir un impact mineur sur la performance des modèles. En effet, bien que des variations

soient observées, la performance d’aucun des modèles ne semble modulée par le nombre

d’indices extrinsèques et la force d’association extrinsèque. Pour certains modèles,

l’absence d’effet de la qualité de la source extrinsèque sur la performance s’expliquerait par

l’utilisation unique d’indices de source intrinsèque. En effet, puisque ANC1, ANC2, ANC3

et L&V1 n’utilisent que des indices de source intrinsèque, il est normal que leur

performance ne soit pas affectée par la manipulation de facteurs associés à la source

extrinsèque, ce qui est conforme aux hypothèses H1a et H1b. Toutefois, dans un

environnement où la validité des indices de source intrinsèque serait réduite, ces stratégies

risquent d’être beaucoup moins performantes puisqu’elles ne peuvent pas compenser par

l’utilisation d’indices de source extrinsèque, potentiellement plus valides. Cela sera évalué

lors de la simulation suivante.

73

Toutefois, l’absence d’effet des deux facteurs associés à la qualité de la source

d’information extrinsèque sur la performance des modèles L&V2, L&V3 et ML1 se révèle

être une surprise, et inverse à l’hypothèse H1c, étant donné la pertinence de cette source

d’information pour ces derniers (Harvey, 2007; Hogarth & Karelaia, 2007). Par contre, ces

stratégies ont également la capacité d’intégrer les indices en provenance de source

intrinsèque. Ainsi, l’absence de résultats significatifs pour ces modèles pourrait s’expliquer

par le fait que ces modèles sont compensatoires (Bröder & Schiffer, 2006). Sous des

conditions de qualité diminuée des indices de source extrinsèque (comme c’est le cas dans

la présente simulation), ces modèles pourraient tout de même bien performer

conditionnellement à une validité élevée des indices de source intrinsèque. Deux analyses

appuient cette interprétation, c’est-à-dire l’analyse des coefficients de régressions du ML1

et la mesure d’association entre force d’autocorrélation et performance des modèles. En

effet, les coefficients de régressions du ML1 associés aux indices de source intrinsèque sont

en moyenne plus importants que ceux attribués aux indices de source extrinsèque. Cela

démontre que, pour diminuer l’erreur de prévision, le ML1 accorde plus d’importance aux

indices intrinsèques comparativement aux indices extrinsèques. L’analyse corrélationnelle

entre force d’autocorrélation et performance des modèles permet d’appuyer davantage cette

interprétation puisqu’elle indique que plus les indices intrinsèques sont fiables et valides,

telle que mesurée par la force de l’autocorrélation des critères, plus la performance des

modèles sera élevée. Ainsi, étant donné la validité élevée des indices intrinsèques dans la

présente simulation, tous les modèles ont la capacité de bien performer, incluant les

modèles non compensatoires.

Bien que cette simulation ne montre qu’un côté de la médaille (c’est-à-dire, indices

intrinsèque de qualité élevée seulement), les résultats appuient certains résultats empiriques

récents selon lesquels une stratégie non compensatoire peut mener à des performances

équivalentes, voire même supérieures à des stratégies compensatoires (Gigerenzer et al.,

1999; Hogarth & Kareleia, 2005, 2007). En effet, les modèles non compensatoires (c’est-à-

dire, ANC1, ANC2, ANC3 et L&V1) tirent particulièrement bien leur épingle du jeu sous

ces conditions comparativement aux modèles compensatoires. Par contre, ils risqueraient de

moins bien performer dans un environnement moins favorable, c’est-à-dire dans un

74

environnement où les indices intrinsèques seraient moins valides. Cette hypothèse sera

d’ailleurs explorée dans la deuxième simulation.

Simulation II

La seconde simulation explore à la fois l’impact de la qualité des indices de source

intrinsèque et des indices de source extrinsèque sur la performance des modèles. Elle vise à

discriminer davantage les modèles, particulièrement les modèles non compensatoires qui

sont basés uniquement sur des indices intrinsèques comparativement aux modèles

compensatoires qui utilisent à la fois les indices intrinsèques et extrinsèques. Concrètement,

les facteurs manipulés sont la force d’association extrinsèque et l’autocorrélation des séries

temporelles. Cette seconde simulation est justifiée par le fait que les sous-hypothèses H1a,

H1b et H1c ne sont que partiellement résolues. Bien que la performance des heuristiques

est parfois supérieure à celle du modèle de jugement linéaire (tel que prédit par l’hypothèse

H1), les conditions sous lesquelles cela est possible demeurent mal définies étant donné les

environnements compensatoires testés.

Le facteur retenu pour la manipulation de la qualité de la source extrinsèque est la

force d’association extrinsèque puisqu’elle est directement liée à la validité et la fiabilité

des indices de source extrinsèque (Seifert & Hadida, 2013) alors que le nombre d’indices

extrinsèque est davantage associé à la quantité. Il représente donc une meilleure indication

de la qualité de la source extrinsèque comparativement au nombre d’indices extrinsèques.

La force d’association extrinsèque est opérationnalisée comme dans la simulation

précédente. Elle correspond au maximum des corrélations linéaires absolues entre les

indices extrinsèques et le critère. Le nombre d’indices extrinsèques est tenu fixe pour la

deuxième simulation puisque son impact sur la performance des modèles lors de la

Simulation I était limité, voire inexistant.

L’autocorrélation des séries temporelles critères est manipulée dans le but de varier

la qualité de la source intrinsèque. Elle correspond à la corrélation des valeurs de la série

temporelle critère sur ses propres valeurs moins une latence d’une période.

L’autocorrélation du critère est un facteur critique dans l’adoption de stratégies alternatives

au modèle linéaire (Lawrence et al., 2006). En effet, plusieurs études observent que les

75

individus qui doivent prédire l’évolution d’une série temporelle auto corrélée ont tendance

à se comporter comme s’ils utilisaient une heuristique d’ancrage et ajustement (Andreassen

& Kraus, 1990; Lawrence & O’Connor, 1992; 1995; Reimers & Harvey, 2011). De plus,

Bolger et Harvey (1993) observent que la nature précise de l’heuristique employée est

différente en fonction de la force de l’autocorrélation, ce qui suggère que ce facteur est

déterminant dans le choix des stratégies employées. Finalement, au sein de la présente

thèse, la première simulation suggère que ce facteur serait un déterminant important de la

performance des stratégies modélisées.

MÉTHODE

La tâche et la procédure sont exactement les mêmes que lors de la première

simulation. La manipulation des facteurs association extrinsèque (min = .14, max = .1, m =

.61, ET = .29) et autocorrélation (min = .00, max = .1, m = .46, ET = .39) est réalisée sur

32 séries temporelles regroupées en quatre version de scénario. Les Figure 23, Figure 24,

Figure 25 et Figure 26 représentent la valeur de chacune des variables pour les 41 tours de

la simulation. Le Tableau 8 recense la force d’association et la force de l’autocorrélation

par série temporelle.

76

Tableau 8

Force d’association entre meilleur indice et critère et autocorrélation du critère.

Série Autocorrélation du critère (SI) Force d’association (SE)

1 0.93 0.96

2 0.89 0.83

3 0.93 0.96

4 0.90 0.86

5 0.85 0.85

6 0.89 0.68

7 0.81 0.86

8 0.62 0.85

9 0.99 0.33

10 1.00 0.36

11 0.72 0.63

12 0.80 0.43

13 0.85 0.43

14 0.30 0.56

15 0.98 0.63

16 0.43 0.43

17 0.01 0.88

18 0.01 1.00

19 0.01 1.00

20 0.01 1.00

21 0.00 1.00

22 0.04 0.99

23 0.33 0.36

24 0.38 0.36

25 0.04 0.25

26 0.17 0.34

27 0.08 0.34

28 0.30 0.14

29 0.02 0.18

30 0.43 0.34

31 0.04 0.36

32 0.11 0.36

77


indice. Ces huit séries ont en moyenne une autocorrélation et une force d’association extrinsèque élevées.


indice. Ces huit séries ont en moyenne une autocorrélation élevée et une force d’association extrinsèque faible.

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Val

eur

Période (t)

V01

V02

V03

V04

V05

V06

V07

V08

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Val

eur

Période (t)

V01

V02

V03

V04

V05

V06

V07

V08

78


indice. Ces huit séries ont en moyenne une autocorrélation faible et une force d’association extrinsèque élevée.


indice. Ces huit séries ont en moyenne une autocorrélation faible et une force d’association extrinsèque faible.

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Val

eur

Période (t)

V01

V02

V03

V04

V05

V06

V07

V08

0

2

4

6

8

10

12

14

16

18

20

t1 t2 t3 t4 t5 t6 t7 t8 t9 t10

t11

t12

t13

t14

t15

t16

t17

t18

t19

t20

t21

t22

t23

t24

t25

t26

t27

t28

t29

t30

t31

t32

t33

t34

t35

t36

t37

t38

t39

t40

t41

Vale

ur

Période (t)

V01

V02

V03

V04

V05

V06

V07

V08

79

ESTIMATION DES PARAMÈTRES

À l’instar de la simulation précédente, les paramètres des modèles sont estimés

grâce aux formules présentées précédemment. Les modèles effectuent leurs prévisions pour

l’ensemble des séries temporelles. Tout comme pour la première simulation, chaque

modèle fait systématiquement la même prévision lorsqu’il sera dans les mêmes conditions

environnementales. Il résulte donc de 32 séries de prévisions pour chaque modèle.

RÉSULTATS

Les données générées par la simulation II sont analysées en trois étapes. La

première consiste à évaluer la similarité des prévisions des modèles. Cette analyse vise à

évaluer si les conditions de simulation permettent de discriminer les modèles. La deuxième

étape consiste à comparer les deux classes de modèles – heuristiques (ANC1, ANC2,

ANC3, L&V1, L&V2, L&V3) et jugement linéaire (ML1) – afin d’évaluer si certaines

heuristiques arrivent à mieux performer que le modèle de jugement linéaire. Cette

comparaison est directement en lien avec l’hypothèse H1, c’est-à-dire :

H1 : La performance des heuristiques à la tâche de prévision temporelle sera dans

certains cas supérieure à celle du modèle de jugement linéaire.

La troisième étape consiste à évaluer l’impact des facteurs expérimentaux sur la

performance des modèles. Cette analyse vise à identifier quelles sont les conditions qui

pourraient déterminer l’utilité des stratégies. L’étape trois est en lien avec l’objectif O1,

c’est-à-dire :



Cet objectif est lui-même associé à trois sous-hypothèses :




80







Similarité des modèles. Pour chaque série temporelle, un coefficient de corrélation

Pearson entre les prévisions des modèles est calculé. Plus le coefficient est prêt de un, plus

les prévisions des modèles comparés sont similaires. Le Tableau 9 rapporte le coefficient de

corrélation de Pearson moyen (écart-type) pour l’ensemble des séries temporelles.

Tableau 9

Moyenne (écart-type) des corrélations entre les prévisions des modèles.


ANC1 .74 (.36) 1.00 (.00) .81 (.33) .67 (.45) .42 (.48) .30 (.53)

ANC2

.74 (.36) .51 (.58) .64 (.38) .67 (.33) .34 (.51)

ANC3

.81 (.33) .67 (.45) .42 (.48) .30 (.53)

L&V1

.69 (.36) .30 (.49) .37 (.47)

L&V2

.65 (.29) .41 (.42)

L&V3

.41 (.34)

Notez que, à l’instar de la première simulation, la corrélation moyenne entre ANC1

et ANC3 est de un, ce qui signifie que les prévisions réalisées par ces deux modèles sont

identiques en tout point pour l’ensemble des séries temporelles de l’expérience. Par

conséquent, pour les analyses subséquentes, ces deux modèles seront traités de façon

indifférenciée.

Comparaison des classes de modèles. Une ANOVA à mesures répétées sur la

performance en variable dépendante et le modèle comme facteur répété indique qu’en

moyenne, sur les 32 séries temporelles, aucun modèle ne permet l’atteinte de performance

supérieure aux autres F(5,155) = 2.251, non significatif. On ne peut donc pas rejeter

81

l’hypothèse nulle selon laquelle la performance moyenne des modèles est équivalente. La

moyenne de performance et l’écart-type des modèles sont rapportés dans le Tableau 10.

Tableau 10

PVE moyenne (écart-type) des modèles.


PVE moyenne -.40 (1.05) -.31 (1.60) -.11 (.82) -.10 (.74) .15 (.70) -.05 (.89)

Bien qu’en moyenne, aucun modèle ne performe mieux que les autres, la

performance à chaque série temporelle est analysée. Afin de comparer les classes de

modèles et de vérifier si certains modèles d’heuristiques performent mieux que le modèle

linéaire, la différence entre la performance de chaque modèle d’heuristique et le modèle

linéaire est calculée. Pour chaque série temporelle, une différence positive indique que le

modèle d’heuristique performe mieux que le modèle linéaire. Le Tableau 11 indique la

fréquence de différence positive par heuristique.

Tableau 11

Fréquence de différence positive indiquant une performance supérieure au modèle

linéaire par modèle d’heuristique.

ANC1 ANC2 L&V1 L&V2 L&V3

Fréquence (/32) 13 22 15 12 20

Au total, il existe au moins un modèle d’heuristique qui performe mieux que le

modèle linéaire pour 25 des 32 séries temporelles. Les sept séries temporelles mieux

prédites par le modèle linéaire que par les autres modèles sont les séries 7, 8, 10, 14, 20, 21

et 23 (voir Figure 27). Le modèle le plus performant est identifié par série temporelle. Ils

sont rapportés dans le Tableau 12.

82

Tableau 12

Modèle le plus performant par série temporelle.

ANC1 ANC2 L&V1 L&V2 L&V3 ML

Séries 4, 15

1, 2, 3, 5, 6,

9, 12, 13,

26, 28, 29,

32

11, 16, 17,

18, 19, 22,

24, 25

27, 31 30 7, 8, 10, 14,

20, 21, 23

83

Figure 27. Séries temporelles (noires) pour lesquelles la performance de ML1 excède celle de tous les

modèles d’heuristiques et séries co-évoluant à celles-ci (grises).

0

2

4

6

8

10

12

14

16

18

20


Série 1

Série 2

Série 3

Série 4

Série 5

Série 6

Série 7

Série 8

0

2

4

6

8

10

12

14

16

18

20


Série 1

Série 2

Série 3

Série 4

Série 5

Série 6

Série 7

Série 8

0

2

4

6

8

10

12

14

16

18

20


Série 9

Série 10

Série 11

Série 12

Série 13

Série 14

Série 15

Série 16

0

2

4

6

8

10

12

14

16

18

20


Série 9

Série 10

Série 11

Série 12

Série 13

Série 14

Série 15

Série 16

0

2

4

6

8

10

12

14

16

18

20


Série 17

Série 18

Série 19

Série 20

Série 21

Série 22

Série 23

Série 24

0

2

4

6

8

10

12

14

16

18

20


Série 17

Série 18

Série 19

Série 20

Série 21

Série 22

Série 23

Série 24

0

2

4

6

8

10

12

14

16

18

20


Série 17

Série 18

Série 19

Série 20

Série 21

Série 22

Série 23

Série 24

84

Effet des facteurs expérimentaux sur la performance. Pour toutes les séries

temporelles et les modèles confondus, la moyenne (écart-type) de performance est égale à -

.17 (1.02) telle qu’estimée par la PVE. Notez que bien que la performance moyenne des

modèles est très basse au sein de la présente simulation, les observations sont caractérisées

par une grande variabilité, indiquant que la performance des modèles varie beaucoup d’une

série temporelle à l’autre. Une MANOVA avec la simulation comme facteur fixe et la

performance des modèles comme variable dépendante révèle que la performance des

stratégies à la Simulation 1 est statistiquement supérieure à celle obtenue par les mêmes

modèles lors de la Simulation 2 F(1,54) = 7.601, p < .01. Le Tableau 13 rapporte la

moyenne observée par simulation et par modèle.

Tableau 13

Moyenne (écart-type) de performance des modèles par simulation.


Simulation 1 .89 (.12) .92 (.12) .84 (.21) .83 (.26) .91 (.04) .67 (.87)

Simulation 2 -.40 (1.05) -.31 (1.60) -.11 (.82) -.10 (.73) .15 (.70) -.05 (.89)

Pour estimer l’impact de la qualité des sources d’information sur la performance des

modèles, une série d’analyses de régression est réalisée sur la performance atteinte par

chaque modèle en VD et la force d’association extrinsèque ainsi que l’autocorrélation du

critère comme VIs. Pour mener ces analyses, toutes les formalisations des modèles n’ont

pas été retenues. À l’instar de la première simulation, ce choix est motivé par

l’augmentation des risques d’erreur de type I (c’est-à-dire le rejet erroné de l’hypothèse

nulle) avec l’augmentation du nombre de tests. Ainsi, pour limiter le nombre de tests, seul

un représentant des modèles d’ancrage et ajustement (ANC2) a été retenu. Il s’agit de la

version de l’heuristique qui obtient la meilleure performance de prévision moyenne. De

plus, les deux autres modèles de cette heuristique sont caractérisés par les mêmes sources

d’information que le modèle ANC2. Les trois modèles de limites et vraisemblance ont été

retenus puisqu’ils sont tous caractérisés par des sources d’information distinctes. Le ML1 a

aussi été retenu puisqu’il est le seul représentant du jugement linéaire. Finalement, une

correction Bonferroni a été réalisée pour éviter le gonflement de la probabilité d’erreur de

type I. Le seuil alpha étant fixé à .05 et le nombre de tests effectués étant égal à cinq, le

85

seuil alpha corrigé est égal à .01. Les prémisses de normalité, linéarité et

d’homoscédasticité des résidus ont été vérifiés avec SPSS EXAMINE et SPSS

REGRESSION. Étant donné la valeur extrême de performance du modèle ANC2,

l’observation correspondant à la série temporelle #10 (voir Tableau 8) a été retirée des

analyses. Il en est de même pour l’observation correspondant à la série temporelle #16 du

ML1. Les analyses ont été réalisées avec SPSS REGRESSION. La méthode de sélection

des facteurs se fonde sur un critère d’entrée statistique STEPWISE2. À l’inverse de la

Simulation I, les régressions sur la performance des modèles ANC2, L&V1, L&V2, L&V3

et ML1 indiquent que les R sont tous statistiquement significatifs.

La régression de l’autocorrélation du critère et de la force d’association extrinsèque

sur la performance du modèle ANC2 avec un critère statistique d’entrée inclut les deux

facteurs au sein de l’équation linéaire. Les statistiques relatives à la régression sont

rapportées dans le Tableau 14. Le R est statistiquement significatif F(2,28) = 110.64, p <

.01. Le R2 ajusté de .88 indique qu’environ 88% de la variance de la performance atteinte

par le modèle ANC2 est expliquée par la combinaison linéaire de l’autocorrélation et de la

force d’association extrinsèque. Plus précisément, les coefficients de régression

standardisés indiquent que l’impact de l’autocorrélation du critère sur la performance

( ) du modèle ANC2 est presque six fois plus important que celui de la force

d’association extrinsèque ( ).

Tableau 14

Régression linéaire de l’autocorrélation et de la force d’association extrinsèque sur la

performance du modèle ANC2.

Variable

ANC2

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI) B β

Autocorrélation .929 1.854 .910

Association .267 .122 .415 .156

Origine = -1.15

Moyenne -.06 .45 .62

Écart-type .78 .38 .29 R2 = .888

R2 ajusté = .880

R = .942**

** p < .01

2 Entré à F <= .05, sortie à F >= .10

86

La régression de l’autocorrélation et de la force d’association extrinsèque sur la

performance de L&V1 avec un critère statistique d’entrée incorpore les deux facteurs au

sein de l’équation linéaire. Les statistiques relatives à la régression sont rapportées dans le

Tableau 15. Le R est statistiquement significatif F(2,28) = 79.11, p < .01. Le R2 ajusté de

.84 indique qu’environ 84% de la variance de la performance atteinte par le modèle L&V1

est expliquée par la combinaison linéaire de l’autocorrélation et de la force d’association

extrinsèque. Plus précisément, les coefficients de régression standardisés indiquent que

l’impact de l’autocorrélation sur la performance du modèle L&V1 est environ trois fois

plus important que celui de la force d’association extrinsèque.

Tableau 15


performance du modèle L&V1.

Variable

L&V1

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI) B β


Association .385 .122 .800 .283

Origine = -1.439

Moyenne -.13 .45 .62

Écart-type .82 .38 .29 R2 = .850

R2 ajusté = .839

R = .922**

** p < .01


performance du modèle L&V2 avec un critère statistique d’entrée inclut les deux facteurs

au sein de l’équation linéaire. Les statistiques relatives à la régression sont rapportées dans

le Tableau 16. Le R est statistiquement significatif F(2,28) = 110.006, p < .01. Le R2 ajusté

de .88 indique qu’environ 88% de la variance de la performance atteinte par le modèle

L&V2 est expliquée par la combinaison linéaire de l’autocorrélation et de la force

d’association extrinsèque. Plus précisément, les coefficients de régression standardisés

indiquent que l’impact de l’autocorrélation sur la performance est presque cinq fois plus

important que celui de la force d’association extrinsèque.

87

Tableau 16


performance du modèle L&V2.

Variable

L&V2

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI) B β


Association .293 .122 .469 .183

Origine = -1.192

Moyenne -.11 .45 .62

Écart-type .75 .38 .29 R2 = .887

R2 ajusté = .879

R = .942**

** p < .01


performance du modèle L&V3 avec un critère statistique d’entrée inclut seulement le

facteur autocorrélation au sein du modèle final. Les statistiques relatives à la régression

sont rapportées dans le Tableau 17. Le R est statistiquement significatif F(2,29) = 23.876, p

< .01. Le R2

ajusté de .43 indique qu’environ 43% de la variance de la performance atteinte

par le modèle L&V3 est expliquée par l’autocorrélation du critère. Le rejet de la force

d’association extrinsèque comme prédicteur au sein de la régression indique que la

contribution de ce facteur dans l’explication de la variance de la performance du modèle

L&V3 est négligeable.

Tableau 17

Régression linéaire de l’autocorrélation sur la performance du modèle L&V3.

Variable

L&V3

(VD)

Autocorrélation

(SI) (VI)

B β


Origine = -.427

Moyenne .12 .45

Écart-type .70 .38 R2 = .452

R2 ajusté = .433

R = .672**

** p < .01


performance de ML1 avec un critère statistique d’entrée incorpore les deux facteurs au sein

de l’équation linéaire. Les statistiques relatives à la régression sont rapportées dans le

Tableau 18. Le R est statistiquement significatif F(2,28) = 19.279, p < .01. Le R2 ajusté de

.55 indique qu’environ 55% de la variance de la performance atteinte par le ML1 est

88

expliquée par la combinaison linéaire de l’autocorrélation et de la force d’association

extrinsèque. Plus précisément, les coefficients de régression standardisés indiquent que

l’impact de l’autocorrélation sur la performance de ML1 est environ deux fois plus

important que celui de la force d’association extrinsèque.

Tableau 18


performance de ML1.

Variable

ML1

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI) B β

Autocorrélation 1.337 .663

Association .122 .888 .328

Origine = -1.143

Moyenne -.11 .45 .62

Écart-type .75 .38 .29 R2 = .579

R2 ajusté = .549

R = .761**

** p < .01

Finalement, le Tableau 19 résume les coefficients observés par modèle suite aux

analyses de régression.

Tableau 19

Résumé des coefficients de régression standardisés par source d’information et modèles.

Source ANC2 L&V1 L&V2 L&V3 ML1

Intrinsèque .910 .844 .902 .672 .663

Extrinsèque .156 .283 .183 0 .328

Autres analyses. Afin d’évaluer l’importance relative des sources d’information,

une analyse des coefficients de régression standardisés du ML1 a été réalisée. L’analyse

consiste à comparer la valeur moyenne des coefficients attribués aux indices de source

intrinsèque à ceux de source extrinsèque. La valeur absolue des coefficients est utilisée

puisque le signe ne qualifie pas l’importance d’un coefficient, mais plutôt sa direction. Un

test-t pour échantillons pairés révèle qu’on ne peut pas rejeter l’hypothèse nulle selon

laquelle la moyenne des coefficients standardisés absolus des indices de source intrinsèque

(m = .70, ET = 1.06) est égale à la moyenne des coefficients standardisés absolus des

indices de source extrinsèque (m = .50, ET = .63) t(31) = 1.18, non significatif.

89

Comparativement à la première simulation, les conditions de la deuxième

simulation mènent à des prévisions dissimilaires entre les modèles formalisés.

Globalement, la variété des propriétés qui caractérisent les séries temporelles génère une

plus grande variabilité en termes de prévisions, mais aussi en termes de performance. En

effet, les faibles moyennes de coefficients de corrélation qui estime l’association linéaire

entre les prévisions des modèles indiquent que dans l'ensemble, les prévisions faites par

chacun des modèles sont différentes l’une de l’autre. Ce résultat suggère que les conditions

de simulation permettront de bien discriminer les modèles en termes de performance. Par

contre, étonnamment et contrairement à cette observation générale, les modèles ANC1 et

ANC3 de l'heuristique d'ancrage et ajustement génèrent encore une fois des prévisions

complètement identiques pour l'ensemble des séries temporelles de la présente simulation.

Ce résultat indique que, bien qu’il existe une différence théorique entre ces deux modèles

de l’heuristique d’ancrage et ajustement (voir Andreassen, 1990; Andreassen & Kraus,

1990; Lawrence & O’Connor, 1995) l’approche de modélisation actuelle a du mal, dans les

conditions de la thèse, à discriminer leur comportement. Néanmoins, étant donné que ces

deux versions de modèles représentent l’heuristique d’ancrage et ajustement, elles sont

traitées de façon indifférenciée.


cas supérieur à celle du modèle de jugement linéaire.

En moyenne, la performance observée des modèles lors de cette simulation est

nettement inférieure à celle obtenue lors de la première. Toutefois, malgré la chute de

performance générale observée, les modèles d’heuristiques arrivent encore à mieux

performer que le modèle de jugement linéaire dans la majorité des cas. De plus, tout

comme dans la Simulation 1, l’utilisation d’un modèle unique ne permet pas l’atteinte de la

meilleure performance pour l’ensemble des séries temporelles de la simulation. Ce résultat

constitue un appui important au concept de rationalité écologique et du coffre à outils

cognitif (Gigerenzer & Selten, 2001; Gigerenzer et al., 1999; Strum, 2011).



90

Les analyses montrent que dans l’ensemble, la performance des modèles est affectée

par la variation de la qualité des sources d’information. Les niveaux élevés de variance

expliquée par les régressions (généralement autour de 88%) indiquent également que les

facteurs manipulés au sein de la thèse sont critiques pour la prévision des séries

temporelles. Particulièrement, la qualité des indices de source intrinsèque semble être un

facteur clé. En effet, les coefficients des régressions des facteurs sur la performance des

modèles indiquent que pour l’ensemble des stratégies modélisées, la performance est

davantage déterminée par la qualité de la source intrinsèque comparativement à la source

extrinsèque. L’analyse des coefficients du ML1 suggère que cela ne peut pas être

uniquement causé par la plus grande qualité des indices de source intrinsèque relativement

aux indices de source extrinsèque puisque aucune différence statistiquement significative

n’est observée dans la pondération de ceux-ci. Cet effet peut toutefois s’expliquer par le fait

que l’ensemble des stratégies modélisées emploient la source intrinsèque pour fonder leur

prévision.

Des analyses supplémentaires ont été réalisées en combinant les observations des

deux simulations. L’objectif de ces analyses est de vérifier quelles conditions favorisent un

gain de performance des modèles d’heuristique par rapport au modèle de jugement linéaire.

Alors que les données ont jusqu’à présent été analysées dans le but de comprendre

comment les conditions expérimentales font varier la performance des modèles, ces

analyses concernent davantage comment ces conditions les discriminent, c’est-à-dire dans

quelle mesure la variation de la qualité des indices de source intrinsèque et extrinsèque

mène à des patrons de performance distincts entre les modèles. Les données des deux

simulations sont combinées de façon à augmenter la puissance statistique et à pouvoir

comparer directement l’influence des trois facteurs au sein d’une même analyse.

Pour estimer l’impact de la qualité des sources d’information sur le gain de

performance des modèles d’heuristique comparativement au ML1, une série d’analyses de

régression est réalisée sur le gain de performance atteint par chaque modèle d’heuristique

en VD et la force d’association extrinsèque, le nombre d’indices extrinsèques et

l’autocorrélation comme VIs. Pour mener ces analyses, tous les modèles sont retenus à

l’exception du modèle ANC3 qui a un comportement identique à ANC1. Les prémisses de

91

normalité, linéarité et d’homoscédasticité des résidus ont été vérifiés avec SPSS EXAMINE

et SPSS REGRESSION. Les analyses ont été réalisées avec SPSS REGRESSION. La

méthode de sélection des facteurs est ENTER, ce qui force tous les facteurs à être

considérés par le modèle. L’objectif de ce critère d’entrée est de pouvoir comparer les bêtas

de chacun des facteurs, significatif ou non.

Gain de performance ANC1. Les statistiques relatives à la régression de

l’autocorrélation, du nombre d’indices extrinsèques et de la force d’association extrinsèque

sur le gain de performance du modèle ANC1 sont rapportées dans le Tableau 20. Le R est

statistiquement significatif F(3,53) = 5.29, p = .003. Le R2 ajusté de .20 indique qu’environ

20% de la variance du gain de performance atteint par le modèle ANC1 est expliquée par la

combinaison linéaire des trois facteurs. Plus précisément, les coefficients de régression

standardisés indiquent que l’impact de l’autocorrélation sur le gain de performance du

modèle ANC1 est le seul qui est statistiquement significatif (p < .001). Plus

l’autocorrélation est élevée, plus le modèle ANC1 obtient un gain de performance

important comparativement au modèle de jugement linéaire ML1.

Tableau 20

Régression linéaire de l’autocorrélation, du nombre d’indices et de la force d’association

extrinsèque sur le gain de performance du modèle ANC1.

Variable

ANC1

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI)

Nombre

d'indices

(SE) (VI) B β

Autocorrélation .440

.767 .522

Association -.075 .286

-.469 -.214

Nombre d'indices -.078 -.336 -.162

.025 .063

Origine = -.467

Moyenne -.12 .664 .69 6.41

Écart-type .56 .38 .26 1.43 R2 = .241

R2 ajusté = .196

R = .491*

* p = .003

Gain de performance ANC2. Les statistiques relatives à la régression de


sur le gain de performance du modèle ANC2 sont rapportées dans le Tableau 21. Le R est

92

statistiquement significatif F(3,53) = 3.102, p = .035. Le R2 ajusté de .11 indique

qu’environ 11% de la variance du gain de performance atteint par le modèle ANC2 est

expliquée par la combinaison linéaire des trois facteurs. Plus précisément, les coefficients

de régression standardisés indiquent que l’impact de l’autocorrélation et de la force

d’association sur le gain de performance du modèle ANC2 sont les deux facteurs qui sont

statistiquement significatifs (p =.018 et p = .022 respectivement). À l’instar du modèle

ANC1, plus l’autocorrélation est élevée, plus le modèle ANC2 obtient un gain de

performance important comparativement au modèle de jugement linéaire ML1. De plus,

plus la force d’association extrinsèque est élevée, moins le gain de performance du modèle

ANC2 est élevé.

Tableau 21


extrinsèque sur le gain de performance du modèle ANC2.

Variable

ANC2

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI)

Nombre

d'indices

(SE) (VI) B β


.463 .348


-.636 -.321

Nombre d'indices .034 -.336 -.162

.035 .099

Origine = -.059

Moyenne .038 .664 .69 6.41

Écart-type .51 .38 .26 1.43 R2 = .157

R2 ajusté = .106

R = .396*

* p = .035

Gain de performance L&V1. Les statistiques relatives à la régression de


sur le gain de performance de L&V1 sont rapportées dans le Tableau 22. Le R est non-

statistiquement significatif F(3,53) = 1.038, non significatif. Le R2 ajusté de .02 indique que

seulement 2% de la variance du gain de performance atteint par le modèle L&V1 est

expliquée par la combinaison linéaire des trois facteurs. Étant donnée la très faible

proportion de variance expliquée, l’effet d’aucun des facteurs sur le gain de performance du

modèle L&V1 n’est statistiquement significatif.

93

Tableau 22


extrinsèque sur le gain de performance du modèle L&V1.

Variable

L&V1

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI)

Nombre

d'indices

(SE) (VI) B β


.382 .258


-.258 -.117


.024 .061

Origine = -.267

Moyenne -.035 .664 .69 6.41

Écart-type .57 .38 .26 1.43 R2 = .059

R2 ajusté = .002

R = .242

N.S.



sur le gain de performance du modèle L&V2 sont rapportées dans le Tableau 23. Le R est

statistiquement non significatif F(3,53) = 1.117, N.S. Le R2 ajusté de .01 indique que

seulement 1% de la variance du gain de performance atteint par le modèle L&V2 est

expliquée par la combinaison linéaire des trois facteurs. L’effet d’aucun des facteurs sur le

gain de performance du modèle L&V2 n’est statistiquement significatif.

Tableau 23



Variable

L&V2

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI)

Nombre

d'indices

(SE) (VI) B β


.313. .224


-.417 -.200


.013 .034

Origine = -.034

Moyenne -.030 .664 .69 6.41

Écart-type .54 .38 .26 1.43 R2 = .063

R2 ajusté = .007

R = .251

N.S.

94



sur le gain de performance du modèle L&V3 sont rapportées dans le Tableau 24. Le R est

statistiquement significatif F(3,53) = 3.176, p = .032. Le R2 ajusté de .11 indique

qu’environ 11% de la variance du gain de performance atteint par le modèle L&V3 est

expliquée par la combinaison linéaire des trois facteurs. L’analyse par facteur indique que

seule la force d’association extrinsèque est significativement associée au gain de

performance du modèle L&V3 (p = .007). En effet, plus la force d’association extrinsèque

est élevée, moins le gain de performance du modèle L&V3 est élevé.

Tableau 24



Variable

L&V3

(VD)

Autocorrélation

(SI) (VI)

Association

(SE) (VI)

Nombre

d'indices

(SE) (VI) B β

Autocorrélation -.148

-.043 -.025


-.971 -.383

Nombre d'indices .111 -.336 -.162

.019 .041

Origine = .716

Moyenne .140 .664 .69 6.41

Écart-type .66 .38 .26 1.43 R2 = .160

R2 ajusté = .110

R = .400*

* p = .032

DISCUSSION

Alors que des résultats antérieurs ont déjà démontré que certaines heuristiques

permettaient l’atteinte de performances au moins équivalentes au jugement linéaire (par

exemple, Borges et al., 1999; Bolger & Harvey, 1993; Boyd, 2001; Lawrence & O’Connor,

1995; Ying Luo, 2013), les conditions qui favorisaient ce phénomène demeuraient floues et

sans cadre interprétatif clair (Todd & Gigerenzer, 2007), particulièrement dans un contexte

de prévision de séries temporelles. Les analyses présentées dans cette section permettent

d’estimer l’effet des facteurs manipulés (autocorrélation du critère, nombre d’indices

extrinsèques et force d’association extrinsèque) sur le gain de performance des modèles

95

d’heuristiques par rapport au modèle de jugement linéaire. L’analyse de la signification

statistique des régressions soulève que seul le gain de performance de trois modèles

d’heuristiques semble modulé de façon significative par la combinaison linéaire des trois

facteurs. Ces trois modèles sont ANC1, ANC2 et L&V3. Pour ces modèles, la proportion

de variance expliquée du gain de performance par les trois facteurs manipulés varie entre

10% et 20%. Cela ne signifie pas que les autres modèles ne représentent pas des stratégies

potentiellement meilleures que le jugement linéaire, mais seulement que les conditions sous

lesquelles le gain de performance varie ne sont pas manipulées dans le contexte de la

présente thèse.

L’analyse des facteurs mène à plusieurs observations intéressantes. En premier lieu,

l’effet du nombre d’indices extrinsèques sur le gain de performance des modèles

d’heuristiques n’est jamais significatif. Cette observation indique que sous les conditions de

la thèse, le nombre d’indices extrinsèques n’était pas un facteur discriminant de

performance entre les heuristiques et le jugement linéaire. Ce résultat est particulièrement

intéressant puisqu’il a été démontré dans d’autres contextes que l’augmentation du nombre

d’indices menait à un abandon d’une règle de jugement linéaire par les participants

(Hogarth & Karelaia, 2008). Puisque le nombre d’indices ne serait pas lié à un gain de

performance par rapport au jugement linéaire, cela indique que la cause de l’abandon du

modèle linéaire, selon un cadre d’interprétation coûts/bénéfices (voir Beach & Mitchell,

1978; Christensen-Szalanski, 1978; Payne et al., 1988, 1993; Smith & Walker, 1993), serait

probablement davantage liée aux coûts en termes d’efforts cognitifs qu’aux bénéfices en

termes de gain de performance. Les résultats observés dans la présente thèse sont donc

cohérants avec l’interprétation généralement avancée dans la littérature. Étant donné que le

modèle de jugement linéaire a la capacité d’intégrer des informations provenant d’une

multitude d’indices extrinsèques et que la majorité des heuristiques ne le pouvaient pas,

cela indique que le modèle de jugement linéaire ne bénéficiait pas de cet « avantage » sous

les conditions de la thèse. Cette observation s’explique probablement par le fait que la

validité des indices extrinsèques n’est aucunement associée à leur quantité. En effet, ce

n’est pas parce que le nombre d’indices augmente que leur validité est meilleure.

96

Une seconde observation en lien avec les facteurs expérimentaux montre que la

force d’association extrinsèque (directement associée à la validité des indices extrinsèques)

est négativement associée au gain de performance des modèles d’heuristique pour

l’ensemble des régressions exécutées (qu’elles soient significatives ou non). Ces résultats

suggèrent que le modèle de jugement linéaire est avantagé comparativement à l’ensemble

des modèles d’heuristiques lorsque les indices extrinsèques augmentent en validité.

Conformément à l’hypothèse H1a, cela n’est pas une surprise par rapport à l’heuristique

d’ancrage et ajustement (Lawrence & O’Connor, 1995; Bolger & Harvey, 1993) et,

conformément à l’hypothèse H1b, au modèle L&V1 (Becker & Leopold-Wildburger, 1996)

de limites et vraisemblance, car ces derniers n’utilisent aucunement les indices de sources

extrinsèques pour faire leurs prévisions. Cela est par contre plus surprenant, et en

opposition avec l’hypothèse H1c, en ce qui concerne les modèles L&V2 et L&V3 de

limites et vraisemblance puisque ces derniers ont également la capacité d’utiliser les indices

de source extrinsèque pour faire leurs prévisions (Becker et al., 2005; 2007). Toutefois, la

nature de la pondération des indices est distincte entre l’heuristique de limites et

vraisemblance et le modèle de jugement linéaire. Il est donc possible que la pondération

linéaire de ML1 soit plus efficace, menant ainsi à une augmentation de la performance

comparativement à L&V2 et L&V3. Une autre explication plausible de ce résultat est

l’utilisation d’indices « extraits » des séries temporelles par L&V2 et L&V3 plutôt que

l’utilisation des valeurs explicites de ces séries comme le fait ML1 (Tucker, 1964). En

effet, il est possible que la force d’association extrinsèque des séries temporelles ne soit pas

liée à la validité des indices extraits par l’heuristique de limites et vraisemblance.

Davantage d’études variant systématiquement la validité des indices extraits et explicites

seraient nécessaires afin de vérifier si cette explication est bonne.

En ce qui concerne l’autocorrélation du critère, conformément à l’hypothèse H1a,

les résultats suggèrent que le gain de performance des deux modèles d’ancrage et

ajustement sont significativement affectés par celle-ci. En effet, plus le critère est

autocorrélé, plus le gain de performance des modèles ANC1 et ANC2 est élevé. Cette

observation n’est pas complètement surprenante puisque l’heuristique d’ancrage et

ajustement mise uniquement sur la source d’information intrinsèque pour faire ses

prévisions. Toutefois, le modèle de jugement linéaire utilise également cette source

97

d’information. Ainsi, l’avantage conféré par une autocorrélation élevée à l’heuristique

d’ancrage et ajustement comparativement au modèle de jugement linéaire n’est pas si

évident a priori. Une explication possible de ce résultat réside donc dans la nature de

l’utilisation des indices intrinsèques. En effet, l’heuristique d’ancrage et ajustement telle

que décrite par Lawrence et O’Connor (1995) ainsi que Bolger et Harvey (1993) utilise la

dernière valeur observée pour réaliser sa prévision. Inversement, le modèle de jugement

linéaire base son estimation sur l’ensemble des données observées jusqu’à présent (Tucker,

1964). Dans le contexte de la thèse, la manipulation de l’autocorrélation concerne

précisément la corrélation du critère avec lui-même sur la dernière valeur observée et non

pas l’ensemble des valeurs passées. Ce résultat sera davantage discuté dans les sections

subséquentes.

Globalement, ces résultats empiriques indiquent que les normes de la rationalité ne

devraient pas être valides indépendamment du contexte dans lequel elles sont appliquées

(Sturm, 2012). Particulièrement, ils montrent que la qualité des indices intrinsèques et la

qualité des indices extrinsèques (Harvey, 2007) permettent en partie de décrire le contexte

dans lequel certaines heuristiques sont adaptées pour la prévision de séries temporelles. Par

contre, la proportion de variance expliquée demeure somme toute assez faible (entre 10% et

20%) pour les modèles significatifs et l’origine du gain de performance de plusieurs

modèles d’heuristiques demeure inexpliquée. Cela suggère que davantage d’études sont

nécessaires pour mieux cartographier les conditions qui favorisent une bonne performance

des heuristiques comparativement au modèle de jugement linéaire.

Discussion du Chapitre II

L’objectif de ce chapitre était de développer et simuler des stratégies cognitives de

prévision de séries temporelles dans le but de comparer leur performance sous différentes

conditions. Cette méthode est similaire à celle employée par plusieurs auteurs qui cherchent

à comparer différents modèles de jugement et de prise de décision (Bergert & Nosofsky,

2007; Bolger & Harvey, 1993; Shanteau & Thomas, 2000). Les stratégies modélisées

appartenaient à deux classes distinctes : c’est-à-dire les heuristiques et le jugement linéaire.

Ces deux classes ont dominé la recherche sur le jugement et la prise de décision pour

98

plusieurs décennies (Karelaia & Hogarth, 2008). Les heuristiques étudiées étaient celles

d’ancrage et ajustement (par exemple, Goodwin & Wright, 1994; Harvey, 2007; Lawrence

et al., 2006; Lawrence & O’Connor, 1995; Reimers & Harvey, 2011) et limites et

vraisemblance (par exemple, Becker & Leopold-Wildburger, 1996; Becker et al., 2007). Le

modèle de jugement linéaire était le modèle lentille (ML; Anderson, 1981; Brehmer, 1994;

Hammond, 1996). Finalement, les conditions évaluées concernaient la qualité de sources

d’information, c’est-à-dire la source intrinsèque et la source extrinsèque (Harvey, 2007).


cas supérieure à celle du modèle de jugement linéaire.

Les résultats obtenus dans les deux simulations appuient l’hypothèse H1. La

démonstration de l’atteinte de performance supérieure par les heuristiques, particulièrement

les heuristiques non compensatoires, comparativement au modèle linéaire normatif jouissait

déjà d’un certain niveau d’appuis empiriques (Gigerenzer & Goldstein, 1996). Toutefois,

certains auteurs critiquaient le caractère idiosyncratique de la démonstration et souhaitaient

une évaluation plus systématique de la performance des modèles de jugement (Bröder,

2003; Lipshitz, 2000). Entre autres, la prévision de séries temporelles constitue une tâche

pour laquelle la démonstration était toujours fragmentaire (par exemple, Becker et al.,

2000; 2004; 2007) et qui demande davantage d’exploration (Harvey, 2007). Les résultats

obtenus dans les deux simulations montrent que tous les modèles d’heuristiques ont la

capacité de mieux performer que le modèle de jugement linéaire. Comparativement à

Becker et ses collègues (2000; 2004; 2007), la présente étude le démontre au-delà de

l’heuristique de limites et vraisemblance, en incluant également l’heuristique d’ancrage et

ajustement, et permet de généraliser à une grande variété de séries temporelles. Cette

observation constitue un appui empirique supplémentaire de la capacité des heuristiques à

bien performer comparativement au jugement linéaire.



Au-delà de cette démonstration, une observation critique associée aux deux

simulations est qu’aucune stratégie unique (linéaire ou heuristique) n’est la plus

99

performante pour la prévision de l’ensemble des séries temporelles. Ce résultat est

fondamental puisqu’il démontre que le modèle de jugement linéaire ne représente pas une

norme absolue de jugement optimal dans ce contexte et que l’utilisation de plusieurs

stratégies, et donc la nécessité d’adapter ses stratégies, est critique pour l’atteinte de

performance optimale. Le principe du coffre à outils cognitif suggère que la force des

heuristiques repose sur l’aspect varié, modulaire et simple de ces stratégies, qui peuvent

être utilisées dans différents contextes de manière adaptée, individuellement ou en

combinaison (Gigerenzer & Selten, 2001; Gigerenzer et al., 1999). Les simulations

effectuées dans la présente thèse démontrent la possibilité et la force potentielle d’une telle

approche dans un contexte de prévision de séries temporelles complexes. Alors que les

travaux antérieurs dans ce contexte démontraient bien que certaines heuristiques

permettaient l’atteinte de performances respectables (par exemple, Becker et al., 2000;

2004; 2007), il s’agit de la première démonstration de la pertinence d’un coffre à outil

cognitif dans ce contexte.

Comme le mentionnent Rieskamp et Otto (2006), l’utilisation de plusieurs stratégies

de manière adaptée requiert toutefois un mécanisme de sélection de stratégie.

Essentiellement, les modèles associés à ce mécanisme proposent que les stratégies soient

sélectionnées sur la base d’un compromis entre les coûts (c’est-à-dire, l’effort cognitif

requis pour le traitement de l’information) et les bénéfices (c’est-à-dire, la performance

atteinte par la stratégie) (Payne et al., 1993; Rieskamp & Otto, 2006; Smith & Walker,

1993). L’étude de la performance des stratégies de jugement en lien avec les

caractéristiques des séries temporelles est donc d’une importance capitale pour comprendre

la sélection des stratégies dans ce contexte (Dieckmann & Rieskamp, 2007; Rieskamp &

Otto, 2006; Rieskamp & Reimer, 2007). Les simulations effectuées dans le cadre de la

thèse visaient donc à étudier le rôle de deux facteurs critiques pour la performance des

stratégies, c’est-à-dire la qualité des sources d’information intrinsèque et extrinsèque

(Harvey, 2007).

La première simulation donne toutefois très peu d’indices sur la nature des

conditions susceptibles d’affecter la performance des stratégies utilisées. En effet, il semble

que la qualité de la source extrinsèque (manipulée au sein de la première simulation)

100

n’affecte pas la performance des stratégies malgré l’importance présumée de cette source

dans l’utilisation de certaines heuristiques (Harvey, 2007). De plus, l’ensemble des

stratégies arrivent à très bien prédire l’évolution des séries temporelles. Cela s’expliquerait

notamment par le caractère compensatoire de certaines stratégies. Une stratégie est

compensatoire lorsqu’un jugement basé sur un indice peut être fait à l’aide d’un autre

indice sans perte de performance. À l’inverse une stratégie non compensatoire ne peut pas

utiliser un autre indice sans diminuer sa performance (Elrod et al., 2005; Payne et al.,

1993). Ainsi dans le contexte de la première simulation, toutes les stratégies non

compensatoires utilisaient seulement les indices intrinsèques et toutes les stratégies

compensatoires ont également la capacité de les utiliser. Conséquemment, puisque toutes

les stratégies ont la capacité d’utiliser les indices intrinsèques, la variation de la qualité des

indices de la source extrinsèque n’a pas eu d’impact sur leur performance. Les

performances des modèles étaient donc toutes très élevées.

La manipulation de la qualité des deux sources d’information lors de la deuxième

simulation permet d’appuyer davantage cette interprétation puisqu’elle mène à des

variations de performance pour l’ensemble des stratégies modélisées. Particulièrement, les

coefficients des régressions sur la performance des modèles de la deuxième simulation

suggèrent que la performance des stratégies non compensatoires sera fortement dégradée

avec la diminution de la qualité de la source intrinsèque alors que celle des stratégies

compensatoires le sera moins, ce qui est cohérent.

Considérées ensemble, les simulations 1 et 2 indiquent que des heuristiques simples

surpassent fréquemment un modèle complexe de jugement linéaire. Certains pourraient

argumenter que les heuristiques y arrivent parce que les séries temporelles à prédire sont

simples. Toutefois, la qualité générale relativement faible des prévisions, particulièrement

au sein de la deuxième simulation, indique que ce n’est pas le cas. Il est possible toutefois

que le modèle de jugement linéaire jouisse d’une moins grande flexibilité que les

heuristiques, ce qui le pénaliserait par rapport à ces dernières. En effet, le modèle de

jugement linéaire utilise l’ensemble des observations passées pour estimer une association

linéaire entre un indice et un critère. Les heuristiques, quant à elles, n’utilisent qu’un sous-

ensemble des données. Ainsi, si la relation entre les indices et le critère change dans le

101

temps, la règle de jugement linéaire verra la précision de ses prévisions diminuées

(Clements & Hendry, 2002; Lewis, 1989; Stekler, 2007). À l’inverse, la performance des

heuristiques n’en sera pas affectée. Dans un environnement dynamique complexe tel que

ceux étudiés dans la thèse, ces changements dans la nature de la relation entre les variables

sont fréquents (Seifert & Hadida, 2013), ainsi le caractère flexible des heuristiques

pourraient permettre l’atteinte de performance surpassant celle du modèle de jugement

linéaire. Certains auteurs mentionnent d’ailleurs que des modifications dans la nature des

relations entre les variables pourraient négativement affecter la performance de modèles

normatifs (Lewis, 1989; Stekler, 2007). Le jugement linéaire suppose également que la

relation entre les indices et critères est bien représentée par une droite monotone linéaire.

Toutefois, comme certains auteurs le mentionnent, cette prémisse constitue une contrainte

souvent non nécessaire (Dougherty & Thomas, 2012). En effet, selon ces auteurs,

l’utilisation de modèles plus simples, abandonnant la prémisse de linéarité et ne conservant

que celle de monotonie, permet généralement un jugement plus robuste au sein

d’environnement hautement non linéaire.

Au-delà de la performance des stratégies, les résultats des simulations ont permis

d’étudier quelles conditions favorisent un gain de performance des modèles d’heuristiques

par rapport au modèle de jugement linéaire. Ces analyses démontrent que de manière

générale, la force d’association extrinsèque serait négativement associée au gain de

performance des heuristiques alors qu’à l’inverse, l’autocorrélation serait positivement

associée au gain de performance de certaines heuristiques. Le nombre d’indices

extrinsèques, quant à lui, ne serait pas un facteur déterminant du gain de performance des

heuristiques modélisées dans le contexte de la thèse. Les raisons qui expliquent ces gains

sont toutefois plus nébuleuses. Deux explications complémentaires nécessiteraient

davantage de recherches. Premièrement, la nature des indices pourraient potentiellement

expliquer une partie des résultats observés. En effet, certains indices sont explicitement

disponibles dans l’environnement alors que d’autres sont extraits, c’est-à-dire qu’ils

résultent d’une transformation quelconque de l’information (par exemple, la tendance de la

série temporelle doit être extraite de la combinaison des observations individuelles). Les

effets différentiels observés entre les modèles utilisant des indices extraits par rapport à

ceux utilisant des indices explicites portent à croire que ce facteur pourrait avoir un impact

102

sur le gain de performance. Deuxièmement, la nature de l’utilisation des indices pourrait

aussi expliquer une partie des résultats. C’est le cas, par exemple, du modèle L&V3 qui est

négativement associé à la force d’association extrinsèque. Ce résultat est étonnant puisque

ce modèle a techniquement la capacité d’intégrer des informations d’origine extrinsèque

pour réaliser ses prévisions, tout comme le modèle linéaire. Par contre, la nature de

l’intégration des indices entre les deux stratégies est différente et pourrait expliquer l’effet

observé.

Certaines limites associées aux simulations présentées doivent toutefois nuancer

l’interprétation des résultats. Une limite potentielle est le caractère artificiel des séries

temporelles étudiées. Il est vrai que les séries temporelles utilisées ne visent pas à

reproduire les caractéristiques des séries temporelles « naturelles ». Ces dernières sont en

effet caractérisées, en moyenne, par certaines propriétés telles qu’une légère pente positive

et un niveau modéré d’autocorrélation (Harvey, 2007). Toutefois, l’objectif de la présente

thèse est de varier systématiquement certaines propriétés des séries temporelles pour

comprendre leur impact sur la performance des stratégies. Elle ne s’intéresse pas en soi

directement à la performance des stratégies. En d’autres mots, la thèse ne cherche pas à

évaluer si les stratégies sont performantes de façon absolue, mais plutôt de façon relative

par rapport au modèle de jugement linéaire.

Une autre limite concerne les choix dans la formalisation des stratégies. En effet,

plusieurs paramètres sont sujets à interprétation lors de la formalisation des stratégies de

jugement. C’est le cas, par exemple, de la stratégie d’ancrage et ajustement. Bien que le

concept d’ancrage et ajustement soit bien défini, son opérationnalisation peut susciter des

choix qui peuvent sembler arbitraires. Quelle est la référence utilisée pour constituer

l’ancre? Comment évaluer la valeur et la direction de l’ajustement? Pour mitiger cette

limite, plusieurs versions de chaque heuristique ont été formalisées. De plus, ces versions

sont calquées de la littérature et bénéficient d’appuis empiriques (voir Anderson, 1981;

Becker & Leopold-Wildburger, 1996; Becker et al., 2007; Brehmer, 1994; Goodwin &

Wright, 1994; Hammond, 1996; Harvey, 2007; Lawrence et al., 2006; Lawrence &

O’Connor, 1995; Reimers & Harvey, 2011).

103

En conclusion, malgré certaines limites, les résultats des simulations permettent de

se prononcer quant à la possibilité d’une approche écologique de la rationalité. Ils

démontrent que le choix adapté de stratégies de jugement cognitivement raisonnables dans

un contexte de prévision de séries temporelles (l’utilisation de la plupart de ces stratégies

par des humains a été démontrée lors d’études antérieures) peut théoriquement mener à une

performance supérieure à celle du modèle linéaire normatif. Les analyses révèlent

également une partie des facteurs responsables du gain de performance de certaines

heuristiques par rapport au jugement linéaire. C’est le cas notamment de l’autocorrélation

de la série temporelle critère et de la force d’association extrinsèque. Les résultats

soulignent aussi que le nombre d’indices extrinsèques ne serait pas un facteur critique dans

la différenciation des modèles, malgré que ce facteur soit typiquement associé à la sélection

ou l’abandon d’une règle de jugement linéaire chez les individus faisant des tâches de

prévision. Toutefois, bien que les simulations réalisées dans ce chapitre démontrent la

plausibilité de l’approche de rationalité écologique, elle ne démontre en rien l’adoption de

cette approche par les individus. Le Chapitre III étudie donc dans quelle mesure les

humains adhèrent à une rationalité écologique.

105

CHAPITRE III

PREVISION DE SÉRIES TEMPORELLES : HUMAIN, STRATÉGIE

ET ENVIRONNEMENT

106

Le principe de rationalité écologique postule notamment que les individus adaptent

leur stratégie en fonction du contexte environnemental, et que cette adaptation permet

l’atteinte de performance supérieure à celle qui serait obtenue s’ils appliquaient le modèle

normatif rationnel (Dieckmann & Rieskamp, 2007; Rieskamp & Otto, 2006; Rieskamp &

Reimer, 2007). Ce phénomène manque toutefois d’appuis empiriques, particulièrement

dans un contexte de prévision de séries temporelles, et demeure ainsi spéculatif (Bröder,

2003; Harvey, 2007). Premièrement, aucune étude ne montre un changement de stratégie

du même participant en fonction des caractéristiques des séries temporelles à prédire. Bien

qu’il ait été démontré dans différentes études que les individus se comportent comme s’ils

utilisaient une stratégie d’ancrage et ajustement (Andreassen, 1990; Andreassen & Kraus,

1990; Harvey, 1988; Lawrence & O’Connor, 1992) ou celle de limites et vraisemblance

(Becker & Leopold-Wildburger, 1996; Becker et al., 2007) ou de jugement linéaire

(Bisantz et al., 2000), aucune étude n’a permis de comparer directement la représentativité

de ces stratégies par rapport au comportement humain. Pourtant, les chercheurs soulignent

l’aspect crucial de la comparaison de plusieurs modèles de stratégies pour l’étude du

comportement humain dans ce contexte (Bröder, 2003; Gigerenzer & Gaissmaier, 2011).

Une telle comparaison nécessiterait également un devis expérimental intra-participant

(Bröder, 2003; Payne et al., 1988). Deuxièmement, la démonstration computationnelle de la

plausibilité de la rationalité écologique réalisée dans certaines études (par exemple, Becker

& Leopold-Wildburger, 1996; présente thèse, Chapitre II) ne signifie pas que les humains y

adhèrent (Bröder, 2003). Ainsi, deux lacunes actuelles en lien avec la rationalité écologique

dans un contexte de prévision de séries temporelles subsistent : c’est-à-dire (1) l’absence de

démonstration d’un changement de stratégie des individus et (2) l’absence de

démonstration que ce changement est adapté. L’objectif de ce chapitre est directement en

lien avec la correction de ces lacunes : il vise à identifier si les individus changent de

stratégie de manière adaptée.

Malgré l’absence de preuves d’une transition entre deux stratégies, plusieurs études

ont toutefois démontré que l’adoption d’une stratégie particulière est favorisée par certaines

conditions environnementales : c’est le cas, par exemple, (1) du nombre d’indices présent

dans la situation (Karelaia & Hogarth, 2008), (2) de la force de l’autocorrélation des séries

temporelles à prédire (Bolger & Harvey, 1993; Lawrence et al., 2006) et (3) de la qualité

107

des indices externes à la série critère (Harvey, 1995; Harvey et al., 1997; Lim & O’Connor,

1996).

Le nombre d’indices est critique dans l’étude des situations complexes et

dynamiques. Bien qu’il ne soit pas proportionnellement associé à la complexité d’une

situation (Funke, 1988), plusieurs auteurs indiquent qu’un nombre d’indices élevé constitue

une caractéristique clé des situations complexes (Gonzalez et al., 2005). En effet, ces

situations sont caractérisées par une quantité importante d’information pertinente ou non

pertinente souvent tenue responsable d’une partie des difficultés vécues par les individus en

charge de leur contrôle ou de leur prévision (voir Brehmer, 1992; Osman, 2010; Sterman,

2006). Cela est généralement interprété à la lumière des limitations cognitives

fondamentales en termes de capacité de traitement de l’information et de limites en

mémoire active (Payne et al., 1993). Particulièrement, le nombre d’indices extrinsèques est

un facteur connu pour avoir un impact sur l’abandon d’un jugement linéaire. En effet, au-

delà de trois variables à considérer comme indices lors d’un jugement, les individus

semblent avoir beaucoup de difficulté à appliquer une règle de jugement linéaire (Karelaia

& Hogarth, 2008). Toutefois, bien que le nombre d’indices soit un facteur connu dans

l’étude des situations complexes dynamiques de façon générale, l’effet de ce facteur n’a pas

été étudié dans un contexte précis de prévision de séries temporelles, particulièrement

concernant son impact sur la sélection de stratégie de prévision.

À l’inverse, l’autocorrélation de la série critère est un facteur fréquemment étudié au

sein du paradigme de prévision de série temporelle. L’autocorrélation réfère à la validité de

la valeur actuelle d’une variable dans la prévision de sa propre valeur future. Contrairement

au nombre d’indices, l’autocorrélation du critère n’est pas directement étudiée au sein

d’autres tâches de prise de décision complexe dynamique. Toutefois, ce dernier peut

raisonnablement être associé à un facteur connexe, c’est-à-dire la complexité dynamique

d’une situation (Diehl & Sterman, 1995; Gonzalez et al., 2005; Sterman, 1994). La

complexité dynamique réfère à l’occurrence de patrons dynamiques non linéaires qui

émergeraient en raison de délais d’influence entre les variables de la situation, qui

limiteraient l’apprentissage et qui rendraient le contrôle de ces situations difficile. Pour

toutes ces raisons, la complexité dynamique est reconnue comme étant un facteur de très

108

grande importance influençant la cognition au sein des situations complexes (Cronin,

Gonzalez, & Sterman, 2009). Au sein des séries temporelles, la présence de patron

d’évolution non linéaire sera caractérisée par une faible autocorrélation des variables, c’est-

à-dire que la valeur actuelle d’une variable ne sera pas un indice valable pour la prévision

de sa valeur future. Dans ce contexte, l’autocorrélation serait un facteur critique entre autres

dans l’adoption de l’heuristique d’ancrage et ajustement (Lawrence et al., 2006). En effet,

plusieurs études observent que les individus qui doivent prédire l’évolution d’une série

temporelle fortement auto corrélée ont tendance à adopter une heuristique d’ancrage et

ajustement (Andreassen & Kraus, 1990; Lawrence & O’Connor, 1992; 1995; Reimers &

Harvey, 2011). De plus, Bolger et Harvey (1993) observent que la version précise de

l’heuristique d’ancrage et ajustement employée est différente en fonction de la force de

l’autocorrélation, ce qui suggère que ce facteur est déterminant dans le choix des stratégies

employées.

La qualité des indices externes réfère à l’utilité des indices pour prédire le critère.

Les études démontrent que la manipulation de la qualité des indices a un impact significatif

sur la performance aux tâches réalisées au sein de situations complexes et dynamiques. Un

de ces facteurs associé à la qualité des indices extrinsèque est la nature des relations entre

les variables d’une situation (Gonzalez et al., 2005). En effet, plusieurs études démontrent

que les relations d’influences non linéaires entre les variables d’une situation,

particulièrement lorsque ces relations sont non monotones, nuisent à la qualité de la

représentation qu’en ont les individus et au contrôle qu’ils peuvent exercer sur cette

dernière (par exemple, Funke, 1988; Karelaia & Hogarth, 2008). Les études démontrent

aussi que la manipulation de la qualité des indices a un impact sur la performance à la tâche

de prévision de séries temporelles (par exemple, Lim & O’Connor, 1996; Chapitre II de la

présente thèse) et sur l’adoption d’heuristiques simplificatrices (par exemple, Bröder &

Schiffer 2003, 2006; Harvey, 1995; Harvey et al., 1997; Lim & O’Connor, 1996). De plus,

bien que les individus semblent sous-échantillonner les indices peu importe leur qualité, il

semble que, dans un contexte de prévision de séries temporelles, le sous-échantillonnage

soit exacerbé lorsque la qualité des indices est faible (Lim & O’Connor, 1996).

109

Ces facteurs sont associés aux sources d’information utilisées lors de prévision de

séries temporelles (Harvey, 2007). Le nombre d’indices est associé à la source extrinsèque

d’information puisqu’il concerne l’utilisation d’autres séries temporelles pour prédire le

critère. La qualité des indices externes est associée à la source extrinsèque d’information

puisqu’elle concerne l’utilité d’autres séries temporelles pour prédire le critère. Finalement,

l’autocorrélation de la série critère est associée à la source intrinsèque d’information

puisqu’elle concerne directement le critère. Étant donné que les modèles d’heuristiques et

de jugement linéaire sont basés sur des sources d’information distinctes (unique ou en

combinaison), leur performance est susceptible de varier différemment en fonction de la

qualité de ces dernières. Cela a d’ailleurs été démontré lors du précédent chapitre. Les

facteurs associés à la qualité de l’information des sources intrinsèques et extrinsèques,

c’est-à-dire force d’autocorrélation du critère, force d’association extrinsèque et nombre

d’indices, affecteraient ainsi à la fois la performance relative des stratégies de prévision de

séries temporelles (heuristiques et jugement linéaire) et leur adoption (par exemple,

Lawrence et al., 2006; Reimers & Harvey, 2011). Aucune étude ne permet toutefois de dire

que le changement de stratégie sous des conditions spécifiques concorde avec l’adoption de

la stratégie la plus performante sous ces mêmes conditions.

Objectif

Le présent chapitre étudie le comportement humain dans l’adoption de stratégies

cognitives, heuristiques ou jugement linéaire, pour la prévision de séries temporelles

complexes sous des conditions variées de qualité d’information. Précisément, l’objectif du

présent chapitre est d’explorer si dans certains contextes, les individus utilisent des

stratégies simplificatrices de manière adaptées, menant à des performances au moins

équivalentes au modèle de jugement linéaire. Conformément à la position de l’auteur, trois

hypothèses seront testées:



110



prévision.




Méthode Générale

Pour tester ces hypothèses, des participants humains ont réalisé une tâche simulée

de prévision de séries temporelles. Cette tâche est implémentée au sein d’un micromonde

dont le but est de reproduire les caractéristiques essentielles des séries temporelles en

laboratoire tout en permettant un niveau élevé de contrôle expérimental ainsi qu’une

collecte de données objective (Gonzalez et al., 2005). Les séries temporelles sont variées en

termes de qualité de source extrinsèque et de source intrinsèque d’information. Ces

manipulations sont réalisées puisque ces facteurs ont démontré leur capacité à moduler la

stratégie employée pour la prévision de séries temporelles et pour leur impact sur la

performance des stratégies modélisées en plus d’être particulièrement pertinentes pour

l’étude de la cognition en situations complexes et dynamiques de façon générale.

MATÉRIEL

Les participants réalisent la tâche à l’aide de CODEM, une plateforme

expérimentale destinée à étudier le comportement humain dans la prise de décision en

situation dynamique complexe (Lafond & DuCharme, 2011). Il s’agit d’un programme en

langage Java qui est exécuté sur un poste informatique dont le système d’exploitation est

Windows 7 édition 64-bits. Le poste est muni d’un écran ACL en format 4:3 de 22 pouces,

d’un clavier et d’une souris d’ordinateur.

TÂCHE

La tâche des participants consiste à prédire la valeur numérique d’un ensemble de

critères (4 ou 8 séries temporelles, dépendamment de la condition expérimentale en cours)

111

pour la période suivante t+1. Il s’agit de la même tâche que celle réalisée par les modèles

formalisés au chapitre précédent. C’est-à-dire que les participants humains disposent

exactement des mêmes informations que les modèles pour faire leurs prévisions et que les

séries temporelles à prédire sont exactement les mêmes. Les participants qui complètent la

tâche ont pour consigne de minimiser l’écart entre la valeur prédite et la valeur réelle. Pour

y arriver, les participants ont accès à l’ensemble des valeurs passées et actuelles de toutes

les variables. Pour éviter l’influence potentielle de connaissance a priori sur les jugements

des participants, les noms de variables n’ont aucune sémantique associée. Bien qu’il est

connu que la pression temporelle peut avoir un impact sur l’adoption de stratégie de

jugement (Hilbig et al., 2012; Pachur & Hertwig, 2006; Pachur et al., 2009), la présente

tâche exclut ce facteur pour se concentrer uniquement sur ceux mentionnés précédemment.

L’information est présentée aux participants sous la forme d’une gauge et sous forme

numérique (voir Figure 28). Les valeurs présentées aux participants ne comportent pas

d’incertitude, c’est-à-dire que les participants ont accès à une information juste et précise

sur la valeur actuelle et les valeurs passées de toutes les variables de la situation.

Les prévisions sont inscrites par les participants sous forme numérique dans l’onglet

« Prédiction » (Figure 29). Cet onglet affiche la valeur actuelle de toutes les variables et

permet aux participants d’entrer numériquement chacune de leur prévision. Une fois toutes

les prévisions faites, les participants ont la possibilité de passer à la période suivante en

cliquant sur « Done ». Tant que les participants n’ont pas cliqué sur « Done » il leur est

toujours possible de consulter l’onglet « Situation » et de changer les valeurs de leurs

prévisions.

112

Figure 28. Interface de CODEM. L’onglet « Situation » permet aux participants d’accéder aux informations

relatives aux valeurs actuelles et passées de toutes les variables de la situation. Ces valeurs sont présentées

sous forme graphique et numérique. Pour consulter les valeurs passées, les participants doivent glisser la

poignée située au bas à droite de l’interface vers la gauche.

Figure 29. Interface de CODEM. L’onglet « Prédiction » permet aux participants d’entrer la valeur numérique

de leurs prévisions ainsi que d’indiquer leur niveau de confiance moyen pour la période actuelle sur une

échelle de 1 à 5.

113

Une fois les prévisions entrées, au moment où les participants appuient sur

« Done », deux fenêtres de rétroaction sont affichées (Figure 30). Ces fenêtres indiquent

l’évolution de la série temporelle et l’erreur de la dernière prévision. Une fois la rétroaction

consultée, le participant procède à la période suivante. La simulation dure 41 périodes, mais

le participant n’émet des prédictions que pour 40 puisqu’il ne doit pas en fournir pour le

premier tour. Finalement, les participants devaient fournir un niveau de confiance envers la

précision de leurs prévisions à chaque tour. Cette information n’a pas été considérée dans le

contexte de la présente thèse.

Figure 30. Interface de CODEM. Les écrans de rétroaction fournissent des informations sur les changements

dans les valeurs réelles des variables (haut) et sur la direction et l’amplitude des erreurs de prévision (bas).

114

MODÈLES

Les modèles de prévisions de séries temporelles qui sont comparés aux prévisions des

participants sont les mêmes que ceux employés dans le chapitre précédent (voir Tableau

25). Cette comparaison est possible puisque la tâche des participants est identique à celle

réalisée par les modèles. Deux modèles représentent la stratégie d’ancrage et ajustement qui

consiste à partir d’une valeur initiale (c’est-à-dire, l’ancrage) et de l’ajuster dans le but

d’émettre une prévision avec une caractéristique importante de la série. Cette

caractéristique peut être la pente récente, ou la pente à long terme, par exemple. Ces

modèles sont nommés ANC1 et ANC2. Le modèle ANC3 est retiré puisqu’il est identique

en tous points à ANC1, et donc non discriminable. Trois modèles représentent la stratégie

de limites et vraisemblance. Cette heuristique consiste à extraire des caractéristiques de la

ou des série(s) temporelle(s) d’intérêt et d’intégrer ces nouveaux indices au sein d’une

représentation linéaire pour prédire le critère. Ces modèles sont nommés L&V1, L&V2 et

L&V3. Finalement, la norme rationnelle est représentée par le jugement linéaire. Un seul

modèle représente cette stratégie, le ML1.

Tableau 25

Sources d’information par modèle.

SI SE

Stratégie Modèle Explicite Extraite Unique Multiple

Ancrage et

ajustement

(heuristique)

ANC1 X

ANC2 X

ANC3* X

Limites et

vraisemblance

(heuristique)

L&V1 X

L&V2 X X

L&V3 X X

Jugement

linéaire ML1 X X

* Les prévisions du modèle ANC3 ne sont pas comparées à celles des participants

puisqu’elles sont identiques à celles de ANC1.

115

MESURES

Performance. La performance des participants et l’adéquation du comportement des

participants aux prévisions des modèles sont mesurées à l’aide de la PVE (initialement

popularisée par Hays, 1963). Cet indice, tel que formulé entre autres par Stevens (2013; Eq.

14), tient compte à la fois de l’erreur moyenne des prévisions et de la prévision de la

variation des séries temporelles (O’Grady, 1982). Essentiellement, cet indice correspond à

l’erreur de prévision, pondérée par la variance de la série critère. La PVE peut

théoriquement varier de -∞ à +1, ce qui implique ironiquement qu’il ne s’agit pas d’une

proportion à proprement parler (Fairchild et al., 2009). Plus la valeur de la PVE est proche

de un, plus la prévision de la série temporelle est bonne. Une PVE négative signifie que les

prévisions réalisées ajoutent de la variance à la variance réelle de la série.

Gain de performance et fréquence de gain. Afin de comparer les données des

participants au modèle linéaire, la performance atteinte par ce dernier est soustraite de celle

des participants. Une différence positive indique qu’un participant a obtenu une

performance de prévision supérieure au modèle linéaire. Cette mesure est utilisée afin de

mitiger l’impact de l’échelle de la PVE (-∞ à +1) qui a pour effet de décentrer la

distribution des scores de performance vers le négatif; or, dans le contexte de la thèse, il ne

s’agit pas de qualifier l’ampleur de l’erreur de performance, mais simplement de déterminer

si erreur il y a comparativement à un modèle normatif. Pour cette raison, l’utilisation d’une

mesure de fréquence de gain permet de répondre aux questions de recherche. Dans ce

contexte, la mesure de performance PVE est tout de même rapportée puisqu’elle permet de

décrire les résultats obtenus de manière plus exhaustive, et ainsi, de mieux apprécier les

limites de la thèse. Le gain moyen de performance par rapport au modèle linéaire n’est

toutefois pas représentatif d’une stratégie particulière. Pour cette raison, la fréquence à

laquelle chaque participant obtient une performance supérieure à celle du modèle linéaire

est également calculée.

Fréquence et proportion de représentativité des modèles. Pour chacune des séries

temporelles et chacun des participants, les prévisions des six modèles (ANC1, ANC2,

L&V1, L&V2, L&V3 et ML1) sont comparées aux prévisions des participants à l’aide d’un

test-t pour échantillons pairés. Un test significatif indique que les prévisions du participant

116

sont différentes des prévisions du modèle testé pour une série temporelle donnée. Le seuil

alpha fixé pour cette analyse est de p = .1 afin de favoriser l’identification de différence

significative entre les prévisions des modèles et les prévisions des participants. Ce seuil

libéral permet ainsi une plus grande discrimination des modèles, puisqu’une déviation

légère des réponses du participant par rapport au modèle suffira pour rejeter le modèle.

L’inflation de l’erreur alpha ne constitue pas un problème en soi puisque le rejet erroné des

modèles devrait être distribué également entre les modèles. Une deuxième étape consiste à

discriminer les modèles restant grâce à la PVE. Encore une fois, pour favoriser une

discrimination des modèles, un critère sévère est adopté. Le degré d’association entre les

prévisions du participant et les prévisions du modèle, tel que mesuré par la PVE, doit être

supérieure à .95 pour que le modèle soit jugé comme représentatif du comportement du

participant. Ce seuil est très sévère puisqu’il a été démontré que le ML1 expliquait en

moyenne environ 64% de la variance du comportement des individus dans des contextes

similaires à celui de la présente thèse (par exemple, catégorisation, prévision de critère

dichotomique). L’objectif de ce seuil sévère est de s’assurer que les modèles retenus sont

représentatifs du comportement des participants.

Une fois ces deux critères rencontrés, il est estimé que le modèle est représentatif et

donc plausiblement employé pour la prévision de la série temporelle. Cette méthode pour la

discrimination des modèles combine à la fois un critère de signification statistique et une

évaluation de la variance expliquée. Cette combinaison est réalisée afin de combler les

limites associées au test de signification statistiques (voir Cohen, 1990) et de la proportion

de variance expliquée (voir O’Grady, 1982). Par contre, dans certains cas, cette procédure

ne permet pas de discriminer entre deux ou plusieurs modèles. Dans ces circonstances,

ceux-ci sont simultanément considérés comme plausibles pour les fins des analyses. De

plus, même si un seul modèle est retenu, cette procédure ne permet pas de juger de

l’utilisation de la stratégie, mais seulement de la représentativité d’un modèle en lien avec

le comportement humain. Même dans le cas où un modèle expliquerait 100% de la variance

des prévisions d’un participant, il est seulement possible de dire que le participant se

comporte « comme s’il » utilisait cette stratégie (Sterman, 1989; Hogarth & Karelaia,

2007). C’est pourquoi, tout au long de la thèse, on réfère à la représentativité des modèles

plutôt qu’à leur utilisation.

117

La fréquence de représentativité des modèles indique le nombre de fois où chaque

modèle est représentatif du comportement humain. Les fréquences sont ensuite

transformées en proportion de représentativité en les divisant par le nombre de séries

temporelles au sein d’une condition (4 ou 8 selon la condition). Cette proportion est

calculée par condition expérimentale.

Adaptabilité. L’adaptabilité réfère à quel point la sélection de stratégie des

participants est optimale. Elle correspond à la proportion des séries temporelles qui étaient

prédites à l’aide de la stratégie la plus performante dans ce contexte. Les simulations du

chapitre précédent ont permis l’identification du modèle le plus performant pour prédire

chaque série temporelle (voir Tableau 26). L’adaptabilité réfère à la proportion à laquelle

les modèles représentatifs du comportement humain correspondent au modèle le plus

performant par condition expérimentale.

118

Tableau 26

Modèle le plus performant par série temporelle, défini par simulation.

XP1 XP2

Série 1 ANC2 Série 1 ANC2



Série 4 ML1 Série 4 ANC1

Série 5 ML1 Série 5 ANC2

Série 6 L&V1 Série 6 ANC2

Série 7 ML1 Série 7 ML1

Série 8 ANC1 Série 8 ML1


Série 10 ML1 Série 10 ML1

Série 11 ANC2 Série 11 L&V1










Série 21 L&V1 Série 21 ML1




Série 25 L&V1

Série 26 ANC2

Série 27 L&V2

Série 28 ANC2

Série 29 ANC2

Série 30 L&V3

Série 31 L&V2

Série 32 ANC2

119

Expérience I

Cette expérience a pour objectif d’étudier le comportement humain dans l’adoption

de stratégies cognitives, heuristiques ou jugement linéaire, pour la prévision de séries

temporelles complexes sous des conditions variées de qualité d’information de source

extrinsèque. Les facteurs manipulés au sein de l’Expérience 1 sont le nombre d’indices

extrinsèques et la force d’association extrinsèque. Ces deux facteurs sont associés à la

source extrinsèque d’information. Le nombre d’indices extrinsèques correspond au nombre

de séries temporelles qui co-évoluent avec la série critère. En effet, la valeur des séries qui

co-évoluent avec la série critère est la seule information extrinsèque explicitement

disponible aux participants pour émettre leur prévision. La force d’association extrinsèque

correspond à la corrélation linéaire absolue maximum entre les indices extrinsèques et le

critère. Ces facteurs n’ont montré aucun impact sur la performance des modèles lors de la

première simulation du chapitre précédent, toutefois, ils sont parfois associés à la sélection

de stratégie utilisée pour faire les prévisions. Les hypothèses testées dans le cadre de cette

expérience sont les suivantes :





prévision.




MÉTHODE

Participants. L’échantillon se compose de 24 étudiant(e)s de l’Université Laval,

soit 10 hommes et 14 femmes. Une compensation financière de 10$ par session

120

expérimentale est remise aux participants (donc 40$ pour les quatre sessions). Tous les

participants rapportent une vision normale ou corrigée.

Devis expérimental. Le nombre d’indices extrinsèques (3 ou 7) et la force

d’association extrinsèque (faible [m = .65; ET = .14] ou élevée [m = .91; ET = .06])

engendre un plan à mesures répétées 2 × 2. Tous les participants complètent la tâche de

prévision de séries temporelles au sein de quatre versions de scénario. Les vingt-quatre

séries temporelles utilisées pour cette expérience sont les mêmes que celles employées pour

la première simulation rapportée dans le chapitre précédent (voir Erreur ! Source du

renvoi introuvable.).

Procédure. Le Tableau 27 montre la procédure suivie par les participants au cours

des quatre sessions tests. Lors de la première session, les participants sont d’abord invités à

lire et remplir le formulaire de consentement. Par la suite, ceux-ci procèdent à un scénario

de pratique dont l’objectif était de les familiariser avec les contrôles de la plateforme

expérimentale. L’ensemble des participants réalisent le même scénario pratique. Suite à la

pratique, les participants sont invités à compléter la première version du scénario

expérimental. Par la suite, chaque session expérimentale est dédiée à la réalisation d’une

autre version du scénario. L’ordre de présentation des différentes versions de scénarios est

contrebalancé entre les participants.

Tableau 27

Déroulement des sessions expérimentales.

Étape Session 1 Session 2 Session 3 Session 4

Étape 1 Formulaire de

consentement

Prévision de

séries

temporelles

Prévision de

séries

temporelles

Prévision de

séries

temporelles

Étape 2 Pratique

Étape 3

Prévision de

séries

temporelles

121

Les instructions données aux participants avant la réalisation de chaque scénario

sont présentées dans la Figure 31. Ces instructions exposaient l’objectif des participants,

c’est-à-dire de trouver le plus précisément possible la valeur des différentes variables au

tour suivant. Les instructions mettaient également le participant en contexte, c’est-à-dire

qu’ils incarnaient un astronaute perdu sur des planètes inconnues. L’objectif de cette mise

en contexte était de s’assurer que les participants n’appliquent aucune connaissance a priori

lorsqu’ils réalisaient la tâche. En effet, cette source d’information décrite par Harvey (2007)

pourrait avoir une influence sur la précision des prévisions et a donc été retirée des études

réalisées dans cette présente thèse. Finalement, les instructions insistaient sur le fait que la

tâche est particulièrement difficile et que seules les personnes qui déploient des efforts

importants arrivent à bien prédire la valeur des variables. Cela était mentionné pour ne pas

que les participants perdent leur motivation en cours d’expérimentation et aussi pour

encourager les participants à bien faire la tâche.

Figure 31. Instructions présentées aux participants avant la tâche expérimentale.

RÉSULTATS

Les résultats sont organisés en quatre sections. La première consiste à décrire les

résultats de manière générale à justifier certains choix d’analyse. La seconde section

concerne l’analyse de la performance absolue des participants et relativement au jugement

linéaire. Cette seconde section est directement associée à l’hypothèse H2 :

122



La troisième section consiste en l’analyse de l’adéquation entre les prévisions des

participants et les prévisions des modèles en fonction des conditions expérimentales. Ces

analyses sont directement en lien avec l’hypothèse H3 :



prévision.

Finalement, la quatrième section concerne l’analyse du niveau d’adaptabilité et est en lien

avec l’hypothèse H4 :




Description et justification. Pour les analyses statistiques de la présente thèse, la

correction de Greenhouse-Geisser est appliquée sur les degrés de liberté de tous les effets

intra-sujets pour lesquels la condition de sphéricité n'est pas respectée. De plus, une

correction Bonferroni est appliquée lorsque nécessaire pour limiter l’inflation de l’erreur

alpha. Toutes les statistiques rapportées ne concernent que les périodes t > 9 (participants et

modèles). Cela est causé par des limitations computationnelles des modèles de stratégies

qui requièrent dans certains cas un nombre minimal d’observations pour être exécutées. Par

exemple, le calcul du ML1 ne peut être réalisé lorsque la matrice de variance-covariance est

caractérisée par un niveau de colinéarité trop élevé ou lorsque le nombre de paramètres

excède le nombre d’observations.

La Figure 32 illustre un exemple des réponses données par certains participants par

rapport à une des séries temporelles à prédire. L’Annexe A comporte une série de figures

illustrant les prévisions de participants à certaines séries temporelles, ainsi que les prévision

des modèles ANC2 et ML.

123

Figure 32. Exemple des réponses données par un sous-ensemble de 13 participants (gris) comparativement à

la série temporelle critère (noire).

Les prévisions d’un sous-ensemble de 13 participants sont montrées en gris alors

que la série temporelle à prédire est représentée en noir. Notez que les prévisions ne sont

pas toutes exactes et qu’elles sont distribuées autour de la série temporelle critère. Une

distribution similaire des prévisions est observée pour l’ensemble des séries temporelles à

prédire. C’est l’écart entre les prévisions des participants et la série temporelle critère qui

correspond à la performance de prévision. Ce critère de performance est employé puisqu’il

correspond aux consignes qui sont données aux participants lors de l’expérience. Tel que

mentionné précédemment, l’ampleur de l’écart n’est pas critique à l’atteinte des objectifs de

la thèse. Plutôt, ce qui importe concerne davantage si la stratégie employée par les

participants est meilleure ou non comparativement à une norme donnée. Néanmoins,

l’ampleur de l’écart est tout de même analyser afin de décrire les observations de manière

exhaustive.

Performance comparative au modèle linéaire. Une première analyse se concentre

d’abord sur la performance des participants, puis sur la comparaison de celle-ci avec celle

d’un jugement linéaire. Les données d’un participant ont été retirées puisque sa

performance pour une des conditions était à plus de trois écart-types sous la moyenne. Les

moyennes et erreurs quadratiques moyennes par condition expérimentale sont représentées

0

2

4

6

8

10

12

14

16

18

20

t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40

124

dans la Figure 33. Suite à une première inspection visuelle, on note que l’erreur moyenne

pour l’ensemble des conditions est très faible, ce qui suggère que les réponses des

participants sont assez homogènes. De plus, la performance atteinte est très élevée à

l’exception de la condition 7 indices – association extrinsèque faible.

Une ANOVA à mesures répétées 2 2 est effectuée sur la performance selon le

nombre d’indices extrinsèques et la force d’association extrinsèque. Les résultats montrent

des effets significatifs du nombre d’indices extrinsèques F(1,22) = 84.04, p < .001, =

.793; de la force d’association extrinsèque F(1,22) = 89.38, p < .001, = .802; et de

l’interaction entre les facteurs F(1,22) = 206.74, p < .001, = .904 sur la performance.

Figure 33. Performance moyenne des participants par condition expérimentale (nombre d’indices et force

d’association extrinsèque). La performance correspond à la proportion de variance expliquée des séries

temporelles par les prévisions des participants.

Des comparaisons pairées multiples sont effectuées pour décomposer l’interaction

(voir Tableau 28). Les résultats montrent que la performance augmente entre forte et faible

association extrinsèque lorsque le nombre d’indices est de trois, mais qu’elle diminue entre

forte et faible association extrinsèque lorsque le nombre d’indices est de sept. De plus, la

125

performance augmente de trois à sept indices lorsque la force d’association extrinsèque est

forte, mais diminue lorsque la force d’association est faible. Malgré ces effets significatifs,

les tailles d’effets indiquent que le principal effet d’importance est la diminution de la

performance lorsque le nombre d’indices est de trois en combinaison avec une force

d’association extrinsèque faible comparativement aux autres conditions.

Tableau 28

Décomposition de l’interaction performance PVE.

Comparaison t dl p d’

Forte - 3 Indices vs. Faible - 3 Indices 8.46 22 < .001 1.76


Forte - 3 Indices vs. Forte - 7 Indices 3.27 22 .004 .68

Faible - 3 Indices vs. Faible - 7 Indices 12.85 22 < .001 2.67

Gain de performance. Le gain de performance par condition est représenté dans la

Figure 34. Suite à une inspection visuelle, on constate que la seule condition pour laquelle

le gain de performance moyen est potentiellement supérieur à zéro est la condition 7 indices

– association extrinsèque faible. Un test-t est réalisé afin de vérifier si le gain de

performance moyen observé pour la condition 7 Indices – Association extrinsèque faible est

différente de zéro. Le test-t révèle que la différence est non-statistiquement significative

t(22) = .578, non-significatif. On ne peut donc pas rejeter l’hypothèse nulle selon laquelle le

gain de performance moyen est différent de zéro.

126

Figure 34. Gain de performance moyen des participants par condition expérimentale (nombre d’indices et

force d’association extrinsèque). Le gain de performance correspond à la différence entre la performance des

participants et celle obtenue par l’application parfaite du modèle de jugement linéaire.

Une ANOVA à mesures répétées 2 2 est effectuée sur le gain de performance

moyen selon le nombre d’indices extrinsèques et la force d’association extrinsèque. Les

données d’un participant ont été retirées puisque sa performance pour une des conditions

était à plus de trois écart-types sous la moyenne. Les résultats montrent que seul l’effet de

la force d’association extrinsèque sur l’ampleur moyen du gain est statistiquement

significatif F(1,22) = 7.55, p = .012, = .256. En effet, le gain moyen de performance est

supérieur lorsque la force d’association extrinsèque est faible comparativement à

lorsqu’elle est élevée. Les effets du nombre d’indices extrinsèques et de l’interaction des

facteurs sont non significatifs.

Fréquence de gain. La Figure 35 représente la fréquence de gain de performance par

participant. Les participants sont ordonnés en rang et la fréquence maximum est de 24 (24

séries temporelles).

127

Figure 35. Fréquence de gain de performance par participant. Tous les participants ont obtenus une

performance supérieure à celle du modèle de jugement linéaire à au moins sept reprises sur une possibilité de

vingt-quatre.

La fréquence par participant et par condition expérimentale est ensuite calculée et

divisée par le maximum possible (c’est-à-dire, 24, le nombre de séries temporelles). Les

fréquences sont ainsi standardisées et représentées entre zéro et un. Une série de tests-t est

réalisée afin de vérifier si la fréquence de gain standardisée moyenne est différente de zéro.

Les tests-t révèlent que toutes les différences sont statistiquement significatives (voir

Tableau 29).

Tableau 29

Test-t à un échantillon entre fréquences moyennes de gain standardisées et valeur test de

zéro.

Condition t dl p

Force d'association élevée - 3 Indices 15.27 23 < .001

Force d'association faible - 3 Indices 11.02 23 < .001

Force d'association élevée - 7 Indices 14.95 23 < .001

Force d'association faible - 7 Indices 21.52 23 < .001

0

4

8

12

16

20

24

11 14 21 19 24 16 5 10 13 18 3 8 15 17 7 20 23 1 12 6 2 22 4 9

Fré

qu

en

ce d

e g

ain

(/2

4)

Participant

128

Une ANOVA à mesures répétées 2 2 est effectuée sur la fréquence de gain

standardisée moyenne selon le nombre d’indices extrinsèques et la force d’association

extrinsèque. Les résultats montrent que seul l’effet du nombre d’indices extrinsèques sur la

fréquence standardisée de gain est statistiquement significatif F(1,23) = 8.87, p = .007, =

.278. En effet, la moyenne de fréquence de gain standardisée est supérieure lorsque le

nombre d’indices extrinsèques est de sept comparativement à lorsqu’il est de trois. Les

effets de la force d’association extrinsèque et de l’interaction des facteurs sont non

significatifs (voir Figure 36).

Figure 36. Fréquence de gain standardisée moyenne par condition expérimentale (nombre d’indices et force

d’association extrinsèque). Les tests-t révèlent que les fréquences sont supérieure à 0 pour l’ensemble des

conditions expérimentales.

Adéquation aux modèles. Les analyses d’adéquation aux modèles comportent

quatre étapes. La première consiste à comparer l’adéquation entre les prévisions des

participants un à un avec les prévisions de chacun des modèles de stratégie dans le but

d’identifier quels sont les modèles les plus représentatifs du comportement humain. La

seconde étape consiste à comparer la représentativité globale des modèles, sans égard aux

129

conditions expérimentales. La troisième étape consiste à estimer l’impact des conditions

expérimentales sur la représentativité des modèles. Cela permettra d’évaluer si les

participants adaptent leur stratégie en fonction des conditions environnementales.

Finalement, la dernière étape vise à évaluer si la représentativité des modèles est adaptée,

c’est-à-dire si elle permet l’atteinte de performances équivalentes ou supérieures au modèle

de jugement linéaire.

Représentativité des modèles. Pour chacune des 24 séries temporelles et chacun des

24 participants, les prévisions des six modèles sont comparées aux prévisions des

participants avec un test-t pour échantillons pairés (donc = 3456 comparaisons).

Ce premier effort de sélection permet de réduire le nombre moyen de modèles plausibles à

3.56 par série temporelle. En d’autres mots, suite à cette sélection, il reste en moyenne

environ entre trois et quatre modèles plausibles pour expliquer le comportement des

participants dans la prévision d’une seule série temporelle. Un effort supplémentaire de

sélection de modèle est donc nécessaire. Ainsi, l’adéquation entre le comportement des

participants et celui du modèle telle que mesurée par la PVE doit être supérieure à .95 pour

que le modèle soit considéré comme plausible. La sélection finale réduit le nombre

plausible de modèles à 1.12 par série temporelle. Le

130

Tableau 30 montre la fréquence de représentativité de chacun des modèles pour

l’ensemble des 24 séries temporelles par participant. Notez que la somme de la

représentativité par participant n’égale pas nécessairement le nombre total de séries

temporelles pour les raisons mentionnées précédemment.

131

Tableau 30

Fréquence de représentativité des modèles par participant.

Participant ANC1 ANC2 L&V1 L&V2 L&V3 ML1

P1 3 11 3 2 0 10

P2 5 8 5 3 1 7

P3 4 8 4 2 1 7

P4 3 11 5 2 0 9

P5 7 7 5 4 1 9

P6 4 12 3 2 0 10

P7 3 12 2 2 1 9

P8 5 10 5 2 0 10

P9 4 10 4 3 0 7

P10 3 7 3 1 0 7

P11 4 6 3 3 1 3

P12 5 11 5 2 0 10

P13 6 10 6 4 0 12

P14 3 5 2 2 0 4

P15 4 9 4 3 1 5

P16 4 6 3 3 1 6

P17 2 9 1 0 1 8

P18 5 8 5 1 0 9

P19 4 8 4 3 0 7

P20 6 11 5 2 0 12

P21 2 2 2 1 0 5

P22 3 10 3 3 0 7

P23 2 10 4 2 0 10

P24 4 8 3 3 1 6

Moyenne 3.96 8.71 3.71 2.29 0.38 7.88

132

Représentativité des modèles. Une série de tests-t pour échantillons uniques est

exécutée afin de vérifier si la fréquence de représentativité moyenne des modèles est

différente de zéro. Les analyses révèlent que les fréquences moyennes sont toutes

différentes de zéro (voir Tableau 31).

Tableau 31

Test-t à un échantillon entre fréquence de représentativité et valeur test de zéro.

Modèle t dl p

ANC1 14.90 23 < .001

ANC2 17.74 23 < .001

L&V1 14.33 23 < .001

L&V2 11.76 23 < .001

L&V3 3.71 23 .001

ML 16.314 23 < .001

Une ANOVA à mesures répétées sur la fréquence de représentativité des modèles

avec la version du modèle comme facteur répété (6 niveaux) est réalisée afin de vérifier s’il

existe une différence significative dans la représentativité entre les modèles,

indépendemment de la condition expérimentale. Les résultats montrent que l’effet du

modèle sur la fréquence de représentativité est statistiquement significatif F(5,115) =

126.92, p < .001, = .847. Afin de localiser la source de cette différence, une série de

comparaisons pairées est réalisée. Une correction Bonferroni est appliquée pour éviter

l’inflation des risques d’une erreur alpha. L’analyse, résumée dans le Tableau 32, révèle

que seuls les modèles ANC1 vs L&V1 et ANC2 vs ML1 ont une fréquence de

représentativité non-statistiquement différente.

133

Tableau 32

Différences absolues de fréquence moyenne d’utilisation entre les modèles. Les différences

non significatives sont ombragées.

ANC2 L&V1 L&V2 L&V3 ML

ANC1 4.75* 0.25 1.67* 3.58* 3.92*

ANC2

5.00* 6.42* 8.33* 0.83

L&V1

1.42* 3.33* 4.17*

L&V2

1.92* 5.58*

L&V3

7.50*

* p < .001 avec correction Bonferroni

Impact des conditions expérimentales sur la représentativité des modèles. Les

proportions moyennes de représentativité (les barres d’erreur représentent l’erreur

quadratique moyenne) par condition et modèle sont rapportées dans la Figure 37. Pour

chacun des modèles à l’exception de L&V3, une ANOVA à mesures répétées 2 2 est

effectuée sur la proportion de représentativité selon le nombre d’indices extrinsèques et la

force d’association extrinsèque. Le seuil de signification est fixé à .01 (.05/5) pour éviter

l’inflation du nombre d’erreur de type I.

134

Figure 37. Proportion moyenne de représentativité des modèles par condition expérimentale (nombre

d’indices et force d’association extrinsèque) et modèle.

ANC1. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité

du modèle ANC1 selon le nombre d’indices extrinsèques et la force d’association

extrinsèque. L’analyse montre que l’effet du nombre d’indices sur la représentativité est

statistiquement significatif F(1,23) = 57.06, p < .001, = .713. En effet, la représentativité

135

du comportement humain par le modèle ANC1 est significativement plus élevée au sein des

conditions à 7 indices comparativement aux conditions à 3 indices. Ni l’effet de la force

d’association F(1,23) = 2.76, ni celui de l’interaction des facteurs F(1,23) = 2.16 sur la

représentativité du comportement par le modèle ANC1 ne sont significatifs.


du modèle ANC2 selon le nombre d’indices extrinsèques et la force d’association

extrinsèque. L’analyse montre que l’effet de la force d’association extrinsèque sur la

représentativité du comportement par le modèle ANC2 est statistiquement significatif

F(1,23) = 18.44, p < .001, = .445. En effet, la représentativité du modèle ANC2 est

significativement plus élevée au sein des conditions à force d’association extrinsèque forte

comparativement aux conditions avec force d’association extrinsèque faible. L’effet du

nombre d’indices sur la représentativité du modèle ANC2 est également significatif F(1,23)

= 11.32, p = .003, = .330. Cet effet est le même que pour le modèle ANC1, c’est-à-dire

que la représentativité du comportement humain par le modèle ANC2 est plus élevée au

sein des conditions à sept indices comparativement aux conditions à trois indices.

Finalement, l’effet d’interaction des facteurs sur la représentativité du modèle ANC2 est

non significatif F(1,23), p = .033, = .183.

L&V1. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité de

L&V1 selon le nombre d’indices extrinsèques et la force d’association extrinsèque. Les

résultats montrent que l’effet du nombre d’indices F(1,23) = 34.77, p < .001, = .602, de

la force d’association extrinsèque F(1,23) = 14.57, p < .001, = .388, et de l’interaction

des facteurs F(1,23) = 15.65, p < .001, = .405, sur la représentativité du comportement

des participants par le modèle L&V1 sont significatifs. Des comparaisons multiples sont

effectuées pour décomposer l’interaction (voir Tableau 33). Les résultats des comparaisons

montrent que la représentativité du comportement des participants par le modèle L&V1 est

plus élevée lorsque l’association extrinsèque est forte, mais seulement lorsque le nombre

d’indices est de sept.

136

Tableau 33

Décomposition de l’interaction L&V1.


Forte - 3 Indices vs. Faible - 3 Indices 0.49 23 0.63 .10


Forte - 3 Indices vs. Forte - 7 Indices 5.86 23 < .001 1.20

Faible - 3 Indices vs. Faible - 7 Indices 1.62 23 0.12 .33

L&V2. Une ANOVA à mesures répétées 2 2 est effectuée sur la représentativité

du modèle L&V2 selon le nombre d’indices extrinsèques et la force d’association

extrinsèque. Les résultats montrent que l’effet du nombre d’indices F(1,23) = 24.31, p <

.001, = .514, de la force d’association extrinsèque F(1,23) = 38.52, p < .001,

= .626,

et de l’interaction des facteurs F(1,23) = 24.45, p < .001, = .515, sur la représentativité

de L&V2 sont significatifs. Des comparaisons pairées multiples sont effectuées pour

décomposer l’interaction (voir Tableau 34). Les résultats, pratiquement identiques à ceux

obtenus pour la même analyse L&V1, montrent que la représentativité de L&V2 est plus

élevée lorsque l’association extrinsèque est forte, mais seulement lorsque le nombre

d’indices est de sept.

Tableau 34

Décomposition de l’interaction L&V2.




Forte - 3 Indices vs. Forte - 7 Indices 5.27 23 < .001 1.08

Faible - 3 Indices vs. Faible - 7 Indices 0.37 23 0.71 .08

ML1. Finalement, une ANOVA à mesures répétées 2 2 est effectuée sur la

représentativité du comportement des participants par le modèle ML1 selon le nombre

d’indices extrinsèques et la force d’association extrinsèque. Les résultats montrent que

l’effet du nombre d’indices F(1,23) = 78.50, p < .001, = .773, de la force d’association

extrinsèque F(1,23) = 15.02, p < .001, = .395, et de l’interaction des facteurs F(1,23) =

26.73, p < .001, = .537, sur la représentativité de ML1 sont significatifs. Des

137

comparaisons pairées multiples sont effectuées pour décomposer l’interaction (voir Tableau

35). Les résultats des analyses comparaisons montrent que la représentativité du ML1 n’est

pas différente en fonction de la force d’association extrinsèque, mais seulement dans le cas

où le nombre d’indices est égal à trois. Toutes les autres différences observées sont

significatives.

Tableau 35

Décomposition de l’interaction ML1.




Forte - 3 Indices vs.Forte - 7 Indices 4.27 23 < .001 .87

Faible - 3 Indices vs.Faible - 7 Indices 9.36 23 < .001 1.91

Adaptabilité. La proportion à laquelle le modèle le plus représentatif du

comportement d’un participant correspond au modèle le plus performant par condition

expérimentale est utilisée comme mesure d’adaptabilité des participants. Une analyse de

corrélation révèle que la mesure d’adaptabilité est corrélée avec la fréquence moyenne de

gain r(22) = .61, p < .001 et le gain moyen3 r(21) = .70, p < .001. Une analyse par condition

expérimentale est également effectuée afin d’établir si le niveau d’adaptabilité est affecté

par celles-ci. La Figure 38 représente l’adaptabilité par condition expérimentale. Une

ANOVA à mesures répétées 2 2 est effectuée sur la mesure d’adaptabilité selon le

nombre d’indices extrinsèques et la force d’association extrinsèque. Les résultats montrent

que seul l’effet d’interaction des facteurs est significatif F(1,23) = 48.16, p < .001, =

.677. Les effets de la force d’association extrinsèque et du nombre d’indices sur

l’adaptabilité sont non significatifs. Des comparaisons pairées multiples sont effectuées

pour décomposer l’interaction (voir Tableau 36). L’analyse montre que l’adaptabilité

augmente entre association forte et faible lorsque le nombre d’indices est de trois, mais

qu’elle diminue lorsque le nombre d’indices est de sept.

3 Les données d’un participant ont été retirées pour cette analyse puisque leur score était à plus de trois écart-

types sous la moyenne.

138

Tableau 36

Décomposition de l’interaction sur adaptabilité.




Forte - 3 Indices vs. Forte - 7 Indices 3.83 23 .001 .78

Faible - 3 Indices vs. Faible - 7 Indices 5.41 23 < .001 1.10

Figure 38. Adaptabilité par condition expérimentale (nombre d’indices et force d’association extrinsèque).

DISCUSSION

L’objectif de ce chapitre est d’évaluer si la performance des participants est égale ou

supérieure à celle du modèle de jugement linéaire, identifier quelles sont les stratégies

employées par les participants et vérifier si ces stratégies sont adaptées. À cet égard, la

première expérience s’intéresse à ces objectifs en lien avec la qualité des indices

extrinsèques dans la prévision de séries temporelles. Précisément, deux facteurs associés à

la qualité des indices extrinsèques sont manipulés : le nombre d’indices extrinsèques et la

force d’association extrinsèque.

139

H2 : La performance des participants à la tâche de prévision sera supérieure à celle

atteinte par le modèle de jugement linéaire.

La fréquence de gain moyenne est relativement élevée pour l’ensemble des

conditions expérimentales, ce qui indique que les participants ont la capacité de faire des

prévisions dont la précision est supérieure à celle d’un modèle de jugement linéaire. La

démonstration que dans certaines situations l’adoption d’heuristiques simples mènent à des

performances au moins équivalentes au modèle normatif de référence n’est pas nouvelle.

Par exemple, Borges et ses collègues (1999) ont démontré que l’heuristique de disponibilité

a permis l’atteinte de performance financière supérieure à la moyenne, mais seulement au

sein d’un marché fort (Boyd, 2001). Ying Luo (2013) observe aussi qu’une heuristique de

représentativité permet l’atteinte de performances financières au moins équivalentes à un

modèle rationnel, mais seulement lorsque l’environnement à prédire comporte une part

élevée de hasard. Les résultats de la présente étude élargissent l’éventail des conditions

sous lesquelles cela est possible.

Par contre, les données observées indiquent que le gain moyen par rapport au

jugement linéaire est minimal puisqu'il n’est positif que dans une des conditions

expérimentales. Une explication possible de cette apparente contradiction est que le gain

potentiel des heuristiques comparativement au modèle linéaire est relativement limité

puisque ce dernier obtient généralement une bonne performance. La performance élevée du

modèle de jugement linéaire est d’ailleurs un argument clé de son statut de modèle normatif

(Karelaia & Hogarth, 2008). Toutefois, à l’inverse, une stratégie inefficace peut être

nettement sous la performance d’un jugement linéaire, particulièrement avec l’utilisation

d’une échelle de performance variant de -∞ à +1. Ainsi, la moyenne des « gains » pourrait

être grandement diminuée par quelques mauvaises prévisions, particulièrement dans les

conditions où la performance du modèle de jugement linéaire est élevée. Pour ces raisons,

la fréquence de gain moyenne constitue un meilleur indicateur de l’adaptabilité des

participants que l’amplitude du gain.

H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle donnée

variera significativement en fonction des caractéristiques de la tâche de prévision.

140

Un gain de performance n’est toutefois pas nécessairement causé par un

changement adapté de stratégie. Est-ce que le gain de performance peut être attribué à la

sélection adaptée de stratégies cognitives, ou résulte-t-il simplement d’une variation de la

performance du modèle linéaire? En effet, si les participants emploient toujours la même

stratégie, mais seulement sous certaines conditions, cette stratégie est plus adaptée que le

modèle linéaire, il en résultera un gain, mais non causé par une sélection adaptée de

stratégie. Les résultats suggèrent toutefois que les participants adaptent leur stratégie.

Premièrement, la fréquence moyenne de gain est modulée par le nombre d’indices

extrinsèques, mais pas par la force d’association extrinsèque, or, le chapitre précédent a

démontré que sous ces conditions, le nombre d’indices n’a pas d’impact sur la performance

du modèle linéaire, ni même des autres modèles. Ainsi, le simple fait de toujours conserver

la même stratégie ne devrait pas moduler la différence de performance entre celle-ci et une

stratégie distincte. Deuxièmement, les résultats suggèrent que les individus ont la capacité

de se comporter comme l’ensemble des stratégies modélisées, du moins sous certaines

conditions. Cette observation constitue un appui empirique supplémentaire à l’utilisation

des heuristiques d’ancrage et ajustement (Goodwin & Wright, 1994; Harvey, 2007;

Lawrence et al., 2006; Lawrence & O’Connor, 1995; Reimers & Harvey, 2011), de limites

et vraisemblance (Becker & Leopold-Wildburger, 1996; Becker et al., 2007), et de

jugement linéaire dans un contexte de prévision de séries temporelles. Troisièmement, la

variation des facteurs associés à la source extrinsèque d’information semble moduler le

comportement des participants. Par exemple, l’augmentation du nombre d’indices a

généralement pour effet d’éloigner le comportement des participants de celui du jugement

linéaire. De plus, les modèles d’heuristiques augmentent en représentativité du

comportement humain avec l’augmentation du nombre d’indices. Ainsi, il y a donc un

abandon d’une stratégie similaire au jugement linéaire pour favoriser des stratégies

similaires aux heuristiques modélisées. Cette observation était attendue, puisqu’il a été

souvent observé que les individus abandonnent la stratégie de jugement linéaire lorsque le

nombre d’indices dépasse trois (Hogarth & Karelaia, 2008). Ce phénomène est

généralement attribué aux limites cognitives fondamentales en mémoire active qui rendrait

impossible le calcul d’interactions à plus de trois variables pour la plupart des individus

(Halford et al., 2005 ; Halford et al., 1998). De plus, cette observation est cohérente avec

141

l’idée selon laquelle l’adoption d’heuristiques résulte d’un abandon de règle normative trop

complexe pour être réalisée adéquatement (Todd & Gigerenzer, 2000; Goldstein &

Gigerenzer, 2009; Gigerenzer et al., 1999; Kahneman et al., 1982). Ces résultats ne

signifient pas, toutefois, que le jugement linéaire est toujours un mauvais représentant de la

stratégie des participants. Au contraire, selon une analyse de comparaison de la fréquence

de représentativité des modèles, la fréquence à laquelle les participants se comportent

comme cette règle rivalise avec l’instance la plus populaire des heuristiques.

Particulièrement, le modèle de jugement linéaire représente bien la stratégie des

participants dans les conditions où le nombre d’indices extrinsèques est égal à trois et où la

force d’association extrinsèque est élevée.

Dans l’ensemble il y a un abandon de l’ensemble des stratégies modélisées

(heuristiques et jugement linéaire) au sein de la condition à sept indices et dont

l’association extrinsèque des indices est faible. Les raisons possibles qui expliquent ce

résultat seront discutées dans la discussion générale du chapitre, mais ce résultat ne reflète

probablement pas l’absence de stratégie puisque c’est également au sein de cette condition

qu’on observe le gain de performance et la fréquence de gain les plus élevés. Ce résultat

pourrait être causé par l’application inconstante d’une même heuristique (par exemple,

Karelaia & Hogarth, 2008) ou encore de l’application de plusieurs stratégies pour la

prévision d’une même série temporelle. Ainsi, bien que la stratégie adoptée (ou la

combinaison de stratégies) ne soit représentée par aucun des modèles de la thèse, elle n’en

demeure pas moins adaptée et performante.

H4 : L’adaptabilité (c.-à-d., la proportion à laquelle le modèle le plus représentatif du

comportement d’un participant correspond au modèle le plus performant) sera supérieure

au hasard.

Le changement de stratégies des participants semble d’ailleurs être proche de

l’optimal dans une grande proportion des cas. En effet, la mesure d’adaptabilité est

relativement élevée pour l’ensemble de l’expérience. Toutefois, comme cette mesure n’est

basée que sur les modèles formalisés dans la présente thèse, elle ne peut identifier les cas

où d’autres stratégies (ou combinaison de stratégies) seraient plus optimales. Néanmoins,

142

l’adaptabilité est fortement corrélée avec le gain de performance, ce qui suggère qu’elle

représente bien la capacité des participants à changer de stratégie de manière adaptée.

Les conclusions portées suite à cette expérience doivent toutefois être nuancées

puisque l’ensemble des stratégies modélisées dans le contexte de la thèse ont la capacité de

bien performer sous ces conditions. Cet environnement est donc très favorable à l’atteinte

de performance supérieure au modèle de jugement linéaire. En effet, tel que discuté

précédemment, le niveau d’autocorrélation des séries temporelles employées dans cette

première expérience est élevé et permet l’application de l’ensemble des stratégies sans

impact important sur la performance. Cela était possible parce que toutes les stratégies non

compensatoires modélisées se fondent sur la source intrinsèque d’information

(particulièrement ANC2 qui constitue le modèle le plus représentatif du comportement

humain avec le jugement linéaire au sein de la présente expérience) alors que les stratégies

compensatoires ont la capacité d’utiliser cette source d’information dans les cas où la

source extrinsèque serait trop dégradée.

Il serait particulièrement intéressant d’évaluer si des conditions dégradées de

validité des indices de source intrinsèque combinées à un nombre d’indices élevé

permettraient l’atteinte de performance supérieure au jugement linéaire. En effet, sous ces

conditions, l’application du modèle ANC2 résulte en une performance réduite alors que

l’application du ML semble contrainte par des limites cognitives. Ainsi, ces conditions

favoriseront probablement un changement de stratégie, mais représenteront un défi

important pour l’atteinte d’un gain de performance par rapport au modèle de jugement

linéaire.

Expérience II

La seconde expérience explore à la fois l’impact de la qualité des indices

intrinsèques et extrinsèques sur les stratégies de prévision des participants et leur

adaptabilité. En manipulant la source intrinsèque et extrinsèque d’information, l’expérience

vise à vérifier si les participants sont capables d’adapter leurs stratégies fortement basées

sur la source intrinsèque d’information vers des stratégies qui se fonderaient sur la source

extrinsèque d’information. De plus, les conditions de cette expérience favorisent l’abandon

143

de modèle de jugement linéaire par les participants en fixant le nombre d’indices

extrinsèques à sept. En effet, l’expérience précédente démontre que la représentativité du

modèle de jugement linéaire est négativement affectée par une augmentation du nombre

d’indices extrinsèques.

Les facteurs manipulés sont la force d’association extrinsèque et l’autocorrélation

des séries temporelles. La force d’association extrinsèque est opérationnalisée comme dans

l’expérience précédente. Elle correspond au maximum des corrélations linéaires absolues

entre les indices extrinsèques et le critère. La force d’association est manipulée pour faire

varier la qualité de la source extrinsèque. L’autocorrélation est opérationnalisée avec la

corrélation des valeurs de la série temporelle sur ses propres valeurs moins une latence de

d’une période (Lawrence et al., 2006). Bien que l’autocorrélation puisse être

opérationnalisée avec une latence plus grande (c’est-à-dire, pour une période > 1), Bolger et

Harvey (1993) démontrent que les individus se fient systématiquement davantage à l’indice

de la période précédente (c’est-à-dire, t-1) qu’à ceux des périodes antérieures (par exemple,

t-2, t-3, etc.). L’objectif de cette manipulation est de dégrader la qualité des indices

intrinsèques. Cette dégradation diminuera fortement la précision d’une stratégie d’ancrage

et ajustement (la stratégie la plus représentative des participants lors de l’Expérience 1) et

les forcera ainsi à adopter une stratégie alternative. Les hypothèses testées sont les mêmes

que celles de l’Expérience 1 :





prévision.




144

MÉTHODE

Participants. L’échantillon se compose de 24 étudiant(e)s de l’Université Laval,

soit 10 hommes et 14 femmes. Une compensation financière de 10$ par session

expérimentale est remise aux participants (donc 40$ pour les quatre sessions). Tous les

participants rapportent une vision normale ou corrigée.

Devis expérimental. La manipulation des facteurs intra-sujets force d’association

extrinsèque (faible [m = .44, SD = .17]; élevée [m = .86, SD = .15]) et autocorrélation du

critère (faible [m = .12, SD = .13]; élevée [m = .81, SD = .18]) engendre un plan

expérimental à mesures répétées 2 × 2. Les participants réalisent l’ensemble des conditions

expérimentales. Le nombre d’indices extrinsèques est tenu fixe à sept. Les conditions sont

contrebalancées entre les participants. La Erreur ! Source du renvoi introuvable.

représente la valeur de chacune des variables pour les 41 tours de la simulation en fonction

de la condition expérimentale.

Procédure. La procédure est la même que celle employée lors de l’Expérience 1

décrite précédemment.

RÉSULTATS

À l’instar de l’Expérience 1, les résultats sont organisés en quatre sections. La

première consiste à décrire les résultats de manière générale. La seconde section concerne

quant à elle à l’analyse de la performance des participants, tant absolue que relative au

jugement linéaire. Cette seconde section est directement associée à l’hypothèse H2 :



La troisième section concerne l’analyse de l’adéquation entre les prévisions des participants

et les prévisions des modèles en fonction des conditions expérimentales. Comparativement

à l’Expérience 1, les facteurs manipulés dans l’Expérience 2 ont démontrés, lors de

simulation computationnelles, qu’ils ont un impact significatif sur la performance des

stratégies. Conséquemment, une modulation de stratégie des participants serait

145

particulièrement pertinente dans ce contexte. Ces analyses sont directement en lien avec

l’hypothèse H3 :



prévision.

Finalement, la quatrième section concerne l’analyse du niveau d’adaptabilité et est en lien

avec l’hypothèse H4 :




Description. La Figure 39 illustre un exemple de prévision des participants en

comparaison avec la série temporelle critère.

Figure 39. Exemple des réponses données par un sous-ensemble de 13 participants (gris) comparativement à

la série temporelle critère (noire).

0

2

4

6

8

10

12

14

16

18

20

t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40

146

Les prévisions d’un sous-ensemble de 13 participants sont montrées en gris alors

que la série temporelle à prédire est représentée en noir. Notez que les prévisions sont loin

d’être exactes et qu’elles sont distribuées autour de la série temporelle critère,

particulièrement en comparaison à celles de l’Expérience 1. Une distribution similaire des

prévisions est observée pour l’ensemble des séries temporelles à prédire. C’est l’écart entre

les prévisions des participants et la série temporelle critère qui correspond à la performance

de prévision.

Performance comparative au modèle linéaire. Une première analyse se concentre

d’abord sur la performance des participants, puis sur la comparaison de celle-ci avec celle

d’un jugement linéaire. Les données de deux participants ont été retirées puisque leur

performance était à plus de trois écart-types sous la moyenne. Les moyennes et erreurs

quadratiques moyennes par condition expérimentale sont représentées dans la Figure 40.

Suite à une première inspection visuelle, on remarque que la performance semble nettement

inférieure dans les conditions où l’autocorrélation est faible comparativement à celles où

elle est forte.

Une ANOVA à mesures répétées 2 2 est effectuée sur la performance selon le la

force d’autocorrélation et la force d’association extrinsèque. Les résultats montrent un effet

significatif de la force d’autocorrélation sur la performance F(1,21) = 124.03, p < .001,

= .855. La performance moyenne observée est clairement plus faible dans les conditions

d’autocorrélation faible comparativement aux conditions d’autocorrélation élevée. L’effet

de la force d’association extrinsèque sur la performance est également significatif F(1,21) =

12.57, p = .002, = .374. La performance est moins élevée dans les conditions de force

d’association extrinsèque faible comparativement aux conditions de force d’association

extrinsèque élevée. L’effet de l’interaction des facteurs sur la performance est non

significatif F(1,21) < 1, N.S.

147

Figure 40. Performance moyenne des participants par condition expérimentale (force d’autocorrélation et

force d’association extrinsèque). La performance correspond à la proportion de variance expliquée des séries

temporelles par les prévisions des participants.

Gain de performance. Deux analyses sont effectuées : la première consiste à

analyser l’ampleur du gain de performance (représentée par condition dans la Figure 41)

alors que la seconde se concentre sur la fréquence à laquelle les participants sont meilleurs

que le modèle linéaire. Suite à une inspection visuelle, on constate que seules les conditions

d’autocorrélation forte affichent une moyenne supérieure à zéro. Un test-t est réalisé afin de

vérifier si les gains de performance moyens observés pour ces conditions sont différents de

zéro. Le test-t révèle que la différence pour la condition autocorrélation forte – association

extrinsèque forte est non-statistiquement significative t(21) = 1.69, non significatif. Donc

on ne peut rejeter l’hypothèse nulle selon laquelle la moyenne du gain de performance pour

cette condition est différente de zéro. La moyenne de gain de performance pour la condition

autocorrélation forte – association extrinsèque faible est significativement différente de

zéro t(21) = 3.77, p = .001. On peut donc rejeter l’hypothèse nulle selon laquelle la

moyenne de gain de performance pour cette condition est différente de zéro.

148

Figure 41. Gain de performance moyen des participants par condition expérimentale (autocorrélation et force

d’association extrinsèque). Le gain de performance correspond à la différence entre la performance des

participants et de celle obtenue par l’application parfaite du modèle de jugement linéaire.

Une ANOVA à mesures répétées 2 2 est effectuée sur le gain moyen selon le

nombre d’indices extrinsèque et la force d’association extrinsèque. Les données de deux

participants ont été retirées puisque leur performance pour deux des conditions était à plus

de trois écart-types sous la moyenne. Les résultats montrent que l’effet de la force

d’association extrinsèque F(1,21) = 30.26, p < .001, = .590 et de la force

d’autocorrélation F(1,21) = 21.52, p < .001, = .506 sur la moyenne du gain de

performance sont statistiquement significatifs. En effet, le gain moyen de performance est

supérieur lorsque la force d’association extrinsèque est faible comparativement à

lorsqu’elle est élevée et est plus élevée lorsque la force d’autocorrélation est forte

comparativement à lorsqu’elle est faible. L’effet de l’interaction des facteurs est non

significatif. La Figure 42 représente la fréquence de gain de performance par participant.

Les participants sont ordonnés en rang et la fréquence maximum est de 32 (32 séries

temporelles).

149

Figure 42. Fréquence de gain de performance par participant. Tous les participants ont obtenus une

performance supérieure à celle du modèle de jugement linéaire à au moins neuf reprises sur une possibilité de

trente-deux.

La fréquence par participant et par condition expérimentale est ensuite calculée et

divisée par le maximum possible (c’est-à-dire, 32, le nombre de séries temporelles). Les

fréquences sont donc représentées entre zéro et un. Une série de tests-t est réalisée afin de

vérifier si la fréquence moyenne de gain obtenue par les participants est différente de zéro.

Les tests-t révèlent que toutes les différences sont statistiquement significatives (voir

Tableau 37).

Tableau 37

Test-t à un échantillon entre fréquence de gain et valeur test de zéro.

Condition t dl p

Force d'association forte – Autocorrélation forte 20.46 23 < .001

Force d'association faible - Autocorrélation forte 12.62 23 < .001

Force d'association forte - Autocorrélation faible 6.13 23 < .001

Force d'association faible - Autocorrélation faible 6.81 23 < .001

Une ANOVA à mesures répétées 2 2 est effectuée sur la fréquence moyenne de

gain selon la force d’autocorrélation et la force d’association extrinsèque. Les résultats

montrent que seul l’effet de la force d’autocorrélation sur la fréquence de gain est

statistiquement significatif F(1,23) = 39.27, p < .001, = .631. En effet, la fréquence de

0

4

8

12

16

20

24

28

32

p1

8

p1

p9

p2

0

p7

p1

4

p2

3

p2

p1

3

p1

7

p8

p1

2

p1

6

p4

p2

4

p1

1

p1

0

p1

9

p2

1

p5

p6

p1

5

p2

2

p3

Fré

qu

en

ce d

e g

ain

(/3

2)

Participant

150

gain est supérieure lorsque la force d’autocorrélation est élevée, comparativement à

lorsqu’elle est faible. Les effets de la force d’association extrinsèque et de l’interaction des

facteurs sont non significatifs (voir Figure 43).

Figure 43. Fréquence de gain standardisée par condition expérimentale (force d’autocorrélation et force

d’association extrinsèque). Les tests-t révèlent que les fréquences sont supérieures à zéro pour l’ensemble des

conditions expérimentales.

Adéquation aux modèles. Pour chacune des 32 séries temporelles et chacun des 24

participants, les prévisions des six modèles sont comparées aux prévisions des participants

avec un test-t pour échantillons pairés (donc = 4608 comparaisons). Ce premier

effort de sélection permet de réduire le nombre moyen de modèles plausibles à 4.11 par

série temporelle. En d’autres mots, suite à cette sélection, en moyenne environ quatre

modèles demeurent représentatifs du comportement des participants pour la prévision d’une

seule série temporelle. Un effort supplémentaire de sélection de modèle est donc nécessaire.

Ainsi, la PVE doit être supérieure à .95 pour que le modèle soit conservé. La sélection

finale réduit le nombre plausible de modèles à 0.22 par série temporelle. Le Tableau 38

montre la fréquence de représentativité de chacun des modèles pour l’ensemble des 32

séries temporelles par participant. Notez que la somme de représentativité des modèles par

151

participant n’égale pas nécessairement le nombre total de séries temporelles pour les

raisons mentionnées précédemment.

Tableau 38

Fréquence de représentativité des modèles par participant.

Participant ANC1 ANC2 L&V1 L&V2 L&V3 ML

P1 0 1 0 0 0 0

P2 2 3 2 1 0 1

P3 1 4 0 1 0 5

P4 1 0 1 1 0 2

P5 0 3 0 1 0 4

P6 1 4 1 0 0 2

P7 0 2 0 1 0 1

P8 1 4 1 1 0 1

P9 0 3 0 1 0 2

P10 1 4 1 1 0 2

P11 1 3 1 1 0 1

P12 0 4 0 0 0 2

P13 0 1 0 1 0 3

P14 1 4 1 0 0 1

P15 0 4 0 1 0 3

P16 2 5 2 1 0 1

P17 2 2 2 1 0 1

P18 1 3 1 0 0 0

P19 1 3 1 1 0 3

P20 0 3 0 0 0 1

P21 2 6 2 1 0 4

P22 0 2 0 0 0 1

P23 0 4 0 1 0 1

P24 1 2 1 1 0 1

Moyenne 0.75 3.08 0.71 0.71 0.00 1.79

Représentativité des modèles. Notez que le modèle L&V3 n’est jamais représentatif

du comportement des participants au cours de l’expérience. Pour cette raison, il sera retiré

des analyses subséquentes. Une série de tests-t pour échantillons uniques est exécutée afin

152

de vérifier si la fréquence de représentativité des autres modèles est différente de zéro. Les

analyses révèlent que les fréquences sont toutes différentes de zéro (voir Tableau 39).

Tableau 39

Test-t à un échantillon entre fréquence d’utilisation des modèles et valeur test de zéro.

Modèle t dl p

ANC1 4.98 23 < .001

ANC2 11.20 23 < .001

L&V1 4.62 23 < .001

L&V2 7.47 23 < .001

ML 6.83 23 < .001

Une ANOVA à mesures répétées sur la fréquence de représentativité des stratégies

avec le modèle comme facteur répété (5 niveaux) est réalisée afin de vérifier si il existe une

différence significative dans la représentativité des modèles, indépendemment de la

condition expérimentale. Les résultats montrent que l’effet du modèle sur la fréquence de

représentativité est statistiquement significatif F(4,92) = 34.225, p < .001, = .598. Afin

de localiser la source de cette différence, une série de comparaisons pairées est réalisée.

Une correction Bonferroni est appliquée pour éviter l’inflation des risques d’une erreur

alpha. L’analyse, résumée dans le Tableau 40, révèle que seuls les modèles ANC2 et ML

sont significativement plus représentatifs du comportement humain comparativement aux

autres modèles. De plus, ANC2 est significativement plus représentatif du comportement

humain que le ML. La représentativité des modèles ANC1, L&V1 et L&V2 n’est pas

significativement différente entre eux.

153

Tableau 40

Différences moyennes absolues de la fréquence de représentativité des modèles. Les

différences non significatives sont ombragées.

ANC2 L&V1 L&V2 ML

ANC1 2.33** 0.04 0.04 1.04*

ANC2

2.38** 2.38** 1.29**

L&V1

0.00 1.08*

L&V2

1.08**

* p < .05

** p < .01

Impact des conditions expérimentales sur la représentativité des modèles. La

proportion de représentativité correspond au nombre de fois où un modèle est représentatif

du comportement humain divisé par le nombre de fois maximum où cela pourrait se

produire (par condition expérimentale). Les proportions moyennes de représentativité du

comportement des participants par condition et modèle sont rapportées dans la Figure 44

(les barres d’erreur indiquent l’erreur quadratique moyenne).

Pour chacun des modèles à l’exception de L&V3, une ANOVA à mesures répétées

2 2 est effectuée sur la proportion de représentativité selon le nombre d’indices

extrinsèques et la force d’association extrinsèque. Le seuil de signification est fixé à .01

(.05/5) pour éviter l’inflation du nombre d’erreur alpha.


du modèle ANC1 selon le nombre d’indices extrinsèque et la force d’association

extrinsèque. L’analyse montre que l’effet de l’autocorrélation sur la représentativité est

statistiquement significatif F(1,23) = 18.76, p < .001, = .449. En effet, la proportion de

représentativité du modèle ANC1 est significativement plus élevée lorsque

l’autocorrélation est élevée que lorsqu’elle est faible. Ni l’effet de la force d’association

F(1,23) < 1, ni celui de l’interaction des facteurs F(1,23) < 1 ne sont significatifs.

154

Figure 44. Proportion moyenne de représentativité des modèles par condition expérimentale (autocorrélation

et force d’association extrinsèque) et modèle.


du modèle ANC2 selon l’autocorrélation et la force d’association extrinsèque. L’analyse

montre que l’effet de l’autocorrélation sur la représentativité du modèle est statistiquement

significatif F(1,23) = 125.45, p < .001, = .845. En effet, les résultats montrent que le

155

modèle ANC2 n’est jamais représentatif du comportement humain dans les conditions de

faible autocorrélation alors qu’une proportion significative est observée dans les conditions

d’autocorrélation forte. L’effet de la force d’association sur la représentativité du modèle

ANC2 est aussi significatif F(1,23) = 21.29, p < .001, = .481, la proportion de

représentativité du modèle ANC2 étant supérieure dans les conditions de force

d’association extrinsèque élevée comparativement aux conditions de force d’association

faible. L’effet d’interaction des facteurs est également significatif F(1,23) = 21.29, p <

.001, = .481. Cet effet s’explique par l’absence totale de représentativité de ce modèle

dans les conditions d’autocorrélation faible. Pour cette raison, une diminution de la

proportion de représentativité du modèle ANC2 est observée entre force d’association forte

à faible, mais seulement dans les cas où l’autocorrélation est forte.

L&V1. Une ANOVA à mesures répétées 2 2 est effectuée sur la proportion de

représentativité du modèle L&V1 selon l’autocorrélation et la force d’association

extrinsèque. Les résultats montrent que seul l’effet d’autocorrélation est significatif F(1,23)

= 21.37, p < .001, = .482. La représentativité du modèle L&V1 est significativement

plus faible dans les conditions d’autocorrélation faible comparativement aux conditions

d’autocorrélation forte. L’effet de la force d’association extrinsèque F(1,23) < 1 et de

l’interaction des facteurs F(1,23) < 1, sur la proportion de représentativité du modèle L&V1

sont non significatifs.

L&V2. Une ANOVA à mesures répétées 2 2 est effectuée sur la proportion de

représentativité du modèle L&V2 selon l’autocorrélation et la force d’association

extrinsèque. Les résultats montrent que l’effet de l’autocorrélation F(1,23) = 55.86, p <

.001, = .708, de la force d’association extrinsèque F(1,23) = 55.86, p < .001,

= .708,

et de l’interaction des facteurs F(1,23) = 55.86, p < .001, = .708, sur la proportion de la

représentativité du modèle L&V2 sont significatifs. Ce patron de résultat (c’est-à-dire, Fs

identiques), est causé par le fait qu’on observe une représentativité non nulle du modèle

L&V2 pour une des quatre conditions. Ainsi, la représentativité de ce modèle n’est

significativement différente de zéro que dans le cas où l’autocorrélation est forte et que

l’association extrinsèque est faible.

156

ML1. Une ANOVA à mesures répétées 2 2 est effectuée sur la proportion de

représentativité du ML1 selon l’autocorrélation et la force d’association extrinsèque. Les

résultats montrent que l’effet de l’autocorrélation F(1,23) = 19.12, p < .001, = .454, de

la force d’association extrinsèque F(1,23) = 36.58, p < .001, = .614, et de l’interaction

des facteurs F(1,23) = 25.71, p < .001, = .528, sur la proportion de représentativité du

ML1 sont significatifs. Des comparaisons pairées multiples sont effectuées pour

décomposer l’interaction (voir Tableau 41).

Tableau 41

Décomposition de l’interaction ML1.


Force d'association forte – Autocorrélation forte vs.

Force d'association faible – Autocorrélation forte 5.89 23 < .001 1.20

Force d'association forte - Autocorrélation faible vs.

Force d'association faible – Autocorrélation faible 0 23 1.000 0

Force d'association forte - Autocorrélation forte vs

Force d'association forte – Autocorrélation faible .569 23 .575 .12

Force d'association faible - Autocorrélation forte vs

Force d'association faible - Autocorrélation faible 6.73 23 < .001 1.37

Les résultats montrent que la proportion de représentativité du ML1 augmente entre

force d’association forte à faible, mais seulement lorsque l’autocorrélation est forte. De

plus, la proportion de représentativité du ML1 est significativement plus élevée lorsque

l’autocorrélation est forte, mais seulement lorsque la force d’association extrinsèque est

faible.

Adaptabilité. La proportion à laquelle les modèles représentatifs correspondent au

modèle le plus performant est utilisée comme mesure d’adaptabilité des participants. Une

analyse de corrélation révèle que la mesure d’adaptabilité est corrélée avec la fréquence

moyenne de gain r(22) = .65, p < .001 et le gain moyen4 r(20) = .48, p = .025. Une analyse

par condition expérimentale est également effectuée afin d’établir si le niveau

4 Les données de deux participants ont été retirées pour cette analyse parce que leur score était à plus de trois

écart-types sous la moyenne.

157

d’adaptabilité est affecté par celles-ci. La Figure 45 représente l’adaptabilité par condition

expérimentale. Une ANOVA à mesures répétées 2 2 est effectuée sur la mesure

d’adaptabilité selon l’autocorrélation et la force d’association extrinsèque. Les résultats

montrent que l’effet de l’autocorrélation F(1,23) = 44.24, p < .001, = .658, de la force

d’association extrinsèque F(1,23) = 11.5, p = .003, = .333 et l’effet d’interaction des

facteurs F(1,23) = 13.07, p < .001, = .362 sur l’adaptabilité sont significatifs.

Figure 45. Adaptabilité par condition expérimentale (autocorrélation et force d’association extrinsèque).

Des comparaisons pairées multiples sont effectuées pour décomposer l’interaction

(voir Tableau 42). L’analyse montre que l’adaptabilité diminue entre association forte et

faible seulement lorsque l’autocorrélation est forte. De plus, l’adaptabilité est plus élevée

lorsque l’autocorrélation est forte comparativement à lorsqu’elle est faible, peu importe la

force d’association extrinsèque.

158

Tableau 42

Décomposition de l’interaction adaptabilité.


Force d'association forte – Autocorrélation forte vs.

Force d'association faible – Autocorrélation forte 3.89 23 .001 .79

Force d'association forte - Autocorrélation faible vs.

Force d'association faible – Autocorrélation faible 0 23 1.000 0

Force d'association forte - Autocorrélation forte vs

Force d'association forte – Autocorrélation faible 6.382 23 < .001 1.30

Force d'association faible - Autocorrélation forte vs

Force d'association faible - Autocorrélation faible 3.680 23 .001 .75

DISCUSSION

H2 : La performance des participants à la tâche de prévision sera supérieure à celle

atteinte par le modèle de jugement linéaire.

H3 : L’adéquation moyenne des prévisions humaines à une stratégie décisionnelle donnée

variera significativement en fonction des caractéristiques de la tâche de prévision.

La présente expérience manipule la qualité des indices intrinsèques et extrinsèques,

de façon à vérifier si les participants sont capables d’adapter leurs stratégies. À cet égard, la

représentativité des prévisions des participants par les modèles formalisés dans la présente

thèse est passablement faible comparativement à l’Expérience 1. Entre autres, une des

instances de l’heuristique de limites et vraisemblance (L&V3) n’est représentative d’aucune

des prévisions des participants dans le cadre de la présente expérience. En fait, les seules

conditions dans lesquelles les modèles formalisés sont représentatifs des prévisions

humaines sont celles qui sont caractérisées par un niveau d’autocorrélation élevé. Aucun

des modèles d’heuristique n’est représentatif du comportement humain lorsque

l’autocorrélation du critère est faible, alors que le ML1 l’est très faiblement. Toutefois, cela

ne signifie pas que les prévisions des participants sont moins performantes qu’une règle de

jugement linéaire. D’ailleurs, la fréquence de gain montre que les participants arrivent tout

de même à mieux performer qu’une règle de jugement linéaire même dans les conditions de

faible autocorrélation.

159



au hasard.

Il semble aussi toujours y avoir un certain niveau d’adaptation des stratégies

employées. En effet, lorsque le niveau d’autocorrélation du critère est élevée, une

diminution de la force d’association extrinsèque mène à une diminution de la

représentativité des prévisions des participants par les heuristiques n’utilisant que la source

intrinsèque d’information au profit des stratégies qui misent à la fois sur la source

intrinsèque et la source extrinsèque (c’est-à-dire, L&V2 et ML). L’adoption de stratégies

basées en partie sur la source extrinsèque d’information alors que la qualité de cette

dernière diminue est particulièrement difficile à expliquer. Le modèle de sélection de

stratégie de Rieskamp et Otto (2006) apporte toutefois une explication potentielle. En effet,

selon ce modèle, les individus compareraient l’utilité de la stratégie actuelle par rapport à

l’utilité attendue des autres stratégies possibles. Ils changeraient de stratégie lorsque l’utilité

attendue d’une stratégie dépasserait l’utilité de la stratégie actuelle, or, l’utilité de toutes les

stratégies dans le contexte de cette expérience était limitée, ainsi il est probable que les

participants changent de stratégie en espérant en adopter une meilleure.

Les stratégies adoptées pour les conditions où la qualité des indices intrinsèques et

extrinsèques est faible demeurent toutefois nébuleuses. Il semble bien que les stratégies

adoptées soient adaptées étant donné le gain de performance, mais les faibles niveaux de

représentativité de l’ensemble des modèles et le faible niveau d’adaptabilité suggèrent que

les stratégies modélisées dans le cadre de la présente thèse ne permettent pas d’expliquer la

stratégie employée par les participants dans ce contexte. Ce patron de résultats mixte

indique qu’il semble y avoir, dans un nombre de cas plus limité que l’Expérience 1, un gain

de performance par rapport à une règle de jugement linéaire, qui est partiellement

attribuable à la sélection adaptée des stratégies modélisées, mais que d’autres stratégies (ou

combinaison de stratégies) non identifiées sont probablement en jeu ou encore que les

individus appliquent leur stratégie de manière inconstante.

160

Discussion Chapitre III

Le présent chapitre étudie l’adoption de stratégies cognitives (heuristiques ou

jugement linéaire) pour la prévision de séries temporelles sous des conditions variées de

qualité d’information. L’objectif est d’explorer si dans certains contextes, les individus

utilisent des stratégies simplificatrices de manière adaptée, menant à des performances au

moins équivalentes au modèle de jugement linéaire. Trois sous-objectifs sont étudiés :

évaluer si la performance des participants est égale ou supérieure à celle du modèle de

jugement linéaire; identifier quelles sont les stratégies employées par les participants; et

vérifier si ces stratégies sont adaptées.

H2 : La performance des participants à la tâche de prévision (telle que mesurée par la

proportion de variance expliquée) sera supérieure à celle atteinte par le modèle de

jugement linéaire.

Les Expériences 1 et 2 suggèrent que la performance des individus dans la prévision

de séries temporelles complexes n’est pas toujours inférieure ou égale à celle obtenue grâce

à l’application d’une règle de jugement linéaire, postulée comme la norme rationnelle dans

ce contexte (Muth 1961; Hogarth & Karelaia, 2008). Par contre, bien que ce phénomène se

produise à plusieurs reprises, le gain de performance par rapport au jugement linéaire est

minime. Ces observations indiquent que, bien qu’il soit possible d’atteindre une

performance équivalente ou supérieure au modèle de jugement linéaire dans la prévision de

séries temporelles, les heuristiques peuvent aussi mener à des performances nettement sous

optimales si elles sont utilisées au mauvais moment (voir aussi Boyd, 2001; Ying Luo,

2013).

H3 : L’adéquation moyenne (telle que mesurée par la proportion de variance expliquée)

des prévisions humaines pour une stratégie décisionnelle donnée variera significativement

en fonction des caractéristiques de la tâche de prévision.

Un autre résultat clé relativement aux objectifs est que les modèles représentatifs du

comportement humain dans ce contexte sont variés. En effet, tous les modèles formalisés

sont représentatifs du comportement humain à un moment ou à un autre. Ceci constitue un

161

appui empirique à l’utilisation de l’heuristique d’ancrage et ajustement (Goodwin &

Wright, 1994; Harvey, 2007; Lawrence et al., 2006; Lawrence & O’Connor, 1995; Reimers

& Harvey, 2011), de limites et vraisemblance (Becker & Leopold-Wildburger, 1996;

Becker et al., 2007) et du jugement linéaire (Hogarth & Karelaia, 2008) pour la prévision

de séries temporelles complexes. De plus, les résultats indiquent que dans les conditions

reproduites dans les Expériences 1 et 2, les participants se comportent le plus souvent

comme s’ils utilisaient une heuristique d’ancrage et ajustement, puis une règle de jugement

linéaire et finalement une heuristique de limites et vraisemblances. Plus précisément, les

données suggèrent que le modèle de l’heuristique d’ancrage et ajustement la plus

fréquemment représentative du comportement humain est celle de Bolger et Harvey (1993).

Dans ce modèle, l’ancrage est constitué de la dernière observation alors que l’ajustement

est composé d’une proportion de la différence entre la plus récente observation et la

précédente. Cela n’est pas surprenant puisque cette version de l’heuristique serait

particulièrement adaptée aux séries temporelles non-stationnaires, ces dernières constituant

la grande majorité des séries au sein de la thèse. Toutefois, les résultats ne permettent pas

de discriminer les deux autres modèles de l’heuristique d’ancrage et ajustement, c’est-à-dire

ceux d’Andreassen (1990) et Lawrence et O’Connor (1993), puisqu’ils mènent toujours aux

mêmes prévisions. Plus de travaux seraient nécessaires afin de bien les discriminer.

En ce qui concerne l’heuristique de limites et vraisemblances, deux modèles

semblent être représentatifs du comportement humain dans le contexte de la thèse. Becker

et ses collègues (1996; 2007) proposent plusieurs modèles de l’heuristique variant

essentiellement sur le nombre d’indices extrinsèques intégrés au sein d’une règle linéaire.

D’ailleurs, cette représentation linéaire des indices constitue une sérieuse limite à

l’application de cette « heuristique » puisque la complexité augmente à chaque nouvel

indice intégré jusqu’à être au moins aussi complexe qu’une règle pure de jugement linéaire.

Les deux versions représentatives du comportement humain sont d’ailleurs celles qui ont un

nombre limité d’indices intégrés (un ou deux) alors que la version non représentative en

comporte huit. Les seules rares occasions où ce modèle représente le comportement humain

sont lorsque le nombre d’indice est de quatre. Considérant les limites cognitives humaines

en mémoire active (Halford et al., 1998; Halford et al., 2005), Becker, Leitner et Leopold-

Wildburger, 2007 prévoyaient eux-mêmes une chute de la représentativité de leur modèle

162

au-delà de quatre indices. Les résultats de la thèse constituent donc un appui empirique à

leur hypothèse. Une autre observation impliquant cette heuristique concerne sa faible

représentativité du comportement humain de façon générale comparativement aux autres

stratégies modélisées alors que certaines études ont observé un niveau élevé d’adéquation

aux prévisions humaines (Becker et al., 2007). Une explication possible est que cette

heuristique repose sur l’extraction rapide de propriétés gestaltiques visuelles des séries

temporelles (Becker & Leopold-Wildburger, 1996). En effet, selon la proposition initiale,

les indices extraits de la série temporelle (par exemple, le nombre de maximum locaux

passés) le sont facilement lorsque la série temporelle est représentée visuellement alors

qu’elles ne sont pas facilement extraites lorsque celle-ci est représentée numériquement, or,

dans la présente thèse le format de présentation des séries n’était pas favorable à

l’utilisation de cette heuristique. Il est donc possible que cette différence dans le format de

présentation des données mène à une représentativité réduite de cette heuristique.

Les résultats montrent aussi que les participants se comportent relativement

fréquemment comme s’ils utilisaient une règle de jugement linéaire, particulièrement

lorsque le nombre d’indices est faible. Ce résultat est cohérant, toujours en considérant les

limites fondamentales en mémoire active (Halford et al., 1998; Halford et al., 2005). La

forte représentativité de cette stratégie démontre que malgré l’importance des heuristiques

simplificatrices (Todd & Gigerenzer, 2000; Goldstein & Gigerenzer, 2009; Gigerenzer et

al., 1999), le jugement linéaire demeure une stratégie représentative du comportement

humain, et ce, même au sein d’une tâche relativement complexe comme celle étudiée dans

la présente thèse. À la lumière d’une approche de rationalité écologique, ce résultat indique

qu’il ne faut pas rejeter les modèles « rationnels » traditionnels comme le jugement linéaire,

mais plutôt que ceux-ci font partie intégrante du coffre à outils cognitif des humains. Ces

modèles demeurent représentatifs d’une bonne proportion des prévisions humaines dans le

contexte de la thèse en plus d’être performant sous certaines conditions, à l’instar des

heuristiques plus simples.

Les résultats suggèrent également que le comportement des individus change en

fonction de la qualité des sources d’information disponibles pour réaliser le jugement. Ce

changement de stratégie en fonction des caractéristiques de l’environnement constitue la

163

base d’une approche de coffre à outils cognitif (Todd & Gigerenzer, 2000; Goldstein &

Gigerenzer, 2009; Gigerenzer et al., 1999), or, dans la présente thèse, la représentativité de

l’ensemble des modèles varie en fonction des conditions expérimentales. Entres autres, une

diminution de la qualité des indices de source intrinsèque mène à une diminution marquée

de la représentativité de l’ensemble des modèles (heuristiques et jugement linéaire) pour la

prévision des séries temporelles. Les stratégies employées par les participants dans ces

conditions (c’est-à-dire, lorsque la qualité des indices intrinsèques est faible) demeurent

inconnues et davantage de travaux seraient nécessaires pour les identifier.



au hasard.

Le patron de résultat suggère que les participants ont bel et bien appliqué une

stratégie et n’ont pas fait de prévision au hasard. En effet, le changement de stratégie, que

la stratégie soit identifiée ou non, semble adaptée, permettant l’atteinte de performances au

moins équivalentes au jugement linéaire dans plusieurs cas. Cela est essentiel et constitue la

pierre angulaire de la rationalité écologique (Dieckmann & Rieskamp, 2007; Rieskamp &

Otto, 2006; Rieskamp & Reimer, 2007). Selon le principe de rationalité écologique, il ne

suffit pas de moduler ses stratégies en fonction des caractéristiques de l’environnement,

mais il faut en plus que ce changement soit adapté, permettant l’atteinte de performance

supérieure. La proportion relativement élevée d’adaptabilité des participants dans

l’Expérience 1 et la corrélation entre cette mesure et le gain de performance indique que les

individus ont sélectionné la stratégie optimale pour faire leur prévision et que cette stratégie

était souvent parmi celles modélisées dans la thèse. Par contre, bien que la mesure

d’adaptabilité soit toujours fortement corrélée avec le gain de performance au sein de

l’Expérience 2, la faible proportion d’adaptabilité observée montre que les stratégies

utilisées pour être meilleur que le modèle de jugement linéaire ne font pas parti de celles

modélisées dans la présente thèse. Tel que discuté précédemment, une explication possible

de ce résultat est que les stratégies modélisées misent toutes sur l’utilisation (partiellement

ou en totalité) de la source intrinsèque d’information, or, au sein de la seconde expérience,

164

la qualité de cette source d’information est manipulée de manière à rendre ces stratégies

inefficaces.

165

CHAPITRE IV

RATIONALITÉ ÉCOLOGIQUE ET PRÉVISION

166

Rappel des principaux résultats

L’objectif de la thèse est de combler les lacunes actuelles dans la démonstration du

concept de rationalité écologique en contexte de prévision de séries temporelles.

Précisément, dans un contexte de prévision de séries temporelles complexes, elle cherche à

démontrer (1) la plausibilité de la rationalité écologique (et sous quelles conditions cela est

possible), (2) que les individus changent de stratégies et (3) que ce changement permet

l’atteinte de performance supérieure à la norme rationnelle attendue, c’est-à-dire le modèle

de jugement linéaire.

Le Chapitre II se centre d’abord sur l’atteinte du premier objectif, c’est-à-dire sur

l’établissement de la plausibilité d’une approche de rationalité écologique dans un contexte

de prévision de séries temporelles et sur l’identification des conditions dans lesquelles une

telle approche est possible. À cet égard et en appui à l’hypothèse H1, les résultats des

simulations I et II démontrent que la prévision de la plupart des séries temporelles est plus

précise lorsque faite par des heuristiques simplificatrices (par exemple, Becker et al., 2007;

Gigerenzer & Sturm, 2011; Reimers & Harvey, 2011), comparativement à une stratégie de

jugement linéaire (voir Karelaia & Hogarth, 2008; Hogarth & Karelaia, 2007), remettant

ainsi son statut de norme rationnelle dans ce contexte (initialement établie par Muth, 1961).

De plus, ces simulations constituent une comparaison systématique de la précision de

plusieurs heuristiques en lien avec la qualité des sources d’information présentes dans une

tâche de prévision de séries temporelles (Harvey, 2007). Particulièrement, les simulations

soulignent l’importance de la qualité de la source d’information intrinsèque

comparativement à la source extrinsèque pour la formulation de prévisions précises par la

plupart des stratégies. Cela appuie, dans une certaine mesure, les études antérieures qui

accordaient une importance élevée aux modèles de prévision basés sur cette source

d’information (par exemple, Goodwin & Wright, 1994; Harvey, 2007; Lawrence et al.,

2006; Lawrence & O’Connor, 1995; Reimers & Harvey, 2011). Finalement, ces

simulations permettent de se prononcer sur les conditions dans lesquelles les heuristiques

sont plus performantes que le modèle de jugement linéaire, ou en d’autres mots, de

cartographier le lien entre les heuristiques et les caractéristiques environnementales (Sturm,

2012). Cela est critique pour l’atteinte de l’objectif O1. Particulièrement, les résultats

167

permettent de juger empiriquement de l’importance de l’auto corrélation, de la force

d’association et du nombre d’indices extrinsèques sur l’adaptabilité des heuristiques

comparativement au modèle de jugement linéaire. En effet, une série d’analyses de

régression démontrent (1) qu’un gain de performance de l’heuristique d’ancrage et

ajustement est associée positivement à la force de l’auto corrélation du critère, (2) que la

force d’association extrinsèque est négativement associé au gain de performance de

l’ensemble des heuristiques, et (3) que le nombre d’indices extrinsèques n’a pas

d’incidence sur le gain de performance des heuristiques modélisées. Dans ce contexte, la

norme rationnelle serait ainsi mieux définie par la sélection adaptée et l’application de

stratégies de prévisions simples en fonction des contraintes environnementales, que par

l’adoption d’une règle linéaire unique plus complexe (Gigerenzer & Sturm, 2011).

La démonstration de la plausibilité d’une telle approche par les simulations ne

permet en rien de se prononcer sur son exécution par des humains (Bröder, 2003). Ainsi,

une deuxième collecte empirique, cette fois-ci impliquant des participants humains, visait à

atteindre les objectifs deux et trois, c’est-à-dire (1) d’évaluer si les individus changent de

stratégie et (2) si ce changement permet l’atteinte de performances supérieures au modèle

de jugement linéaire. Les résultats montrent que les participants utiliseraient, dans certains

cas, des stratégies de manières adaptées. En effet, les résultats indiquent d’abord que la

plupart des prévisions réalisées par les participants sont, à l’occasion, plus précises que

celles réalisées à l’aide de l’application pure d’une règle de jugement linéaire (appuie à

H2). Les résultats montrent également que ce gain de performance serait probablement

attribuable au changement adapté de stratégie de prévision par les participants, et ce,

malgré certaines contraintes du traitement cognitif des individus (par exemple, Halford et

al., 2005; Payne et al., 1993; Simon, 1956) (appuie à H3 et H4). En effet, le patron de

représentativité des stratégies suggère que les participants emploieraient des stratégies

différentes selon les caractéristiques environnementales. Le bassin de stratégies disponibles

serait toutefois contraint par le nombre de paramètres au sein des stratégies individuelles.

Plus précisément, la qualité des indices de source intrinsèque et extrinsèque modulerait la

nature de la stratégie employée pour réaliser la tâche, mais les stratégies nécessitant

l’intégration de huit indices seraient inapplicables. Bien que Harvey (2007) discute de

l’influence des sources d’information dans la sélection d’heuristiques, aucune étude n’a

168

testé cette hypothèse directement au sein d’une tâche de prévision temporelle. En effet, les

études antérieures ne comparaient pas plusieurs stratégies simultanément (par exemple,

Bolger & Harvey, 1993), étaient basées sur des données simulées (par exemple, Becker et

al., 2007) ou n’impliquaient pas un devis intra-participant (par exemple, Lawrence et al.,

2006). De plus, la thèse montre l’importance de considérer à la fois les caractéristiques de

l’environnement, les stratégies et les limites cognitives des individus dans l’étude des

prévisions de situations complexes dynamiques. Un autre résultat qui indique que le

changement adapté des stratégies serait responsable du potentiel gain de performance par

rapport au jugement linéaire est le niveau relativement élevé du niveau d’adaptabilité

observé au sein de l’Expérience I. En effet, cette mesure est une indication de la proportion

de séries temporelles prédites par les participants pour lesquelles la stratégie la plus

représentative est aussi la plus performante dans ce contexte. Sans surprise, cette mesure est

fortement corrélée avec le gain de performance. Les moyennes observées pour cette mesure

sont toutefois plus faible lors de l’Expérience II. Les raisons possibles qui expliquent la

diminution de cette mesure malgré le gain de performance observé sont décrites plus loin

dans la discussion.

Contributions théoriques

La rationalité écologique considère que la norme rationnelle attendue d’une tâche

donnée doit être établie de manière relative plutôt qu’absolue en lien avec les

caractéristiques environnementales (Gigerenzer & Sturm, 2011; Sturm, 2012). Selon cette

vision de la rationalité, les contraintes environnementales jouent un rôle important dans le

façonnement du comportement humain. Une règle de jugement optimale est adaptée en ce

sens où elle permet de compenser pour les contraintes environnementales et ainsi atteindre

une performance efficace dans ce contexte précis (Vuckovic et al., 2013). Les résultats de

la présente thèse s’inscrivent dans cette vision de la rationalité puisqu’ils remettent en

question le caractère absolu de la norme rationnelle attendue du jugement linéaire (Muth,

1961) et suggèrent que la performance optimale ne peut être obtenue par l’adoption d’une

stratégie unique, mais plutôt par le changement adapté de plusieurs stratégies

simplificatrices.

169

NORME RATIONELLE

À la lumière des résultats de la présente thèse le caractère normatif du jugement

linéaire (Anderson, 1981; Brehmer, 1994; Brunswik, 1952; 1955; Hammond, 1996;

Hogarth & Karelaia, 2007; Karelaia & Hogarth, 2008; Tucker, 1964) dans un contexte de

prévision de séries temporelles (Muth, 1961) est remis en question. Particulièrement, les

résultats des simulations suggèrent que la stratégie la plus performante pour réaliser la

tâche de prévision est rarement la règle de jugement linéaire généralement considérée

comme la norme rationnelle attendue dans ce contexte, que les stratégies les plus

performantes sont fréquemment plus simples (en termes de nombre de paramètres)

comparativement à la stratégie de jugement linéaire et qu’il n’existe pas une stratégie

unique qui permet l’atteinte de performance optimale pour l’ensemble des séries

temporelles à prédire. Ainsi, il semble que la norme rationnelle varie en fonction des

contraintes environnementales, tel que postulé par les tenants de la rationalité écologique

(Gigerenzer & Sturm, 2011; Sturm, 2012).

Comment est-ce possible? C’est-à-dire, comment des stratégies simples, souvent

non compensatoires, peuvent supplanter une stratégie compensatoire complexe? Bien que

cette observation ne soit pas nouvelle (par exemple, Hogarth & Kareleia, 2005, 2007) elle

constitue la base de la rationalité écologique et devait être démontrée dans un contexte de

prévision de séries temporelles. Selon Gigerenzer et Gaissmaier (2011), le caractère adapté

des heuristiques serait attribuable à leur simplicité et par leur modularité. En effet, étant

donné le nombre limité de paramètres au sein de ces stratégies, elles requièrent peu

d’information de l’environnement, peu de connaissances en mémoire sur la structure de

l’environnement, et demande peu de ressources cognitives pour leur exécution (par

exemple, Gigerenzer, 2004; Pohl et al., 2013). En termes de nombre de paramètres, elles

sont donc très simples. Ces caractéristiques semblent bien adaptées aux contraintes des

environnements complexes dynamiques tels que ceux étudiés dans le contexte de la

présente thèse. En effet, les individus qui doivent composer avec de tels environnements

sont contraints par des indices de faible validité (Osman, 2010), des connaissances a priori

sur le système souvent négligeables (Kurtz & Snowden, 2010) et une quantité

d’information à considérer qui excède souvent leurs capacités (Funke, 2001).

170

La diminution du nombre de paramètres au sein d’une règle de jugement sera par

contre associée à une diminution de sa flexibilité (Gigerenzer & Gaissmaier, 2011). Ainsi,

les heuristiques simplificatrices, particulièrement les non compensatoires, seraient moins

flexibles qu’une règle compensatoire de jugement linéaire plus complexe. Plus une

heuristique sera simple, moins elle tentera d’optimiser l’adéquation avec les données

disponibles et plus ses prévisions seront prévisibles, systématiques (Tversky & Kahneman,

1974). Par conséquent, les conditions sous lesquelles une heuristique est performante sont

réduites et précises. En déviant de ces conditions, les heuristiques seront biaisées et

nettement moins performantes qu’une règle plus complexe. Les écart-types de performance

des modèles lors de la seconde simulation illustrent bien ce phénomène en suggérant que

les modèles obtiennent des performances très différentes selon les séries temporelles à

prédire. Ce manque de flexibilité peut a priori sembler être contraire à ce qui serait attendu

d’une norme rationnelle, mais serait en partie compensée par un bassin de stratégies variées

(Bröder & Newell, 2008; Gigerenzer, Todd et al., 1999). En effet, si les individus ont accès

à un bassin de plusieurs stratégies simples variées misant sur des informations différentes, il

leur suffirait de sélectionner la bonne stratégie adaptée au contexte. Les résultats des

simulations montrent d’ailleurs que l’utilisation de stratégies variées permettrait l’atteinte

de performance supérieure à l’utilisation d’une règle unique plus complexe de jugement

linéaire. La sélection de l’heuristique appropriée n’est toutefois pas si évidente. En effet,

une telle sélection présuppose que les caractéristiques environnementales permettent de

discriminer les stratégies en termes de performance (Marewski & Schooler, 2011).

STRATÉGIES ET ENVIRONNEMENT

La vision écologique de la rationalité est basée sur la prémisse que l’efficacité des

stratégies sera déterminée par l’adéquation entre leurs caractéristiques propres et les

caractéristiques de l’environnement (Dieckmann & Rieskamp, 2007; Gigerenzer &

Gaissmaier, 2011; Rieskamp & Otto, 2006; Rieskamp & Reimer, 2007; Todd &

Gigerenzer, 2007). Les simulations présentées dans cette thèse visaient essentiellement à

cartographier ce lien entre les caractéristiques environnementales et les stratégies de

prévisions les plus étudiées en lien avec la prévision de séries temporelles. La cartographie

de ce lien est une entreprise empirique encore à ses balbutiements (Sturm, 2012; Gigerenzer

171

& Gaissmaier, 2011), particulièrement dans un contexte de prévision de séries temporelles

(Bröder, 2003).

Performance des modèles. Les résultats montrent que la précision des stratégies à la

tâche de prévision de séries temporelles est influencée significativement par certaines

caractéristiques environnementales, particulièrement par la qualité des sources

d’information disponible. À l’inverse, le nombre d’indices extrinsèques n’est toutefois pas

associé à la performance des modèles. La forte proportion de variance expliquée par les

régressions sur la performance des modèles indique que les facteurs manipulés au sein de la

thèse, à l’exception du nombre d’indices extrinsèques, sont critiques. Précisément, une

qualité élevée des indices de source intrinsèque est associée à une performance moyenne

supérieure des stratégies comparativement à une qualité plus faible des indices de source

intrinsèque. L’effet de la qualité des indices de source extrinsèque est similaire, mais plus

modéré. En effet, une qualité élevée des indices de source extrinsèque est associée à une

performance moyenne supérieure des stratégies comparativement à une qualité faible des

indices extrinsèques. Toutefois, les coefficients de régression standardisés indiquent que

l’importance de ce facteur sur la performance des stratégies serait au moins trois fois

moindre que la qualité des indices de source intrinsèque. Dans certains cas (c’est-à-dire,

L&V3), l’effet de la qualité des indices extrinsèques est même nul. De plus, lorsque la

qualité des indices de source intrinsèque est élevée, l’impact d’une faible qualité des indices

de source extrinsèque semble annulé, tel qu’en témoigne les résultats de la première

simulation. L’analyse des coefficients du ML1 suggère que cela ne peut pas être

uniquement causé par la plus grande qualité des indices de source intrinsèque relativement

aux indices de source extrinsèque puisque aucune différence statistiquement significative

n’est observée dans la pondération de ceux-ci. C’est-à-dire qu’en moyenne, les indices

intrinsèques et extrinsèques sont aussi valides en lien avec la prévision du critère au sein du

ML1. Ces résultats ne sont pas surprenants puisque la qualité des sources d’information

était théoriquement associée à la discrimination des heuristiques et du modèle de jugement

linéaire dans un contexte de prévision de séries temporelles (Harvey, 2007). De plus, Todd,

Gigerenzer et collaborateurs (2011) identifient dans un contexte plus général de jugement,

mais tout de même similaire à la prévision de séries temporelles, quatre facteurs associés à

la structure de l’environnement susceptibles de moduler la performance des stratégies,

172

parmi lesquels on retrouve la qualité des indices. Ces auteurs identifient aussi la distribution

de la qualité des indices comme étant un facteur potentiellement associé à la performance

des stratégies. Ce facteur est indirectement étudié au sein de la présente thèse puisque la

qualité des indices est variée selon l’origine de ceux-ci (intrinsèque et extrinsèque) plutôt

que par indice. Ainsi, la qualité des indices peut être élevée pour les deux sources, une

seule des deux ou aucune. Tel que mentionné précédemment, aucune étude ne démontrait

systématiquement l’influence des facteurs manipulés au sein de la thèse sur la performance

des stratégies dans un contexte de prévision de séries temporelles (Bröder, 2003).

La principale explication de l’importance des indices de source intrinsèque réside

dans le caractère compensatoire ou non compensatoire des stratégies modélisées. Une

stratégie compensatoire a la possibilité d’utiliser plusieurs sources distinctes d’information

(Bröder & Schiffer, 2006). Ainsi, si la validité d’une des sources d’information est

compromise, une telle stratégie pourra compenser avec une autre source d’information et

obtenir une performance raisonnable. À l’inverse, une stratégie non compensatoire n’a pas

la capacité d’intégrer plusieurs sources d’information distinctes (Elrod et al., 2005; Payne

et al., 1993). Par conséquent, si la validité de la source d’information sur laquelle elle se

base est compromise, une telle stratégie ne pourra pas compenser avec une autre source et

sa performance sera donc elle aussi compromise.

Stratégies non compensatoires. Toutes les stratégies non compensatoires étaient

dans l’incapacité d’utiliser des indices de sources extrinsèques. En effet, les modèles non

compensatoires d’ancrage et ajustement (ANC1, ANC2 et ANC3) et de limites et

vraisemblance (L&V1) sont uniquement basés sur les indices de source intrinsèque. Par

conséquent, la variation de la qualité des indices intrinsèques a un impact important sur la

performance de ceux-ci. Par contre, il est étonnant d’observer un impact, quoique limité, de

la qualité des indices de source extrinsèque sur la performance de ces modèles.

Théoriquement, puisque ces modèles n’utilisent aucunement les indices de source

extrinsèque, la variation de la qualité de ces derniers ne devrait par avoir d’impact sur leur

performance. Cela s’explique potentiellement par le fait que les facteurs manipulés ne sont

pas parfaitement orthogonaux, malgré un niveau de contrôle expérimental le plus élevé

possible (et confirmé par l’analyse des coefficients de ML1). Toutefois, peu importe

173

l’origine de cette observation, la qualité des indices intrinsèques sur la performance du

modèle ANC2 explique 86% de la variance alors que la qualité des indices extrinsèques

n’explique que 2%. Pour la performance de L&V1, 76% de la variance expliquée est

attribuable à la qualité des indices intrinsèques alors que seulement 8% est attribuable à la

qualité des indices extrinsèques. Bref, ces résultats montrent que la stratégie d’ancrage et

ajustement performe nettement mieux dans des environnements ou la qualité des indices

intrinsèques, et plus particulièrement la force d’auto corrélation, est élevée. Cette

observation constitue un appui supplémentaire à la pertinence de cette heuristique dans les

environnements autocorrélés comme c’est fréquemment le cas pour la prévision de séries

temporelles (Goodwin & Wright, 1994; Lawrence et al., 2006; Lawrence & O’Connor,

1995; Reimers & Harvey, 2011). Ces résultats montrent que c’est aussi le cas pour la

version non compensatoire de l’heuristique de limites et vraisemblance (c’est-à-dire,

L&V1).

Stratégies compensatoires. Tous les autres modèles intégrés dans le contexte de la

présente thèse (L&V2, L&V3 et ML1) étaient compensatoires, c’est-à-dire qu’ils avaient la

capacité d’intégrer des indices de source intrinsèque et extrinsèque. Ainsi, une diminution

de la qualité de l’une ou l’autre des sources d’information pourrait théoriquement être

compensée par l’utilisation d’informations plus valides. Toutefois, les résultats des

simulations suggèrent que la qualité des indices intrinsèques demeure plus importante que

la qualité des indices extrinsèques. Tel que discuté précédemment, il est peu probable que

cela soit causé par une validité plus élevée des indices de source intrinsèque

comparativement aux indices de source extrinsèque puisque l’analyse des coefficients de

régression du ML1 indique qu’il n’y avait pas de différence significative dans les poids

moyens attribués à ces deux sources d’information. Cela pourrait donc être expliqué par la

nature de l’intégration des indices de source extrinsèque et par la nature de

l’opérationnalisation de la force d’association extrinsèque. En effet, les coefficients de

régression indiquent que l’effet de la qualité de la source extrinsèque sur la performance

des modèles L&V2 et L&V3 est inférieure comparativement à l’influence de ce même

facteur sur la performance du ML1, or, ces deux classes de modèles (limites et

vraisemblance et jugement linéaire), n’utilisent pas les indices extrinsèques de la même

façon en plus de les pondérer différemment. En effet, l’heuristique de limites et

174

vraisemblance extrait des indices extrinsèques alors que le jugement linéaire utilise la

valeur explicitement disponible des indices extrinsèques. Par conséquent, il est possible que

l’opérationnalisation actuelle de la qualité des indices extrinsèque (déterminée à partir des

valeurs explicitement disponibles) ne soit pas directement associée à la qualité des indices

extraits. Étant donné que la liste actuelle des facteurs modulant la performance des

stratégies est limitée (Gigerenzer & Gaissmaier, 2011; Todd et al., 2011), cette observation

est critique puisqu’elle souligne ainsi l’existence potentielle d’un facteur, c’est-à-dire la

validité des indices extraits.

Nombre d’indices extrinsèques. Contrairement aux autres facteurs manipulés, le

nombre d’indices extrinsèques ne semble pas être un facteur qui influence la performance

des stratégies modélisées dans le contexte de la thèse. Ce résultat est intéressant puisqu’il

signifie que les stratégies qui utilisent plusieurs indices extrinsèques (c’est-à-dire, L&V3 et

ML) ne bénéficient pas de cette option par rapport aux autres stratégies. Toutefois, il ne

faut pas invalider ce facteur comme déterminant de la performance des stratégies. En effet,

le nombre limité d’observations (c’est-à-dire, 40 périodes par série temporelle) est

relativement peu élevé comparativement au nombre d’indices intégrés (c’est-à-dire, huit

indices) au sein des modèles L&V3 et ML1 (Todd et al., 2011). De plus, la force et la

nature des relations entre les variables des situations complexes et dynamiques sont souvent

changeantes (Kurtz & Snowden, 2010). Cela signifie, concrètement, que la valeur d’un

index de corrélation entre deux séries temporelles sera instable dans le temps. Par exemple

pour les 10 premières périodes, une corrélation entre deux séries temporelles pourrait

indiquer une valeur positive, alors qu’elle pourrait être négative pour les 10 périodes

suivantes. Cela limite d’autant plus le nombre d’observations pour lesquelles les données

sont valides. Pour ces raisons, ce facteur risque d’être peu déterminant de la performance

des modèles au sein des situations complexes et dynamiques telles que celles étudiées dans

la présente thèse, toutefois, il pourrait bien se révéler important dans des situations plus

régulières (Karelaia, 2006).

À la lumière de ces résultats, il semble clair que la performance des modèles est

affectée par les facteurs associés à la qualité des indices. Toutefois, les défenseurs de la

rationalité écologique soulignent que non seulement la performance des stratégies est

175

déterminée en fonction des contraintes environnementales (Dieckmann & Rieskamp, 2007;

Gigerenzer & Gaissmaier, 2011; Rieskamp & Otto, 2006; Rieskamp & Reimer, 2007; Todd

& Gigerenzer, 2007), mais que la performance atteinte par des stratégies simples peut être

supérieure à celle obtenue par des stratégies complexes normatives tel que le jugement

linéaire (Sturm, 2012; Gigerenzer & Gaissmaier, 2011).

Discrimination des classes de modèle. Une série d’analyses visait ainsi à évaluer si

les contraintes environnementales permettaient de discriminer les classes de modèles (c’est-

à-dire heuristiques et jugement linéaire) en termes de performance à la tâche de prévision

de série temporelle. Alors que des résultats antérieurs ont déjà démontré que certaines

heuristiques permettaient l’atteinte de performances au moins équivalentes au jugement

linéaire (par exemple, Borges et al., 1999; Boyd, 2001; Ying Luo, 2013; Bolger & Harvey,

1993; Lawrence & O’Connor, 1995), les conditions qui favorisent ce phénomène

demeurent floues et sans cadre interprétatif clair (Todd & Gigerenzer, 2007). Les analyses

soulèvent que seul le gain de performance de trois modèles d’heuristiques semble modulé

de façon significative par les facteurs expérimentaux, c’est-à-dire la force de l’auto

corrélation du critère, la force d’association extrinsèque et le nombre d’indices

extrinsèques. Ces trois modèles sont ANC1, ANC2 et L&V3 (il y a donc quatre modèles,

implicitement, puisque ANC1 et ANC3 ont un comportement identique). Pour ces modèles,

la proportion de variance expliquée par la régression des trois facteurs manipulés sur le gain

de performance varie entre 10% et 20%. Cela ne signifie pas que les autres modèles ne

représentent pas des stratégies potentiellement meilleures que le jugement linéaire, mais

seulement que les conditions sous lesquelles le gain de performance varie ne sont pas

manipulées dans le contexte de la présente thèse. Les paragraphes suivants discutent de

l’implication de chacun des facteurs manipulés dans la discrimination des modèles.

Nombre d’indices extrinsèques. Parmi les observations critiques, on constate que

l’effet du nombre d’indices extrinsèques sur le gain de performance des modèles

d’heuristiques n’est jamais significatif. Sous les conditions de la thèse, le nombre d’indices

extrinsèques n’était pas un facteur discriminant de performance entre les classes de modèle.

Dans un cadre d’interprétation coûts/bénéfices (voir Beach & Mitchell, 1978; Christensen-

Szalanski, 1978; Payne, Bettman, & Johnson, 1988, 1993; Smith & Walker, 1993), ce

176

résultat suggère que la cause de l’abandon du modèle linéaire observé dans plusieurs études

serait probablement davantage liée aux coûts en termes d’efforts cognitifs qu’aux bénéfices

en termes de gain de performance. Ce résultat sera discuté davantage dans la prochaine

section traitant des limites cognitives des individus.

Force d’association extrinsèque. La force d’association extrinsèque est

négativement associée au gain de performance de l’ensemble des modèles de la classe des

heuristiques. Cela suggère que le modèle de jugement linéaire est avantagé

comparativement à l’ensemble des modèles d’heuristiques lorsque les indices extrinsèques

augmentent en validité. Cela n’est généralement pas une surprise en ce qui concerne les

modèles non compensatoires d’ancrage et ajustement (Lawrence & O’Connor, 1995;

Bolger & Harvey, 1993) et L&V1 (Becker & Leopold-Wildburger, 1996) et de limites et

vraisemblance, car ces derniers n’utilisent pas les indices extrinsèques. À l’inverse, ce

résultat est plus surprenant en ce qui concerne les modèles compensatoires, c’est-à-dire les

modèles L&V2 et L&V3 de limites et vraisemblance (Becker et al., 2005; 2007). Toutefois,

comme mentionné précédemment, les modèles de limites et vraisemblance utilisent des

indices extraits plutôt qu’explicitement disponibles au sein de l’environnement en plus de

pondérer les indices de façon différente au ML1. Ces différences pourraient être ce qui

explique la performance supérieure de ML1 comparativement à L&V2 et L&V3.

Auto corrélation du critère. Bien que l’auto corrélation du critère soit fortement

associée à la performance de tous les modèles, est-ce que ce facteur permet également de

les discriminer? Les résultats suggèrent que oui. En effet, plus le critère est auto corrélé,

plus la performance des modèles ANC1 et ANC2 est élevée comparativement au modèle de

jugement linéaire. L’heuristique d’ancrage et ajustement (Bolger & Harvey, 1993;

Lawrence & O’Connor, 1995) utilise la dernière valeur observée pour réaliser sa prévision

alors que le modèle de jugement linéaire base son estimation sur l’ensemble des données

observées jusqu’à présent (Tucker, 1964). Toutefois, comme mentionné précédemment, les

relations entre les variables au sein des environnements complexes et dynamiques sont

souvent changeantes, ce qui limite la validité des observations passées pour la prévision du

futur, or, étant donné que les modèles ANC1 et ANC2 se basent uniquement sur la dernière

177

valeur observée pour réaliser leurs prévisions, ces modèles sont moins vulnérables au

changement de relations que le ML1 (Karelaia 2006).

Territoire non cartographié. En plus de cartographier le lien entre la qualité des

indices et la performance de plusieurs modèles existants, l’étude des caractéristiques des

modèles de jugement en lien avec les caractéristiques de l’environnement a mené

essentiellement à deux constats. Premièrement, il y a un certain vide dans les modèles

proposés, à savoir des modèles non compensatoires misant exclusivement sur des indices

de source extrinsèque. En effet, la plupart des études réalisées en lien avec la prévision de

séries temporelles se concentrent uniquement sur une source unique intrinsèque

d’information (par exemple, Becker & Leopold-Wildburger, 1996; Lawrence & O’Connor,

1995; Bolger & Harvey, 1993). Il est donc normal, dans ce contexte, de suggérer des

modèles qui ne misent que sur cette source d’information. Néanmoins, les individus en

charge des prévisions de séries temporelles au sein de domaines de travail réel, notamment

en finance et en gestion des stocks d’inventaires, ont accès à plusieurs sources

d’information extrinsèque (Leitner & Leopold-Wildburger, 2011). Malgré le fait que

certains auteurs croient que suffisamment de modèles ont été proposés pour expliquer le

comportement humain dans ce contexte (Bröder, 2003), la présente thèse suggère que la

proposition de nouveaux modèles non compensatoires serait justifiée à la fois par la

pertinence écologique et méthodologique. Deuxièmement, les facteurs étudiés dans le

contexte de la thèse étaient d’une importance majeure pour la détermination de la

performance des stratégies. En effet, la qualité des indices intrinsèques et extrinsèques

permettent d’expliquer jusqu’à 90% de la variance des modèles étudiés. Toutefois, ces

mêmes facteurs ne permettent pas d’expliquer une grande proportion de la différence

observée entre la performance du jugement linéaire et des heuristiques (c’est-à-dire,

seulement jusqu’à 20%). Cela peut s’expliquer en partie par la grande similarité des

prévisions entre les modèles. En effet, dans le contexte de la thèse, les modèles mènent à

des prévisions très similaires. Tel que discuté précédemment, cela n’est pas très surprenant

puisqu’il est normal que des stratégies toutes conçues pour réaliser la même tâche y arrivent

au moins avec un certain degré de performance. Par contre, cela signifie aussi que les

différences entre les modèles résultent probablement de patrons d’évolution temporelle

178

spécifiques qui ne sont pas bien représentés par les facteurs manipulés au sein de la thèse.

L’identification de ces conditions précises pourra faire l’objet d’études futures.

Une autre observation discutée n’est pas directement en lien avec les hypothèses de

la thèse, mais est néanmoins importante puisqu’elle permet de situer l’ensemble des

résultats dans leur contexte. Les conditions de prévisions évaluées dans le contexte de la

présente thèse étaient très variées en termes de difficulté. C’est-à-dire que dans certains cas,

la performance des modèles et des participants était très élevée, mais que dans d’autres cas,

cette performance était très faible. Notamment, dans les conditions les plus difficiles, les

prévisions moyennes des participants n’expliquent pas la variance du critère à prédire, mais

comportent même davantage de « bruit » que la série temporelle elle-même (cela est

indiqué par une PVE négative). Dans ces circonstances, on peut considérer que les modèles

et individus sont complètement inefficaces à prédire leur environnement. Qu’en est-il, dans

ce cas, du concept de rationalité? Peut-on vraiment parler de réponse optimale dans ce

contexte ou s’il ne s’agit pas plutôt d’un moindre mal? Cette limite importante pourrait être

associée à un mur de la complexité, c’est-à-dire un point à partir duquel la compréhension

de la situation est impossible pour l’humain. Kurtz et Snowden (2003) ont également

soulevé cette limite et considèrent que ces environnements pour lesquels aucune relation de

cause à effet ne peut être perçue sont chaotiques. Selon leur cadre interprétatif, ces

environnements requièrent un ensemble distinct de stratégies décisionnelles

comparativement aux situations dites complexes. Bien qu’ils ne suggèrent pas

explicitement de stratégies décisionnelles applicables au contexte de la thèse, il serait

intéressant de traduire leurs idées en stratégies modélisables afin de tester si des

performances supérieures peuvent être atteintes.

STRATÉGIES ET INDIVIDU

Bien que les simulations démontrent que des stratégies simples peuvent être plus

adaptées que des stratégies complexes, elles ne permettent pas de se prononcer sur

l’adoption de ces stratégies par les humains (Bröder, 2003). De plus, comme le mentionne

Simon (1992), s’il ne suffisait que d’étudier les caractéristiques de l’environnement pour

comprendre le comportement humain, l’étude des heuristiques serait obsolète. En fait, dans

l’optique du coffre à outils cognitif (Gigerenzer & Selten, 2001; Gigerenzer et al., 1999),

179

l’étude des caractéristiques des stratégies en lien avec les contraintes individuelles permet

d’établir quel est le bassin de stratégies disponibles pour réaliser une tâche donnée. Il est

donc critique de bien caractériser les limites cognitives fondamentales des individus,

puisque celles-ci auront un impact important sur le jugement humain.

Limites cognitives. Les simulations ont démontré que le nombre d’indices

extrinsèques n’était pas un facteur déterminant de la performance, ni du gain de

performance des heuristiques par rapport au jugement linéaire, ni des stratégies modélisées.

Néanmoins, le nombre d’indices semble être un facteur déterminant dans la modulation des

stratégies représentatives du comportement des participants dans le contexte de la présente

thèse. Plus précisément, l’augmentation du nombre d’indices extrinsèques mène à une

diminution de la représentativité du modèle de jugement linéaire et du modèle L&V3 de

limites et vraisemblance conjointement à l’augmentation générale de la représentativité des

autres heuristiques modélisées. Au sein de la thèse, les modèles de jugement linéaire et

L&V3 sont les seuls qui nécessitent l’intégration de tous les indices disponibles. Tel que

mentionné précédemment, ce résultat n’est pas surprenant. La littérature attribue

généralement ce phénomène aux limites fondamentales des individus en termes de

traitement de l’information. En effet, plusieurs travaux de domaines variés indiquent qu’au-

delà d’un certain nombre d’indices (Payne et al., 1993) ou de facteurs en interaction

(Halford et al., 2005), les individus n’arrivent plus à exécuter des règles décisionnelles

complexes rationnelles et utilisent donc des heuristiques simplificatrices (Karelaia &

Hogarth, 2008). Cette vision de l’adoption d’heuristiques simplificatrices correspond

davantage à la rationalité contrainte de Simon (1955; 1956) selon laquelle les individus sont

caractérisés par des limites cognitives fondamentales et par conséquent, ne pourraient pas

adopter de règles décisionnelles optimales. Dans une perspective de rationalité écologique

(Sturm, 2012), ces limites viennent contraindre le bassin de stratégies accessibles aux

individus et doivent être considérées dans l’analyse du jugement humain dans ce contexte.

Forces cognitives. Malgré le bassin contraint des individus, les résultats montrent

également que plusieurs stratégies demeurent accessibles. Bref, la thèse valide la pertinence

cognitive des modèles d’ancrage et ajustement (ANC1, ANC2 et ANC3), de certains

modèles de limites et vraisemblance (L&V1 et L&V2) et même du modèle de jugement

180

linéaire lorsque le nombre d’indices se limite à quatre. Les résultats montrent également

que certaines heuristiques sont peut-être manquantes pour bien décrire le comportement

humain dans un contexte de prévision de séries temporelles. En effet, au sein des conditions

expérimentales les plus complexes, la représentativité générale des stratégies modélisées

chute drastiquement. Ainsi, il existe plusieurs situations où aucune stratégie modélisée ne

représente le comportement humain. Il est possible que les critères sévères de

représentativité employés dans la présente thèse soient responsables de ce résultat. En effet,

pour être jugé représentatif, un modèle doit entre autres expliquer 95% et plus de la

variance du comportement d’un individu, or, il a été démontré que le jugement de individus

devenait de plus en plus inconstant avec la diminution de la prévisibilité d’un

environnement (Karelaia & Hogarth, 2008). Bien que les causes demeurent sujettes à

discussion, cette incohérence pourrait être due à l’essai de plusieurs stratégies différentes

lors de l’exécution de la tâche. Cela serait observé au sein d’environnements difficilement

prévisibles parce que l’atteinte de performance faible influencerait le processus

d’alternance entre les stratégies, les individus obtenant une performance médiocre

souhaiteraient l’améliorer en changeant de stratégie (Rieskamp & Otto, 2006). Au sein de

la présente thèse, une telle adaptation signifierait que les individus alterneraient de

stratégies pendant la prévision d’une même série temporelle plutôt qu’entre les séries

temporelles (voir Anufriev & Hommes, 2012). Étant donné que l’adéquation entre

comportement et modèles de stratégies est calculée par série temporelle, cela aurait pour

effet de diminuer la représentativité de l’ensemble des modèles. Bien que ce soit au-delà

des objectifs de la présente thèse, le développement et la validation d’un modèle de

sélection de stratégies permettant l’alternance de stratégies pendant la prévision d’une

même série temporelle permettrait peut-être de vérifier cette hypothèse. Il est également

possible que la faible représentativité des modèles soit causée par l’absence de modèles clés

pour expliquer le comportement humain dans ces situations. Notamment, tel que mentionné

précédemment, aucun modèle ne concerne l’utilisation unique des indices de source

extrinsèque. La présente thèse ne visait toutefois pas à proposer de nouveaux modèles, mais

plutôt à cartographier la performance des modèles existants. Ainsi, elle souligne l’existence

d’un vide potentiel dans la formalisation des stratégies humaines de prévision de séries

temporelles. Néanmoins, malgré ce « vide », les niveaux moyens de représentativité des

181

modèles sont relativement élevés, ce qui signifie qu’une part raisonnable du comportement

humain est décrite par les modèles actuels. De ce fait, sur la base des stratégies modélisées,

il semble que celles qui soient accessibles en termes cognitifs sont fréquemment les plus

performantes pour la prévision des séries temporelles. La force de la rationalité écologique

réside alors dans la modularité de ces stratégies et dans la sélection adaptée de celles-ci

(Todd & Gigerenzer, 2007), or, les résultats de la thèse appuient fortement que les

individus seraient capables d’adapter leur stratégie de manière efficace en fonction des

caractéristiques environnementales. En effet, les résultats montrent que la fréquence à

laquelle les individus performent mieux que le modèle de jugement linéaire est très élevée

peu importe la condition expérimentale. De plus, particulièrement au sein de la première

expérience, la mesure d’adaptabilité indique que les participants sélectionnent souvent la

stratégie modélisée la plus adaptée dans ce contexte. Ces résultats peuvent sembler

contradictoires en lien avec les travaux antérieurs sur les heuristiques qui ont souvent

démontré que l’utilisation d’heuristiques menait à des biais et des erreurs systématiques

(par exemple, Becker & Leopold-Wildburger, 1996; Becker et al., 2007; Bolger & Harvey,

1993; Eggleton, 1982; Harvey, 2007; Lawrence & Makridakis, 1989; O’Connor et al.,

1997; Reimers & Harvey, 2011; Ying Luo, 2013). Toutefois, de manière absolue, la

performance des individus chute généralement dans les mêmes conditions où il y a abandon

de la représentativité du modèle de jugement linéaire. De plus, la performance relative des

individus par rapport au modèle linéaire reste stable ou même augmente dans ces mêmes

conditions. C’est donc dire que les caractéristiques des environnements dynamiques

complexes sont les principaux facteurs qui influencent la performance des individus, au-

delà des stratégies employées. Cela s’explique par le fait (tel que démontré par les

simulations) que l’application pure du jugement linéaire au sein de ces conditions n’aurait

pas mené à une performance supérieure à l’application d’heuristiques de manière adaptée.

En d’autres mots, bien que les heuristiques mènent à des biais et erreurs systématiques,

elles permettent tout de même une performance au moins équivalente au jugement linéaire.

Néanmoins, en guise de réflexion, il est aussi intéressant de noter que le modèle de

jugement linéaire n’est pas complètement écarté et qu’il possède toujours certaines qualités

comparativement au modèle de rationalité écologique. Particulièrement, le problème de

sélection de stratégie ne se pose pas en ce qui concerne le modèle de jugement linéaire.

182

D’un point de vue théorique, cela représente un avantage non-négligeable. En effet, le

fonctionnement par procuration de ce modèle proposé par Brunswick (1952) décrit

justement cette capacité à se comporter à la fois comme plusieurs stratégies décisionnelles.

Bien que sa capacité en termes de flexibilité est ultimement plus limitée qu’un coffre à outil

de d’heuristiques, le modèle de jugement linéaire arrive tout de même à représenter le

jugement humain raisonnablement dans une grande variété de contextes. De plus, le modèle

de jugement linéaire y arrive avec un nombre de paramètres inférieurs au nombre total de

paramètres incluent dans l’ensemble des heuristiques individuellement. Bref, la présente

thèse souligne la plausibilité d’un modèle de rationalité écologique dans un contexte de

prévision de séries temporelles dynamiques et complexes, mais ne permet en rien d’exclure

le modèle de jugement linéaire du débat.

Implications pratiques

La gestion des inventaires et le marché financier sont deux domaines

particulièrement liés à la tâche étudiée dans la présente thèse (Worthen, 2003; Wang &

Chen, 2009). Il semble donc réaliste de dire que les résultats observés dans le contexte de la

thèse, et particulièrement les implications pratiques de ces résultats, s’appliquent à ces

domaines. Toutefois, le paradigme de prévision de séries temporelles possède plusieurs

propriétés qui caractérisent les situations dynamiques complexes de façon plus générale

(Harvey, 2007). Par exemple, elles sont caractérisées par plusieurs éléments en relation qui

évoluent dans le temps de façon autonome (Brehmer, 1992; Edwards, 1962), la structure

sous-jacente est opaque, c’est-à-dire qu’elle n’est pas explicitement disponibles (Gonzalez,

Vanyukov, & Martin, 2005), les patrons d’évolution temporelle ne se répètent que très

rarement ce qui laisse peu de place pour l’apprentissage (Kurtz & Snowden, 2010; Sterman,

2006), les influences entre les variables qui composent le système sont délayées dans le

temps, ce qui augmente l’incertitude et limite la compréhension des individus (Diehl &

Sterman, 1995), etc. Il semble donc raisonnable de penser que les phénomènes observés

dans le contexte de la thèse puissent être représentatifs de ceux qui se produisent dans des

situations dynamiques complexes autres que la prévision de séries temporelles. D’ailleurs,

des études récentes suggèrent que les individus utiliseraient des heuristiques de manière

183

adaptée dans des contextes de prise de décision en situations complexes dynamiques (par

exemple, la gestion du trafic aérien; Vuckovic et al., 2013).

Plusieurs chercheurs développent des procédures, systèmes d’aide à la décision (par

exemple, Lizotte et al., 2008) ou encore des entraînements cognitifs (par exemple, Faghihi

et al., 2011) dont l’objectif est d’améliorer la performance des individus en charge de telles

situations complexes dynamiques. Plusieurs systèmes experts utilisent entre autres la

technique du « bootstrapping » (par exemple, Lafond et al., 2013; O'Connor et al., 2005).

Cette technique est possible puisqu’un modèle linéaire des décisions d’un individu sera

généralement plus performant que les décisions réelles de ce même individu (Camerer,

1981; Karelaia & Hogarth, 2008). Cela s’explique par le fait qu’un modèle linéaire n’est

pas susceptible d’être influencé par des facteurs externes nuisibles ou une présence accrue

et soudaine de bruit dans les données alors que les individus sont susceptibles de l’être. Par

exemple, un individu pourra être momentanément distrait et omettre de considérer un

indice important, ce que le modèle linéaire ne fera pas. Toutefois, certaines conditions ne

sont pas propices à l’utilisation de cette technique, telles que celles observées dans le

contexte de la présente thèse. En effet, lorsque la qualité des indices est dégradée, ou encore

que la nature de la relation entre les indices et le critère est changeante, une telle approche

ne permettra pas l’atteinte de performance supérieure à celle d’un humain sans aide

(Karelaia & Hogarth, 2008). La raison principale qui explique la diminution des modèles

« bootstraping » sous ces conditions est que la performance des décisions passées n’est pas

garante de la performance des décisions futures étant donné la nature changeante des

relations entre les indices et les critères, or, la présente thèse suggère que dans ces

environnements, l’utilisation adaptée d’un bassin d’heuristiques permet l’atteinte de

performance souvent supérieure au jugement linéaire. Ainsi, il serait pertinent d’évaluer la

faisabilité d’un modèle basé sur le principe du « bootstraping », mais dont l’objet serait la

sélection adaptée de stratégies plutôt que le raffinement de la pondération linéaire des

indices.

Un autre résultat clé de la thèse concerne les limites fondamentales des individus

qui limiteraient le bassin de stratégies disponibles pour la réalisation de leurs tâches. Bien

que ce résultat ne soit pas nouveau en soi (Halford et al., 2005), il confirme l’importance de

184

considérer cet élément en plus des caractéristiques environnementales dans l’étude des

stratégies décisionnelles. Ce résultat est pertinent pour le développement de systèmes

d’aide à la décision puisqu’il indique quelles sont les failles des stratégies actuelles

disponibles aux individus qui doivent être palliées (Arias-Hernandez et al., 2012). Le

développement de stratégies supplémentaires qui ne pourraient pas être exécutées par les

individus en raison de leurs limites cognitives permettrait ainsi d’élargir le bassin de

stratégies disponibles. Par exemple, contextuellement à la présente thèse, un système d’aide

à la décision pourrait consister en une régression linéaire intégrant l’ensemble des indices.

Cette stratégie est difficilement réalisable par les individus, tel qu’observé dans la présente

thèse, mais l’est facilement par un ordinateur, et pourrait permettre, sous certaines

conditions, à l’atteinte d’une performance optimale. Le rôle des individus au sein de tels

systèmes d’aide, serait davantage de sélectionner la stratégie adéquate, qu’elle soit

implémentée dans la technologie, ou disponible en mémoire. Pertinemment à ce rôle de

sélection de stratégie, l’entraînement cognitif des individus en charge de la prévision de

situations dynamiques complexes telles que celles étudiées dans la présente thèse devrait se

concentrer sur la sélection adaptée de stratégies plutôt que sur l’apprentissage de stratégies

(trop) complexes pour être appliquées dans un environnement opérationnel.

Contributions méthodologiques

Comme le mentionnent Gigerenzer et Gaissmaier (2011), « formal models of

heuristics are indispensable for progress, yet remain the exception in psychology ». La

modélisation formelle des stratégies permet de faire des prédictions précises sur leur

comportement dans différents contextes et de les comparer entre elles. Dans le cadre de la

thèse actuelle, cette approche de modélisation est combinée à une approche expérimentale

classique impliquant des sujets humains. Ainsi, il est également possible de comparer le

comportement des individus à celui des modèles simulés afin d’estimer la représentativité

de ces derniers.

Cette approche méthodologique comporte certains avantages comparativement à

l’approche du suivi de processus, par exemple. Le suivi des processus consiste à observer

toutes les actions du participant qui précèdent son jugement dans le but d’établir quelles

185

sont les informations consultées (par exemple, Billings & Marcus, 1983; Matsuka & Corter,

2008; Sayeki, 1969; Sundström, 1987). Le suivi de processus comporte certaines limites,

notamment le fait que ce n’est pas parce qu’une information est consultée qu’elle est

utilisée au sein de la stratégie de prévision. Dans le contexte de la thèse, on compare les

prévisions faites par le participant à celles de plusieurs modèles afin d’évaluer lequel de ces

modèles est représentatif des prévisions humaines. Ainsi, peu importe la nature des

informations consultées, il est possible d’estimer l’adéquation aux différents modèles. De

plus, le suivi des processus ne permet pas toujours d’opérationnaliser avec précision les

stratégies cognitives d’intérêt. Par exemple, elle ne permettra pas de discriminer deux

stratégies qui utilisent les mêmes informations, mais qui les pondèrent de façon différente

(Bröder, 2000, 2003). Avec la technique employée dans la présente thèse, il est possible de

discriminer entre deux stratégies en autant que les prévisions faites par les modèles de ces

stratégies ne soient pas identiques.

Par son approche méthodologique, la présente thèse pourrait également être

bénéfique à certains domaines de recherche connexes, notamment l’étude de la prise de

décision dynamique (voir Brehmer, 1992; Busemeyer, 1999; Gonzalez et al., 2005). En

effet, deux problématiques importantes dans l’étude de la prise de décision dynamique

peuvent potentiellement être mitigées par l’adoption d’une méthodologie semblable à celle

adoptée dans la présente thèse. La première problématique est la perte du contrôle

expérimental sur certaines caractéristiques associées à la complexité causée par l’évolution

distincte des simulations en fonction des décisions de chaque participant. En effet, dans une

tâche de prise de décision dynamique, les décisions des participants ont un impact sur

l’évolution de la situation, si bien que chaque série de décision mènera à une instance

spécifique de la simulation. Cela constitue un problème puisque les caractéristiques

associées à la complexité de la simulation peuvent aussi, dans ces conditions, changer en

cours de simulation. Dans ces conditions, le contrôle expérimental sur ces caractéristiques

est difficile et constitue ainsi une limite de ces études puisqu’il devient difficile d’adopter

un plan expérimental factoriel. La méthodologie employée dans cette thèse est différente

puisque les tâches des participants n’ont pas d’impact sur l’évolution de la situation. Ainsi,

le contrôle des caractéristiques associées à la complexité est possible tout au long de la

simulation puisque l’évolution de la situation sera toujours la même, indépendamment des

186

prévisions faites par les participants. La seconde problématique concerne l’évaluation de la

performance des participants. En effet, en prise de décision dynamique, la performance doit

être évaluée en fonction de l’atteinte des objectifs des participants en termes de contrôle de

la situation (Brehmer, 1992; Rigas et al., 2002). C’est-à-dire que dans la prise de décision

dynamique, les participants ont des valeurs cibles à atteindre pour une ou plusieurs

variables et doivent influencer l’évolution du système vers ces cibles. Toutefois, puisque

l’évolution de la situation dépend entre autres des décisions passées des participants, il est

difficile d’évaluer la performance de ceux-ci de façon ponctuelle. La raison est qu’une

décision qui peut sembler sous-optimale de manière ponctuelle peut être optimale en termes

d’atteinte des objectifs à long terme. À l’inverse, une décision optimale ponctuelle peut être

associée à une performance globale sous-optimale (Gureckis & Love, 2009). De plus,

l’impact des décisions initiales dans ce type de situation peut être nettement supérieur à

celui des décisions subséquentes. Dans ce contexte, une quantité équivalente de bonnes et

de mauvaises décisions réalisées par deux participants différents pourra mener à des

performances complètement différentes. Encore une fois, l’utilisation du paradigme des

prévisions de séries temporelles peut constituer une part de solution à ce problème puisque

la précision des prévisions est indépendante des objectifs associés au contrôle de la

situation. En demandant au participant de faire des prévisions sur l’évolution de la situation

(avec ou sans décision qui ont une influence l’évolution de la situation), on arrive à mesurer

leur compréhension de la situation sans interférence associée à la difficulté du contrôle de

celle-ci à un moment donné.

LIMITES

Certaines limites sont toutefois associées à cette méthodologie. Par exemple, elle ne

permet pas de quantifier la représentativité de modèles de jugement qui ne sont pas

formalisés, ni même a priori d’extraire de nouveaux modèles. En effet, la représentativité

des modèles ne peut être évaluée que pour les modèles formalisés. Par exemple, Anufriev et

Hommes (2012) suggèrent d’autres modèles de prévision de séries temporelles basés sur

l’utilisation des indices de sources intrinsèques. Dans le contexte de la présente thèse, cela a

mené à l’absence de modèles non compensatoires basé uniquement sur les indices de

sources extrinsèques. Ainsi, il serait possible que certains modèles soient davantage

187

représentatifs du jugement humain que ceux identifiés dans le contexte de la présente thèse.

Notamment, dans les conditions où la qualité des indices intrinsèques était faible, le niveau

de représentativité général était très bas, pourtant la performance atteinte par les

participants était souvent meilleure que celle qui serait obtenue par l’application pure d’une

règle de jugement linéaire. Pour cette raison, il est difficile de se prononcer sur la stratégie

employée par les participants dans ce contexte. Toutefois, bien qu’il ne soit pas possible

d’identifier avec certitude quelles sont les stratégies employées à tout moment, les résultats

permettent tout de même de dire si les stratégies sont adaptées comparativement au modèle

de jugement linéaire. En effet, comme la performance du modèle de jugement linéaire est

connue, il suffit de comparer la performance observée des individus à celle du modèle de

jugement linéaire. Dans ce contexte, la performance des individus est fréquemment

supérieure à celle du jugement linéaire, ce qui suggère que leur stratégie est adaptée, même

si elle n’est pas toujours identifiable.

Une autre limite associée à cette méthodologie est la possibilité que deux modèles

soient si similaires, en termes de prévision produites, qu’il soit impossible de les

discriminer. C’est le cas, dans la présente thèse des modèles ANC1 et ANC3. Ces modèles

traitent l’information de façon différente, mais arrivent toujours aux mêmes prévisions

numériques au sein des environnements simulés dans la présente thèse. Ainsi, il est

impossible de dire si un individu se comporte davantage comme l’un ou l’autre de ces

modèles. Pour contrer ce problème méthodologique, le paradigme de comparaison de

modèles (par exemple, Bergert & Nosofsky, 2007; Bolger & Harvey, 1993; Shanteau &

Thomas, 2000) pourrait être combiné avec le paradigme de suivi des processus (Billings &

Marcus, 1983; Matsuka & Corter, 2008; Sayeki, 1969; Sundström, 1987). Cela permettrait

de connaître quelles informations ont été consultées par les participants avant de faire leur

prévision et ainsi peut-être de discriminer l’utilisation des modèles.

La présente thèse est également limitée par l’utilisation de la fréquence de gain de

performance plutôt que par le gain de performance moyen. L’utilisation d’une telle

métrique rend difficile la généralisation des résultats au-delà du contexte précis de la thèse.

Par conséquent, l’interprétation des résultats de la thèse doit être mise en contexte et

demanderait une validation empirique supplémentaire.

188

Finalement, une limite de la présente thèse est l’adoption du modèle de jugement

linéaire comme étant la norme rationnelle. En effet, il existe une panoplie d’autres types de

modèles tel que la logique formelle ou encore le jugement bayésien, qui pourrait constituer

la norme rationnelle comparative. Puisque plusieurs des hypothèses testées reposent sur la

prémisse que le jugement linéaire constitue la norme rationnelle, les conclusions qui sont

tirées ne sont aussi fortes que la prémisse sur laquelle elles reposent. Néanmoins, tel que

discuté précédemment, le modèle de jugement linéaire satisfait l’ensemble de conditions

émises par Hastie et Dawes (2010) pour qualifier une stratégie décisionnelle comme étant

rationnelle. De plus, l’une des hypothèses les plus critiques pour l’appui à la rationalité

écologique, c’est-à-dire l’hypothèse selon laquelle l’adéquation aux différentes stratégies

modélisées varie en fonction des conditions expérimentales, ne dépend pas directement de

cette prémisse.

TRAVAUX FUTURS

Dans le contexte des limites liées à la présente thèse, et plus particulièrement la

limite associée à l’utilisation du modèle de jugement linéaire comme norme rationnelle, il

serait pertinent de répliquer ces résultats en les comparant à une norme rationnelle

différente. Particulièrement, le jugement bayésien et la logique formelle seraient deux

avenues pertinentes à envisager. En fait, une telle comparaison permettrait de mieux situer

l’approche de la boîte à outil dans le paysage de la rationalité. La présente thèse propose

une analyse de la rationalité humaine dans un contexte de prévision de situations complexes

dynamiques. Elle soulève néanmoins plusieurs questions pertinentes qui méritent qu’on s’y

attarde davantage, mais qui vont au-delà de la portée de la présente thèse. Entre autres, bien

qu’elle mette en lumière l’importance de certaines caractéristiques environnementales dans

la détermination de la performance des stratégies de jugement, une proportion importante

de la variance du gain de performance des stratégies par rapport au jugement linéaire

demeure inexpliquée. Les caractéristiques des modèles de la présente thèse indiquent que la

validité des indices extraits pourrait représenter un facteur discriminant dans la

performance des stratégies. Toutefois, davantage de travaux seraient requis pour explorer

cette hypothèse. D’autres caractéristiques environnementales sont également suggérées,

mais n’ont pas été testées dans le contexte de la présente thèse. Par exemple, Todd et ses

189

collaborateurs (2011) suggèrent que les caractéristiques environnementales qui déterminent

l’efficacité d’une stratégie donnée sont l’incertitude, la redondance entre les indices, la

taille de l’échantillon et la distribution des poids des indices. La plateforme expérimentale

utilisée dans le cadre de cette thèse, CODEM, est particulièrement efficace pour la

manipulation de plusieurs de ces facteurs. Par exemple, la plateforme permet rapidement de

représenter les données sous forme de graphique plutôt que sous forme numérique, ce qui

est connu pour avoir une incidence sur la sélection des stratégies de prévision dans ce

contexte (Lawrence et al., 2006).

Un autre aspect connexe à la thèse concerne la sélection de stratégie à proprement

parlé. La présente thèse suggère que la sélection de stratégie est déterminée entre autres par

les caractéristiques environnementales, les stratégies et les contraintes cognitives

fondamentales des individus. Les individus sélectionneraient une stratégie adaptée aux

contraintes environnementales et cognitives parmi un ensemble de stratégies disponibles,

un peu à l’image d’un ouvrier qui sélectionne l’outil le plus adapté dans sa boîte à outils.

Par contre, une telle conception de la cognition nécessite un processus de sélection de

stratégie et résulte potentiellement du problème de l’homonculus. Ainsi, plusieurs travaux

se concentrent sur la modélisation d’un tel processus de sélection (Anufriev & Hommes;

2012; Marewski & Scholler, 2011; Pohl et al., 2013; Roberts & Newton, 2001; Rieskamp

& Otto, 2006). Il serait intéressant d’évaluer la pertinence des modèles de sélection

existants dans le contexte de la tâche et des modèles utilisés dans le contexte de la présente

thèse.

191

CONCLUSION GÉNÉRALE

192

La prévision de situations dynamiques complexes est une tâche particulièrement

difficile. Ces situations sont caractérisées par de nombreux éléments en relation. Ces

relations sont souvent changeantes, inconnues et non-linéaires, menant à une évolution

hautement non-linéaire. Les individus en charge de prévoir ou de contrôler de telles

situations ont beaucoup de mal à y arriver, malgré l’importance de leur tâche. Pour

expliquer les erreurs des humains dans ce contexte, plusieurs chercheurs suggèrent que les

individus sont cognitivement limités et que, pour cette raison, ils ne peuvent pas appliquer

les règles normatives rationnelles menant à des performances optimales. D’autres auteurs

suggèrent toutefois que l’utilisation de règles plus simples – nommées heuristiques - est

adaptée puisque la norme ne devrait être établie qu’en lien avec les caractéristiques

environnementales. En d’autres mots, une heuristique pourrait être autant sinon plus

performante que la norme rationnelle sous certaines conditions. Les individus seraient

capables d’adapter l’utilisation des heuristiques en fonction de ces caractéristiques

environnementales et pourraient ainsi performer raisonnablement comparativement à la

norme rationnelle. La présente thèse suggère que c’est seulement à la lumière des

caractéristiques des stratégies, de l’environnement, des individus et de leur interaction, qu’il

est possible de déterminer dans quel contexte une stratégie sera efficace et utilisable. Elle

montre que les heuristiques, quoique biaisées et menant à des erreurs systématiques,

permettent l’atteinte de performances au moins équivalentes à la norme rationnelle de

jugement linéaire dans un contexte de prévision de séries temporelles. De plus, elle spécifie

les limites cognitives en termes de nombre d’indices à considérer qui contraignent les

individus dans l’adoption de stratégies cognitives. Finalement, elle souligne l’importance

de la qualité des indices, particulièrement des indices intrinsèques, dans la détermination de

la performance des stratégies dans un contexte de prévision de séries temporelles et, de

manière plus importante, dans la discrimination des heuristiques et du jugement linéaire.

Ces résultats tempèrent les propos selon lesquels l’utilisation des heuristiques est

irrationnelle en appuyant plutôt une vision écologique de la rationalité selon laquelle la

norme rationnelle est établie selon le contexte environnemental. La réalisation de travaux

supplémentaires est toutefois nécessaire afin de bien documenter le lien entre

caractéristiques environnementales et stratégies, et pour développer et tester des modèles de

sélection de stratégies.

193

RÉFÉRENCES

Abelson, R. P., & Levi, A. (1985). Decision making and decision theory. In G. Lindzey &

E. Aronson (Eds.), Handbook of social psychology. HiIIsdale, NJ: Erlbaum.

Amalberti, R., & Deblon, F. (1992). Cognitive modeling of fighter aircraft process control:

A step towards an intelligent on-board assistance system. International Journal of

Man-Machine Studies, 36(5), 639-671.

Anderson, N. H. (1981). Foundations of information integration theory. New York:

Academic Press.

Anderson, N.H. (1991). A Cognitive Theory of Judgment and Decision. In N.H. Anderson

(Ed.), Contributions to Information Integration Theory Volume I: Cognition, Hillsdale,

NJ: Erlbaum, 105-142.

Anderson, C. A., Lepper, M. R., & Ross, L. (1980). Perseverance of social theories: The

role of explanation in the persistence of discredited information. Journal of

Personality and Social Psychology, 39, 1037 – 1049.

Anderson, T. W. (2011). The statistical analysis of time series (Vol. 19). John Wiley &

Sons.

Andreassen, P. B. (1990). Judgmental extrapolation and market overreaction: on the use

and disuse of news. Journal of Behavioral Decision Making, 3, 153–174.

Andreassen, P. B., & Kraus, S. J. (1990). Judgmental extrapolation and the salience of

change. Journal of Forecasting, 9, 347–372.

Anufriev, M., & Hommes, C. (2012). Evolutionary Selection of Individual Expectations

and Aggregate Outcomes in Asset Pricing Experiments. American Economic Journal:

Microeconomics, 4(4), 35–64. doi:http://dx.doi.org/10.1257/mic.4.4.35

Arias-Hernandez, R., Green, T. M., & Fisher, B. (2012). From Cognitive Amplifiers to

Cognitive Prostheses: Understandings of the Material Basis of Cognition in Visual

Analytics. Interdisciplinary Science Reviews, 37(1), 4–18.

doi:10.1179/0308018812Z.0000000001

Beach, L., & Mitchell, T. R. (1978). A contingency model for the selection of decision

strategies. Academy of Management Review, 3(3), 439–449. Retrieved from

http://www.jstor.org/stable/10.2307/257535

Becker, O., & Leopold-Wildburger, U. (1996). The bounds and likelihood-procedure – a

simulation study concerning the efficiency of visual forecasting techniques. Central

European Journal of Operations Research and Economics 4, 223–229.

194

Becker, O., Leitner, J., Leopold-Wildburger, U. (2005). Modelling judgmental forecasts

under tabular and graphical data presentation formats. In Schmidt, U., Traub, S.

(Eds.), Advances in Public Economics: utility, Choice and Welfare. Springer, pp. 255–

266.

Becker, O., Leitner, J., & Leopold-Wildburger, U. (2007). Heuristic modeling of

expectation formation in a complex experimental information environment. European

Journal of Operational Research, 176(2), 975–985. doi:10.1016/j.ejor.2005.09.003

Becker, O., Leitner, J., & Leopold-Wildburger, U. (2008). Modeling expectation formation

involving several sources of information. German Economic Review 9, 96–112.

Becker, O., Leitner, J., & Leopold-Wildburger, U. (2009). Expectation formation and

regime switches. Experimental Economics 12 (3), 350-364. doi: 10.1007/s10683-009-

9213-0.

Bergert, F. B., & Nosofsky, R.M. (2007). A response time approach to comparing

generalized rational and take-the-best models of decision making. Journal of

Experimental Psychology: Learning, Memory, and Cognition, 33, 107–129.

Billings, R. S., & Marcus, S. (1983). Measures of compensatory and noncompensatory

models of decision behavior: Process tracing versus policy capturing. Organizational

Behavior and Human Performance, 31(3), 331–352. doi:10.1016/0030-

5073(83)90129-0

Bisantz, M., Kirlik, A., Gay, P., Phipps, D., Walker, N., & Fisk, D. (2000). Modeling and

analysis of a dynamic judgment task using a lens model approach. IEEE Transactions

on Systems, Man, and Cybernetics - Part A: Systems and Humans, 30(6), 605–616.

doi:10.1109/3468.895884

Blech, C., & Funke, J. (2005). Dynamis review: An overview about applications of the

Dynamis approach in cognitive psychology. … . 2006): http://www. die-bonn. de/ ….

Retrieved from http://www.psychologie.uni-

heidelberg.de/ae/allg_en/forschun/dynamis/dynamis_review_08-2005.pdf

Bolger, F., & Harvey, N. (1993). Context-sensitive heuristics in statistical reasoning. The

Quarterly Journal of Experimental Psychology Section A, 46(4), 779–811.

Borges, B., Goldstein, D. G., Ortmann, A., & Gigerenzer, G. (1999). Can ignorance beat

the stock market. In G. Gigerenzer, P. M. Todd, & The ABC Research Group (Eds.),

Simple heuristics that make us smart (pp. 59 – 72). Oxford, UK: Oxford University

Press.

Box, G. E., Jenkins, G. M., & Reinsel, G. C. (2013). Time series analysis: forecasting and

control. John Wiley & Sons.

195

Boyd, M. (2001). On ignorance, intuition and investing: A bear market test of the

recognition heuristic. The Journal of Psychology and Financial Markets, 2, 150 – 156.

Brehmer, B., & Allard, R. (1991). Dynamic decision making: The effects of task

complexity and feedback delay. In J. Rasmussen, B. Brehmer, & J. Leplat (Eds.),

Distributed decision making: Cognitive models for cooperative work (pp. 319–334).

Brisbane, Queensland, Australia: Wiley.

Brehmer, B. (1992). Dynamic decision making: human control of complex systems. Acta

psychologica, 81(3), 211–41. Retrieved from

http://www.ncbi.nlm.nih.gov/pubmed/1462786

Brehmer, B. (1994). The psychology of linear judgement models. Acta Psychologica, 87,

137–154.

Bröder, A. (2000). Assessing the empirical validity of the “Take-the-Best” heuristic as a

model of human probabilistic inference. Journal of Experimental Psychology:

Learning, Memory, and Cognition, 26, 1332– 1346.

Bröder, A. (2003). Decision making with the “adaptive toolbox”: Influence of

environmental structure, intelligence, and working memory load. Journal of

Experimental Psychology: Learning, Memory, and Cognition, 29(4), 611–625.

doi:10.1037/0278-7393.29.4.611

Bröder, A., & Schiffer, S. (2006). Adaptive flexibility and maladaptive routines in selecting

fast and frugal decision strategies. Journal of experimental psychology. Learning,

memory, and cognition, 32(4), 904–18. doi:10.1037/0278-7393.32.4.904

Brunswik, E. (1952). The conceptual framework of psychology. Chicago: University of

Chicago Press.

Brunswik, E. (1955). Representative design and probabilistic theory in a functional

psychology. Psychological Review, 62, 193–217.

Burns, B. D., & Vollmeyer, R. (2002). Goal specificity effects on hypothesis testing in

problem solving. Quarterly Journal of Experimental Psychology: Human

Experimental Psychology, 55(A), 241–261.

Busemeyer, J. R., & Pleskac, T. J. (2008). Theoretical tools for understanding and aiding

dynamic decision making. Journal of Mathematical Psychology, 53(3), 126–138.

doi:10.1016/j.jmp.2008.12.007

Busemeyer, J. (1999). Dynamic decision making. International Encyclopedia of the Social

and Behavioral Sciences: Methodology. Mathematics and Computer science. (pp. 1–

17). Amsterdam: Pergamon. Retrieved from

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.132.4256

196

Camerer, C. F. (1981). General conditions for the success of bootstrapping models.

Organizational Behavior and Human Performance, 27, 411– 422.

Carroll, J. S. (1978). The effect of imagining an event on expectations for the event: An

interpretation in terms of the availability heuristic. Journal of Experimental Social

Psychology, 14, 88 – 96.

Chatfield, C. (2013). The analysis of time series: an introduction. CRC press.

Chopra, N., Lakonishok, J., & Ritter, J.R., (1992). Measuring abnormal performance: do

stocks overreact? Journal of Financial Economics 31, 235–268.

Christensen-Szalanski, J. (1978). Problem solving strategies: A selection mechanism, some

implications, and some data. Organizational Behavior and Human, 323, 307–323.

Retrieved from http://www.sciencedirect.com/science/article/pii/0030507378900193

Clements, M. P.,& Hendry, D. F. (2002). Explaining forecast failure. In Michael P.

Clements&David F. Hendry (Eds.), A Companion to Economic Forecasting (pp.

539−571). Oxford, UK: Blackwell Publishers.

Cronin, M., Gonzalez, C., & Sterman, J. D. (2009). Why don’t well-educated adults

understand accumulation? A challenge to researchers, educators, and citizens.

Organizational Behavior and Human Decision Processes, 108(1), 116–130.

doi:10.1016/j.obhdp.2008.03.003

Czerlinski, J., Gigerenzer, G., & Goldstein, D. G. (1999). How good are simple heuristics?

In: Gigerenzer G, Todd PM, the ABC Research Group (eds) Simple heuristics that

make us smart. Oxford University Press, New York, pp 97–118.

Danner, D., Hagemann, D., Holt, D. V., Hager, M., Schankin, A., Wüstenberg, S., &

Funke, J. (2011). Measuring Performance in Dynamic Decision Making. Journal of

Individual Differences, 32(4), 225–233. doi:10.1027/1614-0001/a000055

Dawes, R., & Hastie, R. (2001). Rational choice in an uncertain world: The psychology of

judgment and decision making. Thousand Oaks, CA: Sage.

De Bondt, W. F. M.,& Thaler, R. H. (2002). Doanalysts overreact? In T. Gilovich, D.

Griffin,& D. Kahneman (Eds.), Heuristics and biases: The psychology of intuitive

judgement (pp. 678 – 685). Cambridge, UK: Cambridge University Press.

Desanctis, G., & Jarvenpaa, S. L. (1989). Graphical presentation of accounting data for

financial forecasting: An experimental investigation. Accounting, Organizations and

Society, 14(5,6), 5–9.

Dieckmann, A, & Rieskamp, J. (2007). The influence of information redundancy on

probabilistic inferences. Memory & Cognition. 35, 1801–13.

197

Diehl, E., & Sterman, J. D. (1995). Effects of feedback complexity on dynamic decision

making. Organizational Behavior and Human Decision Processes, 62, 198–215.

Dörner, D. (1996). The logic of failure: Recognizing and avoiding error in complex

situations. Reading, MA: Addison-Wesley.

Dougherty, M. R., & Thomas, R. P. (2012). Robust decision making in a nonlinear world.

Psychological review, 119(2), 321–44. doi:10.1037/a0027039

Edmundson, R. H., Lawrence, M. J., & O'Connor, M. (1988), The use of non-time series

information in sales forecasting: A case study, Journal of Forecasting, 7, 201-211.

Edwards, W. (1962). Dynamic decision theory and probabilistic information processing.

Human Factors, 4, 59–73.

Eggleton, I. R. C. (1982). Intuitive time-series extrapolation. Journal of Accounting

Research, 20, 68 – 102.

Einhorn, H. J., Kleinmuntz, D. N., & Kleinmuntz, B. (1979). Linear regression and process

tracing models of judgment. Psychological Re view, 86, 465–485.

Elrod, T., Johnson, R. D., & White, J. (2005). A new integrated model of noncompensatory

and compensatory decision strategies. Organizational Behavior and Human Decision

Processes, 95, 1–19.

Endsley, M. R. (1995). Toward a theory of situation awareness in dynamic systems. Human

Factors: The Journal of the Human Factors and Ergonomics Society, 37(1), 32-64.

Endsley, M. R. (2000). Theoretical underpinnings of situation awareness: A critical

review. Situation awareness analysis and measurement, 3-32.

Faghihi, U., Fournier-Viger, P., & Nkambou, R. (2011, January). A cognitive tutoring agent

with episodic and causal learning capabilities. In Artificial Intelligence in

Education (pp. 72-80). Springer Berlin Heidelberg.

Fairchild, A. J., MacKinnon, D. P., Taborga, M. P., & Taylor, A. B. (2009). R 2 effect-size

measures for mediation analysis. Behavior research methods, 41(2), 486-498. doi:

10.3758/BRM.41.2.486

Fildes, R., Goodwin, P., Lawrence, M., & Nikolopoulos, K. (2009). Effective forecasting

and judgmental adjustments: an empirical evaluation and strategies for improvement

in supply-chain planning. International Journal of Forecasting, 25(1), 3–23.

doi:10.1016/j.ijforecast.2008.11.010

Fildes, R., & Stekler, H. (2002). The state of macroeconomic forecasting. Journal of

Macroeconomics, 24, 435−468.

198

Fildes, R., & Goodwin, P. (2007). Against Your Better Judgment? How Organizations Can

Improve Their Use of Management Judgment in Forecasting. Interfaces, 37(6), 570–

576. doi:10.1287/inte.1070.0309

Fildes, R., Goodwin, P., Lawrence, M., & Nikolopoulos, K. (2009). Effective forecasting

and judgmental adjustments: an empirical evaluation and strategies for improvement

in supply-chain planning. International Journal of Forecasting, 25(1), 3–23.

doi:10.1016/j.ijforecast.2008.11.010

Forrester, J. W. (1961). System Behavior and Causal Loop Diagrams. System, 1–14.

Funke, J. (2001). Dynamic systems as tools for analyzing human judgment. Thinking and

Reasoning, 7, 69–89.

Gibson, F. P. (2007). Learning and transfer in dynamic decision environments.

Computational and Mathematical Organization Theory, 13(1), 39–61.

doi:10.1007/s10588-006-9010-7

Gibson, F. P., Fichman, M., & Plaut, D. C. (1997). Learning in Dynamic Decision Tasks:

Computational Model and Empirical Evidence. Organizational Behavior and Human

Decision Processes, 71(1), 1–35. doi:10.1006/obhd.1997.2712

Gigerenzer, G. (2004). Fast and frugal heuristics: The tools of bounded

rationality. Blackwell handbook of judgment and decision making, 62-88.

Gigerenzer, G., & Gaissmaier, W. (2011). Heuristic decision making. Annual review of

psychology, 62, 451–82. doi:10.1146/annurev-psych-120709-145346

Gigerenzer, G., & Goldstein, D. G. (1996). Reasoning the fast and frugal way: models of

bounded rationality. Psychological review, 103(4), 650–69. Retrieved from


Gigerenzer, G., & Goldstein, D. G. (1999). Betting on one good reason: The take the best

heuristic. In G. Gigerenzer, P. M. Todd, & The ABC Research Group (Eds.), Simple

heuristics that make us smart (pp. 75 – 95). Oxford, UK: Oxford University Press.

Gigerenzer, G., & Selten, R. (2001). Bounded Rationality: the adaptive toolbox (Vol. 84).

Gigerenzer, G., Todd, P. M., & The ABC Research Group (1999). Simple heuristics that

make us smart. (O. U. Press, Ed.)of Social PsychologyThousand Oaks CA Sage (Vol.

21, p. 416). Oxford University Press. doi:10.1016/S1090-5138(00)00044-1

Goldstein, D. G., & Gigerenzer, G. (1999). The recognition heuristic: How ignorance

makes us smart. In G. Gigerenzer, P.M. Todd, & The ABC Research Group (Eds.),

Simple heuristics that make us smart (pp. 37 – 58). Oxford, UK: Oxford University

Press.

199

Goldstein, D. G., & Gigerenzer, G. (2009). Fast and frugal forecasting. International

Journal of Forecasting, 25(4), 760–772. doi:10.1016/j.ijforecast.2009.05.010

Gonzalez, C., Thomas, R., & Vanyukov, P. (2005). The relationships between cognitive

ability and dynamic decision making. Intelligence, 33(1), 169–186.

doi:10.1016/j.intell.2004.10.002

Gonzalez, C., Vanyukov, P., & Martin, M. (2005). The use of microworlds to study

dynamic decision making. Computers in Human Behavior, 21(2), 273–286.

doi:10.1016/j.chb.2004.02.014

Goodwin, P., & Wright, G. (1994). Heuristics, biases and improvement strategies in

judgmental time series forecasting. Omega, 22(6), 553–568. doi:10.1016/0305-

0483(94)90047-7

Goodwin, P. (2005). How to integrate management judgment with statistical

forecasts. Foresight: The International Journal of Applied Forecasting, (1), 8-12.

Gureckis, T. M., & Love, B. C. (2009). Short-term gains, long-term pains: how cues about

state aid learning in dynamic environments. Cognition, 113(3), 293–313.

doi:10.1016/j.cognition.2009.03.013

Halford, G. S., Baker, R., McCredden, J. E., & Bain, J. D. (2005). How many variables can

humans process? Psychological science : a journal of the American Psychological

Society / APS, 16(1), 70–6. doi:10.1111/j.0956-7976.2005.00782.x

Hammond, K. R. (1996). Human judgment and social policy: Irreducible uncertainty,

inevitable error, unavoidable injustice. Oxford, United Kingdom: Oxford University

Press.

Harvey, N. (2007). Use of heuristics: Insights from forecasting research. Thinking &

reasoning, 13(1), 37–41. doi:10.1080/13546780600872502

Harvey, N. (1988). Judgemental forecasting of univariate time series. Journal of Behavioral

Decision Making, I, 95 – 110.

Harvey, N. (1995). Why Are Judgments Less Consistent in Less Predictable Task

Situations? Organizational Behavior and Human Decision Processes, 63(3), 247–263.

doi:10.1006/obhd.1995.1077

Harvey, N., & Bolger, F. (1996). Graphs versus tables: Effects of data presentation format

on judgemental forecasting. International Journal of Forecasting, 12, 119 – 137.

Harvey, N., Bolger, F., & McClelland, A. (1994). On the nature of expectations. British

Journal of Psychology, 85(2), 203–229. doi:10.1111/j.2044-8295.1994.tb02519.x

200

Harvey, N., Ewart, T., & West, R. (1997). Effects of Data Noise on Statistical Judgement.

Thinking & Reasoning, 3(2), 111–132. doi:10.1080/135467897394383

Hastie, R., & Dawes, R. M. (2010). Rational Choice in an Uncertain World: The

Psychology of Judgment and Decision Making. SAGE Publications.

Hays, W. L. (1963). Statistics for Psychologists. New York: Holt, Rinehart and Winston.

Hilbig, B. E., Erdfelder, E., & Pohl, R. F. (2012). A matter of time: Determinants of one-

reason decision making based on recognition. Acta Psychologica, 141,9-16.

doi:10.1016/j.actpsy.2012.05.006

Hogarth, R. M., & Karelaia, N. (2007). Heuristic and linear models of judgment: matching

rules and environments. Psychological review, 114(3), 733–58. doi:10.1037/0033-

295X.114.3.733

Hogarth, R. M., & Karelaia, N. (2005). Simple models for multi-attribute choice with many

alternatives: When it does and does not pay to face trade-offs with binary attributes.

Management Science, 51, 1860–1872.

Huarng, K.-H., Moutinho, L., & Yu, T. H.-K. (2007). An advanced approach to forecasting

tourism demand in Taiwan. Journal of Travel and Tourism Marketing, 21(4).

Hutchinson J. M. C., & Gigerenzer G. 2005. Simple heuristics and rules of thumb: where

psychologists and behavioural biologists might meet. Behavioural Processes, 69, 87–

124.

Jilani, T. A., & Burney, S. M. A. (2007). M-factor high order fuzzy time series forecasting

for road accident data: Analysis and design of intelligent systems using soft computing

techniques. Advances in Soft Computing, 41, 246–254.

Jilani, T. A., Burney, S. M. A., & Ardil, C. (2008). Fuzzy metric approach for fuzzy time

series forecasting based on frequency density based partitioning. International Journal

of Computational Intelligence, 4(2), 112–117.

Kahneman, D., Slovic, P., & Tversky, A. (1982). Judgement under uncertainty: Heuristics

and biases. Cambridge, UK: Cambridge University Press.

Karelaia, N. (2006). Thirst for confirmation in multi-attribute choice: Does search for

consistency impair decision performance?. Organizational Behavior and Human

Decision Processes, 100(1), 128-143.

Karelaia, N., & Hogarth, R. M. (2008). Determinants of linear judgment: a meta-analysis of

lens model studies. Psychological bulletin, 134(3), 404–26. doi:10.1037/0033-

2909.134.3.404

201

Kleinmuntz, B. (1990). Why we still use our heads instead of formulas: Toward an

integrative approach. Psychological Bulletin, 107, 296–310.

Kurtz, C., & Snowden, D. (2003). The new dynamics of strategy: Sense-making in a

complex and complicated world. IBM Systems Journal, 42(3). Retrieved from

http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5386804

Kurtz, C., & Snowden, D. J. (2010). The new dynamics of strategy: Sense-making in a

complex and complicated world. IBM Systems Journal, 42(3). Retrieved from

http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5386804

Lafond, D., & DuCharme, M. B. (2011). Complex decision making experimental platform

(CODEM): A counter-insurgency scenario. 2011 IEEE Symposium on Computational

Intelligence for Security and Defense Applications (CISDA) (pp. 72–79). Paris.

doi:10.1109/CISDA.2011.5945940

Lafond, D., Tremblay, S., & Banbury, S. (2013). Cognitive shadow: A policy capturing tool

to support naturalistic decision making. 2013 IEEE International Multi-Disciplinary

Conference on Cognitive Methods in Situation Awareness and Decision Support

(CogSIMA), 139–142. doi:10.1109/CogSIMA.2013.6523837

Langer, E. J. (1975). Illusion of control. Journal of Personality and Social Psychology, 32,

311–328.

Lawrence, M. J., & Makridakis, S. (1989). Factors affecting judgemental forecasts and

confidence intervals. Organizational Behavior and Human Decision Processes, 42, 172

– 187.

Lawrence, M. J., & O’Connor, M. (1992). Exploring judgmental forecasting. International

Journal of Forecasting, 8, 15-26.

Lawrence, M. J., & O’Connor, M. (1995). The anchor and adjustment heuristic in

time‐series forecasting. Journal of Forecasting, 14(November 1993), 443–451.

Retrieved from http://onlinelibrary.wiley.com/doi/10.1002/for.3980140504/abstract

Lawrence, M., Goodwin, P., O'Connor, M., & Önkal, D. (2006). Judgmental forecasting: A

review of progress over the last 25years. International Journal of Forecasting, 22(3),

493-518.

Lewis, K. (1989). Changing beliefs and systematic rational forecast errors with evidence

from foreign exchange. American Economic Review, 79, 621−636.

Lichtenstein, S., Slovic, P., Fischhoff, B., Layman, M., & Combs, B. (1978). Judged

frequency of lethal events. Journal of experimental psychology: Human learning and

memory, 4(6), 551.

202

Lim, J., & O’Connor, M. (1996). Judgmental forecasting with time series and causal

information. International Journal of Forecasting, 12, 139–153. Retrieved from

http://www.sciencedirect.com/science/article/pii/0169207095006354

Lipshitz, R. (2000). Two cheers for bounded rationality. Behavioral & Brain Sciences, 23,

756–757.

Lizotte, M., Bernier, F., Mokhtari, M., Boivin, E., DuCharme, M. B., & Poussart, D.

(2008). Image: Simulation for understanding complex situations and increasing future

force agility, Au 26ème Army Science Conference, Dec. 1-4, Orlando, FL.

Ying Luo, G. (2013). Can representativeness heuristic traders survive in a competitive

securities market? Journal of Financial Markets, 16(1), 152–164.

doi:10.1016/j.finmar.2012.05.001

Machuca, J. A. D., Ruiz, J., Domingo, M., & González, M. (1998). Our ten years of work

on transparent box business simulation. Proceedings of the Sixteenth International

Conference of the System Dynamics Society, Québec City (p. 5). Retrieved from

http://www.systemdynamics.org/conferences/1998/PROCEED/00064.PDF

Marewski, J. N., & Schooler, L. J. (2011). Cognitive niches: An ecological model of

strategy selection. Psychological review, 118(3), 393–437. doi:10.1037/a0024143

Matsuka, T., & Corter, J. E. (2008). Observed attention allocation processes in category

learning. The Quarterly Journal of Experimental Psychology, 61(7), 1067–1097.

doi:10.1080/17470210701438194

Maule, A. J. (1994). A componential investigation of the relation between structural

modelling and cognitive accounts of human judgement. Acta Psychologica, 87, 199–

216.

McNees, S.K., 1990. The role of judgment in macroeconomic forecasting accuracy.

International Journal of Forecasting 6, 287–299.

Muth, J. (1961). Rational expectations and the theory of price movements. Econometrica:

Journal of the Econometric Society, 29(3), 315–335. Retrieved from

http://medcontent.metapress.com/index/A65RM03P4874243N.pdf

O’Connor, M., Remus, W., & Griggs, K. (1997). Going up-going down: How good are

people at forecasting trends and changes in trends? Journal of Forecasting, 16(3),

165–176.

O'Connor, M., Remus, W., & Lim, K. (2005). Improving judgemental forecasts with

judgemental bootstrapping and task feedback support. Journal of Behavioral Decision

Making, 18, 247−260.

203

O’Grady, K. E. (1982). Measures of explained variance: Cautions and limitations.

Psychological Bulletin, 92(3), 766–777. doi:10.1037//0033-2909.92.3.766

Osman, M. (2010). Controlling uncertainty: a review of human behavior in complex

dynamic environments. Psychological bulletin, 136(1), 65–86. doi:10.1037/a0017815

Osman, M., & Speekenbrink, M. (2012). Prediction and control in a dynamic environment.

Frontiers in psychology, 3(March), 68. doi:10.3389/fpsyg.2012.00068

Pachur, T., & Hertwig, R. (2006). On the psychology of the recognition heuristic: retrieval

primacy as a key determinant of its use. Journal of experimental psychology.

Learning, memory, and cognition, 32(5), 983–1002. doi:10.1037/0278-7393.32.5.983

Pachur, T., Mata, R.,& Schooler, L. J. (2009). Cognitive aging and the adaptive use of

recognition in decision making. Psychology and Aging, 24, 901-915.

doi:10.1037/a0017211

Paich, M., & Sterman, J. D. (1993). Boom, bust, and failures to learn in experimental

markets. Management Science, 39(12), 1439–1458. Retrieved from

http://www.jstor.org/stable/2633062

Payne, J. W., Bettman, J. R., & Johnson, E. J. (1988). Adaptive strategy selection in

decision making. Journal of Experimental Psychology: Learning, Memory, and

Cognition, 14, 534–552.

Payne, J. W., Bettman, J. R., & Johnson, E. J. (1993). The adaptive decision maker. New

York: Cambridge University Press.

Pezzulo, G. (2008). Anticipation and Anticipatory Systems : and Introduction The Power of

Anticipation : From Reactivity to Proactivity. In G. Pezzulo (Ed.), The Challenge of

Anticipation: A Unifying Framework for the Analysis and Design of Artificial

Cognitive Systems (Goebel, R., pp. 1–5). Heidelberg, Berlin: Springer-Verlag.

Pohl, R. F., Erdfelder, E., Hilbig, B. E., Liebke, L., & Stahlberg, D. (2013). Effort reduction

after self-control depletion: The role of cognitive resources in use of simple heuristics.

Journal of Cognitive Psychology, (January 2013), 1–10.

doi:10.1080/20445911.2012.758101

Poli, R. (2010). An introduction to the ontology of anticipation. Forthcoming in Futures,

42(7), 769–776. doi:10.1016/j.futures.2010.04.028

Reimers, S., & Harvey, N. (2011). Sensitivity to autocorrelation in judgmental time series

forecasting. International Journal of Forecasting, 27(4), 1196–1214.

doi:10.1016/j.ijforecast.2010.08.004

204

Rieskamp, J., & Otto, P. E. (2006). SSL: a theory of how people learn to select strategies.

Journal of experimental psychology. General, 135(2), 207–36. doi:10.1037/0096-

3445.135.2.207

Rieskamp, J., & Reimer, T. (2007). Ecological rationality. Encyclopedia of social

psychology, 273-275.

Rigas, G., Carling, E., & Brehmer, B. (2002). Reliability and validity of performance

measures in microworlds. Scenario, 30, 463 – 480.

Ross, L. D., Lepper, M. R., Strack, F., & Steinmetz, J. (1977). Social explanation and social

expectation: Effects of real and hypothetical explanations on subjective

likelihood. Journal of Personality and Social Psychology, 35(11), 817.

Sanders, N., & Ritzman, L. (1992). The need for contextual and technical knowledge in

judgmental forecasting. Journal of Behavioral Decision Making, 5, 39–52.

Sanders, N. (1992). Accuracy of judgmental forecasts: A comparison. Omega, 20(3), 353–

364. doi:10.1016/0305-0483(92)90040-E

Sayeki, Y. (1969). Information seeking for object identification. Organizational Behavior

and Human Performance. Retrieved from


Seifert, M., & Hadida, A. L. (2013). On the relative importance of linear model and human

judge (s) in combined forecasting. Organizational Behavior and Human Decision

Processes, 120(1), 24-36.

Shanteau, J., & Thomas, R. P. (2000). Fast and frugal heuristics: What about unfriendly

environments?. Behavioral and Brain Sciences, 23(05), 762-763.

Simon, H. A. (1955). A behavioral model of rational choice. The quarterly journal of

economics, 69(1), 99-118.

Simon, H. A. (1956). Rational choice and the structure of the environment. (M. Egidi & R.

Marris, Eds.)Psychological Review, 63(2), 129–138. Retrieved from


Simon, H. A. (1992). What is an “explanation” of behavior?. Psychological Science, 3(3),

150-161.

Smith, V.L., Walker, J., 1993. Monetary rewards and decision cost in experimental

economics. Economic Inquiry 31, 245-261. doi: 10.1111/j.1465-7295.1993.tb00881.x.

Stanley, W. B., Mathews, R. C., Buss, R. R., & Kotler-Cope, S. (1989). Insight without

awareness: On the interaction of verbalization, instruction, and practice in a simulated

205

process control task. Quarterly Journal of Experimental Psychology: Human

Experimental Psychology, 41(A), 553–577.

Stekler, H. O. (2007). The future of macroeconomic forecasting: Understanding the

forecasting process. International Journal of Forecasting, 23(2), 237–248.

doi:10.1016/j.ijforecast.2007.01.002

Sterman, J. D. (1994). Learning in and about complex systems. System, 10(February), 291–

330.

Sterman, J. D. (2000). Business Dynamics: Systems Thinking and Modeling for a Complex

World. Boston, MA: Irwin/ McGraw-Hill

Sterman, J. D. (2010). Does formal system dynamics training improve people's

understanding of accumulation?. System Dynamics Review, 26(4), 316-334.

Stevens, J. P. (2013). Intermediate statistics: A modern approach. Routledge Academic.

Sturm, T. (2012). The “Rationality Wars” in Psychology: Where They Are and Where They

Could Go. Inquiry, 55(1), 66–81. doi:10.1080/0020174X.2012.643628

Sundström, G. (1987). Information search and decision making: The effects of information

displays. Acta Psychologica, 65, 165–179. Retrieved from


Tabachnick, B. G., & Fidell, L. S. (2012). Using Multivariate Statistics. Pearson Education,

Limited.

Teddy, S. D., & Ng, S. K. (2011). Forecasting ATM cash demands using a local learning

model of cerebellar associative memory network. International Journal of

Forecasting, 27(3), 760–776. doi:10.1016/j.ijforecast.2010.02.013

Todd, P. M., & Gigerenzer, G. (2000). Précis of Simple heuristics that make us smart. The

Behavioral and brain sciences, 23(5), 727–41; discussion 742–80. Retrieved from


Todd, P. M., Gigerenzer, G., & The ABC Research Group (2011). Ecological Rationality:

Intelligence in the World. New York: Oxford Univ. Press

Tucker, L. R. (1964). A suggested alternative formulation in the developments by Hursch,

Hammond, and Hursch and by Hammond, Hursch, and Todd. Psychological Review,

71, 528–530.

Tversky, A., & Kahneman, D. (1973). Availability: A heuristic for judging frequency and

probability. Cognitive psychology, 207–232. Retrieved from


206

Vicente, K. (2003). Beyond the lens model and direct perception: Toward a broader

ecological psychology. Ecological Psychology, 15(3), 241–267.

doi:10.1207/S15326969ECO1503

Vollmeyer, R., Burns, B. D., & Holyoak, K. J. (1996). The impact of goal specificity and

systematicity of strategies on the acquisition of problem structure. Cognitive Science,

20, 75–100.

Vuckovic, A., Kwantes, P. J., & Neal, A. (2013). Adaptive decision making in a dynamic

environment: a test of a sequential sampling model of relative judgment. Journal of

experimental psychology. Applied, 19(3), 266–84. doi:10.1037/a0034384

Wang, N.-Y., & Chen, S.-M. (2009). Temperature prediction and TAIFEX forecasting

based on automatic clustering techniques and two-factors high-order fuzzy time series.

Expert Systems with Applications, 36(2 Pt 1), 2143–2154.

Welch, E., Bretschneider, S., & Rohrbaugh, J. (1998). Accuracy of judgmental

extrapolation of time series data Characteristics , causes , and remediation strategies

for forecasting, 14, 95–110.

Woike, J. K., Hoffrage, U., & Hertwig, R. (2012). Estimating Quantities : Comparing

Simple Heuristics and Machine Learning Algorithms, 483–490.

Worthen, B. (2003). Future results not guaranteed; contrary to what vendors tell you,

computer systems alone are incapable of producing accurate forecasts. CIO, 16(19), 1.

Young, P. C. (2011). Recursive estimation and time-series analysis: an introduction for the

student and practitioner. Springer.

207

ANNEXE A

Figure 46. Exemple de prévisions de participants et de modèles pour une série critère avec 3 indices extrinsèques,

autocorrélation élevée et force d’association élevée. Prévisions de deux participants (9 et 11, en bleues), de deux modèles

(ANC2 et ML1, en jaune et vert), la série critère (en rouge) et les séries extrinsèques (en grises).

0

5

10

15

20

t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 t33 t34 t35 t36 t37 t38 t39 t40 t41

Val

eu

r

Période (t)

Extrinsèque 1 Extrinsèque 2Extrinsèque 3 ANC2ML1 Participant 9Participant 11 Série Critère

208




0

5

10

15

20


Val

eu

r

Période (t)

Extrinsèque 1 Extrinsèque 2Extrinsèque 3 Extrinsèque 4Extrinsèque 5 Extrinsèque 6Extrinsèque 7 ANC2ML1 Participant 9Participant 11 Série Critère

209




0

5

10

15

20


Val

eu

r

Période (t)


210


autocorrélation élevée et force d’association faible. Prévisions de deux participants (13 et 16, en bleues), de deux modèles


0

5

10

15

20


Val

eu

r

Période (t)


Documents

Prévision humaine de séries temporelles