Raisonnement sur les actions : de Toronto à Amsterdam · lences 8x8s(p(do(x;s)) $ ˆ(a;s). Nous ne considérons pas cette extension ici. observent que une proposition donnée est

Raisonnement sur les actions : de Toronto a Amsterdam

Hans Van Dimarsch, Andreas Herzig, Tiago De Lima

To cite this version:

Hans Van Dimarsch, Andreas Herzig, Tiago De Lima. Raisonnement sur les actions : deToronto a Amsterdam. ANNALES DU LAMSADE N8. 2007. <hal-00188885>

HAL Id: hal-00188885

https://hal.archives-ouvertes.fr/hal-00188885

Submitted on 19 Nov 2007

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, estdestinee au depot et a la diffusion de documentsscientifiques de niveau recherche, publies ou non,emanant des etablissements d’enseignement et derecherche francais ou etrangers, des laboratoirespublics ou prives.

https://hal.archives-ouvertes.fr

https://hal.archives-ouvertes.fr/hal-00188885

Raisonnement sur les actions :de Toronto à Amsterdam

Hans van Ditmarsch†

[email protected] Herzig‡

[email protected] de Lima‡

[email protected]

†Université d’Otago, Nouvelle Zelande‡Institut de Recherche en Informatique de Toulouse, France

Résumé :Nous montrons comment en raisonnement sur lesactions la fameuse solution de Reiter du problèmedu décor peut être modélisée en logique épisté-mique dynamique, et nous proposons une méthodede régression optimale. Notre méthode étend la so-lution de Reiter en intégrant des actions d’observa-tion et des opérateurs modaux de connaissance, ettraduit le formalisme de Reiter (le Calcul des situa-tions) dans une logique des actions et des connais-sances comprenant des opérateurs d’annonce etd’affectation. En étendant la méthode de réductionde Lutz de la logique des annonces publiques auxaffectation, nous établissons des résultats de com-plexité pour la régression. Nous montrons que cesrésultats sont optimaux : le problème de décider lasatisfiabilité d’une formule est NP-complet pour unagent, PSPACE-complet pour plusieurs agents etEXPTIME-complet dans la présence de l’opérateurde connaissance commune.

Mots-clés : raisonnement sur les actions et change-ment ; logiques épistémique dynamique ; systèmesmulti-agents ; régression.

Abstract:We show how in the propositional case Reiter’swell-known solution to the frame problem can bemodelled in dynamic epistemic logic, and pro-vide an optimal regression algorithm. Our me-thod is as follows : we extend Reiter’s solution byintegrating observation actions and modal opera-tors of knowledge, and encode the resulting for-malism in a dynamic epistemic logic with an-nouncement and assignment operators. By exten-ding Lutz’ recent satisfiability-preserving reduc-tion for public announcement logic to assignments,we establish optimal complexity results for re-gression : satisfiability is NP-complete for oneagent, PSPACE-complete for multiple agents andEXPTIME-complete when common knowledge isinvolved.

Keywords: reasoning about actions and change ;epistemic dynamic logics ; multiagent systems ; ré-gression.

1 Introduction

Dans [14] Thielscher distingue deux ver-sions du problème du décor. La version re-présentationelle est le problème de conce-voir un langage logique et une sémantiquetelle que les domaines peuvent être décritssans expliciter l’interaction entre toutes lesactions et les fluents : quand il y a n actionset m fluents, la description du domainedoit être beaucoup plus petite que 2× n×m. La version inférentielle du problème dudécor est plus exigeante : étant donnée unesolution pour la version représentationelle,il s’agit du problème de concevoir une pro-cédure de décision ‘efficace’, c’est-à-dire,dont la complexité n’est pas trop élevée.

Reiter [10] a résolu la version représen-tationelle du problème du décor en utili-sant ce qu’il appelle des axiomes de l’étatsuivant ("successor state axioms", SSAs).Dans le cas propositionnel, les fluents ontseulement des situations comme argument,et les SSAs prennent la forme :

∀x∀s(p(do(x, s)) ↔ (¬Poss(x, s)∨(x = a1 ∧ γ+(a1, p, s)) ∨ . . .

∨ (x = an ∧ γ+(an, p, s))∨(p(s) ∧ ¬(x = a′1 ∧ γ−(a′1, p, s)) ∧ . . .

∧ ¬(x = a′m ∧ γ−(a′m, p, s)))))

où a1, . . . , an sont les actions pouvant (po-tentiellement) rendre p vrai, et a′1, . . . , a

′m

sont les actions pouvant (potentiellement)rendre p faux. Pour une action donnéeai, soit Eff +(ai) l’ensemble des fluentsqui peuvent devenir vrais par l’exécution

127

de ai, et Eff −(ai) l’ensemble des fluentsqui peuvent devenir fausse par l’exécu-tion de ai (dans [10] ces ensembles sotlaissé implicites). Donc, pour tout fluentp ∈ Eff +(ai), la formule γ+(ai, p, s) ca-ractérise les conditions dans lesquelles ai

rend p vrai, et γ−(ai, p, s) caractérise lesconditions dans lesquelles ai rend p faux.γ+(ai, p, s) et γ−(ai, p, s) doivent être uni-formes en s, ce qui signifie en particulierqu’ils ne peuvent pas contenir la fonctiondo.1

L’idée centrale de Reiter est que, grâceau principe de l’inertie, les ensemblesEff +(ai) et Eff −(ai) sont des ‘petits’sous-ensembles de l’ensemble des fluentsdu langage. Pour cette raison la taille del’ensemble de tous les SSAs peut être demême ordre que le nombre d’actions etdonc, beaucoup plus petite que le pro-duit du nombre d’actions par le nombre defluents. Cela signifie que les SSAs à la Rei-ter comptent comme une solution du pro-blème du décor. Cette solution a été étendupar [12] aux actions épistémiques.

Quand les SSAs sont disponibles pourtouts les fluents p, on peut réduire (‘régres-ser’) toute formule ϕ à une formule équi-valente red(ϕ) qui ne contient pas d’opéra-teur d’action. Ceci fournit alors une procé-dure de décision dans le cas proposition-nel. Cette procédure a été implanté dansle langage GOLOG. Cependant, la for-mule réduite peut être exponentiellementplus longue que celle d’origine ; en consé-quence la version inférentielle du pro-blème du décor n’a pas été résolu ni parReiter ni par Scherl & Levesque.

Dans cet article, nous étendons la solu-tion de Reiter et résolvons la version infé-rentielle du problème du décor. Pour l’ex-tension à la connaissance, parmi les ac-tions épistémiques nous considérons uni-quement les observations : tous les agents

1Plus tard, Reiter et col. généralisent SSAs à des équiva-lences ∀x∀s(p(do(x, s)) ↔ ψ(a, s). Nous ne considérons pascette extension ici.

observent que une proposition donnée estvraie dans le monde, et mettent à jourleurs état de connaissance en fonction.2Nous proposons une transformation po-lynomiale qui préserve la satisfiabilité deformules et élimine les opérateurs d’ac-tion. Ceci nous permet de définir une mé-thode optimale pour raisonner sur les ac-tions dans ce scénario : dans le cas debase sans l’opérateur de connaissance ainsique dans le cas d’un seul agent, la pro-cédure est dans NP ; dans le cas multi-agents, elle est dans PSPACE ; et dans lecas avec connaissance commune, elle estdans EXPTIME. Ces résultats sont opti-males puisqu’ils coïncident avec la com-plexité de la logique épistémique de base.

Techniquement, notre approche est basésur les avances récentes en logiques épis-témiques dynamiques. Dans cette famillede logiques, les situations sont laissées im-plicites, et il n’y a pas de quantificationsur les actions. Donc, l’outil central dela solution de Reiter n’est pas disponible.Cependant nous montrons que nous pou-vons transposer cette solution sans sa pré-sence et reconstruire cette solution en lo-gique épistémique dynamique DELC

N , pro-posé par [16, 6]. Les annonces peuventêtre utilisées pour modéliser les obser-vations, tandis que les affectations per-mettent de modéliser les actions de chan-gement du monde (dites actions ontiques).DELC

N étant une extension de la logiquedes annonces publiques de Plaza, nousétendrons la procédure de décision op-timale de Lutz pour la dernière ([7]) àDELC

N , et nous montrerons que nous pou-vons préserver l’optimalité de la procé-dure : la vérification de satisfiabilité de for-mules dans DELC

N est démontré avoir lamême complexité que la vérification de sa-tisfiabilité dans la logique épistémique debase.

2Notons que les observations sont différentes des actions deperception (sensing) introduites dans [12]. En exécutant ces der-nières, les agents observent si une proposition donnée est vraieou non.

Raisonnement sur les actions : de Toronto à Amsterdam___________________________________________________________________________

128

2 Base : logique épistémiqueELC

N

Soit P un ensemble infinie et dénombrablede lettres propositionnelles, et soit N unensemble finie d’agents. Par commodité,nous abusons de la notation et identifionsN avec l’ensemble d’entier {1, . . . , |N |}.Le langage LELC

Nde la logique épisté-

mique avec connaissance commune est dé-finie par la BNF :

ϕ ::= p | ¬ϕ | ϕ ∧ ϕ | Kiϕ | CGϕ

où p est un élément de P , i est un élémentde N , et G est un élément de ℘(N). Laformule Kiϕ signifie : ‘l’agent i sait queϕ’, et CGϕ signifie : ‘il est connaissancecommune parmi les agents du groupe Gque ϕ’. Nous utilisons les abréviation ha-bituelles pour ‘∨’, ‘→’, ‘↔’, et Eiϕ, poursous-ensembles G de N . Nous rappelonsque le dernier est définie par : EGϕ =∧

i∈G Kiϕ. Le langage LELNest obtenu du

langage LELCN

par exclusion de l’opérateurde connaissance commune du dernier.

Un ELCN -modèle est une tuple M =

〈W,K, V 〉 où :– W est un ensemble non-vide des

mondes possibles ;– K : N → ℘(W ×W ) associe une rela-

tion d’équivalence Ki à chaque i ∈ N .– V : P → ℘(W ) associe une interpréta-

tion V (p) ⊆ W à chaque p ∈ P .Par commodité, nous définissons Ki(w) ={w′ | (w,w′) ∈ Ki}. La relation Ki modé-lise la connaissance de l’agent i : Ki(w)est l’ensemble des mondes que l’agent iconsidère possible en w.

La relation de satisfaction ‘°’ est définiede façon habituelle :

M,w ° p ssi w ∈ V (p)M,w ° ¬ϕ ssi not M,w ° ϕM,w ° ϕ ∧ ψ ssi M, w ° ϕ and

M, w ° ψM,w ° Kiϕ ssi Ki(w) ⊆ JϕKMM,w ° CGϕ ssi (

⋃i∈G Ki)

∗(w) ⊆ JϕKM

où JϕKM = {w ∈ W | M,w ° ϕ} estl’extension de ϕ dans le modèle M et le ‘∗’dans la dernière clause signifie la clôturereflexive et transitive.

Comme d’habitude nous disons que ϕ estvalide dans M (notation : M ° ϕ) ssiJϕKM = W ; ϕ est ELC

N -valide (notation :|=ELC

Nϕ) ssi M ° ϕ pour tout ELC

N -modèle M ; ϕ est satisfiable dans ELC

N ssi6|=ELC

N¬ϕ. Des notions similaires sont dé-

finie pour la variante ELN sans connais-sance commune.

Nous rappelons que le problème de déci-der la ELN -satisfiabilité d’une formule estNP-complet si N = 1, PSPACE-completsi N ≥ 2, et que la ELC

N -satisfiabilité estEXPTIME-complet [4].

3 Théories d’actions à la Reiter

Nous étendons [3], où les théories d’ac-tions à la Reiter sont formulées en logiquedynamique propositionnelle (PDL).

3.1 Descriptions d’action

Dans [10] et [12] plusieurs hypothèses desimplification sont faites. Les plus impor-tantes sont :

H1 : Toute les lois d’actions sont connu partous les agents.

H2 : Toute occurrence d’action est pu-blique.

H3 : Toute action est déterministe.H4 : Chaque action est ou bien ontique

ou bien épistémique, mais jamais lesdeux à la fois.

H5 : Une action ne peut pas changer la va-leur de vérité d’un nombre infinie defluents.

H6 : L’ensemble de fluents affectés par uneaction est beaucoup plus petit quel’ensemble P de tous les fluents dulangage.

____________________________________________________________________________Annales du LAMSADE N°8

129

Les deux premières hypothèses garan-tissent que la connaissance des agents surles types d’actions (H1) et ses instances(H2) sont correctes. H4 est basé sur la dis-tinction entre actions ontiques et actionsépistémiques : les actions du premier typemodifient les faits, tandis que les actionsdu second type provoquent la mise à jourdes états de connaissance des agents. Cettehypothèse est aussi basée sur le fait quechaque action peut être divisée en une ac-tion ontique et une action épistémique. Ceconstat est du ‘folklore’ dans la literaturedu raisonnement sur les actions (voir, parexemple, [13]). Les deux dernières hypo-thèses garantissent que le formalisme deReiter résout la version représentationelledu problème du décor. Elles sont justi-fiées par l’hypothèse de base de l’iner-tie : les actions (ontiques) ne changentqu’une petite partie du monde. Notons queReiter n’énonce pas explicitement l’hypo-thèse H5 ; cependant elle est indispensablequand les fluents sont propositionnels.

En plus, Scherl & Levesque supposentqu’il n’y a qu’un seul agent. Nous ne fai-sons pas cette restriction dans le présentarticle, et considérons aussi le cas multi-agent.

Soit A un ensemble infini dénombrablede lettre d’actions (actions atomiques abs-traites), et supposons A = Ao ∪ Ae, oùAo et Ae sont des ensembles disjoints delettres d’actions ontiques et épistémiquesrespectivement. Nous supposons que Ae

ne contient que des observations.

Définition 1 Nous définissons une des-cription d’actions comme étant une tuple

D = 〈Poss ,Eff +,Eff −, γ+, γ−,Obs〉tel que :– Poss : A → LELC

Nattribue une formule

à chaque action qui décrit sa précondi-tion d’exécutabilité ;

– Eff + : A → ℘(P ) attribue un en-semble finie d’effets positives possiblesà chaque action ;

– Eff − : A → ℘(P ) attribue un en-semble finie d’effets négatives possiblesà chaque action ;

– γ+ est une famille de fonctions γ+(a) :Eff +(a) → LELC

N. Elle attribue une for-

mule à chaque pair (a, p) qui décrit laprécondition pour que l’action a rende pvraie ;

– γ− est une famille de fonctions γ−(a) :Eff −(a) → LELC

N. Elle attribue une for-

mule à chaque pair (a, p) qui décrit laprécondition pour que l’action a rende pfausse ; et

– Obs : A → LELCN

attribue une formuleà chaque action dont la valeur de véritéest connue après l’exécution de l’action.

Nous convenons aussi que : si a est on-tique (i.e., a ∈ Ao), alors Obs(a) = > ;si a est épistémique (i.e., a ∈ Ae), alorsEff +(a) = Eff −(a) = ∅ ; et si p 6∈Eff +(a), alors γ+(a, p) = ⊥, ainsi commepour γ−(a, p).

H1 et H2 garantissent que les fonctionsdans D ne dépendent pas des agents. Àcause de H3, pour toute action a, ses ef-fets peuvent être caractérisés par γ+(a)et γ−(a). H4 justifie la partition de l’en-semble des actions en Ao et Ae. La finitudede Eff + et Eff − est due à H5. Finalement,H6 permet d’affirmer que la version repré-sentationelle du problème du décor est ré-solu par ce type de description d’action.

En plus, Reiter (et nous) supposons :H7 : Les formules γ+(a, p) ∧ γ−(a, p) sont

inconsistantes dans ELCN .

L’exécution d’une action épistémique aapprend à l’agent que Obs(a) est vraie.Nous supposons que les observations sontfiables :

H8 : Les formules Poss(a)∧¬Obs(a) sontinconsistantes dans ELC

N .Notons que [12] restreint le codomaine dePoss , γ+, γ− et Obs aux formules pro-positionnelles. Nous avons étendu ce co-domaine aux formules dans ∧ELC

N . Ceci


130

permet la formalisation des actions comme‘faire un appel téléphonique’, dont la pré-condition d’exécution est de connaître lenuméro de téléphone de l’interlocuteur.

Pour illustrer ce nouveau type de des-cription d’action, nous introduisons unexemple simple avec une action ontique etdeux actions épistémiques.

Exemple 2 Un robot ne sait pas si la lu-mière est allumé ou non. L’action ontiquedisponible est d’appuyer sur le bouton dela lumière (“toggle”) avec Poss(toggle) =>, Eff +(toggle) = Eff −(toggle) ={light}, γ+(toggle, light) = ¬light , etγ−(toggle, light) = light . Les obser-vations sont oDark et oBright , avecPoss(oDark) = Obs(oDark) = ¬light ,et Poss(oBright) = Obs(oBright) =light .

3.2 Modèles pour les descriptionsd’actions

Soit D une description d’actions pour lesactions dans A = Ao ∪ Ae. Les modèlespour D sont obtenus en rajoutant des re-lations de transition aux modèles de la lo-gique épistémique.

Soit a un élément de Ao ∪ Ae, et soient oet e respectivement des éléments de Ao etAe.

Définition 3 Nous définissons un D-modèle comme étant une 4-upletM = 〈W,K, T, V 〉, où 〈W,K, V 〉 estun ELC

N -modèle et– T : A → ℘(W ×W ) associe une rela-

tion Ta à chaque a ∈ A.

La relation Ta modélise la relation de tran-sition associée à l’action abstraite a : sinous posons Ta(w) = {w′ | (w,w′) ∈Ta}, alors Ta(w) est l’ensemble des résul-tats possibles de l’exécution de l’action adans w.

Les D-modèles doivent satisfaire les res-trictions suivantes :

1. “No-Forgetting” : (Ta ◦ Ki)(w) ⊆(Ki ◦ Ta)(w).

2. “No-Learning” : si Ta(w) 6= ∅, alors(Ki ◦ Ta)(w) ⊆ (Ta ◦Ki)(w).

3. Déterminisme : si v1, v2 ∈ Ta(w),alors v1 = v2.

4. Éxécutabilité : Ta(w) 6= ∅ ssi〈W,K, V 〉, w ° Poss(a).

5. Préservation (épistémique) : si v ∈Te(w), alors

v ∈ V (p) ssi w ∈ V (p) for all p ∈ P

6. Pos-condition (ontique) : si v ∈To(w), alors– p 6∈ Eff +(o) et w 6∈ V (p) implique

v 6∈ V (p) ;– p 6∈ Eff −(o) et w ∈ V (p) implique

v ∈ V (p) ;– p ∈ Eff +(o) et 〈W,K, V 〉, w °

γ+(o, p) implique v ∈ V (p) ;– p ∈ Eff −(o) et 〈W,K, V 〉, w °

γ−(o, p) implique v 6∈ V (p) ;– p ∈ Eff +(o) et 〈W,K, V 〉, w 6°

γ+(o, p) et w 6∈ V (p) implique v 6∈V (p) ;

– p ∈ Eff −(o) et 〈W,K, V 〉, w 6°γ−(o, p) et w ∈ V (p) implique v ∈V (p).

La restriction 1 implante H1 et H2. Ellegarantie que tous les mondes dans (Ta ◦Ki)(w) ont un antécédent. Cette restric-tion est appelée “perfect recall” dans [4].Cet-à-dire, il n’y a pas d’action capablede faire les agents oublier des faits. Larestriction 2 est motivée par H1–H3 pourles actions ontiques. Pour les actions épis-témiques, le fait d’apprendre l’occurrenced’une observation suffit pour faire évoluerl´état épistémique de chaque agent : l’exé-cution d’une action d’observation e éli-mine les mondes possibles où Obse) estfausse. 1 et 2 ensemble correspondent auxSSAs de Scherl & Levesque pour les ac-tions ontiques. La restriction 3 est motivée


131

par l’hypothèse H3. La restriction 4 définitla condition pour qu’une action soit exécu-table. La restriction 5 nous donne un SSApour les actions épistémiques. La restric-tion 6 correspond au SSA de Reiter pourles faits (en opposition à la connaissance).Notons que sa consistance est garantie parH7 : sinon il pourrait y avoir un mondew où les deux γ+(a, p) et γ−(a, p) sontvraies, dans ce cas nous devrions avoir etv ∈ V (p), et v 6∈ V (p) pour tout v ∈Ta(w).

La sémantique des actions atomiques étanten termes d’une fonction totale Ta, il n’ya pas de concurrence. Néanmoins, les ac-tions concurrentes pourraient être modéli-sée par entrelacement (“interleaving”), cequi ne laisse pas de doutes pour leur inter-prétation.

3.3 Axiomes de réduction

Maintenant nous introduisons une combi-naison de la logique épistémique et PDLdans laquelle on peut parler des validi-tés pour D-modèles. Le langage LD étendLELC

Navec des opérateurs dynamiques, et

est définie par la BNF :

ϕ ::= p | ¬ϕ | ϕ ∧ ϕ | Kiϕ | CGϕ | [a]ϕ

où p est un élément de P , i est un élémentde N et a est un élément de A = Ao ∪ Ae.La formule [a]ϕ signifie ‘ϕ est vraie aprèstoute exécution possible de a’. Nous uti-lisons l’abbreviation habituelle 〈a〉ϕ =¬[a]¬ϕ. Donc 〈a〉> exprime que a est exé-cutable, et [a]⊥ exprime que a n’est pasexécutable.

Nous définissons la relation de satisfaction‘°’ comme pour ELC

N , plus :

M,w ° [a]ϕ ssi Ta(w) ⊆ JϕKMLa formule ϕ ∈ LD est valide dans un D-modèle M (notation : M ° ϕ) ssi JϕKM =W . Une formule ϕ ∈ LD est D-valide (no-tation : |=D ϕ) ssi M ° ϕ pour tout D-modèle M .

1. [e]p ↔ (Poss(e) → p)2. [e]¬ϕ ↔ (Poss(e) → ¬[e]ϕ)3. [e](ϕ1 ∧ ϕ2) ↔ ([e]ϕ1 ∧ [e]ϕ2)4. [e]Kiϕ ↔ (Poss(e) → Ki[e]ϕ)5. [o]p ↔ (Poss(o) → p)

if p 6∈ Eff +(o) ∪ Eff −(o)

6. [o]p ↔ (Poss(o) → (γ+(o, p) ∨ p))

if p ∈ Eff +(o) and p 6∈ Eff −(o)

7. [o]p ↔ (Poss(o) → (¬γ−(o, p) ∧ p))

if p 6∈ Eff +(o) and p ∈ Eff −(o)

8. [o]p ↔ (Poss(o) → (γ+(o, p)

∨(¬γ−(o, p) ∧ p)))

if p ∈ Eff +(o) ∩ Eff −(o)9. [o]¬ϕ ↔ (Poss(o) → ¬[o]ϕ)

10. [o](ϕ1 ∧ ϕ2) ↔ ([o]ϕ1 ∧ [o]ϕ2)11. [o]Kiϕ ↔ (Poss(o) → Ki[o]ϕ)

TAB. 1 – D-validités pertinentes.

Pour notre exemple nous avons

6|=D [toggle]Kilight|=D [oDark ][toggle]Kilight

|=D ¬Ki¬light → [toggle]¬Kilight

Notons aussi que [e]Obs(e) n’est pas D-valide. En effet, considérons une action etelle que Obs(e) est la ‘phrase de Moore’p∧¬Kip : après avoir appris que p∧¬Kipl’agent sait que p, donc ¬Kip n’est plusvraie.

Soit D une descriptions d’actions. Le Ta-bleau 1 montre plusieurs équivalences D-valides.3 Dans chaque validité la com-plexité de la formule dans le champde l’opérateur dynamique [ ] décroît degauche à droite. Pour les formules sansopérateur de connaissance commune, cecinous permet de définir une procédure

3Notons que |=D Poss(a) implique Obs(a) par H8.


132

regD, appelée régression par [11], qui ap-plique récursivement ces validités jusqu’àce que la formule résultante ne contienneplus d’opérateurs dynamiques. Donc, pourtoute description D et formule ϕ sansl’opérateur CG nous avons :

|=D ϕ ssi |=ELCN

regD(ϕ)

Par exemple, [toggle]Kilight est toutd’abord réduit à Poss(toggle) →Ki[toggle]light (par l’axiome 11) etaprès à Ki¬light (par l’axiome 8) ; et[oDark ]Ki¬light est d’abord réduità Poss(oDark) → Ki[oDark ]¬light(par l’axiome 4) et ensuite à ¬light →Ki(¬light → ¬light) (par l’axiome 1).Comme le dernier est ELN -valide, alors|=D [oDark ][toggle]Kilight .

Notons que regD est sous-optimal, puisqueil y a des formules tel que regD(ϕ) est ex-ponentiellement plus long que ϕ [11, Sec-tion 4.6].

4 Logique épistémique dyna-mique DELC

N

Une tradition différente dans la modélisa-tion de connaissance et changement a étésuivi par, par exemple, [9, 2, 15]. La lo-gique de [16, 6] se situe dans cette tradi-tion. Elle est basée sur les annonces pu-bliques et les affectations publiques.

4.1 Syntaxe

Le langage de la logique épistémiquedynamique avec connaissance communeLDELC

Nest définie par la BNF :

ϕ ::= p | ¬ϕ | ϕ ∧ ϕ | Kiϕ | [!ϕ]ϕ | [σ]ϕσ ::= p := ϕ | p := ϕ, σ

où p est un élément de P et i est un élémentde N .

De nouveau , la formule [α]ϕ signifie ‘ϕest vraie après toute exécution possible

de α’. L’action !ϕ est l’annonce publiquede ϕ.4 L’action p := ϕ est l’affectation pu-blique de la valeur de vérité de ϕ à l’atomep. Par exemple, p :=⊥ est une affectationpublique, et Ki[p :=⊥]¬p est une formule.Quand des affectations sont faites en pa-rallel, le même atome ne peut apparaîtrequ’une seule fois à la gauche de l’opéra-teur ‘:=’. Par commodité, nous identifions(p1 := ϕ1, . . . , pn := ϕn) avec l’ensemble{p1 := ϕ1, . . . , pn := ϕn}. Nous utilisonsaussi l’abbreviation suivante :

[α if ϕ]ψdef= ϕ → [α]ψ

Le fragment de DELCN sans affectations est

la logique des annonces publiques de Plaza(PALC

N ) [9], dont nous notons le fragmentsans connaissance commune PALN .

Les annonces modélisent les actions épis-témiques, tandis que les affectations mo-délisent les actions ontiques. Par exemple,l’action épistémique oDark de l’Exemple2 est modélisée par !¬light , et l’actionontique toggle par l’affectation σtoggle =(light :=¬light). Cet-à-dire, la valeur devérité de light est inversé.

4.2 Sémantique

Un DELCN -modèle est un tuple M =

〈W,K, V 〉 défini comme pour ELCN . La re-

lation de satisfaction ‘°’ est comme avant,plus :

M,w ° [!ϕ]ψ ssi M,w ° ϕ impliqueM !ϕ, w ° ψ

M,w ° [σ]ϕ ssi Mσ, w ° ϕ

4Notons que l’opérateur d’annonce est différent de l’opéra-teur de test de PDL (habituellement noté ϕ?) : le premier a deseffets épistémiques, mais le second n’en a pas.


133

[!ϕ]p ↔ (ϕ → p)[!ϕ]¬ψ ↔ (ϕ → ¬[!ϕ]ψ)[!ϕ](ψ1 ∧ ψ2) ↔ ([!ϕ]ψ1 ∧ [!ϕ]ψ2)[!ϕ]Kiψ ↔ (ϕ → Ki[!ϕ]ψ)[σ]p ↔ σ(p)[σ]¬ϕ ↔ ¬[σ]ϕ[σ](ϕ ∧ ψ) ↔ ([σ]ϕ ∧ [σ]ψ)[σ]Kiϕ ↔ Ki[σ]ϕ

TAB. 2 – DELCN -validitées pertinentes.

où M !ϕ et Mσ sont des modifications dumodèle M définies par :

M !ϕ = 〈W !ϕ, K !ϕ, V !ϕ〉W !ϕ = W ∩ JϕKMK !ϕ

i = Ki ∩ (JϕKM × JϕKM)V !ϕ(p) = V (p) ∩ JϕKM

etMσ = 〈W,K, V σ〉V σ(p) = Jσ(p)KM

et où σ(p) est une formule affecté à p dansσ. S’il n’y a pas d’occurrence de p := ϕdans σ, alors σ(p) = p.

Comme d’habitude, ϕ est valide dans M(notation : M ° ϕ) ssi JϕKM = W , etϕ est DELC

N -valide (notation : |=DELCN

ϕ)ssi M ° ϕ pour tout modèle épistémiqueM . Par exemple, Kip → [q := p]Kiq estDELC

N -valide.

Plusieurs DELCN -validités pertinentes sont

listées dans le Tableau 2.

Quand il n’y a pas d’occurrence de l’opé-rateur de connaissance commune, les équi-valences du Tableau 2 permettent la dé-finition d’une procédure de régressionregDELN

, qui élimine les opérateurs dyna-miques de l’expression en question [16] :

|=DELCN

ϕ ssi |=ELCN

regDELN(ϕ)

Pourtant, la DELN -régression a lemême problème que la D-régression :la formule résultante regDELN

(ϕ)peut être exponentiellement pluslongue que ϕ (un exemple est〈〈〈. . . 〈>〉 . . .〉¬Ki¬>〉¬Kj¬>〉¬Ki¬>).De plus, il n’existe pas d’équivalence decet type pour l’opérateur de connaissancecommune [2].

Dans les sections suivantes, nous propo-sons une solution alternative qui évite l’ex-plosion exponentielle. Le premier pas estla formalisation de la liaison entre la des-cription d’action à la Reiter D d’un coté,et DELC

N de l’autre.

5 Traduction des théories à laReiter dans DELC

N

Les D-validités présentées dans le Tableau1 sont similaires à celles du tableau 2.Nous observons aussi que (1) les precondi-tions d’exécutabilité Poss dans D peuventêtre modélisées dans DELN comme la par-tie ‘if’ d’une action conditionnelle, commedans α if Poss(a) ; (2) les actions d’obser-vation e peuvent être vues comme des an-nonces publiques ; et (3) les actions on-tiques o peuvent être vues comme des af-fectations publiques.

La traduction δD de LD dans LDELCN

estdonc évidente.

Définition 4 Soit une D description d’ac-tion, soit o ∈ Ao une action ontique, et soite ∈ Ae une observation. Alors nous défi-nissons

δD(e) = !Obs(e) if Poss(e)δD(o) = σo if Poss(o)


134

où σo est l’affectation complexe :

{p := γ+(o, p) ∨ p |p ∈ Eff +(o) and p 6∈ Eff −(o)}∪

{p :=¬γ−(o, p) ∧ p |p 6∈ Eff +(o) and p ∈ Eff −(o)}∪

{p := γ+(o, p) ∨ (¬γ−(o, p) ∧ p) |p ∈ Eff +(o) ∩ Eff −(o)}

Notons que δD(o) est bien définie puisqueEff +(o) et Eff −(o) sont finis par H5. Parexemple, δD(oDark) = !¬light if ¬light ,et δD(toggle) = light :=¬light∨(¬light∧light), ce qui peuvent être simplifié enδD(toggle) = light :=¬light .

Nous étendons cette définition à toute for-mule dans LD.5

δD(p) = pδD(¬ϕ) = ¬δD(ϕ)δD(ϕ ∧ ψ) = δD(ϕ) ∧ δD(ψ)δD(Kiϕ) = Ki(δD(ϕ))δD([a]ϕ) = [δD(a)]δD(ϕ)

Soit | · | une fonction qui donne la longueurd’une expression (y compris les paren-thèses, virgules, etc). Nous avons la corres-pondance suivante entre les formules dans∧D et dans ∧DELC

N (cf. Tableaux 1 et 2).

Théorème 5 Soit D une description finied’action à la Reiter, et soit ϕ ∈ LD. Alorsϕ est D-satisfiable si et seulement si δD(ϕ)est DELC

N -satisfiable, et |δD(ϕ)| ≤ |ϕ| ×|D|).

La preuve est par induction sur la structurede ϕ. Observons que D est une tuple de 5éléments, et donc |D| ≥ 9.

Donc δD est polynomial, et le problèmede décider si pour une D et ϕ, ϕ est D-satisfiable peut être transformé de façon

5Notons que les formules dans ∧D n’ont pas d’occurrencede l’opérateur de connaissance commune. Il n’y a donc pas declause pour cet opérateur.

polynomiale dans un problème de DELCN -

satisfiabilité.

6 Une régression optimale pourDELC

N

Maintenant nous montrons une réductionpolynomiale de DELC

N dans ELCN . L’idée

est d’éliminer d’abord les affectations, etensuite d’appliquer la réduction de Lutzpour éliminer les annonces [7].

6.1 Élimination des affectations

Nous appliquons une technique qui eststandard en démonstration automatique[8].

Proposition 6 Soit[p1 := ϕ1, . . . , pn := ϕn]ψ une sous-formule d’une formule χ dans LDELC

N.

Soit ψ′ une formule obtenue de ψ parsubstitution de toute occurrence de pk

par xpkoù xpk

est un nouveau atomequi n’apparaît pas dans χ. Soit χ′obtenue de χ par remplacement de[p1 := ϕ1, . . . , pn := ϕn]ψ par ψ′. Soit Bl’abréviation de

∧1≤k≤n(xpk

↔ ϕk).

1. Si χ ∈ LDEL1 , alors χ est DEL1-satisfiable ssi

χ′ ∧KiB

est DEL1-satisfiable.2. Si χ ∈ LDELN

, N ≥ 2, alors χ estDELN -satisfiable ssi

χ′ ∧∧

`≤md(ψ)

E`NB

est DELN -satisfiable, où le degré mo-dal md(ψ) est le plus grand nombred’opérateurs modaux enchâssés dansψ, et En

Gϕ abrège ‘EG . . .EGϕ, n ≥ 0fois’.


135

3. Si χ ∈ LDELCN

, alors χ est DELCN -

satisfiable ssi

χ′ ∧CNB

est DELCN -satisfiable.

Preuve. Pour simplifier supposons que lasous-formule de χ est [p := ϕ]ψ.

⇒ : Supposons que M = 〈W,K, V 〉est un ELC

N -modèle tel que M,w ° χ.Nous construisons un ELC

N -modèle Mxp =〈W,K, Vxp〉, où Vxp(p) = V (p) for all p 6=xp, et Vxp(xp) = JϕKM . Nous démontronsque Mxp ° [p := ϕ]ψ ↔ ψ′, d’où les troiscas suivent.

⇐ : Nous supposons que M est généré parw, et observons que Ki est une ‘modalitémaître’ (master modality) pour ELN avecun seul agent, ainsi que CG pour ELC

N ,et ainsi que la conjunction des opérateursEG jusqu’au degré modal de ψ pour ELN

multi-agents. Par exemple, quand M, w °CGχ, alors M ° CGχ.

Le renommage évite l’explosion exponen-tielle. Ceci nous permet la définition desopérateurs de reduction redDEL1 , redDELN

et redDELCN

qui éliminent itérativementtous les affectations.

Par exemple, considérons laformule EDELN suivante :¬[!¬light ][light :=¬light ]Kilight . Saréduction est ¬[!¬light ]Kixlight ∧Ki(xlight ↔ ¬light).

Proposition 7 redDEL1 , redDELNet

redDELCN

sont des transformations poly-nomiales, et ils préservent la satisfiabilitédans les logiques respectives.

Preuve. La préservation de la satisfiabilitéest impliqué par la Proposition 6.

Pour les cas d’un seul agent et de connais-sance commune nous montrons que la lon-gueur de la reduction de χ est bornée par|χ|×(|χ|+6), et pour le cas de DELN nousmontrons que la longueur de la réductionde χ est bornée par |χ2×(|χ|+6). En plus,dans la Proposition 6 la longueur de χ′ estbornée par |χ|, la longueur de chaque équi-valence dans B est bornée par |χ|+4, et lenombre des équivalences est borné par lenombre d’affectations (atomiques) dans χ,ce qui ne dépasse pas |χ|. Dans le cas del’opérateur E, le nombre d’équivalencesdoit être multiplié par le degré modal deχ, qui est borné par |χ|.

6.2 Élimination des annonces

Une fois les affectations sont éliminées,nous pouvons éliminer les annonces en uti-lisant la procédure de Lutz. Nous n’avonspas la place pour montrer les details, alorsnous mettons ici seulement le théorème leplus relevant.6

Proposition 8 ([7]) Le problème de laPALN -satisfiabilité est NP-complet siN = 1, et PSPACE-complet si N ≥ 2.Le problème de la PALC

N -satisfiabilité estEXPTIME-complet.

Via le Théorème 5 nous obtenons :

Corollaire 9 Le problème de la D-satisfiabilité sans l’opérateur CG estNP-complet si N = 1, et PSPACE-complet si N ≥ 2. Le problème de laD-satisfiabilité avec l’opérateur CG estEXPTIME-complet.

7 Conclusions

Nous avons modelisé le problème du décordans la logique épistémico-dynamique par

6Pour une exposition extensive, le lecteur peut se rendre à[7].


136

la proposition d’une traduction des opéra-teurs d’actions ontiques et d’actions d’ob-servation du calcul de situations, et nousavons également identifié la complexité duproblème de satisfiabilité des formules tra-duite par cette méthode.

L’extension de la solution de Reiter pro-posée par Scherl & Levesque ne permetnon seulement la formalisation des obser-vations, mais aussi la formalisation des ac-tions de perception (sensing ?ϕ, qui testentsi une proposition ϕ est vraie. Un tel typed’action peut être vu comme une composi-tion non-déterministe, c’est-à-dire, une ab-breviation : ?ϕ = !ϕ∪!¬ϕ. L’expansion del’opérateur de choix non-déterministe ‘∪’provoque une explosion exponentielle dela formule qui ne permet pas l’integrationde cet type d’action comme primitive dansnotre approche. Il n’est pas clair pour nouscomment le SSA associé

[?ϕ]Kiψ

↔ ((ϕ → Ki(ϕ → [?ϕ]ψ))∧(¬ϕ → Ki(¬ϕ → [?ϕ]ψ)))

pourrait être intégré dans la transformationpolynomial de Lutz. Une autre indice quela présence des actions de perception (sen-sing) augmente la complexité est donnéepar le résultat de [5], qui affirme que la vé-rification de plan est Πp

2-complet dans cecas. Nous avons l’intention de généralisernos résultats aux actions non-publiques,comme dans [2, 1].

Remerciements

Hans van Ditmarsch est soutenu par le pro-jet ‘Games, Action and Social Software’du NIAS (Netherlands Institute for Advan-ced Study in the Humanities and SocialSciences) et le NWO (Netherlands Orga-nisation for Scientific Research) CognitionProgram for the Advanced Studies (grantNWO 051-04-120).

Tiago de Lima est supporté par le Pro-

gramme Alßan, programme de boursesde haut niveau de l’Union Européennepour l’Amérique latine, bourse numéroE04D041703BR.

Les auteurs remercient également les troisrelecteurs anonymes pour leurs commen-taires extrêmement pertinents.

Références[1] F. Bacchus, J.Y. Halpern, and H. Le-

vesque. Reasoning about noisy sen-sors in the situation calculus. Ar-tificial Intelligence, 111 :131–169,1999.

[2] A. Baltag, L. Moss, and S. Solecki.The logic of public announcementsand common knowledge. In Proc.TARK’98, 1998.

[3] R. Demolombe, A. Herzig, andI. Varzinczak. Regression in modallogic. J. of Applied Non-ClassicalLogics, 13(2) :165–185, 2003.

[4] R. Fagin, J. Halpern, Y. Moses, andM. Vardi. Reasoning about Know-ledge. The MIT Press, 1995.

[5] Andreas Herzig, Jérôme Lang, Domi-nique Longin, and Thomas Polacsek.A logic for planning under partial ob-servability. In Proc. AAAI’2000, Aus-tin, Texas, August 2000.

[6] B. Kooi. Expressivity and complete-ness for public update logic via re-duction axioms. Journal of AppliedNon-Classical Logics, 17(2), 2007.To appear.

[7] C. Lutz. Complexity and succint-ness of public announcement logic.In Proc. of AAMAS, pages 137–144,2006.

[8] A. Nonnengart and C. Weiden-bach. Computing small clause nor-mal forms. In Handbook of Automa-ted Reasoning, pages 335–367. NorthHolland, 2001.


137

[9] J. Plaza. Logics of public communi-cations. In M. L. Emrich et al., edi-tors, Proc. of ISMIS, pages 201–216,1989.

[10] R. Reiter. The frame problem inthe situation calculus : A simple so-lution (sometimes) and a complete-ness result for goal regression. InV. Lifschitz, editor, Papers in Honorof John McCarthy, pages 359–380.Academic Press Professional Inc.,1991.

[11] R. Reiter. Knowledge in Action :Logical Foundations for Specifyingand Implementing Dynamical Sys-tems. The MIT Press, 2001.

[12] R. Scherl and H. Levesque. Know-ledge, action and the frame problem.Artificial Intelligence, 144(1–2) :1–39, 2003.

[13] S. Shapiro, M. Pagnucco, Y. Lespé-rance, and H. J. Levesque. Iteratedbelief change in the situation calcu-lus. In Proc. of KR, pages 527–538,2000.

[14] M. Thielscher. From Situation Calcu-lus to Fluent Calculus : State updateaxioms as a solution to the inferen-tial frame problem. Artificial Intelli-gence, 111(1–2) :277–299, 1999.

[15] J. van Benthem. One is a lonely num-ber. In P. Koepke et al., editors, Proc.of LC&CL, 2002.

[16] H. van Ditmarsch, W. van der Hoek,and B. Kooi. Dynamic epistemic lo-gic with assignment. In Proc. of AA-MAS, pages 141–148. ACM, 2005.


138

Documents

Raisonnement sur les actions : de Toronto à Amsterdam · lences 8x8s(p(do(x;s)) $ ˆ(a;s). Nous ne considérons pas cette extension ici. observent que une proposition donnée est