Inteligentní agenti

Inteligentní agenti

Agent

• vnímá své okolí prostřednictvím senzorů• zasahuje do okolí prostřednictvím efektorů• člověk, robot, softwarový agent

Racionální agent• agent, který dělá správné věci

Správná akce• akce, která způsobí, že agent bude nejús-

pěšnější

Agent

prostředí

vjemy

akce

senzory

efektory

Problém: kdy a jak vyhodnocovat úspěch agenta

Míra výkonu (performance measure)• objektivní kritéria pro měření úspěšnosti

agenta• výkon za dlouhou dobu (směna,

životnost)

Racionalita versus vševědoucnost• očekávaný úspěch na základě vnímaného

Racionálnost akce

• míra výkonu, která definuje stupeň úspěchu

• všechny vjemy vnímané do daného okamžiku (posloupnost vjemů)

• znalosti agenta o prostředí• akce, které agent může vykonat

Ideální racionální agent

• pro každou možnou posloupnost vjemů ideální racionální agent na základě faktů získaných posloupnosti vjemů a veškerých zabudovaných znalostí vykoná akci, u které je možné očekávat, že maximalizuje míru jeho výkonnosti

Autonomie

• systém je autonomní do té míry, jakou jeho vlastní zkušenost ovlivňuje jeho chování

• jestliže se akce agenta zakládají pouze na zabudovaných znalostech, pak agent postrádá autonomii

• opravdu autonomní inteligentní agent by měl být schopen úspěšně fungovat v rozmanitých prostředích, jestliže mu je poskytnut dosta-tečný čas na adaptaci

Struktura inteligentních agentů

• program agenta:– funkce zobrazující vjemy na akce

• architektura:– výpočetní prostředek (počítač, speciální

HW)

• agent = architektura + program

Zobrazení vjem akce

Zobrazení posloupnosti vjemů na akce• ke každé posloupnosti vjemů přiřadíme

akci• výčet všech možností: ideální zobrazení• nemusí být explicitní (např. funkce)

• rozdíl mezi ”skutečným” a ”umělým” prostředím není důležitý

• důležitá je složitost vztahu mezi – chováním agenta– posloupností vjemů vytvořenou

prostředím– cíli, kterých má agent dosáhnout

Příklad:

• robot kontrolující součástky na běžícím pásu

• softbot řídící let Boeingu 747 na simulátoru

• softbot třídící informace z on-line zdrojů• prostředí Turingova testu

Typ agenta Vjemy Akce Cíle Prostředí

systémmedicínskédiagnostiky

symptomy,nálezy,pacientovyodpovědi

otázky, testy,léčba

zdravý pa-cient, mini-mální náklady

pacient,nemocnice

systém ana-lýzy družico-vých snímků

pixely různéintenzity abarvy

tisk zařazeníscény

správnézařazení

snímkyz orbitálnídružice

robot propřesunsoučástek

pixely různéintenzity

zvednutísoučástky atřídení do košů

umístění sou-částek dosprávnýchkošů

běžící pásse sou-částkami

kontrolorv rafinerii

měřeníteploty, tlaku

otevření,zavření ventilů,nastaveníteploty

maximálníčistota, zisk,bezpečnost

rafinerie

interaktivníučitelangličtiny

psaná slova tisk cvičení,návrhů, oprav

maximálnípočet bodůstudenta

množinastudentů

Programy agenta

function Kostra-agenta (vjem) akce• paměť, agentova paměť obsahující svět

– paměť Aktualizace_paměti (paměť, vjem)– akce Výběr_nejlepší_akce (paměť)– paměť Aktualizace_paměti (paměť, akce)

• return akce

• vstupní údaj je jeden vjem• cíl nebo míra výkonu není součástí programu

Nejjednodušší program: tabulka

function agent_řízený_tabulkou (vjem) akce• vjemy; posloupnost, na počátku prázdná• tabulka; tabulka, indexovaná podle

posloup-ností vjemů, na počátku plně definovaná– přidej vjem na konec posloupnosti vjemů– akce Vyhledej (vjemy, tabulka)

• return akce

Nevýhody

• tabulka pro jednoduchého agenta hrajícího šachy by obsahovala 35100 položek

• programátorovi by trvalo dlouho sestavit takovou tabulku

• agent nemá žádnou autonomii• i s mechanismem učení by trvalo dlouho

naučit se správné hodnoty pro všechny položky tabulky

Typ agenta řidič taxíkuVjemy kamery, tachometr, lokalizátor, sonar,

mikrofonAkce zatáčet, přidat plyn, brzdit, mluvit

s pasažéremCíle bezpečný, rychlý, dodržující pravidla,

pohodlná jízda, maximální ziskProstředí cesty, jiní účastníci provozu, chodci,

zákazníci

Příklad:automatizovaný řidič taxíku

Čtyři typy programu agenta

• agent jednoduchého reflexu• agent zaznamenávající změny ve světě• agent řízený cílem• agent řízený užitečností

Agent jednoduchého reflexu

• místo tabulky shrneme společně se vyskytující asociace vstup-výstup do pravidel

• funguje správně, jestliže je možné správnou akci zvolit pouze na základě aktuálního vjemu

Reflex agent

Jaký je svět teď

Jakou akci mám vykonat

teď

Pravidla podmínka-akce

Pro

stře

dí

Senzory

Efektory

Fungování agenta

function agent_jednoduchého_reflexu (vjem) akce

• pravidla, množina pravidel podmínka-akce– stav interpretace_vstupu (vjem)– pravidlo nalezení_pravidla (stav, pravidla)– akce akce_pravidla (pravidlo)

• return akce

Agent zaznamenávající změny světa

• znalosti o tom, jak se mění svět nezávisle na agentovi

• znalosti o tom, jak akce agenta ovlivňují svět

Reflex agent s interním stavem

Jaký je svět teď


teď

Stav

Jak se svět vyvíjí

Co dělají moje akce

Pro

stře

dí

Pravidla podmínka-akce

Senzory

Efektory

Fungování agenta

function agent_reflexu_se_stavem (vjem) akce• stav, popis aktuálního stavu světa• pravidla, množina pravidel podmínka-akce

– stav aktualizace_stavu (stav, vjem)– pravidlo napasování_pravidla (stav,

pravidla)– akce akce_pravidla (pravidlo)– stav aktualizace_stavu (stav, akce)

• return akce

Agent řízený cílem

• poznatky o světě ne vždy postačují k rozhod-nutí co dělat

• cíl popisuje situace, které jsou žádoucí

• agent může kombinovat cíle s informací o důsledcích svých možných akcí při výběru akce vedoucí k cíli

Agent řízený cílem

• rozhodování agenta řízeného cílem bere v úvahu budoucnost:– Co se stane, když udělám to a to?– Budu mít z toho radost?

• agent řízený cílem je pružnější

Agent s cíli

Jaký je svět teď

Jaký by byl svět, jestliže vykonám akci

A


teď

Stav



Cíle

Pro

stře

dí

Senzory

Efektory

Agent řízený užitečností

• cíle nepostačují k vytvoření chování vysoké kvality, ten samý cíl je možné dosáhnout různými způsoby

Užitečnost• jestliže nějakému stavu světa dáme

přednost před jiným, pak ten stav je užitečnější

Výhody funkce užitečnosti

• cíle si navzájem odporují• několik cílů, žádný není dosažitelný

s jistotou

• každý racionální agent může být popsán jako agent řízený užitečností

Agent s užitečností

Jaký je svět teď

Senzory

Efektory

Jaký by byl svět, jestliže vykonám akci

AJak šťastný bych byl v takovém

světěJakou akci

mám vykonat teď

Stav



Užitečnost

Pro

stře

dí

Prostředí - vlastnosti

• dostupné vs. nedostupné– všechny aspekty důležité pro výběr akce

jsou dostupné prostřednictvím senzorů• deterministické vs. nedeterministické

– příští stav je plně určen současným stavem a akcemi agenta

• epizodické vs. neepizodické– události následujících epizod nesouvisí

se současnými událostmi

Prostředí - vlastnosti

• statické vs. dynamické– prostředí se mění během agentova

uvažování• diskrétní vs. spojité

– počet jasně definovaných vjemů a akcí je konečný

• nejobtížnější prostředí je nedostupné, neepi-zodické, dynamické a spojité

Prostředí – příklady

prostředí přístup-né

determ. epizo-dické

static-ké

diskrét-ní

šach bez hodin A A N A Apoker N N N A Ařízení taxíku N N N N Ndiagnostický sys-tém v medicíně

N N N N N

systém analýzyobrazů

A A A polo N

kontrolerv rafinérii

N N N N N

interaktivní učitelangličtiny

N N N N A

Documents

Inteligentní agenti