Upload
madge
View
31
Download
1
Embed Size (px)
DESCRIPTION
Inteligentní agenti. Agent. vnímá své okolí prostřednictvím senzorů zasahuje do okolí prostřednictvím efektorů člověk, robot, softwarový agent Racionální agent agent, který dělá správné věci Správná akce akce, která způsobí, že agent bude nejús-pěšnější. Agent. senzory. vjemy. akce. - PowerPoint PPT Presentation
Citation preview
Inteligentní agenti
Agent
• vnímá své okolí prostřednictvím senzorů• zasahuje do okolí prostřednictvím efektorů• člověk, robot, softwarový agent
Racionální agent• agent, který dělá správné věci
Správná akce• akce, která způsobí, že agent bude nejús-
pěšnější
Agent
prostředí
vjemy
akce
senzory
efektory
Problém: kdy a jak vyhodnocovat úspěch agenta
Míra výkonu (performance measure)• objektivní kritéria pro měření úspěšnosti
agenta• výkon za dlouhou dobu (směna,
životnost)
Racionalita versus vševědoucnost• očekávaný úspěch na základě vnímaného
Racionálnost akce
• míra výkonu, která definuje stupeň úspěchu
• všechny vjemy vnímané do daného okamžiku (posloupnost vjemů)
• znalosti agenta o prostředí• akce, které agent může vykonat
Ideální racionální agent
• pro každou možnou posloupnost vjemů ideální racionální agent na základě faktů získaných posloupnosti vjemů a veškerých zabudovaných znalostí vykoná akci, u které je možné očekávat, že maximalizuje míru jeho výkonnosti
Autonomie
• systém je autonomní do té míry, jakou jeho vlastní zkušenost ovlivňuje jeho chování
• jestliže se akce agenta zakládají pouze na zabudovaných znalostech, pak agent postrádá autonomii
• opravdu autonomní inteligentní agent by měl být schopen úspěšně fungovat v rozmanitých prostředích, jestliže mu je poskytnut dosta-tečný čas na adaptaci
Struktura inteligentních agentů
• program agenta:– funkce zobrazující vjemy na akce
• architektura:– výpočetní prostředek (počítač, speciální
HW)
• agent = architektura + program
Zobrazení vjem akce
Zobrazení posloupnosti vjemů na akce• ke každé posloupnosti vjemů přiřadíme
akci• výčet všech možností: ideální zobrazení• nemusí být explicitní (např. funkce)
• rozdíl mezi ”skutečným” a ”umělým” prostředím není důležitý
• důležitá je složitost vztahu mezi – chováním agenta– posloupností vjemů vytvořenou
prostředím– cíli, kterých má agent dosáhnout
Příklad:
• robot kontrolující součástky na běžícím pásu
• softbot řídící let Boeingu 747 na simulátoru
• softbot třídící informace z on-line zdrojů• prostředí Turingova testu
Typ agenta Vjemy Akce Cíle Prostředí
systémmedicínskédiagnostiky
symptomy,nálezy,pacientovyodpovědi
otázky, testy,léčba
zdravý pa-cient, mini-mální náklady
pacient,nemocnice
systém ana-lýzy družico-vých snímků
pixely různéintenzity abarvy
tisk zařazeníscény
správnézařazení
snímkyz orbitálnídružice
robot propřesunsoučástek
pixely různéintenzity
zvednutísoučástky atřídení do košů
umístění sou-částek dosprávnýchkošů
běžící pásse sou-částkami
kontrolorv rafinerii
měřeníteploty, tlaku
otevření,zavření ventilů,nastaveníteploty
maximálníčistota, zisk,bezpečnost
rafinerie
interaktivníučitelangličtiny
psaná slova tisk cvičení,návrhů, oprav
maximálnípočet bodůstudenta
množinastudentů
Programy agenta
function Kostra-agenta (vjem) akce• paměť, agentova paměť obsahující svět
– paměť Aktualizace_paměti (paměť, vjem)– akce Výběr_nejlepší_akce (paměť)– paměť Aktualizace_paměti (paměť, akce)
• return akce
• vstupní údaj je jeden vjem• cíl nebo míra výkonu není součástí programu
Nejjednodušší program: tabulka
function agent_řízený_tabulkou (vjem) akce• vjemy; posloupnost, na počátku prázdná• tabulka; tabulka, indexovaná podle
posloup-ností vjemů, na počátku plně definovaná– přidej vjem na konec posloupnosti vjemů– akce Vyhledej (vjemy, tabulka)
• return akce
Nevýhody
• tabulka pro jednoduchého agenta hrajícího šachy by obsahovala 35100 položek
• programátorovi by trvalo dlouho sestavit takovou tabulku
• agent nemá žádnou autonomii• i s mechanismem učení by trvalo dlouho
naučit se správné hodnoty pro všechny položky tabulky
Typ agenta řidič taxíkuVjemy kamery, tachometr, lokalizátor, sonar,
mikrofonAkce zatáčet, přidat plyn, brzdit, mluvit
s pasažéremCíle bezpečný, rychlý, dodržující pravidla,
pohodlná jízda, maximální ziskProstředí cesty, jiní účastníci provozu, chodci,
zákazníci
Příklad:automatizovaný řidič taxíku
Čtyři typy programu agenta
• agent jednoduchého reflexu• agent zaznamenávající změny ve světě• agent řízený cílem• agent řízený užitečností
Agent jednoduchého reflexu
• místo tabulky shrneme společně se vyskytující asociace vstup-výstup do pravidel
• funguje správně, jestliže je možné správnou akci zvolit pouze na základě aktuálního vjemu
Reflex agent
Jaký je svět teď
Jakou akci mám vykonat
teď
Pravidla podmínka-akce
Pro
stře
dí
Senzory
Efektory
Fungování agenta
function agent_jednoduchého_reflexu (vjem) akce
• pravidla, množina pravidel podmínka-akce– stav interpretace_vstupu (vjem)– pravidlo nalezení_pravidla (stav, pravidla)– akce akce_pravidla (pravidlo)
• return akce
Agent zaznamenávající změny světa
• znalosti o tom, jak se mění svět nezávisle na agentovi
• znalosti o tom, jak akce agenta ovlivňují svět
Reflex agent s interním stavem
Jaký je svět teď
Jakou akci mám vykonat
teď
Stav
Jak se svět vyvíjí
Co dělají moje akce
Pro
stře
dí
Pravidla podmínka-akce
Senzory
Efektory
Fungování agenta
function agent_reflexu_se_stavem (vjem) akce• stav, popis aktuálního stavu světa• pravidla, množina pravidel podmínka-akce
– stav aktualizace_stavu (stav, vjem)– pravidlo napasování_pravidla (stav,
pravidla)– akce akce_pravidla (pravidlo)– stav aktualizace_stavu (stav, akce)
• return akce
Agent řízený cílem
• poznatky o světě ne vždy postačují k rozhod-nutí co dělat
• cíl popisuje situace, které jsou žádoucí
• agent může kombinovat cíle s informací o důsledcích svých možných akcí při výběru akce vedoucí k cíli
Agent řízený cílem
• rozhodování agenta řízeného cílem bere v úvahu budoucnost:– Co se stane, když udělám to a to?– Budu mít z toho radost?
• agent řízený cílem je pružnější
Agent s cíli
Jaký je svět teď
Jaký by byl svět, jestliže vykonám akci
A
Jakou akci mám vykonat
teď
Stav
Jak se svět vyvíjí
Co dělají moje akce
Cíle
Pro
stře
dí
Senzory
Efektory
Agent řízený užitečností
• cíle nepostačují k vytvoření chování vysoké kvality, ten samý cíl je možné dosáhnout různými způsoby
Užitečnost• jestliže nějakému stavu světa dáme
přednost před jiným, pak ten stav je užitečnější
Výhody funkce užitečnosti
• cíle si navzájem odporují• několik cílů, žádný není dosažitelný
s jistotou
• každý racionální agent může být popsán jako agent řízený užitečností
Agent s užitečností
Jaký je svět teď
Senzory
Efektory
Jaký by byl svět, jestliže vykonám akci
AJak šťastný bych byl v takovém
světěJakou akci
mám vykonat teď
Stav
Jak se svět vyvíjí
Co dělají moje akce
Užitečnost
Pro
stře
dí
Prostředí - vlastnosti
• dostupné vs. nedostupné– všechny aspekty důležité pro výběr akce
jsou dostupné prostřednictvím senzorů• deterministické vs. nedeterministické
– příští stav je plně určen současným stavem a akcemi agenta
• epizodické vs. neepizodické– události následujících epizod nesouvisí
se současnými událostmi
Prostředí - vlastnosti
• statické vs. dynamické– prostředí se mění během agentova
uvažování• diskrétní vs. spojité
– počet jasně definovaných vjemů a akcí je konečný
• nejobtížnější prostředí je nedostupné, neepi-zodické, dynamické a spojité
Prostředí – příklady
prostředí přístup-né
determ. epizo-dické
static-ké
diskrét-ní
šach bez hodin A A N A Apoker N N N A Ařízení taxíku N N N N Ndiagnostický sys-tém v medicíně
N N N N N
systém analýzyobrazů
A A A polo N
kontrolerv rafinérii
N N N N N
interaktivní učitelangličtiny
N N N N A