86
1 Kognitívna veda a umelá inteligencia Kolektív autorov: Igor Farkaš Barbora Cimrová Ján Rybár Martin Takáč Andrej Lúčny Katedra aplikovanej informatiky / Centrum pre kognitívnu vedu Fakulta matematiky, fyziky a informatiky Univerzita Komenského v Bratislave Vydané pre Univerzitu Hradec Králové v rámci projektu "Informační, kognitivní a interdisciplinární podpora výzkumu" (reg. č. CZ.1.07/2.3.00/20.0001) Február 2013

Kognitívna veda a umelá inteligencia

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Kognitívna veda a umelá inteligencia

1

Kognitívna veda a umelá inteligencia

Kolektív autorov:

Igor Farkaš

Barbora Cimrová

Ján Rybár

Martin Takáč

Andrej Lúčny

Katedra aplikovanej informatiky /

Centrum pre kognitívnu vedu

Fakulta matematiky, fyziky a informatiky

Univerzita Komenského v Bratislave

Vydané pre Univerzitu Hradec Králové

v rámci projektu "Informační, kognitivní a interdisciplinární podpora

výzkumu" (reg. č. CZ.1.07/2.3.00/20.0001)

Február 2013

Page 2: Kognitívna veda a umelá inteligencia

2

Obsah

1 Paradigmy a metódy výskumu v kognitívnej vede

(Igor Farkaš)

2 Neuroveda – strategická oblasť výskumu v kognitívnej vede

(Barbora Cimrová)

3 Fundamentálne aspekty kognície: percepcia a pamäť

(Ján Rybár)

4 Reprezentácia významov v živých a umelých systémoch

(Martin Takáč)

5 Postkognitivistický prístup k percepcii a akcii v mobilnej robotike

(Andrej Lúčny)

Page 3: Kognitívna veda a umelá inteligencia

3

Kapitola 1

Paradigmy a metódy výskumu v kognitívnej vede

IGOR FARKAŠ

„Veda sa vyvíjala opačným smerom, než aký by sa bol dal očakávať. To,

čo bolo od nás najviac vzdialené, sme opísali pomocou prírodných

zákonov ako prvé, a potom postupne to, čo k nám bolo bližšie: najprv

vesmír, potom Zem, svet zvierat a rastlín, potom ľudské telo, a napokon

(hoci stále veľmi neúplne) ľudskú myseľ.“

(B. Russell, 1935)

1.1 Úvod

Snahy o pochopenie fungovania ľudskej mysle siahajú až do antických čias, keď boli

výsostnou doménou filozofov. Už tí si kládli otázky, v akom vzťahu je myseľ (duša) k

telu, ktoré znalosti sú vrodené, a ktoré sa učíme, a ako ich získavame, či fyzikálne a

abstraktné objekty existujú nezávisle od nás alebo sú výplodom ľudskej mysle atď. Až

koncom 19. storočia sa od filozofie oddelila psychológia, postupným zavádzaním nových

vedeckých metód skúmania. Ďalším významným míľnikom v histórii bola polovica 20.

storočia, keď tzv. kognitívna revolúcia, predznamenaná prvým Hixonským sympóziom

konanom v Kalifornii v roku 1948, viedla k vzniku kognitívnej vedy, ako vedy o poznaní

(z lat. cognitio). Táto udalosť bola vyvrcholením paralelných snáh o skúmanie ľudskej

mysle (mind) a mentálnych procesov (Gardner, 1987). Tieto snahy sa týkali materských

disciplín kognitívnej vedy (časť 1.2), čím sa vytvorili predpoklady pre zrod tejto novej

vednej disciplíny. Na myseľ a kognitívne procesy sa môžeme pozerať z rôznych

perspektív, využívajúc pritom odlišné metódy skúmania. To si vyžaduje samotný objekt

skúmania – myseľ, kvôli svojej komplexnosti, ako aj „špeciálnemu“ statusu. Na jednej

strane, myseľ je privátna (perspektíva prvej osoby) a vlastnému subjektu prístupná, vďaka

čomu ten dokáže vypovedať o (niektorých) svojich mentálnych stavoch. Na druhej strane,

mozog, ako predpokladaný fyzikálny substrát mysle, je objektívne pozorovateľný

(perspektíva tretej osoby), takže ho môžeme skúmať metódami prírodných vied, no

človek samotný k nemu nemá prístup (nie sme si vedomí aktivity vlastného mozgu).

Aj keď myseľ nie je dobre definovateľná entita (môžeme povedať, že neexistuje v

tomto smere v odbornej literatúre jednotný názor), snažíme sa ju skúmať vedeckými

metódami, aj keď nepriamo, napríklad pozorovaním správania alebo pomocou rôznych

fyziologických meraní. Tento proces skúmania je zložitý, pretože schopnosti a prejavy

človeka sú veľmi rozmanité a komplexné. Možno aj preto v súčasnosti stále neexistuje

konsenzus, či kognitívna veda je samostatnou vednou disciplínou alebo stále ostáva

súborom viacerých vedných smerov, z ktorých každý nezávisle napreduje so svojimi

metódami a špecifickými aspektmi skúmania mysle (Greco, 2012).

Page 4: Kognitívna veda a umelá inteligencia

4

Ďalej budeme postupovať nasledovne. V časti 1.2 uvedieme krátky prehľad

materských disciplín kognitívnej vedy a spomenieme i niektoré kľúčové pojmy. Časť 1.3

je „preletom ponad“ hlavné paradigmy kognitívnej vedy. V častiach 1.4 a 1.5

konkrétnejšie vysvetľujeme dva pojmy – reprezentáciu a počítanie. V časti 1.6 uvedieme

argumenty v prospech paradigmy ukotvenej kognície a časť 1.7 je stručným záverom.

1.2 Materské disciplíny kognitívnej vedy

Myseľ je predmetom skúmania viacerých vedeckých disciplín. Samozrejme historicky

najstaršou disciplínou je filozofia, založená na vnútornom pozorovaní (introspekcii)

myšlienok, pocitov, predstáv či želaní. Introspektívne poznanie tvorilo podľa viacerých

filozofov základnú metódu, ako sa oboznamovať s vlastnou skúsenosťou. Okrem toho,

tento spôsob sa používal aj pri uvažovaní o mentálnych stavoch druhých. Aj keď filozofiu

možno vnímať v porovnaní s prírodovednými metódami ako menej exaktnú, úloha

filozofie mysle bola a ostáva veľmi dôležitá. Namiesto odpovedí sa filozofi mysle snažia

spochybňovať teórie a formulovať otázky. Dokážu sa však pozerať na svet s nadhľadom a

nútiť expertov k reflexii o vlastnom snažení. Ich filozofické otázky sa obyčajne týkajú

ontológie (povahy existencie niečoho) a epistemológie (podstaty poznávania). Príkladom

ontologickej otázky môže byť to, či povaha existencie nejakého fyzikálneho objektu

(povedzme kameňa alebo mozgu) je rovnaká ako v prípade nejakého abstraktného

objektu (napríklad prvočísel, alebo mentálnych predstáv). Epistemologická otázka sa

môže týkať napríklad toho, či je niečo poznateľné, alebo aký je vzťah znalostí k pravde,

či presvedčeniam.

Keď sa (vedecká) psychológia odčlenila od filozofie, prevzala od nej síce

introspekciu ako metódu skúmania, ale hlavne ju obohatila o iné metódy – skúmanie

pomocou behaviorálnych experimentov, ktorých dizajn, realizácia a vyhodnocovanie sú

podložené štatistickou teóriou. Kognitívni psychológovia robia experimenty s ľudskými

subjektmi, alebo zvieratami, formulujú teórie a vedecké hypotézy, ktoré potom overujú

pomocou ďalších experimentov. Psychológia predstavuje veľmi dôležitú súčasť

kognitívnej vedy a v súčasnosti sa kognitívna psychológia stáva dokonca dominantnou z

hľadiska počtu publikácií (Gentner, 2010). Experimentálnych poznatkov týkajúcich sa

rôznych kognitívnych funkcií (percepcia, pamäť, plánovanie, rozhodovanie, konanie a

iné) je v súčasnosti veľmi veľa, no stále nie dosť, pretože i v rámci psychológie existuje

nejednoznačnosť v interpretácii výsledkov. To znamená, že namerané dáta sa dajú

vysvetliť rôznymi spôsobmi a teda môžu byť niekedy konzistentné s viacerými teóriami.

Ďalšia materská disciplína je lingvistika, pretože jazyková schopnosť človeka si

zasluhuje špecifické postavenie. Jazykovedci využívajú fakt, že jazyk je akousi bránou do

mysle človeka (čo v prípade zvierat neplatí, na rozdiel od niektorých iných kognitívnych

funkcií, ktoré človek so zvieratami zdieľa). Lingvistika, ako veda o jazyku, má svoje

bohaté vnútorné členenie. Tu spomeňme len dve podoblasti, dôležité z pohľadu

kognitívnej vedy. Psycholingvistika, t.j. psychológia jazyka, sa zameriava na

psychologické experimenty zamerané na skúmanie jazykového správania.

Neurolingvistika si všíma súvislosti medzi poškodeniami mozgu a jazykovým správaním,

čo umožňuje hľadať tzv. neurálne koreláty jazykových funkcií.

Page 5: Kognitívna veda a umelá inteligencia

5

Nemenej zásadnú rolu pri konštituovaní kognitívnej vedy zohrala umelá inteligencia

a vznik digitálneho počítača, ktorý vniesol do kognitívnej vedy novú paradigmu (ale i

nové otázky). Metafora mozgu ako počítača, a mysle ako jeho softvéru, navodila

intuitívne zaujímavú predstavu (v duchu funkcionalizmu) o tom, ako by mohla myseľ

fungovať. Okrem toho, snaha modelovať ľudské myslenie a správanie pomocou

formálnych metód (matematických a algoritmických postupov) dodala skúmaniu kognície

väčšiu exaktnosť. Navrhnúť inteligentné systémy, resp. autonómne robotické systémy

vybavené počítačom (umelým mozgom), je dlhodobým cieľom umelej inteligencie, ktorý

napriek viacerým nezdarom a sklamaniam je stále živý, aj vďaka novým, prírodou

inšpirovaným prístupom, napríklad v rámci kognitívnej robotiky (Asada a spol., 2009).

V rámci súčasných empirických vied sa kognitívna neuroveda snaží dávať do súvisu

kognitívne funkcie (myseľ) s rôznymi časťami mozgu, Spočiatku to bolo hlavne pomocou

behaviorálnych experimentov. K tomuto skúmaniu od 80. rokov minulého storočia

výrazne napomáhajú zobrazovacie metódy mozgu, ktoré nám poskytujú pomerne detailnú

informáciu o činnosti rôznych častí mozgu pri vykonávaní kognitívnych úloh. Ukazuje

sa, že je dôležité skúmať mozog, ak chceme spoznať myseľ (pozri kapitolu 2). Opierame

sa pritom o principiálny predpoklad, že všetky myšlienkové pochody charakterizujúce

myseľ majú svoj biologický základ (korelát).

Napokon, k materským disciplínam kognitívnej vedy sa radí aj kognitívna

antropológia, pretože človek je sociálna bytosť, a tak jeho poznanie a s tým súvisiaci

vývin mysle závisí aj od kultúry. Kognitívni antropológovia sa teda pozerajú na ľudský

druh ako na spoločnosť jedincov, v rámci ktorej vzniká a šíri sa poznanie a kultúrna

inovácia. Kognitívna antropológia sa zaoberá otázkami týkajúcimi sa toho, čo ľudia z

rôznych komunít vedia a ako ich znalosti ovplyvňujú ich vnímanie a interakciu vo svete

okolo nich.

1.2.1 Interdisciplinarita

Jednou zo základných otázok kognitívnej vedy je, či je multidisciplinárna alebo

interdisciplinárna. Multidisciplinarita je neintegratívna, čo znamená, že každá disciplína

si zachováva svoje metodológie skúmania ako aj predpoklady, z ktorých vychádza. Na

druhej strane, interdisciplinarita prekračuje tradičné hranice medzi disciplínami. V oboch

prípadoch možno kognitívnu vedu metaforicky ilustrovať ako snahu o skúmanie veľkého

objektu (napríklad slona) prostredníctvom skupinky nevidiacich vedcov, z ktorých každý

môže preskúmať svojimi dotykmi len nejakú časť. Ich vzájomná komunikácia by však

mohla vyústiť v skupinové poznanie celého objektu.

Každá zo spomínaných disciplín teda prináša so sebou svoje tehličky do mozaiky

poznania kognitívnych procesov. Empirické metódy sú zdrojom informácií pre vznik

teórií a výpočtových modelov, ktoré sa snažia vysvetliť namerané dáta. Tým jednak

ponúkajú mechanistické vysvetlenia,1 ako by myseľ mohla fungovať, a na druhej strane

1 Mechanistický prístup k vysvetľovaniu nejakého fenoménu, založený na redukcionizme, netreba

chápať nejako pejoratívne, či znevažujúco. Ide o štardardný vedecký prístup, ktorého podstatou

je pochopiť fenomén rozkladom na (predpokladané) časti (redukcionizmus) ale aj na interakcie

medzi nimi (rekonštrukcia).

Page 6: Kognitívna veda a umelá inteligencia

6

ponúkajú nové, testovateľné predikcie, ktoré inšpirujú nové experimenty. Tento cyklický

proces poznávania si bude určite vyžadovať ešte veľa iterácií, a to najmä kvôli

nerozhoduteľnosti medzi rôznymi teóriami ako aj nedostatku dobrých a overiteľných

výpočtových modelov (Addyman a French, 2012).

1.2.2 Dôležité pojmy kognitívnej vedy

Ak sa pozrieme na rôzne pokusy o definíciu kognitívnej vedy, môžeme si v nich všimnúť

niekoľko dôležitých pojmov. Napríklad filozof John Searle (1984) uvádza, že “úlohou

kognitívnej vedy je charakterizovať mozog, no nie na úrovni neurónov, ani na úrovni

vedomých mentálnych stavov, ale na úrovni jeho fungovania ako systému spracovania

informácií.” Jeden z otcov umelej inteligencie, Herbert Simon (1989) píše, že „kognitívna

veda je štúdiom inteligencie a inteligentných systémov, so zvláštnym zreteľom na

inteligentné správanie ako počítanie.” Kognitívny vedec Paul Thagard (2001) zase zužuje

pozornosť na myslenie a tvrdí, že „myslenie možno najlepšie vysvetliť v termínoch

reprezentačnej štruktúry mysle a výpočtových procedúr, ktoré pracujú s týmito

štruktúrami“ (Thagard, 2001). V týchto definíciách (a mnohých ďalších) sa vyskytujú

viaceré kľúčové pojmy, ako mentálne stavy, reprezentácie, spracovanie informácie,

výpočtové operácie, úrovne abstrakcie, a iné. Môžeme teda povedať, že reprezentačno-

výpočtový pohľad na myseľ hrá v kognitívnej vede významnú úlohu. Názory sa však

odlišujú v tom, aké reprezentácie a aké výpočty s nimi v mysli prebiehajú. Týmto

pojmom sa preto budeme bližšie venovať v ďalšom texte.

1.2.3 Úrovne analýzy

V snahe o poznávanie mozgu/mysle hrá tiež dôležitú úlohu úroveň abstrakcie. Významný

britský neurovedec a psychológ David Marr (1982) predstavil svoju teóriu, v ktorej

postuloval existenciu troch nezávislých, komplementárnych úrovní abstrakcie, analýzy

(vysvetlenia nejakého fenoménu) – výpočtovej, algoritmickej a implementačnej. Táto

teória bola rozpracovaná v kontexte Marrovho modelu spracovania vizuálnej informácie,

a pomocou nej zdôraznil podobnosť mozgu/mysle s počítačom. Výpočtová úroveň

definuje, aká informácia sa počíta a prečo, bez bližšej špecifikácie. Algoritmická úroveň

už vyžaduje znalosť o používaných reprezentáciách, uchovávajúcich informácie, a o

algoritmických výpočtoch s nimi. Implementačná úroveň sa týka opisu konkrétneho

algoritmu realizovateľného na konkrétnom fyzickom substráte. Tieto úrovne sú

považované za vzájomne nezávislé a platí medzi nim vzťah, že jedno vysvetlenie na

vyššej úrovni sa dá transformovať na viacero vysvetlení na nižšej úrovni (princíp

viacnásobnej realizovateľnosti). Ako ilustračný príklad uvažujme násobenie dvoch

viacciferných čísel. To je teda cieľ výpočtu, ktorý sa dá dosiahnuť rôznymi algoritmami,

napríklad takým, ktorý človek bežne používa, a v ktorom sa medzivýsledky násobenia

(jedného čísla číslicou druhého čísla) zapíšu pod seba a potom sa sčítajú. Napokon,

implementačná úroveň už predstavuje konkrétnu realizáciu tohto algoritmu v nejakom

fyzickom médiu (počítač, pero a papier, a i.).

Page 7: Kognitívna veda a umelá inteligencia

7

1.3 Paradigmy kognitívnej vedy

Od svojich počiatkov prešla kognitívna veda za 60 rokov svojej existencie vývojom,

ktorý sprevádzali štyri významné paradigmy – symbolizmus, konekcionizmus,

dynamické systémy a pravdepodobnostné prístupy. Zrejme by bolo dobré najprv objasniť

význam pojmu paradigma. Významný americký filozof vedy T. S. Kuhn zadefinoval

vedeckú paradigmu ako „všeobecne uznávaný vedecký pokrok, ktorý na nejaký čas

ponúka modelové problémy a riešenia pre komunitu výskumníkov“ (Kuhn, 1996, s. 10).

Každá paradigma teda prináša nový pohľad na študovaný fenomén, podložený nejakou

teóriou, prípadne empirickými poznatkami, a býva často spojená s kontrastom voči

predchádzajúcej paradigme. Kuhn okrem iného zaviedol aj termín posun v paradigme

(paradigm shift), ktorý vyjadruje prechod z jednej paradigmy na druhú, aj keď napríklad

v prípade kognitívnej vedy môžeme povedať, že prechody medzi paradigmami sú

pozvoľné, a viaceré paradigmy stále koexistujú, pretože majú svojich stúpencov (aj keď

ich význam sa s časom mení).

Všetky štyri vyššie spomínané paradigmy sa dotýkajú výpočtových prístupov pri

formalizácii mysle a mentálnych procesov, no majú aj svoje filozofické aspekty týkajúce

sa vzťahu mysle a mozgu. Formálne výpočtové prístupy, ako bolo spomínané, ponúkajú

explicitné mechanizmy fungovania mysle/mozgu, čo principiálne nemožno dosiahnuť

pomocou teoretických modelov (s krabičkami a šípkami). V týchto paradigmách

vystupujú vyššie spomínané pojmy, no nie vždy sa používajú s rovnakým významom, čo

sa pokúsime objasniť.

1.3.1 Symbolizmus

Vznik symbolizmu (známeho aj ako kognitivizmus

alebo klasická paradigma) bol

stimulovaný vynájdením moderných digitálnych počítačov, ktoré realizujú diskrétne

výpočty so symbolmi. Výpočet v počítači prebieha za pomoci dvoch odlišných

kľúčových komponentov: procesora a pamäte. Procesor sériovým spôsobom spracováva

symboly, uložené v pamäti a vykonáva pritom inštrukcie podľa programu uloženého

v inej časti pamäte. Interakcia počítača s prostredím je na periférii záujmu a prebieha

prostredníctvom vstupno-výstupných podsystémov, ktoré (vhodnou transformáciou)

sprostredkovávajú vstupy pre centrálny procesor a pre výstupy z neho. Klasická

paradigma poníma myseľ ako výpočtový stroj, oddeliteľný od prostredia, ktorý

manipuluje s internými symbolmi podľa logických pravidiel, podobne ako to robí počítač.

Výpočtovú teóriu mysle vystihuje hypotéza o fyzikálnom symbolovom systéme, ktorý

podľa jej autorov „disponuje nutnými a postačujúcimi prostriedkami na všeobecné

inteligentné konanie“ (Newell a Simon, 1976).2 Významným počiatočným impulzom pre

symbolizmus bol návrh operacionalizácie testu procesu myslenia, známeho ako Turingov

test (Turing, 1950), podľa ktorého by počítač, pokiaľ by prešiel úspešne testom,

vykazoval inteligentné správanie, neodlíšiteľné od správania človeka.

2 Čo to presne je inteligentné konanie/správanie nás teraz nemusí trápiť. Postačí, že čitateľ má o

tom intuitívnu predstavu. Viac na túto tému možno nájsť napríklad v práci Šefránek, Takáč a

Farkaš (2008).

Page 8: Kognitívna veda a umelá inteligencia

8

Vychádzajúc zo skorších prác symbolikov (Turing, 1950; Newell a Simon, 1976;

Fodor, 1983), Harnad (1990) zrekonštruoval výstižnú definíciu symbolového systému, kde

kľúčovú úlohu hrá syntax, pričom sémantika sa dodá do systému „zvonka“ dizajnérom

systému. Harnad (1990) taktiež sformuloval problém ukotvenia symbolov, ktorý možno

považovať je jeden z kľúčových v oblasti kognitívnej vedy a akvizície významov (pozri

kapitolu 4).

Z pohľadu symbolizmu je teda podstatné, že myslenie (a tým aj konanie) človeka je

vnútorne riadené algoritmami, ktoré sú realizované programami, s využitím vhodných

reprezentácií (napr. predikáty alebo propozície), nejako implementovanými v mozgu.

Ako, to symbolizmus nerieši, pretože sa to považuje len za vec implementácie. Pri

počítačoch môžeme ľubovoľný algoritmus naprogramovať v nejakom programovacom

jazyku a potom ho implementovať vo zvolenej hardvérovej platforme. Podobná predstava

prevláda i v prípade mozgu. Nezáleží ako sú v mozgu implementované mentálne procesy.

Symbolový (algoritmický) pohľad na myseľ je dodnes viacerými odborníkmi

považovaný za tú správnu úroveň abstrakcie, a to najmä z troch dôvodov (Barsalou,

2008): (1) Poskytuje elegantné, transparentné, expresívne (silné) formalizmy na

reprezentáciu znalostí, (2) Zachytáva dôležité ľudské intuície týkajúce sa symbolového

charakteru kognície. Je možné, že ide o jednu z početných kognitívnych predispozícií

človeka (cognitive biases) smerom k diskrétnym formalizmom, pretože operácie

používané na symboloch sú blízke ľudskému mysleniu. (3) Dá sa dobre implementovať v

umelej inteligencii.3 Symbolizmus vníma kogníciu ako manipuláciu tzv. amodálnych

symbolov (t.j. nezávislých od modalít ako je zrak, sluch a iné zmysly) algoritmickým

spôsobom, čo vedie ku klasickému počítaniu, ktoré možno implementovať v

štandardných počítačoch. Symbolizmus sa používa najmä na vysvetľovanie procesov tzv.

vyššej kognície, ako je usudzovanie, plánovanie, a tiež používanie jazyka (napr. Fodor,

2000; Šefránek, 2002; Pinker 2009).

1.3.2 Konekcionizmus

Konekcionizmus predstavuje spektrum metód, ktoré vznikli v rámci umelej inteligencie, a

ktoré boli inšpirované architektúrou a fungovaním mozgu. Môžeme teda hovoriť o

inšpirácii „zdola.“ Konekcionistický systém pozostáva z množiny jednoduchých prvkov –

umelých neurónov, navzájom komunikujúcich cez váhované spojenia, ktoré predstavujú

dlhodobú pamäť systému. Sila konekcionistického systému – umelej neurónovej siete –

nie je v samotných neurónoch, ale v ich vzájomnom prepojení a interakcii. Paralelné

spracovanie a distribuovanosť aktivity predstavujú základný architektúrny rozdiel

v porovnaní so symbolovým systémom, pretože každý neurón je súčasne procesorom aj

pamäťou (aj keď elementárnou). Povaha komunikácie medzi neurónmi má numerický a

nie symbolový charakter, preto hovoríme v prípade sietí o tzv. subsymbolových

reprezentáciách.

Neurónová sieť môže pracovať so spojitými hodnotami, čo je veľmi vhodným

nástrojom na modelovanie kognície, pretože empirické dáta nasvedčujú tomu, že mnoho

3 Umelá inteligencia a výpočtová kognitívna veda majú veľa spoločného, no dá sa zhruba

povedať, že v umelej inteligencii menej záleží na biologickej prijateľnosti modelu.

Page 9: Kognitívna veda a umelá inteligencia

9

kognitívnych procesov má spojité prejavy. Napríklad, nielenže perceptuálne vstupy (napr.

obraz na sietnici) a motorické výstupy bývajú spojité (pohyby, zvuková podoba reči), ale

podobne môžeme argumentovať aj v prípade modelovania vyšších procesov, napr.

rozhodovania (Spivey, 2007). Spomeňme si, aké ťažké môže byť niekedy rozhodnúť sa

medzi dvoma alternatívami. Tento proces „súperenia“ alternatív sa dá vysvetliť pomocou

neurónovej siete so spojitými aktiváciami. Neurónová sieť teda spracováva numerické

dáta v podobe vektorov. Operácie nad takýmito vektorovými dátami sú (nelineárnymi)

transformáciami, čo má svoje implikácie. Je zrejmé, že takéto operácie nie sú vôbec

transparentné, a preto sú človeku málo zrozumiteľné, a aj preto si neurónové siete

vyslúžili prívlastok „čierna skrinka.“ Môžeme však použiť techniky zhlukovania a

vizualizácie vysokorozmerných dát, ktoré nám pomáhajú odhaliť, čo sa v neurónovej sieti

deje (O'Brien a Opie, 2006).

Dôležitou vlastnosťou umelých neurónových sietí je to, že na rozdiel od symbolovej

umelej inteligencie, kde znalosť do systému vkladá dizajnér, ponúkajú biologicky

inšpirované mechanizmy akvizície znalostí, učenia, aplikovateľné na rôznych úrovniach

abstrakcie (Haykin, 2008; Kvasnička a spol., 1997). To znamená, že parametre siete

(váhy spojení) nemusíme explicitne nastaviť (čo sa prakticky ani nedá), no treba sieti

poskytnúť vhodný mechanizmus učenia. Podobne ako človek, neurónová sieť sa učí na

príkladoch. Učenie spôsobuje zmenu váh tak, aby sa po naučení dosiahlo požadované

správanie siete, čo formálne odpovedá hľadaniu extrému (minima, resp. maxima) nejakej

hodnotovej funkcie.

Na rozdiel od symbolizmu, konekcionizmus zahŕňa aj implementačnú úroveň

analýzy. Niektorí filozofi zastávajú názor, že toto nie je podstatné, pretože vysvetľované

fenomény treba oddeliť od mechanizmov ich vzniku (Abrahamsen a Bechtel, 2006),

avšak v konekcionistických modeloch sú tieto dva aspekty spojené. To znamená, že

existuje závislosť medzi implementovanými mechanizmami (danými neurálnymi

interakciami) a kognitívnymi fenoménmi (O'Reilly a Munakata, 2000). Inými slovami,

špecifikáciu neurónovej siete môžeme vytvoriť na výpočtovej úrovni (prostredníctvom

funkcie, ktorú chceme realizovať), no elementárne funkcie (týkajúce sa neurónov) už

umožňujú priamu implementáciu v hardvéri, s relatívne malou abstrakciou od

biologických neurónových sietí.

V prípade neurónových sietí tiež bežne hovoríme, že počítajú a spracovávajú

informácie. Počítajú však rovnako ako symbolové systémy? Detailnejší pohľad na

existujúce modely neurónových sietí nám napovedá, že tie nie sú homogénnou skupinou,

ale naopak, spektrom metód z pohľadu typov aktivácií neurónov a ich dynamiky.

Modely, ktoré pracujú v spojitom priestore, a niektoré dokonca v spojitom čase, sú

matematickými modelmi, ktoré sa dajú presne opísať len pomocou (nelineárnych)

diferenciálnych rovníc, a nie pomocou diskrétnych krokov výpočtu (počítačová

implementácia ponúka len aproximáciu). Zahrnutie takýchto modelov si vyžaduje

voľnejšiu definíciu počítania, o čom pojednávame ďalej. Od modelov neurónových sietí

pracujúcich v spojitom čase sa priamo dostávame k paradigme dynamických systémov.

Page 10: Kognitívna veda a umelá inteligencia

10

1.3.3 Dynamické systémy

Čo klasická paradigma a konekcionizmus zdieľajú, je ich izolovanosť od okolitého

prostredia. V prípade symbolového modelu je to zjavné, pretože nezávislosť od prostredia

je jedným z predpokladov. Neurónová sieť sa síce učí, čiže interaguje s prostredím, no

bežným predpokladom je, že všetky trénovacie dáta máme hneď dispozícii, takže

interakcia nie je „plnohodnotná,“ pretože výstupy siete nemajú dopad na prostredie.

Takýto pohľad na kogníciu sa stal tŕňom v oku niektorým kognitívnym vedcom, ktorí

prišli s myšlienkou kognitívneho systému ako dynamického systému, ktorý predstavuje

proces interakcie s prostredím v spojitom čase a priestore (Thelen a Smith, 1994; Port a

van Gelder, 1995). Kognitívne procesy teda nie sú chápané izolovane od prostredia, ale

v úzkej previazanosti s ním (coupling). Kognitívne procesy ako aj konanie človeka sú

aktivitou v čase, ktorú môžeme opísať pomocou systému nelineárnych diferenciálnych

rovníc. Táto paradigma, postavená na teórii nelineárnych dynamických systémov

predpokladá existenciu dvoch kľúčových, vzájomne prepojených, typov premenných.

Jedným sú tzv. kolektívne premenné, ktoré zahŕňajú vzťahy medzi interagujúcimi

zložkami dynamického systému, a vysvetľujú správanie systému. Druhým typom sú

riadiace parametre, ktorých kvantitatívne zmeny môžu spôsobovať kvalitatívne zmeny v

správaní systému (tzv. fázové prechody). Príkladom takéhoto dynamického systému

môže byť pohyb koňa, ktorého rytmus pohybu (vyjadrený periodickými priebehmi

kolektívnych premenných) závisí od rýchlosti pohybu (riadiaci parameter). Kôň sa môže

pohybovať v každom čase len v jednom rytme, (fázové) prechody medzi nimi nemusia

nutne nastávať pri tých istých rýchlostiach, a závisia aj od stavu prostredia (napr.

hrboľatá cesta). Súčasťou takéhoto dynamického opisu kognitívneho procesu sa teda

priamo stáva aj prostredie, čo rozširuje konceptuálne chápanie mysle. Bressler a Kelso

(2001) argumentujú, že dynamický pohľad je relevantný aj pre charakterizáciu

samotných mentálnych procesov (vnútri kognitívneho systému), hoci identifikácia

kolektívnych premenných a riadiacich parametrov v tomto prípade je zatiaľ tvrdým

orieškom. Okrem toho, zmeny parametrov bývajú nastavované zvonka (dizajnérom), čo

je tiež slabou stránkou dynamických systémov (McClelland, 2009).

Dynamický pohľad na spoznávanie vonkajšieho sveta predstavuje pilier

zjednávacieho (enaktívneho) prístupu (Varela, Thompson a Rosch, 1991), kde sa dôraz z

vnútorných reprezentácií (vopred daného) vonkajšieho sveta presúva na vnímanie

a jednanie vo svete, ktorý sa takto spoluvytvára. Tým vzniká prostredníctvom spätnej

väzby kruhový proces, pretože zjednávaný svet je prostredím pre zjednávanie

(enactment), ale zjednávanie je súčasne predpokladom zjednávaného sveta. V rámci tohto

pohľadu si každý subjekt (kognitívny systém) zjedná svoj svet sám v procese dynamickej

interakcie so svetom (vrátane iných jedincov), a ten bude jedinečný. Zjednávací prístup je

teda založený na konceptoch ako skúsenosť, autonómia, emergencia a vytváranie

významov (sense-making) prostredníctvom skúsenosti. Táto perspektíva je predmetom aj

niektorých ostatných kapitol (4 a 5).

Page 11: Kognitívna veda a umelá inteligencia

11

1.3.4 Pravdepodobnostné modely

Pravdepodobnostný prístup4 sa stal populárny v kognitívnej vede najmä v ostatnej dekáde

rokov (Perfors, Tenenbaum, Griffiths a Xu, 2011). Tento teoreticky podložený

Bayesovský prístup ktorý využíva široké spektrum reprezentácií (stromy, vektory,

logické pravidlá atď.), kombinuje ich so štatistickým učením a tvorením inferencií (t.j.

nových poznatkov na základe dedukcie) za prítomnosti neurčitosti, poskytuje vysvetlenia

na výpočtovej úrovni (v zmysle Marrovej taxonómie). Implementačná úroveň je

považovaná za menej dôležitú, nechávajúc priestor pre hľadanie potenciálnych

odpovedajúcich neurálnych mechanizmov. Na rozdiel od konekcionizmu, ktorý začína

zdola nahor definovaním mechanizmov, pravdepodobnostný prístup ide smerom zhora

nadol, začínajúc funkciou, ktorú chceme vysvetliť, hľadajúc optimálnu reprezentáciu na

vysvetlenie dát. Tento prístup zahŕňa aj dimenziu vrodené–získané (nature–nurture)

prostredníctvom tzv. induktívnych výchyliek (inductive biases), čo sú apriórne distribúcie

na množine hypotéz (vyplývajúce zo znalosti domény). Tie tiež vstupujú do výpočtov

aposteriórnych distribúcií, t.j. tých, ktoré zohľadňujú aj pozorované dáta. Hypotézy si

môžeme predstaviť ako rôzne riešenia alebo kategórie (napr. pri klasifikácii dát), ktoré

máme zistiť na základe apriórnych znalostí (o svete), ako aj pozorovaných dát.

Bayesovský prístup de facto kalkuluje s rôznymi riešeniami paralelne a s prichádzajúcimi

dátami ich aktualizuje, čo je v podstate tiež forma učenia na vyššej úrovni abstrakcie.

Pravdepodobnostný prístup dokázal vysvetliť rôzne prejavy ľudského správania

(pozri článok Griffiths, Kemp a Tenenbaum, 2010, a tamojšie referencie). Vysvetlenia na

výpočtovej úrovni sú považované nielen za výpočtovú abstrakciu skrytých mechanizmov,

ale ich zástancovia tvrdia, že majú nezávislú výpovednú hodnotu (platnosť). McClelland

(2009) však načrtáva niektoré otázky súvisiace s týmto prístupom. Pravdepodobnostný

prístup vychádza z presvedčenia, že ľudskú kogníciu je možné chápať ako sériu

optimálnych odpovedí (čo vedie k racionálnemu správaniu), vzhľadom na obmedzenia,

ktoré človek v danej situácii a kontexte. Vieme však, že človek niekedy koná

neracionálne, aj pod vplyvom emócií (teória ohraničenej racionality). Okrem toho,

problémom Bayesovských prístupov je ich výpočtová neúnosnosť v prípade modelovania

zložitejších problémov. Na druhej strane možno predpovedať, že zvýšený nárast o tieto

prístupy v ostatných rokoch predznamenáva ich možnú dôležitosť v budúcnosti. Bude

zaujímavé objavovať potenciálne linky medzi pravdepodobnostnou výpočtovou úrovňou

a neurálnou implementačnou úrovňou pri snahe pochopiť ľudskú myseľ.

1.4 Reprezentácia

Ako sme avizovali vyššie, pozrime sa teraz bližšie na pojem reprezentácia. Tento pojem

sa bežne používa nielen v umelej inteligencii, ale aj v kognitívnej psychológii, či

lingvistike. Jazykový pôvod tohto pojmu napovedá, že ide o re-prezentovanie niečoho

4 Na rozdiel od predchádzajúcich troch paradigiem, pravdepodobnostný prístup zrejme nenájdeme

medzi paradigmami v bežnej učebnici kognitívnej vedy. V literatúre niektorí hovoria o

modelovacom prístupe, no používajú sa aj spojenia Bayesovská paradigma. Nazdávam sa, že

Bayesovský prístup sa dosť odlišuje od ostatných paradigiem, preto medzi ne tiež patrí.

Page 12: Kognitívna veda a umelá inteligencia

12

vonkajšieho (vo svete) niekde inde, vo vnútri nejakého systému (živého alebo umelého)

alebo i na papieri. V kognitívnej psychológii sa hovorí o mentálnych reprezentáciách, čo

je v podstate prvý teoretický konštrukt v kognitívnej vede (Pitt, 2008). Mentálna

reprezentácia je základným konceptom výpočtovej teórie mysle, podľa ktorej sú

kognitívne stavy a procesy konštituované výskytom, transformáciou a uchovávaním (v

mysli/mozgu) reprezentácií (t.j. štruktúr nesúcich informáciu) nejakého typu. Korene

pojmu mentálna reprezentácia však siahajú až do antických čias, keď širšie chápanie

tohto pojmu medzi filozofmi nemalo výpočtový charakter.5 Až neskorší predpoklad, že

reprezentácia je (abstraktný) objekt so sémantickými vlastnosťami (pozri aj kapitolu 4),

dal tomuto konceptu výpočtový charakter, pretože s takto definovanými objektmi by sa

už podľa predpokladu dalo manipulovať.

S nástupom umelej inteligencie sa hlavným cieľom stala reprezentácia znalostí, t.j.

snaha o formalizáciu znalostí takým spôsobom, aby sa dali uložiť a používať v počítači

(symbolovom systéme). Tu zohrali dôležitú úlohu lingvistika a logika, ktoré ponúkli

existujúce formalizmy na rôzne implementácie reprezentácie znalostí. Môžeme povedať,

že všetky znalosti (tzv. báza znalostí) sú z pohľadu klasickej paradigmy explicitné a

symbolové, a keď systém disponuje pravidlami odvodzovania (inferenčné mechanizmy),

dokáže si odvodiť ďalšie znalosti. Dôležitou vlastnosťou reprezentácií v symbolovom

systéme je, že sú stabilné. Môžu sa síce v čase meniť (ak je to súčasťou programu), ale sú

väčšinou kontextovo nezávislé. Napríklad, koncept6 strom je zväčša reprezentovaný

rovnakým amodálnym symbolom (alebo štruktúrou) vo všetkých prípadoch, a ak nie, tak

ku symbolu reprezentujúceho strom treba pridať iný symbol (alebo štruktúru), ktorý daný

kontext špecifikuje.

V prípade konekcionizmu majú reprezentácie inú povahu. Keďže vieme, že

dlhodobou pamäťou natrénovanej siete sú spojenia medzi neurónmi i so svojimi

hodnotami, znalosť je v sieti distribuovaná, a reprezentovaná implicitne a numericky.

Analýzou natrénovanej siete však vieme zväčša identifikovať, čo konkrétne neuróny a

spojenia medzi nimi zabezpečujú, aj keď komplikáciou je práve distribuovanosť

dlhodobej pamäti. Krátkodobá pamäť je realizovaná pomocou aktivácie neurónov, ako

odpovede na nejaký podnet (vonkajší alebo vnútorný). Miera distribuovanosti predstavuje

kontinuum, od úplnej distribuovanosti, cez riedke reprezentácie (sparse coding) až po

lokalistické reprezentácie (ktoré odpovedajú symbolovej reprezentácii).

V doméne dynamických systémov existuje radikálna téza, ktorá nepredpokladá

existenciu reprezentácií (Thelen a Smith, 1994). Dynamické procesy pracujú v spojitom

čase, a preto v žiadnom časovom okamihu nemôžeme predpokladať, že niečo z

vonkajšieho sveta by mohlo byť aktuálne reprezentované vnútri systému, pretože všetko

sa stále mení. Takýto postoj sa objavil aj v umelej inteligencii, keď Brooks (1986)

5 No už bolo možné hovoriť o reprezentačnej teórii mysle, ktorá pracovala s pojmami ako sú

myšlienky, presvedčenia, túžby, či obrazy, a ktorá sa v kognitívnej vede voľne zamieňa s

výpočtovou teóriou mysle. 6 V literatúre neexistuje konsenzus o definícii termínu koncept. Náš pohľad je konzistentný s

perspektívou kognitívnej sémantiky, t.j. koncept chápeme ako mentálny konštrukt (vzťahujúci

sa obyčajne na nejakú kategóriu), nezávislý od jazyka. Tým sa líši od pojmu, ktorý sa týka

prirodzeného jazyka. Oba termíny spolu súvisia: aby bol pojem pojmom, musí byť k nemu

priradený nejaký význam vyjadrený konceptom. Kognitívnej sémantike je venovaná kapitola 4.

Page 13: Kognitívna veda a umelá inteligencia

13

navrhol tzv. subsumpčnú architektúru inteligentného systému v robotike ako alternatívu k

tradičnej symbolovej architektúre. Subsumpčná architektúra je hierarchická, symbolová,

no správanie robota je čisto reaktívne, čiže nevyžaduje vnútorné reprezentácie (pozri

kapitolu 5). Tento trend v robotike mal snahu priblížiť umelú inteligenciu ku kognitívnej

vede, no nezachytáva aspekty vyššej kognitívnej činnosti, ktorá sa nezaobíde bez

vnútorných mentálnych reprezentácií (Gärdenfors, 1996). Preto reprezentačno-výpočtový

prístup je kompatibilný s mäkšou verziou dynamickej paradigmy (Kelso, 1995; Port a van

Gelder, 1995), resp. s pohľadom na mozog ako na samoorganizujúci sa systém (Farkaš,

2006).

Pravdepodobnostné modelovanie využíva celé spektrum reprezentácií (symbolové,

numerické, grafové), a principiálne nemá žiadne obmedzenia v tomto smere, na rozdiel

od ostatných paradigiem. Znalosť v systéme je daná pomocou pravdepodobností a tie

nadobúdajú spojité hodnoty. Podobnosť s konekcionizmom spočíva v schopnosti učenia a

tiež v tom, že niektoré formy konekcionistického učenia majú prirodzenú Bayesovskú

interpretáciu (napr. Mackay, 1996). Okrem toho, niektoré tzv. generatívne

konekcionistické modely využívajú pravdepodobnostný rámec, pričom si zachovávajú

svoj „konekcionistický štýl” (Bengio, 2009).

1.5 Počítanie z pohľadu paradigiem

Všetky spomínané paradigmy sa síce dotýkajú počítania, ale bližší pohľad na tento

koncept nám prezradí, že ho musíme poňať inak, ako nám napovedá intuícia a tradičné

používanie tohto pojmu. Taktiež, úloha výpočtových modelov v kognitívnej role je

považovaná za dôležitú (McClelland, 2009; Farkaš, 2012) no kontroverznú, práve z tohto

dôvodu. Neexistuje konsenzus o význame kľúčových pojmov ako sú počítanie alebo

spracovanie informácie (Piccicini a Scarantino, 2011).

Vznik moderného digitálneho počítača v 50. rokoch minulého storočia bol

jednoznačne dôležitým míľnikom, ktorý stimuloval pokrok v mnohých vedných

disciplínach, vrátane umelej inteligencie a kognitívnej vedy. Avšak, svet počítania

vznikol dávno pred konceptom Turingovho stroja (Turing, 1936). Sloman (2002) uvádza

historický kontext, ktorý tomu predchádzal prostredníctvom návrhu rôznych typov

strojov a zariadení, u ktorých by sa dalo diskutovať či počítajú alebo nie (napríklad

tkáčske stroje, rôzne regulátory, triediace stroje a iné). Jedine v prípade univerzálneho

digitálneho počítača nikto nepochybuje, že počíta (pretože na ten účel bol

skonštruovaný), v prípade ostatných systémov sa názory rôznia (Farkaš, 2012).

Pochybnosti sa týkajú samozrejme i biologických systémov, vrátane mozgu, aj keď si

intuitívne možno myslíme, že mozog je určite výpočtový systém (Churchland a

Sejnowski, 1992). Táto otázka sa dotýka aj filozofie, pretože jedna vec je, čím mozog je

(ontologicky), a druhá (epistemologická), ako ho môžeme a chceme poznávať (napríklad

ako výpočtový systém). Výpočtový pohľad v kognitívnej vede je však napriek tomu

kľúčový, lebo poskytuje pridanú hodnotu, ako sme už spomínali vyššie (Farkaš, 2012).

Vysvetleniu pojmu počítanie a jeho využiteľnosti v kognitívnej vede môže

napomôcť rozšírenie obsahu tohto pojmu. V užšom slova zmysle sa počítanie spája s

diskrétnymi výpočtami v diskrétnom čase (klasické počítanie), zatiaľ čo v širšom slova

Page 14: Kognitívna veda a umelá inteligencia

14

zmysle zahŕňa neklasické počítanie, ako napríklad analógové, kvantové alebo

pravdepodobnostné výpočty (Piccicini a Scarantino, 2011). Motiváciou pre tento posun

sú spomínané paradigmy kognitívnej vedy. Čo sa týka konekcionizmu, počítanie v

neurónovej sieti nemusí byť to isté ako počítanie v symbolovom systéme, ktorý vykonáva

program, realizujúci nejaký algoritmus sériovým spôsobom. Pracuje v diskrétnom čase, s

diskrétnymi entitami, symbolmi. Neurónové siete však nie sú homogénnou skupinou

metód, pretože niektoré modely neurónových sietí počítajú klasicky, niektoré neklasicky

a niektoré nepočítajú vôbec (Piccicini, 2008). To závisí od toho, či pracujeme v spojitom

alebo diskrétnom priestore a čase. Debaty ohľadne rozdielov medzi konekcionistickými a

symbolovými prístupmi možno nájsť v početnej literatúre. V kognitívnej vede prevláda

názor, že ľudská myseľ realizuje výpočty, a teda spracováva informácie, pričom my sa

tieto procesy snažíme vysvetliť pomocou formálnych modelov. Viacerí zástancovia

konekcionizmu zastávajú názor, že mozog vykonáva výpočty a že neurálne počítanie

vysvetľuje ľudskú kogníciu (napr. Feldman a Ballard, 1982; Churchland a Sejnowski,

1992; Bechtel a Abrahamsen, 2002; O’Brien a Opie, 2006). V čom sa líšia názory

konekcionistov a symbolikov je otázka, či konekcionistické modely sú lepšími

výpočtovými modelmi než klasické symbolové modely. Väčšina konekcionistov tvrdí, že

áno, symbolisti zase, že nie, lebo obe vysvetlenia sú vzájomne transformovateľné

(opierajúc sa o spomenuté dôkazy o ekvivalencii). Niektorí symbolici tvrdia, že

neurónové siete nepočítajú vôbec, alebo ak, tak len vtedy, keď implementujú symbolový

systém (Fodor a Pylyshyn, 1988). Niektorí prívrženci konekcionizmu zase zastávajú

názor, že mozog nie je výpočtovým systémom (napr. Edelman, 1992; Freeman, 2001), a

že naše výpočtové modelovanie je len jeho diskrétnou aproximáciou.

Čo sa týka ostatných paradigiem, v zmysle rozšírenej definície počítania dynamické

systémy nepočítajú vôbec (radikálna téza), alebo počítajú neklasicky (reprezentačno-

výpočtová pozícia). Pravdepodobnostné modely počítajú neklasicky, pretože pracujú

(obyčajne) v diskrétnom priestore spojitých pravdepodobností. Vo všetkých prípadoch

však počítač môžeme použiť ako nástroj na aproximáciu týchto modelov.7

1.6 Smerom k ukotvenej kognícii

Vývoj v kognitívnej vede možno pozorovať aj v kognitívnej psychológii, ktorá

prechádzala rôznymi štádiami. Venujme ešte pozornosť hlavným prúdom a teoretickým

koncepciám vo vývoji kognitívnej vedy, ktoré prispeli k posunu v dominantnosti

jednotlivých paradigiem (Gentner, 2010). Už v 70. rokoch minulého storočia sa v

kognitívnej psychológii objavovali skeptické pohľady na centrálnosť (vnútorných)

reprezentácií a symbolového spracovania informácie v ľudskej kognícii. Gibson (1970),

hlavný predstaviteľ prúdu známeho ako ekologická psychológia, zdôrazňoval, že „nie je

dôležité, čo je vo vnútri hlavy, ale vnútri čoho (akého prostredia) sa hlava nachádza.“

Tento prúd plynulo prešiel v 80. rokoch do teórie situovanej kognície, ktorá bola

postavená na predpokladoch, že ľudská inteligencia je fundamentálne interaktívna

7 To že diskrétny počítač úspešne používame na modelovanie kognitívnych procesov nehovorí

nič o tom, aká je povaha ľudskej kognície.

Page 15: Kognitívna veda a umelá inteligencia

15

(Hutchins, 1996), a že ľudská kognícia je fundamentálne neoddeliteľná od kontextu

(Lave, 1988). Podľa prvého predpokladu človek bezprostredne využíva prostredie (iných

ľudí, zariadenia, situácie, atď.) pre svoje inteligentné konanie, a je s nimi spojený v rámci

spätnoväzbovej slučky. Druhý predpoklad viedol k rozšírenému chápaniu mysle a

kognície v zmysle jej umiestnenia aj do prostredia – myseľ človeka nesídli len v jeho

mozgu, ale jej súčasťou sú aj prvky prostredia (napr. knihy, obrazy, počítač, rôzne

poznámky a i.).

Dôraz na interakciu s prostredím ostal v centre pozornosti aj naďalej, no v 90. rokoch

sa začal klásť dôraz na reprezentácie, ktoré túto interakciu umožňovali, a to v rámci

prúdu stelesnenej kognície. Stelesnená (embodied) kognícia, podobne ako tvrdil Gibson,

vychádza z predpokladu, že pochopenie mentálnych procesov nemožno oddeliť od tela

človeka, konkrétne jeho zmyslov a motoriky. Stelesnená kognícia súčasne predpokladá,

že informácia vstupuje do tela organizmu v podobe modálnych reprezentácií a podieľa sa

na ďalších, vyšších procesoch kognície (Barsalou, 1999). Zmysly určujú povahu

perceptuálnych vstupov, a motorické ústrojenstvo zase určuje spektrum akcií, ktoré

človek môže vykonať, a ktoré tiež predstavujú obmedzenia pre vznik a modifikáciu

vnútorných reprezentácií. Napríklad, mentálna reprezentácia objektu kladivo nezahŕňa len

jeho perceptuálne vlastnosti, ale aj možnosti použitia tohto objektu (ak s ním dotyčný

subjekt má skúsenosť).

V komunite kognitívnej vedy sa objavilo viacero rôznych no súvisiacich pohľadov na

stelesnenie a situovanosť kognície (Gibbs, 2006; Wilson, 2002). Barsalou (2008) navrhol

termín ukotvená kognícia, ktorý zjednocuje rôzne aspekty stelesnenia a situovania

v prostredí. Silnú podporu pre túto paradigmu v kognitívnej vede možno nájsť v

narastajúcej empirickej evidencii (za ostatných 20 rokov), či už z behaviorálnych štúdií

alebo zobrazovacích metód (pozri početné referencie v Barsalou, 2008). Teórie ukotvenej

kognície sú síce opisné, podobne ako klasické teórie, no ponúkajú testovateľné hypotézy

pre ďalší empirický výskum (napr. Lakoff a Johnson, 1999; Smith, 2005) ako aj priestor

pre výpočtové modely. Zaujímavou predikciou týchto teórií je to, že všetky kognitívne

funkcie (vrátane tých vyšších) sú redukovateľné na (nízkoúrovňové) senzomotorické

procesy. Inými slovami, neurálne reprezentácie vyšších a nižších kognitívnych procesov

majú prienik. Tento pohľad na myseľ má svoju relevantnosť aj ohľadne jednej z

kľúčových otázok v kognitívnej vede, ktorou je otázka významov (kapitola 4). Táto

paradigma sa v literatúre nazýva aj postkognitivistická (kapitola 5).

1.7 Záver

V rámci prehľadu paradigiem kognitívnej vedy sme sa snažili objasniť ich podstatné

charakteristiky, podobnosti a rozdiely. Spomenuli sme kľúčové pojmy kognitívnej vedy –

reprezentácia a počítanie, a vysvetlili sme, že pojem počítanie musíme chápať širšie než

ponúka klasická počítačová metafora mysle. Výpočtové modelovanie v kognitívnej vede

možno považovať za nevyhnutný metodologický komponent, ktorý ponúka explicitné

mechanizmy vysvetlenia ľudskej kognície, a teda procesov mysle.

Page 16: Kognitívna veda a umelá inteligencia

16

Literatúra

Abrahamsen A., Bechtel W. (2006). Phenomena and mechanisms: Putting the symbolic,

connectionist, and dynamical systems debate in broader perspective. In R. Stainton

(Ed.), Contemporary Debates in Cognitive Science. Oxford: Basil Blackwell.

Addyman, C., French, R. (2012). Computational modeling in cognitive science: A

manifesto for change. Topics in Cognitive Science, 4: 332-341.

Asada M. a spol. (2009). Cognitive developmental robotics: a survey. IEEE Transactions

on Autonomous Mental Development 1(1), 12-34.

Barsalou L. (1999). Perceptual symbol systems. Behavioral and Brain Sciences, 22(4),

577-660.

Barsalou L. (2008). Grounded cognition. Annual Reviews of Psychology, 59, 617-645.

Bengio, Y. (2009). Learning deep architectures for AI. Foundations and Trends in

Machine Learning , 2(1): 1-127.

Bressler S., Kelso J.S. (2001). Cortical coordination dynamics and cognition. Trends in

Cognitive Sciences, 5, 26-36.

Brooks R. (1986). A robust layered control system for a mobile robot. IEEE Journal of

Robotics and Automation, 2(1), 14-23.

Churchland P., Sejnowski, T. (1992). The Computational Brain. Cambridge, MA: MIT

Press.

Edelman G. (1992). Bright Air, Brilliant Fire: On the Matter of the Mind. New York:

Basic Books.

Farkaš I. (2006). Samoorganizácia ako hybná sila dynamických vzorcov aktivít v mozgu

a mysli. Kognice a umělý život VI, Opava: Slezská univerzita, 143-148.

Farkaš I. (2011). Konekcionizmus v náručí výpočtovej kognitívnej vedy. In Kvasnička V.

et al. (eds.), Umelá inteligencia a kognitívna veda III, 19-62.

Farkaš I. (2012). Indispensability of computational modeling in cognitive science.

Journal of Cognitive Science, 13, 211-235.

Feldman J., Ballard D. (1982). Connectionist models and their properties. Cognitive

Science, 6, 205–254.

Fodor J. (1983). The Modularity of Mind. Cambridge, MA: MIT Press.

Fodor J. (2000). The Mind Doesn't Work That Way. MIT Press.

Fodor J., Pylyshyn Z. (1988). Connectionism and cognitive architecture. Cognition, 28, 3-

71.

Freeman W. (2001). How Brains Make Up Their Minds. New York: Columbia University

Press.

Gardner H. (1997). The Minds New Science: A History of the Cognitive Revolution. New

York: Basic Books.

Gärdenfors P. (1996). Cued and detached representations in animal cognition.

Behavioural Processes, 36, 263-273.

Gentner D. (2010). Psychology in cognitive science: 1978-2038. Topics in Cognitive

Science, 2, 328-344.

Gibbs R. (2006). Embodiment and Cognitive Science. New York: Cambridge University

Press.

Page 17: Kognitívna veda a umelá inteligencia

17

Gibson J. (1970). Ecological Approach to Visual Perception. Boston: Houghton-Mifflin.

Greco A. (2012). Cognitive science and cognitive sciences. Journal of Cognitive Science,

13, 471-485.

Griffiths T., Kemp C., Tenenbaum J. (2008). Bayesian models of cognition. In R. Sun

(Ed.), Cambridge Handbook of Computational Psychology, New York: Cambridge

University Press, 59-100.

Harnad S. (1990). The symbol grounding problem. Physica D, 42, 335-346.

Haykin S. (2008). Neural Networks and Learning Machines, Prentice Hall.

Hutchins E. (1996). Cognition in the Wild. MIT Press.

Kelso J. (1995). Dynamic Patterns: The Self-Organization of Brain and Behavior. The

MIT Press, Cambridge, MA.

Kuhn, T. (1996). The Structure of Scientific Revolutions (3. vyd.), Chicago: University of

Chicago Press.

Kvasnička V., Beňušková Ľ., Pospichal J., Farkaš I., Tiňo P., Kráľ A. (1997). Úvod do

teórie neurónových sietí. Iris, Bratislava.

Lakoff G., Johnson M. (1999). Philosophy in the Flesh: The Embodied Mind and Its

Challenge to Western Thought. New York: Basic Books.

Lave J. (1988). Cognition in Practice: Mind, Mathematics and Culture in Everyday Life.

New York: Cambridge University Press.

Marr D. (1982). Vision. San Francisco, CA: W.H. Freeman.

McClelland J. (2009). The place of modeling in cognitive science. Topics in Cognitive

Science, 1(1), 11-38.

O’Brien G., Opie J. (2006). How do connectionist networks compute? Cognitive

Processing, 7, 30-41.

O'Reilly R., Munakata Y. (2000). Computational Explorations in Cognitive

Neuroscience: Understanding the Mind by Simulating the Brain. MIT Press.

Piccinini G. (2008). Some neural networks compute, others don’t. Neural Networks,

21(2-3), 311-321.

Pinker S. (2009). How the Mind Works. W.W. Norton and Co.

Pitt D. (2008). Mental representation, The Stanford Encyclopedia of Philosophy,

http://plato.stanford.edu/archives/fall2008/entries/mental-representation.

Port R., van Gelder T., Eds. (1995). Mind as Motion: Explorations in the Dynamics of

Cognition. Cambridge, MA: MIT Press.

Searle J. (1980). Minds, Brains, and Programs. Behavioral and Brain Sciences, 3, 417-

458.

Smith L. (2005). Cognition as a dynamic system: principles from embodiment.

Developmental Review, 25, 278-98.

Spivey M. (2007). The Continuity of Mind. Oxford: Oxford University Press.

Šefránek J. (2002). Inteligencia ako výpočet. IRIS Bratislava.

Šefránek J., Takáč M., Farkaš I. (2008). Vznik inteligencie v umelých systémoch. V

knihe Magdolen, D. (zost.): Hmota, život, inteligencia: Vznik. VEDA, Bratislava,

245-270.

Thelen E., Smith L. (1994). A Dynamic Systems Approach to the Development of

Cognition and Action. Cambridge, MA: MIT Press.

Page 18: Kognitívna veda a umelá inteligencia

18

Turing, A. (1936). On computable numbers, with an application to the Entscheidungs

problem. Proceedings of the London Mathematical Society, 2(42): 230-65.

Turing A. (1950). Computing machinery and intelligence. Mind, 59, 433-460.

Varela F., Thompson E., Rosch, E. (1991). The Embodied Mind: Cognitive Science and

Human Experience. Cambridge, MA: MIT Press.

Wilson M. (2002). Six views of embodied cognition. Psychonomics Bulletin Review,

9(4), 625-636.

Ziemke T. (1999). Rethinking grounding. In: Riegler A. et al. (eds.), Understanding

Representation in the Cognitive Sciences, New York: Plenum Press, 177-190.

Page 19: Kognitívna veda a umelá inteligencia

19

Kapitola 2

Neuroveda – strategická oblasť výskumu v

kognitívnej vede

BARBORA CIMROVÁ

Neuroveda je vedecká disciplína, ktorej predmetom výskumu je nervový systém (NS).

Zaoberá sa jeho stavbou, zložením, organizáciou a funkciou jeho jednotlivých častí, aj

jeho fungovaním ako celku. Je to medziodborová disciplína, ktorá vychádza z biológie,

no zahŕňa mnohé ďalšie odbory – napríklad anatómiu, fyziológiu, chémiu, fyziku,

filozofiu, psychológiu, informatiku a ďalšie. V súčasnosti je známe, že NS pozostáva z

viacerých štruktúr a ich podštruktúr, ktoré sú zložené z mnohých navzájom

poprepájaných neurónov. Jednotlivé neuróny vykonávajú špecializované funkcie, ale

aktivita jediného neurónu bez kontextu nemá prakticky žiaden význam. Neuróny

navzájom komunikujú, ale neposielajú svoju aktivitu do žiadneho centrálneho procesora.

Zmysluplná aktivita emerguje z neuveriteľného množstva čiastočne nezávislých a

čiastočne vzájomne závislých procesov nastávajúcich simultánne v celom NS (Kalat,

2012). Aby bolo možné pochopiť, ako takýto zložitý systém funguje, v prvom rade je

vhodné/nevyhnutné vedieť z akých častí sa skladá, ako sú tieto časti navzájom

usporiadané a akými základnými funkčnými a stavebnými jednotkami sú tvorené.

2.1 Bunky nervového systému

Stavebnými jednotkami NS sú bunky, ktoré sa delia na nervové bunky, nazývané aj

neuróny a bunky gliové (Kolb a Wishaw, 2009). V nervovom systéme sa nachádza viac

ako 150 miliárd buniek. Nervové bunky spracovávajú informácie (prijímajú ich a ďalej

prenášajú) a sú navzájom husto poprepájané. Jedna nervová bunka môže mať viac ako

15 000 spojení s ostatnými bunkami. Typický neurón (na obrázku 1) má na rozdiel od

iných buniek niekoľko výbežkov. Kratšie výbežky, ktorých môže byť veľký počet a môžu

byť rôzne rozvetvené, sa nazývajú dendrity a privádzajú impulzy do tela nervovej bunky

zvanej soma alebo perykarion. Dlhší výbežok sa nazýva axón alebo neurit, je spravidla

iba jeden a vedie nervové vzruchy smerom od tela bunky. V mieste pripojenia axónu

k telu bunky sa nachádza rozšírený tzv. axónový hrbolček toto miesto sa označuje aj ako

iniciálny segment. Nachádza sa tu veľké množstvo napäťovo závislých sodíkových

kanálov, o ktorých bude reč v ďalšej časti. Axón býva rozvetvený až na konci, čo sa

nazýva terminálna arborizácia alebo telodendrie. Každá vetvička sa rozširuje do útvaru

nazývaného terminálny butón a spolu s časťou ďalšieho neurónu (postsynaptická

membrána) vytvára štrbinku nazývanú synapsia. Synapsia je najmenšou funkčnou

jednotkou NS. Prostredníctvom nej prebieha komunikácia jednej nervovej bunky

s druhou. Na základe počtu výbežkov (dendritov) rozlišujeme rôzne typy neurónov.

Page 20: Kognitívna veda a umelá inteligencia

20

Multipolárne neuróny majú veľký počet dendritov (napríklad pyramídová bunka

v motorickej kôre), bipolárne neuróny majú iba jeden dendrit a jeden axón (napríklad

bipolárna bunka sietnice), unipolárne neuróny nemajú dendrit žiaden (napríklad tyčinky a

čapíky).

Gliové bunky zabezpečujú v NS rôzne podporné funkcie. Jeden typ gliových buniek

tzv. astrocyty zabezpečujú homeostázu neurónov, ich výživu a odvod odpadových látok

a podľa najnovších výsledkov sú nevyhnutné na zabezpečenie synchronizácie neurónov

(Haydon, 2006). Druhý typ, tzv. mikroglia má schopnosť pohybu a fagocytózy

a zabezpečuje imunologické deje v NS. Tretí typ, oligodendrocyty, sa svojimi výbežkami

obtáčajú okolo axonálnych výbežkov neurónov, čím vytvárajú tzv. myelínovú pošvu,

umožňujúcu rýchlejšie vedenie vzruchov po nervovom vlákne. Myelínová pošva je

zodpovedná aj za belšie sfarbenie tzv. bielej hmoty mozgu alebo miechy, ktorá je tvorená

zväzkami axónov obalených myelínom. Naopak, tzv. šedá hmota, ktorá sa pri

makroskopickom pohľade na prierez mozgovým (alebo miešnym) tkanivom javí ako

tmavšia, je tvorená zhlukmi tiel neurónov. Šedá hmota býva v mozgu usporiadaná do

vrstiev (napríklad v mozgovej kôre) alebo do útvarov nazývaných jadrá (napríklad

bazálne gangliá).

Obrázok 1. Schematický nákres neurónu (nervovej bunky). Neurón sa skladá z troch základných

častí: tela bunky (soma, resp. perykarion), dendritov, ktoré prijímajú informáciu a axónu, ktorý

informáciu vysiela. Tvar neurónu závisí od počtu jeho výbežkov a býva pre rôzne typy neurónov

rôzny. Axón môže byť obalený myelínovou pošvou (ako je znázornené na tomto obrázku), ktorá je

často prerušovaná. Tieto prerušenia, ktoré sa nazývajú Ranvierove zárezy, umožňujú saltatórne

vedenie vzruchu.

Page 21: Kognitívna veda a umelá inteligencia

21

2.2 Stavba a funkcia nervovej bunky

Ako väčšina buniek ľudského tela, nervová bunka obsahuje viaceré typy bunkových

organel – bunkové jadro, v ktorom je uložená genetická informácia, mitochondrie

produkujúce energiu, endoplazmatické retikulum, ribozómy a Golgiho aparát, ktoré

zabezpečujú tvorbu bielkovín (napr. neurotransmitérov) na základe informácie uloženej

v jadre. Ďalej sa v nervovej bunke nachádzajú vezikuly (membránou ohraničené útvary)

vyplnené vyprodukovanými bielkovinami (prevažne neurotransmitérmi) a mikrotubuly,

ktoré jednak bunke umožňujú udržať tvar a zároveň slúžia pri tzv. axonálnom transporte,

teda prenose látok z tela bunky k synaptickému zakončeniu. Všetky organely sa

nachádzajú v cytoplazme, tekutine vypĺňajúcej vnútro bunky. Obal bunky tvorí selektívne

priepustná bunková membrána. Tvorí ju relatívne nepriepustná fosfolipidová dvojvrstva,

v ktorej sa nachádzajú periférne a integrálne proteíny.

Selektívna priepustnosť bunkovej membrány tvorí základ pre všetky elektrické deje

nervovej bunky. Udržuje totiž nerovnomerné chemické rozloženie častíc s elektrickým

nábojom medzi vnútorným a vonkajším prostredím bunky, čím vzniká na membráne

chemický aj elektrický gradient. Proteíny zabudované v membráne umožňujú prestup

látok, akými sú kladne alebo záporne nabité iónové častice, ktoré inak nie sú schopné cez

nepolárnu fosfolipidovú membránu preniknúť. Jedným typom takýchto integrálnych

proteínov sú iónové kanály. Tie umožňujú voľný prestup určitého typu iónov (napríklad

draslíkové iónové kanály). Druhým typom sú tzv. vrátkové kanály, ktoré sa zmenou

svojej konformácie môžu pre ión buď otvoriť alebo uzavrieť a tým je možné pohyb iónov

regulovať (napríklad napäťovo závislé sodíkové kanály). Tretím typom integrálnych

proteínov sú tzv. aktívne transportéry, ktoré spotrebúvajú energiu a pumpujú nabité

častice aj proti smeru chemického či elektrického gradientu (napríklad sodíkovo-

draslíková pumpa: Na+K

+ATP-áza).

Vo vnútri bunky (v intracelulárnom priestore) je relatívne vyššia koncentrácia

bielkovín. Tieto látky s vysokou molekulovou hmotnosťou a so záporným nábojom nie sú

schopné cez fosfolipidovú dvojvrstvu membrány prechádzať. Vnútro bunky je oproti

vonkajšiemu prostrediu záporne nabité (približne –70mV). K zápornejšiemu náboju

vnútra bunky do značnej miery prispieva aj sodíkovo-draslíková pumpa, ktorá proti

koncentračnému gradientu vymieňa 3 ióny sodíka za 2 ióny draslíka. Keďže sodíkové

kanály sú v pokojovom stave zatvorené, postupne sa vytvorí nerovnomerné rozmiestnenie

sodíkových a napokon aj draslíkových iónov. V extracelulárnej tekutine je teda relatívne

vyššia koncentrácia iónov sodíka. Hoci draslíkové iónové kanály sú pre draslík

priechodné, vytvorený potenciálový rozdiel (elektrický gradient) na membráne drží

draslíkové ióny s kladným nábojom vo vnútri bunky. Vo vonkajšom (extracelulárnom)

prostredí je teda v pokojovom stave relatívne nižšia koncentrácia draslíka oproti

koncentrácii v intracelulárnej tekutine. Tento stav sa nazýva pokojový (membránový)

potenciál (Purves, 2004).

Page 22: Kognitívna veda a umelá inteligencia

22

2.3 Akčný potenciál

V mieste spojenia dvoch neurónov, teda v synaptickej štrbine dochádza ku chemickej

komunikácii medzi neurónmi. Z presynaptickej membrány sa vylúči signálna molekula –

nervový prenášač (neurotransmitér) do štrbinky medzi presynaptickou a postsynaptickou

membránou. V postsynaptickej membráne sa nachádzajú už spomínané iónové kanály

(integrálne proteíny zabudované v bunkovej membráne), ktoré obsahujú väzbové miesto

– receptor, kam sa môže príslušná signálna molekula naviazať. Po naviazaní signálnej

molekuly môže dôjsť k otvoreniu týchto ligandom otváraných iónových kanálov, čiže k

zmene priepustnosti membrány a tým aj k zmene elektrického stavu na membráne.

(Naviazanie inej signálnej molekuly môže spôsobiť kaskádu zmien vedúcich až k prepisu

genetickej informácie v jadre a následnému ovplyvneniu fungovania bunky, napríklad

tvorbou nových bielkovín, či už stavebných alebo nervových prenášačov). V závislosti od

typu kanálov dochádza buď k zmene membránového potenciálu smerom k pozitívnym

hodnotám – hovoríme o depolarizácii membrány alebo naopak, potenciál sa ešte viac

zníži – nastáva hyperpolarizácia (obrázok 2).

Obrázok 2. Akčný potenciál. Po dosiahnutí prahového potenciálu (približne –50mV) nastáva

depolarizácia membrány – otvoria sa rýchle napäťovo závislé kanály a kladne nabité sodíkové

ióny prúdia do bunky až nastane transpolarizácia – na krátky moment dosiahne membránový

potenciál kladné hodnoty. Vzápätí sa otvárajú pomalé napäťovo závislé draslíkové kanály a ióny

draslíka nesú kladný náboj opäť von z bunky až nastane hyperpolarizácia. Sodíkovo-draslíková

pumpa napokon za spotreby energie vráti koncentrácie iónov do pôvodného nerovnovážneho stavu

a neurón je opäť pripravený na priebeh akčného potenciálu.

Pri otvorení sodíkových kanálov začnú kladné sodíkové ióny v smere

koncentračného (v bunke je ich menej) aj elektrického (vnútro bunky je nabité

Page 23: Kognitívna veda a umelá inteligencia

23

zápornejšie) gradientu vtekať do bunky – potenciálový rozdiel na membráne sa zníži –

nastáva depolarizácia. Ako bolo spomínané vyššie, na membráne axónového hrbolčeka

sa nachádza veľké množstvo rýchlych napäťovo závislých sodíkových iónových kanálov.

Tieto kanály sa otvárajú v prípade, ak tu membránové napätie poklesne na určitú prahovú

hodnotu (–50mV). Následkom toho začnú do bunky masívne vtekať sodíkové ióny, ktoré

so sebou nesú kladný náboj. Potenciálový rozdiel sa zníži na nulu, až nakoniec dosiahne

pozitívne hodnoty – hovoríme o transpolarizácii (vnútro bunky je oproti

extracelulárnemu prostrediu na chvíľu nabité kladne). Tento stav však netrvá dlho,

pretože vzápätí sa otvárajú pomalé napäťovo závislé draslíkové kanály, ktoré umožnia

podobne masívny presun kladného náboja, tentokrát s draslíkom, z bunky von (opäť

v smere elektrického, no najmä chemického gradientu). Na membráne bunky sa obnovuje

pôvodný pokojový potenciál – tento dej sa nazýva repolarizácia. Počas tejto fázy sa síce

obnoví pôvodné napätie (okolo –70mV) na membráne (a dokonca môže nastať až

hyperpolarizácia: –90mV), ale na oboch stranách membrány je koncentrácia iónov sodíka

aj iónov draslíka približne rovnaká. Ďalší priebeh akčného potenciálu, ako sa opísaný dej

súborne nazýva, môže nastať až po obnovení pôvodnej nerovnomernej distribúcie iónov.

Tá sa dosiahne opäť pomocou sodíkovo-draslíkovej pumpy (Na+K

+ATP-áza), ktorá proti

koncentračnému gradientu presúva molekuly sodíka v bunky von výmenou za molekuly

draslíka z extracelulárnej tekutiny a spotrebúva pri tom značné množstvo energie (Purves,

2004).

2.4 Šírenie impulzu pozdĺž neurónu

Otvorenie napäťovo závislých kanálov spôsobí šírenie potenciálovej zmeny do priľahlých

miest membrány – akčný potenciál (nervový vzruch, impulz) sa tak šíri pozdĺž axónu od

tela bunky až po terminálny butón (Kolb a Wishaw, 2009). Keďže ďalší akčný potenciál

nemôže nastať okamžite, ale až po obnovení iónových koncentrácií do pôvodného stavu

(hovoríme, že membrána je v tzv. refraktérnej fáze), akčný potenciál sa nemôže šíriť

späť, ale iba jedným smerom. Rýchlosť šírenia vzruchu závisí od viacerých faktorov –

jedným z nich je dĺžka nervového vlákna. Vedenie vzruchu môže byť urýchlené

myelinizáciou axónu. Ako bolo spomenuté vyššie, myelínovú pošvu tvoria bunky

oligodendroglie (v periférnej nervovej sústave sú to Schwannove bunky), ktoré sa

obtáčajú okolo axónu. Medzi dvoma gliovými bunkami je nemyelinizovaná medzera,

ktorá sa nazýva Ranvierov zárez. Keďže myelinizovaný úsek nie je vodivý (nenachádzajú

sa tu iónové kanály a nabité častice nemôžu prechádzať cez membránu), nervový impulz

pri šírení nervovým vláknom preskakuje z jedného Ranvierovho zárezu na ďalší, čím sa

celý priebeh šírenia značne urýchľuje. Takéto vedenie sa nazýva saltatórne alebo

skokovité (z lat. saltare, skákať).

2.5 Komunikácia medzi neurónmi

Prenos informácie vo vnútri neurónu je elektrochemický. Prenos informácie medzi

neurónmi prebieha chemicky. Po dosiahnutí terminálneho gombíka na axóne

Page 24: Kognitívna veda a umelá inteligencia

24

(presynaptickej membrány) vyvolá akčný potenciál otvorenie vápnikových napäťovo

závislých kanálov. Keďže koncentrácia vápnika je za normálnych okolností vyššia mimo

bunky, ióny vápnika začnú prúdiť do vnútra terminálneho butónu. Tu sa nachádzajú

vezikuly vyplnené molekulami neurotransmitéra, vyprodukované v tele bunky

a dopravené pomocou vyššie spomínaného axonálneho transportu. Vezikuly sú spojené

s presynaptickou membránou pomocou kontraktilných bielkovín, ktoré po naviazaní

vápnika pritiahnu vezikulu k membráne, až nastane ich splynutie a neurotransmitér sa

vylúči do synaptickej štrbiny a nakoniec sa naviaže na receptor na postsynaptickej

membráne. Mnohé z týchto receptorov sú ligandom otvárané iónové kanály (na rozdiel od

napäťovo závislých kanálov). Ich otvorenie vyvolá lokálny zmenu postsynaptického

potenciálu. Na dosiahnutie prahového napätia (nutného na spustenie akčného potenciálu)

v iniciálnom segmente obvykle jediný postsynaptický potenciál nestačí (Kráľ, 1997).

Na povrchu neurónu sa môžu nachádzať stovky až tisícky synaptických zakončení

iných neurónov. Navyše, v nervovom systéme sa nachádza množstvo rôznych druhov

neurotransmitérov, ktoré môžu ovplyvňovať rôzne neuróny odlišným spôsobom. Mnohé

neurotransmitéry (napríklad acetylcholín) majú na postsynaptický neurón excitačný efekt.

Takýto excitačný postsynaptický potenciál (EPSP) spôsobí depolarizáciu membrány

vstupom kladných iónov do bunky, čím sa zvýši pravdepodobnosť dosiahnutia prahového

potenciálu a následného vzniku akčného potenciálu. Až sumáciou viacerých EPSP v tele

bunky (v iniciálnom segmente) môže dôjsť k dosiahnutiu prahového potenciálu

a vyvolaniu nervového vzruchu. Takáto sumácia môže byť buď časová, ak EPSP nastane

opakovane na tom istom mieste dostatočne rýchlo po sebe, alebo priestorová, ak sa

sčítajú EPSP z rôznych synáps.

Avšak, existujú aj neurotransmitéry, ktoré majú na postsynaptický neurón inhibičný

efekt (napríklad gama-amino-maslová kyselina). Dosiahnu to znížením postsynaptického

potenciálu smerom k negatívnym hodnotám (napríklad otvorením chloridových kanálov)

a tým sa pravdepodobnosť, že vznikne akčný potenciál zníži. Takéto postsynaptické

potenciály spôsobujúce hyperpolarizáciu sa nazývajú inhibičné postsynaptické potenciály

(IPSP). Rozhodujúci vplyv na to, či v nervovej bunke vznikne akčný potenciál má

celkový pomer medzi excitačným a inhibičným účinkom nervových prenášačov

v dendritických synapsiách neurónu. Mnohé neuróny vykazujú spontánnu aktivitu –

sporadicky generujú akčné potenciály. EPSP môže ich frekvenciu zvýšiť, IPSP naopak

znížiť. Inhibícia hrá v mozgu kľúčovú úlohu – zabraňuje nekontrolovanému nárastu

a šíreniu aktivity neurónov. Inhibičných neurónov je v mozgu 15% a excitačných

zvyšných 85% (White, 1989).

Prenos informácie v neuróne teda začína excitáciou dendritov, informácia sa

integruje v tele neurónu. Hneď ako excitácia dosiahne excitačný prah, objaví sa vzruch.

Dôsledkom excitácie je šírenie vlny akčného potenciálu pozdĺž membrány axónu na

základe princípu „všetko alebo nič“. Elektrický náboj pre vznik akčného potenciálu je

buď dostatočný alebo nedostatočný. Vzruch sa navyše v priebehu svojho šírenia

neoslabuje a dosiahne koniec axónu v rovnakej intenzite. Ak má každý neuronálny

vzruch rovnakú amplitúdu, ako je potom možné rozlíšiť podnety rôznej intenzity a rôznej

modality?

Page 25: Kognitívna veda a umelá inteligencia

25

2.6 Kódovanie informácií v NS

Amplitúda akčného potenciálu sa nemení, ale mení sa počet vygenerovaných akčných

potenciálov za jednotku času – teda ich frekvencia. Intenzita senzorických podnetov je v

NS kódovaná frekvenciou vzniku nervových vzruchov (akčných potenciálov). Ku

kódovaniu rôznych typov podnetov však prispieva aj anatomicko topografické kódovanie.

Typ informácie, ktorú neurón prenáša súvisí so vstupom, ktorý dostáva a s výstupom,

ktorý vysiela. Napríklad, pri podráždení somatosenzorických (dotykových) receptorov na

koži sa informácia dostáva do konkrétnych neurónov z ktorých putuje konkrétnou dráhou

až do špeciálnej oblasti mozgovej kôry zodpovednej za tú konkrétnu oblasť kože.

Aktivita kôrového neurónu v tejto oblasti odráža mieru podráždenia oblasti kože, ktorá

mu prislúcha. Charakter podnetu je v tomto prípade kódovaný miestom, ktoré je v NS

podráždené. V ostatných senzorických systémoch platí tento anatomický princíp

podobne. V prípade, že by sa zmenilo zapojenie neurónov tak, aby vstupy zo zrakových

podnetov končili v primárnej somatosenzorickej kôre, jej funkcia by sa zmenila, hoci

oblasť samotná by zostala nezmenená. Funkcie danej oblasti je určená jej vstupmi

a výstupmi.

Hoci je vyššie opísaný mechanizmus prenosu vzruchu v rámci jedného neurónu aj

medzi neurónmi navzájom pomerne zložitý, na vznik tak komplexného správania akým je

ľudské konanie a myslenie ešte sám osebe dostačujúci nie je. Skok od neurónov

generujúcich impulzy k jednajúcej, cítiacej a mysliacej osobnosti umožňuje funkčná

organizácia NS (Sternberg, 1996). V nasledujúcej časti sú popísané jej úrovne.

2.7 Štrukturálna organizácia NS

Nervový systém sa skladá z dvoch hlavných častí: centrálny nervový systém (CNS),

ktorý pozostáva z mozgu a miechy a periférny (PNS), ktorý je tvorený nervami. Na

obrázku 3 je schematické znázornenie zloženia NS. Miechové nervy vystupujú z miechy

a vedú informácie z periférie do CNS (napríklad zo senzorických receptorov v koži)

a naopak, z CNS naspäť na perifériu (napríklad do hladkej svaloviny stien žalúdka) –

inervujú senzorické, motorické a vegetatívne orgány. Rovnako hlavové nervy, ktoré

vychádzajú priamo z mozgu nesú informácie do mozgu (napríklad zo zrakových

receptorov v sietnici) a tiež aj z mozgu (napríklad motorickú informáciu do mimických

svalov). PNS sa podľa funkcie ďalej delí na autonómny, ktorý inervuje vnútorné orgány a

somatický, ktorý zabezpečuje motorickú a senzorickú inerváciu zvyšku tela.

Orgány CNS patria medzi najlepšie chránené orgány v ľudskom tele. Mozog je

uložený v lebke a miecha v chrbticovom kanáli, čím je zabezpečená ich mechanická

odolnosť. Oba orgány CNS sú ďalej chránené troma vrstvami obalov (tvrdá plena,

pavúčnica a mäkká plena). Navyše „plávajú“ v tekutine zvanej mozgovo-miechový mok

(likvor), ktorý jednak vypĺňa systém dutín v CNS – mozgové komory a miechový kanál,

a jednak obmýva CNS v subarachnoidálnom priestore (pod pavúčnicou), takže chráni

orgány proti otrasom. Zároveň zabezpečuje podporné homeostatické a iné funkcie. Takto

je zabezpečená ochrana CNS pred vonkajším poškodením. Na ochranu mozgu a miechy

proti poškodeniu z vnútra tela slúži tzv. hematoencefalická bariéra. Tvoria ju krvné cievy,

Page 26: Kognitívna veda a umelá inteligencia

26

ktoré nie sú priepustné pre niektoré látky, napríklad veľké bielkovinové molekuly, ani pre

mikroorganizmy, ale napríklad glukóza, kyslík či látky rozpustné v tukoch (alkohol,

nikotín) ňou prechádzajú bez problémov (Ward, 2006).

Štruktúra a organizácia mozgu je pomerne zložitá. Na to, aby sme pochopili, na čo

slúžia jednotlivé jeho časti, ako navzájom súvisia a akým spôsobom ich činnosťou vzniká

celá tá plejáda dejov a pocitov, ktoré sprevádzajú ľudské správanie, pociťovanie,

premýšľania a uvedomovanie si, na to slúži množstvo metód. Najznámejšie z nich si

predstavíme v ďalšej časti, kde stručne načrtneme ich základné princípy, výhody,

nevýhody a možnosti ich použitia.

Obrázok 3. Štrukturálna organizácia nervového systému. Centrálny nervový systém (CNS) sa

skladá z mozgu a miechy. Periférny nervový systém (PNS) je zložený z autonómneho

a somatického nervového systému. Autonómny systém inervuje vnútorné orgány, somatický

systém prenáša senzorické a motorické informácie viazané s kostrovým svalstvom. (Upravené

podľa: Sternberg, 1996).

2.8 Metódy skúmania mozgu

Na skúmanie mozgových funkcií sa využívajú viaceré metódy, medzi ktoré patria:

funkčné a štrukturálne zobrazovacie metódy, štúdium mozgových lézií (poranení,

poškodení) a ich dôsledkov, metódy umožňujúce dočasné vyradenie funkcie určitej

mozgovej oblasti, prípadne experimenty na zvieratách. Medzi najstaršie metódy skúmania

patrí pozorovanie dôsledkov poškodenia mozgovej hmoty a následné (či už posmrtné

alebo ak bolo známe, tak aj počas života) priradenie postihnutej funkcie k príslušnej

postihnutej oblasti mozgu (Ward, 2004). Napríklad veľmi známy je prípad, ktorý opísal

Page 27: Kognitívna veda a umelá inteligencia

27

v 19. storočí Paul Broca. Jeho pacient trpel ťažkým poškodením reči – nedokázal

vysloviť nič okrem slabiky „tan“. Toto poškodenie sa viazalo na oblasť v čelovom laloku

mozgu, ktorá je dnes známa ako Brocova oblasť a považuje sa za oblasť zodpovednú za

určité funkcie pri tvorbe reči. Doposiaľ boli opísané mnohé podobné prípady priraďujúce

poškodenie určitej oblasti k určitej funkčnej poruche, z čoho sa usudzuje, že daná oblasť

za normálnych okolností tieto funkcie určitým spôsobom zabezpečuje. Nevýhodou

takejto pozorovacej metódy je, že neumožňuje pozorovať špecifické fyziologické procesy

v živom tkanive mozgu. To umožňujú metódy výskumu in vivo (teda v živom

organizme).

V minulosti prebiehali všetky experimenty in vivo na živých zvieratách. Napríklad

výskum zrakového vnímania, za ktorý bola v r. 1981 udelená Nobelova cena (Hubel

a Wiesel, 1968), bol vykonaný za pomoci mikroelektród zavedených do mozgu živých

zvierat. Zistilo sa tak napríklad, že bunky v primárnej zrakovej kôre sú aktívne pri

objavení sa čiarky určitej orientácie v zrakovom poli. Okrem zavedenia mikroelektród sa

pri pokusoch na zvieratách využíva podobný princíp ako pri pozorovaní lézie mozgovej

oblasti a jej priliehajúcej funkcie. V takýchto prípadoch sa cielene poškodí určitá časť

mozgu a sledujú sa funkčné poruchy, ktoré sú dôsledkom takéhoto zásahu.

Ani pri pokusoch na živom tkanive v mozgu zvierat nie je možné zaznamenať

elektrickú aktivitu všetkých neurónov súčasne a zmapovať tak ich funkčné väzby a

vzťahy. Navyše, výskum špecifických ľudských kognitívnych funkcií, medzi ktoré patrí

napríklad čítanie, reč, počítanie, abstraktné myslenie atď., nie je možné skúmať na

zvieratách. Pri výskume mozgových funkcií u ľudí sa využívajú predovšetkým rôzne

zobrazovacie metódy, ktoré umožňujú vizualizáciu štruktúry alebo aktivity mozgu in

vivo. Základné princípy najpoužívanejších zobrazovacích metód si vysvetlíme

v nasledujúcej časti.

2.9 Zobrazovacie metódy

Zobrazovacie metódy delíme na štrukturálne, ktoré umožňujú statické zobrazenie stavby

a štruktúry mozgového (prípadne iného) tkaniva a na funkčné, ktoré sú schopné buď

priamo alebo nepriamo znázorniť aktivitu mozgu (resp. iného orgánu). Medzi

štrukturálne zobrazovacie metódy patrí napríklad počítačová tomografia (CT) alebo

magnetická rezonancia (MRI). Princípom CT je röntgenové žiarenie, prechádzajúce

tkanivom a otáčací skener, ktorý zaznamená žiarenie po prechode tkanivom, postupne pre

všetky jednotlivé uhlové otočenia od 0° do 180°. Množstvo prepusteného žiarenia závisí

od hustoty tkaniva, cez ktoré musí röntgenový lúč prejsť. Zaznamenané snímky vo

všetkých uhloch otočenia následne vyhodnotí počítač a nakoniec zrekonštruuje 3D obraz

rozloženia hustoty tkaniva v každej z pomyselných rovín snímania. Keďže CT využíva

pre človeka do určitej miery škodlivé röntgenové žiarenie, patrí medzi invazívne

zobrazovacie metódy a nemalo by sa používať veľmi často. Umožňuje však pomerne

lacné vyšetrenie abnormalít alebo poškodení v dôsledku nádorov alebo cievnych

mozgových porúch. Rozlišovacia schopnosť CT je pomerne malá a pre podrobnejšie

znázornenie štruktúry tkaniva sa využíva skôr MRI, ktorá má oproti CT vyšetreniu aj

ďalšie výhody. MRI nezaťažuje organizmus škodlivým žiarením a preto ním môže byť

Page 28: Kognitívna veda a umelá inteligencia

28

človek vyšetrovaný opakovane aj veľakrát. Na zobrazenie štruktúry využíva MRI silné

magnetické pole a elektromagnetické vlastnosti molekúl. Osi rotácií protónov vodíka sa

po umiestnení do silného magnetického poľa usporiadajú paralelne so smerom poľa.

Krátky vysokofrekvenčný magnetický impulz vychýli osi rotácií protónov. Toto

vychýlenie je merateľné zmenou magnetického poľa a tvorí základ signálu MRI. Počas

opakovaného vychyľovania osí protónov sa sleduje doba, za ktorú nastane opäť paralelné

usporiadanie. Na základe toho je možné rozlíšiť jednotlivé typy tkaniva. Štrukturálny

obraz z MRI je pomerne podrobný, umožňuje rozlíšiť bielu hmotu od šedej a zobraziť tak

jednotlivé mozgové útvary, no neprináša takmer žiadnu informáciu o priebehu

fyziologických procesov.

Funkčné zobrazovacie metódy dokážu zobraziť aj aktivitu mozgového tkaniva.

Medzi najpoužívanejšie funkčné zobrazovacie metódy patrí pozitrónová emisná

tomografia (PET), funkčná magnetická rezonancia (fMRI) alebo elektroencefalografia

(EEG). Pozitrónová emisná tomografia a funkčná magnetická rezonancia sú metabolické

metódy, ktoré využívajú sledovanie zvýšenej spotreby glukózy alebo kyslíka

v aktívnejšej oblasti mozgu. Predpokladá sa, že počas riešenia určitej úlohy sa oblasť,

ktorá je pre jej riešenie nevyhnutná, prejaví zvýšenou aktivitou a teda aj zvýšenou

spotrebou kyslíku alebo glukózy ako počas pokoja. Počas vyšetrenia pomocou PET sa do

krvi vyšetrovaného jedinca vstrekne malé množstvo radioaktívne značenej látky

(napríklad voda, glukóza, prípadne neurotransmitér). V metabolicky aktívnejších

oblastiach sa hromadí (spotrebúva) viac kyslíku či glukózy, preto bude toto miesto

radioaktívnejšie. Nestabilný rádioaktívny izotop glukózy sa po krátkom čase samovoľne

rozpadne a uvoľnený pozitrón okamžite anihiluje spojením s najbližším voľným

elektrónom, pričom sa vyžiaria dva fotóny, letiace opačným smerom. Tieto fotóny sú

zachytené skenerom, pričom sa podľa času a miesta ich dopadu sa určí miesto ich

vyžiarenia a teda miesto s vyšším obsahom glukózy (resp. inej použitej látky). Vyšetrenie

pomocou PET patrí medzi invazívne funkčné zobrazovacie metódy, keďže sa využíva

rádioaktívna látka. Ďalšou nevýhodou PET je pomerne slabá priestorová aj časová

rozlišovacia schopnosť. V posledných rokoch bolo použitie PET zatienené inou metódou

– fMRI, ktorá jednak dosahuje lepšie priestorové rozlíšenie a jednak nezaťažuje

organizmus vyšetrovaného rádioaktívnym žiarením, a môže byť preto používané

opakovane.

Funkčná magnetická rezonancia zobrazuje mozgovú aktivitu na základe zmeny

pomeru okysličenej a odkysličenej krvi v danej oblasti. Princíp je rovnaký ako pri MRI,

avšak sleduje sa zložka signálu závislá od množstva odkysličeného hemoglobínu.

V oblasti, ktorá je metabolicky aktívnejšia, nastane po počiatočnom krátkodobom poklese

pomerne rýchly prísun väčšieho množstva okysličeného hemoglobínu (aby sa predišlo čo

i len prechodnému nedostatku kyslíka v tejto oblasti so zvýšenou spotrebou). Časové

rozlíšenie tejto metódy je niekoľko sekúnd. Nevýhodou použitia fMRI oproti použitiu

PET je extrémny hluk zariadenia, čo je pri kognitívnom experimente nepríjemné

a použitie sluchových podnetov je takmer vylúčené. Na rozdiel od oboch spomínaných

funkčných zobrazovacích metód, v ktorých sa na mozgovú aktivitu usudzuje nepriamo –

na základe množstva spotrebovanej glukózy alebo kyslíka v príslušnej oblasti, metódy

ako elektroencefalografia alebo magnetoencefalografia snímajú priamo aktivitu mozgu.

Page 29: Kognitívna veda a umelá inteligencia

29

Pri EEG vyšetrení je zaznamenávaná bioelektrická aktivita mozgu pomocou elektród

priložených k povrchu hlavy. Vďaka stĺpcovitému a paralelnému usporiadaniu je možné

zachytiť a zosilniť synchrónnu elektrickú aktivitu skupiny neurónov. Pozitívne

a negatívne výchylky zaznamenané elektródami závisia od excitačných postsynaptických

potenciálov apikálnych dendritov pyramidálnych buniek, šíriacich sa kolmo na povrch

hlavy. Ich smer a teda aj smer výchylky závisí od lokalizácie zdroja impulzu. V prípade

impulzov pochádzajúcich z kôrových neurónov kontralaterálnej hemisféry, ktorých axóny

končia v druhej vrstve mozgovej kôry, zaznamenáme na povrchu hlavy pozitívnu

výchylku. V prípade impulzov pochádzajúcich z neurónov talamu, ktorých axóny končia

v štvrtej vrstve mozgovej kôry, zaznamenáme na povrchu hlavy negatívnu výchylku

(Westbrook 2000). K výhodám EEG vyšetrenia patrí veľmi dobré časové rozlíšenie,

s presnosťou na milisekundy; neinvazívnosť a finančná nenáročnosť prístroja aj

samotného vyšetrenia. Nevýhodou je pomerne nízke priestorové rozlíšenie. EEG záznam

je možné snímať relatívne dlhú dobu. Zmeny frekvencie a amplitúdy EEG aktivity súvisia

s mentálnym stavom (iné sú pri ospalosti, pri sústredení, pri rôznych štádiách spánku

a pod.). Na priradenie elektrickej aktivity mozgu k určitej konkrétnej činnosti alebo

udalosti je potrebné takýto pokus niekoľkokrát opakovať (napr. 100krát). Mozgová

aktivita, ktorá s úlohou nesúvisí, sa po sčítaní všetkých záznamov vynuluje, pretože

nastáva v náhodnom čase vzhľadom k začiatku úlohy. Aktivita, ktorá sa opakovala pri

každom jednom pokuse sa sčítaním zvýrazní – dostaneme tak evokované alebo

kognitívne potenciály (ERP, z angl. event-related potentials, potenciály viazané na

udalosť) charakteristického tvaru. Ich vlastnosti (tvar, amplitúda a latencia) odrážajú

časový priebeh mozgovej činnosti súvisiacej s úlohou.

Použitím spomenutých výskumných a zobrazovacích metód sme sa priblížili

k porozumeniu princípov fungovania mozgu a NS vôbec. No od skutočného poznania

konkrétnej funkcie každej konkrétnej oblasti mozgu sme ešte ďaleko. Na základe

výsledkov neurovedeckých experimentov je možné nájsť koreláciu medzi určitou

funkciou a určitou mozgovou oblasťou (resp. oblasťami), ktorá s danou funkciou súvisí.

Stručný prehľad toho, čo je doposiaľ o ľudskom mozgu (a jeho stavbe a funkcii) známe

sa nachádza v ďalšej časti.

2.10 Mozog a kognitívne procesy

Obrázok 4 zobrazuje základné časti mozgu. V najhrubšom delení rozdeľujeme mozog na

predný, stredný a zadný mozog. Toto delenie sa odvíja aj od fylogenetického vývoja.

Proces evolúcie uprednostnil pridávanie ďalších štruktúr pred nahradením starších.

Dôsledkom toho je hierarchická organizácia mozgového tkaniva – určité časti (evolučne

mladšie) sú „nadradené“ iným častiam (evolučne starším) – NS je usporiadaný do

viacerých úrovní, pričom vyššie úrovne majú zabezpečujú zložitejšie aspekty správania,

no robia tak prostredníctvom nižších vrstiev (Hughlings-Jackson,1931)

Predný mozog tvorí väčšinu viditeľnej časti neporušeného ľudského mozgu.

Fylogeneticky sa objavuje už u nižších cicavcov, no u žiadneho iného živočíšneho druhu

nie je vyvinutý do tak nepomerne veľkých rozmerov v porovnaní s ostatnými časťami

mozgu. Skladá sa z dvoch hemisfér – pravej a ľavej, ktoré síce nie sú identické, no na

Page 30: Kognitívna veda a umelá inteligencia

30

každej z nich (tak ako aj na hemisférach rôznych ľudí) môžeme nájsť a opísať súbor

istých prvkov s ich charakteristickým vzájomným usporiadaním (podobne, ako žiadne

dve tváre a ani žiadne dve polovice tej istej tváre nie sú rovnaké, ale na každej z nich sa

nad ústami nachádza nos). Povrch oboch hemisfér brázdia ryhy alebo zárezy (z lat.

sulcus, mn. č. sulci), medzi ktorými sa nachádzajú závity (z lat. gyrus, mn. č. gyri).

Najväčšie brázdy svojím priebehom vyčleňujú aj štyri mozgové laloky. Frontálny resp.

čelový lalok sa nachádza pod čelovou lebečnou kosťou a od susedného temenného (z lat.

parietálneho) laloka ho oddeľuje centrálny zárez. Za ním sa nachádza okcipitálny, čiže

záhlavný lalok. Silviova brázda vyčleňuje spánkový alebo temporálny lalok, ktorý sa

nachádza pod spánkovou kosťou.

Obrázok 4. Základné časti mozgu. Predný mozog nasadá na štruktúry súborne označované ako

mozgový kmeň, medzi ktoré patrí predĺžená miecha, Varolov most a stredný mozog (medzimozog

sa niekedy taktiež radí k štruktúram mozgového kmeňa). (Upravené podľa: Pinel, 2009).

Na povrchu predného mozgu sa nachádza mozgová kôra, ktorá sa javí na reze

mozgom ako tmavšia (šedá) hmota hrubá asi 3mm. Je usporiadaná do vrstiev (rozdielne

vrstvy sú tvorené rozdielnymi typmi neurónov a na rôznych miestach kôry sa počet

vrstiev rôzni). Podľa cytoarchitektúry (rozdielneho tvaru, veľkosti, štruktúry, vzájomného

prepojenia buniek a ich rozmiestneniu v NS), rozdelil Brodmann mozgovú kôru na 52

areí. Neskôr sa na základe elektrofyziologických výskumov prostredníctvom stimulácie

kôrových oblastí určili na mozgovej kôre funkčne špecifické oblasti, ktoré prekvapivo

odpovedali určitým Brodmannovým areám (Fritsch a Hitzig, 1960). Napríklad

Brodmannova area (BA) 17, ktorá sa nachádza v záhlavnom (okcipitálnom) laloku

odpovedá neskôr opísanej primárnej zrakovej kôre; BA 4 nachádzajúca sa v čelovom

(frontálnom laloku) odpovedá primárnej motorickej kôre. Podobným spôsobom je možné

nájsť primárnu sluchovú oblasť v spánkovom (temporálnom) laloku a primárnu

somatosenzorickú oblasť v temennom (parietálnom) laloku. Okrem oblastí, ktoré sú

funkčne špecifické sa v mozgovej kôre nachádzajú oblasti, kde pravdepodobne prebieha

integrácia informácií z iných oblastí. Okrem lokalizácie funkcií v mozgovej kôre bola

zistená aj funkčná asymetria hemisfér – niektoré aspekty spracovávania informácií

väčšinou prebiehajú prednostne v pravej hemisfére (napríklad priestorové vnímanie), iné

sú väčšinou preferenčne viazané na ľavú hemisféru (napríklad reč).

Page 31: Kognitívna veda a umelá inteligencia

31

Pod mozgovou kôrou sa nachádza biela hmota mozgu, v ktorej prebiehajú nervové

dráhy. V bielej hmote sú vnorené ďalšie štruktúry tvorené šedou hmotou – zhluky tiel

nervových buniek, súborne nazývané jadrá. Medzi tieto útvary patrí aj súbor štruktúr

zvaný bazálne gangliá, ktoré majú kľúčovú úlohu pri regulácii motoriky (dôsledky ich

poškodenia môžeme vidieť napríklad pri Parkinsonovej poruche). Štrukturálne rôznorodý

komplex zvaný limbický systém je významný pre reguláciu emotivity, motivácií,

pamäte, učenia a spracovania čuchových podnetov. Tvoria ho štruktúry ako amygdala

(dôležitá pre spracovanie emócie strachu), hipokampus, nevyhnutný pre tvorbu dlhodobej

epizodickej pamäte a ďalšie. K podkôrovým štruktúram koncového mozgu patrí aj tzv.

medzimozog, ktorý je uložený v hĺbke, medzi oboma hemisférami. Dve hlavné štruktúry

medzimozgu sú talamus a hypotalamus. Talamus alebo mozgové lôžko tvoria dva

vajcovité útvary s množstvom jadier. Označuje sa aj ako „brána do vedomia“, pretože

všetky senzorické dráhy (s výnimkou čuchu), ktoré vedú impulzy z periférie až do

mozgovej kôry (a následne sa objavia vo vedomí) prechádzajú cez talamus. Pod talamom

sa nachádza hypotalamus –štruktúra, zabezpečujúca základné homeostatické funkcie a

integráciu somatických a vegetatívnych funkcií do zložitých vzorcov reakcií, nevyhnutné

pre zachovanie života (riadenie činnosti vnútorných orgánov, termoregulácia, regulácia

príjmu potravy a vody, sexuálne správanie, motivačné správanie).

Stredný mozog tvorí u človeka objemovo len malú časť, nachádzajúcu sa pod

koncovým mozgom. Spolu s časťou zadného mozgu tvoria tzv. mozgový kmeň (niekedy

sa k nim priraďuje aj medzimozog), na ktorý nasadá „koruna“ tvorená hemisférami

predného mozgu. V strednom mozgu sa nachádzajú centrá pre zrakové a sluchové

orientované správanie (zameranie pozornosti na náhly zrakový alebo sluchový podnet)

a motorické jadrá hlavových nervov. Zasahuje doň aj retikulárna formácia – útvar

sieťovitého vzhľadu (na rozdiel od šedej a bielej hmoty), ktorý je zložený zo zmesi tiel

a axónov nervových buniek. Retikulárna formácia je súčasťou retikárneho aktivačného

systému, ktorého úlohou je aktivácia kôrových oblastí. Väčšia časť retikulárnej formácie

sa však nachádza v časti mozgového kmeňa, ktorý patrí k zadnému mozgu.

Zadný mozog tvorí Varolov most, predĺžená miecha a mozoček. Varolov most

obsahuje okrem časti retikulárnej formácie najmä vlákna, spájajúce časti NS navzájom (z

toho aj jeho pomenovanie) a jadrá niektorých hlavových nervov. Predĺžená miecha

zabezpečuje vitálne, esenciálne funkcie (dýchanie, srdečná frekvencia, slinenie,

prehĺtanie, vracanie, kašeľ, kýchanie a pod.). Okrem toho tiež obsahuje časť retikulárnej

formácie. Varolov most a predĺžená miecha tvoria spolu so stredným mozgom mozgový

kmeň. Mozoček neleží v línii s ostatnými časťami kmeňa, ale nasadá naň zozadu a tvorí

tak strop štvrtej mozgovej komory. K hlavným funkciám mozočka patrí kontrola

a koordinácia pohybov, vytváranie motorického plánu, koordinácia svalového napätia,

rovnováhy a postúry, ale aj časovanie pohybov, vnímanie rytmu a mnohé ďalšie funkcie

(Kalat, 2012, Pinel, 2009, Koukolík, 2002)

Tento výpočet mozgových funkcií zďaleka nie je vyčerpávajúci. Naznačuje však, že

určitým oblastiam NS je možné priradiť určité funkcie, no proces spracovania informácií

prebieha paralelne v mnohých častiach NS a na komplexné spracovanie informácií sa

využívajú rozsiahle distribuované neurónové siete.

Page 32: Kognitívna veda a umelá inteligencia

32

Literatúra

Fritsch, G. a Hitzig E. (1960): On the electrical excitability of the cerebrum. In Bonin,

von G. (zost.): The Cerebral Cortex. Springfield, IL: Charles C. Thomas.

Haydon, P. G. a Carmignoto, G. (2006): Astrocyte control of synaptic transmission and

neurovascular coupling. Physiological Reviews, 86, 1009–1031.

Hubel, D. H. a Wiesel, T. N. (1968): Receptive fields and functional architecture of

monkey striate cortex. Journal of Physiology, 195(1): 215-243.

Hughlings-Jackson, J. (1931): Selected Writings of John Hughlings-Jackson, In J. Taylor,

Ed., vols. 1 and 2. London: Hodder.

Kalat, J. (2012): Biological Psychology (11. vyd). Belmont, California: Wadsworth.

Kolb, B. a Wishaw, I.Q. (2009): Fundamentals of Human Neuropsychology (6. vyd). San

Francisco: Freeman.

Koukolík, F. (2002): Lidský mozek – funkční systémy, norma a poruchy. Praha: Portál.

Kráľ, A. (1997): Neurónové siete a nervový systém. V knihe Kvasnička, V. (zost.): Úvod

do teórie neurónových sietí. Iris, Bratislava, 11-31.

Pinel, J.P.J. (2009): Biopsychology (7. vyd.). Pearson/Allyn and Bacon.

Purves, D., Augustine, G.J., Fitzpatrick, D., Hall, W.C., LaMantia, A-S., a spol. (2004):

Neuroscience, (3. vyd). Sunderland: Sinauer Associates, Inc.

Sternberg, R.J. (2009): Kognitivní psychologie [z amerického originálu Cognitive

psychology preložil Koukolík, F.] Praha: Portál.

Ward, J. (2006): The Student’s Guide to Cognitive Neuroscience. New York: Psychology

Press.

Westbrook, G.L. (2000): Seizures and Epilepsy. In Kandel, E.R., Schwartz, J.H., Jessel,

T.M. (zost.): Principles Of Neural Science 4th Ed. New York: McGraw-Hill, 910-

935.

White EL. (1989): Cortical Circuits: Synaptic Organization of the Cerebral Cortex.

Boston: Birkhauser.

Page 33: Kognitívna veda a umelá inteligencia

33

Kapitola 3

Fundamentálne aspekty kognície: percepcia a

pamäť

JÁN RYBÁR

Predmetom tejto kapitoly sú základné kognitívne aspekty (resp. funkcie) kognície:

percepcia a pamäť v kontexte s najnovším vývinom v kognitívnej vede a kognitívnej

psychológii. Hoci sa nimi budeme zaoberať oddelene, chceli by sme zdôrazniť, že sú

navzájom prepojené a fungujú spolu. Jednotlivo sa nimi budeme zaoberať predovšetkým

kvôli transparentnejšiemu výkladu.

3.1 Vizuálna percepcia – základné vlastnosti

Vzhľadom na limitovaný priestor, ktorý máme k dispozícii, výklad zúžime len na jeden

druh percepcie, a to na vizuálnu percepciu. Výber nie je náhodný, vedú nás k nemu tieto

hlavné dôvody: (1) u človeka vizualita hrá veľmi významnú úlohu; (2) vizuálna percepcia

je výnimočný kognitívny nástroj, ktorý má dištančný charakter (sníma informácie

z prostredia bez priameho kontaktu s predmetmi); (3) výskum vizuálnej percepcie má

dlhodobú tradíciu a dosiahli sa tu pozoruhodné výsledky.

Za veľmi dobrý prostriedok (pomôcku) pri vysvetľovaní vizuality považujeme

optické ilúzie. Pretože v prípade týchto ilúzií nejde o nedostatky, chyby percepčného

systému, ako by sa mohlo zdať na prvý pohľad, ale ide o inteligentné heuristiky,

pomocou ktorých odhadujeme aké je prostredie okolo nás (Gigerenzer, 1999).

Prostredníctvom optických ilúzií je možné veľmi dobre vysvetliť základné vlastnosti

vizuálneho percepčného systému: (1) dynamiku organizačnej sily (schopnosti)

percepčného systému; (2) konštantnosť vnímania veľkosti, tvaru, jasnosti a rôzne

heuristiky s ňou spojené; (3) binokulárne a monokulárne vnímanie hĺbky (3D).

3.1.1 Klasifikácia optických ilúzií

V súčasnosti je k dispozícii veľké množstvo techník na demonštrovanie najrôznejších

optických ilúzií (môžeme hovoriť o stovkách a ich počet neustále rastie). O tom svedčí aj

množstvo webových stránok venovaných optickým ilúziám. Ak chceme vniesť do toho

nejaký poriadok (alebo ak chcete vedeckejší prístup) prvé, čo treba urobiť, je pokúsiť sa

o klasifikáciu týchto ilúzií. Niektoré takéto pokusy boli už urobené. Medzi

najzaujímavejšie patrí klasifikácia R. Gregoryho. Delí ilúzie podľa dvoch základných

kritérií. Prvé kritérium spočíva v tom o aký druh „chýb“ pri videní ide. Podľa toho

môžeme deliť ilúzie na: dvojznačné obrazce (napríklad Neckerova kocka, káčer/zajac

a mnohé ďalšie), skreslenia (všetky ilúzie, ktoré sa týkajú porušenia konštantnej veľkosti,

tvaru a jasu), paradoxy (napríklad Penrosove schody) a fikcie (napríklad Kanizsov

Page 34: Kognitívna veda a umelá inteligencia

34

trojuholník). Druhým kritériom klasifikácie ilúzií je delenie podľa toho, čo ich spôsobuje.

Podľa toho kritéria delíme ilúzie na: fyzikálne (napríklad palica ponorená do vody sa zdá

nalomená), fyziologické (rôzne paobrazy a afterefekty), kognitívne (napríklad dvojznačné

obrazce), a na tie, ktoré súvisia s geštaltistickými princípmi – princíp blízkosti,

podobnosti, symetrie atď. (Gregory, 2004, s. 248-249).8 V hre sú aj ďalšie kritériá, ak sa

vstupné senzorické dáta menia, ale obrazce nejakým spôsobom pretrvávajú, hovoríme

o fyziologických ilúziách (napríklad paobrazy).9 A naopak, ak sa vstupné dáta nemenia,

ale obrazce napriek tomu áno, hovoríme o kognitívnych ilúziách (dvojznačné obrazce,

fikcie, skreslenia – veľkosti, tvaru, jasu, a tiež tzv. nemožné obrazce). Gregory

poznamenáva, že fyziologické ilúzie sú o mozgu, kognitívne o mysli.

V klasifikácii, ktorú používame sa pridržiavame posledných dvoch kritérií, teda či sa

menia vstupné senzorické dáta alebo nie a aký to má vplyv na obrazce v procese

vnímania. Tieto základné kritéria kombinujeme s klasifikovaním podľa druhu „chýb“,

ktoré sa vyskytujú v optických ilúziách.

3.1.1.1 Paobrazy

Typickým predstaviteľom fyziologických ilúzií sú tzv. paobrazy (after-images). O

existencii týchto fenoménov sa môžete veľmi ľahko presvedčiť, ak sa pozriete na

niekoľko sekúnd do ostrého svetla, napríklad žiarovky, a potom zatvoríte oči, alebo

premiestnite pohľad na bielu plochu, uvidíte plávajúcu žiaru. Určite však najslávnejšou a

najznámejšou ilúziou v tejto kategórii je ilúzia bradatého muža (na webových stránkach

ju môžete nájsť aj pod názvom four dots). Je to veľmi efektný príklad ilúzie. Ak sa budete

pozerať tridsať sekúnd na isté čiernobiele škvrny, uprostred ktorých sú štyri bodky, a

potom zatvoríte oči, tak na mentálnej obrazovke, alebo, ak premiestnite pohľad napríklad

na bielu stenu, uvidíte v svetelnom kruhu hlavu bradatého muža.

Na prvý pohľad sa môže zdať, že táto ilúzia je zaujímavou ilustráciou jednej z

mnohých záhad „defaultovo“ obsiahnutých vo vizuálnej mozgovej kôre (resp. ďalších

častiach mozgu). Cestu k vysvetleniu tejto záhady treba však primárne hľadať už v tom,

čo sa v tejto súvislosti odohráva na sietnici. Ide jednoducho o to, že pri vnímaní čierno-

bieleho obrazca bunky citlivé na svetlo sa po tridsiatich sekundách unavia, a to vlastne

spôsobuje, že vidíme negatívny paobraz. Tento experiment je veľmi dobrými príkladom

na demonštráciu toho, ako na sietnici pracujú bunky citlivé na svetlo.

Na základe toho sme si vytvorili hypotézu, že konštruktéri tejto ilúzie nám vlastne

predkladajú negatív hlavy bradatého muža. V zásade je to tak, ale procesy na sietnici

nevysvetľujú celkom vznik paobrazu. V hre musia byť ešte ďalšie záležitosti, pretože, ak

urobíme počítačový negatív negatívu (pozri obrázok 1) nedostaneme dokonalú hlavu

bradatého muža.

8 Zaujímavá je aj kategorizácia optických ilúzií podľa obsiahnutých postupov, ktorej autorom je

Ninio (2001). Klasifikáciou ilúzií sa zaoberajú aj Šikl a Šimeček (2010). 9 Aby sme sa vyhli prípadným nedorozumeniam upozorňujeme, že termín fyziologické ilúzie

používame v tejto prednáške len v tomto presne zadefinovanom zmysle. Samozrejme, že v

širšom zmysle slova sú všetky ilúzie fyziologické, pretože sú vždy spojené s činnosťou oka a

mozgu.

Page 35: Kognitívna veda a umelá inteligencia

35

Obrázok 1.: Predloha a negatív.

Paobraz nie je presný negatív pozorovaného obrázku. Tvorcovia ilúzie – aby sme

celkom ľahko neprišli na to, že je to jednoducho negatív – urobili ešte niekoľko zásahov

do tohto negatívu. Kruh, v ktorom je negatív bradatého muža, je deformovaný, črty tváre

sú znejasnené pridaním alebo posunutím bielych a čiernych škvŕn. Napriek tomu

v paobraze vidíme zreteľné črty bradatého muža umiestneného v dokonalom svetelnom

kruhu. To znamená, že pri konštruovaní tejto ilúzie, okrem čiernobieleho negatívu, sú v

hre ešte aj záležitosti súvisiace s geštaltistickým zákonom pregnantnosti (zákonom

dobrých tvarov). Môžeme povedať, že v paobraze je manifestovaná úžasná organizačná

sila percepčného systému. Je to jedna zo základných vlastnosti percepčného systému.

Aby sme si jasnejšie uvedomili o čo ide, pozrime sa pozorne na testovací obrázok 2.

Vidíme na ňom raz väčšie a hneď zase menšie kruhy, skladajúce sa do ďalších kruhov,

v ktorých sú rôzne útvary. Obrázok je veľmi dynamicky, neustále sa mení. Táto

organizačná sila percepčného systému bola formulovaná v geštaltistických princípoch

(blízkosti, podobnosti, kontinuity, uzatvorenosti, symetrie atď.).10

Obrázok 2: Dynamika videnia.

10

Čo je exaktným potvrdením Kantových špekulatívnych úvah, o tom, že organizácia poznania už

na zmyslovej úrovni je podmienená organizačnými schopnosťami našej mysle.

Page 36: Kognitívna veda a umelá inteligencia

36

Ale vráťme sa k paobrazom, k nášmu východiskovému problému. Na jednom

seminári, keď sme demonštrovali konštruovanie paobrazov, bola položená otázka, či sa

objaví ten istý fenomén, ak na obrázku bude napríklad stolička. Samozrejme, že to

funguje aj so stoličkou, alebo s akýmkoľvek čierno-bielym objektom. Dokonca v súlade

s Heringovými objavmi to funguje, ak použijeme nielen čiernobiely, ale aj žlto-modrý

alebo červeno-zelený negatív. Jednoducho, ak použijeme tzv. komplementárne farby. Na

základe toho bolo vytvorených mnoho paobrazových ilúzií pracujúcimi s farbami

štátnych zástav, v ktorých sa vyskytujú tieto komplementárne farby (napríklad zástava

USA, Anglicka, Nemecka, Japonska atď.)

Aj v prípade stoličky platia tie isté záležitosti ako v prípade paobrazu bradatého

muža. Keď sme do negatívneho obrázka stoličky pridali čierne škvrny, trochu sme

rozrušili jej ostré línie, napriek tomu stolička v paobraze bude bez škvŕn, jej línie budú

ostré a bude v dokonalom svetelnom kruhu. Mimochodom, štyri bodky uprostred, podľa

ktorých sa zvykne ilúzia bradatého muža volať (na našom obrázku stoličky sme použili

len tri bodky), nemajú v ilúziách tohto druhu veľký význam, je to len ďalší odpútavací

manéver konštruktérov ilúzie.

Ako sme už uviedli, základným kritériom pre určenie kognitívnych ilúzií je fakt, že

hoci sú vstupné dáta stále, napriek tomu sa vnímané obrazce menia. Tieto ilúzie sú oproti

fyziologickým ilúziám viac spojené s vyššími kognitívnymi procesmi. Kognitívne ilúzie

podľa druhu chýb môžeme deliť na niekoľko podkategórií: dvojznačné obrazce, fiktívne

obrazce, skresľujúce (veľkosť, tvar a jas) a nemožné obrazce.

3.1.1.2 Dvojznačné obrazce

Ide o figúry, ktorých vnímanie je spojené s dvoma, niekedy aj viacerými možnosťami.

Nezainteresovanému pozorovateľovi sa môže zdáť, že prepínanie tých možnosti je

náhodné, no nie je to celkom tak. V prípade Neckerovej kocky (obr. 3 vľavo) je ten istý

roh vnímaný ako vnútorný a inokedy zase ako vonkajší roh. Náš vizuálny systém v tomto

prípade dokáže cieľavedome preklikávať. Nikdy však nemôžeme vidieť obidve orientácie

naraz. Podobne je to aj v prípade ďalšej populárnej dvojznačnej figúry (obr. 3 vpravo),

ktorá sa zvykne nazývať svokra/nevesta. Vstupný obrázok sa nemení, ale náš vizuálny

systém ho interpretuje dvoma spôsobmi. Závisí to od toho, kam sa pozeráme. Ak sa

pozeráme na oko, uvidíme svokru, ak viac na ľavú stranu obrázku, uvidíme nevestu.

Obrázok 3: Neckerova kocka (vľavo) a svokra/nevesta (vpravo).

Page 37: Kognitívna veda a umelá inteligencia

37

Dvojznačnými (resp. mnohoznačnými) figúrami sa inšpirovalo mnoho slávnych

výtvarných umelcov. Najznámejšie sú v tomto smere grafiky M. C. Eschera (1898-1972).

Tento výtvarník bol ozajstným majstrom vizuálnych paradoxov. Jeho obľúbenou

technológiou bolo premyslené využívanie optických ilúzií, včítane dvojznačných figúr.

V tomto smere vynikajúco uplatnil dvojznačnú optickú figúru Schroederove schody (obr.

4). Ak sa pozornejšie pozrieme na tento obrázok, po chvíli zistíme, že tá strana schodiska,

na ktorej je okrúhly znak, môže byť zadnou stenou alebo prednou stenou schodiska

(v druhom prípade sú schody otočené dolu hlavou). Ak si vopred na tomto obrázku

nacvičíme preklikanie z jednej figúry na druhú, budeme pripravení pochopiť, prečo je na

jeho grafike Relativita možné, že dve postavy idú jedným smerom na jednom schodisku,

a predsa jedna ide dole a jedna hore. Tá istá dvojznačná figúra je viacnásobne uplatnená

aj v grafike Konvexné a konkávne, a potom sa naozaj tie isté schody zdajú raz vypuklé

a raz preliačené.11

Obrázok 4: Schroederove schody.

Dvojznačnými figúrami sa nadchol aj známy surealistický maliar Salvador Dalí

(1904-1989), ktorý tento druh ilúzií zakomponoval do mnohých svojich obrazov.

Najznámejšie z nich sú Paranoická figúra (na obraze môžeme vidieť tvár ležiacu na

piesku alebo skupinu sediacich ľudí), Obraz mizne (môžeme tu vidieť hlavu fúzatého

a bradatého muža z profilu, alebo čítajúcu ženu) a ďalšie.

Od konca 19. storočia, keď sa psychológovia začali intenzívne zaujímať o optické

ilúzie, bolo skonštruovaných veľmi veľa dvojznačných figúr. J. R. Blockovi sa do jeho

knihy Seeing double (2002) podarilo nazbierať viac než dvesto.

3.1.1.3 Fiktívne ilúzie

Tento druh ilúzií tiež svedčí proti koncepciám priamej percepcie (vnímané objekty nie sú

v senzorických vstupoch). Na Ehrlichovom obrázku (obr. 3 vľavo) nie sú nakreslené

žiadne biele kruhy, a predsa ich tam jasne vidíme.

Najslávnejšou a najefektnejšou ilúziou v tejto oblasti je Kaniszov trojuholník (obr.

5). Biely trojuholník, ktorý vidíme je fikciou. Ide o proces zhora nadol, náš vizuálny

systém si obrázok interpretuje tak, že konštruuje trojuholník, ktorý prekrýva tri tmavé

objekty. Trojuholník má dokonca výraznejšiu bielu farbu než pozadie. Je zjavné, že aj tu

11

Uvedené grafiky môžeme nájsť na stránke: http://www.mcescher.com/Gallery/gallery.htm. Tiež

ich môžeme nájsť v reprezentačných monografiách venovaných Escherovmu grafickému dielu

(Locker 1992, Locker 2000).

Page 38: Kognitívna veda a umelá inteligencia

38

sú v hre geštaltistické princípy, predovšetkým princíp uzatvorenosti. Ilúzia fiktívneho

trojuholníka sa objaví aj vtedy, ak pod ním nie je nakreslený ďalší akoby prekrytý

trojuholník. Úloha tohto trojuholníka spočíva iba v zosilnení účinku ilúzie.

Obrázok 5: Ehrlichova ilúzia (vľavo) a dva príklady Kanizsovho trojuholníka.

3.1.1.4 Skresľujúce ilúzie

Prvá podskupina ilúzií, ktorou sa tu budeme zaoberať sa týka fenoménu vnímania

konštantnej veľkosti objektov. Ide o to, že napriek tomu, že veľkosť objektu na našej

sietnici sa mení podľa toho ako je predmet vzdialený od nás (ak je objekt bližšie k nám je

väčší, ak je ďalej je menší na našej sietnici), stále máme rovnakú predstavu o jeho

veľkosti. Táto stálosť sa však pomocou rôznych “manipulácií” dá významne narušiť.

Hádam najznámejším klasickým prípadom je Müller-Lyerova figúra.

Podstata ilúzie je v tom, že ak jedna z dvoch rovnakých úsečiek má kótovanie

(krídelká) do vnútra a druhá von, úsečka s vonkajším kótovaním (s vonkajšími

krídelkami) sa bude zdať dlhšia. Napríklad pri pokusoch, v ktorých sa porovnáva

štandardná úsečka (bez krídelok) s úsečkou s krídelkami von, sa zistilo, že v odhade

veľkosti sa mýlime v priemere o 10% (Francis, 2004).

Zaujímavé je, že ilúzia ostáva aj keď vieme, že je to ilúzia, tento poznatok, táto

vedomosť ju neodstraňuje. Teda v tomto zmysle percepcia nie je informačne otvorená

voči predchádzajúcim skúsenostiam. Zdá sa, že nie je penetrovaná kogníciou a je

informačne uzatvorená, má modulárnu povahu (pozri bližšie Rybár, 2002, s. 35-40).

Obrázok 6: Orbisonova ilúzia (vľavo) a Whiteova ilúzia (vpravo).

Podobne je to aj s konštantnosťou tvaru. V závislosti od toho či sa pozeráme na

predmet spredu alebo zboku je na sietnicu premietnutý iný tvar, ale to nijako neohrozuje

našu predstavu o stálom tvare predmetu. Avšak pomocou pozadia (napríklad líniami

Page 39: Kognitívna veda a umelá inteligencia

39

usporiadanými do hviezdice, alebo do sústredných kruhov) vieme narušiť túto

konštantnosť. Bolo vytvorených mnoho ilúzií tohto druhu, niektoré už v 19. storočí. Ich

autormi boli fyzici, ktorí sa zaoberali skresleniami optických prístrojov. Uveďme aspoň

jednu z nich (obr. 6 vľavo).

V odbornej literatúre je opísaný zaujímavý prípad S. B. Išlo o muža, ktorý bol slepý

od narodenia až do stredného veku. Po transplantácii rohovky začal vidieť. Jeho videnie

bolo spojené s mnohými ťažkosťami a zvláštnosťami a trpel depresívnymi náladami.

Napríklad, mal veľký problém s tým, že predmety z rôznych strán vyzerajú rôzne.

Vizuálny svet sa mu nezdal taký dokonalý ako očakával. Ťažko odhadoval vzdialenosť

objektov, mal problém s vnímaním vecí, ktoré nepoznal z dotyku, podobne ťažkosti mal

aj s kreslením vecí, ktoré nepoznal z dotyku. Mal problémy s čítaním malých písmen,

pretože tie sa v slepeckej škole neučili (Gregory, 2004). Okrem iného S. B. nebol veľmi

senzitívny na ilúzie Orbisonovho typu.12

Konštruktéri paradoxných fenoménov radi využívajú aj ilúzie spojené s vnímaním

vertikály a horizontály. Je známe, že vzdialenosti orientované zdola hore (alebo zhora

dole) sa nám zdajú väčšie než vzdialenosti v orientácii zľava doprava (alebo sprava

doľava).13

Čiastočne aj o tento poznatok sa opiera konštrukcia Shepardových otočených

stolov (jeden zo stolov je viac menej otočený užšou stranou v smere vertikály a širšou

stranou v smere horizontály). Ide o ilúziu týkajúcu sa tvaru a veľkosti dosiek stolov, ktoré

hoci nevyzerajú rovnaké, napriek tomu sú toho istého tvaru a veľkosti. Avšak

preceňovanie vertikály ani zďaleka nestačí na vysvetlenie ilúzie, pretože, keď obrázok

otočíme o 90˚, ilúzia sa síce trochu zoslabí, ale nezmizne (stoly stále vyzerajú nerovnaké).

To znamená, že pri konštruovaní tejto ilúzie sú v hre aj ďalšie záležitosti. Veľmi

dôležitým faktorom je, že vnútorné (susedné) hrany a nohy stolov sú v perspektíve, čo

vytvára hĺbku a predlžuje jeden stôl do dĺžky a druhý do šírky. V hre sú pravdepodobne

aj ďalšie faktory monokulárneho videnia hĺbky (napríklad efekt prekrývania zadných nôh

stolov). V každom prípade ide tu o využitie viacerých ilúzio-tvorných prvkov v jednom

obrazci (Ninio, 2001).

Ďalej existuje veľké množstvo efektných ilúzií s porušením konštantnosti jasu. Na

ilustráciu sme vybrali Whitovu ilúziu, ktorá patrí medzi najjednoduchšie. Na obrázku 6

vpravo je v obidvoch stĺpcoch rovnaká šedá. Jasnosť šedého polička sa mení v súvislosti

s pozadím. Na tmavom pozadí sa tá istá šedá farba javí svetlejšia a naopak na svetlom

pozadí sa javí tmavšia.14

12

Z tohto prípadu vyplýva, že vidieť sa do značnej miery učíme. Najsenzitívnejšie obdobie pre

takéto učenie je už rané detstvo. V zrelom veku je takéto učenie už veľmi ťažké, často aj

nemožné. Napríklad sa zistilo, že ak istý druh vrabca (white-crowned sparrow) medzi 20. až 50.

dňom svojho života nepočuje spev, tak neskôr sa to už nenaučí. Podobne, ak sa mačiatkam

medzi 30. až 80. dňom zakryjú oči, tak sú slepé do konca života (Gopnik, 2001). 13

Evolučno-psychologické vysvetlenie tejto ilúzie hovorí, že predimenzované videnie vertikály

(oproti horizontále) bolo výhodné pre lovca-zberača. 14

Veľmi zaujímavé analýzy o fenoménoch s porušovaním jasnosti môžeme nájsť v štúdii

Kremláčka (2006).

Page 40: Kognitívna veda a umelá inteligencia

40

3.1.1.5 Nemožné objekty

Tieto objekty majú zvláštnu povahu, môžeme ich nakresliť v dvojrozmernej rovine, ale

nemôžeme ich reálne skonštruovať v trojrozmernom priestore. Poznáme niekoľko

základných typov nemožných objektov.

Na pôdu vedeckej psychológie sa problematika dostala až v päťdesiatych rokoch

minulého storočia, keď Lionel S. Penrose a jeho syn Roger Penrose publikovali článok

v British Journal of Psychology (1958), v ktorom boli nakreslené a opísané dva typy

nemožných objektov. Prvý typ objektov, ktorý popisujú je tzv. nemožný (paradoxný)

trojuholník. Každý uhol tohto trojuholníka sa javí ako perfektne pravý, ale celkove je to

veľmi zvláštny trojuholník (obr. 7 vľavo).

Obrázok 7: Penrosov nemožný trojuholník (vľavo) a Penrosove schody (vpravo).

Nezávisle od Penrosovcov skonštruoval podobný trojuholník aj švédsky výtvarný

teoretik Oscar Reuterswärd (1915-2002). Prvý nemožný trojuholník nakreslil z kociek už

v roku 1934. Je autorom viac než dvetisíc rôznych variácií tohto typu nemožných

objektov. Dokonca vo Švédsku bola vydaná na jeho počesť poštová známka s námetom

nemožného trojuholníka.

Druhým slávnym nemožným objektom, o ktorom sa hovorí v článku Penrosovcov sú

tzv. večné schody (obr. 7 vpravo). Po týchto schodoch môžeme neustále vystupovať

alebo zostupovať.15

Je to jeden z najznámejších nemožných objektov. Ilúzia sa podľa

mien jej autorov často nazýva aj Penrosove schody.

Avšak pravdepodobne najznámejším nemožným objektom je nemožná kocka (obr.

8), ktorej autorom je M. C. Escher. S jej rôznymi variantmi sa môžeme sa stretnúť na

rôznych webových stránkach, na plagátoch, jednoducho všade tam, kde ide o upútanie

pozornosti diváka. V každom prípade je to zvláštna kocka.16

Ak si budeme všímať len

jednotlivé detaily obrázku, bude všetko v poriadku, ak sa však pozrieme na kocku ako

15

Profesor Zimbardo vo svojom televíznom kurze psychológie uvádza dokonca animovanú

podobu tejto ilúzie (po schodoch smerom hore alebo dole večne skáče gulička). 16

V podstate ide o upravenú Neckerovu kocku. Prvú známu verziu nemožnej kocky prezentoval

holandský grafik Escher (1958) vo svojej známej grafickej práci Belvedér. Autor tu prejavil

značnú dávku zmyslu pre humor, pod belvedérom sedí na lavičke chlapec, pred sebou má nákres

nemožnej kocky, a zároveň ju už zostrojenú drží v rukách. Najjednoduchšiu verziu nemožnej

kocky (obr. 9) možeme nájsť na stránke: http://mathworld.wolfram.com/FreemishCrate.html

Page 41: Kognitívna veda a umelá inteligencia

41

celok, je to nezmysel (jeden z jej zadných „pilierov“ je postavený pred predným

„prekladom“).

Holandský grafik Escher bol skutočne majstrom vytvárania podivných

trojrozmerných efektov (ilúzií) v dvojrozmernej rovine, bol majstrom v mýlení našich

schopností vnímať trojrozmerné objekty. Jeho grafiky pôsobia ako akýsi vizuálny

labyrint, ktorého zmysel nechápeme, a z ktorého sa nedá dostať von. Nie je to však až

také beznádejné. Odpoveď ako sa zorientovať v labyrinte Escherových trikov nám môžu

poskytnúť práve poznatky z psychológie vnímania.

Obrázok 8: Nemožná kocka.

Je zaujímavé, že tohto vynikajúceho grafika mnohí jeho súčasníci považovali skôr za

dobrého remeselníka, než výtvarného umelca. Dokonca boli vyslovené pochybnosti, či

vôbec ide ešte o výtvarné umenie, alebo sú to len rôzne intelektuálne hračky a vedecké

záhady. Escher dosiahol väčšiu popularitu medzi prírodovedcami a matematikmi než

medzi výtvarníkmi a výtvarnými teoretikmi.17

Nie je to náhodné, keďže je o ňom známe,

že svoje inšpirácie hľadal (hoci nemal žiadne formálne prírodovedné vzdelanie) práve

v tejto oblasti. Veľký vplyv mal na neho jeho brat, ktorý bol kryštalograf. Escher svojím

skúmaním a kreslením mnohostenov vzbudil záujem aj u profesionálnych prírodovedcov,

ktorí ho pozývali prednášať o symetrii na svoje vedecké semináre. Ovplyvnilo ho aj

čítanie niektorých matematických odborných článkov, medzi nimi predovšetkým Polyov

článok o symetrických grupách a takisto článok profesora Coxetera, ktorý mal významný

vplyv na tvorbu jeho grafík súvisiacich s princípom nekonečna. V každom prípade Escher

mal výnimočnú schopnosť vizualizovať také matematické princípy ako sú symetria,

rekurzia, limita a ďalšie. Dokázal sa zmocniť aj takej témy ako je princíp autoreferencie.

Ukážkovou toho je litografia s názvom Galéria.18

Keďže bol známy svojím záujmom o vizuálne paradoxy, v tejto súvislosti treba

uviesť, že R. Penrose mu poslal článok o nemožných objektoch. A urobil dobre, pretože

Escher sa skutočne dokázal inšpirovať a zmocniť témy nemožných objektov veľmi

originálnym spôsobom. Penrosove paradoxné schody sa stali námetom jeho slávnej

17

V tejto súvislosti nezabudnime pripomenúť, že je stále veľmi populárny aj medzi laickou

verejnosťou. Mnohé jeho práce „zľudoveli“ a často jeho obdivovatelia ani nevedia, že ich

autorom je Escher..

18 Pozri: http://www.mcescher.com/Gallery/gallery.htm

Page 42: Kognitívna veda a umelá inteligencia

42

grafiky Ascendentné a descendentné (niekedy nazývanej aj Mnísi). Grafika predstavuje

mníchov na večnom schodisku. Po jednej strane schodiska mnísi stále zostupujú a po

druhej strane toho istého schodiska iní mnísi stále vystupujú v uzatvorenom cykle. Tu už

nejde len o majstrovsku konštrukciu vizuálneho paradoxu, tu sa Escherovi podarilo

vniesť do tohto námetu metafyzický rozmer.

Veľkou témou sa pre neho stal aj nemožný trojuholník. Túto ilúziu spracoval

v slávnej grafike Vodopád.19

Na grafike je prezentovaný mlyn s vodným náhonom

a dvomi vežami. Ak sa budeme na obrázok pozerať analyticky (kúsok po kúsku pôjdeme

vodným kanálom) všetko bude v poriadku – voda tečie stále dole. Ak sa pozrieme na

obrázok ako celok, budeme vidieť niečo nezmyselné a nemožné, že voda tečie hore

kopcom. Na obrázku nás šokuje konflikt medzi lokálnym a holistickým prístupom. Táto

grafika je skvelým príkladom, že jeho práce sú viacvrstvové. Ak si túto grafiku ešte

pozornejšie prezrieme, tak zistíme, že okrem efektu vody, ktorá paradoxne tečie hore

kopcom, grafika obsahuje tri nemožné trojuholníky. Pričom sú konštruované tak, že ak si

pozrieme len ľavú alebo len pravú stranu práce, tieto trojuholníky neuvidíme. Vidíme ich

len, keď pozeráme na grafiku ako celok.

3.1.2 Binokulárne a monokulárne vnímanie hĺbky

Je zaujímavé, že skúmanie nemožných objektov môže efektívnym spôsobom prispieť

k objasneniu vizuálnych paradoxov obzvlášť tých, ktoré súvisia s vnímaním hĺbky (3D).

Toto skúmanie môže pomôcť odpovedať na mnohé základné otázky: Ako je možné, že

dokážeme vnímať priestor, hoci na sietnici máme v podstate len 2D zobrazenie objektov?

Zvyčajná odpoveď je: „Pretože sme binokulárni“. Samozrejme, odpoveď ide správnym

smerom. Ak sa objekt približuje k nám, oči sa otáčajú k nosu. Toto otáčanie (binokulárna

konvergencia), pohyb očných svalov je významným indikátorom pre mozog pri

odhadovaní vzdialenosti objektu. Druhým takým indikátorom je fakt, že vnímaný obraz z

obidvoch očí nie je celkom totožný (binokulárna disparita). Môžeme sa o tom ľahko

presvedčiť, keď sa pozrieme na objekt, ktorý je blízko pred nami najprv jedným a potom

druhým okom.20

Na základe rozdielnych informácií z jedného a druhého oka mozog

indikuje vzdialenosť objektu v priestore. Konvergencia a disparita sú nepochybne

dôležitými faktormi priestorového vnímania.

To však ešte nemôže byť úplným vysvetlením vnímania hĺbky, a to z veľmi

jednoduchého dôvodu – hĺbku dokážeme vnímať aj jedným okom. V tejto súvislosti nás

zaujímajú vlastne dve otázky: (1) V čom spočíva podstata vnímania hĺbky jedným okom?

(2) Ako sa konštruuje hĺbka (ilúzia hĺbky) v dvojrozmernej rovine? Na základe čoho teda

môžeme vytvárať a vnímať trojrozmerné efekty v rovine. Odpoveď na prvú i druhú

otázku treba hľadať v “manipulácii” s monokulárnymi indikátormi vnímania hĺbky.

A práve spomínaný Escher vo svojich grafikách priam inžiniersky presne pracuje

s týmito indikátormi. Ešte raz sa pozrime na jeho znamenitú grafiku Vodopád,21

aby sme

19

Obidve spomínané grafiky môžeme nájsť na http://www.mcescher.com/Gallery/gallery.htm. 20

Tu treba poznamenať, že ak je objekt vzdialený od nás viac než sto metrov, rozdiely sú už

zanedbateľné a v tom zmysle sme vlastne monokulárni. 21

Pozri: http://www.mcescher.com/Gallery/gallery.htm

Page 43: Kognitívna veda a umelá inteligencia

43

videli akú bohatú paletu indikátorov vnímania hĺbky použil, aby rafinovane poplietol náš

percepčný systém.22

Prvým takým indikátorom využívaným v tejto grafike je prekrývanie

objektov. Hoci len čiastočne prekryté objekty sa na dvojrozmernom obraze vždy zdajú

vzdialenejšie. Druhý indikátor súvisí s umiestnením objektov vo výške. Objekty

umiestnené vyššie (nad horizontom) sa zdajú vzdialenejšie, objekty umiestnené nižšie

(pod horizontom) sa zdajú bližšie. V danom prípade je využitý výškový efekt, a napriek

tomu, že kanál smeruje v rovine do výšky, máme dojem, že voda tečie do hĺbky. Tretí

indikátor, ktorý pomáha vytvárať hĺbku sú konvergujúce línie, teda lineárna perspektíva.

Je to najdôležitejší indikátor, s ktorým Escher v grafike pracuje. Štvrtým indikátorom je

veľkosť objektov na obraze. Väčšie objekty na grafike sa zdajú bližšie než menšie (ten

istý mnohosten na pravej veži mlyna je väčší než mnohosten na ľavej strane, aj preto sa

prvý zdá bližšie než druhý). Prúd vody v kanále tečúci do hĺbky je posilnený

zmenšovaním veľkosti múrika, ktorý vodu obklopuje. Dôležitým indikátorom je

povrchová štruktúra nakresleného múrika kanála aj samotnej vody. Je hrubšia, zrnitejšia

na začiatku kanála a jemnejšia na konci, čo takisto posilňuje ilúziu hĺbky. Ďalším

indikátorom je tienenie. Tmavšie častí objektu (napríklad spomínané múriky vodného

kanála) sa zdajú byť vzdialenejšie než svetlejšie oblasti. Posledným indikátorom je

vzdušná perspektíva. Obrazy objektov, ktoré sú nejasnejšie sa zdajú vzdialenejšie, než

objekty s výraznými zreteľnými obrysmi. Escher práve pomocou majstrovského

vyžívania indikátorov monokulárneho videnia hĺbky dokáže vytvoriť ilúziu, že voda tečie

hore kopcom. Na začiatku sa nám mohlo zdať, že ide o záhadný výtvor autorovej

výstrednej mysle. Teraz vidíme, že to nie je tak. Escherov prístup je vysoko racionálny.

Lineárna perspektíva. Ako sme už spomínali kľúčovým indikátorom vnímania hĺbky

je lineárna perspektíva. Ako poznamenáva Gregory (2004), trvalo veľmi dlho, kým sa

človek prepracoval k objavu lineárnej perspektívy. Tento autor radí objav perspektívy

medzi také prevratné objavy v dejinách civilizácie, akými boli objavy ohňa alebo kolesa.

Ako je známe, k objaveniu perspektívy došlo až v renesančnom období. Staré egyptské

umenie, antika, stredovek nepoznajú perspektívu.23

Napríklad umelecký kánon

stredovekej maľby predpisoval zobrazovať veľkosť postáv podľa dôležitosti. Položme si

hypotetickú Gregoryho otázku: Čo by sa stalo, keby perspektíva bola objavená neskôr

než fotografia? Odpoveď je jednoduchá: fotografia by sa určite nepovažovala za verný

obraz skutočnosti.

3.1.3 Hlavné teoretické prístupy: zdola nahor a zhora nadol

Záver tejto časti by sme chceli venovať teóriám percepcie. Už vopred treba povedať, že

v súčasnosti neexistuje teória, ktorá by dokázala vysvetliť všetky aspekty percepčných

22

Paradoxy, s ktorými pracuje, obyčajne nie sú prvoplánové, až keď si všimneme obrázok bližšie

(a obrázok vždy vyžaduje bližšie skúmanie), vidíme, že niečo nie je v poriadku. Čím detailnejšie

ho budeme skúmať, tým hlbšie sa budeme dostávať do siete jeho kognitívnych hier. 23

To, že sa s lineárnou perspektívou začalo pracovať tak neskoro, je o to paradoxnejšie, že aj na

sietnici sú objekty zobrazené v perspektíve. Každým zdvojením vzdialenosti objektu od oka, je

zobrazenie veľkosti objektu na sietnici o polovicu menšie (takzvaný Emmertov zákon).

Page 44: Kognitívna veda a umelá inteligencia

44

procesov. Ako uvidíme ďalej, každá z týchto teórií vysvetľuje niektoré aspekty a nevie

vysvetliť ďalšie.

Prístup zdola nahor. Ide o teórie tzv. priamej percepcie. Najradikálnejším

predstaviteľom tohto prístupu bol James Gibson (1904-1979). Podľa neho všetky

informácie, ktoré potrebujeme k utváraniu percepcie sú už dané v prostredí (resp. všetko

dôležité, čo potrebujeme je už v zmyslových receptoroch). Ide o bezprostredný

a spontánny proces, zhora nadol procesy nie sú nevyhnutné (nepotrebujeme vyššie

kognitívne procesy, aby robili sprostredkovateľa medzi zmyslovou, senzorickou

skúsenosťou a percepčnými procesmi). Podľa neho druhou základnou vlastnosťou

percepčného procesu je, že percepcia a činnosť nemôžu byť oddelené (percepcia

sprevádza činnosť a činnosť generuje nové percepčné informácie).24

Medzi najznámejšie teórie tohto prístupu patrí teória šablón (template theory). Podľa

nej v dlhodobej pamäti máme určité šablóny, ktoré porovnávame s informáciami o

objektoch. Slabou stránkou tejto teórie je hľadanie “zhody” medzi šablónou a

konkrétnym objektom. Vzhľadom na pestrosť objektov, hrozí neustále nebezpečenstvo,

že zhodu nenájdeme. Ak by teória mala dobre fungovať, muselo by byť k dispozícií

veľmi veľa šablón.25

Odstrániť tieto nedostatky sa pokúša prototypová teória. Vychádza z predpokladu, že

ľudské rozpoznávanie objektov sa opiera o schopnosť neustále hľadať najpodstatnejšie

charakteristiky objektov. V pamäti nemusíme mať vopred daný presný vzor objektu, ale

je to skôr o neustálom, veľmi flexibilnom hľadaní modelu objektu (jeho podstatných

vlastností).26

Pomerne populárna je aj teória geónov. Podľa tejto teórie rozpoznávanie prebieha

prostredníctvom určitých základných trojdimenzionálnych komponentov. Pričom

neporovnávame šablóny celých objektov, ale len šablóny časti objektov. Takéto

rozpoznávanie je oveľa flexibilnejšie. Autorom tejto teórie je Irving Biederman, ktorý

rozlišuje 24 geometrických trojdimenzionálnych útvarov (valec, kváder, kužeľ, ihlan

atď.) Tieto komponenty nazval geóny. Dôležité je tiež určenie v akých priestorových

vzťahoch sa môžu vyskytovať jednotlivé komponenty (čo môže byť na čom, alebo vedľa

seba). Napríklad stolná lampa s tienidlom, to je valec a na ňom zrezaný kužeľ, hrnček s

uškom, to je valec, ktorý má na boku ohnutú guľatinovou tyčku a pod. Vlastnosti

jednotlivých geónov (t.j. uhly, vrcholy, strany, zakrivenia) sú invariantné. Pomocou

geónov sa relatívne dobre vysvetľuje rozpoznávanie objektov vyrobených človekom, ale

problematickejšie je to s prírodnými objektmi ako sú rastliny alebo živočíchy.

Prístup zhora nadol. Stúpenci tohto prístupu vychádzajú z predpokladu, že percepcia

má do značnej miery konštruktívny charakter. Medzi významných stúpencov tohto

prístupu patrí Jerome Brunner. Podľa neho na percepcii participuje: 1. To, čo pociťujeme

(senzorické dáta); 2. to, čo vieme (máme uložené v pamäti); 3. to, čo vyvodzujeme z

toho, čo vieme; 4. naše očakávania. Teda vnímateľ vytvára kognitívne pochopenie

24

Prepojenie percepcie a činnosti je dnes jednou z najvýznamnejších oblastí výskumu

v kognitívnej vede. J. Gibsona môžeme považovať za dôležitého anticipátora tohto výskumu. 25

To by zahltilo pamäťový systém. 26

Prototypová teória sa často pletie s teóriou šablón. Prototypy však nie sú šablóny!

Page 45: Kognitívna veda a umelá inteligencia

45

(percepciu) stimulu na základe senzorickej informácie, ale tiež používa aj iné zdroje

informácií na konštruovanie percepcie. Hypotézu, že naša minulá skúsenosť a naše

očakávania ovplyvňujú našu percepciu potvrdil známy Postmanov experiment. Tento

autor ukazoval v určitom krátkom čase pokusným osobám karty, ktoré následne mali

identifikovať. Najprv ukazoval normálne karty, pokusné osoby s tým nemali žiadny

problém. Neskôr im ukazoval karty anomálie (napríklad jedna časť karty bola piková,

druhá srdcová), pokusné osoby si nevšimli zmenu a určovali takúto kartu ako

jednoznačne pikovú alebo srdcovú. Až, keď sa podstatne zvýšil čas expozície, prišli

niektorí na to, že ide o kartu anomáliu.

Na záver tejto časti by sme chceli uviesť niekoľko poznámok. (1) Už i z uvedených

príkladov konštrukcií optických ilúzií je zrejmé, že pokusy o ich klasifikáciu (teda

pokusy o prekonanie len čisto opisného katalógového prístupu) môžu byť veľmi užitočné

a podnetné. Vedú k hľadaniu a testovaniu efektívnych nástrojov (kritérií) pre skúmanie

tak rozsiahlej oblasti akou je vizuálna percepcia. Sú hľadaním základných charakteristík,

ktoré sú spojené s optickými ilúziami. Tieto charakteristiky sú vlastne charakteristikami

celého percepčného systému. Môžu tiež viesť k lepšiemu objasneniu toho, čo je

výsledkom nižších a čo vyšších kognitívnych procesov. (2) Primárne vysvetlenie

vizuálnych paradoxov treba hľadať v tom, že percepčný systém „neskenuje“

a nespracováva všetky informácie zo zorného poľa. Prakticky to ani nie je možné, pretože

systém by sa veľmi rýchlo „zahltil“ (veľmi rýchlo by sa vyčerpala jeho kapacita).

Percepčný systém spracováva informácie len výberovo a táto skutočnosť ho potom „núti“

používať určité heuristiky odhadovania. Uplatnenie týchto heuristík vedie k vzniku

najrôznejších vizuálnych paradoxov. Našťastie tieto heuristiky (resp. indikátory) majú

pomerne stabilnú štruktúru a preto sú predmetom rozsiahleho výskumu. V každom

prípade, heuristiky odhadovania (a v tom zmysle aj vizuálne paradoxy) svedčia nie

o nedostatkoch, ale skôr o prednostiach a inteligencii percepčného systému. (3) Možno

ste si všimli, že na začiatku výkladu vizuálnej percepcie sme neuviedli žiadnu definíciu.

Zámerne sme si to nechali až na koniec: percepcia je proces rozpoznávania, organizácie a

interpretovania informácií. Ide o v súčasnosti všeobecne prijímanú definíciu. Naším

cieľom bolo však ukázať, že je to naozaj tak.

3.2 Modely a metódy skúmania pamäti

Ďalším významným aspektom kognície (resp. kognitívnou funkciou) je pamäť. Zdá sa

nám, že najefektívnejším spôsobom, ako sa zorientovať v tejto rozsiahlej oblasti, je

pokúsiť sa porovnať dva, v ostatných desaťročiach dominantné, modely pamäti:

Atkinsonov-Shiffrinov trojzložkový model a Baddeleyho model pracovnej pamäti. Pre

obidva modely je charakteristické, že významne ovplyvnili teoretický a experimentálny

výskum v tejto oblasti.27

Najprv sa zameriame na prínos a najvýznamnejšie výsledky

27

Jedna z príčin úspechu týchto modelov určite spočíva v ich prekvapujúcej jednoduchosti.

Page 46: Kognitívna veda a umelá inteligencia

46

klasického modelu, potom sa pozrieme na nedostatky tohto modelu a čo ponúka na ich

prekonávanie Baddeleyho model pracovnej pamäti.28

3.2.1 Klasický trojzložkový model pamäti

Podstatou klasického Atkinsonovho-Shiffrinovho modelu pamäti (1968, 1971) je

predstava, že informácie prúdia zo senzorických registrov cez krátkodobú pamäť do

dlhodobej pamäti. Tento model viedol k vytvoreniu mnohých experimentálnych metód

(často veľmi sofistikovaných), pomocou ktorých dokážeme merať trvanie a kapacitu

jednotlivých zložiek pamäti. V tomto smere sa dosiahli pozoruhodné výsledky. Pri

niektorých sa krátko zastavíme.

Meranie senzorickej a krátkodobej pamäti. Senzorická pamäť je niečo ako zásobník

v počítači, ktorého kapacita je určite veľmi veľká. Avšak, na čo sa nezameria pozornosť,

to sa rozpadne do jednej sekundy, pokiaľ ide o vizuálnu informáciu, a do dvoch sekúnd

pokiaľ ide zvukovú informáciu. Z tohto hľadiska by sme ju mohli nazvať aj

ultrakrátkodobou pamäťou. Prvý významný pokus na jej zmeranie urobil ešte

začiatkom šesťdesiatych rokoch Sperling (1960). Jeho test však meria len istý špeciálny

druh vizuálnej senzorickej pamäti. Zameriava sa na reprodukciu ikôn (písmen alebo

číslic), preto sa aj volá test ikonickej pamäti. Sperling premietol pokusným osobám na 50

milisekúnd rad ikôn a zisťoval koľko z nich si dokážu zapamätať. Pokusné osoby si

v priemere dokázali zapamätať štyri symboly. S týmto výsledkom však Sperling nebol

spokojný, zdalo sa mu to veľmi málo. Preto vymyslel iný experimentálny postup, tzv.

parciálny report, pomocou ktorého bolo možné presnejšie zmerať ikonickú pamäť.

Pokusným osobám exponoval 12 ikon v troch riadkoch, ale reprodukovať mali len jeden

označený riadok. Označovanie riadkov sa dialo prostredníctvom tónu, ktorý zaznel tesne

pred alebo tesne po exponovaní všetkých symbolov. Vysoký tón označoval horný riadok,

stredný označoval stredný riadok a najnižší označoval spodný riadok. (Známy je aj

variant experimentu, v ktorom sa riadok označuje pomocou šípky.) Získaný výsledok

Sperling vynásobil tromi, a tak zistil, že kapacita ikonickej pamäti môže byť až deväť

symbolov.29

Na rozdiel od senzorickej pamäti, kapacita krátkodobej pamäti je limitovanejšia. Jej

kapacita je vyjadrená tzv. Millerovým zákonom sedem plus mínus dva položiek. Čo si

ľahko môžeme overiť, keď prezentujeme pokusným osobám rad číslic (z pochopiteľných

dôvodov väčší než deväť). Počet zreprodukovaných položiek (číslic) sa bude pohybovať

medzi päť až deväť.30

Táto kapacita sa však značne zvýši, ak použijeme zhlukovanie

položiek, či už pôjde o čísla, slová, frázy alebo celé vety. Napríklad zreprodukovať

dvadsať osem číslic nie je možné, pretože to výrazne prekračuje kapacitu krátkodobej

28

V istom zmysle je tento článok aj pokusom o veľmi stručný náčrt modernej histórie skúmania

pamäti (najmä pokiaľ ide o kľúčové behaviorálne experimenty). 29

Gazzaniga, Ivry a Mangun (2002) v takom istom teste uvádzajú kapacitu ikonickej pamäti až

dvanásť položiek (symbolov). 30

K Millerovmu zákonu bolo urobených veľa aktualizácií, napríklad vo waleshčine, kde su

číslovky dlhšie, bol výsledok testu menší ako sedem plus mínus dva a naopak v mandarínskej

čínštine, kde sú číslovky kratšie, priemerný výsledok testu bol lepší.

Page 47: Kognitívna veda a umelá inteligencia

47

pamäti, ale, ak zistíme, že ide vlastne o sedem významných historických dátumov

(napríklad 1848, 1917, 1945 atď.), tak zreprodukovať tieto číslice nebude žiadny

problém.31

Oproti senzorickej pamäti je čas uchovania informácií v krátkodobej pamäti

dlhší. Hoci v literatúre sa uvádzajú rôzne čísla, platí zhoda, že ide o sekundy až minúty.

Meranie dlhodobej pamäti. Kapacita dlhodobej pamäti je takmer neobmedzená, viac

menej vždy k nej môžeme niečo pridať. Pokiaľ ide o jej trvanie, ide o hodiny, dni,

mesiace, často sa informácia uchová až do konca života.

Ako sme už vyššie naznačili prenos informácie z krátkodobej do dlhodobej pamäti sa

realizuje predovšetkým opakovaním a tréningom. V tomto smere je veľmi efektívne

používanie mnemotechnických pomôcok (na istej úrovni ich využívame všetci). Medzi

najzákladnejšie mnemotechnické pomôcky patrí: kategorizovanie, interaktívne predstavy,

akronymy (napríklad skratky ako BA, EU, USA a pod.), akrostichy (ako napríklad „Eva

hodila granát do atómovej elektrárne“ – začiatočné hlásky v každom slove uvedenej vety

pomenúvajú struny na gitare), dôležité sú aj napovedajúce slová (tieto slová hrajú veľmi

dôležitú úlohu v procesoch vybavovania informácie z dlhodobej pamäti).32

Na rozdiel od senzorickej a krátkodobej pamäti, meranie dlhodobej pamäti

(vzhľadom na to, že sa tu skúma uchovanie informácií v priebehu dlhých časových

úsekov) je na prvý pohľad oveľa náročnejšie a komplikovanejšie. Pri riešení tohto

problému prišiel kolektív autorov (Bahrick a Wittlinger, 1975) na originálny nápad,

využiť pri meraní dlhodobej pamäti stredoškolské tablá (resp. ročenky, v ktorých sú

publikované fotografie a mená absolventov). Použili metódu voľnej reprodukcie mien,

metódu rozpoznávania fotografií svojich bývalých spolužiakov, ďalej metódu

rozpoznávania mien a test priraďovania mien k fotografiám spolužiakov. Výskumu sa

zúčastnilo 392 bývalých stredoškolákov. Výsledky sú veľmi zaujímavé. Participanti po

34 rokoch dosahovali 90% presnosť v rozpoznávaní tvárí a mien, 80% presnosť

v rozpoznávaní mien po 48 rokoch, 40% presnosť v rozpoznávaní tvárí po 48 rokoch,

60% presnosť vo voľnej reprodukcii mien po 15 rokoch a 30% presnosť vo voľnej

reprodukcii mien po 30 rokoch.33

Aj tieto, hoci len veľmi ilustratívne načrtnuté výsledky dostatočne svedčia o vplyve

a dôležitosti klasického modelu na orientáciu experimentálneho výskumu v oblasti

pamäti. No napriek tomu, že klasický trojzložkový model je v literatúre stále najčastejšie

spomínaným modelom, dnes sa považuje už za prekonaný. Jeden z najvýraznejších

kritikov tohto modelu je A. D. Baddeley. Tento autor vyšiel z kritiky chápania

krátkodobej pamäti v klasickom modeli. Podľa neho 1. krátkodobá pamäť nie je

monolitným celkom (ako to viac menej predstavuje klasický model), ale je bohato

štruktúrovaná a 2. úlohou krátkodobej pamäti nie je len držanie informácií na istý

31

Boli urobené aj výskumy, v ktorých sa zistilo, že ak predmetom testu sú zhlukovania, počet

zapamätaných položiek je menší než sedem plus mínus dva. 32

Z mnohých súčasných empirických výskumov pamäti vyplýva, že okrem opakovania je rovnako

dôležitým faktorom aj úroveň spracovania informácií, čím je hlbšie tým sú lepšie výsledky

v pamäťových testoch. 33

Výsledky experimentu ukazujú, že najmä rozpoznávanie mien a tvárí je veľmi dobré aj po

mnohých desaťročiach.

Page 48: Kognitívna veda a umelá inteligencia

48

obmedzený čas, ale aj aktívne manipulovanie a spracovanie informácií (či už prichádzajú

zo zmyslových receptorov alebo dlhodobej pamäti).

Svoje predstavy Baddeley a Hitch (1974) vyjadrili vo vlastnom modeli pracovnej

pamäti. Pozoruhodné na tomto modeli je, že hoci sa spočiatku javil, iba ako komplement

klasického modelu, postupne sa stal jeho najvplyvnejšou alternatívou. Pozrime sa

detailnejšie na tento model.

3.2.2 Mnohozložkový model pracovnej pamäti

Informácie, ktoré sú obsiahnuté v pracovnej pamäti sú bezprostredne, veľmi rýchlo

k dispozícii. Môžeme to povedať aj tak, že všetko to, čo pociťujeme ako prítomnosť sa

odohráva na úrovni pracovnej pamäti. Podľa Baddeleyho-Hitchovho modelu pracovná

pamäť pozostáva z fonologickej slučky (phonological loop), vizuálno-priestorového

„náčrtníka“ (spatio-visual sketchpad) a centrálnej exekutívy. Ako uvidíme ďalej, tieto

hlavné časti sú štruktúrované ešte na ďalšie podčasti.

Fonologická slučka je teoretický konštrukt na vysvetlenie uchovania a spracovania

verbálnych informácií a skladá sa z dvoch častí: (1) fonologického úložiska (phonological

store) – ide o akýsi sklad verbálnej informácie (to je to, čo počujeme „vnútorným

uchom“) a (2) artikulačného opakovania (articulatory rehearsal) – ide o aktívny proces

upevňovania a udržania informácií v pracovnej pamäti (to je to, čo si opakujeme

„vnútorným hlasom“). Teda celý proces krátkodobého uchovania verbálnej informácie by

sme mohli vyjadriť takto: Najprv verbálnu informáciu počujeme vnútorným uchom,

potom ju opakujeme (artikulujeme) vnútorným hlasom a znovu počujeme vnútorným

uchom a opakujeme vnútorným hlasom, a tak až dovtedy, dokedy potrebujeme udržať

informáciu vo fonologickom sklade (preto ten názov fonologická slučka). Bez

fonologickej slučky sa akustická informácia rozpadne, vyhasne do dvoch sekúnd.

Baddeley venoval fonologickej slučke veľmi veľa pozornosti a určite patrí v jeho

modeli medzi experimentálne najdetailnejšie rozpracované časti. Na empirické potvrdenie

jej fungovania Baddley využíva mnohé dnes už klasické experimenty (niektoré vyvinul

sám spolu so svojimi spolupracovníkmi, niektoré sú modifikáciami experimentov iných

odborníkov). Medzi najznámejšie patrí testovanie tzv. efektu fonologickej podobnosti,

efektu irelevantnej reči a efektu dĺžky slova.

Pokiaľ ide o efekt fonologickej podobnosti a dôležitosť akustického spracovania

informácií v tomto smere Baddeley nadväzuje na R. Conrada (1964), ktorý vo svojich

experimentoch pokusným osobám v pamäťovom teste vizuálne prezentoval šestice

písmen, jedno písmeno za 0,75 s. Pri analýze chýb pri opakovaní šestíc s prekvapením

zistil, že najčastejšie dochádza k chybám pri písmenách, ktoré sa nie vizuálne, akoby sme

očakávali, ale zvukovo podobajú.34

R. Conrad tu objavil fungovanie akéhosi translátora

informácií prezentovaných vo vizuálnom kóde do verbálneho kódu. V každom prípade,

výsledky týchto experimentov svedčia o veľkej dôležitosti zvukového kódovania

34

Conrad pracoval so zvukovo podobnými spoluhláskami (za také považoval spoluhlásky ako sú

D B C T P G) a so zvukovo nepodobnými (ako sú napríklad K F Y L R Q).

Page 49: Kognitívna veda a umelá inteligencia

49

v pracovnej pamäti.35

V mnohokrát opakovaných testoch sa potvrdilo, že opakovanie

zoznamu zvukovo nepodobných spoluhlások má vyššiu úspešnosť než opakovanie

zoznamu podobných spoluhlások.

Neskoršie Baddeley uplatnil túto techniku aj na podobné a nepodobné slová a prišiel

tiež k zaujímavým výsledkom. Fonologicky podobné slová (napríklad man, cat, cap, map,

can) mali pri reprodukovaní len 10%-nú úspešnosť, nepodobné slova (napríklad pit, day,

cow, pen, sup) boli reprodukované až s 80%-nou úspešnosťou. Ale je zaujímavé, že

v porovnaní s tým, úspešnosť reprodukovania sématicky podobných slov (napríklad

large, great, huge, long, big) bola 65% a sémanticky nepodobných slov (napríklad old,

wet, strong, thin, deep) 75%, teda nešlo o nejaký dramatický rozdiel (Baddeley 1986, s.

76).

Na testovanie (resp. pre empirickú evidenciu) fonologickej slučky sa často používajú

rôzne techniky, pomocou ktorých dokážeme jej fungovanie narušiť a potlačiť (ide o tzv.

articulate suppression). Mnohé z týchto potlačovacích techník sú spojené s využitím

efektu irelevantnej reči. V tomto smere jeden z najznámejších postupov je, že pri

prezentovaní (v niektorých variantoch aj pri opakovaní) vizuálneho materiálu (číslic,

písmen, slov a pod.), pokusná osoba musí neustále počítať napríklad do štyroch (resp.

bude opakovať nejaké iné neutrálne slová), to do značnej miery zhorší vytváranie

fonologického záznamu vizuálne prezentovaného stimulu a tým zhorší aj výsledky v

danom pamäťovom teste. Najjednoduchšou verziou testovania efektu irelevantnej reči je,

keď pokusná osoba pri prezentácii položiek počuje v pozadí nejakú reč. Aj v tomto

prípade je fungovanie fonologickej slučky zaťažené konkurenčnou verbálnou

prezentáciou (hovorenou rečou v pozadí), čím sa významne zníži výkon v pamäťovom

teste (dokonca bez ohľadu na to, či danej reči v pozadí rozumieme alebo nie).

Medzi faktory, ktoré potvrdzujú fonologickú slučku patrí aj efekt dĺžky slov.

Fonologická slučka má obmedzenú kapacitu, a preto je samozrejme, že kapacita krátkych

slov v pracovnej pamäti je väčšia než kapacita dlhých slov. Dôležitú úlohu tu však hrá

nielen počet slabík (resp. foném), ale či ide o slabiky krátke alebo dlhé, jednoducho

koľko času zaberie výslovnosť (artikulácia) daného slova.36

Položky, ktorých artikulácia

bude trvať dlhšie budú sa ťažšie reprodukovať v pamäťovom teste.37

Dlhé slová sa dlhšie

vyslovujú a viac zaťažujú artikulačné opakovanie. To znamená, že je aj väčšia

pravdepodobnosť, že sa nedostanú alebo vypadnú z fonologického slovníka.38

Na záver tejto časti by sme ešte chceli poznamenať, že z evolučno-psychologického

hľadiska fonologická slučka iste nevznikla preto, aby sme si vedeli zapamätať PIN kód.

Určite však súvisí s chápaním a tvorbou reči a je nepostrádateľná pri učení sa jazyka (či

35

Nakoniec pripomeňte si ako si spomínate na PIN kód, keď idete platiť kartou v supermarkete,

vidíte ho na mentálnej obrazovke, alebo si ho poviete vnútorným hlasom? 36

Dokonca platí, že subjekty, ktoré dokážu rýchlejšie opakovať položky majú väčšiu kapacitu

pracovnej pamäti. 37

Dlhé dvojslabičné slová harpoon a woodoo viac zaťažia kapacitu fonologickej slučky, než

krátke dvojslabičné slová bishop alebo power. 38

V experimentoch súvisiacich s efektom dĺžky slov sa obyčajne testovanie dlhých a krátkych slov

kombinuje aj s testovaním iných efektov vzťahujúcich sa k fonologickej slučke a potom položky

tu môžu byť číslice, podobné a nepodobné spoluhlásky, krátke a dlhé slová a pod.

Page 50: Kognitívna veda a umelá inteligencia

50

už materinského alebo pri učení sa cudzieho jazyka). Dokonca môžeme povedať, že

fonologická slučka je zariadenie pre učenie sa jazyka (learning language device).39

Vizuálno-priestorový náčrtník (visuospatial sketchpad).

O fungovaní tejto časti

pracovnej pamäti sa môžeme ľahko presvedčiť napríklad pri hľadaní odpovede na takú

úsmevnú otázku či má zajac fúzy? Pravdepodobne odpoveď nájdete tak, že si premietnete

zajaca na „mentálnej“ obrazovke, alebo v Baddeleyho terminológii vo vizuálno-

priestorovom náčrtníku.

Vizuálno-priestorový náčrtník má dve základné funkcie: (1) spracováva informácie

o lokalizácií objektov v priestore; (2) spracováva informácie o objektoch (resp. o ich

vizuálnych znakoch) (Baddeley 2003). Existuje množstvo rôznych behaviorálnych

a klinických potvrdení pre vyčlenenie uvedených komponentov. Tu treba poznamenať, že

vizuálnu pamäť možno skúmať len v tesnom prepojení s vizuálnou pozornosťou

a vizuálnou percepciou. Tieto oblasti sú relatívne dobre preskúmané a mnohé

experimenty v tejto oblasti poskytujú zaujímavé informácie aj o pamäťovom systéme.40

Jednotlivé funkcie ukladania a spracovania čisto vizuálnych informácií môžeme

merať príslušnými testami. Schopnosť vizuálnej priestorovej pamäti (spatial span)

meriame tzv. Corsiho testom (Corsi block tapping test). Experimentátor postupne

umiestňuje kocky na stole a úlohou pokusnej osoby je potom imitovať tento postup.

Experiment začína s malým počtom kociek a končí, keď už pokusná osoba nie je schopná

s narastajúcim počtom kociek imitovať experimentátora (celkový počet kociek je 9).

Typický výsledok je okolo 5 kociek.41

Je to o dve položky menej než je pri reprodukovaní

číslic (digit span) v pamäťovom teste (Baddeley, 2007).42

Vizuálne vnímame objekty ako určité štruktúry znakov. Špeciálnym testom vieme

odmerať schopnosť (kapacitu) ukladania a spracovania vizuálnych znakov objektu (tzv.

pattern span). V tomto teste sa používa biela šachovnica, na ktorej experimentátor

vyčierni niektoré polia (vyplnených je vždy 50%), vyplnené políčka potom vymaže

a úlohou pokusnej osoby je znovu zopakovať, ktoré políčka boli vyplnené. Test sa začína

so šachovnicou so štyrmi poličkami, postupne sa šachovnica zväčšuje až pokiaľ pokusná

osoba už nedokáže zopakovať vzor vyplnených políčok. Typický výsledok je okolo 16

políčiek.

Základný rozdiel medzi týmito dvoma funkciami vizuálno-priestorového náčrtníka je,

že v jednom prípade je dôraz na kde a v druhom prípade na čo je zapamätané (Baddeley,

2007). 43

Centrálna exekutíva. Podľa Baddeleyho ide o najdôležitejšiu časť pracovnej pamäti,

hoci stále najmenej pochopenú. Vyčlenenie tejto časti pracovnej pamäti je jedna

z hlavných odlišností od klasického modelu. Tento model pamäti počíta s aktívnym

39

Kapacita fonologickej slučky je dobrým prediktorom úspešnosti učenia sa druhého jazyka. 40

Baddeley sa dokáže pozrieť na ne z hľadiska ich využiteľnosti pri skúmaní pracovnej pamäti. 41

Samozrejme, že v súčasnosti sa používajú počítačové verzie týchto testov. 42

Tu by sme chceli uviesť, že v Corsiho teste metóda potlačenia artikulácie nemá žiaden vplyv na

výkon, pri meraní počtu zapamätaných číslic však výsledky výrazne zhoršuje. Aj to svedčí

o tom, že delenie pracovnej pamäti na verbálnu a vizuálnu má svoje opodstatnenie. 43

Ľudia s lepšou schopnosťou držať a manipulovať vizuálno-priestorové reprezentácie majú dobré

predpoklady pre pôsobenie v takých oblastiach ako je architektúra a inžinierske disciplíny.

Page 51: Kognitívna veda a umelá inteligencia

51

spracovaním informácií už na úrovni krátkodobej pamäti. Nejde len o pasívne ukladanie

informácie ako je to v klasickom modeli. Centrálna exekutíva je to, čo (1) usudzuje,

chápe, zhlukuje, transformuje informácie; (2) určuje, ktoré informácie budú uložené do

zásobníkov; (3) určuje či je vybraný fonologický alebo vizuálny zásobník; (4) integruje a

koordinuje informácie z obidvoch zásobníkov.

Centrálna exekutíva je spojená s prácou pozornostného systému a jeho fungovanie

významne ovplyvňuje rozhodovanie o tom, ktoré informácie a ako sa budú ďalej

spracovávať. O dôležitosti centrálnej exekutívy hovorí aj skutočnosť, že oslabenie

funkcie centrálnej exekutívy (resp. oslabenie niektorých funkcií pozornosti, napríklad

delenia pozornosti) je jeden z príznakov Alzheimerovej choroby (Baddeley, 2007).

Epizodický zásobník (buffer). Postupne sa ukázalo, že len vizuálnym a fonologickým

zásobníkom je ťažko vysvetliť zaznamenávanie a spracovanie komplexnejších informácií.

Vzhľadom na to Baddeley zaviedol ešte jeden špeciálny zásobník, v ktorom sa spájajú

(skladajú) informácie z pomocných podsystémov pracovnej pamäti (vizuálne informácie

a fonologické informácie) s informáciami z dlhodobej pamäti do jednotnej epizodickej

reprezentácie (Baddeley, 2000).

3.2.3 Neurálne koreláty pracovnej pamäti

Pri hľadaní, ktoré štruktúry mozgu majú priamu súvislosť s pamäťou, historicky

významnú úlohu zohral prípad H. M. Išlo o ťažkého epileptika, záchvaty sa mu objavili

po úraze v detstve, s pribúdajúcimi rokmi frekvencia záchvatov neustále stúpala, preto sa

pacient rozhodol pre operáciu a odstránenie epicentra záchvatov. Operácia sa uskutočnila,

keď mal 27 rokov. Odstránili mu hipokampus, amygdalu a ďalšie časti mediálnych

spánkových lalokov. Operačný zákrok splnil svoj cieľ. Epileptické záchvaty sa podarilo

dostať pod kontrolu, ale bolo jasné, že zákrok priniesol aj nepríjemné a neočakávané

výsledky. Pacient vykazoval znaky silného poškodenia pamäti. Po zákroku stratil

schopnosť zapamätať si nové fakty a epizódy (deklaratívna pamäť), bol akoby zmrazený

v čase. To sú všetko symptómy ťažkej anterográdnej amnézie.44

Avšak zdá sa, že krátkodobá pracovná pamäť chirurgickým zásahom v spánkových

lalokoch neutrpela vôbec. Pacient H. M. vie zopakovať zoznam slov v pamäťovom teste,

pretože neurálne koreláty pracovnej pamäti sú umiestnené v iných častiach mozgu,

dominantne v čelových lalokoch a tie ostali neporušené.

Dnes už nie sme odkázaní len na skúmanie dôsledkov chirurgických zásahov do

štruktúr mozgu (na skúmanie patológie mozgu), v súčasnosti máme k dispozícií veľmi

efektívne zobrazovacie metódy skúmania aktívneho zdravého mozgu. Máme na mysli

predovšetkým pozitrónovo emisnú tomografiu (PET) a funkčne magnetickú rezonanciu

(fMRI). Pomocou týchto metód sú relatívne presne zmapované neurálne koreláty funkcií

pracovnej pamäti. Tieto metódy podrobnejšie približuje kapitola 2.

44

Ostal mu jazyk, včítane slovníka a predtým získanej sémantickej pamäti. Vykazoval aj určité

znaky retrográdnej amnézie. Mal ťažkosti si spomenúť na udalosti z posledných 11 rokov pred

operáciou. Avšak niektoré udalosti z detstva si pamätal veľmi detailne. Tiež nerobilo mu

problémy učiť sa novým zručnostiam, zvykom, jednoduchému podmieňovaniu a ďalším formám

implicitného nedeklaratívneho učenia (Smith a Kosslyn, 2007).

Page 52: Kognitívna veda a umelá inteligencia

52

Keďže pracovná pamäť je bohato štruktúrovaná a má rôzne funkcie, jej neurálne

koreláty nachádzame v rôznych častiach mozgu. Fonologická slučka súvisí predovšetkým

s bilaterálnou aktiváciou čelových a temenných lalokov. Pokiaľ ide o vizuálno-

priestorový náčrtník, ak je dĺžka držania mentálnych obrazov veľmi krátka, aktivujú sa

oblasti záhlavných lalokov a pravej časti čelového laloka. Dlhšie časové intervaly

aktivujú záhlavné a ľavú časť čelového laloka. Funkcie centrálnej exekutívy súvisia

zväčša s čelovými lalokmi. Funkcie epizodického zásobníka súvisia najmä s čelovými

lalokmi a niektorými časťami spánkových lalokov (Smith a Kosslyn, 2007).

3.3 Na záver

Hoci od prvého publikovania Baddeleyho-Hitchovho modelu pracovnej pamäti prešlo

niekoľko desaťročí, model je stále inšpiratívny z teoretického i experimentálneho

hľadiska. Ide o model potvrdený množstvom empirického experimentálneho materiálu.

Na začiatku Baddeleyho záujmu o pracovnú pamäť sa mohlo zdať (a možno to aj tak

skutočne bolo), že mu ide len o čiastkový problém – krátkodobú pracovnú pamäť

(jednoducho parciálne vylepšenie klasického modelu). Postupne sa však ukázalo, že v hre

je oveľa viac. Baddeley rozvíjaním svojho kľúčového teoretického konštruktu pracovnej

pamäti, vybudoval alternatívny model pamäti. Diametrálny rozdiel medzi klasickým

modelom a jeho modelom je v tom, že pamäťový systém nechápe iba ako pasívne

ukladanie informácií do senzorického, krátkodobého a dlhodobého zásobníka.

Baddeleyho model nie je len o toku informácií a ich pasívnom ukladaní, ale je skôr o

šírení aktivácie (aj aktívna časť dlhodobej pamäti je pracovná pamäť). V tom zmysle je

pre jeho model lepšie grafické vyjadrenie nie v blokoch, ale v sústredných kruhoch (v

prostriedku je senzorická pamäť, nad ňou je kruh krátkodobej a dlhodobej pamäti),

pričom aktivované môžu byť informácie aj zo všetkých kruhov naraz. V tom zmysle je

krátkodobá pamäť len malou časťou pracovnej pamäti. Zdá sa, že Baddeleyho model viac

zodpovedá reálnym pamäťovým procesom než klasický trojzložkový Atkinsonov-

Shiffrinov model.

Literatúra

Atkinson, R. C., Shiffrin, R. M. (1968): Human Memory: A proposed system and his

control processes. In: K. W. Spence, J. T. Spence (eds): The Psychology of Learning

and Motivation. Vol. 2 Advances in Research and Theory. New York: Academic

Press.

Atkinson, R. C., Shiffrin, R. M. (1971): The control of short-term memory. Scientific

American, 225, 82-95.

Baddeley, A. D., Hitch, G. J. (1974): Working memory. In: G. Bower (ed.): Advances in

learning and motivation, 8, 47-90, New York: Academic Press.

Baddeley, A. D. (2002): The concept of episodic memory. In: Baddeley, A. D., Aggleton,

J. P., Conway (ed.), Episodic memory: New directions in Research. Oxford: Oxford

University Press.

Page 53: Kognitívna veda a umelá inteligencia

53

Baddeley, A. D. (2000): The episodic buffer: a new component of working memory?

Trends in Cognitive Sciences, 4(11), 417-423.

Baddeley, A. D. (2003): Working memory: looking back and looking forward. Nature

Reviews Neuroscience, 4(10), 829-839.

Baddeley, A. D. (1986): Working memory. Oxford: Oxford University Press.

Baddeley, A. D. (2007): Working Memory, Thought, and Action. Oxford: Oxford

University Press.

Bahrick, H. P., Bahrick, P.O., & Wittlinger, R. P. (1975). Fifty years of memory for

names and faces: A cross-sectional approach. Journal of Experimental Psychology,

104(1), 54-75.

Block, J. R. (2002). Seeing Double. London: Routledge.

Block, J.R., Yuker H. E. (1989): Can You Believe Your Eyes? London: Brunner-

Routledge.

Conrad, R. (1964): Acoustic confusion in immediate memory. British Journal of

Psychology, 55, 75-84.

Francis, G., Neath, I., MacKewn, A., Goldthwaite, D. (2004): CogLab on CD. London:

Thomson Learning.

Gazzaniga, M. S., Ivry, R. B., Mangun, G. R. (2002): Cognitive neuroscience. The

biology of the mind. New York: W. W. Norton & Company.

Gigerenzer, G. (2005): I think, therefore I err. Social Research, 72 (1), 195-218.

Gopnik, A., Meltzoff, A. M., Kuhl P. K. (2001): The Scientist in the Cribe. New York:

William Morrow.

Gregory, R. L. (2004): Eye and Brain. The Psychology of Seeing (5. vyd.), Oxford

University Press.

Kremláček, J. (2006): Co prozradily optické iluze o našem zrakovém vnímání. In: Sborník

konferenčních příspěvku. Psychologický ústav, Akademie věd ČR.

Locker, J. L. (Ed.) (2000): The Magic of Escher. New York: Harry N. Abrams.

Locker, J. L. (Ed.) (1992): M. C. Escher. His Life and Complete Graphic Work. New

York: Harry N. Abrams.

Ninio, J. (2001): The Science of Illusions. Cornell University Press.

Penrose, L. S., Penrose, R. (1958): Impossible Objects: A special type of visual illusion.

Brit. J. Psychology 49, 31-33.

Seckel, A. (2006): Optical illusions. The Science of Visual Perception. New York: Firefly

Books.

Shepard, R. (1990): Mindslights. Original Visual Illusions, Ambiguities, and Other

Anomalies with aCcommentary on the Play of Mind in Perception and Art. New

York: W. H. Freeman and company.

Smith, E. E., Kosslyn, S. M. (2007): Cognitive Psychology: Mind and Brain. New Jersey:

Pearson Education.

Sperling, G. (1960): The information available in brief visual representations.

Psychological Monographs: General and Applied, 74, 1-28.

Šikl, R., Šimeček, M. (2010): Jak a proč vznikaji zrakové klamy? V knihe Kvasnička, V.

a spol. (zost.), Umelá inteligencia a kognitívna veda II. Bratislava: STU, 467-522.

Page 54: Kognitívna veda a umelá inteligencia

54

Kapitola 4

Reprezentácia významov v živých a umelých

systémoch

MARTIN TAKÁČ

4.1 Úvod

Schopnosť rozumieť – pripisovať význam – je kľúčovým aspektom kognície. V tejto

kapitole sa zameriame na teóriu významov a možné formy reprezentácie znalostí

a významov v živočíšnej ríši, u ľudí, ale aj v umelých systémoch.45

Významy sa obvykle

spájajú s jazykom. Porozumením jazyku sa myslí priradenie významov jednotlivým

prvkom jazyka – slovám, frázam či vetám. V tomto zmysle sa ich štúdiom zaoberá

lingvistika (jazykoveda). V rámci lingvistiky rozlišujeme syntax – náuku o pravidlách

skladania jednoduchých prvkov jazyka do komplexnejších štruktúr a o ich vzájomných

vzťahoch, sémantiku - náuku o význame jednotlivých prvkov a pragmatiku, ktorá študuje

ako sa jazyk prakticky používa a ako je interpretovaný v konkrétnych okolnostiach.

Okrem lingvistiky sa s teóriami významu môžeme stretnúť ešte v semiotike, ktorá

rozširuje poňatie pripisovania významu akémukoľvek systému znakov, nie iba jazyku

(zloženého zo slov a viet). Klasifikácii typov sémantických teórií bude venovaná časť

4.2.1. V časti 4.2.2 sa budeme podrobnejšie venovať tzv. kognitívnym sémantikám

a v časti 4.2.3 semiotickému prístupu k významu. Centrálnou tézou tejto kapitoly je, že

významy môžu existovať nezávisle od jazyka a že okrem porozumenia jazyku existuje

porozumenie situácii, udalosti. Takéto rozšírené poňatie nám umožní analyzovať

významy aj u živočíchov, ktoré nedisponujú jazykom (časť 4.3). V časti 4.4 uvedieme

prehľad niektorých teórií významu u ľudí a v časti 4.5 sa budeme venovať problematike

reprezentácie významu v umelých systémoch. Na záver zhrnieme najdôležitejšie tézy

načrtnutého prístupu k významom a pokúsime sa odpovedať na niektoré výhrady voči

nemu.

4.2 Teória významu

4.2.1 Klasifikácia typov sémantík

Základné delenie sémantických teórií vznikne podľa toho, čo považujú za význam,

konkrétne či existujú nejaké entity – materiálne, mentálne, ideálne atď., ktoré tvoria

významy jazykových výrazov. Sémantické teórie, ktoré na túto otázku odpovedajú

kladne, sú denotačné; tie, čo odpovedajú záporne, nazveme nedenotačné. Príkladom

nedenotačného prístupu je funkcionalistická sémantika, ktorej základy položil

45

V tejto kapitole sú použité fragmenty textov Takáč (2006, 2009).

Page 55: Kognitívna veda a umelá inteligencia

55

Wittgenstein. Podľa (neskorého) Wittgensteina (1953), významom slov nie je referencia

na objekty alebo veci označené vo vonkajšom svete, ani žiadne idey či mentálne

reprezentácie s nimi asociované, ale spôsob ich používania v komunikácii. Jazyková

výpoveď je v prvom rade aktom v reálnom svete, význam je preto viac vecou pragmatiky

ako sémantiky. Wittgenstein prirovnáva použitie jazykového výrazu k ťahu v hre podľa

nejakých pravidiel.

V denotačných sémantikách sú jazykovými významami nejaké objekty. Podľa

názoru na povahu týchto objektov môžeme rozlíšiť realistické a kognitivistické (alebo

konceptualistické) prístupy. Podľa realistického prístupu sú významami entity „vo

vonkajšom svete“ (porovnaj obr. 2a). Podľa kognitivistického prístupu sú významy

mentálne entity „v hlave“ (obr. 2b).

V extenzionálnych realistických sémantikách, napríklad Tarski (1933), sa význam

definuje vzťahom k objektom vo svete, alebo formálnejšie k modelovej štruktúre M.

Prvky jazyka sa zobrazia na konkrétne objekty – prvky M, predikáty sa zobrazia na

množiny objektov resp. relácie v M. Pomocou kompozície sa vety zobrazia na

pravdivostné hodnoty. Pokusom o nápravu niektorých nedostatkov extenzionálnej

sémantiky bol návrh tzv. intenzionálnej sémantiky (Carnap, 1947/1956; Kripke, 1959;

Montague, 1974), v ktorej sa prvky jazyka zobrazujú na zobrazenia z možných svetov na

množiny objektov a relácií.

4.2.2 Kognitívna sémantika

V oboch sémantikách – extenzionálnej aj intenzionálnej sa významy pokladajú za niečo

objektívne existujúce nezávisle od pochopenia jednotlivých používateľov. Tento prístup

môžeme označiť ako objektivistický a je blízky paradigme klasického kognitivizmu resp.

funkcionalizmu v kognitívnej vede (Putnam, 1967; Pfeifer a Scheier, 1999, kap. 2; pozri

aj kap. 1 tohto zborníka).

Objektivizmus je paradigma charakterizovaná nasledujúcimi názormi: Myslenie je

nezávislé od tela, spočíva v mechanickej manipulácii s abstraktnými symbolmi a funguje

v zásade podobne ako počítačové algoritmy. Symboly (napríklad slová a mentálne

reprezentácie) získavajú svoj význam prostredníctvom korešpondencie so skutočným

svetom, sú objektívne konštruované a teda nezávisia od porozumenia a špecifických

vlastností určitého organizmu – nemajú naň vplyv obmedzenia ľudského tela, vnímania a

nervového systému. Adekvátnym nástrojom modelovania myslenia sú matematicko-

logické systémy definované všeobecnými pravidlami manipulácie so symbolmi spolu s

mechanizmami interpretácie symbolov zobrazeniami do „skutočného sveta“. Kritikom

objektivizmu je George Lakoff, ktorý položil základy nového tzv. experienciálneho

prístupu a kognitívnej sémantiky. Vo svojej knihe Lakoff (1987) argumentuje najmä

výskumami kategorizácie, ktorých výsledky sú v rozpore s dvetisíc rokov starým

Aristotelovským pohľadom na kategórie používaným v objektivizme.

Podľa tohto pohľadu sú kategórie definované súborom vlastností spoločných pre

všetkých jej členov, sú teda objektívne dané, existujúce vo svete nezávisle od vlastností

pozorovateľa, ktorý kategorizáciu vykonáva (ten sa môže akurát mýliť, ak je jeho

pochopenie v nesúlade so „správnou“, objektívne danou kategorizáciou). Sú doslovným

odrazom skutočnosti, bez vplyvu imaginatívnych mechanizmov, ako metafora,

Page 56: Kognitívna veda a umelá inteligencia

56

metonýmia, obrazotvornosť. Klasická teória kategórií nevznikla na základe empirických

štúdií, ale ako apriórna filozofická špekulácia, ktorá sa v priebehu storočí stala súčasťou

západného myslenia a ponímania vedy, takže sa ani nepovažuje za teóriu, ale za

nespochybniteľný fakt. Lakoff proti nej argumentuje v prvom rade empiricky: ak sú

kategórie definované spoločnými vlastnosťami všetkých členov, nemali by existovať

členy, ktoré sú lepšími, reprezentatívnejšími príkladmi kategórie ako iné členy, čo je v

spore s výsledkami rozsiahlych empirických výskumov Eleanor Roschovej (1978),

autorky teórie prototypov, Brenta Berlina a Paula Kaya (1969), ktorí skúmali

medzikultúrne rozdiely vo vnímaní a pomenovávaní farebných kategórií, a mnohých

ďalších: Predovšetkým nie všetky členy kategórie musia mať spoločné vlastnosti, skôr sa

môžu asociačne reťaziť a vytvárať niečo ako rodinné podobnosti, ako ilustroval už

Wittgenstein na obsahu pojmu hra. Niektoré kategórie majú viac a menej centrálne členy,

teda nie všetky členy sú rovnako typickými príkladmi kategórie (napríklad vrabec je

typickejším vtákom ako pštros), iné kategórie ani nemajú pevné hranice, ale

odstupňovanú príslušnosť, napríklad vysoký muž. Uprostred taxonomickej hierarchie

kategórií (napríklad teriér – pes – zviera) existuje akási privilegovaná základná (bázová)

úroveň, ktorá sa vyznačuje celým radom psychologicky zaujímavých vlastností ako

gestaltové vnímanie, motorická interakcia, schopnosť vytvárania mentálnych obrazov,

ľahkosť učenia, zapamätávania a používania.

Väčšina našich vedomostí je organizovaná na základnej úrovni, pojmy základnej

úrovne najviac používajú dospelí pri interakcii s deťmi a deti si ich osvojujú ako prvé. Čo

je podstatné, základná úroveň závisí od vnímanej štruktúry častí a celku a od

skúsenostných motorických interakcií. Kategórie neexistujú v objektívnom svete

nezávisle od ľudí, ale sú stelesnené a okrem fyzických vlastností sveta sú spoluurčované

ľudskou biológiou, mysľou a kultúrnymi aspektmi. Napríklad to, že určité vlnové dĺžky

svetla kategorizujeme ako nejakú farbu, je čiastočne dané vlastnosťami neurofyziológie

videnia a čiastočne je záležitosťou kultúrneho úzu.

Alternatívou k objektivizmu je Lakoffov experiencializmus, podľa ktorého sú

významy ukotvené v skúsenosti fyzicky stelesnených bytostí a táto skúsenosť je bohato

štruktúrovaná ešte pred nástupom jazyka. Lakoffova kniha odštartovala celý nový

výskumný program v sémantike – kognitívnu sémantiku, ktorá nekladie významy do

vonkajšieho sveta. Gärdenfors (2000) charakterizuje kognitívnu sémantiku nasledovne:

1. Význam je konceptuálna štruktúra kognitívneho systému (nie podmienky pravdivosti

v možných svetoch).

2. Konceptuálne štruktúry sú stelesnené (význam nie je nezávislý od percepcie a

telesnej skúsenosti).

3. Sémantické elementy sa konštruujú z geometrických alebo topologických štruktúr

(nie zo symbolov skladaných na základe nejakého systému pravidiel).

4. Kognitívne modely sú predovšetkým obrazovo-schematické (nie propozičné).

Obrazové schémy sú transformované metaforickými a metonymickými operáciami.

5. Sémantika predchádza syntax a čiastočne ju determinuje (syntax nemožno opísať

úplne nezávisle od sémantiky).

Page 57: Kognitívna veda a umelá inteligencia

57

6. V kontraste s Aristotelovským poňatím kategórií založenom na nutných a

postačujúcich podmienkach, koncepty vykazujú prototypové efekty.

Konkrétna podoba konceptuálnych štruktúr, ktoré tvoria významy bola rozpracovaná vo

viacerých teóriách. Sú to obrazové schémy a idealizované kognitívne modely (Lakoff,

1987; pozri aj časť 4.4.1), geometrické a topologické štruktúry v konceptuálnych

priestoroch (Gärdenfors, 2000; pozri aj časť 4.4.2, štruktúry silovej dynamiky (Talmy,

2000), rámce (Fillmore, 1982), a mentálne priestory (Fauconnier, 1985). Vzťah

významov k jazyku, najmä ku gramatickým štruktúram bol rozpracovaný v prácach

(Langacker, 1987, 1991; Bergen a Chang, 2003; Feldman, 2006).

Etablovanie experiencializmu a kognitívnej sémantiky malo aj závažné praktické

dôsledky pre metodológiu kognitívnej vedy, umelú inteligenciu a lingvistiku. Myslenie

nemožno redukovať na manipulovanie s abstraktnými symbolmi, a teda metafora mysle

ako algoritmu nie je presná. Kognitívna veda nemôže abstrahovať od emócií,

neurobiologických a kultúrnych faktorov, ako to navrhoval Gardner (1985). V umelej

inteligencii nastal posun od GOFAI (good old-fashioned artificial intelligence) s prevažne

propozičnými systémami k stelesneným (embodied) a v prostredí vnoreným (embedded)

subsymbolovým architektúram na báze konekcionizmu – umelých neurónových sietí (viď

kap. 1 tohto zborníka). Klasický kognitivizmus vytláča paradigma stelesnenosti

(embodiment) či ukotvenej kognície (Pecher a Zwaan, 2005; Gibbs, 2006; Barsalou,

2008).

4.2.3 Semiotický prístup k významom

Ďalší inšpiratívny prístup k významom, ktorý chceme na tomto mieste spomenúť,

pochádza zo semiotiky. Podľa semiotických teórií vytvárame význam tvorbou

a interpretáciou znakov. Znaky môžu mať podobu slov, obrázkov, zvukov, aktov, či

objektov, ale stávajú sa znakmi len ak im pripíšeme nejaký význam. „Nič nie je znakom,

pokým to nie je interpretované ako znak“ (Peirce, 1931-58). A tiež, čokoľvek môže byť

znakom, ak to niekto interpretuje ako označujúce niečo, teda odkazujúce na niečo alebo

zastupujúce niečo iné ako samo seba (Chandler, 2002). Peirce (1931-58) definuje znak

ako triádu – tri časti poprepájané reláciami:

reprezentámen je forma, ktorú znak nadobúda,

interpretant je zmysel, ktorý má znak pre nejakého interpetátora,

objekt je to, na čo znak odkazuje.

Triadické poňatie znaku sa niekedy označuje ako semiotický trojuholník (obr. 1). (Odteraz

budeme namiesto pôvodnej terminológie reprezentámen, interpretant, objekt používať

zaužívanejšie označenia signál, význam, referent.) Príkladom signálu je slovo „stolička“,

referentom je nejaká stolička (teda nie množina všetkých stoličiek na svete, ako by to

bolo v extenzionálnej sémantike, ale napríklad stolička nachádzajúca sa v momentálnom

situačnom kontexte) a významom je mentálna reprezentácia vytvorená konkrétnou

osobou, ktorá interpretuje tento znak.

Page 58: Kognitívna veda a umelá inteligencia

58

Obrázok 1. Semiotický trojuholník. Obrázok je prebratý z Takáč (2009).

Je dôležité zdôrazniť, že znak v Peirceovom poňatí nie je absolútna alebo

ontologická vlastnosť veci, ale je to relačná situovaná interpretatívna rola, ktorú vec

nadobúda v konkrétnom kontexte. Čo je pre jedného pozorovateľa znakom, môže byť pre

iného len zbytočným alebo nevnímateľným šumom, v závislosti od pozorovateľovho

stelesnenia (embodiment), spoločnosti a interakčnej histórie. Takýto pohľad má blízko

k enaktívnemu prístupu v kognitívnej vede (Stewart, Gapenne, a Di Paolo, 2011).

Enaktívny prístup je asi najsilnejšie vyjadrený v dynamickej kognitívnej paradigme

(Gelder 1999; Tschacher a Dauwalder, 1999; Ward, 2001), ktorá nahliada na kogníciu

ako na komplexný dynamický systém (resp. viacero spriahnutých dynamických

systémov) a „zdôrazňuje časový rozmer kognície a emergenciu samoorganizovaných

vzorcov správania jedinca ako stabilných stavov v interakciách mozgu, tela a prostredia”

(Gibbs, 2006). Takáto perspektíva ide naprieč hranicami medzi mozgom, telom a svetom.

Niektoré dynamické modely celkom odmietajú reprezentácie, iné ich považujú za

dynamické entity (napríklad momentálne stavy systému, trajektórie či atraktory a ich

spádové oblasti). „Reprezentácie sú dočasné, kontextovo závislé stability uprostred

zmeny a nie statické, nemenné a na kontexte nezávislé jednotky” (Gelder 1999). Takýto

prístup teda presahuje kognitívnu sémantiku, pretože významy už nie sú iba „v hlave“

(obr. 2b), ale situačne vznikajú v procese signifikácie ako celá triáda (obr. 2d).

Obrázok 2. Interpretácia neúplných verzií semiotického trojuholníka „význam (V) – signál (S) –

referent (R)”. (a) Realistická sémantika umiestňuje významy do sveta. (b) V kognitívnej sémantike

sú lexikálnymi významami interné reprezentácie. Bez vzťahu k svetu by však takáto sémantika

trpela problémom ukotvenia symbolov (Harnad, 1990; pozri aj časť 4.5). (c) Predverbálne

konceptualizácie sveta môžu predchádzať jazyk. (d) V paradigme dynamických systémov vzniká

význam ako atraktor triadických interakcií. Obrázok je prebratý z Takáč (2009).

Interpretant

(Význam, Zmysel)

Objekt

(Referent)

Reprezentámen (Signál, Forma)

Znak

R

S

Jazyk

Svet

(a)

V

S

Jazyk

Konceptuálny

systém

(b)

V R

Svet Konceptuálny

systém

(c)

V R

S

Jazyk

Svet Konceptuálny

systém

(d)

Page 59: Kognitívna veda a umelá inteligencia

59

4.3 Významy v živočíšnej ríši

V tomto texte sme viackrát pertraktovali myšlienku, že možno rozumieť, resp. pripisovať

význam, priamo situáciám a udalostiam, bez vzťahu k jazyku či komunikácii. Takéto

poňatie významu umožňuje sledovať a analyzovať významy v živočíšnej ríši aj

u organizmov, ktoré nedisponujú jazykom. Pokúsime sa o to v tejto časti.

U organizmov nedisponujúcim jazykom budeme vychádzať z ich správania.

Vhodným teoretickým konštruktom na analýzu správania je pojem reprezentácie.

Gärdenfors (1996a) charakterizuje reprezentáciu ako niečo, čo pridáva informáciu

k senzorickému vstupu získanému psychofyzickou transdukciou. Vo svojej práci

analyzuje rôzne typy reprezentácií a ich poradie nutné pre evolúciu jazyka. Rozlišuje dva

typy reprezentácie: vyvolanú (cued) a oddelenú (detached). Vyvolaná reprezentácia je

vždy spustená nejakým externým stimulom prítomným v aktuálnej situácii organizmu.

Organizmus, ktorý diferencovane reaguje na rôzne stavy svojho prostredia (napríklad

konzumuje objekty rozpoznané ako potravu a vyhýba sa objektom rozpoznaným ako

predátori) vykonáva (prinajmenšom implicitnú) kategorizáciu – hovoríme, že disponuje

vyvolanými reprezentáciami príslušných kategórií. Vyvolanie reprezentácií spočíva

v tom, že sú vždy aktivované len v prítomnosti svojich referentov. Vyvolané

reprezentácie sú deskripčno-vysvetľujúcim konštruktom pre vrodené vôľou

neovplyvniteľné diferencované behaviorálne reakcie, ktoré majú fylogenetický pôvod.

Dôležitým mechanizmom, ktorý rozširuje limitované pamäťové možnosti

organizmov, je ukladanie externalizovaných pamäťových značiek do prostredia.

Príkladom sú pachové stopy, ktoré pomáhajú zvieratám v orientácii, či u ľudí notoricky

známy uzlík na vreckovke (a napokon vynález kníh a iných záznamových médií, ktoré

výrazne akcelerovali ľudskú kultúru). Externalizovaná značka uložená do prostredia

neskôr aktivuje príslušnú vyvolanú reprezentáciu.

Oddelená reprezentácia môže zastupovať objekty či udalosti, ktoré nie sú aktuálne

prítomné ani nesúvisia so súčasnou situáciou v prostredí. Napríklad šimpanz, ktorý chce

dočiahnuť banán a odíde preto hľadať dlhý konár, musí disponovať oddelenou

reprezentáciou konára aj možnosti jeho použitia. Predpokladá sa, že oddelené

reprezentácie sa vo fylogenéze objavujú približne s vývojom neokortexu (Gärdenfors,

1996b); v ontogenéze korešpondujú s vytvorením stálosti predmetu (Piaget a Inhelder,

1966).

Disponovanie oddelenými reprezentáciami je nutnou podmienkou pre vyššie

kognitívne funkcie ako plánovanie, klamanie, sebauvedomenie a jazyková komunikácia

(Gärdenfors, 1996a). Plánovanie predpokladá schopnosť organizmu „mentálne” (t.j.

pomocou oddelených reprezentácií) vyhodnotiť dôsledky rôznych behaviorálnych

scenárov a zvoliť postupnosť akcií, ktorá najviac vyhovuje aktuálnym cieľom. Dobré

plánovanie by tiež malo zvažovať dôsledky akcií iných agentov. Predstieranie, resp.

klamanie predpokladá schopnosť reprezentovať iné agenty aj s ich vlastnými

reprezentáciami, zámermi, plánmi atď., teda akúsi „teóriu mysle“. Klamár musí taktiež

disponovať reprezentáciou toho, ako ho budú vnímať klamané agenty. Týmto vnoreným

spôsobom vlastne disponuje (meta)reprezentáciou samého seba, čo je nutným

prekurzorom sebauvedomenia (Gärdenfors, 1996a).

Page 60: Kognitívna veda a umelá inteligencia

60

Za jednu z najvyšších kognitívnych schopností sa považuje jazyková kompetencia.

Jazyk je symbolový znakový systém, ktorý umožňuje externalizáciu a komunikáciu

oddelených reprezentácií. Práve oddelenosť reprezentácií umožňuje vyjadriť významy

prekračujúce aktuálne „tu a teraz“, dokonca aj významy, ktorých referenty v reálnom

svete neexistujú (napríklad ježibaba, či trojuholník s troma pravými uhlami). Podľa

Gärdenforsa bola najsilnejším evolučným impulzom pre vznik jazyka potreba

spoločenstva koordinovať sa pri spoločnom dosahovaní budúcich cieľov (Gärdenfors,

2004).

Z nereprezentacionalistických prístupov k významom v živočíšnej ríši spomenieme

práce estónskeho biológa Jacoba von Uexkülla (1957). Uexküll sa snažil očistiť biológiu

od mechanistických a antropocentrických pohľadov prevládajúcich v jeho dobe. Ponímal

biológiu ako epistemológiu, ktorá študuje organizmy nie ako objekty, ale ako subjekty,

ktoré svojimi zmysluplnými reakciami aktívne realizujú vlastný subjektívny svet, tzv.

Umwelt. Umwelt je (podobne ako interpretant v semiotickom trojuholníku)

determinovaný konkrétnym stelesnením, senzomotorickými možnosťami, vnútornými

stavmi, potrebami a interakčnou históriou konkrétneho organizmu. Organizmus je

spriahnutý s prostredím prostredníctvom spätnoväzobných slučiek, tzv. funkčných cyklov.

Takto vlastne organizmus neustále modifikuje a spoludeterminuje stav prostredia

a naopak, čo je veľmi blízke súčasnému ponímaniu enaktívnej paradigmy a dynamických

systémov. Štúdiom funkčných cyklov konkrétneho organizmu môžeme konceptualizovať

jeho správanie ako neustále prebiehajúci proces zmysluplnej (z pohľadu daného

organizmu) regulácie. Ako príklad Uexküll (1957) uvádza správanie kliešťa ako tri

funkčné cykly:

1. Prvý reflexný cyklus je spustený podnetom v podobe butyrickej kyseliny vylučovanej

kožou cicavcov. Tento podnet uvoľní úchop kliešťových nožičiek a spôsobí jeho

pád/spustenie.

2. Po dopade na pokožku cicavca taktilný vnem srsti naštartuje pohyb kliešťa – lezenie.

3. Vnem teploty pokožky spustí ďalšie správanie – zavŕtanie sa do pokožky a cicanie

krvi.

Z tisícov stimulov emitovaných z tela cicavca sú pre kliešťa relevantné iba tri a tak sa

celý jeho svet – Umwelt redukuje na to, čo je preň zmysluplné. Antropocentrický koncept

„cicavca“ teda pre kliešťa vôbec nemusí existovať, namiesto toho existuje reťaz časovo

ohraničených semiotických objektov.

S enaktívnym prístupom priamo súvisia aj práce Maturanu a Varelu (1987) a ich

kolegov (Varela, Thompson, a Rosch, 1991), ktorí chápali kogníciu predovšetkým ako

situovanú akciu organizmu zameranú na udržanie jeho funkčnej organizácie –

autopoiesis.

Page 61: Kognitívna veda a umelá inteligencia

61

4.4 Významy u ľudí

4.4.1 Idealizované kognitívne modely

V tejto časti sa posunieme od významov predverbálnych živočíchov k ľudským. Ako

prvú stručne charakterizujeme teóriu Georgea Lakoffa (1987). Hlavnou Lakoffovou tézou

je, že ľudské myslenie je organizované pomocou štruktúr, ktoré nazýva idealizované

kognitívne modely (IKM), a že štruktúra kategórií, prototypy a ostatné javy sú vedľajším

produktom tohto usporiadania a sú pomocou neho vysvetliteľné. Každý pojem či slovo je

definované vzhľadom na nejaké IKM, v kontexte ktorých má význam. Napríklad význam

slova utorok je definovaný vzhľadom na IKM obsahujúce vedomosť o prirodzenom

členení na dni na základe pozorovaného pohybu slnka po oblohe a konvenčne danom

lineárnom usporiadaní dní v sedemdňových cykloch. Pojem víkend zase zahŕňa

vedomosť o podelení týchto cyklov na päť pracovných dní a dvojdňovú prestávku atď.

Model je idealizovaný, pretože toto členenie neexistuje objektívne v prírode, ale je

vytvorené ľuďmi určitej kultúry (napríklad v kalendári na Bali beží súčasne desať

rôznych cyklov pomenovaných dní, z ktorých sa výsledné pomenovanie konkrétneho dňa

vypočíta a poskladá).

Niektoré IKM majú propozičnú štruktúru, teda špecifikujú elementy, ich vlastnosti a

vzájomné vzťahy, iné majú obrazovo-schematickú povahu a ich pochopenie pramení

priamo z našej telesnej skúsenosti. Napríklad aj klasický pohľad na kategóriu, do ktorej

niečo buď patrí, alebo nie, Lakoff vysvetľuje obrazovou schémou nádoba, ktorá má jasnú

hranicu a veci sú buď v nej, alebo mimo. Pôvod tejto obrazovej schémy (ako aj väčšiny

ostatných, ako sila, rovnováha, hore/dolu, časť/celok) je spätý so skúsenosťami vlastného

tela a motorickými interakciami v ranom detstve. Idealizované modely je ďalej možné

rôznym spôsobom skladať, reťaziť, usporadúvať do radiálnych štruktúr, vytvárať ich

varianty a modifikácie, používať jeden centrálny model ako zástupcu celej kategórie

(metonýmia) či zobraziť časť modelu z jednej domény na podobnú štruktúru v inej

doméne (metaforické modely, napríklad HNEV AKO ZAHRIEVAJÚCA SA TEKUTINA

V UZAVRETEJ NÁDOBE: „vzkypieť hnevom“, „vybuchnúť“). Význam abstraktných

pojmov je daný ich systematickým vzťahom (metaforickými a metonymickými

zobrazeniami) k štruktúram základnej úrovne a kinestetickým obrazovým schémam, ktoré

chápeme priamo telesnou skúsenosťou.

4.4.2 Konceptuálne priestory

Ďalšou zaujímavou sémantickou teóriou sú konceptuálne priestory Petra Gärdenforsa

(2000). Významy sú reprezentované geometrickými štruktúrami v tzv. konceptuálnom

priestore. Konceptuálny priestor pozostáva z množstva dimenzií ako farba, výška tónu,

teplota, váha, tri priestorové dimenzie, ktoré zodpovedajú vlastnostiam reprezentovaných

objektov. Dimenzie dôležité pre naše prežitie sú pravdepodobne vrodené (vyvinuté v

priebehu evolúcie) a vbudované do nášho nervového systému. Iné dimenzie sú naučené a

niektoré z nich môžu byť kultúrne podmienené. Dimenzie sú organizované do domén (pre

reprezentované objekty môžu byť relevantné dimenzie iba z niektorých domén).

Základnou vlastnosťou konceptuálnych priestorov je to, že podobné objekty sú

Page 62: Kognitívna veda a umelá inteligencia

62

umiestnené blízko pri sebe. Konkrétny objekt je reprezentovaný ako bod v podpriestore

zloženom z jednej alebo viacerých domén. Vektor súradníc bodu určuje hodnoty

vlastností na jednotlivých dimenziách. Podobnosť dvoch objektov je nepriamo úmerná

vzdialenosti ich bodových reprezentácií v konceptuálnom priestore. (Prirodzené)

kategórie sú reprezentované (konvexnými) oblasťami v priestore. Geometrické centrá

oblastí zodpovedajú najlepším resp. typickým reprezentantom kategórií – prototypom

v zmysle Rosch (1978). Využitie takejto reprezentácie pre objektové koncepty je

intuitívne. Rozšírenie na relačné koncepty, vlastnosti, akcie a udalosti je načrtnuté

v článku Gärdenfors (2011) a podrobne rozpracované v pripravovanej knihe (Gärdenfors,

v tlači).

4.4.3 Významy a mozog

Doteraz prezentované teórie sa nezaoberajú otázkou vzťahu významov a neurálneho

substrátu, teda ako sú významy realizované pomocou procesov či štruktúr mozgu.

Dominantnou modernou teóriou je tzv. simulačná teória (Barsalou, 1999, 2008;

Pulvermüller, 1999, Knott, 2012), ktorá hovorí, že pochopenie resp. evokovanie nejakého

významu, situácie, či udalosti je realizované znovuprehratím (reenactment)

senzomotorických procesov, ktoré nastali pri prežívaní danej udalosti. Na neurálnej

úrovni to znamená, že na reprezentácii konceptov sa zúčastňujú senzomotorické štruktúry

a procesy, ktoré sú aktívne pri nadobúdaní skúsenosti resp. interagovaní s inštanciami

daného konceptu. Napríklad koncept jablka môže byť reprezentovaný štruktúrami mozgu

zúčastnenými na zažívaní chuti, vône, tvaru a farby jazyka. Medzi skupinami neurónov,

ktoré vykazujú korelovanú aktivitu sú posilňované asociatívne väzby hebbovským

učením (Hebb, 1949), tým vznikajú skupiny neurónov (cell assemblies; Pulvermüller,

1999) ako funkčné jednotky, ktoré spoločne reprezentujú nejaký koncept. Skupiny môžu

byť lokalizované v rámci jednej oblasti mozgu, ale aj naprieč oblasťami, čím dochádza

k multimodálnej integrácii. Tieto teórie sú blízke paradigme ukotvenej kognície a majú

mohutnú empirickú podporu (Pecher a Zwaan, 2005; Barsalou, 2008).

4.5 Významy v umelých systémoch

Rozmach umelej inteligencie v druhej polovici 20. storočia priniesol aj otázky o povahe

rozumenia a významov v umelých systémoch. Od filozoficko-teoretických („Môžu stroje

myslieť?“) (Turing, 1950; Searle, 1980) až po praktické otázky reprezentácie znalostí

a implementácie procesov ich nadobúdania. Systémy s predprogramovanými znalosťami

v duchu klasickej umelej inteligencie a vtedy dominantnej paradigmy v kognitívnej vede

– kognitivizmu (viď kapitolu 1 tohto zborníka) boli kritizované za to, že akýkoľvek

význam je iba interpretáciou z pohľadu vonkajšieho (ľudského) pozorovateľa a znalosti

nemajú žiaden inherentný význam pre systém samotný, ktorý iba vykonáva manipulácie

a transformácie nezmyselných symbolov – problém ukotvenia symbolov (Harnad, 1990).

Reakcia v podobe vlny tzv. Novej umelej inteligencie (Brooks, 1991a, 1991b; Kelemen,

1994) odmietla koncept reprezentácie znalostí ako takej, tvrdiac, že svet je svojím

najlepším modelom a inteligentné správanie je výsledkom interakcie organizmu

Page 63: Kognitívna veda a umelá inteligencia

63

s komplexným prostredím. Brooks (1991b) navrhol tzv. subsumpčnú architektúru (pozri

kapitolu 5 tohto zborníka), ktorá vrstvením jednoduchých navzájom nezávislých modulov

priamo prepájajúcich percepciu s akciou dosahuje komplexné správanie. V takomto

systéme absentujú symboly a zmysluplné správanie je zabezpečené senzomotorickými

rutinami; tieto však nie sú systému vlastné ale sú výsledkom inžinierskeho dizajnu

(Ziemke, 1999).

Určité riešenie ponúka najnovší trend v robotike, tzv. kognitívna vývinová robotika

(Cohen et al, 1996; Weng et al, 2000; Smith a Gasser, 2005; Wang et al, 2011) ktorá sa

inšpiruje spôsobom, akým nadobúda vlastnosti človek: počas miliónov senzomotorických

interakcií s prostredím a s inými ľuďmi. Inteligencia sa nerodí hotová: dieťa je vybavené

silnými učiacimi mechanizmami, ktoré mu umožňujú potrebné znalosti postupne získať

a vyladiť ich na konkrétne prostredie. Smith a Gasser (2005) identifikujú týchto šesť

dôležitých faktorov pre vývin kognície umelého systému:

1. Multimodálnosť: Skúsenosť detí so svetom je inherentne multimodálna. Vzájomne

časovo korelované vnemy generované v rôznych senzorických modalitách procesmi

vnímania a konania vo svete sú dôležitým učiacim signálom pre vyvíjajúci sa systém

– aj v neprítomnosti externého učiteľa.

2. Inkrementálnosť: Deti nie sú chytré od narodenia, ale sa vyvíjajú inkrementálne.

Počiatočná nezrelosť a obmedzenia na postupnosť jednotlivých krokov sú

nevyhnutné pre vývin komplexnej kognície.

3. Fyzickosť/stelesnenosť: Deti interagujú s fyzickým svetom, ktorý je plný

štrukturálnych pravidelností, ktoré organizujú percepciu, činnosť a nakoniec aj

myslenie. Detská inteligencia je distribuovaná naprieč ich interakciami s materiálnym

svetom, ktorý je potrebný pre vývin vyšších kognitívnych funkcií.

4. Explorácia: Deti experimentujú a skúmajú – často sa hýbu a konajú veľmi

variabilným, hravým a zdanlivo náhodným spôsobom, ktorý nepripomína cieľovo

orientovanú aktivitu. Takto objavujú nové problémy a nové riešenia. Explorácia

umožňuje inovatívnosť kognície a jej otvorený koniec.

5. Sociálnosť: Deti jednajú a učia sa v sociálnom svete, kde ich zrelší partneri

sprevádzajú procesom učenia a poskytujú štruktúry podporujúce učenie.

6. Jazyk: Deti sa učia jazyk – zdieľaný symbolický komunikačný systém, ktorý im

umožní formovanie vysokoúrovňových abstraktných znalostí.

Nespornou výhodou vývinového prístupu je, že získaná znalosť nie je vopred

naprogramovaná externými osobami, ale systém (robot, dieťa) si sám v senzomotorickom

spriahnutí s prostredím nachádza a formuje znalosti relevantné pre neho samotného, čím

sa eliminuje problém ukotvenia symbolov. Ďalej je zabezpečený otvorený koniec

takéhoto vývinu, pretože systém autonómne si osvojujúci znalosti môže prísť na riešenia,

ktoré dizajnérom vôbec nemuseli napadnúť. V súvislosti s bodom 4 spomenieme koncept

tzv. vlastnej (intrinsic) motivácie (Oudeyer a Kaplan, 2007): systém si v každom kroku

sám vyberá problémy, ktoré bude riešiť, ktoré sú pre neho zaujímavé. Motivačným

faktorom môže byť napríklad nárast vlastnej kompetencie realizovaný tak, že agent

Page 64: Kognitívna veda a umelá inteligencia

64

priebežne monitoruje svoju schopnosť splniť vytýčené ciele a motivácia je priamo

úmerná nárastu tejto schopnosti (rozdielu medzi hodnotou kompetencie medzi dvoma

časovými okamihmi). Takto sa zabezpečí, že agent bude riešiť úlohy optimálnej

zložitosti: príliš zložitými sa nebude zaoberať (pretože ich nezvláda a tak hodnota

kompetencie nerastie) a tiež ho nebudú zaujímať príliš jednoduché úlohy (keďže ich

zvláda perfektne a kompetencia sa nemení). Postupným sebazdokonaľovaním systému sa

profil zaujímavosti jednotlivých činností mení a agent prechádza od elementárnych

činností k zložitejším bez toho, aby to musel mať predpísané z externého zdroja

(Oudeyer, Kaplan, a Hafner, 2007).

4.6 Záver

Prehľad poznatkov o teórii významov a reprezentácie znalostí uvedený v tejto kapitole

bol podávaný z určitej perspektívy. Teraz je na mieste zhrnúť kľúčové presvedčenia resp.

tézy nášho prístupu k významom (Takáč, 2009; Takáč a Šefránek, 2012):

1. Významy nie sú výlučne spojené s jazykom. V širšom ponímaní má zmysel hovoriť

o význame či porozumení situácii, udalosti, okolnostiam.

2. Disponovanie významami teda možno študovať aj u predjazykových kognitívnych

agentov ako sú zvieratá alebo malé deti. Významy tvoria kontinuum, na jednom póle

sú to primitívne protovýznamy späté s diferencovaním správaním/rozlišovaním, na

opačnom póle významy jazykových konštruktov či komplexných abstraktných

pojmov.

3. Pre kognitívny systém je dôležitá spriahnutosť významov s jeho skúsenosťami

pomocou percepčno-motorických interakcií s prostredím a s inými kognitívnymi

systémami.

4. Významy sú individuálne, situačné a závislé od telesnej skúsenosti, konštruované

v konkrétnych kontextoch jednotlivými agentmi. Čo je zmysluplné a interpretované

jedným kognitívnym systémom ako význam, môže byť pre iný kognitívny zmysel iba

nezmyselný šum. Robot, ktorý si vytvorí inherentné významy, bude disponovať

významami „robotími“, nie ľudskými.

5. Pre otvorený koniec vývinu kognície je dôležitý dynamický charakter významov, ich

neustála inkrementálna (re)konštrukcia.

Takýto prístup k významov musí čeliť niektorým dôležitým námietkam. Na tomto mieste

sa pokúsime odpovedať na nasledujúce dve:

Ak sú významy individuálne konštruované jednotlivým kognitívnymi agentmi, ako je

možné, že si navzájom rozumieme? Existuje nejaká cesta k intersubjektivite významov?

V prvom rade, identickosť interných významov nie je pre vzájomné porozumenie nutná;

postačuje koordinácia na úrovni správania. Na druhej strane, vzájomné interakcie agentov

im umožňujú adaptívne vyladenie resp. priblíženie významov. Interakcie vedúce k vzniku

spoločného dorozumievacieho systému boli pozorované napríklad medzi nikaragujskými

nepočujúcimi deťmi (Kegl, Senghas, a Coppola, 1999), ako aj počítačovo simulované

Page 65: Kognitívna veda a umelá inteligencia

65

(Steels, 2000) v tzv. jazykových hrách. V týchto hrách simulované agenty adaptívne

menili svoju reprezentáciu významov aj asociácie významov s komunikačnými signálmi

na základe výsledkov predchádzajúcich interakcií: asociácie, ktoré v minulosti viedli k

úspešnému dorozumeniu, mali vyššiu šancu byť použité aj v budúcnosti. Takto vytvorená

pozitívna spätná väzba viedla k samoorganizácii a k vzniku zdieľaného komunikačného

systému. Vzniknuté významy jednotlivých agentov boli stále individuálne a interné,

avšak navzájom kompatibilné natoľko, že umožňovali úspešné dorozumenie. Kolektívne

resp. intersubjektívne významy možno považovať za akési ekvilibriá dynamického

systému vzájomného vylaďovania spoločenstva (Gärdenfors, 2000). Opísanú konštrukciu

významov ako výsledku dlhodobého procesu možno extrapolovať aj na každý krátkodobý

a jedinečný komunikačný akt, v ktorom si účastníci komunikácie zjednávajú význam

danej konkrétnej situačnej interakcie. Intersubjektívny význam je potom pevným bodom

tohto zjednávania – „stretnutím myslí“ (Bara, 2010; Gärdenfors, v tlači). Zároveň je

aktom signifikácie v Peirceho zmysle (viď časť 4.2.3). Niektoré nástroje eliminácie

nejednoznačností v procese zjednávania významu sme načrtli v práci (Takáč a Šefránek,

2012). V práci Gärdenforsa (2008) boli analyzované typy intersubjektivity v živočíšnej

ríši nutné pre kooperáciu a komunikáciu.

Ak sú významy stelesnené a ukotvené v senzomotorickej skúsenosti, platí to aj

o abstraktných pojmoch? Ako si kognitívny agent osvojuje abstraktné významy?

Podľa Lakoffa a Johnsona (1980) sú abstraktné pojmy prepojené so senzomotorickou

skúsenosťou pomocou metaforických zobrazení. Pod metaforou nemyslia umeleckú či

básnickú metaforu, ale vzájomné zobrazenie medzi dvoma skúsenostnými doménami na

základe štrukturálnej podobnosti, pričom pojem z domény s abstraktnejším resp.

skúsenostne vzdialenejšej je konceptualizovaný pomocou pojmov zo skúsenostne bližšej

domény, napríklad vyjadrovanie emócií pomocou fyzických vnemov či procesov:

„vybuchol od hnevu“, „vzkypela v ňom žlč“ – metafora HNEV JE UZAVRETÁ

ZOHRIEVAJÚCA SA NÁDOBA (Lakoff, 1987). Podľa tzv. konflačnej hypotézy (Johnson,

1997) majú niektoré (tzv. primárne) metafory experienciálny základ – vznikli

skúsenosťami v ranom detstve, pri ktorých doslovný a metaforický význam splývali.

Príkladom je napríklad metafora POZITÍVNY CIT JE TEPLO (zážitok tepla a lásky zároveň

v rodičovskej náruči) alebo DÔLEŽITÝ JE VEĽKÝ (najdôležitejšie objekty pre dieťa –

rodičia sú v relatívnom porovnaní s dieťaťom veľké). Dôležitým zdrojom poznatkov

o konceptuálnych metaforách konkrétneho jazykovo-kultúrneho sveta sú frázy a obrazné

vyjadrenia daného jazyka: pre český jazyk viď napríklad Vaňkovú a spol. (2005), pre

slovenský prácu Retovej (2009).

Na záver chceme zdôrazniť, že teórie významu, ktoré sme predstavili v tejto kapitole

priamo odrážajú (a v niektorých prípadoch ich priamo vyprovokovali) paradigmatické

posuny v kognitívnej vede. Preto významy považujeme za jednu z centrálnych tém

kognitívnej vedy. Súčasné trendy ponúkajú mnoho podnetov pre empirický výskum,

počítačové simulácie aj industriálne aplikácie.

Page 66: Kognitívna veda a umelá inteligencia

66

Literatúra

Bara, B.G. (2010): Cognitive Pragmatics: The Mental Processes of Communication.

Cambridge, MA: Bradford Books.

Barsalou, L. W. (1999): Perceptual Symbol Systems. Behavioral and Brain Sciences

22(4), 577-609.

Barsalou, L.W. (2008): Grounded cognition. Annual Review of Psychology 59, 617-645.

Bergen, B. a Chang, N. (2003): Embodied construction grammar in simulation-based

language understanding. In Ostman, J. O. a Fried, M. (eds.): Construction

grammar(s): Cognitive and cross-language dimensions, 147–190, Amsterdam : Johns

Benjamins.

Berlin, B. a Kay, P. (1969): Basic Color Terms: Their Universality and Evolution.

University of California Press.

Brooks, R. A. (1991a): Intelligence without reason. In Proceedings of the Twelfth

International Joint Conference on Artificial Intelligence. San Mateo, CA: Morgan

Kaufmann, 569–595.

Brooks, R. A. (1991b): Intelligence without representation. Artificial Intelligence 47 (1–

3), 139–159.

Carnap, R. (1947/1956): Meaning and Necessity: A Study In Semantics And Modal Logic.

Chicago, IL: University of Chicago Press.

Chandler, D. (2002): Semiotics: The Basics (Second ed.). London, New York: Routledge.

Cohen, P. R., Oates, T., Atkin, M. S., a Beal, C. R. (1996): Building a Baby.

In Proceedings of the Eighteenth Annual Conference of the Cognitive Science Society,

L. Erlbaum, 518-522.

Fauconnier, G. (1985): Mental Spaces: Aspects of Meaning Construction in Natural

Language. Cambridge, MA: MIT Press.

Feldman, J. (2006): From Molecule to Metaphor: A Neural Theory of Language.

Cambridge MA: MIT Press.

Fillmore, C. J. (1982): Frame semantics. In Linguistics in the morning calm. Seoul:

Hanshin Pub. Co., 111–137.

Gärdenfors, P. (1996a): Cued and detached representations in animal cognition.

Behavioral Processes 35, 263–273.

Gärdenfors, P. (1996b): Language and the evolution of cognition. In V. Rialle, D. Fisette

(Eds.): Penser l’esprit: Des sciences de la cognition a‘ une philosophie cognitive.

Grenoble: Presses Universitaires de Grenoble, 151–172.

Gärdenfors, P. (2000): Conceptual Spaces. Cambridge, MA: MIT Press.

Gärdenfors, P. (2004): Cooperation and the evolution of symbolic communication. In K.

Oller a U. Griebel (Eds.): The evolution of communication systems. Cambridge, MA:

MIT Press, 237–256.

Gärdenfors, P. (2008): The role of intersubjectivity in animal and human

cooperation, Biological Theory 3(1), 1-12.

Gärdenfors, P. (2011): Semantics based on conceptual spaces. In M. Banerjee a A. Seth

(eds.): Proceedings of 4th Indian Conference on Logic and its Applications (LNAI

6521), Berlin: Springer, 1-11.

Page 67: Kognitívna veda a umelá inteligencia

67

Gärdenfors, P. (v tlači): The Geometry of Meaning: Semantics Based on Conceptual

Spaces. Cambridge MA: MIT Press.

Gardner, H. (1985): The Mind's New Science: A History of the Cognitive Revolution. New

York: Basic Books.

Gelder, T. J. (1999): Dynamic approaches to cognition. In R. A. Wilson, F. C. Keil

(Eds.): The MIT encyclopedia of the cognitive sciences. Cambridge, MA: MIT Press,

244–246.

Gibbs, R. W. (2006): Embodiment and Cognitive Science. Cambridge, U. K.: Cambridge

University Press.

Harnad, S. (1990): The Symbol Grounding Problem. Physica D 42, 335–346.

Hebb, D. (1949): The Organization of Behaviour. John Wiley a Sons.

Johnson, C. (1997): Metaphor vs. conflation in the acquisition of polysemy: the case of

SEE. In: Hiraga, M. K., Sinha, C., Wilcox, S. (Eds.): Cultural, typological and

psychological issues in Cognitive Linguistics. Amsterdam: John Benjamins.

Kegl, J., Senghas, A., a Coppola, M. (1999): Creation through contact: Sign language

emergence and sign language change in Nicaragua. In M. DeGraff (Ed.): Language

creation and language change: creolization, diachrony, and development.

Cambridge, MA: MIT Press.

Kelemen, J. (1994): Strojovia a agenty. Bratislava: Archa.

Knott, A. (2012): Sensorimotor Cognition and Natural Language Syntax. Cambridge,

MA: MIT Press.

Kripke, S. A. (1959): A completeness theorem in modal logic. Journal of Symbolic Logic

24, 1–15.

Lakoff, G. a Johnson, M. (1980): Metaphors We Live by. Chicago, IL: University of

Chicago Press.

Lakoff, G. (1987): Women, Fire, and Dangerous Things: What Categories Reveal About

the Mind. Chicago, IL: University of Chicago Press.

Langacker, R. W. (1987): Foundations of Cognitive Grammar: Theoretical Prerequisites

(Vol. 1). Stanford, CA: Stanford University Press.

Langacker, R. W. (1991): Foundations of Cognitive Grammar: Descriptive Applications

(Vol. 2). Stanford, CA: Stanford University Press.

Maturana, H. R. a Varela, F. J. (1987): The Tree of Knowledge: The Biological Roots of

Human Understanding. Boston, MA: Shambhala.

Montague, R. (1974): Formal Philosophy: Selected Papers of Richard Montague (R.

Thomason, Ed.). New Haven, CT: Yale University Press.

Oudeyer, P.-Y. a Kaplan, F. (2007): What is intrinsic motivation? A typology of

computational approaches. Frontiers in Neurorobotics 1(6).

Oudeyer P.-Y., Kaplan , F. a Hafner, V. (2007): Intrinsic Motivation Systems for

Autonomous Mental Development. IEEE Transactions on Evolutionary Computation

11(2), 265-286.

Pecher, D., a Zwaan, R. A., eds. (2005): Grounding Cognition: The Role of Perception

and Action in Memory, Language, and Thinking. Cambridge, UK: Cambridge

University Press.

Page 68: Kognitívna veda a umelá inteligencia

68

Peirce, C. S. (1931-58): Collected Writings (Hartshorne, C., Weiss, P., Burks, A. W.,

Eds.). Cambridge, MA: Harvard University Press.

Pfeifer, R., Scheier, C. (1999): Understanding Intelligence. Cambridge, MA: MIT Press.

Piaget, J., Inhelder, B. (1966): La Psychologie de l’Enfant. Paris: PUF.

Pulvermüller, F. (1999): Words in the brain’s language. Behavioral and Brain Sciences

22 (2) 253–279.

Putnam, H. (1967). The nature of mental states. Readings in the Philosophy of

Psychology, 1, 222-231.

Retová, D. (2009): Analýza konceptuálnych metafor emócií v slovenčine. In Kognice

2009. Hradec Králové: Gaudeamus, 162-172.

Rosch, E. (1978): Principles of categorization. In E. Rosch, B. Lloyd (Eds.): Cognition

and categorization. Hillsdale, NJ: Lawrence Erlbaum Associates, 27–48.

Searle, J. R. (1980): Minds, brains, and programs. Behavioural and Brain Sciences 3,

417–457.

Smith, L., Gasser, M. (2005): The Development of Embodied Cognition: Six Lessons

from Babies. Artificial Life, 11(1–2), 13–30.

Steels, L. (2000): Language as a complex adaptive system. In: V. Schoenauer, M. (ed.):

Proceedings of PPSN-VI. Springer-Verlag, Berlin.

Stewart, J., Gapenne, O., a Di Paolo, E. A. (2011): Enaction. Cambridge MA: MIT Press.

Takáč, M. (2006): Potrebujeme na myslenie telo? Knihy a spoločnosť 3(10).

Takáč, M. (2009): Konštruktivistický prístup k štúdiu kognície. In Kvasnička, V.,

Pospíchal, J., Kozák, Š., Návrat, P., Paroulek, P. (eds.), Umelá inteligencia a

kognitívna veda I, Vydavateľstvo STU, Bratislava. 395-424.

Takáč, M. a Šefránek, J. (2012): Semantics of distinguishing criteria: from subjective to

intersubjective. Interdisciplinary Description of Complex Systems 10(3). 248-269.

Talmy, L. (2000): Toward a Cognitive Semantics. Cambridge, MA: MIT Press.

Tarski, A. (1933): Pojecie prawdy w jezykach nauk dedukcyjnych. Prace Towarzystwa

Naukowego Warszawskiego, Wydzial III Nauk Matematyczno-Fizycznych 34, 13–172.

Tschacher, W. a Dauwalder, J.-P., eds. (1999): The dynamical systems approach to

cognition: Concepts and empirical paradigms based on self-organization,

embodiment, and coordination dynamics (Vol. 10). Singapore: World Scientific.

Turing, A. M. (1950): Computing machinery and intelligence. Mind 59, 433–460.

Vaňková, I., Nebeská, I., Saicová Římalová, L., a Šlédrová, J. (2005): Co na srdci to na

jazyku: Kapitoly z kognitivní lingvistiky. Praha: Nakladatelství Karolinum.

Varela, F.J., Thompson, E. a Rosch, E. (1991). The Embodied Mind: Cognitive Science

and Human Experience. Cambridge, MA: MIT Press.

Von Uexküll, J. (1957): A Stroll through the Worlds of Animals and Men. In C. Schiller,

ed.: Instinctive Behavior, International Universities Press, New York.

Wang, Y., Wu, X., Weng, J. (2011): Skull-closed autonomous development. In Bao-

Liang Lu, Liqing Zhang, and James Kwok (Eds.): Proceedings of the 18th

international conference on Neural Information Processing - Volume Part

I (ICONIP'11), Vol. Part I. Berlin, Heidelberg: Springer-Verlag, 209-216.

Ward, L. M. (2001): Dynamical Cognitive Science. Cambridge MA: MIT Press.

Page 69: Kognitívna veda a umelá inteligencia

69

Weng, J., Hwang, W. S., Zhang, Y., Yang, C. a Smith, R. (2000): Developmental

Humanoids: Humanoids that Develop Skills Automatically. In Proc. First IEEE Conf.

on Humanoid Robots, Cambridge MA: MIT Press.

Wittgenstein, L. (1953): Philosophical Investigations. New York: Macmillan.

Ziemke, T. (1999): Rethinking Grounding. In: Riegler, Peschl a von Stein (eds.)

Understanding Representation in the Cognitive Sciences. New York: Plenum Press,

177-190.

Page 70: Kognitívna veda a umelá inteligencia

70

Kapitola 5

Postkognitivistický prístup k percepcii a akcii

v mobilnej robotike

ANDREJ LÚČNY

Cieľom príspevku je porovnať kognitivistický a postkognitivistický prístup k

modelovaniu mysle. Kým v prvom prípade myseľ považujeme za stelesnenie

univerzálneho algoritmu myslenia, v prípade druhom ju považujeme za hromadu

špecifických algoritmov závislých od tela i prostredia. Ozrejmíme taktiež ako sa tento

rozdiel premieta do vzťahu medzi percepciou a akciou.

5.1 Kognitivizmus

Pod kogníciou rozumieme schopnosť spracúvať informácie spôsobom podobným

človeku. Toľko hovorí tradičná definícia. Pri pokuse túto definíciu zobjektívniť

a vysvetliť, v čom je spôsob spracovania informácie u človeka špecifický, sa už názory

rozchádzajú. Jedni chápu kogníciu širšie a berú do úvahy akékoľvek spracovanie

informácii, ktoré v konečnom dôsledku vedie k tomu, že sa bytosť – či už prirodzená

(spravidla človek) alebo umelá (t.j. robot), pri pohľade zvonku správa účelne. Druhým

takáto schopnosť nestačí. Ukazuje sa totiž, že účelné správanie možno často dosiahnuť aj

jednoduchými vhodnými reakciami, ktoré prípadne využívajú charakter prostredia,

v ktorom sú vykonávané (obrázok 1). A toho sú schopní aj tie najjednoduchšie tvory.

Preto vyžadujú okrem spracovania typu stimul–reakcia určitú kontinuitu spracovania

informácii v čase, určitú schopnosť poučiť sa zo svojich zážitkov (obrázok 2). Aj tu sa

ponúka viac možností, pričom ich ako tzv. typy myslenia pekne charakterizuje (Dennett,

1997). Tvory neschopné počas svojho života upravovať svoju konkrétnu reakciu na

konkrétny stav prostredia nazýva darwinovskými. Hoci čisto darwinovského tvora ťažko

v živej ríši nájdeme (snáď niektoré vírusy), zaujímavé príklady takéhoto myslenia možno

nájsť hlavne v ríši hmyzu. Napríklad ak pod pohár schováte kutavku medvedíkovú

a chrobáka medvedíka, tak pokiaľ je kutavka po párení, uloví ho a použije ako potravu

pre svoje larvy. Pokiaľ však oplodnená nie je, zožerie medvedík kutavku. Napriek jej

schopnosti medvedíka poraziť ju nikdy nevycvičíte, aby sa jej to chcelo, pokiaľ nie je

čerstvo po párení. Pozoruhodné je, že i týmto spôsobom myslenia možno vybudovať

fantastické stavby ako sú termitiská, prevádzkovať poľnohospodárstvo ako mravce Atta,

či viesť vojny ako to robia otrokárske mravce.

Pokročilejšie tvory – Dennett ich nazýva skinnerovskými – dokážu meniť svoje

správanie na základe podmieňovania (conditioning). Hoci nie každý tvor je ochotný dať

sa vycvičiť, skinnerovské myslenie možno nájsť v prírode prakticky kdekoľvek, dobre sa

dá podmieňovať napríklad chobotnica (Boycott, 1965). Ďalším krokom k

Page 71: Kognitívna veda a umelá inteligencia

71

zdokonaľovaniu je tzv. popperovské myslenie, pri ktorom dochádza v mysli k utvoreniu

modelu toho, čo existuje v reálnom svete a do mysle tvora postupne prichádza v podobe

stimulov. O modeli hovoríme, pokiaľ je dokonalý, do tej miery, že ho v mysli možno

použiť na simuláciu toho, čo by sa v reálnom svete muselo vyskúšať. Túto schopnosť

majú nepochybne napríklad psy (Hass, 1970), ktoré vedia predvídať vývoj situácie

a vedia si zvoliť stratégiu ako ju riešiť. Vrcholným spôsobom myslenia je schopnosť

vyjadriť tieto vnútorné modely jazykom, ktorý slúži ako prenosový prostriedok na ich

presun do inej mysle. Takého tvora Dennett nazýva gregoryovským. Je ním

predovšetkým človek, ale sú určité náznaky, že aj ďalšie ľudoopy a niektoré primáty,

veľryby ako aj niektoré vtáky.

Obrázok 1. Správanie na základe reakcie na stimul. Na základe v čase prichádzajúcich stimulov

tvor reaguje vždy určitou a rovnakou reakciou.

Obrázok 2. Správanie, v ktorom je reakcia výsledkom kontinuity stimulov. Vyžaduje

komplikovanejšiu vnútornú štruktúru tvora.

Pre ilustračný príklad si predstavme krčmu, kde každý tvor, čo do nej vojde, dostane

po hlave a vyhodia ho von. Účelné správanie spočíva teda v tom, aby sme sa naučili tam

nevstupovať. Darwinovský tvor by nemal šancu, stále by ho mlátili po hlave a on by tam

stále liezol. Skinnerovský tvor by postupne s pribúdajúcim počtom úderov vchádzal do

krčmy menej často, až nakoniec skoro vôbec. Popperovský tvor by vošiel len raz a pri

ďalšom raze by si simuláciou situácie domyslel čo ho čaká, takže už by tam viackrát

Page 72: Kognitívna veda a umelá inteligencia

72

nevkročil. Gregoryovský by tam nekročil vôbec, pokiaľ by mal to šťastie, že stretne iného

tvora, ktorý mu jazykovou komunikáciou prezradí, ako to tam chodí.

Jedine u gregoryovského tvora si môžeme byť istí, že má v mysli niečo, čo

zodpovedá symbolom. Teoreticky by aj nižšie typy myslenia mohli tejto požiadavke

vyhovovať, ale nemáme zatiaľ žiadnu šancu to overiť.

Takže, keď sa rozhodneme na kogníciu nazerať ako na také spracovanie informácií,

ktoré zodpovedá manipulácii so symbolmi, stále nevieme presne, aké bytosti z prírody

máme na mysli. Vieme si ale dobre predstaviť, čo musí spĺňať umelý systém, aby v ňom

manipulácia so symbolmi prebiehala. Preto mnohí preferujú práve tento spôsob definície

kognície. Kognícia je pre nich schopnosťou spracúvať informácie vo forme symbolov.

Títo druhí sa nazývajú kognitivistami a ich prístup kognitivizmom.

Pre kognitivistov nie je podstatné, či myslenie prebieha v mysli človeka alebo

v riadiacej jednotke robota. Predpokladajú, že detaily „hardvéru“ nie sú podstatné,

podstatný je abstraktný model prebiehajúceho výpočtu.

Na kognitivistickom prístupe je dôležité, že symbol je niečo celkom abstraktné. Táto

vlastnosť symbolov určuje výrazne i charakter spracovania informácie, ktorý je

následkom toho univerzálny. Pre kognitivistov nadobúdajú zmysel pojmy ako je

napríklad algoritmus myslenia. Je to algoritmus, ktorý zo stimulu vyjadrenému

v symboloch počíta rovnako v symboloch vyjadrenú reakciu. Avšak s jeho

univerzálnosťou sú problémy. Pomocou matematickej logiky možno ukázať, že

algoritmus, ktorý by vedel v konečnom čase vypočítať správnu reakciu na ľubovoľný

stimul neexistuje. Zo znalosti jeho vnútornej štruktúry sa totiž dá skonštruovať taký

stimul, na ktorom sa zacyklí. Tento problém si uvedomil už Turing pri úvahách o vzniku

oboru, ktorý sa dnes nazýva umelou inteligenciou (Kelemen, 2010). Kognitivisti k tomuto

problému pristupujú zavedením neurčitosti platnosti dát, t.j. odkláňajú sa od binárnej

logiky pravda/nepravda a nemonotónnosťou ich reťazenia, t.j. schopnosťou dopracovať

sa v rôznych fázach reťazenia dát k rôznym záverom.

5.2 Kognitivistický prístup k modelovaniu mysle

Pokiaľ kognitivisti modelujú myseľ, pracujú vždy s modelom, ktorý je nezávislý na

konkrétnej úlohe. Napríklad nezávisí od toho, či skúmame na človeku spôsob čítania

alebo motoriku uchopovania predmetov. Závisí len od toho, akú konkrétnu predstavu

o mysli máme. Tá je stelesnená vo forme tzv. kognitívneho podsystému, ktorý je schopný

vykonávať manipulácie so symbolmi a odvodiť zo stimulu príslušnú reakciu. Aby to bolo

možné, musí byť stimul najprv zakódovaný do podoby symbolov, a aby to malo význam,

musí byť reakcia vyjadrená v symboloch interpretovateľná v podobe akcií. Stimul totiž

v podobe symbolov do tela mysliaceho tvora neprichádza, ale je vyjadrený

v subsymbolovej forme zodpovedajúcej povahe jeho senzorov (iným slovom povedané

receptorov). Reakcia, ktorú telo produkuje, je zase postupnosťou akcií jeho motorov

(aktuátorov).

Robot, skonštruovaný na báze kognitívneho prístupu má teda riadiaci systém zložený

zo spracovania vnemov, ich premeny do symbolovej formy pri tzv. výbere, kognitívneho

podsystému – napríklad v podobe plánovača, premeny vygenerovaného plánu

Page 73: Kognitívna veda a umelá inteligencia

73

vyjadreného v symbolovej forme na akcie pri vykonávaní plánu a generovanie reakcie

v podobe akcií (obrázok 3 vľavo).

Takýmto robotom bol napríklad SHRDLU (Kelemen, 2010), schopný manipulovať

s kockami umiestnenými v scéne. Dnes by sme ich implementovali tak, že by sme použili

štandardný postup počítačového videnia, napríklad farebný obraz z kamery by sme

previedli do farebného modelu odolného voči zmene jasu a potom ho previedli na odtiene

šedej. Z toho by sme získali hrany hranovým operátorom ako je Canny. Potom by sme v

týchto hranách hľadali úsečky alebo rovno celé štvorce a kosoštvorce pomocou

Houghovej transformácie a podľa nich určili, kde na obraze máme kocky. Tieto kocky by

sme pomenovali symbolmi, napríklad A, B, C, ... Následne by sme sa snažili zodpovedať,

aké sú vzťahy medzi kockami a premeniť ich na logické formuly, napríklad Hornove

klauzuly. Takže fakt, že kocka označená ako A sa nachádza na kocke B, by sme vyjadrili

ako Na(A,B), zatiaľ čo fakt, že sa kocka B nachádza na podlahe, vyjadríme ako Na(A,Fl).

Robotovi by sme potom zadali cieľ, dajme tomu Na(A,C). Jeho kognitívny systém by

potom začal reťaziť tieto poznatky s poznatkami o presúvaní kociek, ktoré by sme mohli

vyjadriť tzv. STRIPS pravidlom:

pravidlo: Preloz(X,Y,Z) - prelož X z Y na Z

podmienka aplikovateľnosti: Volne(X), Na(X,Y), Volne(Z)

odoberané klauzuly: Na(X,Y), Volne(Z)

pridané klauzuly: Na(X,Z), Volne(Y), Volne(Fl)

Dosadzovaním A, B, C za X, Y, Z, kognitívny podsystém dokáže odvodiť, že správny

plán na dosiahnutie cieľa je Preloz(A,B,C). Pritom toto odvodenie prebieha čisto na báze

manipulácie so symbolmi, ktoré v tejto chvíli už nič neznamenajú, zaujímavá je len

štruktúra vzťahov medzi nimi. Keby nešlo o kocky ale o valce, odvodenie by vyzeralo

úplne rovnako. Úplne rovnako by mohlo vyzeraj aj v prípade, že C je guľa, a museli by

sme rozšíriť podmienku aplikovateľnosti, aby sme dokázali zachytiť, že v tomto prípade

by bol takýto plán nerealizovateľný.

Obrázok 3. Príklad kognitivistického robota, dekomponovaného funkciou (vľavo) a

postkognitivistického robota, dekomponovaného aktivitou (vpravo).

Page 74: Kognitívna veda a umelá inteligencia

74

Po vygenerovaní plánu nastáva potreba premeniť opäť abstraktné na konkrétne

a treba interpretovať tento plán, tj. preložiť kocku A z B na C. Toto sa dá zabezpečiť

algoritmom fungujúcim na báze tzv. inverznej kinematiky, ktorý vygeneruje správnu

postupnosť nastavení parametrov aktuátora, napríklad uhlov v kĺboch robotického

ramena.

Túto postupnosť treba potom vykonať ako sériu akcií v čase. Môže sa pritom stať

i to, že sa táto akcia vykonať nedá, pretože sa zmenili podmienky, za ktorých bola

odvodená – napríklad niekto položí ďalšiu kocku na A, alebo že výber sprevádzajúci

vytvorenie reprezentácie nezobral v úvahu niečo čo bolo dôležité – napríklad, že medzi

A a C je stena (to je tzv. problém rámca). V oboch prípadoch sa na zlyhanie plánu príde

až pri jeho vykonaní, nie pri odvodzovaní. Je to práve preto, že modelovanie reálneho

sveta v mysli prebieha v symbolovej forme a spochybňuje to zaužívaný názor, že pokiaľ

v systéme máme A reprezentujúce reálnu kocku, ide o popperovský spôsob myslenia.

Možno práve subsymbolová forma, pri ktorej napríklad kocku aproximujeme hmotným

bodom v euklidovskom priestore, a ktorý dokážeme postupne posúvať po určitej

trajektórii priamo v mysli, zodpovedá popperovskému mysleniu viac. Problém je, že

hmotný bod nie je univerzálnou abstrakciou. Pre iné účely bude výhodnejšie kocku

reprezentovať ako množinu plôch, alebo ako vektor príznakov obsahujúci dĺžku strany,

farbu, textúru, ... Toto je začiatok úvahy, ktorá nás posúva od kognitivistického prístupu

k postkognitivistickému.

Pri kognitivistickom prístupe si môžeme všimnúť, že percepcia je úplne oddelená od

akcie (oddeľuje ich kognitívny podsystém). Charakter takejto mysle by sme teda mohli

vyjadriť sloganom „percepcia–kognícia–akcia“ (obrázok 4 vľavo).

Obrázok 4. Kognitivistická predstava o vzťahu medzi percepciou a akciou (vľavo) a analogická

postkognitivistická predstava (vpravo).

5.3 Postkognitivistický prístup k modelovaniu mysle

Nevýhody tradičného prístupu percepcia–kognícia–akcia sa už dlhé roky snaží prekonať

prístup založený na predstave, že kognícia je neoddeliteľná od percepcie a akcie, t.j.

prekrýva sa s nimi. Následkom toho nemožno oddeliť ani samotnú percepciu od akcie

(obrázok 4 vpravo). Vidíme, že zo štrukturálneho hľadiska tu nič, čo by zodpovedalo

kognícii, nenájdeme. Kognícia je rozptýlená vo vzťahu medzi percepciou a akciou,

povstáva ako vedľajší efekt dômyselného prepojenia a prekrytia týchto dvoch zložiek

mysle.

Postkognitivisti neveria, že existuje univerzálny algoritmus myslenia, ale že štruktúra

mysle je daná telom, ktoré ovláda – hovoria o princípe stelesnenia (embodiment)

Page 75: Kognitívna veda a umelá inteligencia

75

a prostredím v ktorom telo funguje (situovanosť). Detaily biologického hardvéru, tzv.

wetware, považujú za dôležité a preto preferujú prácu s neurónovými sieťami, prevažne

impulznými, ktoré sa viac ponášajú na prírodné vzory, než tradičné. Avšak neodmietajú

ani iné inžinierske prístupy, z ktorých najvýznamnejším základom je práca Rodneyho

Brooksa (1999). Brooks pre konštrukciu riadiacich systémov mobilných robotov (ktoré

môžeme pri troche fantázie nazývať umelými mysľami) sformuloval nasledovné

východiská:

Situovanosť

• Pri tvorbe neuvažujeme, že sa vytváraný systém nachádza v akýchkoľvek

podmienkach vyjadrených všeobecne, ale uvažujeme veľký súbor špecifických

podmienok.

• Môžeme najprv urobiť verziu, ktorá funguje len pre časť týchto podmienok a

neskôr ju rozšíriť na ostatné.

• Nebudeme podmienky ošetrovať jediným modulom, ale špecifické podmienky

budú ošetrované špecifickými modulmi – „raz zaberie taký trik, inokedy onaký“.

• Nesnažíme sa budovať abstraktnú reprezentáciu sveta. „Najlepšou reprezentáciou

sveta je svet sám“.

• Systém vyvíjame pre konkrétne prostredie, v ktorom ho testujeme (ladíme).

Stelesnenosť

• Neoddeľujeme návrh od implementácie.

• Navrhujeme s prototypom v ruke.

• Tým je umožnené po skončení každej fázy vývoja systém testovať a ladiť.

• Pracujeme so skutočnými vstupmi, spoliehame sa na ich reálny charakter.

Emergencia

• Správanie systému je výsledkom interakcie jednotiek, z ktorých sa skladá.

• Súvislosť medzi správaním jednotiek a systému môže byť na prvý pohľad

nejasná.

• Pri vhodnej štruktúre systému môžeme explicitnou implementáciou určitých

schopností implicitne implementovať schopnosť doteraz neuvažovanú. Vývojár

môže byť neschopný tento jav predvídať, hoci jeho dodatočné vysvetlenie nie je

zložité.

Interakcia

• Systém môže inteligenciu čerpať z dynamiky prostredia. Často možno zložitý

riadiaci systém nahradiť jednoduchým, ktorý vhodne stavia na dynamike

prostredia.

• Paradoxne (na rozdiel od systémov, ktoré obsahujú kognitívny modul) v

statickom prostredí sa takýto systém správa horšie než v dynamickom.

• Inteligencia sa prejavuje reakciami systému na stav jeho prostredia, teda v

globálnom správaní, nemožno ju nájsť vnútri systému.

• Reaktivita systému zabezpečuje jeho odolnosť voči rušivým zmenám

a prechodným stavom v prostredí.

Hierarchia (Inkrementálnosť)

Page 76: Kognitívna veda a umelá inteligencia

76

• Systém vyvíjame inkrementálne, po vrstvách, pričom každá implementuje určitú

aktivitu.

• Postupujeme pritom zdola nahor. Začíname s hierarchicky nižšími vrstvami

(biologická metafora: historicky staršími), teda s primitívnejšími aktivitami.

• Postupne pridávame nové a nové vrstvy, pričom po každom inkremente,

testujeme, ladíme a opravujeme, kým naozaj nezbehnú všetky testy určené pre

danú fázu vývoja úspešne.

• Vďaka tomu sa nám nemôže stať že implementácia zlyhá na integrácii častí

v celok. Hoci na druhej strane nám potenciálne hrozí, že systém dostaneme do

stavu, že novú aktivitu už nemožno konzistentne pridať.

• Hierarchia systému spočíva v tom, že vyššie vrstvy môžu využívať nižšie. Môžu

ich pasívne monitorovať alebo aj aktívne na ne pôsobiť tým, že potláčajú alebo

dokonca modifikujú ich činnosť.

Na základe týchto východísk navrhol Brooks pre tvorbu mobilných robotov tzv.

subsumpčnú architektúru. Podľa nej sa systém skladá z modulov organizovaných do

vrstiev, ktoré zodpovedajú jednotlivým aktivitám a zároveň fázam vývoja. Každý modul

je založený na konečno-stavovom automate rozšírenom o vstupno-výstupné a interné

registre, o možnosť volať náročnejšie výpočtové procedúry a hlavne o časovač. Tento

zabezpečuje, že modul opakovane transformuje signály prijaté do vstupných registrov na

signály zapísané do výstupných registrov. V rámci jednej vrstvy môžu byť moduly

vzájomne prepojené vedením, po ktorom sú signály z výstupných registrov odposlané do

vstupných registroch iných modulov. Okrem toho sa moduly z vyššej vrstvy môžu

„vtierať“ do činnosti modulov v nižších vrstvách, a to prostredníctvom troch

mechanizmov (obrázok 5):

odpočúvaním – pri ňom dochádza k rozdvojeniu vedenia v nižšej vrstve a odvedenia

jeho novej vetvy do vyššej vrstvy; modul vo vyššej vrstve takto monitoruje, aké

signály sú posielané medzi dvomi modulmi v nižšej vrstve;

supresiou – pri nej do vedenia v nižšej vrstve vkladáme špeciálne zariadenie –

supresor – a napájame ho na výstup z modulu vo vyššej vrstve. Supresor zabezpečí,

že signál z vyššej vrstvy nahradí signál, ktorý sa šíri po vedení v nižšej vrstve;

inhibíciou – pri nej podobne vkladáme do vedenia v nižšej vrstve inhibítor, ktorý ak

dostáva signál z vyššej vrstvy, zastaví šírenie signálu v nižšej vrstve.

Obrázok 5. Mechanizmy subsumpcie.

Supresor a inhibítor majú pritom časovú konštantu, ktorá zabezpečuje, že ak začnú

supresiu či inhibíciu bude to trvať istý čas. Vstup a výstup niektorých modulov je

prepojený so senzormi a aktuátormi systému a to bez ohľadu na to, v ktorej vrstve sa

modul nachádza.

Page 77: Kognitívna veda a umelá inteligencia

77

Obrázok 6. Senzory a motory robota ALLEN.

Ako príklad si uvedieme najjednoduchší (a najstarší) robot postavený subsumpčnou

architektúrou a to robot ALLEN (Brooks, 1999). Tento prípad použijeme v ďalšom, preto

ho uvedieme relatívne podrobne (pričom upozorňujeme, že isté nepublikované detaily

o tomto robote musíme odhadnúť). ALLEN je robot, ktorý má prechádzať miestnosťami

na jednom podlaží, aby navštívil podľa možnosti čo najviac miest (čo je základ pre

budovanie kognitívnej mapy podlažia). Robot je vybavený dvanástimi sonarmi

(ultrazvukovými senzormi), ktoré merajú vzdialenosť najbližšej prekážky na im

pridelenom výseku v okolí robota. Sonary sú rozmiestnené rovnomerne, takže na každý

sonar pripadá výsek veľkosti 30. Podvozok robota umožňuje pohyb dopredu a dozadu

ako aj otáčanie sa na mieste (obrázok 6).

V zmysle subsumpčnej architektúry sa ALLEN skladá z troch vrstiev (obrázok 7):

AVOID, WANDER a EXPLORE. Ako prvá bola implementovaná vrstva AVOID

realizujúca najjednoduchšiu aktivitu a to vyhýbanie sa prekážkam. Začína modulom

Forward, ktorý ovláda dopredný a spätný pohyb a pokiaľ nedostane iný pokyn realizuje

dopredný pohyb robota. Teda keby mal robot iba tento modul, šiel by rovno a narazil by

do prvej prekážky. Aby sa tak nestalo, je vo vrstve AVOID modul Sonar, ktorý prijíma

vzdialenosti najbližších prekážok zo sonarov a na základe toho produkuje mapu týchto

vzdialeností, indexovanú relatívnym smerom. Časť tejto mapy, ktorá sa viaže

k dopredným smerom (napríklad ± 60) vstupuje do modulu Collide, ktorý vyhodnotí či

nastala, alebo hrozí zrážka. (Robot sa pohybuje vždy v smere 0, lebo všetky smery sú

relatívne – robot nemá žiadny kompas). Pokiaľ Collide vyhodnotí, že nastala alebo

nastáva zrážka zaradí na určitú dobu spätný chod prostredníctvom modulu Forward.

S týmito modulmi už robot do prekážky nenarazí, ale cúvne pred ňou. Nič mu to však nie

je platné, lebo po cúvnutí opäť vyrazí smerom k prekážke a tak stále dokola. Zjavne treba

pridať otáčanie. To realizuje modul Turn, ktorý potláča činnosť modulu Forward (robot

sa otáča na mieste). Turn však realizuje otáčanie iba keď na to dostane pokyn. Tento

generujú moduly Feelforce a Runaway. Feelforce vyhodnocuje z mapy vzdialeností smer

v ktorom najviac hrozí zrážka. Na to Runaway vyhodnotí či sa treba otáčať a vypočítava

o koľko a ktorým smerom. Túto informáciu potom posiela do modulu Turn. Treba si

uvedomiť, že tu môže vznikať určitá spätná väzba, keď otáčanie trvá dlhší čas: tým že

Page 78: Kognitívna veda a umelá inteligencia

78

Turn začne realizovať príkaz od Runaway na otočenie o 150, mení sa poloha robota,

a tým pádom aj mapa a smer v ktorom najviac hrozí zrážka a následne príkaz modulu

Runaway, ktorý už žiada otočenie len o 100. Na druhej strane, moduly pracujú v taktoch,

takže ak sa žiadosť o otočenie o 5 vykoná prv než prebehne vygenerovanie nového

príkazu, tento už bude znieť „netočiť sa“. Ďalším modulom vrstvy AVOID je Status,

ktorého prítomnosť je v podstate porušením princípu inkrementálneho vývoja zdola nahor

(v práci vysvetlíme príčinu a ukážeme ako sa bez neho zaobísť). Jeho úlohou je

poskytovať dostatočne výstižné informácie o pohybe robota pre vyššie vrstvy. Pokiaľ by

robot obsahoval iba vrstvu AVOID, tak by vyštartoval rovno, pri prekážkach by sa otáčal

do voľného priestoru. Zaujímavosťou je to, že hoci vrstva AVOID bola navrhnutá pre

statické prekážky, funguje rovnako dobre aj pre pohybujúce sa objekty, ktoré sú pomalšie

než robot. Už pri prvej časti vrstvy AVOID vie robot cúvať pred pohybujúcim sa

objektom, pri celej vrstve dokáže pred ním utekať.

Sonar

Collide

Feel force Runaway

Forward

Turn StatusS

Avoid

AVOID

WANDER

Wander

Look Pathplan

IntegrateStereo

Whenlook

I S

EXPLORE

map

force

halt

busy

heading

encoders

heading

travel

busy

candidate init

startlook

heading

path

integral

Obrázok 7. Subsumpčná architektúra robota ALLEN.

Pohyb, ktorý generuje AVOID, je však natoľko deterministický, že pri pustení robota

do scény pomerne rýchlo príde k zacykleniu jeho trajektórie. Odstrániť tento nedostatok

je úlohou vrstvy WANDER. Túlanie realizujú dva moduly. Prvý z nich – Wander –

generuje raz za istý čas (prípadne s istou pravdepodobnosťou) náhodný smer a posiela ho

do druhého modulu Avoid. Ten má zariadiť, aby sa robot otočil týmto smerom. Keďže

vrstva AVOID ovláda aktuátory pohybu, musí tak urobiť s jej pomocou. Tá však žiadne

rozhranie na takúto spoluprácu neposkytuje, keďže bola implementovaná spôsobom zdola

nahor – teda bez uvažovania, čo bude v implementácii nasledovať. Preto Avoid musí

použiť jeden z mechanizmov subsumpcie, ktorý takéto rozhranie vytvorí. Konkrétne bude

použitá supresia: do vedenia medzi modulmi Runaway a Turn vložíme supresor napojený

na výstup z Avoid. Tým pádom Turn bude považovať hodnotu z Avoid za smer, ktorý mu

Page 79: Kognitívna veda a umelá inteligencia

79

poslal Runaway, teda za smer, ktorým sa treba otočiť, aby nenastala zrážka. Čo treba

doriešiť je prípad, keď zrážka naozaj hrozí. Preto Avoid použije aj mechanizmus

odpočúvania: vedenie medzi Feelforce a Runaway zdvojíme a odvedieme na vstup

modulu Avoid, ktorý tak získa potrebnú informáciu o nebezpečenstve zrážky. V takom

prípade nebude stimul z Wander realizovať.

Vrstvy AVOID a WANDER zabezpečia, že pohyb robota bude bezpečný

a nedeterministický. To však zďaleka nestačí na to, aby robot prehľadával priestor.

Naopak, bude sa motať na mieste. Opak zabezpečuje vrstva EXPLORE. Jej úlohou je

presúvať robot z jednej oblasti do inej udržujúc stály smer pohybu (ale obchádzajúc

pritom prekážky). Podmienku aktivácie vrstvy do činnosti vyhodnocuje modul Whenlook

na základe údajov o pohybe robota od modulu Status. Keď sa mu zdá, že sa robot motá na

mieste, uvedie do činnosti modul Look. Ten spolupracuje s modulom Stereo, ktorý

preberá údaje zo senzorov a hľadá medzi nimi smer, v ktorom je dostatok voľného

priestoru (napríklad chodba). Tohto kandidáta posiela modulu Look, ktorý ho prípadne

vyhlási za smer presunu do inej oblasti od tohto momentu modul Pathplan, otáča robota

tak, aby stále držal tento smer. Keďže smery sú relatívne, od momentu voľby musí robot

počítať odchýlku aktuálneho absolútneho smeru od jeho hodnoty v čase voľby, čo robí

modul Integrate. Ten na to samozrejme potrebuje dostatočné informácie o pohybe robota

– tie mu sprostredkúva modul Status z vrstvy AVOID. Pathplan pritom realizuje otáčanie

robota cez vrstvu WANDER a to opäť supresiou – ako keby šlo o náhodný smer

zabezpečujúci túlanie, hoci tento nie je náhodný, ale generovaný podľa presnej logiky.

Pritom prekážky budeme obchádzať, lebo Avoid nepošle tento smer do Turn, ak hrozí

zrážka. Je logické zabezpečiť, aby sa do činnosti EXPLORE nemiešal modul Wander,

preto je počas presunu potlačená jeho činnosť mechanizmom inhibície. Ničmenej, aj keby

sme toto nespravili, presun by sa podaril, len by počas neho dochádzalo k vybočeniam

a návratom aj bez výskytu prekážok. Všetky tri vrstvy realizujú dostatočne bohatý pohyb,

aby sa dal použiť na sofistikovanejšie úlohy, ako je napríklad budovanie kognitívnej

mapy prostredia. ALLEN je typický robot, ktorého riadiaca štruktúra je dekomponovaná

aktivitou (obrázok 3 vpravo).

Toľko k robotovi ALLEN. Zaujímavým a modernejším príkladom podobného

prístupu je robot ACE, ktorý využíva princíp interaktívnosti. Dostane za úlohu dostať sa

na určité miesto v meste. Potom chodí po ulici a oslovuje ľudí, aby mu rukou ukázali

smer, ktorý určuje cestu k danému miestu. Keby na ulici nikoho nebolo, nikam by sa

nedostal. Ale vďaka dynamike prostredia, v ktorom sa nachádza, jeho spôsob navigácie

bezpečne funguje.

Podobne to robí v živej prírode slimák Litorino, ktorý bol inšpiráciou pre Brooksa

(Brooks, 1999). Tento slimák vylieza za odlivu z mora na breh, kde sa živí vyplavenými

kôrovcami. Zaujímavé je, že sa vôbec nevie vrátiť naspäť a pri chove v akváriu by vyšiel

von a zdochol. Späť do mora ho v prírode vracia príliv, na ktorý sa na Zemi naozaj dá

spoľahnúť.

Zatiaľ čo kognitivisti sa obracajú na filozofiu, v ktorej hľadajú všeobecné princípy

myslenia, postkognitivistický prístup čerpá námety hlavne z neurobiológie, vývinovej

psychológie ako aj evolučnej biológie.

Page 80: Kognitívna veda a umelá inteligencia

80

5.4 Senzomotorický prístup k modelovaniu mysle

Jedným z prístupov spadajúcich pod postkognitivistický prístup k modelovaniu mysle,

ktorý sa inšpiruje výskumom vo vývinovej psychológii je tzv. senzomotorický prístup.

Prvý, kto prišiel s myšlienkou, že myslenie sa formuje nielen z vnímania, ale aj zo

senzomotorickej činnosti, bol zrejme Jean Piaget. Odvodil ju z experimentov ako je

napríklad „Chyba A non B“ (The A not B error) (obrázok 8): Dieťaťu je prezentovaná

scéna s dvoma skrýšami. Do jednej zo skrýš schovávame pre dieťa zaujímavý predmet

a demonštrujeme, že odkrytím skrýše sa vieme predmetu opäť zmocniť. Opakujeme to,

pokým sa dieťa nenaučí predmet odkryť. Potom predmet schováme do druhej skrýše.

Napriek tomu, že dieťa vidí kde predmet schovávame, dieťa mladšie ako 10 mesiacov,

nebude hľadať schovaný predmet tam, kde sme ho schovali, ale tam, kde ho predtým

nachádzalo. Piaget z tohto pokusu urobil záver, že dieťa nie je schopné predmet

reprezentovať nezávisle od motorickej akcie, ktorou sa ho zmocňuje. Obdobie vývinu

dieťaťa, v ktorom sú jeho reprezentačné schopnosti takto obmedzené, nazval

senzomotorickým obdobím.

Obrázok 8. Experiment „Chyba A non B“.

Podľa Lindy Smithovej (Smith, 2008) mal síce Piaget pravdu v tom, že prvé

reprezentácie u dieťaťa sú senzomotorické, ale mýlil sa v predstave, že v neskorších

vývinových fázach sú tieto reprezentácie nahradené dokonalejšími. Smithová

predpokladá, že experimenty ako je „Chyba A non B“ odhaľujú najvnútornejšiu črtu

našich kognitívnych schopností, ktorá nás sprevádza celým životom. Senzomotorické

obdobie dieťaťa je podľa nej špecifické len tým, že táto črta ľahko vypláva na povrch

a môžeme ju tak zvonku pozorovať. Dokonca i v tomto období môžeme zabrániť

vonkajšiemu prejavu chyby, pokiaľ medzi zmenou skrýše zmeníme polohu dieťaťa

(napríklad sediace postavíme, alebo stojace posadíme – pritom stále sediace alebo stále

stojace dieťa chybu demonštruje) alebo zmeníme čokoľvek čo má súvis s „rečou jeho

tela“ (napríklad mu dáme na zápästie závažie).

Page 81: Kognitívna veda a umelá inteligencia

81

Tento názor veľmi dobre zapadá do predstavy, že myseľ je dokonalý systém

poskladaný z nedokonalých vecí, ktoré vyplávajú na povrch pri rôznych klamoch. Akcie

tu nie sú len následkom vnímania, ale aktívne sa podieľajú na konštitúcii vnímania.

Motorická zložka môže byť podstatná aj vtedy, keď sa nám na prvý pohľad zdá, že

sa pozorovaný subjekt vôbec nehýbe. Bompas a O’Regan (2006) napríklad ukázali, že

motorika okohybných svalov má vplyv na vnímanie farieb. Testovaným osobám

predkladali do pravej časti zorného poľa zelenú škvrnu a do ľavej červenú v rôznom

poradí. Potom im ukazovali v oboch častiach žltú rôznych odtieňov. Pri normálnom

pohybe očí testovanej osoby dochádzalo k tomu, že rovnaký vnem vyvolávali rôzne

odtiene žltej – na pravej strane musela byť bližšie k zelenej a na ľavej k červenej. Pokiaľ

boli oči fixované, k tomuto efektu nedochádzalo. Autori testu predpokladajú, že

motorické dáta z oko-hybných svalov sú použité na kalibráciu sýtosti farieb.

Smithová (2008) sa zamerala na spôsob, akým deti v nízkom veku manipulujú

s objektmi v ich okolí v porovnaní s dospelými. Na základe analýzy videa z kamery

umiestneného na čele dieťaťa a dospelého objektívne preukázala, že dieťa si na rozdiel od

dospelého aktívne umiestňuje predmety do zorného poľa tak, aby ho prakticky celé

pokrývali. To mu má umožniť lepšie oddeliť daný predmet od ostatnej scény, uložiť si do

pamäti jeho opis a následne tak eliminovať potrebu si ho prikladať k očiam, lebo

zapamätané parametre vie použiť na to, aby ho rozpoznalo aj diaľky a v rámci zložitejšej

scény. Toto pozorovanie je zaujímavé z toho hľadiska, že varuje inžinierov, ktorí sa

zaoberajú rozpoznávaním scény, že snímanie obrazu z kamery a jeho následné

spracovanie nedáva dostatočný materiálny základ na napodobnenie analogického

rozpoznávacieho mechanizmu u človeka. Na správnu kalibráciu takéhoto systému môže

byť nevyhnutný aj aktívny pohyb kamery, či dokonca manipulátor na umiestňovanie

predmetov do zorného uhla kamery. Zo Smithovej experimentu by mohlo dokonca

vyplývať, že je veľmi podstatné mať dve kamery s možnosťou ovládania ich zaostrenia.

Pokiaľ si totiž dieťa umiestni predmet blízko k očiam, ľahko ho odseparuje od zvyšku

scény aj tým, že keď naň zaostrí zrak, je to jediný predmet, ktorý vidí ostro. Používanie

zdanlivo dokonalejšieho vizuálneho systému na simuláciu zraku môže takto zmariť

simuláciu zrakového vnímania v zárodku – keďže aktívnou motorikou sa niektoré

zdanlivé nevýhody dajú využiť. Motorické dáta oko-hybných svalov sú opäť zjavne

jednoduchšie než obraz a môžu hrať nezastupiteľnú úlohu vo formovaní rozpoznávacieho

mechanizmu. Tento prístup demonštrujeme na jednoduchom príklade mobilného robota

rozpoznávajúceho scénu (obrázok 9).

Page 82: Kognitívna veda a umelá inteligencia

82

Obrázok 9. Mobilný robot a objekty v scéne.

Obrázok 10. Pohľad spredu (vľavo) a zboku (vpravo).

Predstavme si teraz, že robot vidí to, čo je obrázku 10 vľavo. Otázka je čo vlastne

vidí: jeden objekt alebo dva? My vidíme dva, ale ako na to príde náš robot? Tradičný

prístup v počítačovom videní sa snaží určiť, čo je na obraze vypuklé, čo duté a pod.,

následne odhadnúť hĺbku (vzdialenosť od kamery) pre každý pixel obrazu a na základe

určitej logiky – preferujúc určité štandardné tvary objektov – rozhodnúť, či ide o jeden, či

o dva objekty.

Obrázok 11. Jedno z možných vnímaní scény z pohľadu robota (výsledok segmentácie).

Page 83: Kognitívna veda a umelá inteligencia

83

motorická

akcia robota

preskúmavaný

objekt

Obrázok 12. „Nadrôtovaná“ motorická akcia robota za účelom preskúmania objektu.

Senzomotorický prístup na to ide inak. Predpokladá, že v momente keď robot prvý

raz čelí pohľadu z obrázku 10 vľavo, nie je schopný vydolovať z neho úplnú informáciu.

Je však schopný na scénu aplikovať málo účinnú, ale rýchlu segmentáciu – napríklad

metódou (nehierarchického) zhlukovania do dvoch skupín (2-means clustering) (obrázok

11), ktorá mu napovie, že niečo na scéne je. Robot taktiež vie zhruba určiť vzdialenosť

videného, predpokladajúc, že sa videné nachádza na zemi a vediac výšku a orientáciu

kamery. Na základe predstavy o relatívnom umiestnení robota a objektu na pôdoryse

scény sa robot postaví do určitej vzdialenosti čelne k predmetu a spustí motorickú akciu

za účelom bližšieho preskúmania objektu.

Táto motorická akcia môže byť načisto „nadrôtovaná“ a obchádza predmet z pravej

strany, pričom tento pohyb je prerušovaný otáčaním sa k objektu a späť (obrázok 12).

Dôležité je, že motorická akcia je dostatočne krátka na to, aby sa dalo zo sekvencie

príkazov na motory s dostatočnou presnosťou vedieť po akej trajektórii šiel robot.

Obrázok 13. Pozorovaný objekt z rôznych pohľadov.

Pri tomto pohybe si robot segmentuje obraz z rôznych pohľadov (obrázok 13).

Keďže robot predpokladá, že motorickú akciu dokáže vykonať presne – takže vie

relatívne polohy miest, z ktorých sa bude na objekt pozerať, zlúčiť jednotlivé pohľady nie

je ťažké. Takáto 3D rekonštrukcia pochopiteľne nie je presná, je však vykonateľná

v reálnom čase a jej výsledkom je zistenie, že predmety sú dva, jeden menší, jeden väčší.,

jeden vyšší, jeden nižší a podobne (obrázok 14).

Page 84: Kognitívna veda a umelá inteligencia

84

Obrázok 14. Rekonštrukcia objektov z rôznych pohľadov robota, objekty na scéne sú

reprezentované čiernymi plochami (pohľad na scénu zhora).

Z takýchto čiastočných reprezentácii je možné aj v „mysli“ robota rekonštruovať

videné objekty a hoci sú veľmi nepresné, sú v princípe dostatočné na vykonanie rôznych

simulácií, napríklad, či by bolo možné položiť panáčika na kváder.

Obrázok 15. Zložitejšia reprezentácia objektu v “mysli“ robota. Zľava doprava, zhora dole: obraz

v odtieňoch šedej, hrany získané algoritmom Canny, orientácie hrán, mriežka regiónov položená

na obraz, význačné orientácie v každom regióne, jedna zo šablón reprezentujúcich objekt.

Page 85: Kognitívna veda a umelá inteligencia

85

Poznáme už aj rafinovanejšie reprezentácie, výpočtovo náročnejšie, ale oveľa menej

nepresné, ktoré umožňujú reprezentovať v mysli robota predmet tak kvalitne, že je to

porovnateľné s rozpoznávacou schopnosťou človeka. Najjednoduchšou z nich je

reprezentácia používaná metódou šablón z význačných orientácií (dominant orientation

templates). Získava sa z kontinuálneho snímania objektu z rôznych pohľadov

extrahovaním orientácii jeho hrán (obrázok 15), teda opäť tu ide o senzomotorický

prístup. Aj pri tejto metóde je možné použiť reprezentáciu objektu na jeho

zrekonštruovanie v umelej 3D scéne v „mysli“ robota, čím sa získa pomerne realistický

obraz, tvarom podobný, len veľkosťami nie celkom zhodný, videnému.

Ako vidíme, postkognitivistický prístup sa vyznačuje tým, že objekt môže byť

reprezentovaný mnohorakým spôsobom, pričom každý spôsob vyhovuje inému použitiu.

Na rozdiel od kognitivistického prístupu, ktorý hľadá jednu najlepšiu a univerzálnu

reprezentáciu, postkognitivisti používajú súčasne rôzne reprezentácie v závislosti od toho

akú aktivitu práve potrebujú vykonávať.

5.5 Záver

Kognitivistický i postkognitivistický prístup sa stále rozvíjajú a polemika medzi ich

stúpencami je stále veľmi živá. Oba ešte nepochybne prispejú k vytvoreniu zaujímavých

strojov vyznačujúcich sa umelou inteligenciou.

Literatúra

Bompas, A., O’Regan K. (2006): More evidence for sensorimotor adaptation in color

perception. Journal of Vision, 6, 145-153.

Boycott, B. (1965). Learning in the Octopus. Scientific American, 212(3): 42-50.

Brooks, R.: Cambrian Intelligence. The MIT Press, Cambridge, Mass., 1999.

Charron, C., Labbani-Igbida, O., Mouaddib, E. M. (2003): Sensory-motor approach to

shape recognition. Perception 32, ECVP Abstract Supplement.

Dennett, D. (1997): Typy myslí. Bratislava: Archa.

Hass, H. (1970): Human Animal: The Mystery of Man's Behaviour. Corgi Books.

Hinterstoisser, S., Lepetit, V., Ilic, S., Fua, P., Navab, N. (2010): Dominant Orientation

Templates for Real-Time Detection of Texture-Less Objects. IEEE Computer Society

Conference on Computer Vision and Pattern Recognition (CVPR), San Francisco,

California.

Kelemen, J. (1993): Strojovia a agenty, Archa, Bratislava.

Kelemen, J. (2010): Myslenie a stroj. Kaligram, Bratislava.

Lúčny, A. (2011): Multiagentový prístup k modelovaniu mysle - alebo ako sledovať

pingpongovú loptičku. V knihe Umelá inteligencia a kognitívna veda III, STU

Bratislava.

Minsky, M. (1986): Society of Mind. Simon & Schuster, New York.

Piaget, J., Inhelderová, B. (1993): Psychológia dieťaťa. SOFA, Bratislava.

Page 86: Kognitívna veda a umelá inteligencia

86

Smith, L. (2008): From Fragments to Geometric Shape: Changes in Visual Object

Recognition Between 18- and 24-Months. Current Directions in Psychological

Science, 18(5), 290-294.

Sonka, M., Hlaváč, V., Boyle, R. (2007): Image Processing, Analysis and Machine Vision

(3. vyd.), Thomson Learning, Toronto.