Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
1
Kognitívna veda a umelá inteligencia
Kolektív autorov:
Igor Farkaš
Barbora Cimrová
Ján Rybár
Martin Takáč
Andrej Lúčny
Katedra aplikovanej informatiky /
Centrum pre kognitívnu vedu
Fakulta matematiky, fyziky a informatiky
Univerzita Komenského v Bratislave
Vydané pre Univerzitu Hradec Králové
v rámci projektu "Informační, kognitivní a interdisciplinární podpora
výzkumu" (reg. č. CZ.1.07/2.3.00/20.0001)
Február 2013
2
Obsah
1 Paradigmy a metódy výskumu v kognitívnej vede
(Igor Farkaš)
2 Neuroveda – strategická oblasť výskumu v kognitívnej vede
(Barbora Cimrová)
3 Fundamentálne aspekty kognície: percepcia a pamäť
(Ján Rybár)
4 Reprezentácia významov v živých a umelých systémoch
(Martin Takáč)
5 Postkognitivistický prístup k percepcii a akcii v mobilnej robotike
(Andrej Lúčny)
3
Kapitola 1
Paradigmy a metódy výskumu v kognitívnej vede
IGOR FARKAŠ
„Veda sa vyvíjala opačným smerom, než aký by sa bol dal očakávať. To,
čo bolo od nás najviac vzdialené, sme opísali pomocou prírodných
zákonov ako prvé, a potom postupne to, čo k nám bolo bližšie: najprv
vesmír, potom Zem, svet zvierat a rastlín, potom ľudské telo, a napokon
(hoci stále veľmi neúplne) ľudskú myseľ.“
(B. Russell, 1935)
1.1 Úvod
Snahy o pochopenie fungovania ľudskej mysle siahajú až do antických čias, keď boli
výsostnou doménou filozofov. Už tí si kládli otázky, v akom vzťahu je myseľ (duša) k
telu, ktoré znalosti sú vrodené, a ktoré sa učíme, a ako ich získavame, či fyzikálne a
abstraktné objekty existujú nezávisle od nás alebo sú výplodom ľudskej mysle atď. Až
koncom 19. storočia sa od filozofie oddelila psychológia, postupným zavádzaním nových
vedeckých metód skúmania. Ďalším významným míľnikom v histórii bola polovica 20.
storočia, keď tzv. kognitívna revolúcia, predznamenaná prvým Hixonským sympóziom
konanom v Kalifornii v roku 1948, viedla k vzniku kognitívnej vedy, ako vedy o poznaní
(z lat. cognitio). Táto udalosť bola vyvrcholením paralelných snáh o skúmanie ľudskej
mysle (mind) a mentálnych procesov (Gardner, 1987). Tieto snahy sa týkali materských
disciplín kognitívnej vedy (časť 1.2), čím sa vytvorili predpoklady pre zrod tejto novej
vednej disciplíny. Na myseľ a kognitívne procesy sa môžeme pozerať z rôznych
perspektív, využívajúc pritom odlišné metódy skúmania. To si vyžaduje samotný objekt
skúmania – myseľ, kvôli svojej komplexnosti, ako aj „špeciálnemu“ statusu. Na jednej
strane, myseľ je privátna (perspektíva prvej osoby) a vlastnému subjektu prístupná, vďaka
čomu ten dokáže vypovedať o (niektorých) svojich mentálnych stavoch. Na druhej strane,
mozog, ako predpokladaný fyzikálny substrát mysle, je objektívne pozorovateľný
(perspektíva tretej osoby), takže ho môžeme skúmať metódami prírodných vied, no
človek samotný k nemu nemá prístup (nie sme si vedomí aktivity vlastného mozgu).
Aj keď myseľ nie je dobre definovateľná entita (môžeme povedať, že neexistuje v
tomto smere v odbornej literatúre jednotný názor), snažíme sa ju skúmať vedeckými
metódami, aj keď nepriamo, napríklad pozorovaním správania alebo pomocou rôznych
fyziologických meraní. Tento proces skúmania je zložitý, pretože schopnosti a prejavy
človeka sú veľmi rozmanité a komplexné. Možno aj preto v súčasnosti stále neexistuje
konsenzus, či kognitívna veda je samostatnou vednou disciplínou alebo stále ostáva
súborom viacerých vedných smerov, z ktorých každý nezávisle napreduje so svojimi
metódami a špecifickými aspektmi skúmania mysle (Greco, 2012).
4
Ďalej budeme postupovať nasledovne. V časti 1.2 uvedieme krátky prehľad
materských disciplín kognitívnej vedy a spomenieme i niektoré kľúčové pojmy. Časť 1.3
je „preletom ponad“ hlavné paradigmy kognitívnej vedy. V častiach 1.4 a 1.5
konkrétnejšie vysvetľujeme dva pojmy – reprezentáciu a počítanie. V časti 1.6 uvedieme
argumenty v prospech paradigmy ukotvenej kognície a časť 1.7 je stručným záverom.
1.2 Materské disciplíny kognitívnej vedy
Myseľ je predmetom skúmania viacerých vedeckých disciplín. Samozrejme historicky
najstaršou disciplínou je filozofia, založená na vnútornom pozorovaní (introspekcii)
myšlienok, pocitov, predstáv či želaní. Introspektívne poznanie tvorilo podľa viacerých
filozofov základnú metódu, ako sa oboznamovať s vlastnou skúsenosťou. Okrem toho,
tento spôsob sa používal aj pri uvažovaní o mentálnych stavoch druhých. Aj keď filozofiu
možno vnímať v porovnaní s prírodovednými metódami ako menej exaktnú, úloha
filozofie mysle bola a ostáva veľmi dôležitá. Namiesto odpovedí sa filozofi mysle snažia
spochybňovať teórie a formulovať otázky. Dokážu sa však pozerať na svet s nadhľadom a
nútiť expertov k reflexii o vlastnom snažení. Ich filozofické otázky sa obyčajne týkajú
ontológie (povahy existencie niečoho) a epistemológie (podstaty poznávania). Príkladom
ontologickej otázky môže byť to, či povaha existencie nejakého fyzikálneho objektu
(povedzme kameňa alebo mozgu) je rovnaká ako v prípade nejakého abstraktného
objektu (napríklad prvočísel, alebo mentálnych predstáv). Epistemologická otázka sa
môže týkať napríklad toho, či je niečo poznateľné, alebo aký je vzťah znalostí k pravde,
či presvedčeniam.
Keď sa (vedecká) psychológia odčlenila od filozofie, prevzala od nej síce
introspekciu ako metódu skúmania, ale hlavne ju obohatila o iné metódy – skúmanie
pomocou behaviorálnych experimentov, ktorých dizajn, realizácia a vyhodnocovanie sú
podložené štatistickou teóriou. Kognitívni psychológovia robia experimenty s ľudskými
subjektmi, alebo zvieratami, formulujú teórie a vedecké hypotézy, ktoré potom overujú
pomocou ďalších experimentov. Psychológia predstavuje veľmi dôležitú súčasť
kognitívnej vedy a v súčasnosti sa kognitívna psychológia stáva dokonca dominantnou z
hľadiska počtu publikácií (Gentner, 2010). Experimentálnych poznatkov týkajúcich sa
rôznych kognitívnych funkcií (percepcia, pamäť, plánovanie, rozhodovanie, konanie a
iné) je v súčasnosti veľmi veľa, no stále nie dosť, pretože i v rámci psychológie existuje
nejednoznačnosť v interpretácii výsledkov. To znamená, že namerané dáta sa dajú
vysvetliť rôznymi spôsobmi a teda môžu byť niekedy konzistentné s viacerými teóriami.
Ďalšia materská disciplína je lingvistika, pretože jazyková schopnosť človeka si
zasluhuje špecifické postavenie. Jazykovedci využívajú fakt, že jazyk je akousi bránou do
mysle človeka (čo v prípade zvierat neplatí, na rozdiel od niektorých iných kognitívnych
funkcií, ktoré človek so zvieratami zdieľa). Lingvistika, ako veda o jazyku, má svoje
bohaté vnútorné členenie. Tu spomeňme len dve podoblasti, dôležité z pohľadu
kognitívnej vedy. Psycholingvistika, t.j. psychológia jazyka, sa zameriava na
psychologické experimenty zamerané na skúmanie jazykového správania.
Neurolingvistika si všíma súvislosti medzi poškodeniami mozgu a jazykovým správaním,
čo umožňuje hľadať tzv. neurálne koreláty jazykových funkcií.
5
Nemenej zásadnú rolu pri konštituovaní kognitívnej vedy zohrala umelá inteligencia
a vznik digitálneho počítača, ktorý vniesol do kognitívnej vedy novú paradigmu (ale i
nové otázky). Metafora mozgu ako počítača, a mysle ako jeho softvéru, navodila
intuitívne zaujímavú predstavu (v duchu funkcionalizmu) o tom, ako by mohla myseľ
fungovať. Okrem toho, snaha modelovať ľudské myslenie a správanie pomocou
formálnych metód (matematických a algoritmických postupov) dodala skúmaniu kognície
väčšiu exaktnosť. Navrhnúť inteligentné systémy, resp. autonómne robotické systémy
vybavené počítačom (umelým mozgom), je dlhodobým cieľom umelej inteligencie, ktorý
napriek viacerým nezdarom a sklamaniam je stále živý, aj vďaka novým, prírodou
inšpirovaným prístupom, napríklad v rámci kognitívnej robotiky (Asada a spol., 2009).
V rámci súčasných empirických vied sa kognitívna neuroveda snaží dávať do súvisu
kognitívne funkcie (myseľ) s rôznymi časťami mozgu, Spočiatku to bolo hlavne pomocou
behaviorálnych experimentov. K tomuto skúmaniu od 80. rokov minulého storočia
výrazne napomáhajú zobrazovacie metódy mozgu, ktoré nám poskytujú pomerne detailnú
informáciu o činnosti rôznych častí mozgu pri vykonávaní kognitívnych úloh. Ukazuje
sa, že je dôležité skúmať mozog, ak chceme spoznať myseľ (pozri kapitolu 2). Opierame
sa pritom o principiálny predpoklad, že všetky myšlienkové pochody charakterizujúce
myseľ majú svoj biologický základ (korelát).
Napokon, k materským disciplínam kognitívnej vedy sa radí aj kognitívna
antropológia, pretože človek je sociálna bytosť, a tak jeho poznanie a s tým súvisiaci
vývin mysle závisí aj od kultúry. Kognitívni antropológovia sa teda pozerajú na ľudský
druh ako na spoločnosť jedincov, v rámci ktorej vzniká a šíri sa poznanie a kultúrna
inovácia. Kognitívna antropológia sa zaoberá otázkami týkajúcimi sa toho, čo ľudia z
rôznych komunít vedia a ako ich znalosti ovplyvňujú ich vnímanie a interakciu vo svete
okolo nich.
1.2.1 Interdisciplinarita
Jednou zo základných otázok kognitívnej vedy je, či je multidisciplinárna alebo
interdisciplinárna. Multidisciplinarita je neintegratívna, čo znamená, že každá disciplína
si zachováva svoje metodológie skúmania ako aj predpoklady, z ktorých vychádza. Na
druhej strane, interdisciplinarita prekračuje tradičné hranice medzi disciplínami. V oboch
prípadoch možno kognitívnu vedu metaforicky ilustrovať ako snahu o skúmanie veľkého
objektu (napríklad slona) prostredníctvom skupinky nevidiacich vedcov, z ktorých každý
môže preskúmať svojimi dotykmi len nejakú časť. Ich vzájomná komunikácia by však
mohla vyústiť v skupinové poznanie celého objektu.
Každá zo spomínaných disciplín teda prináša so sebou svoje tehličky do mozaiky
poznania kognitívnych procesov. Empirické metódy sú zdrojom informácií pre vznik
teórií a výpočtových modelov, ktoré sa snažia vysvetliť namerané dáta. Tým jednak
ponúkajú mechanistické vysvetlenia,1 ako by myseľ mohla fungovať, a na druhej strane
1 Mechanistický prístup k vysvetľovaniu nejakého fenoménu, založený na redukcionizme, netreba
chápať nejako pejoratívne, či znevažujúco. Ide o štardardný vedecký prístup, ktorého podstatou
je pochopiť fenomén rozkladom na (predpokladané) časti (redukcionizmus) ale aj na interakcie
medzi nimi (rekonštrukcia).
6
ponúkajú nové, testovateľné predikcie, ktoré inšpirujú nové experimenty. Tento cyklický
proces poznávania si bude určite vyžadovať ešte veľa iterácií, a to najmä kvôli
nerozhoduteľnosti medzi rôznymi teóriami ako aj nedostatku dobrých a overiteľných
výpočtových modelov (Addyman a French, 2012).
1.2.2 Dôležité pojmy kognitívnej vedy
Ak sa pozrieme na rôzne pokusy o definíciu kognitívnej vedy, môžeme si v nich všimnúť
niekoľko dôležitých pojmov. Napríklad filozof John Searle (1984) uvádza, že “úlohou
kognitívnej vedy je charakterizovať mozog, no nie na úrovni neurónov, ani na úrovni
vedomých mentálnych stavov, ale na úrovni jeho fungovania ako systému spracovania
informácií.” Jeden z otcov umelej inteligencie, Herbert Simon (1989) píše, že „kognitívna
veda je štúdiom inteligencie a inteligentných systémov, so zvláštnym zreteľom na
inteligentné správanie ako počítanie.” Kognitívny vedec Paul Thagard (2001) zase zužuje
pozornosť na myslenie a tvrdí, že „myslenie možno najlepšie vysvetliť v termínoch
reprezentačnej štruktúry mysle a výpočtových procedúr, ktoré pracujú s týmito
štruktúrami“ (Thagard, 2001). V týchto definíciách (a mnohých ďalších) sa vyskytujú
viaceré kľúčové pojmy, ako mentálne stavy, reprezentácie, spracovanie informácie,
výpočtové operácie, úrovne abstrakcie, a iné. Môžeme teda povedať, že reprezentačno-
výpočtový pohľad na myseľ hrá v kognitívnej vede významnú úlohu. Názory sa však
odlišujú v tom, aké reprezentácie a aké výpočty s nimi v mysli prebiehajú. Týmto
pojmom sa preto budeme bližšie venovať v ďalšom texte.
1.2.3 Úrovne analýzy
V snahe o poznávanie mozgu/mysle hrá tiež dôležitú úlohu úroveň abstrakcie. Významný
britský neurovedec a psychológ David Marr (1982) predstavil svoju teóriu, v ktorej
postuloval existenciu troch nezávislých, komplementárnych úrovní abstrakcie, analýzy
(vysvetlenia nejakého fenoménu) – výpočtovej, algoritmickej a implementačnej. Táto
teória bola rozpracovaná v kontexte Marrovho modelu spracovania vizuálnej informácie,
a pomocou nej zdôraznil podobnosť mozgu/mysle s počítačom. Výpočtová úroveň
definuje, aká informácia sa počíta a prečo, bez bližšej špecifikácie. Algoritmická úroveň
už vyžaduje znalosť o používaných reprezentáciách, uchovávajúcich informácie, a o
algoritmických výpočtoch s nimi. Implementačná úroveň sa týka opisu konkrétneho
algoritmu realizovateľného na konkrétnom fyzickom substráte. Tieto úrovne sú
považované za vzájomne nezávislé a platí medzi nim vzťah, že jedno vysvetlenie na
vyššej úrovni sa dá transformovať na viacero vysvetlení na nižšej úrovni (princíp
viacnásobnej realizovateľnosti). Ako ilustračný príklad uvažujme násobenie dvoch
viacciferných čísel. To je teda cieľ výpočtu, ktorý sa dá dosiahnuť rôznymi algoritmami,
napríklad takým, ktorý človek bežne používa, a v ktorom sa medzivýsledky násobenia
(jedného čísla číslicou druhého čísla) zapíšu pod seba a potom sa sčítajú. Napokon,
implementačná úroveň už predstavuje konkrétnu realizáciu tohto algoritmu v nejakom
fyzickom médiu (počítač, pero a papier, a i.).
7
1.3 Paradigmy kognitívnej vedy
Od svojich počiatkov prešla kognitívna veda za 60 rokov svojej existencie vývojom,
ktorý sprevádzali štyri významné paradigmy – symbolizmus, konekcionizmus,
dynamické systémy a pravdepodobnostné prístupy. Zrejme by bolo dobré najprv objasniť
význam pojmu paradigma. Významný americký filozof vedy T. S. Kuhn zadefinoval
vedeckú paradigmu ako „všeobecne uznávaný vedecký pokrok, ktorý na nejaký čas
ponúka modelové problémy a riešenia pre komunitu výskumníkov“ (Kuhn, 1996, s. 10).
Každá paradigma teda prináša nový pohľad na študovaný fenomén, podložený nejakou
teóriou, prípadne empirickými poznatkami, a býva často spojená s kontrastom voči
predchádzajúcej paradigme. Kuhn okrem iného zaviedol aj termín posun v paradigme
(paradigm shift), ktorý vyjadruje prechod z jednej paradigmy na druhú, aj keď napríklad
v prípade kognitívnej vedy môžeme povedať, že prechody medzi paradigmami sú
pozvoľné, a viaceré paradigmy stále koexistujú, pretože majú svojich stúpencov (aj keď
ich význam sa s časom mení).
Všetky štyri vyššie spomínané paradigmy sa dotýkajú výpočtových prístupov pri
formalizácii mysle a mentálnych procesov, no majú aj svoje filozofické aspekty týkajúce
sa vzťahu mysle a mozgu. Formálne výpočtové prístupy, ako bolo spomínané, ponúkajú
explicitné mechanizmy fungovania mysle/mozgu, čo principiálne nemožno dosiahnuť
pomocou teoretických modelov (s krabičkami a šípkami). V týchto paradigmách
vystupujú vyššie spomínané pojmy, no nie vždy sa používajú s rovnakým významom, čo
sa pokúsime objasniť.
1.3.1 Symbolizmus
Vznik symbolizmu (známeho aj ako kognitivizmus
alebo klasická paradigma) bol
stimulovaný vynájdením moderných digitálnych počítačov, ktoré realizujú diskrétne
výpočty so symbolmi. Výpočet v počítači prebieha za pomoci dvoch odlišných
kľúčových komponentov: procesora a pamäte. Procesor sériovým spôsobom spracováva
symboly, uložené v pamäti a vykonáva pritom inštrukcie podľa programu uloženého
v inej časti pamäte. Interakcia počítača s prostredím je na periférii záujmu a prebieha
prostredníctvom vstupno-výstupných podsystémov, ktoré (vhodnou transformáciou)
sprostredkovávajú vstupy pre centrálny procesor a pre výstupy z neho. Klasická
paradigma poníma myseľ ako výpočtový stroj, oddeliteľný od prostredia, ktorý
manipuluje s internými symbolmi podľa logických pravidiel, podobne ako to robí počítač.
Výpočtovú teóriu mysle vystihuje hypotéza o fyzikálnom symbolovom systéme, ktorý
podľa jej autorov „disponuje nutnými a postačujúcimi prostriedkami na všeobecné
inteligentné konanie“ (Newell a Simon, 1976).2 Významným počiatočným impulzom pre
symbolizmus bol návrh operacionalizácie testu procesu myslenia, známeho ako Turingov
test (Turing, 1950), podľa ktorého by počítač, pokiaľ by prešiel úspešne testom,
vykazoval inteligentné správanie, neodlíšiteľné od správania človeka.
2 Čo to presne je inteligentné konanie/správanie nás teraz nemusí trápiť. Postačí, že čitateľ má o
tom intuitívnu predstavu. Viac na túto tému možno nájsť napríklad v práci Šefránek, Takáč a
Farkaš (2008).
8
Vychádzajúc zo skorších prác symbolikov (Turing, 1950; Newell a Simon, 1976;
Fodor, 1983), Harnad (1990) zrekonštruoval výstižnú definíciu symbolového systému, kde
kľúčovú úlohu hrá syntax, pričom sémantika sa dodá do systému „zvonka“ dizajnérom
systému. Harnad (1990) taktiež sformuloval problém ukotvenia symbolov, ktorý možno
považovať je jeden z kľúčových v oblasti kognitívnej vedy a akvizície významov (pozri
kapitolu 4).
Z pohľadu symbolizmu je teda podstatné, že myslenie (a tým aj konanie) človeka je
vnútorne riadené algoritmami, ktoré sú realizované programami, s využitím vhodných
reprezentácií (napr. predikáty alebo propozície), nejako implementovanými v mozgu.
Ako, to symbolizmus nerieši, pretože sa to považuje len za vec implementácie. Pri
počítačoch môžeme ľubovoľný algoritmus naprogramovať v nejakom programovacom
jazyku a potom ho implementovať vo zvolenej hardvérovej platforme. Podobná predstava
prevláda i v prípade mozgu. Nezáleží ako sú v mozgu implementované mentálne procesy.
Symbolový (algoritmický) pohľad na myseľ je dodnes viacerými odborníkmi
považovaný za tú správnu úroveň abstrakcie, a to najmä z troch dôvodov (Barsalou,
2008): (1) Poskytuje elegantné, transparentné, expresívne (silné) formalizmy na
reprezentáciu znalostí, (2) Zachytáva dôležité ľudské intuície týkajúce sa symbolového
charakteru kognície. Je možné, že ide o jednu z početných kognitívnych predispozícií
človeka (cognitive biases) smerom k diskrétnym formalizmom, pretože operácie
používané na symboloch sú blízke ľudskému mysleniu. (3) Dá sa dobre implementovať v
umelej inteligencii.3 Symbolizmus vníma kogníciu ako manipuláciu tzv. amodálnych
symbolov (t.j. nezávislých od modalít ako je zrak, sluch a iné zmysly) algoritmickým
spôsobom, čo vedie ku klasickému počítaniu, ktoré možno implementovať v
štandardných počítačoch. Symbolizmus sa používa najmä na vysvetľovanie procesov tzv.
vyššej kognície, ako je usudzovanie, plánovanie, a tiež používanie jazyka (napr. Fodor,
2000; Šefránek, 2002; Pinker 2009).
1.3.2 Konekcionizmus
Konekcionizmus predstavuje spektrum metód, ktoré vznikli v rámci umelej inteligencie, a
ktoré boli inšpirované architektúrou a fungovaním mozgu. Môžeme teda hovoriť o
inšpirácii „zdola.“ Konekcionistický systém pozostáva z množiny jednoduchých prvkov –
umelých neurónov, navzájom komunikujúcich cez váhované spojenia, ktoré predstavujú
dlhodobú pamäť systému. Sila konekcionistického systému – umelej neurónovej siete –
nie je v samotných neurónoch, ale v ich vzájomnom prepojení a interakcii. Paralelné
spracovanie a distribuovanosť aktivity predstavujú základný architektúrny rozdiel
v porovnaní so symbolovým systémom, pretože každý neurón je súčasne procesorom aj
pamäťou (aj keď elementárnou). Povaha komunikácie medzi neurónmi má numerický a
nie symbolový charakter, preto hovoríme v prípade sietí o tzv. subsymbolových
reprezentáciách.
Neurónová sieť môže pracovať so spojitými hodnotami, čo je veľmi vhodným
nástrojom na modelovanie kognície, pretože empirické dáta nasvedčujú tomu, že mnoho
3 Umelá inteligencia a výpočtová kognitívna veda majú veľa spoločného, no dá sa zhruba
povedať, že v umelej inteligencii menej záleží na biologickej prijateľnosti modelu.
9
kognitívnych procesov má spojité prejavy. Napríklad, nielenže perceptuálne vstupy (napr.
obraz na sietnici) a motorické výstupy bývajú spojité (pohyby, zvuková podoba reči), ale
podobne môžeme argumentovať aj v prípade modelovania vyšších procesov, napr.
rozhodovania (Spivey, 2007). Spomeňme si, aké ťažké môže byť niekedy rozhodnúť sa
medzi dvoma alternatívami. Tento proces „súperenia“ alternatív sa dá vysvetliť pomocou
neurónovej siete so spojitými aktiváciami. Neurónová sieť teda spracováva numerické
dáta v podobe vektorov. Operácie nad takýmito vektorovými dátami sú (nelineárnymi)
transformáciami, čo má svoje implikácie. Je zrejmé, že takéto operácie nie sú vôbec
transparentné, a preto sú človeku málo zrozumiteľné, a aj preto si neurónové siete
vyslúžili prívlastok „čierna skrinka.“ Môžeme však použiť techniky zhlukovania a
vizualizácie vysokorozmerných dát, ktoré nám pomáhajú odhaliť, čo sa v neurónovej sieti
deje (O'Brien a Opie, 2006).
Dôležitou vlastnosťou umelých neurónových sietí je to, že na rozdiel od symbolovej
umelej inteligencie, kde znalosť do systému vkladá dizajnér, ponúkajú biologicky
inšpirované mechanizmy akvizície znalostí, učenia, aplikovateľné na rôznych úrovniach
abstrakcie (Haykin, 2008; Kvasnička a spol., 1997). To znamená, že parametre siete
(váhy spojení) nemusíme explicitne nastaviť (čo sa prakticky ani nedá), no treba sieti
poskytnúť vhodný mechanizmus učenia. Podobne ako človek, neurónová sieť sa učí na
príkladoch. Učenie spôsobuje zmenu váh tak, aby sa po naučení dosiahlo požadované
správanie siete, čo formálne odpovedá hľadaniu extrému (minima, resp. maxima) nejakej
hodnotovej funkcie.
Na rozdiel od symbolizmu, konekcionizmus zahŕňa aj implementačnú úroveň
analýzy. Niektorí filozofi zastávajú názor, že toto nie je podstatné, pretože vysvetľované
fenomény treba oddeliť od mechanizmov ich vzniku (Abrahamsen a Bechtel, 2006),
avšak v konekcionistických modeloch sú tieto dva aspekty spojené. To znamená, že
existuje závislosť medzi implementovanými mechanizmami (danými neurálnymi
interakciami) a kognitívnymi fenoménmi (O'Reilly a Munakata, 2000). Inými slovami,
špecifikáciu neurónovej siete môžeme vytvoriť na výpočtovej úrovni (prostredníctvom
funkcie, ktorú chceme realizovať), no elementárne funkcie (týkajúce sa neurónov) už
umožňujú priamu implementáciu v hardvéri, s relatívne malou abstrakciou od
biologických neurónových sietí.
V prípade neurónových sietí tiež bežne hovoríme, že počítajú a spracovávajú
informácie. Počítajú však rovnako ako symbolové systémy? Detailnejší pohľad na
existujúce modely neurónových sietí nám napovedá, že tie nie sú homogénnou skupinou,
ale naopak, spektrom metód z pohľadu typov aktivácií neurónov a ich dynamiky.
Modely, ktoré pracujú v spojitom priestore, a niektoré dokonca v spojitom čase, sú
matematickými modelmi, ktoré sa dajú presne opísať len pomocou (nelineárnych)
diferenciálnych rovníc, a nie pomocou diskrétnych krokov výpočtu (počítačová
implementácia ponúka len aproximáciu). Zahrnutie takýchto modelov si vyžaduje
voľnejšiu definíciu počítania, o čom pojednávame ďalej. Od modelov neurónových sietí
pracujúcich v spojitom čase sa priamo dostávame k paradigme dynamických systémov.
10
1.3.3 Dynamické systémy
Čo klasická paradigma a konekcionizmus zdieľajú, je ich izolovanosť od okolitého
prostredia. V prípade symbolového modelu je to zjavné, pretože nezávislosť od prostredia
je jedným z predpokladov. Neurónová sieť sa síce učí, čiže interaguje s prostredím, no
bežným predpokladom je, že všetky trénovacie dáta máme hneď dispozícii, takže
interakcia nie je „plnohodnotná,“ pretože výstupy siete nemajú dopad na prostredie.
Takýto pohľad na kogníciu sa stal tŕňom v oku niektorým kognitívnym vedcom, ktorí
prišli s myšlienkou kognitívneho systému ako dynamického systému, ktorý predstavuje
proces interakcie s prostredím v spojitom čase a priestore (Thelen a Smith, 1994; Port a
van Gelder, 1995). Kognitívne procesy teda nie sú chápané izolovane od prostredia, ale
v úzkej previazanosti s ním (coupling). Kognitívne procesy ako aj konanie človeka sú
aktivitou v čase, ktorú môžeme opísať pomocou systému nelineárnych diferenciálnych
rovníc. Táto paradigma, postavená na teórii nelineárnych dynamických systémov
predpokladá existenciu dvoch kľúčových, vzájomne prepojených, typov premenných.
Jedným sú tzv. kolektívne premenné, ktoré zahŕňajú vzťahy medzi interagujúcimi
zložkami dynamického systému, a vysvetľujú správanie systému. Druhým typom sú
riadiace parametre, ktorých kvantitatívne zmeny môžu spôsobovať kvalitatívne zmeny v
správaní systému (tzv. fázové prechody). Príkladom takéhoto dynamického systému
môže byť pohyb koňa, ktorého rytmus pohybu (vyjadrený periodickými priebehmi
kolektívnych premenných) závisí od rýchlosti pohybu (riadiaci parameter). Kôň sa môže
pohybovať v každom čase len v jednom rytme, (fázové) prechody medzi nimi nemusia
nutne nastávať pri tých istých rýchlostiach, a závisia aj od stavu prostredia (napr.
hrboľatá cesta). Súčasťou takéhoto dynamického opisu kognitívneho procesu sa teda
priamo stáva aj prostredie, čo rozširuje konceptuálne chápanie mysle. Bressler a Kelso
(2001) argumentujú, že dynamický pohľad je relevantný aj pre charakterizáciu
samotných mentálnych procesov (vnútri kognitívneho systému), hoci identifikácia
kolektívnych premenných a riadiacich parametrov v tomto prípade je zatiaľ tvrdým
orieškom. Okrem toho, zmeny parametrov bývajú nastavované zvonka (dizajnérom), čo
je tiež slabou stránkou dynamických systémov (McClelland, 2009).
Dynamický pohľad na spoznávanie vonkajšieho sveta predstavuje pilier
zjednávacieho (enaktívneho) prístupu (Varela, Thompson a Rosch, 1991), kde sa dôraz z
vnútorných reprezentácií (vopred daného) vonkajšieho sveta presúva na vnímanie
a jednanie vo svete, ktorý sa takto spoluvytvára. Tým vzniká prostredníctvom spätnej
väzby kruhový proces, pretože zjednávaný svet je prostredím pre zjednávanie
(enactment), ale zjednávanie je súčasne predpokladom zjednávaného sveta. V rámci tohto
pohľadu si každý subjekt (kognitívny systém) zjedná svoj svet sám v procese dynamickej
interakcie so svetom (vrátane iných jedincov), a ten bude jedinečný. Zjednávací prístup je
teda založený na konceptoch ako skúsenosť, autonómia, emergencia a vytváranie
významov (sense-making) prostredníctvom skúsenosti. Táto perspektíva je predmetom aj
niektorých ostatných kapitol (4 a 5).
11
1.3.4 Pravdepodobnostné modely
Pravdepodobnostný prístup4 sa stal populárny v kognitívnej vede najmä v ostatnej dekáde
rokov (Perfors, Tenenbaum, Griffiths a Xu, 2011). Tento teoreticky podložený
Bayesovský prístup ktorý využíva široké spektrum reprezentácií (stromy, vektory,
logické pravidlá atď.), kombinuje ich so štatistickým učením a tvorením inferencií (t.j.
nových poznatkov na základe dedukcie) za prítomnosti neurčitosti, poskytuje vysvetlenia
na výpočtovej úrovni (v zmysle Marrovej taxonómie). Implementačná úroveň je
považovaná za menej dôležitú, nechávajúc priestor pre hľadanie potenciálnych
odpovedajúcich neurálnych mechanizmov. Na rozdiel od konekcionizmu, ktorý začína
zdola nahor definovaním mechanizmov, pravdepodobnostný prístup ide smerom zhora
nadol, začínajúc funkciou, ktorú chceme vysvetliť, hľadajúc optimálnu reprezentáciu na
vysvetlenie dát. Tento prístup zahŕňa aj dimenziu vrodené–získané (nature–nurture)
prostredníctvom tzv. induktívnych výchyliek (inductive biases), čo sú apriórne distribúcie
na množine hypotéz (vyplývajúce zo znalosti domény). Tie tiež vstupujú do výpočtov
aposteriórnych distribúcií, t.j. tých, ktoré zohľadňujú aj pozorované dáta. Hypotézy si
môžeme predstaviť ako rôzne riešenia alebo kategórie (napr. pri klasifikácii dát), ktoré
máme zistiť na základe apriórnych znalostí (o svete), ako aj pozorovaných dát.
Bayesovský prístup de facto kalkuluje s rôznymi riešeniami paralelne a s prichádzajúcimi
dátami ich aktualizuje, čo je v podstate tiež forma učenia na vyššej úrovni abstrakcie.
Pravdepodobnostný prístup dokázal vysvetliť rôzne prejavy ľudského správania
(pozri článok Griffiths, Kemp a Tenenbaum, 2010, a tamojšie referencie). Vysvetlenia na
výpočtovej úrovni sú považované nielen za výpočtovú abstrakciu skrytých mechanizmov,
ale ich zástancovia tvrdia, že majú nezávislú výpovednú hodnotu (platnosť). McClelland
(2009) však načrtáva niektoré otázky súvisiace s týmto prístupom. Pravdepodobnostný
prístup vychádza z presvedčenia, že ľudskú kogníciu je možné chápať ako sériu
optimálnych odpovedí (čo vedie k racionálnemu správaniu), vzhľadom na obmedzenia,
ktoré človek v danej situácii a kontexte. Vieme však, že človek niekedy koná
neracionálne, aj pod vplyvom emócií (teória ohraničenej racionality). Okrem toho,
problémom Bayesovských prístupov je ich výpočtová neúnosnosť v prípade modelovania
zložitejších problémov. Na druhej strane možno predpovedať, že zvýšený nárast o tieto
prístupy v ostatných rokoch predznamenáva ich možnú dôležitosť v budúcnosti. Bude
zaujímavé objavovať potenciálne linky medzi pravdepodobnostnou výpočtovou úrovňou
a neurálnou implementačnou úrovňou pri snahe pochopiť ľudskú myseľ.
1.4 Reprezentácia
Ako sme avizovali vyššie, pozrime sa teraz bližšie na pojem reprezentácia. Tento pojem
sa bežne používa nielen v umelej inteligencii, ale aj v kognitívnej psychológii, či
lingvistike. Jazykový pôvod tohto pojmu napovedá, že ide o re-prezentovanie niečoho
4 Na rozdiel od predchádzajúcich troch paradigiem, pravdepodobnostný prístup zrejme nenájdeme
medzi paradigmami v bežnej učebnici kognitívnej vedy. V literatúre niektorí hovoria o
modelovacom prístupe, no používajú sa aj spojenia Bayesovská paradigma. Nazdávam sa, že
Bayesovský prístup sa dosť odlišuje od ostatných paradigiem, preto medzi ne tiež patrí.
12
vonkajšieho (vo svete) niekde inde, vo vnútri nejakého systému (živého alebo umelého)
alebo i na papieri. V kognitívnej psychológii sa hovorí o mentálnych reprezentáciách, čo
je v podstate prvý teoretický konštrukt v kognitívnej vede (Pitt, 2008). Mentálna
reprezentácia je základným konceptom výpočtovej teórie mysle, podľa ktorej sú
kognitívne stavy a procesy konštituované výskytom, transformáciou a uchovávaním (v
mysli/mozgu) reprezentácií (t.j. štruktúr nesúcich informáciu) nejakého typu. Korene
pojmu mentálna reprezentácia však siahajú až do antických čias, keď širšie chápanie
tohto pojmu medzi filozofmi nemalo výpočtový charakter.5 Až neskorší predpoklad, že
reprezentácia je (abstraktný) objekt so sémantickými vlastnosťami (pozri aj kapitolu 4),
dal tomuto konceptu výpočtový charakter, pretože s takto definovanými objektmi by sa
už podľa predpokladu dalo manipulovať.
S nástupom umelej inteligencie sa hlavným cieľom stala reprezentácia znalostí, t.j.
snaha o formalizáciu znalostí takým spôsobom, aby sa dali uložiť a používať v počítači
(symbolovom systéme). Tu zohrali dôležitú úlohu lingvistika a logika, ktoré ponúkli
existujúce formalizmy na rôzne implementácie reprezentácie znalostí. Môžeme povedať,
že všetky znalosti (tzv. báza znalostí) sú z pohľadu klasickej paradigmy explicitné a
symbolové, a keď systém disponuje pravidlami odvodzovania (inferenčné mechanizmy),
dokáže si odvodiť ďalšie znalosti. Dôležitou vlastnosťou reprezentácií v symbolovom
systéme je, že sú stabilné. Môžu sa síce v čase meniť (ak je to súčasťou programu), ale sú
väčšinou kontextovo nezávislé. Napríklad, koncept6 strom je zväčša reprezentovaný
rovnakým amodálnym symbolom (alebo štruktúrou) vo všetkých prípadoch, a ak nie, tak
ku symbolu reprezentujúceho strom treba pridať iný symbol (alebo štruktúru), ktorý daný
kontext špecifikuje.
V prípade konekcionizmu majú reprezentácie inú povahu. Keďže vieme, že
dlhodobou pamäťou natrénovanej siete sú spojenia medzi neurónmi i so svojimi
hodnotami, znalosť je v sieti distribuovaná, a reprezentovaná implicitne a numericky.
Analýzou natrénovanej siete však vieme zväčša identifikovať, čo konkrétne neuróny a
spojenia medzi nimi zabezpečujú, aj keď komplikáciou je práve distribuovanosť
dlhodobej pamäti. Krátkodobá pamäť je realizovaná pomocou aktivácie neurónov, ako
odpovede na nejaký podnet (vonkajší alebo vnútorný). Miera distribuovanosti predstavuje
kontinuum, od úplnej distribuovanosti, cez riedke reprezentácie (sparse coding) až po
lokalistické reprezentácie (ktoré odpovedajú symbolovej reprezentácii).
V doméne dynamických systémov existuje radikálna téza, ktorá nepredpokladá
existenciu reprezentácií (Thelen a Smith, 1994). Dynamické procesy pracujú v spojitom
čase, a preto v žiadnom časovom okamihu nemôžeme predpokladať, že niečo z
vonkajšieho sveta by mohlo byť aktuálne reprezentované vnútri systému, pretože všetko
sa stále mení. Takýto postoj sa objavil aj v umelej inteligencii, keď Brooks (1986)
5 No už bolo možné hovoriť o reprezentačnej teórii mysle, ktorá pracovala s pojmami ako sú
myšlienky, presvedčenia, túžby, či obrazy, a ktorá sa v kognitívnej vede voľne zamieňa s
výpočtovou teóriou mysle. 6 V literatúre neexistuje konsenzus o definícii termínu koncept. Náš pohľad je konzistentný s
perspektívou kognitívnej sémantiky, t.j. koncept chápeme ako mentálny konštrukt (vzťahujúci
sa obyčajne na nejakú kategóriu), nezávislý od jazyka. Tým sa líši od pojmu, ktorý sa týka
prirodzeného jazyka. Oba termíny spolu súvisia: aby bol pojem pojmom, musí byť k nemu
priradený nejaký význam vyjadrený konceptom. Kognitívnej sémantike je venovaná kapitola 4.
13
navrhol tzv. subsumpčnú architektúru inteligentného systému v robotike ako alternatívu k
tradičnej symbolovej architektúre. Subsumpčná architektúra je hierarchická, symbolová,
no správanie robota je čisto reaktívne, čiže nevyžaduje vnútorné reprezentácie (pozri
kapitolu 5). Tento trend v robotike mal snahu priblížiť umelú inteligenciu ku kognitívnej
vede, no nezachytáva aspekty vyššej kognitívnej činnosti, ktorá sa nezaobíde bez
vnútorných mentálnych reprezentácií (Gärdenfors, 1996). Preto reprezentačno-výpočtový
prístup je kompatibilný s mäkšou verziou dynamickej paradigmy (Kelso, 1995; Port a van
Gelder, 1995), resp. s pohľadom na mozog ako na samoorganizujúci sa systém (Farkaš,
2006).
Pravdepodobnostné modelovanie využíva celé spektrum reprezentácií (symbolové,
numerické, grafové), a principiálne nemá žiadne obmedzenia v tomto smere, na rozdiel
od ostatných paradigiem. Znalosť v systéme je daná pomocou pravdepodobností a tie
nadobúdajú spojité hodnoty. Podobnosť s konekcionizmom spočíva v schopnosti učenia a
tiež v tom, že niektoré formy konekcionistického učenia majú prirodzenú Bayesovskú
interpretáciu (napr. Mackay, 1996). Okrem toho, niektoré tzv. generatívne
konekcionistické modely využívajú pravdepodobnostný rámec, pričom si zachovávajú
svoj „konekcionistický štýl” (Bengio, 2009).
1.5 Počítanie z pohľadu paradigiem
Všetky spomínané paradigmy sa síce dotýkajú počítania, ale bližší pohľad na tento
koncept nám prezradí, že ho musíme poňať inak, ako nám napovedá intuícia a tradičné
používanie tohto pojmu. Taktiež, úloha výpočtových modelov v kognitívnej role je
považovaná za dôležitú (McClelland, 2009; Farkaš, 2012) no kontroverznú, práve z tohto
dôvodu. Neexistuje konsenzus o význame kľúčových pojmov ako sú počítanie alebo
spracovanie informácie (Piccicini a Scarantino, 2011).
Vznik moderného digitálneho počítača v 50. rokoch minulého storočia bol
jednoznačne dôležitým míľnikom, ktorý stimuloval pokrok v mnohých vedných
disciplínach, vrátane umelej inteligencie a kognitívnej vedy. Avšak, svet počítania
vznikol dávno pred konceptom Turingovho stroja (Turing, 1936). Sloman (2002) uvádza
historický kontext, ktorý tomu predchádzal prostredníctvom návrhu rôznych typov
strojov a zariadení, u ktorých by sa dalo diskutovať či počítajú alebo nie (napríklad
tkáčske stroje, rôzne regulátory, triediace stroje a iné). Jedine v prípade univerzálneho
digitálneho počítača nikto nepochybuje, že počíta (pretože na ten účel bol
skonštruovaný), v prípade ostatných systémov sa názory rôznia (Farkaš, 2012).
Pochybnosti sa týkajú samozrejme i biologických systémov, vrátane mozgu, aj keď si
intuitívne možno myslíme, že mozog je určite výpočtový systém (Churchland a
Sejnowski, 1992). Táto otázka sa dotýka aj filozofie, pretože jedna vec je, čím mozog je
(ontologicky), a druhá (epistemologická), ako ho môžeme a chceme poznávať (napríklad
ako výpočtový systém). Výpočtový pohľad v kognitívnej vede je však napriek tomu
kľúčový, lebo poskytuje pridanú hodnotu, ako sme už spomínali vyššie (Farkaš, 2012).
Vysvetleniu pojmu počítanie a jeho využiteľnosti v kognitívnej vede môže
napomôcť rozšírenie obsahu tohto pojmu. V užšom slova zmysle sa počítanie spája s
diskrétnymi výpočtami v diskrétnom čase (klasické počítanie), zatiaľ čo v širšom slova
14
zmysle zahŕňa neklasické počítanie, ako napríklad analógové, kvantové alebo
pravdepodobnostné výpočty (Piccicini a Scarantino, 2011). Motiváciou pre tento posun
sú spomínané paradigmy kognitívnej vedy. Čo sa týka konekcionizmu, počítanie v
neurónovej sieti nemusí byť to isté ako počítanie v symbolovom systéme, ktorý vykonáva
program, realizujúci nejaký algoritmus sériovým spôsobom. Pracuje v diskrétnom čase, s
diskrétnymi entitami, symbolmi. Neurónové siete však nie sú homogénnou skupinou
metód, pretože niektoré modely neurónových sietí počítajú klasicky, niektoré neklasicky
a niektoré nepočítajú vôbec (Piccicini, 2008). To závisí od toho, či pracujeme v spojitom
alebo diskrétnom priestore a čase. Debaty ohľadne rozdielov medzi konekcionistickými a
symbolovými prístupmi možno nájsť v početnej literatúre. V kognitívnej vede prevláda
názor, že ľudská myseľ realizuje výpočty, a teda spracováva informácie, pričom my sa
tieto procesy snažíme vysvetliť pomocou formálnych modelov. Viacerí zástancovia
konekcionizmu zastávajú názor, že mozog vykonáva výpočty a že neurálne počítanie
vysvetľuje ľudskú kogníciu (napr. Feldman a Ballard, 1982; Churchland a Sejnowski,
1992; Bechtel a Abrahamsen, 2002; O’Brien a Opie, 2006). V čom sa líšia názory
konekcionistov a symbolikov je otázka, či konekcionistické modely sú lepšími
výpočtovými modelmi než klasické symbolové modely. Väčšina konekcionistov tvrdí, že
áno, symbolisti zase, že nie, lebo obe vysvetlenia sú vzájomne transformovateľné
(opierajúc sa o spomenuté dôkazy o ekvivalencii). Niektorí symbolici tvrdia, že
neurónové siete nepočítajú vôbec, alebo ak, tak len vtedy, keď implementujú symbolový
systém (Fodor a Pylyshyn, 1988). Niektorí prívrženci konekcionizmu zase zastávajú
názor, že mozog nie je výpočtovým systémom (napr. Edelman, 1992; Freeman, 2001), a
že naše výpočtové modelovanie je len jeho diskrétnou aproximáciou.
Čo sa týka ostatných paradigiem, v zmysle rozšírenej definície počítania dynamické
systémy nepočítajú vôbec (radikálna téza), alebo počítajú neklasicky (reprezentačno-
výpočtová pozícia). Pravdepodobnostné modely počítajú neklasicky, pretože pracujú
(obyčajne) v diskrétnom priestore spojitých pravdepodobností. Vo všetkých prípadoch
však počítač môžeme použiť ako nástroj na aproximáciu týchto modelov.7
1.6 Smerom k ukotvenej kognícii
Vývoj v kognitívnej vede možno pozorovať aj v kognitívnej psychológii, ktorá
prechádzala rôznymi štádiami. Venujme ešte pozornosť hlavným prúdom a teoretickým
koncepciám vo vývoji kognitívnej vedy, ktoré prispeli k posunu v dominantnosti
jednotlivých paradigiem (Gentner, 2010). Už v 70. rokoch minulého storočia sa v
kognitívnej psychológii objavovali skeptické pohľady na centrálnosť (vnútorných)
reprezentácií a symbolového spracovania informácie v ľudskej kognícii. Gibson (1970),
hlavný predstaviteľ prúdu známeho ako ekologická psychológia, zdôrazňoval, že „nie je
dôležité, čo je vo vnútri hlavy, ale vnútri čoho (akého prostredia) sa hlava nachádza.“
Tento prúd plynulo prešiel v 80. rokoch do teórie situovanej kognície, ktorá bola
postavená na predpokladoch, že ľudská inteligencia je fundamentálne interaktívna
7 To že diskrétny počítač úspešne používame na modelovanie kognitívnych procesov nehovorí
nič o tom, aká je povaha ľudskej kognície.
15
(Hutchins, 1996), a že ľudská kognícia je fundamentálne neoddeliteľná od kontextu
(Lave, 1988). Podľa prvého predpokladu človek bezprostredne využíva prostredie (iných
ľudí, zariadenia, situácie, atď.) pre svoje inteligentné konanie, a je s nimi spojený v rámci
spätnoväzbovej slučky. Druhý predpoklad viedol k rozšírenému chápaniu mysle a
kognície v zmysle jej umiestnenia aj do prostredia – myseľ človeka nesídli len v jeho
mozgu, ale jej súčasťou sú aj prvky prostredia (napr. knihy, obrazy, počítač, rôzne
poznámky a i.).
Dôraz na interakciu s prostredím ostal v centre pozornosti aj naďalej, no v 90. rokoch
sa začal klásť dôraz na reprezentácie, ktoré túto interakciu umožňovali, a to v rámci
prúdu stelesnenej kognície. Stelesnená (embodied) kognícia, podobne ako tvrdil Gibson,
vychádza z predpokladu, že pochopenie mentálnych procesov nemožno oddeliť od tela
človeka, konkrétne jeho zmyslov a motoriky. Stelesnená kognícia súčasne predpokladá,
že informácia vstupuje do tela organizmu v podobe modálnych reprezentácií a podieľa sa
na ďalších, vyšších procesoch kognície (Barsalou, 1999). Zmysly určujú povahu
perceptuálnych vstupov, a motorické ústrojenstvo zase určuje spektrum akcií, ktoré
človek môže vykonať, a ktoré tiež predstavujú obmedzenia pre vznik a modifikáciu
vnútorných reprezentácií. Napríklad, mentálna reprezentácia objektu kladivo nezahŕňa len
jeho perceptuálne vlastnosti, ale aj možnosti použitia tohto objektu (ak s ním dotyčný
subjekt má skúsenosť).
V komunite kognitívnej vedy sa objavilo viacero rôznych no súvisiacich pohľadov na
stelesnenie a situovanosť kognície (Gibbs, 2006; Wilson, 2002). Barsalou (2008) navrhol
termín ukotvená kognícia, ktorý zjednocuje rôzne aspekty stelesnenia a situovania
v prostredí. Silnú podporu pre túto paradigmu v kognitívnej vede možno nájsť v
narastajúcej empirickej evidencii (za ostatných 20 rokov), či už z behaviorálnych štúdií
alebo zobrazovacích metód (pozri početné referencie v Barsalou, 2008). Teórie ukotvenej
kognície sú síce opisné, podobne ako klasické teórie, no ponúkajú testovateľné hypotézy
pre ďalší empirický výskum (napr. Lakoff a Johnson, 1999; Smith, 2005) ako aj priestor
pre výpočtové modely. Zaujímavou predikciou týchto teórií je to, že všetky kognitívne
funkcie (vrátane tých vyšších) sú redukovateľné na (nízkoúrovňové) senzomotorické
procesy. Inými slovami, neurálne reprezentácie vyšších a nižších kognitívnych procesov
majú prienik. Tento pohľad na myseľ má svoju relevantnosť aj ohľadne jednej z
kľúčových otázok v kognitívnej vede, ktorou je otázka významov (kapitola 4). Táto
paradigma sa v literatúre nazýva aj postkognitivistická (kapitola 5).
1.7 Záver
V rámci prehľadu paradigiem kognitívnej vedy sme sa snažili objasniť ich podstatné
charakteristiky, podobnosti a rozdiely. Spomenuli sme kľúčové pojmy kognitívnej vedy –
reprezentácia a počítanie, a vysvetlili sme, že pojem počítanie musíme chápať širšie než
ponúka klasická počítačová metafora mysle. Výpočtové modelovanie v kognitívnej vede
možno považovať za nevyhnutný metodologický komponent, ktorý ponúka explicitné
mechanizmy vysvetlenia ľudskej kognície, a teda procesov mysle.
16
Literatúra
Abrahamsen A., Bechtel W. (2006). Phenomena and mechanisms: Putting the symbolic,
connectionist, and dynamical systems debate in broader perspective. In R. Stainton
(Ed.), Contemporary Debates in Cognitive Science. Oxford: Basil Blackwell.
Addyman, C., French, R. (2012). Computational modeling in cognitive science: A
manifesto for change. Topics in Cognitive Science, 4: 332-341.
Asada M. a spol. (2009). Cognitive developmental robotics: a survey. IEEE Transactions
on Autonomous Mental Development 1(1), 12-34.
Barsalou L. (1999). Perceptual symbol systems. Behavioral and Brain Sciences, 22(4),
577-660.
Barsalou L. (2008). Grounded cognition. Annual Reviews of Psychology, 59, 617-645.
Bengio, Y. (2009). Learning deep architectures for AI. Foundations and Trends in
Machine Learning , 2(1): 1-127.
Bressler S., Kelso J.S. (2001). Cortical coordination dynamics and cognition. Trends in
Cognitive Sciences, 5, 26-36.
Brooks R. (1986). A robust layered control system for a mobile robot. IEEE Journal of
Robotics and Automation, 2(1), 14-23.
Churchland P., Sejnowski, T. (1992). The Computational Brain. Cambridge, MA: MIT
Press.
Edelman G. (1992). Bright Air, Brilliant Fire: On the Matter of the Mind. New York:
Basic Books.
Farkaš I. (2006). Samoorganizácia ako hybná sila dynamických vzorcov aktivít v mozgu
a mysli. Kognice a umělý život VI, Opava: Slezská univerzita, 143-148.
Farkaš I. (2011). Konekcionizmus v náručí výpočtovej kognitívnej vedy. In Kvasnička V.
et al. (eds.), Umelá inteligencia a kognitívna veda III, 19-62.
Farkaš I. (2012). Indispensability of computational modeling in cognitive science.
Journal of Cognitive Science, 13, 211-235.
Feldman J., Ballard D. (1982). Connectionist models and their properties. Cognitive
Science, 6, 205–254.
Fodor J. (1983). The Modularity of Mind. Cambridge, MA: MIT Press.
Fodor J. (2000). The Mind Doesn't Work That Way. MIT Press.
Fodor J., Pylyshyn Z. (1988). Connectionism and cognitive architecture. Cognition, 28, 3-
71.
Freeman W. (2001). How Brains Make Up Their Minds. New York: Columbia University
Press.
Gardner H. (1997). The Minds New Science: A History of the Cognitive Revolution. New
York: Basic Books.
Gärdenfors P. (1996). Cued and detached representations in animal cognition.
Behavioural Processes, 36, 263-273.
Gentner D. (2010). Psychology in cognitive science: 1978-2038. Topics in Cognitive
Science, 2, 328-344.
Gibbs R. (2006). Embodiment and Cognitive Science. New York: Cambridge University
Press.
17
Gibson J. (1970). Ecological Approach to Visual Perception. Boston: Houghton-Mifflin.
Greco A. (2012). Cognitive science and cognitive sciences. Journal of Cognitive Science,
13, 471-485.
Griffiths T., Kemp C., Tenenbaum J. (2008). Bayesian models of cognition. In R. Sun
(Ed.), Cambridge Handbook of Computational Psychology, New York: Cambridge
University Press, 59-100.
Harnad S. (1990). The symbol grounding problem. Physica D, 42, 335-346.
Haykin S. (2008). Neural Networks and Learning Machines, Prentice Hall.
Hutchins E. (1996). Cognition in the Wild. MIT Press.
Kelso J. (1995). Dynamic Patterns: The Self-Organization of Brain and Behavior. The
MIT Press, Cambridge, MA.
Kuhn, T. (1996). The Structure of Scientific Revolutions (3. vyd.), Chicago: University of
Chicago Press.
Kvasnička V., Beňušková Ľ., Pospichal J., Farkaš I., Tiňo P., Kráľ A. (1997). Úvod do
teórie neurónových sietí. Iris, Bratislava.
Lakoff G., Johnson M. (1999). Philosophy in the Flesh: The Embodied Mind and Its
Challenge to Western Thought. New York: Basic Books.
Lave J. (1988). Cognition in Practice: Mind, Mathematics and Culture in Everyday Life.
New York: Cambridge University Press.
Marr D. (1982). Vision. San Francisco, CA: W.H. Freeman.
McClelland J. (2009). The place of modeling in cognitive science. Topics in Cognitive
Science, 1(1), 11-38.
O’Brien G., Opie J. (2006). How do connectionist networks compute? Cognitive
Processing, 7, 30-41.
O'Reilly R., Munakata Y. (2000). Computational Explorations in Cognitive
Neuroscience: Understanding the Mind by Simulating the Brain. MIT Press.
Piccinini G. (2008). Some neural networks compute, others don’t. Neural Networks,
21(2-3), 311-321.
Pinker S. (2009). How the Mind Works. W.W. Norton and Co.
Pitt D. (2008). Mental representation, The Stanford Encyclopedia of Philosophy,
http://plato.stanford.edu/archives/fall2008/entries/mental-representation.
Port R., van Gelder T., Eds. (1995). Mind as Motion: Explorations in the Dynamics of
Cognition. Cambridge, MA: MIT Press.
Searle J. (1980). Minds, Brains, and Programs. Behavioral and Brain Sciences, 3, 417-
458.
Smith L. (2005). Cognition as a dynamic system: principles from embodiment.
Developmental Review, 25, 278-98.
Spivey M. (2007). The Continuity of Mind. Oxford: Oxford University Press.
Šefránek J. (2002). Inteligencia ako výpočet. IRIS Bratislava.
Šefránek J., Takáč M., Farkaš I. (2008). Vznik inteligencie v umelých systémoch. V
knihe Magdolen, D. (zost.): Hmota, život, inteligencia: Vznik. VEDA, Bratislava,
245-270.
Thelen E., Smith L. (1994). A Dynamic Systems Approach to the Development of
Cognition and Action. Cambridge, MA: MIT Press.
18
Turing, A. (1936). On computable numbers, with an application to the Entscheidungs
problem. Proceedings of the London Mathematical Society, 2(42): 230-65.
Turing A. (1950). Computing machinery and intelligence. Mind, 59, 433-460.
Varela F., Thompson E., Rosch, E. (1991). The Embodied Mind: Cognitive Science and
Human Experience. Cambridge, MA: MIT Press.
Wilson M. (2002). Six views of embodied cognition. Psychonomics Bulletin Review,
9(4), 625-636.
Ziemke T. (1999). Rethinking grounding. In: Riegler A. et al. (eds.), Understanding
Representation in the Cognitive Sciences, New York: Plenum Press, 177-190.
19
Kapitola 2
Neuroveda – strategická oblasť výskumu v
kognitívnej vede
BARBORA CIMROVÁ
Neuroveda je vedecká disciplína, ktorej predmetom výskumu je nervový systém (NS).
Zaoberá sa jeho stavbou, zložením, organizáciou a funkciou jeho jednotlivých častí, aj
jeho fungovaním ako celku. Je to medziodborová disciplína, ktorá vychádza z biológie,
no zahŕňa mnohé ďalšie odbory – napríklad anatómiu, fyziológiu, chémiu, fyziku,
filozofiu, psychológiu, informatiku a ďalšie. V súčasnosti je známe, že NS pozostáva z
viacerých štruktúr a ich podštruktúr, ktoré sú zložené z mnohých navzájom
poprepájaných neurónov. Jednotlivé neuróny vykonávajú špecializované funkcie, ale
aktivita jediného neurónu bez kontextu nemá prakticky žiaden význam. Neuróny
navzájom komunikujú, ale neposielajú svoju aktivitu do žiadneho centrálneho procesora.
Zmysluplná aktivita emerguje z neuveriteľného množstva čiastočne nezávislých a
čiastočne vzájomne závislých procesov nastávajúcich simultánne v celom NS (Kalat,
2012). Aby bolo možné pochopiť, ako takýto zložitý systém funguje, v prvom rade je
vhodné/nevyhnutné vedieť z akých častí sa skladá, ako sú tieto časti navzájom
usporiadané a akými základnými funkčnými a stavebnými jednotkami sú tvorené.
2.1 Bunky nervového systému
Stavebnými jednotkami NS sú bunky, ktoré sa delia na nervové bunky, nazývané aj
neuróny a bunky gliové (Kolb a Wishaw, 2009). V nervovom systéme sa nachádza viac
ako 150 miliárd buniek. Nervové bunky spracovávajú informácie (prijímajú ich a ďalej
prenášajú) a sú navzájom husto poprepájané. Jedna nervová bunka môže mať viac ako
15 000 spojení s ostatnými bunkami. Typický neurón (na obrázku 1) má na rozdiel od
iných buniek niekoľko výbežkov. Kratšie výbežky, ktorých môže byť veľký počet a môžu
byť rôzne rozvetvené, sa nazývajú dendrity a privádzajú impulzy do tela nervovej bunky
zvanej soma alebo perykarion. Dlhší výbežok sa nazýva axón alebo neurit, je spravidla
iba jeden a vedie nervové vzruchy smerom od tela bunky. V mieste pripojenia axónu
k telu bunky sa nachádza rozšírený tzv. axónový hrbolček toto miesto sa označuje aj ako
iniciálny segment. Nachádza sa tu veľké množstvo napäťovo závislých sodíkových
kanálov, o ktorých bude reč v ďalšej časti. Axón býva rozvetvený až na konci, čo sa
nazýva terminálna arborizácia alebo telodendrie. Každá vetvička sa rozširuje do útvaru
nazývaného terminálny butón a spolu s časťou ďalšieho neurónu (postsynaptická
membrána) vytvára štrbinku nazývanú synapsia. Synapsia je najmenšou funkčnou
jednotkou NS. Prostredníctvom nej prebieha komunikácia jednej nervovej bunky
s druhou. Na základe počtu výbežkov (dendritov) rozlišujeme rôzne typy neurónov.
20
Multipolárne neuróny majú veľký počet dendritov (napríklad pyramídová bunka
v motorickej kôre), bipolárne neuróny majú iba jeden dendrit a jeden axón (napríklad
bipolárna bunka sietnice), unipolárne neuróny nemajú dendrit žiaden (napríklad tyčinky a
čapíky).
Gliové bunky zabezpečujú v NS rôzne podporné funkcie. Jeden typ gliových buniek
tzv. astrocyty zabezpečujú homeostázu neurónov, ich výživu a odvod odpadových látok
a podľa najnovších výsledkov sú nevyhnutné na zabezpečenie synchronizácie neurónov
(Haydon, 2006). Druhý typ, tzv. mikroglia má schopnosť pohybu a fagocytózy
a zabezpečuje imunologické deje v NS. Tretí typ, oligodendrocyty, sa svojimi výbežkami
obtáčajú okolo axonálnych výbežkov neurónov, čím vytvárajú tzv. myelínovú pošvu,
umožňujúcu rýchlejšie vedenie vzruchov po nervovom vlákne. Myelínová pošva je
zodpovedná aj za belšie sfarbenie tzv. bielej hmoty mozgu alebo miechy, ktorá je tvorená
zväzkami axónov obalených myelínom. Naopak, tzv. šedá hmota, ktorá sa pri
makroskopickom pohľade na prierez mozgovým (alebo miešnym) tkanivom javí ako
tmavšia, je tvorená zhlukmi tiel neurónov. Šedá hmota býva v mozgu usporiadaná do
vrstiev (napríklad v mozgovej kôre) alebo do útvarov nazývaných jadrá (napríklad
bazálne gangliá).
Obrázok 1. Schematický nákres neurónu (nervovej bunky). Neurón sa skladá z troch základných
častí: tela bunky (soma, resp. perykarion), dendritov, ktoré prijímajú informáciu a axónu, ktorý
informáciu vysiela. Tvar neurónu závisí od počtu jeho výbežkov a býva pre rôzne typy neurónov
rôzny. Axón môže byť obalený myelínovou pošvou (ako je znázornené na tomto obrázku), ktorá je
často prerušovaná. Tieto prerušenia, ktoré sa nazývajú Ranvierove zárezy, umožňujú saltatórne
vedenie vzruchu.
21
2.2 Stavba a funkcia nervovej bunky
Ako väčšina buniek ľudského tela, nervová bunka obsahuje viaceré typy bunkových
organel – bunkové jadro, v ktorom je uložená genetická informácia, mitochondrie
produkujúce energiu, endoplazmatické retikulum, ribozómy a Golgiho aparát, ktoré
zabezpečujú tvorbu bielkovín (napr. neurotransmitérov) na základe informácie uloženej
v jadre. Ďalej sa v nervovej bunke nachádzajú vezikuly (membránou ohraničené útvary)
vyplnené vyprodukovanými bielkovinami (prevažne neurotransmitérmi) a mikrotubuly,
ktoré jednak bunke umožňujú udržať tvar a zároveň slúžia pri tzv. axonálnom transporte,
teda prenose látok z tela bunky k synaptickému zakončeniu. Všetky organely sa
nachádzajú v cytoplazme, tekutine vypĺňajúcej vnútro bunky. Obal bunky tvorí selektívne
priepustná bunková membrána. Tvorí ju relatívne nepriepustná fosfolipidová dvojvrstva,
v ktorej sa nachádzajú periférne a integrálne proteíny.
Selektívna priepustnosť bunkovej membrány tvorí základ pre všetky elektrické deje
nervovej bunky. Udržuje totiž nerovnomerné chemické rozloženie častíc s elektrickým
nábojom medzi vnútorným a vonkajším prostredím bunky, čím vzniká na membráne
chemický aj elektrický gradient. Proteíny zabudované v membráne umožňujú prestup
látok, akými sú kladne alebo záporne nabité iónové častice, ktoré inak nie sú schopné cez
nepolárnu fosfolipidovú membránu preniknúť. Jedným typom takýchto integrálnych
proteínov sú iónové kanály. Tie umožňujú voľný prestup určitého typu iónov (napríklad
draslíkové iónové kanály). Druhým typom sú tzv. vrátkové kanály, ktoré sa zmenou
svojej konformácie môžu pre ión buď otvoriť alebo uzavrieť a tým je možné pohyb iónov
regulovať (napríklad napäťovo závislé sodíkové kanály). Tretím typom integrálnych
proteínov sú tzv. aktívne transportéry, ktoré spotrebúvajú energiu a pumpujú nabité
častice aj proti smeru chemického či elektrického gradientu (napríklad sodíkovo-
draslíková pumpa: Na+K
+ATP-áza).
Vo vnútri bunky (v intracelulárnom priestore) je relatívne vyššia koncentrácia
bielkovín. Tieto látky s vysokou molekulovou hmotnosťou a so záporným nábojom nie sú
schopné cez fosfolipidovú dvojvrstvu membrány prechádzať. Vnútro bunky je oproti
vonkajšiemu prostrediu záporne nabité (približne –70mV). K zápornejšiemu náboju
vnútra bunky do značnej miery prispieva aj sodíkovo-draslíková pumpa, ktorá proti
koncentračnému gradientu vymieňa 3 ióny sodíka za 2 ióny draslíka. Keďže sodíkové
kanály sú v pokojovom stave zatvorené, postupne sa vytvorí nerovnomerné rozmiestnenie
sodíkových a napokon aj draslíkových iónov. V extracelulárnej tekutine je teda relatívne
vyššia koncentrácia iónov sodíka. Hoci draslíkové iónové kanály sú pre draslík
priechodné, vytvorený potenciálový rozdiel (elektrický gradient) na membráne drží
draslíkové ióny s kladným nábojom vo vnútri bunky. Vo vonkajšom (extracelulárnom)
prostredí je teda v pokojovom stave relatívne nižšia koncentrácia draslíka oproti
koncentrácii v intracelulárnej tekutine. Tento stav sa nazýva pokojový (membránový)
potenciál (Purves, 2004).
22
2.3 Akčný potenciál
V mieste spojenia dvoch neurónov, teda v synaptickej štrbine dochádza ku chemickej
komunikácii medzi neurónmi. Z presynaptickej membrány sa vylúči signálna molekula –
nervový prenášač (neurotransmitér) do štrbinky medzi presynaptickou a postsynaptickou
membránou. V postsynaptickej membráne sa nachádzajú už spomínané iónové kanály
(integrálne proteíny zabudované v bunkovej membráne), ktoré obsahujú väzbové miesto
– receptor, kam sa môže príslušná signálna molekula naviazať. Po naviazaní signálnej
molekuly môže dôjsť k otvoreniu týchto ligandom otváraných iónových kanálov, čiže k
zmene priepustnosti membrány a tým aj k zmene elektrického stavu na membráne.
(Naviazanie inej signálnej molekuly môže spôsobiť kaskádu zmien vedúcich až k prepisu
genetickej informácie v jadre a následnému ovplyvneniu fungovania bunky, napríklad
tvorbou nových bielkovín, či už stavebných alebo nervových prenášačov). V závislosti od
typu kanálov dochádza buď k zmene membránového potenciálu smerom k pozitívnym
hodnotám – hovoríme o depolarizácii membrány alebo naopak, potenciál sa ešte viac
zníži – nastáva hyperpolarizácia (obrázok 2).
Obrázok 2. Akčný potenciál. Po dosiahnutí prahového potenciálu (približne –50mV) nastáva
depolarizácia membrány – otvoria sa rýchle napäťovo závislé kanály a kladne nabité sodíkové
ióny prúdia do bunky až nastane transpolarizácia – na krátky moment dosiahne membránový
potenciál kladné hodnoty. Vzápätí sa otvárajú pomalé napäťovo závislé draslíkové kanály a ióny
draslíka nesú kladný náboj opäť von z bunky až nastane hyperpolarizácia. Sodíkovo-draslíková
pumpa napokon za spotreby energie vráti koncentrácie iónov do pôvodného nerovnovážneho stavu
a neurón je opäť pripravený na priebeh akčného potenciálu.
Pri otvorení sodíkových kanálov začnú kladné sodíkové ióny v smere
koncentračného (v bunke je ich menej) aj elektrického (vnútro bunky je nabité
23
zápornejšie) gradientu vtekať do bunky – potenciálový rozdiel na membráne sa zníži –
nastáva depolarizácia. Ako bolo spomínané vyššie, na membráne axónového hrbolčeka
sa nachádza veľké množstvo rýchlych napäťovo závislých sodíkových iónových kanálov.
Tieto kanály sa otvárajú v prípade, ak tu membránové napätie poklesne na určitú prahovú
hodnotu (–50mV). Následkom toho začnú do bunky masívne vtekať sodíkové ióny, ktoré
so sebou nesú kladný náboj. Potenciálový rozdiel sa zníži na nulu, až nakoniec dosiahne
pozitívne hodnoty – hovoríme o transpolarizácii (vnútro bunky je oproti
extracelulárnemu prostrediu na chvíľu nabité kladne). Tento stav však netrvá dlho,
pretože vzápätí sa otvárajú pomalé napäťovo závislé draslíkové kanály, ktoré umožnia
podobne masívny presun kladného náboja, tentokrát s draslíkom, z bunky von (opäť
v smere elektrického, no najmä chemického gradientu). Na membráne bunky sa obnovuje
pôvodný pokojový potenciál – tento dej sa nazýva repolarizácia. Počas tejto fázy sa síce
obnoví pôvodné napätie (okolo –70mV) na membráne (a dokonca môže nastať až
hyperpolarizácia: –90mV), ale na oboch stranách membrány je koncentrácia iónov sodíka
aj iónov draslíka približne rovnaká. Ďalší priebeh akčného potenciálu, ako sa opísaný dej
súborne nazýva, môže nastať až po obnovení pôvodnej nerovnomernej distribúcie iónov.
Tá sa dosiahne opäť pomocou sodíkovo-draslíkovej pumpy (Na+K
+ATP-áza), ktorá proti
koncentračnému gradientu presúva molekuly sodíka v bunky von výmenou za molekuly
draslíka z extracelulárnej tekutiny a spotrebúva pri tom značné množstvo energie (Purves,
2004).
2.4 Šírenie impulzu pozdĺž neurónu
Otvorenie napäťovo závislých kanálov spôsobí šírenie potenciálovej zmeny do priľahlých
miest membrány – akčný potenciál (nervový vzruch, impulz) sa tak šíri pozdĺž axónu od
tela bunky až po terminálny butón (Kolb a Wishaw, 2009). Keďže ďalší akčný potenciál
nemôže nastať okamžite, ale až po obnovení iónových koncentrácií do pôvodného stavu
(hovoríme, že membrána je v tzv. refraktérnej fáze), akčný potenciál sa nemôže šíriť
späť, ale iba jedným smerom. Rýchlosť šírenia vzruchu závisí od viacerých faktorov –
jedným z nich je dĺžka nervového vlákna. Vedenie vzruchu môže byť urýchlené
myelinizáciou axónu. Ako bolo spomenuté vyššie, myelínovú pošvu tvoria bunky
oligodendroglie (v periférnej nervovej sústave sú to Schwannove bunky), ktoré sa
obtáčajú okolo axónu. Medzi dvoma gliovými bunkami je nemyelinizovaná medzera,
ktorá sa nazýva Ranvierov zárez. Keďže myelinizovaný úsek nie je vodivý (nenachádzajú
sa tu iónové kanály a nabité častice nemôžu prechádzať cez membránu), nervový impulz
pri šírení nervovým vláknom preskakuje z jedného Ranvierovho zárezu na ďalší, čím sa
celý priebeh šírenia značne urýchľuje. Takéto vedenie sa nazýva saltatórne alebo
skokovité (z lat. saltare, skákať).
2.5 Komunikácia medzi neurónmi
Prenos informácie vo vnútri neurónu je elektrochemický. Prenos informácie medzi
neurónmi prebieha chemicky. Po dosiahnutí terminálneho gombíka na axóne
24
(presynaptickej membrány) vyvolá akčný potenciál otvorenie vápnikových napäťovo
závislých kanálov. Keďže koncentrácia vápnika je za normálnych okolností vyššia mimo
bunky, ióny vápnika začnú prúdiť do vnútra terminálneho butónu. Tu sa nachádzajú
vezikuly vyplnené molekulami neurotransmitéra, vyprodukované v tele bunky
a dopravené pomocou vyššie spomínaného axonálneho transportu. Vezikuly sú spojené
s presynaptickou membránou pomocou kontraktilných bielkovín, ktoré po naviazaní
vápnika pritiahnu vezikulu k membráne, až nastane ich splynutie a neurotransmitér sa
vylúči do synaptickej štrbiny a nakoniec sa naviaže na receptor na postsynaptickej
membráne. Mnohé z týchto receptorov sú ligandom otvárané iónové kanály (na rozdiel od
napäťovo závislých kanálov). Ich otvorenie vyvolá lokálny zmenu postsynaptického
potenciálu. Na dosiahnutie prahového napätia (nutného na spustenie akčného potenciálu)
v iniciálnom segmente obvykle jediný postsynaptický potenciál nestačí (Kráľ, 1997).
Na povrchu neurónu sa môžu nachádzať stovky až tisícky synaptických zakončení
iných neurónov. Navyše, v nervovom systéme sa nachádza množstvo rôznych druhov
neurotransmitérov, ktoré môžu ovplyvňovať rôzne neuróny odlišným spôsobom. Mnohé
neurotransmitéry (napríklad acetylcholín) majú na postsynaptický neurón excitačný efekt.
Takýto excitačný postsynaptický potenciál (EPSP) spôsobí depolarizáciu membrány
vstupom kladných iónov do bunky, čím sa zvýši pravdepodobnosť dosiahnutia prahového
potenciálu a následného vzniku akčného potenciálu. Až sumáciou viacerých EPSP v tele
bunky (v iniciálnom segmente) môže dôjsť k dosiahnutiu prahového potenciálu
a vyvolaniu nervového vzruchu. Takáto sumácia môže byť buď časová, ak EPSP nastane
opakovane na tom istom mieste dostatočne rýchlo po sebe, alebo priestorová, ak sa
sčítajú EPSP z rôznych synáps.
Avšak, existujú aj neurotransmitéry, ktoré majú na postsynaptický neurón inhibičný
efekt (napríklad gama-amino-maslová kyselina). Dosiahnu to znížením postsynaptického
potenciálu smerom k negatívnym hodnotám (napríklad otvorením chloridových kanálov)
a tým sa pravdepodobnosť, že vznikne akčný potenciál zníži. Takéto postsynaptické
potenciály spôsobujúce hyperpolarizáciu sa nazývajú inhibičné postsynaptické potenciály
(IPSP). Rozhodujúci vplyv na to, či v nervovej bunke vznikne akčný potenciál má
celkový pomer medzi excitačným a inhibičným účinkom nervových prenášačov
v dendritických synapsiách neurónu. Mnohé neuróny vykazujú spontánnu aktivitu –
sporadicky generujú akčné potenciály. EPSP môže ich frekvenciu zvýšiť, IPSP naopak
znížiť. Inhibícia hrá v mozgu kľúčovú úlohu – zabraňuje nekontrolovanému nárastu
a šíreniu aktivity neurónov. Inhibičných neurónov je v mozgu 15% a excitačných
zvyšných 85% (White, 1989).
Prenos informácie v neuróne teda začína excitáciou dendritov, informácia sa
integruje v tele neurónu. Hneď ako excitácia dosiahne excitačný prah, objaví sa vzruch.
Dôsledkom excitácie je šírenie vlny akčného potenciálu pozdĺž membrány axónu na
základe princípu „všetko alebo nič“. Elektrický náboj pre vznik akčného potenciálu je
buď dostatočný alebo nedostatočný. Vzruch sa navyše v priebehu svojho šírenia
neoslabuje a dosiahne koniec axónu v rovnakej intenzite. Ak má každý neuronálny
vzruch rovnakú amplitúdu, ako je potom možné rozlíšiť podnety rôznej intenzity a rôznej
modality?
25
2.6 Kódovanie informácií v NS
Amplitúda akčného potenciálu sa nemení, ale mení sa počet vygenerovaných akčných
potenciálov za jednotku času – teda ich frekvencia. Intenzita senzorických podnetov je v
NS kódovaná frekvenciou vzniku nervových vzruchov (akčných potenciálov). Ku
kódovaniu rôznych typov podnetov však prispieva aj anatomicko topografické kódovanie.
Typ informácie, ktorú neurón prenáša súvisí so vstupom, ktorý dostáva a s výstupom,
ktorý vysiela. Napríklad, pri podráždení somatosenzorických (dotykových) receptorov na
koži sa informácia dostáva do konkrétnych neurónov z ktorých putuje konkrétnou dráhou
až do špeciálnej oblasti mozgovej kôry zodpovednej za tú konkrétnu oblasť kože.
Aktivita kôrového neurónu v tejto oblasti odráža mieru podráždenia oblasti kože, ktorá
mu prislúcha. Charakter podnetu je v tomto prípade kódovaný miestom, ktoré je v NS
podráždené. V ostatných senzorických systémoch platí tento anatomický princíp
podobne. V prípade, že by sa zmenilo zapojenie neurónov tak, aby vstupy zo zrakových
podnetov končili v primárnej somatosenzorickej kôre, jej funkcia by sa zmenila, hoci
oblasť samotná by zostala nezmenená. Funkcie danej oblasti je určená jej vstupmi
a výstupmi.
Hoci je vyššie opísaný mechanizmus prenosu vzruchu v rámci jedného neurónu aj
medzi neurónmi navzájom pomerne zložitý, na vznik tak komplexného správania akým je
ľudské konanie a myslenie ešte sám osebe dostačujúci nie je. Skok od neurónov
generujúcich impulzy k jednajúcej, cítiacej a mysliacej osobnosti umožňuje funkčná
organizácia NS (Sternberg, 1996). V nasledujúcej časti sú popísané jej úrovne.
2.7 Štrukturálna organizácia NS
Nervový systém sa skladá z dvoch hlavných častí: centrálny nervový systém (CNS),
ktorý pozostáva z mozgu a miechy a periférny (PNS), ktorý je tvorený nervami. Na
obrázku 3 je schematické znázornenie zloženia NS. Miechové nervy vystupujú z miechy
a vedú informácie z periférie do CNS (napríklad zo senzorických receptorov v koži)
a naopak, z CNS naspäť na perifériu (napríklad do hladkej svaloviny stien žalúdka) –
inervujú senzorické, motorické a vegetatívne orgány. Rovnako hlavové nervy, ktoré
vychádzajú priamo z mozgu nesú informácie do mozgu (napríklad zo zrakových
receptorov v sietnici) a tiež aj z mozgu (napríklad motorickú informáciu do mimických
svalov). PNS sa podľa funkcie ďalej delí na autonómny, ktorý inervuje vnútorné orgány a
somatický, ktorý zabezpečuje motorickú a senzorickú inerváciu zvyšku tela.
Orgány CNS patria medzi najlepšie chránené orgány v ľudskom tele. Mozog je
uložený v lebke a miecha v chrbticovom kanáli, čím je zabezpečená ich mechanická
odolnosť. Oba orgány CNS sú ďalej chránené troma vrstvami obalov (tvrdá plena,
pavúčnica a mäkká plena). Navyše „plávajú“ v tekutine zvanej mozgovo-miechový mok
(likvor), ktorý jednak vypĺňa systém dutín v CNS – mozgové komory a miechový kanál,
a jednak obmýva CNS v subarachnoidálnom priestore (pod pavúčnicou), takže chráni
orgány proti otrasom. Zároveň zabezpečuje podporné homeostatické a iné funkcie. Takto
je zabezpečená ochrana CNS pred vonkajším poškodením. Na ochranu mozgu a miechy
proti poškodeniu z vnútra tela slúži tzv. hematoencefalická bariéra. Tvoria ju krvné cievy,
26
ktoré nie sú priepustné pre niektoré látky, napríklad veľké bielkovinové molekuly, ani pre
mikroorganizmy, ale napríklad glukóza, kyslík či látky rozpustné v tukoch (alkohol,
nikotín) ňou prechádzajú bez problémov (Ward, 2006).
Štruktúra a organizácia mozgu je pomerne zložitá. Na to, aby sme pochopili, na čo
slúžia jednotlivé jeho časti, ako navzájom súvisia a akým spôsobom ich činnosťou vzniká
celá tá plejáda dejov a pocitov, ktoré sprevádzajú ľudské správanie, pociťovanie,
premýšľania a uvedomovanie si, na to slúži množstvo metód. Najznámejšie z nich si
predstavíme v ďalšej časti, kde stručne načrtneme ich základné princípy, výhody,
nevýhody a možnosti ich použitia.
Obrázok 3. Štrukturálna organizácia nervového systému. Centrálny nervový systém (CNS) sa
skladá z mozgu a miechy. Periférny nervový systém (PNS) je zložený z autonómneho
a somatického nervového systému. Autonómny systém inervuje vnútorné orgány, somatický
systém prenáša senzorické a motorické informácie viazané s kostrovým svalstvom. (Upravené
podľa: Sternberg, 1996).
2.8 Metódy skúmania mozgu
Na skúmanie mozgových funkcií sa využívajú viaceré metódy, medzi ktoré patria:
funkčné a štrukturálne zobrazovacie metódy, štúdium mozgových lézií (poranení,
poškodení) a ich dôsledkov, metódy umožňujúce dočasné vyradenie funkcie určitej
mozgovej oblasti, prípadne experimenty na zvieratách. Medzi najstaršie metódy skúmania
patrí pozorovanie dôsledkov poškodenia mozgovej hmoty a následné (či už posmrtné
alebo ak bolo známe, tak aj počas života) priradenie postihnutej funkcie k príslušnej
postihnutej oblasti mozgu (Ward, 2004). Napríklad veľmi známy je prípad, ktorý opísal
27
v 19. storočí Paul Broca. Jeho pacient trpel ťažkým poškodením reči – nedokázal
vysloviť nič okrem slabiky „tan“. Toto poškodenie sa viazalo na oblasť v čelovom laloku
mozgu, ktorá je dnes známa ako Brocova oblasť a považuje sa za oblasť zodpovednú za
určité funkcie pri tvorbe reči. Doposiaľ boli opísané mnohé podobné prípady priraďujúce
poškodenie určitej oblasti k určitej funkčnej poruche, z čoho sa usudzuje, že daná oblasť
za normálnych okolností tieto funkcie určitým spôsobom zabezpečuje. Nevýhodou
takejto pozorovacej metódy je, že neumožňuje pozorovať špecifické fyziologické procesy
v živom tkanive mozgu. To umožňujú metódy výskumu in vivo (teda v živom
organizme).
V minulosti prebiehali všetky experimenty in vivo na živých zvieratách. Napríklad
výskum zrakového vnímania, za ktorý bola v r. 1981 udelená Nobelova cena (Hubel
a Wiesel, 1968), bol vykonaný za pomoci mikroelektród zavedených do mozgu živých
zvierat. Zistilo sa tak napríklad, že bunky v primárnej zrakovej kôre sú aktívne pri
objavení sa čiarky určitej orientácie v zrakovom poli. Okrem zavedenia mikroelektród sa
pri pokusoch na zvieratách využíva podobný princíp ako pri pozorovaní lézie mozgovej
oblasti a jej priliehajúcej funkcie. V takýchto prípadoch sa cielene poškodí určitá časť
mozgu a sledujú sa funkčné poruchy, ktoré sú dôsledkom takéhoto zásahu.
Ani pri pokusoch na živom tkanive v mozgu zvierat nie je možné zaznamenať
elektrickú aktivitu všetkých neurónov súčasne a zmapovať tak ich funkčné väzby a
vzťahy. Navyše, výskum špecifických ľudských kognitívnych funkcií, medzi ktoré patrí
napríklad čítanie, reč, počítanie, abstraktné myslenie atď., nie je možné skúmať na
zvieratách. Pri výskume mozgových funkcií u ľudí sa využívajú predovšetkým rôzne
zobrazovacie metódy, ktoré umožňujú vizualizáciu štruktúry alebo aktivity mozgu in
vivo. Základné princípy najpoužívanejších zobrazovacích metód si vysvetlíme
v nasledujúcej časti.
2.9 Zobrazovacie metódy
Zobrazovacie metódy delíme na štrukturálne, ktoré umožňujú statické zobrazenie stavby
a štruktúry mozgového (prípadne iného) tkaniva a na funkčné, ktoré sú schopné buď
priamo alebo nepriamo znázorniť aktivitu mozgu (resp. iného orgánu). Medzi
štrukturálne zobrazovacie metódy patrí napríklad počítačová tomografia (CT) alebo
magnetická rezonancia (MRI). Princípom CT je röntgenové žiarenie, prechádzajúce
tkanivom a otáčací skener, ktorý zaznamená žiarenie po prechode tkanivom, postupne pre
všetky jednotlivé uhlové otočenia od 0° do 180°. Množstvo prepusteného žiarenia závisí
od hustoty tkaniva, cez ktoré musí röntgenový lúč prejsť. Zaznamenané snímky vo
všetkých uhloch otočenia následne vyhodnotí počítač a nakoniec zrekonštruuje 3D obraz
rozloženia hustoty tkaniva v každej z pomyselných rovín snímania. Keďže CT využíva
pre človeka do určitej miery škodlivé röntgenové žiarenie, patrí medzi invazívne
zobrazovacie metódy a nemalo by sa používať veľmi často. Umožňuje však pomerne
lacné vyšetrenie abnormalít alebo poškodení v dôsledku nádorov alebo cievnych
mozgových porúch. Rozlišovacia schopnosť CT je pomerne malá a pre podrobnejšie
znázornenie štruktúry tkaniva sa využíva skôr MRI, ktorá má oproti CT vyšetreniu aj
ďalšie výhody. MRI nezaťažuje organizmus škodlivým žiarením a preto ním môže byť
28
človek vyšetrovaný opakovane aj veľakrát. Na zobrazenie štruktúry využíva MRI silné
magnetické pole a elektromagnetické vlastnosti molekúl. Osi rotácií protónov vodíka sa
po umiestnení do silného magnetického poľa usporiadajú paralelne so smerom poľa.
Krátky vysokofrekvenčný magnetický impulz vychýli osi rotácií protónov. Toto
vychýlenie je merateľné zmenou magnetického poľa a tvorí základ signálu MRI. Počas
opakovaného vychyľovania osí protónov sa sleduje doba, za ktorú nastane opäť paralelné
usporiadanie. Na základe toho je možné rozlíšiť jednotlivé typy tkaniva. Štrukturálny
obraz z MRI je pomerne podrobný, umožňuje rozlíšiť bielu hmotu od šedej a zobraziť tak
jednotlivé mozgové útvary, no neprináša takmer žiadnu informáciu o priebehu
fyziologických procesov.
Funkčné zobrazovacie metódy dokážu zobraziť aj aktivitu mozgového tkaniva.
Medzi najpoužívanejšie funkčné zobrazovacie metódy patrí pozitrónová emisná
tomografia (PET), funkčná magnetická rezonancia (fMRI) alebo elektroencefalografia
(EEG). Pozitrónová emisná tomografia a funkčná magnetická rezonancia sú metabolické
metódy, ktoré využívajú sledovanie zvýšenej spotreby glukózy alebo kyslíka
v aktívnejšej oblasti mozgu. Predpokladá sa, že počas riešenia určitej úlohy sa oblasť,
ktorá je pre jej riešenie nevyhnutná, prejaví zvýšenou aktivitou a teda aj zvýšenou
spotrebou kyslíku alebo glukózy ako počas pokoja. Počas vyšetrenia pomocou PET sa do
krvi vyšetrovaného jedinca vstrekne malé množstvo radioaktívne značenej látky
(napríklad voda, glukóza, prípadne neurotransmitér). V metabolicky aktívnejších
oblastiach sa hromadí (spotrebúva) viac kyslíku či glukózy, preto bude toto miesto
radioaktívnejšie. Nestabilný rádioaktívny izotop glukózy sa po krátkom čase samovoľne
rozpadne a uvoľnený pozitrón okamžite anihiluje spojením s najbližším voľným
elektrónom, pričom sa vyžiaria dva fotóny, letiace opačným smerom. Tieto fotóny sú
zachytené skenerom, pričom sa podľa času a miesta ich dopadu sa určí miesto ich
vyžiarenia a teda miesto s vyšším obsahom glukózy (resp. inej použitej látky). Vyšetrenie
pomocou PET patrí medzi invazívne funkčné zobrazovacie metódy, keďže sa využíva
rádioaktívna látka. Ďalšou nevýhodou PET je pomerne slabá priestorová aj časová
rozlišovacia schopnosť. V posledných rokoch bolo použitie PET zatienené inou metódou
– fMRI, ktorá jednak dosahuje lepšie priestorové rozlíšenie a jednak nezaťažuje
organizmus vyšetrovaného rádioaktívnym žiarením, a môže byť preto používané
opakovane.
Funkčná magnetická rezonancia zobrazuje mozgovú aktivitu na základe zmeny
pomeru okysličenej a odkysličenej krvi v danej oblasti. Princíp je rovnaký ako pri MRI,
avšak sleduje sa zložka signálu závislá od množstva odkysličeného hemoglobínu.
V oblasti, ktorá je metabolicky aktívnejšia, nastane po počiatočnom krátkodobom poklese
pomerne rýchly prísun väčšieho množstva okysličeného hemoglobínu (aby sa predišlo čo
i len prechodnému nedostatku kyslíka v tejto oblasti so zvýšenou spotrebou). Časové
rozlíšenie tejto metódy je niekoľko sekúnd. Nevýhodou použitia fMRI oproti použitiu
PET je extrémny hluk zariadenia, čo je pri kognitívnom experimente nepríjemné
a použitie sluchových podnetov je takmer vylúčené. Na rozdiel od oboch spomínaných
funkčných zobrazovacích metód, v ktorých sa na mozgovú aktivitu usudzuje nepriamo –
na základe množstva spotrebovanej glukózy alebo kyslíka v príslušnej oblasti, metódy
ako elektroencefalografia alebo magnetoencefalografia snímajú priamo aktivitu mozgu.
29
Pri EEG vyšetrení je zaznamenávaná bioelektrická aktivita mozgu pomocou elektród
priložených k povrchu hlavy. Vďaka stĺpcovitému a paralelnému usporiadaniu je možné
zachytiť a zosilniť synchrónnu elektrickú aktivitu skupiny neurónov. Pozitívne
a negatívne výchylky zaznamenané elektródami závisia od excitačných postsynaptických
potenciálov apikálnych dendritov pyramidálnych buniek, šíriacich sa kolmo na povrch
hlavy. Ich smer a teda aj smer výchylky závisí od lokalizácie zdroja impulzu. V prípade
impulzov pochádzajúcich z kôrových neurónov kontralaterálnej hemisféry, ktorých axóny
končia v druhej vrstve mozgovej kôry, zaznamenáme na povrchu hlavy pozitívnu
výchylku. V prípade impulzov pochádzajúcich z neurónov talamu, ktorých axóny končia
v štvrtej vrstve mozgovej kôry, zaznamenáme na povrchu hlavy negatívnu výchylku
(Westbrook 2000). K výhodám EEG vyšetrenia patrí veľmi dobré časové rozlíšenie,
s presnosťou na milisekundy; neinvazívnosť a finančná nenáročnosť prístroja aj
samotného vyšetrenia. Nevýhodou je pomerne nízke priestorové rozlíšenie. EEG záznam
je možné snímať relatívne dlhú dobu. Zmeny frekvencie a amplitúdy EEG aktivity súvisia
s mentálnym stavom (iné sú pri ospalosti, pri sústredení, pri rôznych štádiách spánku
a pod.). Na priradenie elektrickej aktivity mozgu k určitej konkrétnej činnosti alebo
udalosti je potrebné takýto pokus niekoľkokrát opakovať (napr. 100krát). Mozgová
aktivita, ktorá s úlohou nesúvisí, sa po sčítaní všetkých záznamov vynuluje, pretože
nastáva v náhodnom čase vzhľadom k začiatku úlohy. Aktivita, ktorá sa opakovala pri
každom jednom pokuse sa sčítaním zvýrazní – dostaneme tak evokované alebo
kognitívne potenciály (ERP, z angl. event-related potentials, potenciály viazané na
udalosť) charakteristického tvaru. Ich vlastnosti (tvar, amplitúda a latencia) odrážajú
časový priebeh mozgovej činnosti súvisiacej s úlohou.
Použitím spomenutých výskumných a zobrazovacích metód sme sa priblížili
k porozumeniu princípov fungovania mozgu a NS vôbec. No od skutočného poznania
konkrétnej funkcie každej konkrétnej oblasti mozgu sme ešte ďaleko. Na základe
výsledkov neurovedeckých experimentov je možné nájsť koreláciu medzi určitou
funkciou a určitou mozgovou oblasťou (resp. oblasťami), ktorá s danou funkciou súvisí.
Stručný prehľad toho, čo je doposiaľ o ľudskom mozgu (a jeho stavbe a funkcii) známe
sa nachádza v ďalšej časti.
2.10 Mozog a kognitívne procesy
Obrázok 4 zobrazuje základné časti mozgu. V najhrubšom delení rozdeľujeme mozog na
predný, stredný a zadný mozog. Toto delenie sa odvíja aj od fylogenetického vývoja.
Proces evolúcie uprednostnil pridávanie ďalších štruktúr pred nahradením starších.
Dôsledkom toho je hierarchická organizácia mozgového tkaniva – určité časti (evolučne
mladšie) sú „nadradené“ iným častiam (evolučne starším) – NS je usporiadaný do
viacerých úrovní, pričom vyššie úrovne majú zabezpečujú zložitejšie aspekty správania,
no robia tak prostredníctvom nižších vrstiev (Hughlings-Jackson,1931)
Predný mozog tvorí väčšinu viditeľnej časti neporušeného ľudského mozgu.
Fylogeneticky sa objavuje už u nižších cicavcov, no u žiadneho iného živočíšneho druhu
nie je vyvinutý do tak nepomerne veľkých rozmerov v porovnaní s ostatnými časťami
mozgu. Skladá sa z dvoch hemisfér – pravej a ľavej, ktoré síce nie sú identické, no na
30
každej z nich (tak ako aj na hemisférach rôznych ľudí) môžeme nájsť a opísať súbor
istých prvkov s ich charakteristickým vzájomným usporiadaním (podobne, ako žiadne
dve tváre a ani žiadne dve polovice tej istej tváre nie sú rovnaké, ale na každej z nich sa
nad ústami nachádza nos). Povrch oboch hemisfér brázdia ryhy alebo zárezy (z lat.
sulcus, mn. č. sulci), medzi ktorými sa nachádzajú závity (z lat. gyrus, mn. č. gyri).
Najväčšie brázdy svojím priebehom vyčleňujú aj štyri mozgové laloky. Frontálny resp.
čelový lalok sa nachádza pod čelovou lebečnou kosťou a od susedného temenného (z lat.
parietálneho) laloka ho oddeľuje centrálny zárez. Za ním sa nachádza okcipitálny, čiže
záhlavný lalok. Silviova brázda vyčleňuje spánkový alebo temporálny lalok, ktorý sa
nachádza pod spánkovou kosťou.
Obrázok 4. Základné časti mozgu. Predný mozog nasadá na štruktúry súborne označované ako
mozgový kmeň, medzi ktoré patrí predĺžená miecha, Varolov most a stredný mozog (medzimozog
sa niekedy taktiež radí k štruktúram mozgového kmeňa). (Upravené podľa: Pinel, 2009).
Na povrchu predného mozgu sa nachádza mozgová kôra, ktorá sa javí na reze
mozgom ako tmavšia (šedá) hmota hrubá asi 3mm. Je usporiadaná do vrstiev (rozdielne
vrstvy sú tvorené rozdielnymi typmi neurónov a na rôznych miestach kôry sa počet
vrstiev rôzni). Podľa cytoarchitektúry (rozdielneho tvaru, veľkosti, štruktúry, vzájomného
prepojenia buniek a ich rozmiestneniu v NS), rozdelil Brodmann mozgovú kôru na 52
areí. Neskôr sa na základe elektrofyziologických výskumov prostredníctvom stimulácie
kôrových oblastí určili na mozgovej kôre funkčne špecifické oblasti, ktoré prekvapivo
odpovedali určitým Brodmannovým areám (Fritsch a Hitzig, 1960). Napríklad
Brodmannova area (BA) 17, ktorá sa nachádza v záhlavnom (okcipitálnom) laloku
odpovedá neskôr opísanej primárnej zrakovej kôre; BA 4 nachádzajúca sa v čelovom
(frontálnom laloku) odpovedá primárnej motorickej kôre. Podobným spôsobom je možné
nájsť primárnu sluchovú oblasť v spánkovom (temporálnom) laloku a primárnu
somatosenzorickú oblasť v temennom (parietálnom) laloku. Okrem oblastí, ktoré sú
funkčne špecifické sa v mozgovej kôre nachádzajú oblasti, kde pravdepodobne prebieha
integrácia informácií z iných oblastí. Okrem lokalizácie funkcií v mozgovej kôre bola
zistená aj funkčná asymetria hemisfér – niektoré aspekty spracovávania informácií
väčšinou prebiehajú prednostne v pravej hemisfére (napríklad priestorové vnímanie), iné
sú väčšinou preferenčne viazané na ľavú hemisféru (napríklad reč).
31
Pod mozgovou kôrou sa nachádza biela hmota mozgu, v ktorej prebiehajú nervové
dráhy. V bielej hmote sú vnorené ďalšie štruktúry tvorené šedou hmotou – zhluky tiel
nervových buniek, súborne nazývané jadrá. Medzi tieto útvary patrí aj súbor štruktúr
zvaný bazálne gangliá, ktoré majú kľúčovú úlohu pri regulácii motoriky (dôsledky ich
poškodenia môžeme vidieť napríklad pri Parkinsonovej poruche). Štrukturálne rôznorodý
komplex zvaný limbický systém je významný pre reguláciu emotivity, motivácií,
pamäte, učenia a spracovania čuchových podnetov. Tvoria ho štruktúry ako amygdala
(dôležitá pre spracovanie emócie strachu), hipokampus, nevyhnutný pre tvorbu dlhodobej
epizodickej pamäte a ďalšie. K podkôrovým štruktúram koncového mozgu patrí aj tzv.
medzimozog, ktorý je uložený v hĺbke, medzi oboma hemisférami. Dve hlavné štruktúry
medzimozgu sú talamus a hypotalamus. Talamus alebo mozgové lôžko tvoria dva
vajcovité útvary s množstvom jadier. Označuje sa aj ako „brána do vedomia“, pretože
všetky senzorické dráhy (s výnimkou čuchu), ktoré vedú impulzy z periférie až do
mozgovej kôry (a následne sa objavia vo vedomí) prechádzajú cez talamus. Pod talamom
sa nachádza hypotalamus –štruktúra, zabezpečujúca základné homeostatické funkcie a
integráciu somatických a vegetatívnych funkcií do zložitých vzorcov reakcií, nevyhnutné
pre zachovanie života (riadenie činnosti vnútorných orgánov, termoregulácia, regulácia
príjmu potravy a vody, sexuálne správanie, motivačné správanie).
Stredný mozog tvorí u človeka objemovo len malú časť, nachádzajúcu sa pod
koncovým mozgom. Spolu s časťou zadného mozgu tvoria tzv. mozgový kmeň (niekedy
sa k nim priraďuje aj medzimozog), na ktorý nasadá „koruna“ tvorená hemisférami
predného mozgu. V strednom mozgu sa nachádzajú centrá pre zrakové a sluchové
orientované správanie (zameranie pozornosti na náhly zrakový alebo sluchový podnet)
a motorické jadrá hlavových nervov. Zasahuje doň aj retikulárna formácia – útvar
sieťovitého vzhľadu (na rozdiel od šedej a bielej hmoty), ktorý je zložený zo zmesi tiel
a axónov nervových buniek. Retikulárna formácia je súčasťou retikárneho aktivačného
systému, ktorého úlohou je aktivácia kôrových oblastí. Väčšia časť retikulárnej formácie
sa však nachádza v časti mozgového kmeňa, ktorý patrí k zadnému mozgu.
Zadný mozog tvorí Varolov most, predĺžená miecha a mozoček. Varolov most
obsahuje okrem časti retikulárnej formácie najmä vlákna, spájajúce časti NS navzájom (z
toho aj jeho pomenovanie) a jadrá niektorých hlavových nervov. Predĺžená miecha
zabezpečuje vitálne, esenciálne funkcie (dýchanie, srdečná frekvencia, slinenie,
prehĺtanie, vracanie, kašeľ, kýchanie a pod.). Okrem toho tiež obsahuje časť retikulárnej
formácie. Varolov most a predĺžená miecha tvoria spolu so stredným mozgom mozgový
kmeň. Mozoček neleží v línii s ostatnými časťami kmeňa, ale nasadá naň zozadu a tvorí
tak strop štvrtej mozgovej komory. K hlavným funkciám mozočka patrí kontrola
a koordinácia pohybov, vytváranie motorického plánu, koordinácia svalového napätia,
rovnováhy a postúry, ale aj časovanie pohybov, vnímanie rytmu a mnohé ďalšie funkcie
(Kalat, 2012, Pinel, 2009, Koukolík, 2002)
Tento výpočet mozgových funkcií zďaleka nie je vyčerpávajúci. Naznačuje však, že
určitým oblastiam NS je možné priradiť určité funkcie, no proces spracovania informácií
prebieha paralelne v mnohých častiach NS a na komplexné spracovanie informácií sa
využívajú rozsiahle distribuované neurónové siete.
32
Literatúra
Fritsch, G. a Hitzig E. (1960): On the electrical excitability of the cerebrum. In Bonin,
von G. (zost.): The Cerebral Cortex. Springfield, IL: Charles C. Thomas.
Haydon, P. G. a Carmignoto, G. (2006): Astrocyte control of synaptic transmission and
neurovascular coupling. Physiological Reviews, 86, 1009–1031.
Hubel, D. H. a Wiesel, T. N. (1968): Receptive fields and functional architecture of
monkey striate cortex. Journal of Physiology, 195(1): 215-243.
Hughlings-Jackson, J. (1931): Selected Writings of John Hughlings-Jackson, In J. Taylor,
Ed., vols. 1 and 2. London: Hodder.
Kalat, J. (2012): Biological Psychology (11. vyd). Belmont, California: Wadsworth.
Kolb, B. a Wishaw, I.Q. (2009): Fundamentals of Human Neuropsychology (6. vyd). San
Francisco: Freeman.
Koukolík, F. (2002): Lidský mozek – funkční systémy, norma a poruchy. Praha: Portál.
Kráľ, A. (1997): Neurónové siete a nervový systém. V knihe Kvasnička, V. (zost.): Úvod
do teórie neurónových sietí. Iris, Bratislava, 11-31.
Pinel, J.P.J. (2009): Biopsychology (7. vyd.). Pearson/Allyn and Bacon.
Purves, D., Augustine, G.J., Fitzpatrick, D., Hall, W.C., LaMantia, A-S., a spol. (2004):
Neuroscience, (3. vyd). Sunderland: Sinauer Associates, Inc.
Sternberg, R.J. (2009): Kognitivní psychologie [z amerického originálu Cognitive
psychology preložil Koukolík, F.] Praha: Portál.
Ward, J. (2006): The Student’s Guide to Cognitive Neuroscience. New York: Psychology
Press.
Westbrook, G.L. (2000): Seizures and Epilepsy. In Kandel, E.R., Schwartz, J.H., Jessel,
T.M. (zost.): Principles Of Neural Science 4th Ed. New York: McGraw-Hill, 910-
935.
White EL. (1989): Cortical Circuits: Synaptic Organization of the Cerebral Cortex.
Boston: Birkhauser.
33
Kapitola 3
Fundamentálne aspekty kognície: percepcia a
pamäť
JÁN RYBÁR
Predmetom tejto kapitoly sú základné kognitívne aspekty (resp. funkcie) kognície:
percepcia a pamäť v kontexte s najnovším vývinom v kognitívnej vede a kognitívnej
psychológii. Hoci sa nimi budeme zaoberať oddelene, chceli by sme zdôrazniť, že sú
navzájom prepojené a fungujú spolu. Jednotlivo sa nimi budeme zaoberať predovšetkým
kvôli transparentnejšiemu výkladu.
3.1 Vizuálna percepcia – základné vlastnosti
Vzhľadom na limitovaný priestor, ktorý máme k dispozícii, výklad zúžime len na jeden
druh percepcie, a to na vizuálnu percepciu. Výber nie je náhodný, vedú nás k nemu tieto
hlavné dôvody: (1) u človeka vizualita hrá veľmi významnú úlohu; (2) vizuálna percepcia
je výnimočný kognitívny nástroj, ktorý má dištančný charakter (sníma informácie
z prostredia bez priameho kontaktu s predmetmi); (3) výskum vizuálnej percepcie má
dlhodobú tradíciu a dosiahli sa tu pozoruhodné výsledky.
Za veľmi dobrý prostriedok (pomôcku) pri vysvetľovaní vizuality považujeme
optické ilúzie. Pretože v prípade týchto ilúzií nejde o nedostatky, chyby percepčného
systému, ako by sa mohlo zdať na prvý pohľad, ale ide o inteligentné heuristiky,
pomocou ktorých odhadujeme aké je prostredie okolo nás (Gigerenzer, 1999).
Prostredníctvom optických ilúzií je možné veľmi dobre vysvetliť základné vlastnosti
vizuálneho percepčného systému: (1) dynamiku organizačnej sily (schopnosti)
percepčného systému; (2) konštantnosť vnímania veľkosti, tvaru, jasnosti a rôzne
heuristiky s ňou spojené; (3) binokulárne a monokulárne vnímanie hĺbky (3D).
3.1.1 Klasifikácia optických ilúzií
V súčasnosti je k dispozícii veľké množstvo techník na demonštrovanie najrôznejších
optických ilúzií (môžeme hovoriť o stovkách a ich počet neustále rastie). O tom svedčí aj
množstvo webových stránok venovaných optickým ilúziám. Ak chceme vniesť do toho
nejaký poriadok (alebo ak chcete vedeckejší prístup) prvé, čo treba urobiť, je pokúsiť sa
o klasifikáciu týchto ilúzií. Niektoré takéto pokusy boli už urobené. Medzi
najzaujímavejšie patrí klasifikácia R. Gregoryho. Delí ilúzie podľa dvoch základných
kritérií. Prvé kritérium spočíva v tom o aký druh „chýb“ pri videní ide. Podľa toho
môžeme deliť ilúzie na: dvojznačné obrazce (napríklad Neckerova kocka, káčer/zajac
a mnohé ďalšie), skreslenia (všetky ilúzie, ktoré sa týkajú porušenia konštantnej veľkosti,
tvaru a jasu), paradoxy (napríklad Penrosove schody) a fikcie (napríklad Kanizsov
34
trojuholník). Druhým kritériom klasifikácie ilúzií je delenie podľa toho, čo ich spôsobuje.
Podľa toho kritéria delíme ilúzie na: fyzikálne (napríklad palica ponorená do vody sa zdá
nalomená), fyziologické (rôzne paobrazy a afterefekty), kognitívne (napríklad dvojznačné
obrazce), a na tie, ktoré súvisia s geštaltistickými princípmi – princíp blízkosti,
podobnosti, symetrie atď. (Gregory, 2004, s. 248-249).8 V hre sú aj ďalšie kritériá, ak sa
vstupné senzorické dáta menia, ale obrazce nejakým spôsobom pretrvávajú, hovoríme
o fyziologických ilúziách (napríklad paobrazy).9 A naopak, ak sa vstupné dáta nemenia,
ale obrazce napriek tomu áno, hovoríme o kognitívnych ilúziách (dvojznačné obrazce,
fikcie, skreslenia – veľkosti, tvaru, jasu, a tiež tzv. nemožné obrazce). Gregory
poznamenáva, že fyziologické ilúzie sú o mozgu, kognitívne o mysli.
V klasifikácii, ktorú používame sa pridržiavame posledných dvoch kritérií, teda či sa
menia vstupné senzorické dáta alebo nie a aký to má vplyv na obrazce v procese
vnímania. Tieto základné kritéria kombinujeme s klasifikovaním podľa druhu „chýb“,
ktoré sa vyskytujú v optických ilúziách.
3.1.1.1 Paobrazy
Typickým predstaviteľom fyziologických ilúzií sú tzv. paobrazy (after-images). O
existencii týchto fenoménov sa môžete veľmi ľahko presvedčiť, ak sa pozriete na
niekoľko sekúnd do ostrého svetla, napríklad žiarovky, a potom zatvoríte oči, alebo
premiestnite pohľad na bielu plochu, uvidíte plávajúcu žiaru. Určite však najslávnejšou a
najznámejšou ilúziou v tejto kategórii je ilúzia bradatého muža (na webových stránkach
ju môžete nájsť aj pod názvom four dots). Je to veľmi efektný príklad ilúzie. Ak sa budete
pozerať tridsať sekúnd na isté čiernobiele škvrny, uprostred ktorých sú štyri bodky, a
potom zatvoríte oči, tak na mentálnej obrazovke, alebo, ak premiestnite pohľad napríklad
na bielu stenu, uvidíte v svetelnom kruhu hlavu bradatého muža.
Na prvý pohľad sa môže zdať, že táto ilúzia je zaujímavou ilustráciou jednej z
mnohých záhad „defaultovo“ obsiahnutých vo vizuálnej mozgovej kôre (resp. ďalších
častiach mozgu). Cestu k vysvetleniu tejto záhady treba však primárne hľadať už v tom,
čo sa v tejto súvislosti odohráva na sietnici. Ide jednoducho o to, že pri vnímaní čierno-
bieleho obrazca bunky citlivé na svetlo sa po tridsiatich sekundách unavia, a to vlastne
spôsobuje, že vidíme negatívny paobraz. Tento experiment je veľmi dobrými príkladom
na demonštráciu toho, ako na sietnici pracujú bunky citlivé na svetlo.
Na základe toho sme si vytvorili hypotézu, že konštruktéri tejto ilúzie nám vlastne
predkladajú negatív hlavy bradatého muža. V zásade je to tak, ale procesy na sietnici
nevysvetľujú celkom vznik paobrazu. V hre musia byť ešte ďalšie záležitosti, pretože, ak
urobíme počítačový negatív negatívu (pozri obrázok 1) nedostaneme dokonalú hlavu
bradatého muža.
8 Zaujímavá je aj kategorizácia optických ilúzií podľa obsiahnutých postupov, ktorej autorom je
Ninio (2001). Klasifikáciou ilúzií sa zaoberajú aj Šikl a Šimeček (2010). 9 Aby sme sa vyhli prípadným nedorozumeniam upozorňujeme, že termín fyziologické ilúzie
používame v tejto prednáške len v tomto presne zadefinovanom zmysle. Samozrejme, že v
širšom zmysle slova sú všetky ilúzie fyziologické, pretože sú vždy spojené s činnosťou oka a
mozgu.
35
Obrázok 1.: Predloha a negatív.
Paobraz nie je presný negatív pozorovaného obrázku. Tvorcovia ilúzie – aby sme
celkom ľahko neprišli na to, že je to jednoducho negatív – urobili ešte niekoľko zásahov
do tohto negatívu. Kruh, v ktorom je negatív bradatého muža, je deformovaný, črty tváre
sú znejasnené pridaním alebo posunutím bielych a čiernych škvŕn. Napriek tomu
v paobraze vidíme zreteľné črty bradatého muža umiestneného v dokonalom svetelnom
kruhu. To znamená, že pri konštruovaní tejto ilúzie, okrem čiernobieleho negatívu, sú v
hre ešte aj záležitosti súvisiace s geštaltistickým zákonom pregnantnosti (zákonom
dobrých tvarov). Môžeme povedať, že v paobraze je manifestovaná úžasná organizačná
sila percepčného systému. Je to jedna zo základných vlastnosti percepčného systému.
Aby sme si jasnejšie uvedomili o čo ide, pozrime sa pozorne na testovací obrázok 2.
Vidíme na ňom raz väčšie a hneď zase menšie kruhy, skladajúce sa do ďalších kruhov,
v ktorých sú rôzne útvary. Obrázok je veľmi dynamicky, neustále sa mení. Táto
organizačná sila percepčného systému bola formulovaná v geštaltistických princípoch
(blízkosti, podobnosti, kontinuity, uzatvorenosti, symetrie atď.).10
Obrázok 2: Dynamika videnia.
10
Čo je exaktným potvrdením Kantových špekulatívnych úvah, o tom, že organizácia poznania už
na zmyslovej úrovni je podmienená organizačnými schopnosťami našej mysle.
36
Ale vráťme sa k paobrazom, k nášmu východiskovému problému. Na jednom
seminári, keď sme demonštrovali konštruovanie paobrazov, bola položená otázka, či sa
objaví ten istý fenomén, ak na obrázku bude napríklad stolička. Samozrejme, že to
funguje aj so stoličkou, alebo s akýmkoľvek čierno-bielym objektom. Dokonca v súlade
s Heringovými objavmi to funguje, ak použijeme nielen čiernobiely, ale aj žlto-modrý
alebo červeno-zelený negatív. Jednoducho, ak použijeme tzv. komplementárne farby. Na
základe toho bolo vytvorených mnoho paobrazových ilúzií pracujúcimi s farbami
štátnych zástav, v ktorých sa vyskytujú tieto komplementárne farby (napríklad zástava
USA, Anglicka, Nemecka, Japonska atď.)
Aj v prípade stoličky platia tie isté záležitosti ako v prípade paobrazu bradatého
muža. Keď sme do negatívneho obrázka stoličky pridali čierne škvrny, trochu sme
rozrušili jej ostré línie, napriek tomu stolička v paobraze bude bez škvŕn, jej línie budú
ostré a bude v dokonalom svetelnom kruhu. Mimochodom, štyri bodky uprostred, podľa
ktorých sa zvykne ilúzia bradatého muža volať (na našom obrázku stoličky sme použili
len tri bodky), nemajú v ilúziách tohto druhu veľký význam, je to len ďalší odpútavací
manéver konštruktérov ilúzie.
Ako sme už uviedli, základným kritériom pre určenie kognitívnych ilúzií je fakt, že
hoci sú vstupné dáta stále, napriek tomu sa vnímané obrazce menia. Tieto ilúzie sú oproti
fyziologickým ilúziám viac spojené s vyššími kognitívnymi procesmi. Kognitívne ilúzie
podľa druhu chýb môžeme deliť na niekoľko podkategórií: dvojznačné obrazce, fiktívne
obrazce, skresľujúce (veľkosť, tvar a jas) a nemožné obrazce.
3.1.1.2 Dvojznačné obrazce
Ide o figúry, ktorých vnímanie je spojené s dvoma, niekedy aj viacerými možnosťami.
Nezainteresovanému pozorovateľovi sa môže zdáť, že prepínanie tých možnosti je
náhodné, no nie je to celkom tak. V prípade Neckerovej kocky (obr. 3 vľavo) je ten istý
roh vnímaný ako vnútorný a inokedy zase ako vonkajší roh. Náš vizuálny systém v tomto
prípade dokáže cieľavedome preklikávať. Nikdy však nemôžeme vidieť obidve orientácie
naraz. Podobne je to aj v prípade ďalšej populárnej dvojznačnej figúry (obr. 3 vpravo),
ktorá sa zvykne nazývať svokra/nevesta. Vstupný obrázok sa nemení, ale náš vizuálny
systém ho interpretuje dvoma spôsobmi. Závisí to od toho, kam sa pozeráme. Ak sa
pozeráme na oko, uvidíme svokru, ak viac na ľavú stranu obrázku, uvidíme nevestu.
Obrázok 3: Neckerova kocka (vľavo) a svokra/nevesta (vpravo).
37
Dvojznačnými (resp. mnohoznačnými) figúrami sa inšpirovalo mnoho slávnych
výtvarných umelcov. Najznámejšie sú v tomto smere grafiky M. C. Eschera (1898-1972).
Tento výtvarník bol ozajstným majstrom vizuálnych paradoxov. Jeho obľúbenou
technológiou bolo premyslené využívanie optických ilúzií, včítane dvojznačných figúr.
V tomto smere vynikajúco uplatnil dvojznačnú optickú figúru Schroederove schody (obr.
4). Ak sa pozornejšie pozrieme na tento obrázok, po chvíli zistíme, že tá strana schodiska,
na ktorej je okrúhly znak, môže byť zadnou stenou alebo prednou stenou schodiska
(v druhom prípade sú schody otočené dolu hlavou). Ak si vopred na tomto obrázku
nacvičíme preklikanie z jednej figúry na druhú, budeme pripravení pochopiť, prečo je na
jeho grafike Relativita možné, že dve postavy idú jedným smerom na jednom schodisku,
a predsa jedna ide dole a jedna hore. Tá istá dvojznačná figúra je viacnásobne uplatnená
aj v grafike Konvexné a konkávne, a potom sa naozaj tie isté schody zdajú raz vypuklé
a raz preliačené.11
Obrázok 4: Schroederove schody.
Dvojznačnými figúrami sa nadchol aj známy surealistický maliar Salvador Dalí
(1904-1989), ktorý tento druh ilúzií zakomponoval do mnohých svojich obrazov.
Najznámejšie z nich sú Paranoická figúra (na obraze môžeme vidieť tvár ležiacu na
piesku alebo skupinu sediacich ľudí), Obraz mizne (môžeme tu vidieť hlavu fúzatého
a bradatého muža z profilu, alebo čítajúcu ženu) a ďalšie.
Od konca 19. storočia, keď sa psychológovia začali intenzívne zaujímať o optické
ilúzie, bolo skonštruovaných veľmi veľa dvojznačných figúr. J. R. Blockovi sa do jeho
knihy Seeing double (2002) podarilo nazbierať viac než dvesto.
3.1.1.3 Fiktívne ilúzie
Tento druh ilúzií tiež svedčí proti koncepciám priamej percepcie (vnímané objekty nie sú
v senzorických vstupoch). Na Ehrlichovom obrázku (obr. 3 vľavo) nie sú nakreslené
žiadne biele kruhy, a predsa ich tam jasne vidíme.
Najslávnejšou a najefektnejšou ilúziou v tejto oblasti je Kaniszov trojuholník (obr.
5). Biely trojuholník, ktorý vidíme je fikciou. Ide o proces zhora nadol, náš vizuálny
systém si obrázok interpretuje tak, že konštruuje trojuholník, ktorý prekrýva tri tmavé
objekty. Trojuholník má dokonca výraznejšiu bielu farbu než pozadie. Je zjavné, že aj tu
11
Uvedené grafiky môžeme nájsť na stránke: http://www.mcescher.com/Gallery/gallery.htm. Tiež
ich môžeme nájsť v reprezentačných monografiách venovaných Escherovmu grafickému dielu
(Locker 1992, Locker 2000).
38
sú v hre geštaltistické princípy, predovšetkým princíp uzatvorenosti. Ilúzia fiktívneho
trojuholníka sa objaví aj vtedy, ak pod ním nie je nakreslený ďalší akoby prekrytý
trojuholník. Úloha tohto trojuholníka spočíva iba v zosilnení účinku ilúzie.
Obrázok 5: Ehrlichova ilúzia (vľavo) a dva príklady Kanizsovho trojuholníka.
3.1.1.4 Skresľujúce ilúzie
Prvá podskupina ilúzií, ktorou sa tu budeme zaoberať sa týka fenoménu vnímania
konštantnej veľkosti objektov. Ide o to, že napriek tomu, že veľkosť objektu na našej
sietnici sa mení podľa toho ako je predmet vzdialený od nás (ak je objekt bližšie k nám je
väčší, ak je ďalej je menší na našej sietnici), stále máme rovnakú predstavu o jeho
veľkosti. Táto stálosť sa však pomocou rôznych “manipulácií” dá významne narušiť.
Hádam najznámejším klasickým prípadom je Müller-Lyerova figúra.
Podstata ilúzie je v tom, že ak jedna z dvoch rovnakých úsečiek má kótovanie
(krídelká) do vnútra a druhá von, úsečka s vonkajším kótovaním (s vonkajšími
krídelkami) sa bude zdať dlhšia. Napríklad pri pokusoch, v ktorých sa porovnáva
štandardná úsečka (bez krídelok) s úsečkou s krídelkami von, sa zistilo, že v odhade
veľkosti sa mýlime v priemere o 10% (Francis, 2004).
Zaujímavé je, že ilúzia ostáva aj keď vieme, že je to ilúzia, tento poznatok, táto
vedomosť ju neodstraňuje. Teda v tomto zmysle percepcia nie je informačne otvorená
voči predchádzajúcim skúsenostiam. Zdá sa, že nie je penetrovaná kogníciou a je
informačne uzatvorená, má modulárnu povahu (pozri bližšie Rybár, 2002, s. 35-40).
Obrázok 6: Orbisonova ilúzia (vľavo) a Whiteova ilúzia (vpravo).
Podobne je to aj s konštantnosťou tvaru. V závislosti od toho či sa pozeráme na
predmet spredu alebo zboku je na sietnicu premietnutý iný tvar, ale to nijako neohrozuje
našu predstavu o stálom tvare predmetu. Avšak pomocou pozadia (napríklad líniami
39
usporiadanými do hviezdice, alebo do sústredných kruhov) vieme narušiť túto
konštantnosť. Bolo vytvorených mnoho ilúzií tohto druhu, niektoré už v 19. storočí. Ich
autormi boli fyzici, ktorí sa zaoberali skresleniami optických prístrojov. Uveďme aspoň
jednu z nich (obr. 6 vľavo).
V odbornej literatúre je opísaný zaujímavý prípad S. B. Išlo o muža, ktorý bol slepý
od narodenia až do stredného veku. Po transplantácii rohovky začal vidieť. Jeho videnie
bolo spojené s mnohými ťažkosťami a zvláštnosťami a trpel depresívnymi náladami.
Napríklad, mal veľký problém s tým, že predmety z rôznych strán vyzerajú rôzne.
Vizuálny svet sa mu nezdal taký dokonalý ako očakával. Ťažko odhadoval vzdialenosť
objektov, mal problém s vnímaním vecí, ktoré nepoznal z dotyku, podobne ťažkosti mal
aj s kreslením vecí, ktoré nepoznal z dotyku. Mal problémy s čítaním malých písmen,
pretože tie sa v slepeckej škole neučili (Gregory, 2004). Okrem iného S. B. nebol veľmi
senzitívny na ilúzie Orbisonovho typu.12
Konštruktéri paradoxných fenoménov radi využívajú aj ilúzie spojené s vnímaním
vertikály a horizontály. Je známe, že vzdialenosti orientované zdola hore (alebo zhora
dole) sa nám zdajú väčšie než vzdialenosti v orientácii zľava doprava (alebo sprava
doľava).13
Čiastočne aj o tento poznatok sa opiera konštrukcia Shepardových otočených
stolov (jeden zo stolov je viac menej otočený užšou stranou v smere vertikály a širšou
stranou v smere horizontály). Ide o ilúziu týkajúcu sa tvaru a veľkosti dosiek stolov, ktoré
hoci nevyzerajú rovnaké, napriek tomu sú toho istého tvaru a veľkosti. Avšak
preceňovanie vertikály ani zďaleka nestačí na vysvetlenie ilúzie, pretože, keď obrázok
otočíme o 90˚, ilúzia sa síce trochu zoslabí, ale nezmizne (stoly stále vyzerajú nerovnaké).
To znamená, že pri konštruovaní tejto ilúzie sú v hre aj ďalšie záležitosti. Veľmi
dôležitým faktorom je, že vnútorné (susedné) hrany a nohy stolov sú v perspektíve, čo
vytvára hĺbku a predlžuje jeden stôl do dĺžky a druhý do šírky. V hre sú pravdepodobne
aj ďalšie faktory monokulárneho videnia hĺbky (napríklad efekt prekrývania zadných nôh
stolov). V každom prípade ide tu o využitie viacerých ilúzio-tvorných prvkov v jednom
obrazci (Ninio, 2001).
Ďalej existuje veľké množstvo efektných ilúzií s porušením konštantnosti jasu. Na
ilustráciu sme vybrali Whitovu ilúziu, ktorá patrí medzi najjednoduchšie. Na obrázku 6
vpravo je v obidvoch stĺpcoch rovnaká šedá. Jasnosť šedého polička sa mení v súvislosti
s pozadím. Na tmavom pozadí sa tá istá šedá farba javí svetlejšia a naopak na svetlom
pozadí sa javí tmavšia.14
12
Z tohto prípadu vyplýva, že vidieť sa do značnej miery učíme. Najsenzitívnejšie obdobie pre
takéto učenie je už rané detstvo. V zrelom veku je takéto učenie už veľmi ťažké, často aj
nemožné. Napríklad sa zistilo, že ak istý druh vrabca (white-crowned sparrow) medzi 20. až 50.
dňom svojho života nepočuje spev, tak neskôr sa to už nenaučí. Podobne, ak sa mačiatkam
medzi 30. až 80. dňom zakryjú oči, tak sú slepé do konca života (Gopnik, 2001). 13
Evolučno-psychologické vysvetlenie tejto ilúzie hovorí, že predimenzované videnie vertikály
(oproti horizontále) bolo výhodné pre lovca-zberača. 14
Veľmi zaujímavé analýzy o fenoménoch s porušovaním jasnosti môžeme nájsť v štúdii
Kremláčka (2006).
40
3.1.1.5 Nemožné objekty
Tieto objekty majú zvláštnu povahu, môžeme ich nakresliť v dvojrozmernej rovine, ale
nemôžeme ich reálne skonštruovať v trojrozmernom priestore. Poznáme niekoľko
základných typov nemožných objektov.
Na pôdu vedeckej psychológie sa problematika dostala až v päťdesiatych rokoch
minulého storočia, keď Lionel S. Penrose a jeho syn Roger Penrose publikovali článok
v British Journal of Psychology (1958), v ktorom boli nakreslené a opísané dva typy
nemožných objektov. Prvý typ objektov, ktorý popisujú je tzv. nemožný (paradoxný)
trojuholník. Každý uhol tohto trojuholníka sa javí ako perfektne pravý, ale celkove je to
veľmi zvláštny trojuholník (obr. 7 vľavo).
Obrázok 7: Penrosov nemožný trojuholník (vľavo) a Penrosove schody (vpravo).
Nezávisle od Penrosovcov skonštruoval podobný trojuholník aj švédsky výtvarný
teoretik Oscar Reuterswärd (1915-2002). Prvý nemožný trojuholník nakreslil z kociek už
v roku 1934. Je autorom viac než dvetisíc rôznych variácií tohto typu nemožných
objektov. Dokonca vo Švédsku bola vydaná na jeho počesť poštová známka s námetom
nemožného trojuholníka.
Druhým slávnym nemožným objektom, o ktorom sa hovorí v článku Penrosovcov sú
tzv. večné schody (obr. 7 vpravo). Po týchto schodoch môžeme neustále vystupovať
alebo zostupovať.15
Je to jeden z najznámejších nemožných objektov. Ilúzia sa podľa
mien jej autorov často nazýva aj Penrosove schody.
Avšak pravdepodobne najznámejším nemožným objektom je nemožná kocka (obr.
8), ktorej autorom je M. C. Escher. S jej rôznymi variantmi sa môžeme sa stretnúť na
rôznych webových stránkach, na plagátoch, jednoducho všade tam, kde ide o upútanie
pozornosti diváka. V každom prípade je to zvláštna kocka.16
Ak si budeme všímať len
jednotlivé detaily obrázku, bude všetko v poriadku, ak sa však pozrieme na kocku ako
15
Profesor Zimbardo vo svojom televíznom kurze psychológie uvádza dokonca animovanú
podobu tejto ilúzie (po schodoch smerom hore alebo dole večne skáče gulička). 16
V podstate ide o upravenú Neckerovu kocku. Prvú známu verziu nemožnej kocky prezentoval
holandský grafik Escher (1958) vo svojej známej grafickej práci Belvedér. Autor tu prejavil
značnú dávku zmyslu pre humor, pod belvedérom sedí na lavičke chlapec, pred sebou má nákres
nemožnej kocky, a zároveň ju už zostrojenú drží v rukách. Najjednoduchšiu verziu nemožnej
kocky (obr. 9) možeme nájsť na stránke: http://mathworld.wolfram.com/FreemishCrate.html
41
celok, je to nezmysel (jeden z jej zadných „pilierov“ je postavený pred predným
„prekladom“).
Holandský grafik Escher bol skutočne majstrom vytvárania podivných
trojrozmerných efektov (ilúzií) v dvojrozmernej rovine, bol majstrom v mýlení našich
schopností vnímať trojrozmerné objekty. Jeho grafiky pôsobia ako akýsi vizuálny
labyrint, ktorého zmysel nechápeme, a z ktorého sa nedá dostať von. Nie je to však až
také beznádejné. Odpoveď ako sa zorientovať v labyrinte Escherových trikov nám môžu
poskytnúť práve poznatky z psychológie vnímania.
Obrázok 8: Nemožná kocka.
Je zaujímavé, že tohto vynikajúceho grafika mnohí jeho súčasníci považovali skôr za
dobrého remeselníka, než výtvarného umelca. Dokonca boli vyslovené pochybnosti, či
vôbec ide ešte o výtvarné umenie, alebo sú to len rôzne intelektuálne hračky a vedecké
záhady. Escher dosiahol väčšiu popularitu medzi prírodovedcami a matematikmi než
medzi výtvarníkmi a výtvarnými teoretikmi.17
Nie je to náhodné, keďže je o ňom známe,
že svoje inšpirácie hľadal (hoci nemal žiadne formálne prírodovedné vzdelanie) práve
v tejto oblasti. Veľký vplyv mal na neho jeho brat, ktorý bol kryštalograf. Escher svojím
skúmaním a kreslením mnohostenov vzbudil záujem aj u profesionálnych prírodovedcov,
ktorí ho pozývali prednášať o symetrii na svoje vedecké semináre. Ovplyvnilo ho aj
čítanie niektorých matematických odborných článkov, medzi nimi predovšetkým Polyov
článok o symetrických grupách a takisto článok profesora Coxetera, ktorý mal významný
vplyv na tvorbu jeho grafík súvisiacich s princípom nekonečna. V každom prípade Escher
mal výnimočnú schopnosť vizualizovať také matematické princípy ako sú symetria,
rekurzia, limita a ďalšie. Dokázal sa zmocniť aj takej témy ako je princíp autoreferencie.
Ukážkovou toho je litografia s názvom Galéria.18
Keďže bol známy svojím záujmom o vizuálne paradoxy, v tejto súvislosti treba
uviesť, že R. Penrose mu poslal článok o nemožných objektoch. A urobil dobre, pretože
Escher sa skutočne dokázal inšpirovať a zmocniť témy nemožných objektov veľmi
originálnym spôsobom. Penrosove paradoxné schody sa stali námetom jeho slávnej
17
V tejto súvislosti nezabudnime pripomenúť, že je stále veľmi populárny aj medzi laickou
verejnosťou. Mnohé jeho práce „zľudoveli“ a často jeho obdivovatelia ani nevedia, že ich
autorom je Escher..
18 Pozri: http://www.mcescher.com/Gallery/gallery.htm
42
grafiky Ascendentné a descendentné (niekedy nazývanej aj Mnísi). Grafika predstavuje
mníchov na večnom schodisku. Po jednej strane schodiska mnísi stále zostupujú a po
druhej strane toho istého schodiska iní mnísi stále vystupujú v uzatvorenom cykle. Tu už
nejde len o majstrovsku konštrukciu vizuálneho paradoxu, tu sa Escherovi podarilo
vniesť do tohto námetu metafyzický rozmer.
Veľkou témou sa pre neho stal aj nemožný trojuholník. Túto ilúziu spracoval
v slávnej grafike Vodopád.19
Na grafike je prezentovaný mlyn s vodným náhonom
a dvomi vežami. Ak sa budeme na obrázok pozerať analyticky (kúsok po kúsku pôjdeme
vodným kanálom) všetko bude v poriadku – voda tečie stále dole. Ak sa pozrieme na
obrázok ako celok, budeme vidieť niečo nezmyselné a nemožné, že voda tečie hore
kopcom. Na obrázku nás šokuje konflikt medzi lokálnym a holistickým prístupom. Táto
grafika je skvelým príkladom, že jeho práce sú viacvrstvové. Ak si túto grafiku ešte
pozornejšie prezrieme, tak zistíme, že okrem efektu vody, ktorá paradoxne tečie hore
kopcom, grafika obsahuje tri nemožné trojuholníky. Pričom sú konštruované tak, že ak si
pozrieme len ľavú alebo len pravú stranu práce, tieto trojuholníky neuvidíme. Vidíme ich
len, keď pozeráme na grafiku ako celok.
3.1.2 Binokulárne a monokulárne vnímanie hĺbky
Je zaujímavé, že skúmanie nemožných objektov môže efektívnym spôsobom prispieť
k objasneniu vizuálnych paradoxov obzvlášť tých, ktoré súvisia s vnímaním hĺbky (3D).
Toto skúmanie môže pomôcť odpovedať na mnohé základné otázky: Ako je možné, že
dokážeme vnímať priestor, hoci na sietnici máme v podstate len 2D zobrazenie objektov?
Zvyčajná odpoveď je: „Pretože sme binokulárni“. Samozrejme, odpoveď ide správnym
smerom. Ak sa objekt približuje k nám, oči sa otáčajú k nosu. Toto otáčanie (binokulárna
konvergencia), pohyb očných svalov je významným indikátorom pre mozog pri
odhadovaní vzdialenosti objektu. Druhým takým indikátorom je fakt, že vnímaný obraz z
obidvoch očí nie je celkom totožný (binokulárna disparita). Môžeme sa o tom ľahko
presvedčiť, keď sa pozrieme na objekt, ktorý je blízko pred nami najprv jedným a potom
druhým okom.20
Na základe rozdielnych informácií z jedného a druhého oka mozog
indikuje vzdialenosť objektu v priestore. Konvergencia a disparita sú nepochybne
dôležitými faktormi priestorového vnímania.
To však ešte nemôže byť úplným vysvetlením vnímania hĺbky, a to z veľmi
jednoduchého dôvodu – hĺbku dokážeme vnímať aj jedným okom. V tejto súvislosti nás
zaujímajú vlastne dve otázky: (1) V čom spočíva podstata vnímania hĺbky jedným okom?
(2) Ako sa konštruuje hĺbka (ilúzia hĺbky) v dvojrozmernej rovine? Na základe čoho teda
môžeme vytvárať a vnímať trojrozmerné efekty v rovine. Odpoveď na prvú i druhú
otázku treba hľadať v “manipulácii” s monokulárnymi indikátormi vnímania hĺbky.
A práve spomínaný Escher vo svojich grafikách priam inžiniersky presne pracuje
s týmito indikátormi. Ešte raz sa pozrime na jeho znamenitú grafiku Vodopád,21
aby sme
19
Obidve spomínané grafiky môžeme nájsť na http://www.mcescher.com/Gallery/gallery.htm. 20
Tu treba poznamenať, že ak je objekt vzdialený od nás viac než sto metrov, rozdiely sú už
zanedbateľné a v tom zmysle sme vlastne monokulárni. 21
Pozri: http://www.mcescher.com/Gallery/gallery.htm
43
videli akú bohatú paletu indikátorov vnímania hĺbky použil, aby rafinovane poplietol náš
percepčný systém.22
Prvým takým indikátorom využívaným v tejto grafike je prekrývanie
objektov. Hoci len čiastočne prekryté objekty sa na dvojrozmernom obraze vždy zdajú
vzdialenejšie. Druhý indikátor súvisí s umiestnením objektov vo výške. Objekty
umiestnené vyššie (nad horizontom) sa zdajú vzdialenejšie, objekty umiestnené nižšie
(pod horizontom) sa zdajú bližšie. V danom prípade je využitý výškový efekt, a napriek
tomu, že kanál smeruje v rovine do výšky, máme dojem, že voda tečie do hĺbky. Tretí
indikátor, ktorý pomáha vytvárať hĺbku sú konvergujúce línie, teda lineárna perspektíva.
Je to najdôležitejší indikátor, s ktorým Escher v grafike pracuje. Štvrtým indikátorom je
veľkosť objektov na obraze. Väčšie objekty na grafike sa zdajú bližšie než menšie (ten
istý mnohosten na pravej veži mlyna je väčší než mnohosten na ľavej strane, aj preto sa
prvý zdá bližšie než druhý). Prúd vody v kanále tečúci do hĺbky je posilnený
zmenšovaním veľkosti múrika, ktorý vodu obklopuje. Dôležitým indikátorom je
povrchová štruktúra nakresleného múrika kanála aj samotnej vody. Je hrubšia, zrnitejšia
na začiatku kanála a jemnejšia na konci, čo takisto posilňuje ilúziu hĺbky. Ďalším
indikátorom je tienenie. Tmavšie častí objektu (napríklad spomínané múriky vodného
kanála) sa zdajú byť vzdialenejšie než svetlejšie oblasti. Posledným indikátorom je
vzdušná perspektíva. Obrazy objektov, ktoré sú nejasnejšie sa zdajú vzdialenejšie, než
objekty s výraznými zreteľnými obrysmi. Escher práve pomocou majstrovského
vyžívania indikátorov monokulárneho videnia hĺbky dokáže vytvoriť ilúziu, že voda tečie
hore kopcom. Na začiatku sa nám mohlo zdať, že ide o záhadný výtvor autorovej
výstrednej mysle. Teraz vidíme, že to nie je tak. Escherov prístup je vysoko racionálny.
Lineárna perspektíva. Ako sme už spomínali kľúčovým indikátorom vnímania hĺbky
je lineárna perspektíva. Ako poznamenáva Gregory (2004), trvalo veľmi dlho, kým sa
človek prepracoval k objavu lineárnej perspektívy. Tento autor radí objav perspektívy
medzi také prevratné objavy v dejinách civilizácie, akými boli objavy ohňa alebo kolesa.
Ako je známe, k objaveniu perspektívy došlo až v renesančnom období. Staré egyptské
umenie, antika, stredovek nepoznajú perspektívu.23
Napríklad umelecký kánon
stredovekej maľby predpisoval zobrazovať veľkosť postáv podľa dôležitosti. Položme si
hypotetickú Gregoryho otázku: Čo by sa stalo, keby perspektíva bola objavená neskôr
než fotografia? Odpoveď je jednoduchá: fotografia by sa určite nepovažovala za verný
obraz skutočnosti.
3.1.3 Hlavné teoretické prístupy: zdola nahor a zhora nadol
Záver tejto časti by sme chceli venovať teóriám percepcie. Už vopred treba povedať, že
v súčasnosti neexistuje teória, ktorá by dokázala vysvetliť všetky aspekty percepčných
22
Paradoxy, s ktorými pracuje, obyčajne nie sú prvoplánové, až keď si všimneme obrázok bližšie
(a obrázok vždy vyžaduje bližšie skúmanie), vidíme, že niečo nie je v poriadku. Čím detailnejšie
ho budeme skúmať, tým hlbšie sa budeme dostávať do siete jeho kognitívnych hier. 23
To, že sa s lineárnou perspektívou začalo pracovať tak neskoro, je o to paradoxnejšie, že aj na
sietnici sú objekty zobrazené v perspektíve. Každým zdvojením vzdialenosti objektu od oka, je
zobrazenie veľkosti objektu na sietnici o polovicu menšie (takzvaný Emmertov zákon).
44
procesov. Ako uvidíme ďalej, každá z týchto teórií vysvetľuje niektoré aspekty a nevie
vysvetliť ďalšie.
Prístup zdola nahor. Ide o teórie tzv. priamej percepcie. Najradikálnejším
predstaviteľom tohto prístupu bol James Gibson (1904-1979). Podľa neho všetky
informácie, ktoré potrebujeme k utváraniu percepcie sú už dané v prostredí (resp. všetko
dôležité, čo potrebujeme je už v zmyslových receptoroch). Ide o bezprostredný
a spontánny proces, zhora nadol procesy nie sú nevyhnutné (nepotrebujeme vyššie
kognitívne procesy, aby robili sprostredkovateľa medzi zmyslovou, senzorickou
skúsenosťou a percepčnými procesmi). Podľa neho druhou základnou vlastnosťou
percepčného procesu je, že percepcia a činnosť nemôžu byť oddelené (percepcia
sprevádza činnosť a činnosť generuje nové percepčné informácie).24
Medzi najznámejšie teórie tohto prístupu patrí teória šablón (template theory). Podľa
nej v dlhodobej pamäti máme určité šablóny, ktoré porovnávame s informáciami o
objektoch. Slabou stránkou tejto teórie je hľadanie “zhody” medzi šablónou a
konkrétnym objektom. Vzhľadom na pestrosť objektov, hrozí neustále nebezpečenstvo,
že zhodu nenájdeme. Ak by teória mala dobre fungovať, muselo by byť k dispozícií
veľmi veľa šablón.25
Odstrániť tieto nedostatky sa pokúša prototypová teória. Vychádza z predpokladu, že
ľudské rozpoznávanie objektov sa opiera o schopnosť neustále hľadať najpodstatnejšie
charakteristiky objektov. V pamäti nemusíme mať vopred daný presný vzor objektu, ale
je to skôr o neustálom, veľmi flexibilnom hľadaní modelu objektu (jeho podstatných
vlastností).26
Pomerne populárna je aj teória geónov. Podľa tejto teórie rozpoznávanie prebieha
prostredníctvom určitých základných trojdimenzionálnych komponentov. Pričom
neporovnávame šablóny celých objektov, ale len šablóny časti objektov. Takéto
rozpoznávanie je oveľa flexibilnejšie. Autorom tejto teórie je Irving Biederman, ktorý
rozlišuje 24 geometrických trojdimenzionálnych útvarov (valec, kváder, kužeľ, ihlan
atď.) Tieto komponenty nazval geóny. Dôležité je tiež určenie v akých priestorových
vzťahoch sa môžu vyskytovať jednotlivé komponenty (čo môže byť na čom, alebo vedľa
seba). Napríklad stolná lampa s tienidlom, to je valec a na ňom zrezaný kužeľ, hrnček s
uškom, to je valec, ktorý má na boku ohnutú guľatinovou tyčku a pod. Vlastnosti
jednotlivých geónov (t.j. uhly, vrcholy, strany, zakrivenia) sú invariantné. Pomocou
geónov sa relatívne dobre vysvetľuje rozpoznávanie objektov vyrobených človekom, ale
problematickejšie je to s prírodnými objektmi ako sú rastliny alebo živočíchy.
Prístup zhora nadol. Stúpenci tohto prístupu vychádzajú z predpokladu, že percepcia
má do značnej miery konštruktívny charakter. Medzi významných stúpencov tohto
prístupu patrí Jerome Brunner. Podľa neho na percepcii participuje: 1. To, čo pociťujeme
(senzorické dáta); 2. to, čo vieme (máme uložené v pamäti); 3. to, čo vyvodzujeme z
toho, čo vieme; 4. naše očakávania. Teda vnímateľ vytvára kognitívne pochopenie
24
Prepojenie percepcie a činnosti je dnes jednou z najvýznamnejších oblastí výskumu
v kognitívnej vede. J. Gibsona môžeme považovať za dôležitého anticipátora tohto výskumu. 25
To by zahltilo pamäťový systém. 26
Prototypová teória sa často pletie s teóriou šablón. Prototypy však nie sú šablóny!
45
(percepciu) stimulu na základe senzorickej informácie, ale tiež používa aj iné zdroje
informácií na konštruovanie percepcie. Hypotézu, že naša minulá skúsenosť a naše
očakávania ovplyvňujú našu percepciu potvrdil známy Postmanov experiment. Tento
autor ukazoval v určitom krátkom čase pokusným osobám karty, ktoré následne mali
identifikovať. Najprv ukazoval normálne karty, pokusné osoby s tým nemali žiadny
problém. Neskôr im ukazoval karty anomálie (napríklad jedna časť karty bola piková,
druhá srdcová), pokusné osoby si nevšimli zmenu a určovali takúto kartu ako
jednoznačne pikovú alebo srdcovú. Až, keď sa podstatne zvýšil čas expozície, prišli
niektorí na to, že ide o kartu anomáliu.
Na záver tejto časti by sme chceli uviesť niekoľko poznámok. (1) Už i z uvedených
príkladov konštrukcií optických ilúzií je zrejmé, že pokusy o ich klasifikáciu (teda
pokusy o prekonanie len čisto opisného katalógového prístupu) môžu byť veľmi užitočné
a podnetné. Vedú k hľadaniu a testovaniu efektívnych nástrojov (kritérií) pre skúmanie
tak rozsiahlej oblasti akou je vizuálna percepcia. Sú hľadaním základných charakteristík,
ktoré sú spojené s optickými ilúziami. Tieto charakteristiky sú vlastne charakteristikami
celého percepčného systému. Môžu tiež viesť k lepšiemu objasneniu toho, čo je
výsledkom nižších a čo vyšších kognitívnych procesov. (2) Primárne vysvetlenie
vizuálnych paradoxov treba hľadať v tom, že percepčný systém „neskenuje“
a nespracováva všetky informácie zo zorného poľa. Prakticky to ani nie je možné, pretože
systém by sa veľmi rýchlo „zahltil“ (veľmi rýchlo by sa vyčerpala jeho kapacita).
Percepčný systém spracováva informácie len výberovo a táto skutočnosť ho potom „núti“
používať určité heuristiky odhadovania. Uplatnenie týchto heuristík vedie k vzniku
najrôznejších vizuálnych paradoxov. Našťastie tieto heuristiky (resp. indikátory) majú
pomerne stabilnú štruktúru a preto sú predmetom rozsiahleho výskumu. V každom
prípade, heuristiky odhadovania (a v tom zmysle aj vizuálne paradoxy) svedčia nie
o nedostatkoch, ale skôr o prednostiach a inteligencii percepčného systému. (3) Možno
ste si všimli, že na začiatku výkladu vizuálnej percepcie sme neuviedli žiadnu definíciu.
Zámerne sme si to nechali až na koniec: percepcia je proces rozpoznávania, organizácie a
interpretovania informácií. Ide o v súčasnosti všeobecne prijímanú definíciu. Naším
cieľom bolo však ukázať, že je to naozaj tak.
3.2 Modely a metódy skúmania pamäti
Ďalším významným aspektom kognície (resp. kognitívnou funkciou) je pamäť. Zdá sa
nám, že najefektívnejším spôsobom, ako sa zorientovať v tejto rozsiahlej oblasti, je
pokúsiť sa porovnať dva, v ostatných desaťročiach dominantné, modely pamäti:
Atkinsonov-Shiffrinov trojzložkový model a Baddeleyho model pracovnej pamäti. Pre
obidva modely je charakteristické, že významne ovplyvnili teoretický a experimentálny
výskum v tejto oblasti.27
Najprv sa zameriame na prínos a najvýznamnejšie výsledky
27
Jedna z príčin úspechu týchto modelov určite spočíva v ich prekvapujúcej jednoduchosti.
46
klasického modelu, potom sa pozrieme na nedostatky tohto modelu a čo ponúka na ich
prekonávanie Baddeleyho model pracovnej pamäti.28
3.2.1 Klasický trojzložkový model pamäti
Podstatou klasického Atkinsonovho-Shiffrinovho modelu pamäti (1968, 1971) je
predstava, že informácie prúdia zo senzorických registrov cez krátkodobú pamäť do
dlhodobej pamäti. Tento model viedol k vytvoreniu mnohých experimentálnych metód
(často veľmi sofistikovaných), pomocou ktorých dokážeme merať trvanie a kapacitu
jednotlivých zložiek pamäti. V tomto smere sa dosiahli pozoruhodné výsledky. Pri
niektorých sa krátko zastavíme.
Meranie senzorickej a krátkodobej pamäti. Senzorická pamäť je niečo ako zásobník
v počítači, ktorého kapacita je určite veľmi veľká. Avšak, na čo sa nezameria pozornosť,
to sa rozpadne do jednej sekundy, pokiaľ ide o vizuálnu informáciu, a do dvoch sekúnd
pokiaľ ide zvukovú informáciu. Z tohto hľadiska by sme ju mohli nazvať aj
ultrakrátkodobou pamäťou. Prvý významný pokus na jej zmeranie urobil ešte
začiatkom šesťdesiatych rokoch Sperling (1960). Jeho test však meria len istý špeciálny
druh vizuálnej senzorickej pamäti. Zameriava sa na reprodukciu ikôn (písmen alebo
číslic), preto sa aj volá test ikonickej pamäti. Sperling premietol pokusným osobám na 50
milisekúnd rad ikôn a zisťoval koľko z nich si dokážu zapamätať. Pokusné osoby si
v priemere dokázali zapamätať štyri symboly. S týmto výsledkom však Sperling nebol
spokojný, zdalo sa mu to veľmi málo. Preto vymyslel iný experimentálny postup, tzv.
parciálny report, pomocou ktorého bolo možné presnejšie zmerať ikonickú pamäť.
Pokusným osobám exponoval 12 ikon v troch riadkoch, ale reprodukovať mali len jeden
označený riadok. Označovanie riadkov sa dialo prostredníctvom tónu, ktorý zaznel tesne
pred alebo tesne po exponovaní všetkých symbolov. Vysoký tón označoval horný riadok,
stredný označoval stredný riadok a najnižší označoval spodný riadok. (Známy je aj
variant experimentu, v ktorom sa riadok označuje pomocou šípky.) Získaný výsledok
Sperling vynásobil tromi, a tak zistil, že kapacita ikonickej pamäti môže byť až deväť
symbolov.29
Na rozdiel od senzorickej pamäti, kapacita krátkodobej pamäti je limitovanejšia. Jej
kapacita je vyjadrená tzv. Millerovým zákonom sedem plus mínus dva položiek. Čo si
ľahko môžeme overiť, keď prezentujeme pokusným osobám rad číslic (z pochopiteľných
dôvodov väčší než deväť). Počet zreprodukovaných položiek (číslic) sa bude pohybovať
medzi päť až deväť.30
Táto kapacita sa však značne zvýši, ak použijeme zhlukovanie
položiek, či už pôjde o čísla, slová, frázy alebo celé vety. Napríklad zreprodukovať
dvadsať osem číslic nie je možné, pretože to výrazne prekračuje kapacitu krátkodobej
28
V istom zmysle je tento článok aj pokusom o veľmi stručný náčrt modernej histórie skúmania
pamäti (najmä pokiaľ ide o kľúčové behaviorálne experimenty). 29
Gazzaniga, Ivry a Mangun (2002) v takom istom teste uvádzajú kapacitu ikonickej pamäti až
dvanásť položiek (symbolov). 30
K Millerovmu zákonu bolo urobených veľa aktualizácií, napríklad vo waleshčine, kde su
číslovky dlhšie, bol výsledok testu menší ako sedem plus mínus dva a naopak v mandarínskej
čínštine, kde sú číslovky kratšie, priemerný výsledok testu bol lepší.
47
pamäti, ale, ak zistíme, že ide vlastne o sedem významných historických dátumov
(napríklad 1848, 1917, 1945 atď.), tak zreprodukovať tieto číslice nebude žiadny
problém.31
Oproti senzorickej pamäti je čas uchovania informácií v krátkodobej pamäti
dlhší. Hoci v literatúre sa uvádzajú rôzne čísla, platí zhoda, že ide o sekundy až minúty.
Meranie dlhodobej pamäti. Kapacita dlhodobej pamäti je takmer neobmedzená, viac
menej vždy k nej môžeme niečo pridať. Pokiaľ ide o jej trvanie, ide o hodiny, dni,
mesiace, často sa informácia uchová až do konca života.
Ako sme už vyššie naznačili prenos informácie z krátkodobej do dlhodobej pamäti sa
realizuje predovšetkým opakovaním a tréningom. V tomto smere je veľmi efektívne
používanie mnemotechnických pomôcok (na istej úrovni ich využívame všetci). Medzi
najzákladnejšie mnemotechnické pomôcky patrí: kategorizovanie, interaktívne predstavy,
akronymy (napríklad skratky ako BA, EU, USA a pod.), akrostichy (ako napríklad „Eva
hodila granát do atómovej elektrárne“ – začiatočné hlásky v každom slove uvedenej vety
pomenúvajú struny na gitare), dôležité sú aj napovedajúce slová (tieto slová hrajú veľmi
dôležitú úlohu v procesoch vybavovania informácie z dlhodobej pamäti).32
Na rozdiel od senzorickej a krátkodobej pamäti, meranie dlhodobej pamäti
(vzhľadom na to, že sa tu skúma uchovanie informácií v priebehu dlhých časových
úsekov) je na prvý pohľad oveľa náročnejšie a komplikovanejšie. Pri riešení tohto
problému prišiel kolektív autorov (Bahrick a Wittlinger, 1975) na originálny nápad,
využiť pri meraní dlhodobej pamäti stredoškolské tablá (resp. ročenky, v ktorých sú
publikované fotografie a mená absolventov). Použili metódu voľnej reprodukcie mien,
metódu rozpoznávania fotografií svojich bývalých spolužiakov, ďalej metódu
rozpoznávania mien a test priraďovania mien k fotografiám spolužiakov. Výskumu sa
zúčastnilo 392 bývalých stredoškolákov. Výsledky sú veľmi zaujímavé. Participanti po
34 rokoch dosahovali 90% presnosť v rozpoznávaní tvárí a mien, 80% presnosť
v rozpoznávaní mien po 48 rokoch, 40% presnosť v rozpoznávaní tvárí po 48 rokoch,
60% presnosť vo voľnej reprodukcii mien po 15 rokoch a 30% presnosť vo voľnej
reprodukcii mien po 30 rokoch.33
Aj tieto, hoci len veľmi ilustratívne načrtnuté výsledky dostatočne svedčia o vplyve
a dôležitosti klasického modelu na orientáciu experimentálneho výskumu v oblasti
pamäti. No napriek tomu, že klasický trojzložkový model je v literatúre stále najčastejšie
spomínaným modelom, dnes sa považuje už za prekonaný. Jeden z najvýraznejších
kritikov tohto modelu je A. D. Baddeley. Tento autor vyšiel z kritiky chápania
krátkodobej pamäti v klasickom modeli. Podľa neho 1. krátkodobá pamäť nie je
monolitným celkom (ako to viac menej predstavuje klasický model), ale je bohato
štruktúrovaná a 2. úlohou krátkodobej pamäti nie je len držanie informácií na istý
31
Boli urobené aj výskumy, v ktorých sa zistilo, že ak predmetom testu sú zhlukovania, počet
zapamätaných položiek je menší než sedem plus mínus dva. 32
Z mnohých súčasných empirických výskumov pamäti vyplýva, že okrem opakovania je rovnako
dôležitým faktorom aj úroveň spracovania informácií, čím je hlbšie tým sú lepšie výsledky
v pamäťových testoch. 33
Výsledky experimentu ukazujú, že najmä rozpoznávanie mien a tvárí je veľmi dobré aj po
mnohých desaťročiach.
48
obmedzený čas, ale aj aktívne manipulovanie a spracovanie informácií (či už prichádzajú
zo zmyslových receptorov alebo dlhodobej pamäti).
Svoje predstavy Baddeley a Hitch (1974) vyjadrili vo vlastnom modeli pracovnej
pamäti. Pozoruhodné na tomto modeli je, že hoci sa spočiatku javil, iba ako komplement
klasického modelu, postupne sa stal jeho najvplyvnejšou alternatívou. Pozrime sa
detailnejšie na tento model.
3.2.2 Mnohozložkový model pracovnej pamäti
Informácie, ktoré sú obsiahnuté v pracovnej pamäti sú bezprostredne, veľmi rýchlo
k dispozícii. Môžeme to povedať aj tak, že všetko to, čo pociťujeme ako prítomnosť sa
odohráva na úrovni pracovnej pamäti. Podľa Baddeleyho-Hitchovho modelu pracovná
pamäť pozostáva z fonologickej slučky (phonological loop), vizuálno-priestorového
„náčrtníka“ (spatio-visual sketchpad) a centrálnej exekutívy. Ako uvidíme ďalej, tieto
hlavné časti sú štruktúrované ešte na ďalšie podčasti.
Fonologická slučka je teoretický konštrukt na vysvetlenie uchovania a spracovania
verbálnych informácií a skladá sa z dvoch častí: (1) fonologického úložiska (phonological
store) – ide o akýsi sklad verbálnej informácie (to je to, čo počujeme „vnútorným
uchom“) a (2) artikulačného opakovania (articulatory rehearsal) – ide o aktívny proces
upevňovania a udržania informácií v pracovnej pamäti (to je to, čo si opakujeme
„vnútorným hlasom“). Teda celý proces krátkodobého uchovania verbálnej informácie by
sme mohli vyjadriť takto: Najprv verbálnu informáciu počujeme vnútorným uchom,
potom ju opakujeme (artikulujeme) vnútorným hlasom a znovu počujeme vnútorným
uchom a opakujeme vnútorným hlasom, a tak až dovtedy, dokedy potrebujeme udržať
informáciu vo fonologickom sklade (preto ten názov fonologická slučka). Bez
fonologickej slučky sa akustická informácia rozpadne, vyhasne do dvoch sekúnd.
Baddeley venoval fonologickej slučke veľmi veľa pozornosti a určite patrí v jeho
modeli medzi experimentálne najdetailnejšie rozpracované časti. Na empirické potvrdenie
jej fungovania Baddley využíva mnohé dnes už klasické experimenty (niektoré vyvinul
sám spolu so svojimi spolupracovníkmi, niektoré sú modifikáciami experimentov iných
odborníkov). Medzi najznámejšie patrí testovanie tzv. efektu fonologickej podobnosti,
efektu irelevantnej reči a efektu dĺžky slova.
Pokiaľ ide o efekt fonologickej podobnosti a dôležitosť akustického spracovania
informácií v tomto smere Baddeley nadväzuje na R. Conrada (1964), ktorý vo svojich
experimentoch pokusným osobám v pamäťovom teste vizuálne prezentoval šestice
písmen, jedno písmeno za 0,75 s. Pri analýze chýb pri opakovaní šestíc s prekvapením
zistil, že najčastejšie dochádza k chybám pri písmenách, ktoré sa nie vizuálne, akoby sme
očakávali, ale zvukovo podobajú.34
R. Conrad tu objavil fungovanie akéhosi translátora
informácií prezentovaných vo vizuálnom kóde do verbálneho kódu. V každom prípade,
výsledky týchto experimentov svedčia o veľkej dôležitosti zvukového kódovania
34
Conrad pracoval so zvukovo podobnými spoluhláskami (za také považoval spoluhlásky ako sú
D B C T P G) a so zvukovo nepodobnými (ako sú napríklad K F Y L R Q).
49
v pracovnej pamäti.35
V mnohokrát opakovaných testoch sa potvrdilo, že opakovanie
zoznamu zvukovo nepodobných spoluhlások má vyššiu úspešnosť než opakovanie
zoznamu podobných spoluhlások.
Neskoršie Baddeley uplatnil túto techniku aj na podobné a nepodobné slová a prišiel
tiež k zaujímavým výsledkom. Fonologicky podobné slová (napríklad man, cat, cap, map,
can) mali pri reprodukovaní len 10%-nú úspešnosť, nepodobné slova (napríklad pit, day,
cow, pen, sup) boli reprodukované až s 80%-nou úspešnosťou. Ale je zaujímavé, že
v porovnaní s tým, úspešnosť reprodukovania sématicky podobných slov (napríklad
large, great, huge, long, big) bola 65% a sémanticky nepodobných slov (napríklad old,
wet, strong, thin, deep) 75%, teda nešlo o nejaký dramatický rozdiel (Baddeley 1986, s.
76).
Na testovanie (resp. pre empirickú evidenciu) fonologickej slučky sa často používajú
rôzne techniky, pomocou ktorých dokážeme jej fungovanie narušiť a potlačiť (ide o tzv.
articulate suppression). Mnohé z týchto potlačovacích techník sú spojené s využitím
efektu irelevantnej reči. V tomto smere jeden z najznámejších postupov je, že pri
prezentovaní (v niektorých variantoch aj pri opakovaní) vizuálneho materiálu (číslic,
písmen, slov a pod.), pokusná osoba musí neustále počítať napríklad do štyroch (resp.
bude opakovať nejaké iné neutrálne slová), to do značnej miery zhorší vytváranie
fonologického záznamu vizuálne prezentovaného stimulu a tým zhorší aj výsledky v
danom pamäťovom teste. Najjednoduchšou verziou testovania efektu irelevantnej reči je,
keď pokusná osoba pri prezentácii položiek počuje v pozadí nejakú reč. Aj v tomto
prípade je fungovanie fonologickej slučky zaťažené konkurenčnou verbálnou
prezentáciou (hovorenou rečou v pozadí), čím sa významne zníži výkon v pamäťovom
teste (dokonca bez ohľadu na to, či danej reči v pozadí rozumieme alebo nie).
Medzi faktory, ktoré potvrdzujú fonologickú slučku patrí aj efekt dĺžky slov.
Fonologická slučka má obmedzenú kapacitu, a preto je samozrejme, že kapacita krátkych
slov v pracovnej pamäti je väčšia než kapacita dlhých slov. Dôležitú úlohu tu však hrá
nielen počet slabík (resp. foném), ale či ide o slabiky krátke alebo dlhé, jednoducho
koľko času zaberie výslovnosť (artikulácia) daného slova.36
Položky, ktorých artikulácia
bude trvať dlhšie budú sa ťažšie reprodukovať v pamäťovom teste.37
Dlhé slová sa dlhšie
vyslovujú a viac zaťažujú artikulačné opakovanie. To znamená, že je aj väčšia
pravdepodobnosť, že sa nedostanú alebo vypadnú z fonologického slovníka.38
Na záver tejto časti by sme ešte chceli poznamenať, že z evolučno-psychologického
hľadiska fonologická slučka iste nevznikla preto, aby sme si vedeli zapamätať PIN kód.
Určite však súvisí s chápaním a tvorbou reči a je nepostrádateľná pri učení sa jazyka (či
35
Nakoniec pripomeňte si ako si spomínate na PIN kód, keď idete platiť kartou v supermarkete,
vidíte ho na mentálnej obrazovke, alebo si ho poviete vnútorným hlasom? 36
Dokonca platí, že subjekty, ktoré dokážu rýchlejšie opakovať položky majú väčšiu kapacitu
pracovnej pamäti. 37
Dlhé dvojslabičné slová harpoon a woodoo viac zaťažia kapacitu fonologickej slučky, než
krátke dvojslabičné slová bishop alebo power. 38
V experimentoch súvisiacich s efektom dĺžky slov sa obyčajne testovanie dlhých a krátkych slov
kombinuje aj s testovaním iných efektov vzťahujúcich sa k fonologickej slučke a potom položky
tu môžu byť číslice, podobné a nepodobné spoluhlásky, krátke a dlhé slová a pod.
50
už materinského alebo pri učení sa cudzieho jazyka). Dokonca môžeme povedať, že
fonologická slučka je zariadenie pre učenie sa jazyka (learning language device).39
Vizuálno-priestorový náčrtník (visuospatial sketchpad).
O fungovaní tejto časti
pracovnej pamäti sa môžeme ľahko presvedčiť napríklad pri hľadaní odpovede na takú
úsmevnú otázku či má zajac fúzy? Pravdepodobne odpoveď nájdete tak, že si premietnete
zajaca na „mentálnej“ obrazovke, alebo v Baddeleyho terminológii vo vizuálno-
priestorovom náčrtníku.
Vizuálno-priestorový náčrtník má dve základné funkcie: (1) spracováva informácie
o lokalizácií objektov v priestore; (2) spracováva informácie o objektoch (resp. o ich
vizuálnych znakoch) (Baddeley 2003). Existuje množstvo rôznych behaviorálnych
a klinických potvrdení pre vyčlenenie uvedených komponentov. Tu treba poznamenať, že
vizuálnu pamäť možno skúmať len v tesnom prepojení s vizuálnou pozornosťou
a vizuálnou percepciou. Tieto oblasti sú relatívne dobre preskúmané a mnohé
experimenty v tejto oblasti poskytujú zaujímavé informácie aj o pamäťovom systéme.40
Jednotlivé funkcie ukladania a spracovania čisto vizuálnych informácií môžeme
merať príslušnými testami. Schopnosť vizuálnej priestorovej pamäti (spatial span)
meriame tzv. Corsiho testom (Corsi block tapping test). Experimentátor postupne
umiestňuje kocky na stole a úlohou pokusnej osoby je potom imitovať tento postup.
Experiment začína s malým počtom kociek a končí, keď už pokusná osoba nie je schopná
s narastajúcim počtom kociek imitovať experimentátora (celkový počet kociek je 9).
Typický výsledok je okolo 5 kociek.41
Je to o dve položky menej než je pri reprodukovaní
číslic (digit span) v pamäťovom teste (Baddeley, 2007).42
Vizuálne vnímame objekty ako určité štruktúry znakov. Špeciálnym testom vieme
odmerať schopnosť (kapacitu) ukladania a spracovania vizuálnych znakov objektu (tzv.
pattern span). V tomto teste sa používa biela šachovnica, na ktorej experimentátor
vyčierni niektoré polia (vyplnených je vždy 50%), vyplnené políčka potom vymaže
a úlohou pokusnej osoby je znovu zopakovať, ktoré políčka boli vyplnené. Test sa začína
so šachovnicou so štyrmi poličkami, postupne sa šachovnica zväčšuje až pokiaľ pokusná
osoba už nedokáže zopakovať vzor vyplnených políčok. Typický výsledok je okolo 16
políčiek.
Základný rozdiel medzi týmito dvoma funkciami vizuálno-priestorového náčrtníka je,
že v jednom prípade je dôraz na kde a v druhom prípade na čo je zapamätané (Baddeley,
2007). 43
Centrálna exekutíva. Podľa Baddeleyho ide o najdôležitejšiu časť pracovnej pamäti,
hoci stále najmenej pochopenú. Vyčlenenie tejto časti pracovnej pamäti je jedna
z hlavných odlišností od klasického modelu. Tento model pamäti počíta s aktívnym
39
Kapacita fonologickej slučky je dobrým prediktorom úspešnosti učenia sa druhého jazyka. 40
Baddeley sa dokáže pozrieť na ne z hľadiska ich využiteľnosti pri skúmaní pracovnej pamäti. 41
Samozrejme, že v súčasnosti sa používajú počítačové verzie týchto testov. 42
Tu by sme chceli uviesť, že v Corsiho teste metóda potlačenia artikulácie nemá žiaden vplyv na
výkon, pri meraní počtu zapamätaných číslic však výsledky výrazne zhoršuje. Aj to svedčí
o tom, že delenie pracovnej pamäti na verbálnu a vizuálnu má svoje opodstatnenie. 43
Ľudia s lepšou schopnosťou držať a manipulovať vizuálno-priestorové reprezentácie majú dobré
predpoklady pre pôsobenie v takých oblastiach ako je architektúra a inžinierske disciplíny.
51
spracovaním informácií už na úrovni krátkodobej pamäti. Nejde len o pasívne ukladanie
informácie ako je to v klasickom modeli. Centrálna exekutíva je to, čo (1) usudzuje,
chápe, zhlukuje, transformuje informácie; (2) určuje, ktoré informácie budú uložené do
zásobníkov; (3) určuje či je vybraný fonologický alebo vizuálny zásobník; (4) integruje a
koordinuje informácie z obidvoch zásobníkov.
Centrálna exekutíva je spojená s prácou pozornostného systému a jeho fungovanie
významne ovplyvňuje rozhodovanie o tom, ktoré informácie a ako sa budú ďalej
spracovávať. O dôležitosti centrálnej exekutívy hovorí aj skutočnosť, že oslabenie
funkcie centrálnej exekutívy (resp. oslabenie niektorých funkcií pozornosti, napríklad
delenia pozornosti) je jeden z príznakov Alzheimerovej choroby (Baddeley, 2007).
Epizodický zásobník (buffer). Postupne sa ukázalo, že len vizuálnym a fonologickým
zásobníkom je ťažko vysvetliť zaznamenávanie a spracovanie komplexnejších informácií.
Vzhľadom na to Baddeley zaviedol ešte jeden špeciálny zásobník, v ktorom sa spájajú
(skladajú) informácie z pomocných podsystémov pracovnej pamäti (vizuálne informácie
a fonologické informácie) s informáciami z dlhodobej pamäti do jednotnej epizodickej
reprezentácie (Baddeley, 2000).
3.2.3 Neurálne koreláty pracovnej pamäti
Pri hľadaní, ktoré štruktúry mozgu majú priamu súvislosť s pamäťou, historicky
významnú úlohu zohral prípad H. M. Išlo o ťažkého epileptika, záchvaty sa mu objavili
po úraze v detstve, s pribúdajúcimi rokmi frekvencia záchvatov neustále stúpala, preto sa
pacient rozhodol pre operáciu a odstránenie epicentra záchvatov. Operácia sa uskutočnila,
keď mal 27 rokov. Odstránili mu hipokampus, amygdalu a ďalšie časti mediálnych
spánkových lalokov. Operačný zákrok splnil svoj cieľ. Epileptické záchvaty sa podarilo
dostať pod kontrolu, ale bolo jasné, že zákrok priniesol aj nepríjemné a neočakávané
výsledky. Pacient vykazoval znaky silného poškodenia pamäti. Po zákroku stratil
schopnosť zapamätať si nové fakty a epizódy (deklaratívna pamäť), bol akoby zmrazený
v čase. To sú všetko symptómy ťažkej anterográdnej amnézie.44
Avšak zdá sa, že krátkodobá pracovná pamäť chirurgickým zásahom v spánkových
lalokoch neutrpela vôbec. Pacient H. M. vie zopakovať zoznam slov v pamäťovom teste,
pretože neurálne koreláty pracovnej pamäti sú umiestnené v iných častiach mozgu,
dominantne v čelových lalokoch a tie ostali neporušené.
Dnes už nie sme odkázaní len na skúmanie dôsledkov chirurgických zásahov do
štruktúr mozgu (na skúmanie patológie mozgu), v súčasnosti máme k dispozícií veľmi
efektívne zobrazovacie metódy skúmania aktívneho zdravého mozgu. Máme na mysli
predovšetkým pozitrónovo emisnú tomografiu (PET) a funkčne magnetickú rezonanciu
(fMRI). Pomocou týchto metód sú relatívne presne zmapované neurálne koreláty funkcií
pracovnej pamäti. Tieto metódy podrobnejšie približuje kapitola 2.
44
Ostal mu jazyk, včítane slovníka a predtým získanej sémantickej pamäti. Vykazoval aj určité
znaky retrográdnej amnézie. Mal ťažkosti si spomenúť na udalosti z posledných 11 rokov pred
operáciou. Avšak niektoré udalosti z detstva si pamätal veľmi detailne. Tiež nerobilo mu
problémy učiť sa novým zručnostiam, zvykom, jednoduchému podmieňovaniu a ďalším formám
implicitného nedeklaratívneho učenia (Smith a Kosslyn, 2007).
52
Keďže pracovná pamäť je bohato štruktúrovaná a má rôzne funkcie, jej neurálne
koreláty nachádzame v rôznych častiach mozgu. Fonologická slučka súvisí predovšetkým
s bilaterálnou aktiváciou čelových a temenných lalokov. Pokiaľ ide o vizuálno-
priestorový náčrtník, ak je dĺžka držania mentálnych obrazov veľmi krátka, aktivujú sa
oblasti záhlavných lalokov a pravej časti čelového laloka. Dlhšie časové intervaly
aktivujú záhlavné a ľavú časť čelového laloka. Funkcie centrálnej exekutívy súvisia
zväčša s čelovými lalokmi. Funkcie epizodického zásobníka súvisia najmä s čelovými
lalokmi a niektorými časťami spánkových lalokov (Smith a Kosslyn, 2007).
3.3 Na záver
Hoci od prvého publikovania Baddeleyho-Hitchovho modelu pracovnej pamäti prešlo
niekoľko desaťročí, model je stále inšpiratívny z teoretického i experimentálneho
hľadiska. Ide o model potvrdený množstvom empirického experimentálneho materiálu.
Na začiatku Baddeleyho záujmu o pracovnú pamäť sa mohlo zdať (a možno to aj tak
skutočne bolo), že mu ide len o čiastkový problém – krátkodobú pracovnú pamäť
(jednoducho parciálne vylepšenie klasického modelu). Postupne sa však ukázalo, že v hre
je oveľa viac. Baddeley rozvíjaním svojho kľúčového teoretického konštruktu pracovnej
pamäti, vybudoval alternatívny model pamäti. Diametrálny rozdiel medzi klasickým
modelom a jeho modelom je v tom, že pamäťový systém nechápe iba ako pasívne
ukladanie informácií do senzorického, krátkodobého a dlhodobého zásobníka.
Baddeleyho model nie je len o toku informácií a ich pasívnom ukladaní, ale je skôr o
šírení aktivácie (aj aktívna časť dlhodobej pamäti je pracovná pamäť). V tom zmysle je
pre jeho model lepšie grafické vyjadrenie nie v blokoch, ale v sústredných kruhoch (v
prostriedku je senzorická pamäť, nad ňou je kruh krátkodobej a dlhodobej pamäti),
pričom aktivované môžu byť informácie aj zo všetkých kruhov naraz. V tom zmysle je
krátkodobá pamäť len malou časťou pracovnej pamäti. Zdá sa, že Baddeleyho model viac
zodpovedá reálnym pamäťovým procesom než klasický trojzložkový Atkinsonov-
Shiffrinov model.
Literatúra
Atkinson, R. C., Shiffrin, R. M. (1968): Human Memory: A proposed system and his
control processes. In: K. W. Spence, J. T. Spence (eds): The Psychology of Learning
and Motivation. Vol. 2 Advances in Research and Theory. New York: Academic
Press.
Atkinson, R. C., Shiffrin, R. M. (1971): The control of short-term memory. Scientific
American, 225, 82-95.
Baddeley, A. D., Hitch, G. J. (1974): Working memory. In: G. Bower (ed.): Advances in
learning and motivation, 8, 47-90, New York: Academic Press.
Baddeley, A. D. (2002): The concept of episodic memory. In: Baddeley, A. D., Aggleton,
J. P., Conway (ed.), Episodic memory: New directions in Research. Oxford: Oxford
University Press.
53
Baddeley, A. D. (2000): The episodic buffer: a new component of working memory?
Trends in Cognitive Sciences, 4(11), 417-423.
Baddeley, A. D. (2003): Working memory: looking back and looking forward. Nature
Reviews Neuroscience, 4(10), 829-839.
Baddeley, A. D. (1986): Working memory. Oxford: Oxford University Press.
Baddeley, A. D. (2007): Working Memory, Thought, and Action. Oxford: Oxford
University Press.
Bahrick, H. P., Bahrick, P.O., & Wittlinger, R. P. (1975). Fifty years of memory for
names and faces: A cross-sectional approach. Journal of Experimental Psychology,
104(1), 54-75.
Block, J. R. (2002). Seeing Double. London: Routledge.
Block, J.R., Yuker H. E. (1989): Can You Believe Your Eyes? London: Brunner-
Routledge.
Conrad, R. (1964): Acoustic confusion in immediate memory. British Journal of
Psychology, 55, 75-84.
Francis, G., Neath, I., MacKewn, A., Goldthwaite, D. (2004): CogLab on CD. London:
Thomson Learning.
Gazzaniga, M. S., Ivry, R. B., Mangun, G. R. (2002): Cognitive neuroscience. The
biology of the mind. New York: W. W. Norton & Company.
Gigerenzer, G. (2005): I think, therefore I err. Social Research, 72 (1), 195-218.
Gopnik, A., Meltzoff, A. M., Kuhl P. K. (2001): The Scientist in the Cribe. New York:
William Morrow.
Gregory, R. L. (2004): Eye and Brain. The Psychology of Seeing (5. vyd.), Oxford
University Press.
Kremláček, J. (2006): Co prozradily optické iluze o našem zrakovém vnímání. In: Sborník
konferenčních příspěvku. Psychologický ústav, Akademie věd ČR.
Locker, J. L. (Ed.) (2000): The Magic of Escher. New York: Harry N. Abrams.
Locker, J. L. (Ed.) (1992): M. C. Escher. His Life and Complete Graphic Work. New
York: Harry N. Abrams.
Ninio, J. (2001): The Science of Illusions. Cornell University Press.
Penrose, L. S., Penrose, R. (1958): Impossible Objects: A special type of visual illusion.
Brit. J. Psychology 49, 31-33.
Seckel, A. (2006): Optical illusions. The Science of Visual Perception. New York: Firefly
Books.
Shepard, R. (1990): Mindslights. Original Visual Illusions, Ambiguities, and Other
Anomalies with aCcommentary on the Play of Mind in Perception and Art. New
York: W. H. Freeman and company.
Smith, E. E., Kosslyn, S. M. (2007): Cognitive Psychology: Mind and Brain. New Jersey:
Pearson Education.
Sperling, G. (1960): The information available in brief visual representations.
Psychological Monographs: General and Applied, 74, 1-28.
Šikl, R., Šimeček, M. (2010): Jak a proč vznikaji zrakové klamy? V knihe Kvasnička, V.
a spol. (zost.), Umelá inteligencia a kognitívna veda II. Bratislava: STU, 467-522.
54
Kapitola 4
Reprezentácia významov v živých a umelých
systémoch
MARTIN TAKÁČ
4.1 Úvod
Schopnosť rozumieť – pripisovať význam – je kľúčovým aspektom kognície. V tejto
kapitole sa zameriame na teóriu významov a možné formy reprezentácie znalostí
a významov v živočíšnej ríši, u ľudí, ale aj v umelých systémoch.45
Významy sa obvykle
spájajú s jazykom. Porozumením jazyku sa myslí priradenie významov jednotlivým
prvkom jazyka – slovám, frázam či vetám. V tomto zmysle sa ich štúdiom zaoberá
lingvistika (jazykoveda). V rámci lingvistiky rozlišujeme syntax – náuku o pravidlách
skladania jednoduchých prvkov jazyka do komplexnejších štruktúr a o ich vzájomných
vzťahoch, sémantiku - náuku o význame jednotlivých prvkov a pragmatiku, ktorá študuje
ako sa jazyk prakticky používa a ako je interpretovaný v konkrétnych okolnostiach.
Okrem lingvistiky sa s teóriami významu môžeme stretnúť ešte v semiotike, ktorá
rozširuje poňatie pripisovania významu akémukoľvek systému znakov, nie iba jazyku
(zloženého zo slov a viet). Klasifikácii typov sémantických teórií bude venovaná časť
4.2.1. V časti 4.2.2 sa budeme podrobnejšie venovať tzv. kognitívnym sémantikám
a v časti 4.2.3 semiotickému prístupu k významu. Centrálnou tézou tejto kapitoly je, že
významy môžu existovať nezávisle od jazyka a že okrem porozumenia jazyku existuje
porozumenie situácii, udalosti. Takéto rozšírené poňatie nám umožní analyzovať
významy aj u živočíchov, ktoré nedisponujú jazykom (časť 4.3). V časti 4.4 uvedieme
prehľad niektorých teórií významu u ľudí a v časti 4.5 sa budeme venovať problematike
reprezentácie významu v umelých systémoch. Na záver zhrnieme najdôležitejšie tézy
načrtnutého prístupu k významom a pokúsime sa odpovedať na niektoré výhrady voči
nemu.
4.2 Teória významu
4.2.1 Klasifikácia typov sémantík
Základné delenie sémantických teórií vznikne podľa toho, čo považujú za význam,
konkrétne či existujú nejaké entity – materiálne, mentálne, ideálne atď., ktoré tvoria
významy jazykových výrazov. Sémantické teórie, ktoré na túto otázku odpovedajú
kladne, sú denotačné; tie, čo odpovedajú záporne, nazveme nedenotačné. Príkladom
nedenotačného prístupu je funkcionalistická sémantika, ktorej základy položil
45
V tejto kapitole sú použité fragmenty textov Takáč (2006, 2009).
55
Wittgenstein. Podľa (neskorého) Wittgensteina (1953), významom slov nie je referencia
na objekty alebo veci označené vo vonkajšom svete, ani žiadne idey či mentálne
reprezentácie s nimi asociované, ale spôsob ich používania v komunikácii. Jazyková
výpoveď je v prvom rade aktom v reálnom svete, význam je preto viac vecou pragmatiky
ako sémantiky. Wittgenstein prirovnáva použitie jazykového výrazu k ťahu v hre podľa
nejakých pravidiel.
V denotačných sémantikách sú jazykovými významami nejaké objekty. Podľa
názoru na povahu týchto objektov môžeme rozlíšiť realistické a kognitivistické (alebo
konceptualistické) prístupy. Podľa realistického prístupu sú významami entity „vo
vonkajšom svete“ (porovnaj obr. 2a). Podľa kognitivistického prístupu sú významy
mentálne entity „v hlave“ (obr. 2b).
V extenzionálnych realistických sémantikách, napríklad Tarski (1933), sa význam
definuje vzťahom k objektom vo svete, alebo formálnejšie k modelovej štruktúre M.
Prvky jazyka sa zobrazia na konkrétne objekty – prvky M, predikáty sa zobrazia na
množiny objektov resp. relácie v M. Pomocou kompozície sa vety zobrazia na
pravdivostné hodnoty. Pokusom o nápravu niektorých nedostatkov extenzionálnej
sémantiky bol návrh tzv. intenzionálnej sémantiky (Carnap, 1947/1956; Kripke, 1959;
Montague, 1974), v ktorej sa prvky jazyka zobrazujú na zobrazenia z možných svetov na
množiny objektov a relácií.
4.2.2 Kognitívna sémantika
V oboch sémantikách – extenzionálnej aj intenzionálnej sa významy pokladajú za niečo
objektívne existujúce nezávisle od pochopenia jednotlivých používateľov. Tento prístup
môžeme označiť ako objektivistický a je blízky paradigme klasického kognitivizmu resp.
funkcionalizmu v kognitívnej vede (Putnam, 1967; Pfeifer a Scheier, 1999, kap. 2; pozri
aj kap. 1 tohto zborníka).
Objektivizmus je paradigma charakterizovaná nasledujúcimi názormi: Myslenie je
nezávislé od tela, spočíva v mechanickej manipulácii s abstraktnými symbolmi a funguje
v zásade podobne ako počítačové algoritmy. Symboly (napríklad slová a mentálne
reprezentácie) získavajú svoj význam prostredníctvom korešpondencie so skutočným
svetom, sú objektívne konštruované a teda nezávisia od porozumenia a špecifických
vlastností určitého organizmu – nemajú naň vplyv obmedzenia ľudského tela, vnímania a
nervového systému. Adekvátnym nástrojom modelovania myslenia sú matematicko-
logické systémy definované všeobecnými pravidlami manipulácie so symbolmi spolu s
mechanizmami interpretácie symbolov zobrazeniami do „skutočného sveta“. Kritikom
objektivizmu je George Lakoff, ktorý položil základy nového tzv. experienciálneho
prístupu a kognitívnej sémantiky. Vo svojej knihe Lakoff (1987) argumentuje najmä
výskumami kategorizácie, ktorých výsledky sú v rozpore s dvetisíc rokov starým
Aristotelovským pohľadom na kategórie používaným v objektivizme.
Podľa tohto pohľadu sú kategórie definované súborom vlastností spoločných pre
všetkých jej členov, sú teda objektívne dané, existujúce vo svete nezávisle od vlastností
pozorovateľa, ktorý kategorizáciu vykonáva (ten sa môže akurát mýliť, ak je jeho
pochopenie v nesúlade so „správnou“, objektívne danou kategorizáciou). Sú doslovným
odrazom skutočnosti, bez vplyvu imaginatívnych mechanizmov, ako metafora,
56
metonýmia, obrazotvornosť. Klasická teória kategórií nevznikla na základe empirických
štúdií, ale ako apriórna filozofická špekulácia, ktorá sa v priebehu storočí stala súčasťou
západného myslenia a ponímania vedy, takže sa ani nepovažuje za teóriu, ale za
nespochybniteľný fakt. Lakoff proti nej argumentuje v prvom rade empiricky: ak sú
kategórie definované spoločnými vlastnosťami všetkých členov, nemali by existovať
členy, ktoré sú lepšími, reprezentatívnejšími príkladmi kategórie ako iné členy, čo je v
spore s výsledkami rozsiahlych empirických výskumov Eleanor Roschovej (1978),
autorky teórie prototypov, Brenta Berlina a Paula Kaya (1969), ktorí skúmali
medzikultúrne rozdiely vo vnímaní a pomenovávaní farebných kategórií, a mnohých
ďalších: Predovšetkým nie všetky členy kategórie musia mať spoločné vlastnosti, skôr sa
môžu asociačne reťaziť a vytvárať niečo ako rodinné podobnosti, ako ilustroval už
Wittgenstein na obsahu pojmu hra. Niektoré kategórie majú viac a menej centrálne členy,
teda nie všetky členy sú rovnako typickými príkladmi kategórie (napríklad vrabec je
typickejším vtákom ako pštros), iné kategórie ani nemajú pevné hranice, ale
odstupňovanú príslušnosť, napríklad vysoký muž. Uprostred taxonomickej hierarchie
kategórií (napríklad teriér – pes – zviera) existuje akási privilegovaná základná (bázová)
úroveň, ktorá sa vyznačuje celým radom psychologicky zaujímavých vlastností ako
gestaltové vnímanie, motorická interakcia, schopnosť vytvárania mentálnych obrazov,
ľahkosť učenia, zapamätávania a používania.
Väčšina našich vedomostí je organizovaná na základnej úrovni, pojmy základnej
úrovne najviac používajú dospelí pri interakcii s deťmi a deti si ich osvojujú ako prvé. Čo
je podstatné, základná úroveň závisí od vnímanej štruktúry častí a celku a od
skúsenostných motorických interakcií. Kategórie neexistujú v objektívnom svete
nezávisle od ľudí, ale sú stelesnené a okrem fyzických vlastností sveta sú spoluurčované
ľudskou biológiou, mysľou a kultúrnymi aspektmi. Napríklad to, že určité vlnové dĺžky
svetla kategorizujeme ako nejakú farbu, je čiastočne dané vlastnosťami neurofyziológie
videnia a čiastočne je záležitosťou kultúrneho úzu.
Alternatívou k objektivizmu je Lakoffov experiencializmus, podľa ktorého sú
významy ukotvené v skúsenosti fyzicky stelesnených bytostí a táto skúsenosť je bohato
štruktúrovaná ešte pred nástupom jazyka. Lakoffova kniha odštartovala celý nový
výskumný program v sémantike – kognitívnu sémantiku, ktorá nekladie významy do
vonkajšieho sveta. Gärdenfors (2000) charakterizuje kognitívnu sémantiku nasledovne:
1. Význam je konceptuálna štruktúra kognitívneho systému (nie podmienky pravdivosti
v možných svetoch).
2. Konceptuálne štruktúry sú stelesnené (význam nie je nezávislý od percepcie a
telesnej skúsenosti).
3. Sémantické elementy sa konštruujú z geometrických alebo topologických štruktúr
(nie zo symbolov skladaných na základe nejakého systému pravidiel).
4. Kognitívne modely sú predovšetkým obrazovo-schematické (nie propozičné).
Obrazové schémy sú transformované metaforickými a metonymickými operáciami.
5. Sémantika predchádza syntax a čiastočne ju determinuje (syntax nemožno opísať
úplne nezávisle od sémantiky).
57
6. V kontraste s Aristotelovským poňatím kategórií založenom na nutných a
postačujúcich podmienkach, koncepty vykazujú prototypové efekty.
Konkrétna podoba konceptuálnych štruktúr, ktoré tvoria významy bola rozpracovaná vo
viacerých teóriách. Sú to obrazové schémy a idealizované kognitívne modely (Lakoff,
1987; pozri aj časť 4.4.1), geometrické a topologické štruktúry v konceptuálnych
priestoroch (Gärdenfors, 2000; pozri aj časť 4.4.2, štruktúry silovej dynamiky (Talmy,
2000), rámce (Fillmore, 1982), a mentálne priestory (Fauconnier, 1985). Vzťah
významov k jazyku, najmä ku gramatickým štruktúram bol rozpracovaný v prácach
(Langacker, 1987, 1991; Bergen a Chang, 2003; Feldman, 2006).
Etablovanie experiencializmu a kognitívnej sémantiky malo aj závažné praktické
dôsledky pre metodológiu kognitívnej vedy, umelú inteligenciu a lingvistiku. Myslenie
nemožno redukovať na manipulovanie s abstraktnými symbolmi, a teda metafora mysle
ako algoritmu nie je presná. Kognitívna veda nemôže abstrahovať od emócií,
neurobiologických a kultúrnych faktorov, ako to navrhoval Gardner (1985). V umelej
inteligencii nastal posun od GOFAI (good old-fashioned artificial intelligence) s prevažne
propozičnými systémami k stelesneným (embodied) a v prostredí vnoreným (embedded)
subsymbolovým architektúram na báze konekcionizmu – umelých neurónových sietí (viď
kap. 1 tohto zborníka). Klasický kognitivizmus vytláča paradigma stelesnenosti
(embodiment) či ukotvenej kognície (Pecher a Zwaan, 2005; Gibbs, 2006; Barsalou,
2008).
4.2.3 Semiotický prístup k významom
Ďalší inšpiratívny prístup k významom, ktorý chceme na tomto mieste spomenúť,
pochádza zo semiotiky. Podľa semiotických teórií vytvárame význam tvorbou
a interpretáciou znakov. Znaky môžu mať podobu slov, obrázkov, zvukov, aktov, či
objektov, ale stávajú sa znakmi len ak im pripíšeme nejaký význam. „Nič nie je znakom,
pokým to nie je interpretované ako znak“ (Peirce, 1931-58). A tiež, čokoľvek môže byť
znakom, ak to niekto interpretuje ako označujúce niečo, teda odkazujúce na niečo alebo
zastupujúce niečo iné ako samo seba (Chandler, 2002). Peirce (1931-58) definuje znak
ako triádu – tri časti poprepájané reláciami:
reprezentámen je forma, ktorú znak nadobúda,
interpretant je zmysel, ktorý má znak pre nejakého interpetátora,
objekt je to, na čo znak odkazuje.
Triadické poňatie znaku sa niekedy označuje ako semiotický trojuholník (obr. 1). (Odteraz
budeme namiesto pôvodnej terminológie reprezentámen, interpretant, objekt používať
zaužívanejšie označenia signál, význam, referent.) Príkladom signálu je slovo „stolička“,
referentom je nejaká stolička (teda nie množina všetkých stoličiek na svete, ako by to
bolo v extenzionálnej sémantike, ale napríklad stolička nachádzajúca sa v momentálnom
situačnom kontexte) a významom je mentálna reprezentácia vytvorená konkrétnou
osobou, ktorá interpretuje tento znak.
58
Obrázok 1. Semiotický trojuholník. Obrázok je prebratý z Takáč (2009).
Je dôležité zdôrazniť, že znak v Peirceovom poňatí nie je absolútna alebo
ontologická vlastnosť veci, ale je to relačná situovaná interpretatívna rola, ktorú vec
nadobúda v konkrétnom kontexte. Čo je pre jedného pozorovateľa znakom, môže byť pre
iného len zbytočným alebo nevnímateľným šumom, v závislosti od pozorovateľovho
stelesnenia (embodiment), spoločnosti a interakčnej histórie. Takýto pohľad má blízko
k enaktívnemu prístupu v kognitívnej vede (Stewart, Gapenne, a Di Paolo, 2011).
Enaktívny prístup je asi najsilnejšie vyjadrený v dynamickej kognitívnej paradigme
(Gelder 1999; Tschacher a Dauwalder, 1999; Ward, 2001), ktorá nahliada na kogníciu
ako na komplexný dynamický systém (resp. viacero spriahnutých dynamických
systémov) a „zdôrazňuje časový rozmer kognície a emergenciu samoorganizovaných
vzorcov správania jedinca ako stabilných stavov v interakciách mozgu, tela a prostredia”
(Gibbs, 2006). Takáto perspektíva ide naprieč hranicami medzi mozgom, telom a svetom.
Niektoré dynamické modely celkom odmietajú reprezentácie, iné ich považujú za
dynamické entity (napríklad momentálne stavy systému, trajektórie či atraktory a ich
spádové oblasti). „Reprezentácie sú dočasné, kontextovo závislé stability uprostred
zmeny a nie statické, nemenné a na kontexte nezávislé jednotky” (Gelder 1999). Takýto
prístup teda presahuje kognitívnu sémantiku, pretože významy už nie sú iba „v hlave“
(obr. 2b), ale situačne vznikajú v procese signifikácie ako celá triáda (obr. 2d).
Obrázok 2. Interpretácia neúplných verzií semiotického trojuholníka „význam (V) – signál (S) –
referent (R)”. (a) Realistická sémantika umiestňuje významy do sveta. (b) V kognitívnej sémantike
sú lexikálnymi významami interné reprezentácie. Bez vzťahu k svetu by však takáto sémantika
trpela problémom ukotvenia symbolov (Harnad, 1990; pozri aj časť 4.5). (c) Predverbálne
konceptualizácie sveta môžu predchádzať jazyk. (d) V paradigme dynamických systémov vzniká
význam ako atraktor triadických interakcií. Obrázok je prebratý z Takáč (2009).
Interpretant
(Význam, Zmysel)
Objekt
(Referent)
Reprezentámen (Signál, Forma)
Znak
R
S
Jazyk
Svet
(a)
V
S
Jazyk
Konceptuálny
systém
(b)
V R
Svet Konceptuálny
systém
(c)
V R
S
Jazyk
Svet Konceptuálny
systém
(d)
59
4.3 Významy v živočíšnej ríši
V tomto texte sme viackrát pertraktovali myšlienku, že možno rozumieť, resp. pripisovať
význam, priamo situáciám a udalostiam, bez vzťahu k jazyku či komunikácii. Takéto
poňatie významu umožňuje sledovať a analyzovať významy v živočíšnej ríši aj
u organizmov, ktoré nedisponujú jazykom. Pokúsime sa o to v tejto časti.
U organizmov nedisponujúcim jazykom budeme vychádzať z ich správania.
Vhodným teoretickým konštruktom na analýzu správania je pojem reprezentácie.
Gärdenfors (1996a) charakterizuje reprezentáciu ako niečo, čo pridáva informáciu
k senzorickému vstupu získanému psychofyzickou transdukciou. Vo svojej práci
analyzuje rôzne typy reprezentácií a ich poradie nutné pre evolúciu jazyka. Rozlišuje dva
typy reprezentácie: vyvolanú (cued) a oddelenú (detached). Vyvolaná reprezentácia je
vždy spustená nejakým externým stimulom prítomným v aktuálnej situácii organizmu.
Organizmus, ktorý diferencovane reaguje na rôzne stavy svojho prostredia (napríklad
konzumuje objekty rozpoznané ako potravu a vyhýba sa objektom rozpoznaným ako
predátori) vykonáva (prinajmenšom implicitnú) kategorizáciu – hovoríme, že disponuje
vyvolanými reprezentáciami príslušných kategórií. Vyvolanie reprezentácií spočíva
v tom, že sú vždy aktivované len v prítomnosti svojich referentov. Vyvolané
reprezentácie sú deskripčno-vysvetľujúcim konštruktom pre vrodené vôľou
neovplyvniteľné diferencované behaviorálne reakcie, ktoré majú fylogenetický pôvod.
Dôležitým mechanizmom, ktorý rozširuje limitované pamäťové možnosti
organizmov, je ukladanie externalizovaných pamäťových značiek do prostredia.
Príkladom sú pachové stopy, ktoré pomáhajú zvieratám v orientácii, či u ľudí notoricky
známy uzlík na vreckovke (a napokon vynález kníh a iných záznamových médií, ktoré
výrazne akcelerovali ľudskú kultúru). Externalizovaná značka uložená do prostredia
neskôr aktivuje príslušnú vyvolanú reprezentáciu.
Oddelená reprezentácia môže zastupovať objekty či udalosti, ktoré nie sú aktuálne
prítomné ani nesúvisia so súčasnou situáciou v prostredí. Napríklad šimpanz, ktorý chce
dočiahnuť banán a odíde preto hľadať dlhý konár, musí disponovať oddelenou
reprezentáciou konára aj možnosti jeho použitia. Predpokladá sa, že oddelené
reprezentácie sa vo fylogenéze objavujú približne s vývojom neokortexu (Gärdenfors,
1996b); v ontogenéze korešpondujú s vytvorením stálosti predmetu (Piaget a Inhelder,
1966).
Disponovanie oddelenými reprezentáciami je nutnou podmienkou pre vyššie
kognitívne funkcie ako plánovanie, klamanie, sebauvedomenie a jazyková komunikácia
(Gärdenfors, 1996a). Plánovanie predpokladá schopnosť organizmu „mentálne” (t.j.
pomocou oddelených reprezentácií) vyhodnotiť dôsledky rôznych behaviorálnych
scenárov a zvoliť postupnosť akcií, ktorá najviac vyhovuje aktuálnym cieľom. Dobré
plánovanie by tiež malo zvažovať dôsledky akcií iných agentov. Predstieranie, resp.
klamanie predpokladá schopnosť reprezentovať iné agenty aj s ich vlastnými
reprezentáciami, zámermi, plánmi atď., teda akúsi „teóriu mysle“. Klamár musí taktiež
disponovať reprezentáciou toho, ako ho budú vnímať klamané agenty. Týmto vnoreným
spôsobom vlastne disponuje (meta)reprezentáciou samého seba, čo je nutným
prekurzorom sebauvedomenia (Gärdenfors, 1996a).
60
Za jednu z najvyšších kognitívnych schopností sa považuje jazyková kompetencia.
Jazyk je symbolový znakový systém, ktorý umožňuje externalizáciu a komunikáciu
oddelených reprezentácií. Práve oddelenosť reprezentácií umožňuje vyjadriť významy
prekračujúce aktuálne „tu a teraz“, dokonca aj významy, ktorých referenty v reálnom
svete neexistujú (napríklad ježibaba, či trojuholník s troma pravými uhlami). Podľa
Gärdenforsa bola najsilnejším evolučným impulzom pre vznik jazyka potreba
spoločenstva koordinovať sa pri spoločnom dosahovaní budúcich cieľov (Gärdenfors,
2004).
Z nereprezentacionalistických prístupov k významom v živočíšnej ríši spomenieme
práce estónskeho biológa Jacoba von Uexkülla (1957). Uexküll sa snažil očistiť biológiu
od mechanistických a antropocentrických pohľadov prevládajúcich v jeho dobe. Ponímal
biológiu ako epistemológiu, ktorá študuje organizmy nie ako objekty, ale ako subjekty,
ktoré svojimi zmysluplnými reakciami aktívne realizujú vlastný subjektívny svet, tzv.
Umwelt. Umwelt je (podobne ako interpretant v semiotickom trojuholníku)
determinovaný konkrétnym stelesnením, senzomotorickými možnosťami, vnútornými
stavmi, potrebami a interakčnou históriou konkrétneho organizmu. Organizmus je
spriahnutý s prostredím prostredníctvom spätnoväzobných slučiek, tzv. funkčných cyklov.
Takto vlastne organizmus neustále modifikuje a spoludeterminuje stav prostredia
a naopak, čo je veľmi blízke súčasnému ponímaniu enaktívnej paradigmy a dynamických
systémov. Štúdiom funkčných cyklov konkrétneho organizmu môžeme konceptualizovať
jeho správanie ako neustále prebiehajúci proces zmysluplnej (z pohľadu daného
organizmu) regulácie. Ako príklad Uexküll (1957) uvádza správanie kliešťa ako tri
funkčné cykly:
1. Prvý reflexný cyklus je spustený podnetom v podobe butyrickej kyseliny vylučovanej
kožou cicavcov. Tento podnet uvoľní úchop kliešťových nožičiek a spôsobí jeho
pád/spustenie.
2. Po dopade na pokožku cicavca taktilný vnem srsti naštartuje pohyb kliešťa – lezenie.
3. Vnem teploty pokožky spustí ďalšie správanie – zavŕtanie sa do pokožky a cicanie
krvi.
Z tisícov stimulov emitovaných z tela cicavca sú pre kliešťa relevantné iba tri a tak sa
celý jeho svet – Umwelt redukuje na to, čo je preň zmysluplné. Antropocentrický koncept
„cicavca“ teda pre kliešťa vôbec nemusí existovať, namiesto toho existuje reťaz časovo
ohraničených semiotických objektov.
S enaktívnym prístupom priamo súvisia aj práce Maturanu a Varelu (1987) a ich
kolegov (Varela, Thompson, a Rosch, 1991), ktorí chápali kogníciu predovšetkým ako
situovanú akciu organizmu zameranú na udržanie jeho funkčnej organizácie –
autopoiesis.
61
4.4 Významy u ľudí
4.4.1 Idealizované kognitívne modely
V tejto časti sa posunieme od významov predverbálnych živočíchov k ľudským. Ako
prvú stručne charakterizujeme teóriu Georgea Lakoffa (1987). Hlavnou Lakoffovou tézou
je, že ľudské myslenie je organizované pomocou štruktúr, ktoré nazýva idealizované
kognitívne modely (IKM), a že štruktúra kategórií, prototypy a ostatné javy sú vedľajším
produktom tohto usporiadania a sú pomocou neho vysvetliteľné. Každý pojem či slovo je
definované vzhľadom na nejaké IKM, v kontexte ktorých má význam. Napríklad význam
slova utorok je definovaný vzhľadom na IKM obsahujúce vedomosť o prirodzenom
členení na dni na základe pozorovaného pohybu slnka po oblohe a konvenčne danom
lineárnom usporiadaní dní v sedemdňových cykloch. Pojem víkend zase zahŕňa
vedomosť o podelení týchto cyklov na päť pracovných dní a dvojdňovú prestávku atď.
Model je idealizovaný, pretože toto členenie neexistuje objektívne v prírode, ale je
vytvorené ľuďmi určitej kultúry (napríklad v kalendári na Bali beží súčasne desať
rôznych cyklov pomenovaných dní, z ktorých sa výsledné pomenovanie konkrétneho dňa
vypočíta a poskladá).
Niektoré IKM majú propozičnú štruktúru, teda špecifikujú elementy, ich vlastnosti a
vzájomné vzťahy, iné majú obrazovo-schematickú povahu a ich pochopenie pramení
priamo z našej telesnej skúsenosti. Napríklad aj klasický pohľad na kategóriu, do ktorej
niečo buď patrí, alebo nie, Lakoff vysvetľuje obrazovou schémou nádoba, ktorá má jasnú
hranicu a veci sú buď v nej, alebo mimo. Pôvod tejto obrazovej schémy (ako aj väčšiny
ostatných, ako sila, rovnováha, hore/dolu, časť/celok) je spätý so skúsenosťami vlastného
tela a motorickými interakciami v ranom detstve. Idealizované modely je ďalej možné
rôznym spôsobom skladať, reťaziť, usporadúvať do radiálnych štruktúr, vytvárať ich
varianty a modifikácie, používať jeden centrálny model ako zástupcu celej kategórie
(metonýmia) či zobraziť časť modelu z jednej domény na podobnú štruktúru v inej
doméne (metaforické modely, napríklad HNEV AKO ZAHRIEVAJÚCA SA TEKUTINA
V UZAVRETEJ NÁDOBE: „vzkypieť hnevom“, „vybuchnúť“). Význam abstraktných
pojmov je daný ich systematickým vzťahom (metaforickými a metonymickými
zobrazeniami) k štruktúram základnej úrovne a kinestetickým obrazovým schémam, ktoré
chápeme priamo telesnou skúsenosťou.
4.4.2 Konceptuálne priestory
Ďalšou zaujímavou sémantickou teóriou sú konceptuálne priestory Petra Gärdenforsa
(2000). Významy sú reprezentované geometrickými štruktúrami v tzv. konceptuálnom
priestore. Konceptuálny priestor pozostáva z množstva dimenzií ako farba, výška tónu,
teplota, váha, tri priestorové dimenzie, ktoré zodpovedajú vlastnostiam reprezentovaných
objektov. Dimenzie dôležité pre naše prežitie sú pravdepodobne vrodené (vyvinuté v
priebehu evolúcie) a vbudované do nášho nervového systému. Iné dimenzie sú naučené a
niektoré z nich môžu byť kultúrne podmienené. Dimenzie sú organizované do domén (pre
reprezentované objekty môžu byť relevantné dimenzie iba z niektorých domén).
Základnou vlastnosťou konceptuálnych priestorov je to, že podobné objekty sú
62
umiestnené blízko pri sebe. Konkrétny objekt je reprezentovaný ako bod v podpriestore
zloženom z jednej alebo viacerých domén. Vektor súradníc bodu určuje hodnoty
vlastností na jednotlivých dimenziách. Podobnosť dvoch objektov je nepriamo úmerná
vzdialenosti ich bodových reprezentácií v konceptuálnom priestore. (Prirodzené)
kategórie sú reprezentované (konvexnými) oblasťami v priestore. Geometrické centrá
oblastí zodpovedajú najlepším resp. typickým reprezentantom kategórií – prototypom
v zmysle Rosch (1978). Využitie takejto reprezentácie pre objektové koncepty je
intuitívne. Rozšírenie na relačné koncepty, vlastnosti, akcie a udalosti je načrtnuté
v článku Gärdenfors (2011) a podrobne rozpracované v pripravovanej knihe (Gärdenfors,
v tlači).
4.4.3 Významy a mozog
Doteraz prezentované teórie sa nezaoberajú otázkou vzťahu významov a neurálneho
substrátu, teda ako sú významy realizované pomocou procesov či štruktúr mozgu.
Dominantnou modernou teóriou je tzv. simulačná teória (Barsalou, 1999, 2008;
Pulvermüller, 1999, Knott, 2012), ktorá hovorí, že pochopenie resp. evokovanie nejakého
významu, situácie, či udalosti je realizované znovuprehratím (reenactment)
senzomotorických procesov, ktoré nastali pri prežívaní danej udalosti. Na neurálnej
úrovni to znamená, že na reprezentácii konceptov sa zúčastňujú senzomotorické štruktúry
a procesy, ktoré sú aktívne pri nadobúdaní skúsenosti resp. interagovaní s inštanciami
daného konceptu. Napríklad koncept jablka môže byť reprezentovaný štruktúrami mozgu
zúčastnenými na zažívaní chuti, vône, tvaru a farby jazyka. Medzi skupinami neurónov,
ktoré vykazujú korelovanú aktivitu sú posilňované asociatívne väzby hebbovským
učením (Hebb, 1949), tým vznikajú skupiny neurónov (cell assemblies; Pulvermüller,
1999) ako funkčné jednotky, ktoré spoločne reprezentujú nejaký koncept. Skupiny môžu
byť lokalizované v rámci jednej oblasti mozgu, ale aj naprieč oblasťami, čím dochádza
k multimodálnej integrácii. Tieto teórie sú blízke paradigme ukotvenej kognície a majú
mohutnú empirickú podporu (Pecher a Zwaan, 2005; Barsalou, 2008).
4.5 Významy v umelých systémoch
Rozmach umelej inteligencie v druhej polovici 20. storočia priniesol aj otázky o povahe
rozumenia a významov v umelých systémoch. Od filozoficko-teoretických („Môžu stroje
myslieť?“) (Turing, 1950; Searle, 1980) až po praktické otázky reprezentácie znalostí
a implementácie procesov ich nadobúdania. Systémy s predprogramovanými znalosťami
v duchu klasickej umelej inteligencie a vtedy dominantnej paradigmy v kognitívnej vede
– kognitivizmu (viď kapitolu 1 tohto zborníka) boli kritizované za to, že akýkoľvek
význam je iba interpretáciou z pohľadu vonkajšieho (ľudského) pozorovateľa a znalosti
nemajú žiaden inherentný význam pre systém samotný, ktorý iba vykonáva manipulácie
a transformácie nezmyselných symbolov – problém ukotvenia symbolov (Harnad, 1990).
Reakcia v podobe vlny tzv. Novej umelej inteligencie (Brooks, 1991a, 1991b; Kelemen,
1994) odmietla koncept reprezentácie znalostí ako takej, tvrdiac, že svet je svojím
najlepším modelom a inteligentné správanie je výsledkom interakcie organizmu
63
s komplexným prostredím. Brooks (1991b) navrhol tzv. subsumpčnú architektúru (pozri
kapitolu 5 tohto zborníka), ktorá vrstvením jednoduchých navzájom nezávislých modulov
priamo prepájajúcich percepciu s akciou dosahuje komplexné správanie. V takomto
systéme absentujú symboly a zmysluplné správanie je zabezpečené senzomotorickými
rutinami; tieto však nie sú systému vlastné ale sú výsledkom inžinierskeho dizajnu
(Ziemke, 1999).
Určité riešenie ponúka najnovší trend v robotike, tzv. kognitívna vývinová robotika
(Cohen et al, 1996; Weng et al, 2000; Smith a Gasser, 2005; Wang et al, 2011) ktorá sa
inšpiruje spôsobom, akým nadobúda vlastnosti človek: počas miliónov senzomotorických
interakcií s prostredím a s inými ľuďmi. Inteligencia sa nerodí hotová: dieťa je vybavené
silnými učiacimi mechanizmami, ktoré mu umožňujú potrebné znalosti postupne získať
a vyladiť ich na konkrétne prostredie. Smith a Gasser (2005) identifikujú týchto šesť
dôležitých faktorov pre vývin kognície umelého systému:
1. Multimodálnosť: Skúsenosť detí so svetom je inherentne multimodálna. Vzájomne
časovo korelované vnemy generované v rôznych senzorických modalitách procesmi
vnímania a konania vo svete sú dôležitým učiacim signálom pre vyvíjajúci sa systém
– aj v neprítomnosti externého učiteľa.
2. Inkrementálnosť: Deti nie sú chytré od narodenia, ale sa vyvíjajú inkrementálne.
Počiatočná nezrelosť a obmedzenia na postupnosť jednotlivých krokov sú
nevyhnutné pre vývin komplexnej kognície.
3. Fyzickosť/stelesnenosť: Deti interagujú s fyzickým svetom, ktorý je plný
štrukturálnych pravidelností, ktoré organizujú percepciu, činnosť a nakoniec aj
myslenie. Detská inteligencia je distribuovaná naprieč ich interakciami s materiálnym
svetom, ktorý je potrebný pre vývin vyšších kognitívnych funkcií.
4. Explorácia: Deti experimentujú a skúmajú – často sa hýbu a konajú veľmi
variabilným, hravým a zdanlivo náhodným spôsobom, ktorý nepripomína cieľovo
orientovanú aktivitu. Takto objavujú nové problémy a nové riešenia. Explorácia
umožňuje inovatívnosť kognície a jej otvorený koniec.
5. Sociálnosť: Deti jednajú a učia sa v sociálnom svete, kde ich zrelší partneri
sprevádzajú procesom učenia a poskytujú štruktúry podporujúce učenie.
6. Jazyk: Deti sa učia jazyk – zdieľaný symbolický komunikačný systém, ktorý im
umožní formovanie vysokoúrovňových abstraktných znalostí.
Nespornou výhodou vývinového prístupu je, že získaná znalosť nie je vopred
naprogramovaná externými osobami, ale systém (robot, dieťa) si sám v senzomotorickom
spriahnutí s prostredím nachádza a formuje znalosti relevantné pre neho samotného, čím
sa eliminuje problém ukotvenia symbolov. Ďalej je zabezpečený otvorený koniec
takéhoto vývinu, pretože systém autonómne si osvojujúci znalosti môže prísť na riešenia,
ktoré dizajnérom vôbec nemuseli napadnúť. V súvislosti s bodom 4 spomenieme koncept
tzv. vlastnej (intrinsic) motivácie (Oudeyer a Kaplan, 2007): systém si v každom kroku
sám vyberá problémy, ktoré bude riešiť, ktoré sú pre neho zaujímavé. Motivačným
faktorom môže byť napríklad nárast vlastnej kompetencie realizovaný tak, že agent
64
priebežne monitoruje svoju schopnosť splniť vytýčené ciele a motivácia je priamo
úmerná nárastu tejto schopnosti (rozdielu medzi hodnotou kompetencie medzi dvoma
časovými okamihmi). Takto sa zabezpečí, že agent bude riešiť úlohy optimálnej
zložitosti: príliš zložitými sa nebude zaoberať (pretože ich nezvláda a tak hodnota
kompetencie nerastie) a tiež ho nebudú zaujímať príliš jednoduché úlohy (keďže ich
zvláda perfektne a kompetencia sa nemení). Postupným sebazdokonaľovaním systému sa
profil zaujímavosti jednotlivých činností mení a agent prechádza od elementárnych
činností k zložitejším bez toho, aby to musel mať predpísané z externého zdroja
(Oudeyer, Kaplan, a Hafner, 2007).
4.6 Záver
Prehľad poznatkov o teórii významov a reprezentácie znalostí uvedený v tejto kapitole
bol podávaný z určitej perspektívy. Teraz je na mieste zhrnúť kľúčové presvedčenia resp.
tézy nášho prístupu k významom (Takáč, 2009; Takáč a Šefránek, 2012):
1. Významy nie sú výlučne spojené s jazykom. V širšom ponímaní má zmysel hovoriť
o význame či porozumení situácii, udalosti, okolnostiam.
2. Disponovanie významami teda možno študovať aj u predjazykových kognitívnych
agentov ako sú zvieratá alebo malé deti. Významy tvoria kontinuum, na jednom póle
sú to primitívne protovýznamy späté s diferencovaním správaním/rozlišovaním, na
opačnom póle významy jazykových konštruktov či komplexných abstraktných
pojmov.
3. Pre kognitívny systém je dôležitá spriahnutosť významov s jeho skúsenosťami
pomocou percepčno-motorických interakcií s prostredím a s inými kognitívnymi
systémami.
4. Významy sú individuálne, situačné a závislé od telesnej skúsenosti, konštruované
v konkrétnych kontextoch jednotlivými agentmi. Čo je zmysluplné a interpretované
jedným kognitívnym systémom ako význam, môže byť pre iný kognitívny zmysel iba
nezmyselný šum. Robot, ktorý si vytvorí inherentné významy, bude disponovať
významami „robotími“, nie ľudskými.
5. Pre otvorený koniec vývinu kognície je dôležitý dynamický charakter významov, ich
neustála inkrementálna (re)konštrukcia.
Takýto prístup k významov musí čeliť niektorým dôležitým námietkam. Na tomto mieste
sa pokúsime odpovedať na nasledujúce dve:
Ak sú významy individuálne konštruované jednotlivým kognitívnymi agentmi, ako je
možné, že si navzájom rozumieme? Existuje nejaká cesta k intersubjektivite významov?
V prvom rade, identickosť interných významov nie je pre vzájomné porozumenie nutná;
postačuje koordinácia na úrovni správania. Na druhej strane, vzájomné interakcie agentov
im umožňujú adaptívne vyladenie resp. priblíženie významov. Interakcie vedúce k vzniku
spoločného dorozumievacieho systému boli pozorované napríklad medzi nikaragujskými
nepočujúcimi deťmi (Kegl, Senghas, a Coppola, 1999), ako aj počítačovo simulované
65
(Steels, 2000) v tzv. jazykových hrách. V týchto hrách simulované agenty adaptívne
menili svoju reprezentáciu významov aj asociácie významov s komunikačnými signálmi
na základe výsledkov predchádzajúcich interakcií: asociácie, ktoré v minulosti viedli k
úspešnému dorozumeniu, mali vyššiu šancu byť použité aj v budúcnosti. Takto vytvorená
pozitívna spätná väzba viedla k samoorganizácii a k vzniku zdieľaného komunikačného
systému. Vzniknuté významy jednotlivých agentov boli stále individuálne a interné,
avšak navzájom kompatibilné natoľko, že umožňovali úspešné dorozumenie. Kolektívne
resp. intersubjektívne významy možno považovať za akési ekvilibriá dynamického
systému vzájomného vylaďovania spoločenstva (Gärdenfors, 2000). Opísanú konštrukciu
významov ako výsledku dlhodobého procesu možno extrapolovať aj na každý krátkodobý
a jedinečný komunikačný akt, v ktorom si účastníci komunikácie zjednávajú význam
danej konkrétnej situačnej interakcie. Intersubjektívny význam je potom pevným bodom
tohto zjednávania – „stretnutím myslí“ (Bara, 2010; Gärdenfors, v tlači). Zároveň je
aktom signifikácie v Peirceho zmysle (viď časť 4.2.3). Niektoré nástroje eliminácie
nejednoznačností v procese zjednávania významu sme načrtli v práci (Takáč a Šefránek,
2012). V práci Gärdenforsa (2008) boli analyzované typy intersubjektivity v živočíšnej
ríši nutné pre kooperáciu a komunikáciu.
Ak sú významy stelesnené a ukotvené v senzomotorickej skúsenosti, platí to aj
o abstraktných pojmoch? Ako si kognitívny agent osvojuje abstraktné významy?
Podľa Lakoffa a Johnsona (1980) sú abstraktné pojmy prepojené so senzomotorickou
skúsenosťou pomocou metaforických zobrazení. Pod metaforou nemyslia umeleckú či
básnickú metaforu, ale vzájomné zobrazenie medzi dvoma skúsenostnými doménami na
základe štrukturálnej podobnosti, pričom pojem z domény s abstraktnejším resp.
skúsenostne vzdialenejšej je konceptualizovaný pomocou pojmov zo skúsenostne bližšej
domény, napríklad vyjadrovanie emócií pomocou fyzických vnemov či procesov:
„vybuchol od hnevu“, „vzkypela v ňom žlč“ – metafora HNEV JE UZAVRETÁ
ZOHRIEVAJÚCA SA NÁDOBA (Lakoff, 1987). Podľa tzv. konflačnej hypotézy (Johnson,
1997) majú niektoré (tzv. primárne) metafory experienciálny základ – vznikli
skúsenosťami v ranom detstve, pri ktorých doslovný a metaforický význam splývali.
Príkladom je napríklad metafora POZITÍVNY CIT JE TEPLO (zážitok tepla a lásky zároveň
v rodičovskej náruči) alebo DÔLEŽITÝ JE VEĽKÝ (najdôležitejšie objekty pre dieťa –
rodičia sú v relatívnom porovnaní s dieťaťom veľké). Dôležitým zdrojom poznatkov
o konceptuálnych metaforách konkrétneho jazykovo-kultúrneho sveta sú frázy a obrazné
vyjadrenia daného jazyka: pre český jazyk viď napríklad Vaňkovú a spol. (2005), pre
slovenský prácu Retovej (2009).
Na záver chceme zdôrazniť, že teórie významu, ktoré sme predstavili v tejto kapitole
priamo odrážajú (a v niektorých prípadoch ich priamo vyprovokovali) paradigmatické
posuny v kognitívnej vede. Preto významy považujeme za jednu z centrálnych tém
kognitívnej vedy. Súčasné trendy ponúkajú mnoho podnetov pre empirický výskum,
počítačové simulácie aj industriálne aplikácie.
66
Literatúra
Bara, B.G. (2010): Cognitive Pragmatics: The Mental Processes of Communication.
Cambridge, MA: Bradford Books.
Barsalou, L. W. (1999): Perceptual Symbol Systems. Behavioral and Brain Sciences
22(4), 577-609.
Barsalou, L.W. (2008): Grounded cognition. Annual Review of Psychology 59, 617-645.
Bergen, B. a Chang, N. (2003): Embodied construction grammar in simulation-based
language understanding. In Ostman, J. O. a Fried, M. (eds.): Construction
grammar(s): Cognitive and cross-language dimensions, 147–190, Amsterdam : Johns
Benjamins.
Berlin, B. a Kay, P. (1969): Basic Color Terms: Their Universality and Evolution.
University of California Press.
Brooks, R. A. (1991a): Intelligence without reason. In Proceedings of the Twelfth
International Joint Conference on Artificial Intelligence. San Mateo, CA: Morgan
Kaufmann, 569–595.
Brooks, R. A. (1991b): Intelligence without representation. Artificial Intelligence 47 (1–
3), 139–159.
Carnap, R. (1947/1956): Meaning and Necessity: A Study In Semantics And Modal Logic.
Chicago, IL: University of Chicago Press.
Chandler, D. (2002): Semiotics: The Basics (Second ed.). London, New York: Routledge.
Cohen, P. R., Oates, T., Atkin, M. S., a Beal, C. R. (1996): Building a Baby.
In Proceedings of the Eighteenth Annual Conference of the Cognitive Science Society,
L. Erlbaum, 518-522.
Fauconnier, G. (1985): Mental Spaces: Aspects of Meaning Construction in Natural
Language. Cambridge, MA: MIT Press.
Feldman, J. (2006): From Molecule to Metaphor: A Neural Theory of Language.
Cambridge MA: MIT Press.
Fillmore, C. J. (1982): Frame semantics. In Linguistics in the morning calm. Seoul:
Hanshin Pub. Co., 111–137.
Gärdenfors, P. (1996a): Cued and detached representations in animal cognition.
Behavioral Processes 35, 263–273.
Gärdenfors, P. (1996b): Language and the evolution of cognition. In V. Rialle, D. Fisette
(Eds.): Penser l’esprit: Des sciences de la cognition a‘ une philosophie cognitive.
Grenoble: Presses Universitaires de Grenoble, 151–172.
Gärdenfors, P. (2000): Conceptual Spaces. Cambridge, MA: MIT Press.
Gärdenfors, P. (2004): Cooperation and the evolution of symbolic communication. In K.
Oller a U. Griebel (Eds.): The evolution of communication systems. Cambridge, MA:
MIT Press, 237–256.
Gärdenfors, P. (2008): The role of intersubjectivity in animal and human
cooperation, Biological Theory 3(1), 1-12.
Gärdenfors, P. (2011): Semantics based on conceptual spaces. In M. Banerjee a A. Seth
(eds.): Proceedings of 4th Indian Conference on Logic and its Applications (LNAI
6521), Berlin: Springer, 1-11.
67
Gärdenfors, P. (v tlači): The Geometry of Meaning: Semantics Based on Conceptual
Spaces. Cambridge MA: MIT Press.
Gardner, H. (1985): The Mind's New Science: A History of the Cognitive Revolution. New
York: Basic Books.
Gelder, T. J. (1999): Dynamic approaches to cognition. In R. A. Wilson, F. C. Keil
(Eds.): The MIT encyclopedia of the cognitive sciences. Cambridge, MA: MIT Press,
244–246.
Gibbs, R. W. (2006): Embodiment and Cognitive Science. Cambridge, U. K.: Cambridge
University Press.
Harnad, S. (1990): The Symbol Grounding Problem. Physica D 42, 335–346.
Hebb, D. (1949): The Organization of Behaviour. John Wiley a Sons.
Johnson, C. (1997): Metaphor vs. conflation in the acquisition of polysemy: the case of
SEE. In: Hiraga, M. K., Sinha, C., Wilcox, S. (Eds.): Cultural, typological and
psychological issues in Cognitive Linguistics. Amsterdam: John Benjamins.
Kegl, J., Senghas, A., a Coppola, M. (1999): Creation through contact: Sign language
emergence and sign language change in Nicaragua. In M. DeGraff (Ed.): Language
creation and language change: creolization, diachrony, and development.
Cambridge, MA: MIT Press.
Kelemen, J. (1994): Strojovia a agenty. Bratislava: Archa.
Knott, A. (2012): Sensorimotor Cognition and Natural Language Syntax. Cambridge,
MA: MIT Press.
Kripke, S. A. (1959): A completeness theorem in modal logic. Journal of Symbolic Logic
24, 1–15.
Lakoff, G. a Johnson, M. (1980): Metaphors We Live by. Chicago, IL: University of
Chicago Press.
Lakoff, G. (1987): Women, Fire, and Dangerous Things: What Categories Reveal About
the Mind. Chicago, IL: University of Chicago Press.
Langacker, R. W. (1987): Foundations of Cognitive Grammar: Theoretical Prerequisites
(Vol. 1). Stanford, CA: Stanford University Press.
Langacker, R. W. (1991): Foundations of Cognitive Grammar: Descriptive Applications
(Vol. 2). Stanford, CA: Stanford University Press.
Maturana, H. R. a Varela, F. J. (1987): The Tree of Knowledge: The Biological Roots of
Human Understanding. Boston, MA: Shambhala.
Montague, R. (1974): Formal Philosophy: Selected Papers of Richard Montague (R.
Thomason, Ed.). New Haven, CT: Yale University Press.
Oudeyer, P.-Y. a Kaplan, F. (2007): What is intrinsic motivation? A typology of
computational approaches. Frontiers in Neurorobotics 1(6).
Oudeyer P.-Y., Kaplan , F. a Hafner, V. (2007): Intrinsic Motivation Systems for
Autonomous Mental Development. IEEE Transactions on Evolutionary Computation
11(2), 265-286.
Pecher, D., a Zwaan, R. A., eds. (2005): Grounding Cognition: The Role of Perception
and Action in Memory, Language, and Thinking. Cambridge, UK: Cambridge
University Press.
68
Peirce, C. S. (1931-58): Collected Writings (Hartshorne, C., Weiss, P., Burks, A. W.,
Eds.). Cambridge, MA: Harvard University Press.
Pfeifer, R., Scheier, C. (1999): Understanding Intelligence. Cambridge, MA: MIT Press.
Piaget, J., Inhelder, B. (1966): La Psychologie de l’Enfant. Paris: PUF.
Pulvermüller, F. (1999): Words in the brain’s language. Behavioral and Brain Sciences
22 (2) 253–279.
Putnam, H. (1967). The nature of mental states. Readings in the Philosophy of
Psychology, 1, 222-231.
Retová, D. (2009): Analýza konceptuálnych metafor emócií v slovenčine. In Kognice
2009. Hradec Králové: Gaudeamus, 162-172.
Rosch, E. (1978): Principles of categorization. In E. Rosch, B. Lloyd (Eds.): Cognition
and categorization. Hillsdale, NJ: Lawrence Erlbaum Associates, 27–48.
Searle, J. R. (1980): Minds, brains, and programs. Behavioural and Brain Sciences 3,
417–457.
Smith, L., Gasser, M. (2005): The Development of Embodied Cognition: Six Lessons
from Babies. Artificial Life, 11(1–2), 13–30.
Steels, L. (2000): Language as a complex adaptive system. In: V. Schoenauer, M. (ed.):
Proceedings of PPSN-VI. Springer-Verlag, Berlin.
Stewart, J., Gapenne, O., a Di Paolo, E. A. (2011): Enaction. Cambridge MA: MIT Press.
Takáč, M. (2006): Potrebujeme na myslenie telo? Knihy a spoločnosť 3(10).
Takáč, M. (2009): Konštruktivistický prístup k štúdiu kognície. In Kvasnička, V.,
Pospíchal, J., Kozák, Š., Návrat, P., Paroulek, P. (eds.), Umelá inteligencia a
kognitívna veda I, Vydavateľstvo STU, Bratislava. 395-424.
Takáč, M. a Šefránek, J. (2012): Semantics of distinguishing criteria: from subjective to
intersubjective. Interdisciplinary Description of Complex Systems 10(3). 248-269.
Talmy, L. (2000): Toward a Cognitive Semantics. Cambridge, MA: MIT Press.
Tarski, A. (1933): Pojecie prawdy w jezykach nauk dedukcyjnych. Prace Towarzystwa
Naukowego Warszawskiego, Wydzial III Nauk Matematyczno-Fizycznych 34, 13–172.
Tschacher, W. a Dauwalder, J.-P., eds. (1999): The dynamical systems approach to
cognition: Concepts and empirical paradigms based on self-organization,
embodiment, and coordination dynamics (Vol. 10). Singapore: World Scientific.
Turing, A. M. (1950): Computing machinery and intelligence. Mind 59, 433–460.
Vaňková, I., Nebeská, I., Saicová Římalová, L., a Šlédrová, J. (2005): Co na srdci to na
jazyku: Kapitoly z kognitivní lingvistiky. Praha: Nakladatelství Karolinum.
Varela, F.J., Thompson, E. a Rosch, E. (1991). The Embodied Mind: Cognitive Science
and Human Experience. Cambridge, MA: MIT Press.
Von Uexküll, J. (1957): A Stroll through the Worlds of Animals and Men. In C. Schiller,
ed.: Instinctive Behavior, International Universities Press, New York.
Wang, Y., Wu, X., Weng, J. (2011): Skull-closed autonomous development. In Bao-
Liang Lu, Liqing Zhang, and James Kwok (Eds.): Proceedings of the 18th
international conference on Neural Information Processing - Volume Part
I (ICONIP'11), Vol. Part I. Berlin, Heidelberg: Springer-Verlag, 209-216.
Ward, L. M. (2001): Dynamical Cognitive Science. Cambridge MA: MIT Press.
69
Weng, J., Hwang, W. S., Zhang, Y., Yang, C. a Smith, R. (2000): Developmental
Humanoids: Humanoids that Develop Skills Automatically. In Proc. First IEEE Conf.
on Humanoid Robots, Cambridge MA: MIT Press.
Wittgenstein, L. (1953): Philosophical Investigations. New York: Macmillan.
Ziemke, T. (1999): Rethinking Grounding. In: Riegler, Peschl a von Stein (eds.)
Understanding Representation in the Cognitive Sciences. New York: Plenum Press,
177-190.
70
Kapitola 5
Postkognitivistický prístup k percepcii a akcii
v mobilnej robotike
ANDREJ LÚČNY
Cieľom príspevku je porovnať kognitivistický a postkognitivistický prístup k
modelovaniu mysle. Kým v prvom prípade myseľ považujeme za stelesnenie
univerzálneho algoritmu myslenia, v prípade druhom ju považujeme za hromadu
špecifických algoritmov závislých od tela i prostredia. Ozrejmíme taktiež ako sa tento
rozdiel premieta do vzťahu medzi percepciou a akciou.
5.1 Kognitivizmus
Pod kogníciou rozumieme schopnosť spracúvať informácie spôsobom podobným
človeku. Toľko hovorí tradičná definícia. Pri pokuse túto definíciu zobjektívniť
a vysvetliť, v čom je spôsob spracovania informácie u človeka špecifický, sa už názory
rozchádzajú. Jedni chápu kogníciu širšie a berú do úvahy akékoľvek spracovanie
informácii, ktoré v konečnom dôsledku vedie k tomu, že sa bytosť – či už prirodzená
(spravidla človek) alebo umelá (t.j. robot), pri pohľade zvonku správa účelne. Druhým
takáto schopnosť nestačí. Ukazuje sa totiž, že účelné správanie možno často dosiahnuť aj
jednoduchými vhodnými reakciami, ktoré prípadne využívajú charakter prostredia,
v ktorom sú vykonávané (obrázok 1). A toho sú schopní aj tie najjednoduchšie tvory.
Preto vyžadujú okrem spracovania typu stimul–reakcia určitú kontinuitu spracovania
informácii v čase, určitú schopnosť poučiť sa zo svojich zážitkov (obrázok 2). Aj tu sa
ponúka viac možností, pričom ich ako tzv. typy myslenia pekne charakterizuje (Dennett,
1997). Tvory neschopné počas svojho života upravovať svoju konkrétnu reakciu na
konkrétny stav prostredia nazýva darwinovskými. Hoci čisto darwinovského tvora ťažko
v živej ríši nájdeme (snáď niektoré vírusy), zaujímavé príklady takéhoto myslenia možno
nájsť hlavne v ríši hmyzu. Napríklad ak pod pohár schováte kutavku medvedíkovú
a chrobáka medvedíka, tak pokiaľ je kutavka po párení, uloví ho a použije ako potravu
pre svoje larvy. Pokiaľ však oplodnená nie je, zožerie medvedík kutavku. Napriek jej
schopnosti medvedíka poraziť ju nikdy nevycvičíte, aby sa jej to chcelo, pokiaľ nie je
čerstvo po párení. Pozoruhodné je, že i týmto spôsobom myslenia možno vybudovať
fantastické stavby ako sú termitiská, prevádzkovať poľnohospodárstvo ako mravce Atta,
či viesť vojny ako to robia otrokárske mravce.
Pokročilejšie tvory – Dennett ich nazýva skinnerovskými – dokážu meniť svoje
správanie na základe podmieňovania (conditioning). Hoci nie každý tvor je ochotný dať
sa vycvičiť, skinnerovské myslenie možno nájsť v prírode prakticky kdekoľvek, dobre sa
dá podmieňovať napríklad chobotnica (Boycott, 1965). Ďalším krokom k
71
zdokonaľovaniu je tzv. popperovské myslenie, pri ktorom dochádza v mysli k utvoreniu
modelu toho, čo existuje v reálnom svete a do mysle tvora postupne prichádza v podobe
stimulov. O modeli hovoríme, pokiaľ je dokonalý, do tej miery, že ho v mysli možno
použiť na simuláciu toho, čo by sa v reálnom svete muselo vyskúšať. Túto schopnosť
majú nepochybne napríklad psy (Hass, 1970), ktoré vedia predvídať vývoj situácie
a vedia si zvoliť stratégiu ako ju riešiť. Vrcholným spôsobom myslenia je schopnosť
vyjadriť tieto vnútorné modely jazykom, ktorý slúži ako prenosový prostriedok na ich
presun do inej mysle. Takého tvora Dennett nazýva gregoryovským. Je ním
predovšetkým človek, ale sú určité náznaky, že aj ďalšie ľudoopy a niektoré primáty,
veľryby ako aj niektoré vtáky.
Obrázok 1. Správanie na základe reakcie na stimul. Na základe v čase prichádzajúcich stimulov
tvor reaguje vždy určitou a rovnakou reakciou.
Obrázok 2. Správanie, v ktorom je reakcia výsledkom kontinuity stimulov. Vyžaduje
komplikovanejšiu vnútornú štruktúru tvora.
Pre ilustračný príklad si predstavme krčmu, kde každý tvor, čo do nej vojde, dostane
po hlave a vyhodia ho von. Účelné správanie spočíva teda v tom, aby sme sa naučili tam
nevstupovať. Darwinovský tvor by nemal šancu, stále by ho mlátili po hlave a on by tam
stále liezol. Skinnerovský tvor by postupne s pribúdajúcim počtom úderov vchádzal do
krčmy menej často, až nakoniec skoro vôbec. Popperovský tvor by vošiel len raz a pri
ďalšom raze by si simuláciou situácie domyslel čo ho čaká, takže už by tam viackrát
72
nevkročil. Gregoryovský by tam nekročil vôbec, pokiaľ by mal to šťastie, že stretne iného
tvora, ktorý mu jazykovou komunikáciou prezradí, ako to tam chodí.
Jedine u gregoryovského tvora si môžeme byť istí, že má v mysli niečo, čo
zodpovedá symbolom. Teoreticky by aj nižšie typy myslenia mohli tejto požiadavke
vyhovovať, ale nemáme zatiaľ žiadnu šancu to overiť.
Takže, keď sa rozhodneme na kogníciu nazerať ako na také spracovanie informácií,
ktoré zodpovedá manipulácii so symbolmi, stále nevieme presne, aké bytosti z prírody
máme na mysli. Vieme si ale dobre predstaviť, čo musí spĺňať umelý systém, aby v ňom
manipulácia so symbolmi prebiehala. Preto mnohí preferujú práve tento spôsob definície
kognície. Kognícia je pre nich schopnosťou spracúvať informácie vo forme symbolov.
Títo druhí sa nazývajú kognitivistami a ich prístup kognitivizmom.
Pre kognitivistov nie je podstatné, či myslenie prebieha v mysli človeka alebo
v riadiacej jednotke robota. Predpokladajú, že detaily „hardvéru“ nie sú podstatné,
podstatný je abstraktný model prebiehajúceho výpočtu.
Na kognitivistickom prístupe je dôležité, že symbol je niečo celkom abstraktné. Táto
vlastnosť symbolov určuje výrazne i charakter spracovania informácie, ktorý je
následkom toho univerzálny. Pre kognitivistov nadobúdajú zmysel pojmy ako je
napríklad algoritmus myslenia. Je to algoritmus, ktorý zo stimulu vyjadrenému
v symboloch počíta rovnako v symboloch vyjadrenú reakciu. Avšak s jeho
univerzálnosťou sú problémy. Pomocou matematickej logiky možno ukázať, že
algoritmus, ktorý by vedel v konečnom čase vypočítať správnu reakciu na ľubovoľný
stimul neexistuje. Zo znalosti jeho vnútornej štruktúry sa totiž dá skonštruovať taký
stimul, na ktorom sa zacyklí. Tento problém si uvedomil už Turing pri úvahách o vzniku
oboru, ktorý sa dnes nazýva umelou inteligenciou (Kelemen, 2010). Kognitivisti k tomuto
problému pristupujú zavedením neurčitosti platnosti dát, t.j. odkláňajú sa od binárnej
logiky pravda/nepravda a nemonotónnosťou ich reťazenia, t.j. schopnosťou dopracovať
sa v rôznych fázach reťazenia dát k rôznym záverom.
5.2 Kognitivistický prístup k modelovaniu mysle
Pokiaľ kognitivisti modelujú myseľ, pracujú vždy s modelom, ktorý je nezávislý na
konkrétnej úlohe. Napríklad nezávisí od toho, či skúmame na človeku spôsob čítania
alebo motoriku uchopovania predmetov. Závisí len od toho, akú konkrétnu predstavu
o mysli máme. Tá je stelesnená vo forme tzv. kognitívneho podsystému, ktorý je schopný
vykonávať manipulácie so symbolmi a odvodiť zo stimulu príslušnú reakciu. Aby to bolo
možné, musí byť stimul najprv zakódovaný do podoby symbolov, a aby to malo význam,
musí byť reakcia vyjadrená v symboloch interpretovateľná v podobe akcií. Stimul totiž
v podobe symbolov do tela mysliaceho tvora neprichádza, ale je vyjadrený
v subsymbolovej forme zodpovedajúcej povahe jeho senzorov (iným slovom povedané
receptorov). Reakcia, ktorú telo produkuje, je zase postupnosťou akcií jeho motorov
(aktuátorov).
Robot, skonštruovaný na báze kognitívneho prístupu má teda riadiaci systém zložený
zo spracovania vnemov, ich premeny do symbolovej formy pri tzv. výbere, kognitívneho
podsystému – napríklad v podobe plánovača, premeny vygenerovaného plánu
73
vyjadreného v symbolovej forme na akcie pri vykonávaní plánu a generovanie reakcie
v podobe akcií (obrázok 3 vľavo).
Takýmto robotom bol napríklad SHRDLU (Kelemen, 2010), schopný manipulovať
s kockami umiestnenými v scéne. Dnes by sme ich implementovali tak, že by sme použili
štandardný postup počítačového videnia, napríklad farebný obraz z kamery by sme
previedli do farebného modelu odolného voči zmene jasu a potom ho previedli na odtiene
šedej. Z toho by sme získali hrany hranovým operátorom ako je Canny. Potom by sme v
týchto hranách hľadali úsečky alebo rovno celé štvorce a kosoštvorce pomocou
Houghovej transformácie a podľa nich určili, kde na obraze máme kocky. Tieto kocky by
sme pomenovali symbolmi, napríklad A, B, C, ... Následne by sme sa snažili zodpovedať,
aké sú vzťahy medzi kockami a premeniť ich na logické formuly, napríklad Hornove
klauzuly. Takže fakt, že kocka označená ako A sa nachádza na kocke B, by sme vyjadrili
ako Na(A,B), zatiaľ čo fakt, že sa kocka B nachádza na podlahe, vyjadríme ako Na(A,Fl).
Robotovi by sme potom zadali cieľ, dajme tomu Na(A,C). Jeho kognitívny systém by
potom začal reťaziť tieto poznatky s poznatkami o presúvaní kociek, ktoré by sme mohli
vyjadriť tzv. STRIPS pravidlom:
pravidlo: Preloz(X,Y,Z) - prelož X z Y na Z
podmienka aplikovateľnosti: Volne(X), Na(X,Y), Volne(Z)
odoberané klauzuly: Na(X,Y), Volne(Z)
pridané klauzuly: Na(X,Z), Volne(Y), Volne(Fl)
Dosadzovaním A, B, C za X, Y, Z, kognitívny podsystém dokáže odvodiť, že správny
plán na dosiahnutie cieľa je Preloz(A,B,C). Pritom toto odvodenie prebieha čisto na báze
manipulácie so symbolmi, ktoré v tejto chvíli už nič neznamenajú, zaujímavá je len
štruktúra vzťahov medzi nimi. Keby nešlo o kocky ale o valce, odvodenie by vyzeralo
úplne rovnako. Úplne rovnako by mohlo vyzeraj aj v prípade, že C je guľa, a museli by
sme rozšíriť podmienku aplikovateľnosti, aby sme dokázali zachytiť, že v tomto prípade
by bol takýto plán nerealizovateľný.
Obrázok 3. Príklad kognitivistického robota, dekomponovaného funkciou (vľavo) a
postkognitivistického robota, dekomponovaného aktivitou (vpravo).
74
Po vygenerovaní plánu nastáva potreba premeniť opäť abstraktné na konkrétne
a treba interpretovať tento plán, tj. preložiť kocku A z B na C. Toto sa dá zabezpečiť
algoritmom fungujúcim na báze tzv. inverznej kinematiky, ktorý vygeneruje správnu
postupnosť nastavení parametrov aktuátora, napríklad uhlov v kĺboch robotického
ramena.
Túto postupnosť treba potom vykonať ako sériu akcií v čase. Môže sa pritom stať
i to, že sa táto akcia vykonať nedá, pretože sa zmenili podmienky, za ktorých bola
odvodená – napríklad niekto položí ďalšiu kocku na A, alebo že výber sprevádzajúci
vytvorenie reprezentácie nezobral v úvahu niečo čo bolo dôležité – napríklad, že medzi
A a C je stena (to je tzv. problém rámca). V oboch prípadoch sa na zlyhanie plánu príde
až pri jeho vykonaní, nie pri odvodzovaní. Je to práve preto, že modelovanie reálneho
sveta v mysli prebieha v symbolovej forme a spochybňuje to zaužívaný názor, že pokiaľ
v systéme máme A reprezentujúce reálnu kocku, ide o popperovský spôsob myslenia.
Možno práve subsymbolová forma, pri ktorej napríklad kocku aproximujeme hmotným
bodom v euklidovskom priestore, a ktorý dokážeme postupne posúvať po určitej
trajektórii priamo v mysli, zodpovedá popperovskému mysleniu viac. Problém je, že
hmotný bod nie je univerzálnou abstrakciou. Pre iné účely bude výhodnejšie kocku
reprezentovať ako množinu plôch, alebo ako vektor príznakov obsahujúci dĺžku strany,
farbu, textúru, ... Toto je začiatok úvahy, ktorá nás posúva od kognitivistického prístupu
k postkognitivistickému.
Pri kognitivistickom prístupe si môžeme všimnúť, že percepcia je úplne oddelená od
akcie (oddeľuje ich kognitívny podsystém). Charakter takejto mysle by sme teda mohli
vyjadriť sloganom „percepcia–kognícia–akcia“ (obrázok 4 vľavo).
Obrázok 4. Kognitivistická predstava o vzťahu medzi percepciou a akciou (vľavo) a analogická
postkognitivistická predstava (vpravo).
5.3 Postkognitivistický prístup k modelovaniu mysle
Nevýhody tradičného prístupu percepcia–kognícia–akcia sa už dlhé roky snaží prekonať
prístup založený na predstave, že kognícia je neoddeliteľná od percepcie a akcie, t.j.
prekrýva sa s nimi. Následkom toho nemožno oddeliť ani samotnú percepciu od akcie
(obrázok 4 vpravo). Vidíme, že zo štrukturálneho hľadiska tu nič, čo by zodpovedalo
kognícii, nenájdeme. Kognícia je rozptýlená vo vzťahu medzi percepciou a akciou,
povstáva ako vedľajší efekt dômyselného prepojenia a prekrytia týchto dvoch zložiek
mysle.
Postkognitivisti neveria, že existuje univerzálny algoritmus myslenia, ale že štruktúra
mysle je daná telom, ktoré ovláda – hovoria o princípe stelesnenia (embodiment)
75
a prostredím v ktorom telo funguje (situovanosť). Detaily biologického hardvéru, tzv.
wetware, považujú za dôležité a preto preferujú prácu s neurónovými sieťami, prevažne
impulznými, ktoré sa viac ponášajú na prírodné vzory, než tradičné. Avšak neodmietajú
ani iné inžinierske prístupy, z ktorých najvýznamnejším základom je práca Rodneyho
Brooksa (1999). Brooks pre konštrukciu riadiacich systémov mobilných robotov (ktoré
môžeme pri troche fantázie nazývať umelými mysľami) sformuloval nasledovné
východiská:
Situovanosť
• Pri tvorbe neuvažujeme, že sa vytváraný systém nachádza v akýchkoľvek
podmienkach vyjadrených všeobecne, ale uvažujeme veľký súbor špecifických
podmienok.
• Môžeme najprv urobiť verziu, ktorá funguje len pre časť týchto podmienok a
neskôr ju rozšíriť na ostatné.
• Nebudeme podmienky ošetrovať jediným modulom, ale špecifické podmienky
budú ošetrované špecifickými modulmi – „raz zaberie taký trik, inokedy onaký“.
• Nesnažíme sa budovať abstraktnú reprezentáciu sveta. „Najlepšou reprezentáciou
sveta je svet sám“.
• Systém vyvíjame pre konkrétne prostredie, v ktorom ho testujeme (ladíme).
Stelesnenosť
• Neoddeľujeme návrh od implementácie.
• Navrhujeme s prototypom v ruke.
• Tým je umožnené po skončení každej fázy vývoja systém testovať a ladiť.
• Pracujeme so skutočnými vstupmi, spoliehame sa na ich reálny charakter.
Emergencia
• Správanie systému je výsledkom interakcie jednotiek, z ktorých sa skladá.
• Súvislosť medzi správaním jednotiek a systému môže byť na prvý pohľad
nejasná.
• Pri vhodnej štruktúre systému môžeme explicitnou implementáciou určitých
schopností implicitne implementovať schopnosť doteraz neuvažovanú. Vývojár
môže byť neschopný tento jav predvídať, hoci jeho dodatočné vysvetlenie nie je
zložité.
Interakcia
• Systém môže inteligenciu čerpať z dynamiky prostredia. Často možno zložitý
riadiaci systém nahradiť jednoduchým, ktorý vhodne stavia na dynamike
prostredia.
• Paradoxne (na rozdiel od systémov, ktoré obsahujú kognitívny modul) v
statickom prostredí sa takýto systém správa horšie než v dynamickom.
• Inteligencia sa prejavuje reakciami systému na stav jeho prostredia, teda v
globálnom správaní, nemožno ju nájsť vnútri systému.
• Reaktivita systému zabezpečuje jeho odolnosť voči rušivým zmenám
a prechodným stavom v prostredí.
Hierarchia (Inkrementálnosť)
76
• Systém vyvíjame inkrementálne, po vrstvách, pričom každá implementuje určitú
aktivitu.
• Postupujeme pritom zdola nahor. Začíname s hierarchicky nižšími vrstvami
(biologická metafora: historicky staršími), teda s primitívnejšími aktivitami.
• Postupne pridávame nové a nové vrstvy, pričom po každom inkremente,
testujeme, ladíme a opravujeme, kým naozaj nezbehnú všetky testy určené pre
danú fázu vývoja úspešne.
• Vďaka tomu sa nám nemôže stať že implementácia zlyhá na integrácii častí
v celok. Hoci na druhej strane nám potenciálne hrozí, že systém dostaneme do
stavu, že novú aktivitu už nemožno konzistentne pridať.
• Hierarchia systému spočíva v tom, že vyššie vrstvy môžu využívať nižšie. Môžu
ich pasívne monitorovať alebo aj aktívne na ne pôsobiť tým, že potláčajú alebo
dokonca modifikujú ich činnosť.
Na základe týchto východísk navrhol Brooks pre tvorbu mobilných robotov tzv.
subsumpčnú architektúru. Podľa nej sa systém skladá z modulov organizovaných do
vrstiev, ktoré zodpovedajú jednotlivým aktivitám a zároveň fázam vývoja. Každý modul
je založený na konečno-stavovom automate rozšírenom o vstupno-výstupné a interné
registre, o možnosť volať náročnejšie výpočtové procedúry a hlavne o časovač. Tento
zabezpečuje, že modul opakovane transformuje signály prijaté do vstupných registrov na
signály zapísané do výstupných registrov. V rámci jednej vrstvy môžu byť moduly
vzájomne prepojené vedením, po ktorom sú signály z výstupných registrov odposlané do
vstupných registroch iných modulov. Okrem toho sa moduly z vyššej vrstvy môžu
„vtierať“ do činnosti modulov v nižších vrstvách, a to prostredníctvom troch
mechanizmov (obrázok 5):
odpočúvaním – pri ňom dochádza k rozdvojeniu vedenia v nižšej vrstve a odvedenia
jeho novej vetvy do vyššej vrstvy; modul vo vyššej vrstve takto monitoruje, aké
signály sú posielané medzi dvomi modulmi v nižšej vrstve;
supresiou – pri nej do vedenia v nižšej vrstve vkladáme špeciálne zariadenie –
supresor – a napájame ho na výstup z modulu vo vyššej vrstve. Supresor zabezpečí,
že signál z vyššej vrstvy nahradí signál, ktorý sa šíri po vedení v nižšej vrstve;
inhibíciou – pri nej podobne vkladáme do vedenia v nižšej vrstve inhibítor, ktorý ak
dostáva signál z vyššej vrstvy, zastaví šírenie signálu v nižšej vrstve.
Obrázok 5. Mechanizmy subsumpcie.
Supresor a inhibítor majú pritom časovú konštantu, ktorá zabezpečuje, že ak začnú
supresiu či inhibíciu bude to trvať istý čas. Vstup a výstup niektorých modulov je
prepojený so senzormi a aktuátormi systému a to bez ohľadu na to, v ktorej vrstve sa
modul nachádza.
77
Obrázok 6. Senzory a motory robota ALLEN.
Ako príklad si uvedieme najjednoduchší (a najstarší) robot postavený subsumpčnou
architektúrou a to robot ALLEN (Brooks, 1999). Tento prípad použijeme v ďalšom, preto
ho uvedieme relatívne podrobne (pričom upozorňujeme, že isté nepublikované detaily
o tomto robote musíme odhadnúť). ALLEN je robot, ktorý má prechádzať miestnosťami
na jednom podlaží, aby navštívil podľa možnosti čo najviac miest (čo je základ pre
budovanie kognitívnej mapy podlažia). Robot je vybavený dvanástimi sonarmi
(ultrazvukovými senzormi), ktoré merajú vzdialenosť najbližšej prekážky na im
pridelenom výseku v okolí robota. Sonary sú rozmiestnené rovnomerne, takže na každý
sonar pripadá výsek veľkosti 30. Podvozok robota umožňuje pohyb dopredu a dozadu
ako aj otáčanie sa na mieste (obrázok 6).
V zmysle subsumpčnej architektúry sa ALLEN skladá z troch vrstiev (obrázok 7):
AVOID, WANDER a EXPLORE. Ako prvá bola implementovaná vrstva AVOID
realizujúca najjednoduchšiu aktivitu a to vyhýbanie sa prekážkam. Začína modulom
Forward, ktorý ovláda dopredný a spätný pohyb a pokiaľ nedostane iný pokyn realizuje
dopredný pohyb robota. Teda keby mal robot iba tento modul, šiel by rovno a narazil by
do prvej prekážky. Aby sa tak nestalo, je vo vrstve AVOID modul Sonar, ktorý prijíma
vzdialenosti najbližších prekážok zo sonarov a na základe toho produkuje mapu týchto
vzdialeností, indexovanú relatívnym smerom. Časť tejto mapy, ktorá sa viaže
k dopredným smerom (napríklad ± 60) vstupuje do modulu Collide, ktorý vyhodnotí či
nastala, alebo hrozí zrážka. (Robot sa pohybuje vždy v smere 0, lebo všetky smery sú
relatívne – robot nemá žiadny kompas). Pokiaľ Collide vyhodnotí, že nastala alebo
nastáva zrážka zaradí na určitú dobu spätný chod prostredníctvom modulu Forward.
S týmito modulmi už robot do prekážky nenarazí, ale cúvne pred ňou. Nič mu to však nie
je platné, lebo po cúvnutí opäť vyrazí smerom k prekážke a tak stále dokola. Zjavne treba
pridať otáčanie. To realizuje modul Turn, ktorý potláča činnosť modulu Forward (robot
sa otáča na mieste). Turn však realizuje otáčanie iba keď na to dostane pokyn. Tento
generujú moduly Feelforce a Runaway. Feelforce vyhodnocuje z mapy vzdialeností smer
v ktorom najviac hrozí zrážka. Na to Runaway vyhodnotí či sa treba otáčať a vypočítava
o koľko a ktorým smerom. Túto informáciu potom posiela do modulu Turn. Treba si
uvedomiť, že tu môže vznikať určitá spätná väzba, keď otáčanie trvá dlhší čas: tým že
78
Turn začne realizovať príkaz od Runaway na otočenie o 150, mení sa poloha robota,
a tým pádom aj mapa a smer v ktorom najviac hrozí zrážka a následne príkaz modulu
Runaway, ktorý už žiada otočenie len o 100. Na druhej strane, moduly pracujú v taktoch,
takže ak sa žiadosť o otočenie o 5 vykoná prv než prebehne vygenerovanie nového
príkazu, tento už bude znieť „netočiť sa“. Ďalším modulom vrstvy AVOID je Status,
ktorého prítomnosť je v podstate porušením princípu inkrementálneho vývoja zdola nahor
(v práci vysvetlíme príčinu a ukážeme ako sa bez neho zaobísť). Jeho úlohou je
poskytovať dostatočne výstižné informácie o pohybe robota pre vyššie vrstvy. Pokiaľ by
robot obsahoval iba vrstvu AVOID, tak by vyštartoval rovno, pri prekážkach by sa otáčal
do voľného priestoru. Zaujímavosťou je to, že hoci vrstva AVOID bola navrhnutá pre
statické prekážky, funguje rovnako dobre aj pre pohybujúce sa objekty, ktoré sú pomalšie
než robot. Už pri prvej časti vrstvy AVOID vie robot cúvať pred pohybujúcim sa
objektom, pri celej vrstve dokáže pred ním utekať.
Sonar
Collide
Feel force Runaway
Forward
Turn StatusS
Avoid
AVOID
WANDER
Wander
Look Pathplan
IntegrateStereo
Whenlook
I S
EXPLORE
map
force
halt
busy
heading
encoders
heading
travel
busy
candidate init
startlook
heading
path
integral
Obrázok 7. Subsumpčná architektúra robota ALLEN.
Pohyb, ktorý generuje AVOID, je však natoľko deterministický, že pri pustení robota
do scény pomerne rýchlo príde k zacykleniu jeho trajektórie. Odstrániť tento nedostatok
je úlohou vrstvy WANDER. Túlanie realizujú dva moduly. Prvý z nich – Wander –
generuje raz za istý čas (prípadne s istou pravdepodobnosťou) náhodný smer a posiela ho
do druhého modulu Avoid. Ten má zariadiť, aby sa robot otočil týmto smerom. Keďže
vrstva AVOID ovláda aktuátory pohybu, musí tak urobiť s jej pomocou. Tá však žiadne
rozhranie na takúto spoluprácu neposkytuje, keďže bola implementovaná spôsobom zdola
nahor – teda bez uvažovania, čo bude v implementácii nasledovať. Preto Avoid musí
použiť jeden z mechanizmov subsumpcie, ktorý takéto rozhranie vytvorí. Konkrétne bude
použitá supresia: do vedenia medzi modulmi Runaway a Turn vložíme supresor napojený
na výstup z Avoid. Tým pádom Turn bude považovať hodnotu z Avoid za smer, ktorý mu
79
poslal Runaway, teda za smer, ktorým sa treba otočiť, aby nenastala zrážka. Čo treba
doriešiť je prípad, keď zrážka naozaj hrozí. Preto Avoid použije aj mechanizmus
odpočúvania: vedenie medzi Feelforce a Runaway zdvojíme a odvedieme na vstup
modulu Avoid, ktorý tak získa potrebnú informáciu o nebezpečenstve zrážky. V takom
prípade nebude stimul z Wander realizovať.
Vrstvy AVOID a WANDER zabezpečia, že pohyb robota bude bezpečný
a nedeterministický. To však zďaleka nestačí na to, aby robot prehľadával priestor.
Naopak, bude sa motať na mieste. Opak zabezpečuje vrstva EXPLORE. Jej úlohou je
presúvať robot z jednej oblasti do inej udržujúc stály smer pohybu (ale obchádzajúc
pritom prekážky). Podmienku aktivácie vrstvy do činnosti vyhodnocuje modul Whenlook
na základe údajov o pohybe robota od modulu Status. Keď sa mu zdá, že sa robot motá na
mieste, uvedie do činnosti modul Look. Ten spolupracuje s modulom Stereo, ktorý
preberá údaje zo senzorov a hľadá medzi nimi smer, v ktorom je dostatok voľného
priestoru (napríklad chodba). Tohto kandidáta posiela modulu Look, ktorý ho prípadne
vyhlási za smer presunu do inej oblasti od tohto momentu modul Pathplan, otáča robota
tak, aby stále držal tento smer. Keďže smery sú relatívne, od momentu voľby musí robot
počítať odchýlku aktuálneho absolútneho smeru od jeho hodnoty v čase voľby, čo robí
modul Integrate. Ten na to samozrejme potrebuje dostatočné informácie o pohybe robota
– tie mu sprostredkúva modul Status z vrstvy AVOID. Pathplan pritom realizuje otáčanie
robota cez vrstvu WANDER a to opäť supresiou – ako keby šlo o náhodný smer
zabezpečujúci túlanie, hoci tento nie je náhodný, ale generovaný podľa presnej logiky.
Pritom prekážky budeme obchádzať, lebo Avoid nepošle tento smer do Turn, ak hrozí
zrážka. Je logické zabezpečiť, aby sa do činnosti EXPLORE nemiešal modul Wander,
preto je počas presunu potlačená jeho činnosť mechanizmom inhibície. Ničmenej, aj keby
sme toto nespravili, presun by sa podaril, len by počas neho dochádzalo k vybočeniam
a návratom aj bez výskytu prekážok. Všetky tri vrstvy realizujú dostatočne bohatý pohyb,
aby sa dal použiť na sofistikovanejšie úlohy, ako je napríklad budovanie kognitívnej
mapy prostredia. ALLEN je typický robot, ktorého riadiaca štruktúra je dekomponovaná
aktivitou (obrázok 3 vpravo).
Toľko k robotovi ALLEN. Zaujímavým a modernejším príkladom podobného
prístupu je robot ACE, ktorý využíva princíp interaktívnosti. Dostane za úlohu dostať sa
na určité miesto v meste. Potom chodí po ulici a oslovuje ľudí, aby mu rukou ukázali
smer, ktorý určuje cestu k danému miestu. Keby na ulici nikoho nebolo, nikam by sa
nedostal. Ale vďaka dynamike prostredia, v ktorom sa nachádza, jeho spôsob navigácie
bezpečne funguje.
Podobne to robí v živej prírode slimák Litorino, ktorý bol inšpiráciou pre Brooksa
(Brooks, 1999). Tento slimák vylieza za odlivu z mora na breh, kde sa živí vyplavenými
kôrovcami. Zaujímavé je, že sa vôbec nevie vrátiť naspäť a pri chove v akváriu by vyšiel
von a zdochol. Späť do mora ho v prírode vracia príliv, na ktorý sa na Zemi naozaj dá
spoľahnúť.
Zatiaľ čo kognitivisti sa obracajú na filozofiu, v ktorej hľadajú všeobecné princípy
myslenia, postkognitivistický prístup čerpá námety hlavne z neurobiológie, vývinovej
psychológie ako aj evolučnej biológie.
80
5.4 Senzomotorický prístup k modelovaniu mysle
Jedným z prístupov spadajúcich pod postkognitivistický prístup k modelovaniu mysle,
ktorý sa inšpiruje výskumom vo vývinovej psychológii je tzv. senzomotorický prístup.
Prvý, kto prišiel s myšlienkou, že myslenie sa formuje nielen z vnímania, ale aj zo
senzomotorickej činnosti, bol zrejme Jean Piaget. Odvodil ju z experimentov ako je
napríklad „Chyba A non B“ (The A not B error) (obrázok 8): Dieťaťu je prezentovaná
scéna s dvoma skrýšami. Do jednej zo skrýš schovávame pre dieťa zaujímavý predmet
a demonštrujeme, že odkrytím skrýše sa vieme predmetu opäť zmocniť. Opakujeme to,
pokým sa dieťa nenaučí predmet odkryť. Potom predmet schováme do druhej skrýše.
Napriek tomu, že dieťa vidí kde predmet schovávame, dieťa mladšie ako 10 mesiacov,
nebude hľadať schovaný predmet tam, kde sme ho schovali, ale tam, kde ho predtým
nachádzalo. Piaget z tohto pokusu urobil záver, že dieťa nie je schopné predmet
reprezentovať nezávisle od motorickej akcie, ktorou sa ho zmocňuje. Obdobie vývinu
dieťaťa, v ktorom sú jeho reprezentačné schopnosti takto obmedzené, nazval
senzomotorickým obdobím.
Obrázok 8. Experiment „Chyba A non B“.
Podľa Lindy Smithovej (Smith, 2008) mal síce Piaget pravdu v tom, že prvé
reprezentácie u dieťaťa sú senzomotorické, ale mýlil sa v predstave, že v neskorších
vývinových fázach sú tieto reprezentácie nahradené dokonalejšími. Smithová
predpokladá, že experimenty ako je „Chyba A non B“ odhaľujú najvnútornejšiu črtu
našich kognitívnych schopností, ktorá nás sprevádza celým životom. Senzomotorické
obdobie dieťaťa je podľa nej špecifické len tým, že táto črta ľahko vypláva na povrch
a môžeme ju tak zvonku pozorovať. Dokonca i v tomto období môžeme zabrániť
vonkajšiemu prejavu chyby, pokiaľ medzi zmenou skrýše zmeníme polohu dieťaťa
(napríklad sediace postavíme, alebo stojace posadíme – pritom stále sediace alebo stále
stojace dieťa chybu demonštruje) alebo zmeníme čokoľvek čo má súvis s „rečou jeho
tela“ (napríklad mu dáme na zápästie závažie).
81
Tento názor veľmi dobre zapadá do predstavy, že myseľ je dokonalý systém
poskladaný z nedokonalých vecí, ktoré vyplávajú na povrch pri rôznych klamoch. Akcie
tu nie sú len následkom vnímania, ale aktívne sa podieľajú na konštitúcii vnímania.
Motorická zložka môže byť podstatná aj vtedy, keď sa nám na prvý pohľad zdá, že
sa pozorovaný subjekt vôbec nehýbe. Bompas a O’Regan (2006) napríklad ukázali, že
motorika okohybných svalov má vplyv na vnímanie farieb. Testovaným osobám
predkladali do pravej časti zorného poľa zelenú škvrnu a do ľavej červenú v rôznom
poradí. Potom im ukazovali v oboch častiach žltú rôznych odtieňov. Pri normálnom
pohybe očí testovanej osoby dochádzalo k tomu, že rovnaký vnem vyvolávali rôzne
odtiene žltej – na pravej strane musela byť bližšie k zelenej a na ľavej k červenej. Pokiaľ
boli oči fixované, k tomuto efektu nedochádzalo. Autori testu predpokladajú, že
motorické dáta z oko-hybných svalov sú použité na kalibráciu sýtosti farieb.
Smithová (2008) sa zamerala na spôsob, akým deti v nízkom veku manipulujú
s objektmi v ich okolí v porovnaní s dospelými. Na základe analýzy videa z kamery
umiestneného na čele dieťaťa a dospelého objektívne preukázala, že dieťa si na rozdiel od
dospelého aktívne umiestňuje predmety do zorného poľa tak, aby ho prakticky celé
pokrývali. To mu má umožniť lepšie oddeliť daný predmet od ostatnej scény, uložiť si do
pamäti jeho opis a následne tak eliminovať potrebu si ho prikladať k očiam, lebo
zapamätané parametre vie použiť na to, aby ho rozpoznalo aj diaľky a v rámci zložitejšej
scény. Toto pozorovanie je zaujímavé z toho hľadiska, že varuje inžinierov, ktorí sa
zaoberajú rozpoznávaním scény, že snímanie obrazu z kamery a jeho následné
spracovanie nedáva dostatočný materiálny základ na napodobnenie analogického
rozpoznávacieho mechanizmu u človeka. Na správnu kalibráciu takéhoto systému môže
byť nevyhnutný aj aktívny pohyb kamery, či dokonca manipulátor na umiestňovanie
predmetov do zorného uhla kamery. Zo Smithovej experimentu by mohlo dokonca
vyplývať, že je veľmi podstatné mať dve kamery s možnosťou ovládania ich zaostrenia.
Pokiaľ si totiž dieťa umiestni predmet blízko k očiam, ľahko ho odseparuje od zvyšku
scény aj tým, že keď naň zaostrí zrak, je to jediný predmet, ktorý vidí ostro. Používanie
zdanlivo dokonalejšieho vizuálneho systému na simuláciu zraku môže takto zmariť
simuláciu zrakového vnímania v zárodku – keďže aktívnou motorikou sa niektoré
zdanlivé nevýhody dajú využiť. Motorické dáta oko-hybných svalov sú opäť zjavne
jednoduchšie než obraz a môžu hrať nezastupiteľnú úlohu vo formovaní rozpoznávacieho
mechanizmu. Tento prístup demonštrujeme na jednoduchom príklade mobilného robota
rozpoznávajúceho scénu (obrázok 9).
82
Obrázok 9. Mobilný robot a objekty v scéne.
Obrázok 10. Pohľad spredu (vľavo) a zboku (vpravo).
Predstavme si teraz, že robot vidí to, čo je obrázku 10 vľavo. Otázka je čo vlastne
vidí: jeden objekt alebo dva? My vidíme dva, ale ako na to príde náš robot? Tradičný
prístup v počítačovom videní sa snaží určiť, čo je na obraze vypuklé, čo duté a pod.,
následne odhadnúť hĺbku (vzdialenosť od kamery) pre každý pixel obrazu a na základe
určitej logiky – preferujúc určité štandardné tvary objektov – rozhodnúť, či ide o jeden, či
o dva objekty.
Obrázok 11. Jedno z možných vnímaní scény z pohľadu robota (výsledok segmentácie).
83
motorická
akcia robota
preskúmavaný
objekt
Obrázok 12. „Nadrôtovaná“ motorická akcia robota za účelom preskúmania objektu.
Senzomotorický prístup na to ide inak. Predpokladá, že v momente keď robot prvý
raz čelí pohľadu z obrázku 10 vľavo, nie je schopný vydolovať z neho úplnú informáciu.
Je však schopný na scénu aplikovať málo účinnú, ale rýchlu segmentáciu – napríklad
metódou (nehierarchického) zhlukovania do dvoch skupín (2-means clustering) (obrázok
11), ktorá mu napovie, že niečo na scéne je. Robot taktiež vie zhruba určiť vzdialenosť
videného, predpokladajúc, že sa videné nachádza na zemi a vediac výšku a orientáciu
kamery. Na základe predstavy o relatívnom umiestnení robota a objektu na pôdoryse
scény sa robot postaví do určitej vzdialenosti čelne k predmetu a spustí motorickú akciu
za účelom bližšieho preskúmania objektu.
Táto motorická akcia môže byť načisto „nadrôtovaná“ a obchádza predmet z pravej
strany, pričom tento pohyb je prerušovaný otáčaním sa k objektu a späť (obrázok 12).
Dôležité je, že motorická akcia je dostatočne krátka na to, aby sa dalo zo sekvencie
príkazov na motory s dostatočnou presnosťou vedieť po akej trajektórii šiel robot.
Obrázok 13. Pozorovaný objekt z rôznych pohľadov.
Pri tomto pohybe si robot segmentuje obraz z rôznych pohľadov (obrázok 13).
Keďže robot predpokladá, že motorickú akciu dokáže vykonať presne – takže vie
relatívne polohy miest, z ktorých sa bude na objekt pozerať, zlúčiť jednotlivé pohľady nie
je ťažké. Takáto 3D rekonštrukcia pochopiteľne nie je presná, je však vykonateľná
v reálnom čase a jej výsledkom je zistenie, že predmety sú dva, jeden menší, jeden väčší.,
jeden vyšší, jeden nižší a podobne (obrázok 14).
84
Obrázok 14. Rekonštrukcia objektov z rôznych pohľadov robota, objekty na scéne sú
reprezentované čiernymi plochami (pohľad na scénu zhora).
Z takýchto čiastočných reprezentácii je možné aj v „mysli“ robota rekonštruovať
videné objekty a hoci sú veľmi nepresné, sú v princípe dostatočné na vykonanie rôznych
simulácií, napríklad, či by bolo možné položiť panáčika na kváder.
Obrázok 15. Zložitejšia reprezentácia objektu v “mysli“ robota. Zľava doprava, zhora dole: obraz
v odtieňoch šedej, hrany získané algoritmom Canny, orientácie hrán, mriežka regiónov položená
na obraz, význačné orientácie v každom regióne, jedna zo šablón reprezentujúcich objekt.
85
Poznáme už aj rafinovanejšie reprezentácie, výpočtovo náročnejšie, ale oveľa menej
nepresné, ktoré umožňujú reprezentovať v mysli robota predmet tak kvalitne, že je to
porovnateľné s rozpoznávacou schopnosťou človeka. Najjednoduchšou z nich je
reprezentácia používaná metódou šablón z význačných orientácií (dominant orientation
templates). Získava sa z kontinuálneho snímania objektu z rôznych pohľadov
extrahovaním orientácii jeho hrán (obrázok 15), teda opäť tu ide o senzomotorický
prístup. Aj pri tejto metóde je možné použiť reprezentáciu objektu na jeho
zrekonštruovanie v umelej 3D scéne v „mysli“ robota, čím sa získa pomerne realistický
obraz, tvarom podobný, len veľkosťami nie celkom zhodný, videnému.
Ako vidíme, postkognitivistický prístup sa vyznačuje tým, že objekt môže byť
reprezentovaný mnohorakým spôsobom, pričom každý spôsob vyhovuje inému použitiu.
Na rozdiel od kognitivistického prístupu, ktorý hľadá jednu najlepšiu a univerzálnu
reprezentáciu, postkognitivisti používajú súčasne rôzne reprezentácie v závislosti od toho
akú aktivitu práve potrebujú vykonávať.
5.5 Záver
Kognitivistický i postkognitivistický prístup sa stále rozvíjajú a polemika medzi ich
stúpencami je stále veľmi živá. Oba ešte nepochybne prispejú k vytvoreniu zaujímavých
strojov vyznačujúcich sa umelou inteligenciou.
Literatúra
Bompas, A., O’Regan K. (2006): More evidence for sensorimotor adaptation in color
perception. Journal of Vision, 6, 145-153.
Boycott, B. (1965). Learning in the Octopus. Scientific American, 212(3): 42-50.
Brooks, R.: Cambrian Intelligence. The MIT Press, Cambridge, Mass., 1999.
Charron, C., Labbani-Igbida, O., Mouaddib, E. M. (2003): Sensory-motor approach to
shape recognition. Perception 32, ECVP Abstract Supplement.
Dennett, D. (1997): Typy myslí. Bratislava: Archa.
Hass, H. (1970): Human Animal: The Mystery of Man's Behaviour. Corgi Books.
Hinterstoisser, S., Lepetit, V., Ilic, S., Fua, P., Navab, N. (2010): Dominant Orientation
Templates for Real-Time Detection of Texture-Less Objects. IEEE Computer Society
Conference on Computer Vision and Pattern Recognition (CVPR), San Francisco,
California.
Kelemen, J. (1993): Strojovia a agenty, Archa, Bratislava.
Kelemen, J. (2010): Myslenie a stroj. Kaligram, Bratislava.
Lúčny, A. (2011): Multiagentový prístup k modelovaniu mysle - alebo ako sledovať
pingpongovú loptičku. V knihe Umelá inteligencia a kognitívna veda III, STU
Bratislava.
Minsky, M. (1986): Society of Mind. Simon & Schuster, New York.
Piaget, J., Inhelderová, B. (1993): Psychológia dieťaťa. SOFA, Bratislava.
86
Smith, L. (2008): From Fragments to Geometric Shape: Changes in Visual Object
Recognition Between 18- and 24-Months. Current Directions in Psychological
Science, 18(5), 290-294.
Sonka, M., Hlaváč, V., Boyle, R. (2007): Image Processing, Analysis and Machine Vision
(3. vyd.), Thomson Learning, Toronto.