64
Martie – Iunie 1999 CogniŃie, Creier, Comportament 1 CONEXIONISM ŞI ARHITECTURĂ COGNITIVĂ: O ANALIZĂ CRITICĂ * Jerry A. FODOR, Zenon W. PYLYSHYN Cognition, vol. 28, 1988 INTRODUCERE Modelele conexioniste sau PDP [parallel distributed processing - procesări paralele distribuite] "prind" din ce în ce mai mult. Aproape în fiecare zi au loc conferinŃe sau apar cărŃi noi, iar publicaŃiile de popularizare a ştiinŃei salută acest nou val teoretic, considerându-l un eveniment crucial în înŃelegerea psihicului (un exemplu tipic îl constituie articolul din Science 86, numărul din mai, intitulat “How we think: A new theory”). Există, de asemenea, inevitabil, descrieri ale emergenŃei conexionismului ca o “schimbare de paradigmă” în sens kuhnian. (Vezi Schneider 1987, pentru un exemplu de acest gen şi pentru dovezi suplimentare ale tendinŃei de vedea conexionismul drept “noul val” al ştiinŃei cognitive). Fan club-ul include cele mai neaşteptate categorii de oameni. Conexionismul oferă consolare acelor filosofi care consideră că faptul de a se baza pe noŃiunile intenŃionale sau semantice pseudoştiinŃifice ale psihologiei simŃului comun (precum scopuri sau credinŃe) îi induce pe psihologi în eroarea demersului computaŃional (de ex., P.M. Churchland, 1981; P.S. Churchland, 1986; Dennett, 1986); dar îi consolează şi pe cei din tabăra opusă, care consideră psihologia computaŃională falimentară, pentru că nu îşi pune problema intenŃionalităŃii sau a sensului (de ex. Dreyfus & Dreyfus, in press). În ştiinŃa computerelor, conexionismul este îmbrăŃişat de teoreticienii care cred că maşinile seriale sunt prea slabe, trebuind să fie înlocuite de maşini noi, paralele, radical diferite (Fahlman & Hinton, 1986), în timp ce în tabăra biologiei este adoptat de cei care consideră că nu putem înŃelege cogniŃia decât ca neuroştiinŃă (de ex., Arbib, 1975; Sejnowsky, 1981). Conexionismul este totodată atractiv şi pentru psihologii care consideră că o mare parte a psihicului (inclusiv acea parte implicată în imagerie) nu este de natură discretă (de ex., Kosslyn & Hatfield, 1984), sau pentru cei care cred că ştiinŃa cognitivă nu a acordat suficientă atenŃie mecanismelor stohastice sau mecanismelor * Traducerea: Oana Benga, UBB, Cluj-Napoca

CONEXIONISM ŞI ARHITECTUR Ă COGNITIV Ă O ANALIZ · PDF fileMartie – Iunie 1999 •••• Cogni Ńie, Creier, Comportament 1 CONEXIONISM ŞI ARHITECTUR Ă COGNITIV Ă: O ANALIZ

  • Upload
    ngohanh

  • View
    229

  • Download
    1

Embed Size (px)

Citation preview

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

1

CONEXIONISM ŞI ARHITECTUR Ă COGNITIV Ă: O ANALIZ Ă CRITIC Ă*

Jerry A. FODOR, Zenon W. PYLYSHYN Cognition, vol. 28, 1988

INTRODUCERE

Modelele conexioniste sau PDP [parallel distributed processing - procesări paralele distribuite] "prind" din ce în ce mai mult. Aproape în fiecare zi au loc conferinŃe sau apar cărŃi noi, iar publicaŃiile de popularizare a ştiinŃei salută acest nou val teoretic, considerându-l un eveniment crucial în înŃelegerea psihicului (un exemplu tipic îl constituie articolul din Science 86, numărul din mai, intitulat “How we think: A new theory”). Există, de asemenea, inevitabil, descrieri ale emergenŃei conexionismului ca o “schimbare de paradigmă” în sens kuhnian. (Vezi Schneider 1987, pentru un exemplu de acest gen şi pentru dovezi suplimentare ale tendinŃei de vedea conexionismul drept “noul val” al ştiinŃei cognitive).

Fan club-ul include cele mai neaşteptate categorii de oameni. Conexionismul oferă consolare acelor filosofi care consideră că faptul de a se baza pe noŃiunile intenŃionale sau semantice pseudoştiinŃifice ale psihologiei simŃului comun (precum scopuri sau credinŃe) îi induce pe psihologi în eroarea demersului computaŃional (de ex., P.M. Churchland, 1981; P.S. Churchland, 1986; Dennett, 1986); dar îi consolează şi pe cei din tabăra opusă, care consideră psihologia computaŃională falimentară, pentru că nu îşi pune problema intenŃionalităŃii sau a sensului (de ex. Dreyfus & Dreyfus, in press). În ştiinŃa computerelor, conexionismul este îmbrăŃişat de teoreticienii care cred că maşinile seriale sunt prea slabe, trebuind să fie înlocuite de maşini noi, paralele, radical diferite (Fahlman & Hinton, 1986), în timp ce în tabăra biologiei este adoptat de cei care consideră că nu putem înŃelege cogniŃia decât ca neuroştiinŃă (de ex., Arbib, 1975; Sejnowsky, 1981). Conexionismul este totodată atractiv şi pentru psihologii care consideră că o mare parte a psihicului (inclusiv acea parte implicată în imagerie) nu este de natură discretă (de ex., Kosslyn & Hatfield, 1984), sau pentru cei care cred că ştiinŃa cognitivă nu a acordat suficientă atenŃie mecanismelor stohastice sau mecanismelor

* Traducerea: Oana Benga, UBB, Cluj-Napoca

Conexionism şi arhitectură cognitivă: o analiză critică

2

“holistice” (de ex., Lakoff, 1986), şi aşa mai departe. Totodată este îmbrăŃişat şi de mulŃi reprezentanŃi tineri ai ştiinŃelor cognitive, care văd această abordare nu doar anti-establishment (şi deci dezirabilă), dar şi riguroasă şi matematică (vezi, totuşi, nota 2). Aproape oricine nu e mulŃumit cu psihologia cognitivă contemporană şi cu modelele curente ale “procesării informaŃiei” aleargă în braŃele “alternativei conexioniste”.

Atunci când este considerat drept modalitate de modelare a arhitecturii cognitive, conexionismul reprezintă într-adevăr un demers diferit de cel al ştiinŃei cognitive clasice, pe care încearcă să îl înlocuiască. Modelele clasice ale psihicului au fost derivate din structura maşinilor Turing sau Von Neumann. BineînŃeles, ele nu sunt reductibile la detaliile acestor maşini, ca, de exemplu, în formularea originală a lui Turing sau în computerele comerciale tipice; angajamentul acestor modele este doar faŃă de ideea de bază că modul de calcul care e relevant pentru înŃelegerea cogniŃiei implică operaŃii asupra simbolurilor (vezi Fodor 1976, 1987; Newell, 1980, 1982; Pylyshyn, 1980, 1984a, b). Prin contrast, conexioniştii îşi propun să proiecteze sisteme ce pot manifesta comportamente inteligente fără stocare, reactualizare sau alte operări asupra expresiilor structurate simbolic. Stilul de procesare realizat în interiorul acestor modele este, astfel, profund diferit de ceea ce se întâmplă atunci când maşinile convenŃionale realizează o anumită funcŃie. Sistemele conexioniste sunt reŃele constituite dintr-un număr foarte mare de “unităŃi” simple, dar puternic interconectate. În general, se fac anumite asumpŃii atât în privinŃa unităŃilor cât şi în privinŃa conexiunilor dintre ele. Fiecare unitate se presupune că primeşte o activare cu valoare reală (fie excitatorie, fie inhibitorie, fie de ambele feluri) de-a lungul liniilor sale input. În mod tipic, unităŃile nu fac decât să însumeze activarea şi să-şi modifice starea în funcŃie (de obicei funcŃie prag) de această sumă. Fiecare conexiune are dreptul să moduleze această activare, pe care o transmite, datorită unei proprietăŃi intrinseci (dar modificabile) numită “pondere”. Deci, activarea unei linii input este în mod tipic o funcŃie non-lineară a stării de activare a surselor sale. Comportamentul unei reŃele, luată ca întreg, este dat de starea de activare iniŃială a unităŃilor sale şi de ponderile conexiunilor dintre unităŃi, ce servesc drept unica sa formă de memorie. Numeroase elaborări ale acestei arhitecturi conexioniste de bază sunt posibile. De exemplu, modelele conexioniste au adesea mecanisme stohastice pentru determinarea nivelului de activare sau al stării unei unităŃi. Mai mult chiar, unităŃile pot fi conectate la medii exterioare. În acest caz, se presupune uneori că unităŃile răspund doar la o serie restrânsă de combinaŃii ale valorilor parametrice şi se spune despre ele că au un anumit “câmp receptiv” în spaŃiul parametric. Acestea sunt numite “unităŃi de valoare/valorice” (value units) (Ballard, 1986). În anumite versiuni ale arhitecturii conexioniste, proprietăŃile mediului sunt codate de un pattern al stărilor unor întregi populaŃii de unităŃi. Astfel de tehnici de “codare brută” sunt printre modalităŃile de obŃinere a ceea ce conexioniştii numesc “repre-

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

3

zentare distribuită”.1 Termenul de “model conexionist” (ca şi cel de “maşină Turing” sau de “maşină Van Neumann”) se aplică astfel unei familii de mecanisme, ce diferă în privinŃa detaliilor, dar care au în comun o galaxie de angajamente arhitecturale. Vom reveni la caracterizarea acestor angajamente în continuare. ReŃelele conexioniste au fost analizate extensiv - în unele cazuri folosind tehnici matematice avansate 2. Ele au fost, de asemenea, simulate pe computer şi s-a arătat că prezintă interesante proprietăŃi globale. De exemplu, ele pot fi “cablate” pentru a recunoaşte patternuri, pentru a manifesta regularităŃi comportamentale de tipul regulilor şi pentru a realiza, virtual, orice corespondenŃă de la anumite patternuri de parametri (input) la alte patternuri de parametri (output) - deşi în cele mai multe cazuri aceste corespondenŃe multiparametrice, cu multiple valori, necesită un număr foarte mare de unităŃi. De un şi mai mare interes este faptul că astfel de reŃele pot fi făcute să înveŃe; acest lucru se poate realiza prin modificarea ponderilor conexiunilor, în funcŃie de anumite tipuri de feedback (modul precis în care se realizează acest lucru constituie o preocupare a cercetării conexioniste şi a dus la dezvoltarea unor tehnici importante de tipul “retropropagării”). Pe scurt, studiul maşinilor conexioniste a dus la un număr de descoperiri neaşteptate şi spectaculoase; este surprinzător cât de multe computaŃii se pot realiza de către o reŃea uniformă, constituită din elemente simple, interconectate. Mai mult chiar, aceste modele par a avea plauzibilitate neuronală, lucru care lipseşte uneori arhitecturilor clasice. Încât, poate că o nouă ştiinŃă cognitivă, bazată pe reŃele conexioniste, ar trebui să ia locul vechii ştiinŃe cognitive, bazate pe computerele

1 DiferenŃa dintre reŃelele conexioniste în care starea unei singure unităŃi codează proprietăŃi ale lumii (de ex., aşa numitele reŃele “localizaŃioniste”) şi cele în care patternul stărilor unei întregi populaŃii de unităŃi realizează codarea (aşa numitele reŃele de reprezentări “distribuite”) este considerată importantă de către mulŃi dintre cei care lucrează la modele conexioniste. Deşi conexioniştii dezbat meritele relative ale reprezentărilor localizaŃioniste (sau “compacte”) versus reprezentări distribuite (de ex., Feldman, 1986), distincŃia va avea în general consecinŃe minore pentru scopurile noastre, din raŃiuni pe care le vom expune mai târziu. Pentru simplificare, indiferent dacă vom dori să ne referim la coduri ale unei singure unităŃi sau la coduri distribuite unor agregate, ne vom referi la “noduri” într-o reŃea. Când distincŃia va fi relevantă pentru discuŃia noastră, totuşi, vom marca explicit diferenŃa, făcând referiri fie la unităŃi, fie la agregate de unităŃi. 2 Pentru mulŃi, una dintre atracŃiile conexionismului o reprezintă faptul că implică o maşinărie matematică puternică, după cum se poate vedea, dintr-o privire, în multe din capitolele celor două volume ale lui Rumelhart, McClelland şi ale grupului de cercetare PDP (1986). Dar în contrast cu multe alte arii sofisticate matematic ale ştiinŃei cognitive, cum ar fi teoria automatelor, sau părŃi ale inteligenŃei artificiale (în particular studiul căutării, sau al raŃionamentului şi al reprezentării cunoştinŃelor), matematicile nu au fost folosite pentru a arăta care sunt limitele a ceea ce o clasă propusă de mecanisme poate realiza. Ca şi o mare parte din cercetarea din inteligenŃa artificială, demersul conexionist rămâne aproape în întregime experimental; mecanismele care arată interesant sunt propuse şi explorate prin implementarea lor pe computere, şi supuse la încercări empirice pentru a vedea ce anume vor face. În consecinŃă, deşi există un volum mare de studiu matematic înăuntrul tradiŃiei conexioniste, îŃi poŃi face o idee foarte vagă despre utilitatea generală a diferitelor reŃele şi mecanisme conexioniste.

Conexionism şi arhitectură cognitivă: o analiză critică

4

clasice. În mod cert aceasta este o propunere care trebuie luată în serios; dacă e justificată, atunci implică o redirecŃionare majoră a cercetării. Din nefericire, totuşi, discuŃiile asupra meritelor relative ale celor două arhitecturi au fost până acum marcate de o serie de confuzii şi argumente irelevante. Părerea noastră este că, atunci când se elimină aceste concepŃii greşite, ceea ce rămâne este un real dezacord în privinŃa naturii proceselor mentale şi a reprezentărilor mentale. Ni se pare însă că acest subiect a fost pus de o parte în urmă cu vreo treizeci de ani; şi argumentele care atunci păreau să militeze decisiv în favoarea paradigmei clasice par să fie încă valabile. În această lucrare vom proceda în felul următor. Întâi, vom discuta anumite chestiuni metodologice legate de nivelurile explicative care au fost prinse în plasa controversei reale asupra conexionismului. În al doilea rând, vom încerca să arătăm ce anume face ca teoriile conexioniste şi teoriile clasice ale structurii mentale să fie incompatibile. În al treilea rând, vom trece în revistă şi vom extinde anumite argumente tradiŃionale în favoarea arhitecturii clasice. Deşi aceste argumente au fost într-un fel reformulate, foarte puŃin din ceea ce vom avea de spus este în întregime nou. Dar sperăm să clarificăm modul în care diferite aspecte ale doctrinei clasice sunt coerente şi să lămurim din ce cauză respingerea modului clasic de gândire îi face pe conexionişti să afirme acele lucruri implauzibile despre logică şi semantică. În partea a patra, vom reveni la întrebarea legată de ce anume face ca demersul conexionist să fie atractiv pentru atât de mulŃi. Pentru aceasta, vom considera anumite argumente care au fost oferite în sprijinul reŃelelor conexioniste ca modele generale de procesare cognitivă.

1. NIVELE EXPLICATIVE Există două mari tradiŃii în teoretizarea modernă a psihicului, una pe care o

vom numi “reprezentaŃionalistă” şi o alta pe care o vom numi “eliminativistă”. ReprezentaŃionaliştii consideră că a postula stări reprezentaŃionale (sau “intenŃionale” sau “semantice”) este esenŃial pentru o teorie a cogniŃiei; după ei, există stări ale psihicului a căror funcŃie este de a coda stări ale lumii. Eliminativiştii, prin contrast, cred că teoriile psihologice se pot dispensa de noŃiuni semantice precum cea de reprezentare. Potrivit acestora, vocabularul corespunzător teoretizării psihologice este unul neurologic, sau poate unul comportamental, sau poate unul sintactic; în orice caz, nu un vocabular care caracterizează stările mentale în termeni de ceea ce acestea reprezintă. (Pentru o versiune neurologică a eliminativismului, vezi P.S.Churchland, 1986; pentru o versiune comportamentală, vezi Watson, 1930; pentru o versiune sintactică, vezi Stich, 1983.) Conexioniştii sunt de partea reprezentaŃionalistă a acestei probleme. După cum afirmau Rumelhart şi McClelland (1986a, p.121), procesările paralele distribuite sunt “explicit legate de problema reprezentării interne”. Adică, a specifica ce anume reprezintă stările unei reŃele constituie o parte esenŃială dintr-un model conexionist. Să considerăm, de exemplu, binecunoscuta explicaŃie

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

5

conexionistă a bistabilităŃii cubului Necker (Feldman & Ballard, 1982). “UnităŃi simple, reprezentând trăsăturile vizuale ale celor două alternative, sunt organizate în ansambluri concurente, cu legături...inhibitorii între trăsăturile rivale şi legături pozitive înăuntrul fiecărui ansamblu... Rezultatul este o reŃea care are două stări dominante stabile” (vezi figura 1). De notat că, în acest caz, ca şi în cadrul altor modele conexioniste de acelaşi tip, angajamentul faŃă de reprezentările mentale este explicit: denumirea unui nod exprimă conŃinutul reprezentaŃional al stării în care se află mecanismul atunci când nodul este excitat, şi există noduri care corespund proprietăŃilor monadice, respectiv celor relaŃionale ale cubului reversibil, atunci când el este văzut într-un fel sau în altul. E H A B F G C D

Fig. 1. Un model de reŃea conexionistă care ilustrează cele două reprezentări stabile ale cubului Necker. (Reprodus după Feldman şi Ballard, 1982, p.221, cu permisiunea editorului, Ablex Publishing Corporation.)

Există, desigur, momente când conexioniştii par să oscileze între reprezentaŃionalism şi afirmaŃia că “nivelul cognitiv” este dispensabil, în favoarea unui nivel teoretic mai precis şi mai motivat biologic. În particular, se vorbeşte mult în literatura conexionistă despre procese care sunt “sub-simbolice”- în consecinŃă, probabil non-reprezentaŃionale. Dar acest lucru induce în eroare: modelarea conexionistă este consistent reprezentaŃionalistă în practică, şi reprezentaŃionalismul

A este unY convex

G ascuns G vizibil G este uny convex

Cub cu A în prim-plan

Cub cu G în prim-plan

A mai aproape ca B H mai aproape ca G G mai aproape ca H C mai aproape ca D

Conexionism şi arhitectură cognitivă: o analiză critică

6

este în general acceptat chiar şi de teoreticienii cărora le place ideea emergenŃei cogniŃiei din sub-simbolic. Încât, Rumelhart şi McClelland (1986a, p.121) insistă că modelele PDP sunt “... profund angajate în studiul reprezentării şi procesului”. În mod similar, deşi Smolensky (1988, p.2) foloseşte conexionismul pentru a articula regularităŃi la “nivelul sub-simbolic” de analiză, se dovedeşte că stările sub-simbolice au o semantică, chiar dacă nu semantica reprezentărilor de la “nivelul conceptual”. După Smolensky, distincŃia semantică între teorii simbolice şi teorii sub-simbolice constă în faptul că “entităŃile care în mod tipic sunt reprezentate în paradigma simbolică de simboluri (unice) sunt reprezentate în paradigma sub-simbolică de un mare număr de sub-simboluri.”3 Atât nivelul conceptual cât şi cel sub-simbolic postulează, aşadar, stări reprezentaŃionale, dar în cazul teoriilor sub-simbolice aceste stări sunt tăiate în felii mai subŃiri.

Accentuăm caracterul reprezentaŃional al teoretizării conexioniste, deoarece o mare parte din lucrările metodologice conexioniste s-au preocupat cu întrebarea “Care este nivelul explicativ corespunzător arhitecturii cognitive?” (vezi, de exemplu, dialogul dintre Broadbent, 1985, şi Rumelhart & McClelland, 1985). Şi, după cum vom vedea, ceea ce afirmă cineva în problema nivelelor depinde în mare măsură de poziŃia pe care el se plasează în problema existenŃei stărilor reprezentaŃionale. Pare cert faptul că lumea are o structură cauzală la foarte multe niveluri de analiză, indivizii recunoscuŃi la nivelurile cele mai joase fiind, în general, foarte mici, iar indivizii recunoscuŃi la nivelurile cele mai înalte fiind, în general, foarte mari. Deci există un scenariu ştiinŃific ce poate fi povestit despre quarcuri; şi unul despre atomi; şi unul despre molecule... de asemenea, despre roci şi pietre şi râuri...de asemenea, despre galaxii. Şi povestea pe care o spun oamenii de ştiinŃă despre structura cauzală pe care o are lumea la oricare din aceste niveluri poate fi cu totul diferită de cea pe care o spun despre structura cauzală a nivelului următor, superior sau inferior. ImplicaŃia metodologică pentru psihologie este aceasta: dacă vrei să ai un argument legat de arhitectura cognitivă, trebuie să specifici nivelul de analiza care se presupune că e în discuŃie. Dacă nu eşti un reprezentaŃionalist, acest lucru e de-a dreptul complicat, pentru că în acest caz nu e evident ce anume face ca un fenomen să fie cognitiv. Dar specificarea nivelului de analiză relevant pentru teoriile arhitecturii cognitive nu constituie o problemă nici pentru clasicişti, nici pentru conexionişti. Întrucât atât clasiciştii cât şi conexioniştii sunt reprezentaŃionalişti, pentru ei orice nivel la care stările sistemului sunt puse să codeze proprietăŃi ale lumii contează ca nivel cognitiv; nici un alt nivel nu e relevant. (Reprezentările “lumii” includ, bineînŃeles, reprezentări ale simbolurilor; de exemplu, conceptul CUVÂNT este un construct la 3 Smolensky pare să creadă că ideea postulării unui nivel al reprezentărilor cu o semantică de trăsături subconceptuale aparŃine în mod unic teoriilor reŃelelor. Acesta este un punct de vedere extraordinar, considerând măsura în care teoreticienii clasici s-au preocupat de analiza trăsăturilor în fiecare arie a psihologiei, de la fonetică la percepŃie vizuală şi lexicografie. De fapt, întrebarea dacă există trăsături “sub-conceptuale” este neutră relativ la problema naturii clasice sau conexioniste a arhitecturii cognitive.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

7

nivel cognitiv, deoarece reprezintă ceva, şi anume cuvinte). Încât, discuŃiile despre arhitectura cognitivă sunt de fapt despre arhitectura stărilor şi proceselor reprezentaŃionale. Altfel spus, arhitectura sistemului cognitiv constă dintr-un set de operaŃii, resurse, funcŃii, principii etc. fundamentale (în general acele tipuri de proprietăŃi care ar fi descrise în “manualul utilizatorului”, dacă acea arhitectură ar fi disponibilă pe un computer), al căror domeniu şi a căror arie sunt date de stările reprezentaŃionale ale organismului.4 Prin urmare, dacă vrei să faci din teoria conexionistă o bună teorie a arhitecturii cognitive, trebuie să arăŃi că procesele care operează asupra stărilor reprezentaŃionale sunt cele specificate de o arhitectură conexionistă. De exemplu, nu are nici un sens, din punctul de vedere al psihologului cognitivist, să arăŃi că stările nonreprezentaŃionale (de exemplu, neurologice, sau moleculare, sau cuantic-mecanice) ale organismului constituie o reŃea conexionistă, deoarece acest lucru va lăsa deschisă întrebarea dacă psihicul este o astfel de reŃea la nivel psihologic. În particular este perfect posibil ca stările neurologice nonreprezentaŃionale, dar nu şi stările reprezentaŃionale, să fie interconectate în modul descris de modelele conexioniste. Aceasta deoarece, aşa cum e posibil să implementezi o arhitectură cognitivă conexionistă într-o reŃea de elemente nonreprezentaŃionale ce interacŃionează cauzal, este perfect posibil şi să implementezi o arhitectura cognitivă clasică într-o astfel de reŃea.5 De fapt, problema considerării reŃelelor conexioniste drept modele pentru un anumit nivel de implementare este controversată şi va fi discutată mai pe larg în secŃiunea 4.

Această problemă a nivelurilor este important de clarificat, pentru a nu trivializa pur şi simplu chestiunile legate de arhitectura cognitivă. Să considerăm, de pildă, următoarea remarcă a lui Rumelhart: “De câŃiva ani încoace mi se pare că trebuie să existe un demers unificat, în care aşa-numitele cazuri guvernate de reguli şi cazurile excepŃionale să fie explicate printr-un proces fundamental unificat - un proces care produce comportamente de tipul regulilor, dar şi de tipul excepŃiei de la regulă prin aplicarea unui singur proces...[În acest proces]... atât comportamentul de

4 Uneori, totuşi, chiar reprezentaŃionaliştii nu realizează faptul că reprezentarea este cea care distinge nivelurile cognitive de cele noncognitive. Astfel, de exemplu, Smolensky (1988) deşi e clar un reprezentaŃionalist, răspunzând oficial la întrebarea “Ce distinge sistemele dinamice cognitive de cele ce nu sunt cognitive ?” face greşeala de a apela la complexitate în loc de intenŃionalitate: “Un râu ...nu poate fi un sistem dinamic cognitiv, numai pentru că nu poate satisface o gamă largă de scopuri, într-o gamă largă de condiŃii.“ Dar, desigur, aceasta depinde de modul în care individualizezi scopurile şi condiŃiile; râul care vrea să ajungă în mare vrea întâi să străbată jumătate din distanŃa până la mare, şi apoi cealaltă jumătate...şi aşa mai departe; de fapt, o mulŃime de scopuri. Problema reală e de fapt că stările care reprezintă scopuri joacă un rol în etiologia comportamentelor oamenilor, nu şi în etiologia “comportamentelor” râurilor. 5 Că arhitecturile clasice pot fi implementate în reŃele nu este un fapt disputat de conexionişti; vezi de exemplu, Rumelhart şi McClelland (1986, p.118):”... se poate realiza o maşină computaŃională arbitrară din unităŃi prag lineare, inclusiv, de exemplu, o maşină care poate realiza toate operaŃiunile necesare implementării unei maşini Turing: unica limitare este că sistemele biologice reale nu pot fi maşini Turing, deoarece ele dispun de un hard finit.”

Conexionism şi arhitectură cognitivă: o analiză critică

8

tipul regulilor cât şi cel de tipul non-regulilor sunt produse ale interacŃiunii unui mare număr de procese “sub-simbolice” (Rumelhart, 1984, p.60). Reiese clar din context că Rumelhart foloseşte această idee în mod foarte tendenŃios; un conexionist afirmă că teoriilor clasice li se impune să nege. De fapt nu e aşa. Pentru că, desigur, există interacŃiuni “sub-simbolice” care implementează deopotrivă un comportament de tipul regulilor şi unul de tipul violării regulilor, cum o fac, de exemplu, procesele mecanicii cuantice. Nu acest lucru este negat de teoreticienii clasici; într-adevăr, nu e negat de nimeni care este, chiar vag, un materialist. Teoreticianul clasic nu neagă nici faptul că atât comportamentul de conformare la reguli cât şi cel de violare a regulilor sunt implementate de aceeaşi maşinărie neurologică. Pentru un teoretician clasic, neuronii implementează toate procesele cognitive în exact acelaşi fel: prin susŃinerea operaŃiilor de bază necesare pentru procesarea de simboluri. Ceea ce ar putea fi o afirmaŃie interesantă şi tendenŃioasă, însă, este faptul că nu există nici o distincŃie între procesarea conformării la reguli şi cea a violării regulilor la nivel cognitiv sau reprezentaŃional sau simbolic; în mod specific, că în acest caz etiologia comportamentului de conformare la reguli nu este mediată de reprezentarea unor reguli explicite.6 Vom considera această idee în secŃiunea 4, unde vom argumenta că nici acest lucru nu este cel care distinge arhitectura clasică de cea conexionistă; modelele clasice permit o distincŃie, pe bază de principii, între etiologii ale proceselor mentale care sunt, respectiv nu sunt explicit guvernate de reguli; dar ele nu obligă la o astfel de distincŃie. Pe scurt, controversa între arhitectura clasică şi cea conexionistă nu este legată de explicitarea regulilor; după cum vom vedea, arhitectura clasică nu este, per se, devotată ideii că reguli explicite mediază etiologia comportamentului. Nu este nici despre realitatea stărilor reprezentaŃionale; clasiciştii şi conexioniştii sunt toŃi realişti reprezentaŃionali. Nu este nici despre arhitectura nonreprezentaŃională; o reŃea neuronală conexionistă poate implementa perfect o arhitectură clasică la nivel cognitiv. Şi atunci, în ce constă de fapt dezacordul dintre arhitectura clasică şi cea conexionistă?

2. NATURA DISPUTEI Şi clasiciştii şi conexioniştii asignează un conŃinut semantic la ceva anume.

În principiu, conexioniştii asignează conŃinut semantic “nodurilor” (altfel spus, unităŃilor sau ansamblurilor de unităŃi; vezi nota 1) - adică acelor tipuri de obiecte care în mod tipic sunt etichetate drept diagrame conexioniste; în schimb, clasiciştii

6 Există o idee diferită, care apare frecvent în literatura conexionistă, şi cu care aceasta e uşor confundată: anume, că distincŃia dintre regularităŃi şi excepŃii este doar stohastică (ceea ce face ca “went” să fie un trecut neregulat nu e decât faptul că o construcŃie mai frecventă este cea prezentă în “walked”). Pare evident că, dacă acest enunŃ este corect, el poate fi uşor asimilat arhitecturii clasice (vezi secŃiunea 4).

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

9

asignează conŃinut semantic expresiilor - adică acelor tipuri de obiecte care sunt înscrise pe benzile maşinilor Turing şi stocate la adrese în cazul maşinilor Von Neumann.7 Dar teoriile clasice nu sunt de acord cu teoriile conexioniste în legătură cu relaŃiile primare care există între aceste entităŃi purtătoare de conŃinut. Teoriile conexioniste recunosc doar conectivitatea cauzală ca relaŃie primară între noduri; cunoscând modul în care activarea şi inhibiŃia circulă între noduri, poŃi şti totul despre felul în care sunt legate nodurile unei reŃele. Din contră, teoriile clasice recunosc nu numai relaŃii cauzale între obiectele evaluabile semantic pe care le postulează, dar şi o serie de relaŃii structurale, a căror constituenŃă este paradigmatică.

Această diferenŃă are consecinŃe cu bătaie lungă pentru modul în care cele două tipuri de teorii tratează o varietate de fenomene cognitive, dintre care unele vor fi îndată examinate pe larg. Dar la baza neînŃelegerilor de detaliu stau două diferenŃe arhitecturale între aceste tipuri de teorii: (1) Semantica şi sintaxa combinatorică a reprezentărilor mentale. Teoriile clasice - dar nu şi cele conexioniste - postulează un “limbaj al gândirii” (vezi, de exemplu, Fodor, 1975); ei consideră că reprezentările mentale au semantică şi sintaxă combinatorică, ceea ce presupune că (a) există o distincŃie între reprezentări structural atomice şi reprezentări structural moleculare; (b) reprezentările structural moleculare au constituenŃi sintactici care sunt ei înşişi fie structural moleculari, fie structural atomici; şi (c) conŃinutul semantic al unei reprezentări (moleculare) este o funcŃie a conŃinuturilor semantice ale părŃilor sale sintactice, luate împreună cu structura sa constituentă. Din raŃiuni convenŃionale, vom abrevia uneori (a)-(c) şi vom vorbi despre teoriile clasice ca fiind devotate reprezentărilor mentale “complexe” sau “structurilor simbolice”.8 (2) Sensibilitatea la structură a proceselor. În modelele clasice, principiile pe baza cărora sunt transformate stările mentale, sau prin care un input selectează outputul corespunzător, sunt definite relativ la proprietăŃile structurale ale reprezentărilor mentale. Deoarece reprezentările mentale clasice au o structură combinatorică, e

7 Această formulare corespunde scopurilor prezente. Dar un cititor mai subtil al teoriilor conexioniste ar putea considera că stările totale ale maşinii sunt cele care au conŃinut, de exemplu, starea de a avea cutare sau cutare nod excitat. A postula conexiuni între noduri denumite ar fi, deci, echivalent cu a postula relaŃii cauzale între stările corespunzătoare purtătoare de conŃinut ale maşinii: a spune că excitarea nodului denumit “dog” este cauzată de excitarea nodurilor denumite [d], [o], [g] este totuna cu a spune că reprezentarea de către maşină a inputului său, ca fiind constituit din secvenŃa fonetică [dog], cauzează reprezentarea inputu-lui drept cuvântul “dog”. Şi aşa mai departe. Cel mai adesea distincŃia între aceste două moduri de a pune problema nu contează pentru scopurile noastre, încât le vom considera alternativ convenabile. 8 Uneori diferenŃa între a postula pur şi simplu stări reprezentaŃionale şi a postula reprezentări cu semantică şi sintaxă combinatorică este marcată de distingerea între teorii care postulează simboluri şi teorii care postuleaza sisteme simbol. Cele din urmă, dar nu şi primele, sunt devotate “limbajului gândirii”. Pentru această accepŃiune, vezi Kosslyn şi Hatfield (1984) care iau refuzul de a postula sisteme simbol drept aspectul caracteristic prin care arhitecturile conexioniste diferă de cele clasice. Suntem de acord cu acest diagnostic.

Conexionism şi arhitectură cognitivă: o analiză critică

10

posibil ca operaŃiile mentale clasice să li se aplice în raport cu forma lor. Rezultatul este că un proces mental clasic paradigmatic operează asupra oricărei reprezentări mentale care satisface o descripŃie structurală dată, şi o transformă într-o altă reprezentare mentală care satisface o altă descripŃie structurală. (Deci, de exemplu, într-un model al inferenŃei se poate recunoaşte o operaŃie care se aplică oricărei reprezentări de forma P&Q şi o transformă într-o reprezentare de forma P.) De notat că, atâta timp cât proprietăŃile formale pot fi definite la diferite niveluri de abstractizare, o astfel de operaŃie se poate aplica în mod egal unor reprezentări ce diferă în mare masură în privinŃa complexităŃii structurale. OperaŃia ce se aplică reprezentărilor de forma P&Q, pentru a produce P, este satisfăcută, de exemplu, de o expresie ca “(AvBvC) & (DvEvF)”, din care derivă expresia “(AvBvC)”.

Considerăm (1) şi (2) drept principiile ce definesc modelele clasice, şi le luăm în considerare literalmente; ele constrâng realizările fizice ale structurilor simbolice. În particular, se presupune că structurile simbolice dintr-un model clasic corespund unor structuri fizice reale ale creierului, iar structura combinatorică a unei reprezentări se presupune că are un duplicat în relaŃiile structurale dintre proprietăŃile fizice ale creierului. De exemplu, relaŃia “parte a “, care există între un simbol relativ simplu şi unul mai complex, se presupune că ar corespunde unei relaŃii fizice între stări ale creierului.9 De aceea Newell (1980) vorbeşte despre 9 Poate ideea că relaŃiile dintre proprietăŃile fizice ale creierului instanŃiază (sau codează) structura combinatorică a unei expresii comportă o anume elaborare. Un mod de a înŃelege ce anume implică această idee este acela de a considera care sunt condiŃiile care trebuie să stea la baza punerii în corespondenŃă a expresiilor cu stări ale creierului (la care ne vom referi ca la “physical instantiation mapping“), pentru ca relaŃiile cauzale dintre stările creierului să depindă de structura combinatorică a expresiilor encodate. În definirea acestei puneri în corespondenŃă nu e destul doar să specifici o encodare fizică a fiecărui simbol; pentru ca structurile expresiilor să aibă roluri cauzale, relaŃiile structurale trebuie să fie encodate de proprietăŃile fizice ale stărilor creierului (sau de seturi de proprietăŃi fizice, echivalente funcŃional cu starea creierului). Deoarece, în general, modelele clasice presupun că expresiile care sunt instanŃiate fizic în creier au o sintaxă generativă, definiŃia unei corespondenŃe de instanŃiere fizică trebuie să fie construită în termeni de (a) definirea unei corespondenŃe primare între simboluri atomice şi stări fizice relativ elementare, şi (b) specificarea modului în care structura unor expresii complexe corespunde structurii unor stări fizice compozite sau relativ complexe. O atare corespondenŃă care conservă structura este dată, în mod tipic, recursiv, folosind sintaxa combinatorică prin care expresiile complexe sunt construite din unele mai simple. De exemplu, corespondenŃa de instanŃiere fizică F pentru expresii complexe va fi definită recursiv, fiind dată definiŃia lui F pentru simboluri atomice şi fiind dată structura expresiilor complexe, ultima fiind specificată în termeni de reguli de “construire a structurii” care constituie sintaxa generativă pentru expresii complexe. Să luăm, de exemplu, expresia “(A&B)&C”. O defini Ńie potrivită a corespondenŃei în acest caz poate să conŃină afirmaŃia că oricare ar fi expresiile P şi Q, F(P&Q) = B(F[P], F[Q]), unde funcŃia B specifică relaŃia fizică dintre stările fizice F[P] şi F[Q]. Aici proprietatea B serveşte la encodarea fizică, (sau “instanŃierea”) relaŃiei dintre expresiile P şi Q, pe de-o parte, şi expresiile P&Q, pe de altă parte. În folosirea acestei reguli în exemplul de mai sus, P şi Q ar avea valorile “A&B” şi respectiv “C”, aşa încât regula de punere în corespondenŃă ar trebui să fie aplicată de două ori pentru a distinge structurile fizice relevante. Definind corespondenŃa recursiv în acest fel, ne asigurăm că relaŃia dintre expresiile “A”şi “B” şi expresia compozită “A&B” este encodată în termenii unei relaŃii fizice între stări constituente, care este identică (sau funcŃional echivalentă) cu relaŃia fizică folosită la encodarea relaŃiei dintre expresiile “A&B” şi “C”, şi expresia lor compozită “(A&B)&C”. Acest tip de corespondenŃă este binecunoscut datorită folosirii sale de Tarski în definiŃia interpretării unui limbaj

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

11

sisteme computaŃionale precum creierul şi computerele clasice ca despre “sisteme simbolice fizice”.

Acest fapt trebuie accentuat, deoarece angajamentul teoriei clasice nu este doar faŃă de existenŃa unui sistem de simboluri instanŃiate fizic, dar şi faŃă de afirmaŃia că proprietăŃile fizice ce corespund structurii simbolurilor sunt chiar proprietăŃile care determină sistemul să se comporte în felul în care o face. Cu alte cuvinte, corespondenŃii fizici ai simbolurilor şi proprietăŃile lor structurale cauzează comportamentul sistemului. Un sistem care are expresii simbolice, dar ale cărui operaŃii nu depind de structura acestor expresii, nu poate fi calificat drept o maşină clasică, deoarece nu satisface condiŃia (2). În această privinŃă, un model clasic este foarte diferit de unul în care comportamentul este cauzat de mecanisme precum minimizarea energiei, care nu sunt sensibile la encodarea fizică a structurii reprezentărilor.

De acum înainte, când vom vorbi despre modele “clasice” vom avea în minte orice model care are reprezentări mentale complexe, precum cele caracterizate de (1), şi procese mentale sensibile la structură, ca cele caracterizate de (2). Demersul nostru relativ la arhitectura clasică este, deci, neutru în ceea ce priveşte chestiuni de tipul existenŃei sau a nonexistenŃei unei instanŃe executive distincte. De exemplu, maşinile clasice pot avea o arhitectură “orientată pe obiect”, ca limbajul Smalltalk sau o arhitectură de “transmitere a mesajelor”, precum cea a Actorilor lui Hewett (1977) - atâta timp cât obiectele sau mesajele au o structură combinatorică ce e implicată cauzal în procesare. Arhitectura clasică este totodată neutră şi în problema operaŃiilor asupra simbolurilor - a faptului că operaŃiile sunt constrânse să apară pe rând sau dimpotrivă, mai multe pot să apară în acelaşi timp.

Prin urmare, iată planul pentru ceea ce urmează. În ce a mai rămas din această secŃiune, vom schiŃa propunerea conexionistă de arhitectură computaŃională care nu are de-a face cu reprezentări mentale complexe şi operaŃii sensibile la structură. (Deşi scopul nostru este doar explorator, se dovedeşte că a descrie exact care sunt angajamentele conexioniştilor necesită o reconstrucŃie substanŃială a remarcilor şi practicilor lor. Întrucât există o mare varietate de puncte de vedere înăuntrul comunităŃii conexioniste, suntem pregătiŃi să descoperim că unii conexionişti de marcă nu aprobă întru totul programul expus de noi în ceea ce considerăm a fi esenŃa sa pură). În continuarea acestei discuŃii generale expozitive (sau reconstructive), secŃiunea 3 va oferi o serie de argumente în favoarea teoriei clasice. Restul lucrării va lua în considerare câteva raŃiuni pentru care conexionismul pare a fi atractiv pentru mulŃi, şi va oferi comentarii generale relativ la relaŃia dintre demersul conexionist şi cel clasic.

într-un model. Ideea de punere în corespondenŃă a expresiilor simbolice cu structura stărilor fizice este discutată de Pylyshyn (1984a, pp. 54-69), unde se face referire la o “funcŃie de instanŃiere” şi de Stabler (1985), unde este numită “realization mapping”.

Conexionism şi arhitectură cognitivă: o analiză critică

12

2.1. Reprezentări mentale complexe Pentru început, să considerăm unul din exemplele cele mai banale: două

maşini, una construită în spirit clasic, cealaltă în spirit conexionist.10 Iată cum ar putea raŃiona maşina conexionistă. Există o reŃea de noduri etichetate, ca în figura 2. Legăturile dintre noduri indică rutele de-a lungul cărora se distribuie excitaŃia (adică, indică ce consecinŃe are excitarea unuia dintre noduri pentru determinarea nivelului de excitaŃie al altora). A face o inferenŃă de la A&B la A corespunde, deci, excitării nodului 2 datorită excitării nodului 1 (alternativ, dacă sistemul este într-o stare în care nodul 1 este excitat, eventual atinge o stare în care nodul 2 este excitat; vezi nota 7).

1 2 3

Fig. 2. O posibilă reŃea conexionistă pentru stabilirea inferenŃelor de la A&B la A sau la B.

Să considerăm acum o maşină clasică. Această maşină are o bandă pe care îşi înscrie expresiile. Printre expresiile ce pot să apară pe această bandă sunt: “A”, “B”, “A&B”, “C”, “D”, “C&D”, “A&C&D”... etc. Consti tuŃia cauzală a maşinii este după cum urmează: de câte ori un simbol de forma P&Q apare pe bandă, maşina scrie un simbol de forma P. O inferenŃă de la A&B la A corespunde, deci, unei simbolizări de tipul “A&B” pe bandă, care cauzează o simbolizare de tip “A”.

Şi atunci, în ce constă diferenŃa arhitecturală dintre cele două tipuri de maşini? În cazul maşinilor clasice, obiectele cărora le este atribuit conŃinutul A&B (adică, simboluri ale expresiei “A&B”) conŃin literal, ca părŃi veritabile, obiecte cărora le este atribuit conŃinutul A (adică, simboluri ale expresiei A). Mai mult chiar, semantica (de ex., condiŃiile de satisfacere) ale expresiei “A&B” sunt determinate în mod uniform de către semantica propriilor săi constituenŃi.11 Prin 10 Această ilustrare nu vizează un model conexionist particular, deşi caricatura prezentată este de fapt o versiune simplificată a sistemului care dovedeşte teorema conexionistă a lui Ballard (1987) (care de fapt foloseşte o procedură de demonstraŃie mai restrânsă, bazată pe unificarea clauzelor lui Horn). Pentru a simplifica această expunere, am presupus un demers “localizaŃionist”, în care fiecare nod interpretat semantic corespunde unei singure unităŃi conexioniste; dar nu se modifică nimic relevant pentru această discuŃie, dacă nodurile constau de fapt din patternuri constituite dintr-un cluster de unităŃi. 11 Acest lucru face din “compoziŃionalitatea” structurilor de date o proprietate definitorie a arhitecturii clasice. Dar, bineînteles, lasă deschisă problema gradului în care limbajele naturale (ca engleza) sunt la rândul lor compoziŃionale.

B A

A&B

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

13

contrast, în cazul maşinii conexioniste, nimic din aceasta nu e adevărat; obiectul căruia îi este atribuit conŃinutul A&B (adică, nodul 1) este conectat cauzal la obiectul căruia îi este atribuit conŃinutul A (adică, nodul 2); dar între ele nu există o relaŃie structurală (de ex., parte/întreg). Pe scurt, este caracteristic pentru sistemele clasice, dar nu şi pentru cele conexioniste, să exploateze un domeniu de simboluri, dintre care unele sunt atomice (de ex., expresii ca “A”), dar dintre care un număr nedefinit de mare au ca părŃi sintactice sau semantice alte simboluri (de ex., expresii ca “A&B”).

Este uşor să treci cu vederea această diferenŃă dintre arhitecturile clasice şi cele conexioniste, când citeşti polemica din literatura conexionistă sau examinezi un model conexionist. Există cel puŃin 4 moduri în care cineva poate fi determinat să o facă: (1) nu este înŃeleasă diferenŃa între ceea ce fac şirurile de simboluri în maşinile clasice şi ceea ce fac etichetele nodurilor în cazul maşinilor conexioniste; (2) se confundă întrebarea dacă nodurile reŃelelor conexioniste au o structură constituentă cu întrebarea dacă ele sunt distribuite neurologic; (3) nu se face distincŃia între o reprezentare ce are constituenŃi sintactici şi semantici, şi un concept codat în termeni de microtrăsături; (4) se presupune că, întrucât reprezentările din reŃelele conexioniste au o structură de tipul grafurilor, nodurilor reŃelelor le corespunde o structură constituentă. Vom avea nevoie acum de o digresiune mai lungă pentru a clarifica aceste neînŃelegeri.

2.1.1. Rolul etichetelor în teoriile conexioniste

În cursul elaborării unui model conexionist, conŃinutul intenŃional va fi asignat stărilor maşinii, iar expresiile unui limbaj sau ale altuia vor fi, bineînŃeles, folosite pentru a exprima această asignare; de exemplu, nodurile pot fi etichetate în scopul indicării conŃinutului lor reprezentaŃional. Astfel de etichete au adesea şi semantică şi sintaxă combinatorică; în această privinŃă, pot arăta la fel cu reprezentările mentale clasice. Ceea ce trebuie accentuat, totuşi, este că acest lucru nu înseamnă (şi nu este adevărat că) nodurile cărora le sunt asignate aceste etichete au o sintaxă şi semantică combinatorică. Expresia “A&B”, de exemplu, poate fi simbolizată pe banda unei maşini de tip clasic şi poate, de asemenea, să apară ca etichetă într-o maşină conexionistă ca în diagrama 2 de mai sus. Şi, desigur, expresia “A&B” este sintactic şi semantic complexă: are un simbol al lui “A” drept unul din constituenŃii săi sintactici, iar semantica expresiei “A&B” este o funcŃie a semanticii expresiei “A”. Dar din citirea diagramei nu reiese faptul că însuşi nodul 1 are constituenŃi; nodul - spre deosebire de eticheta sa - nu are părŃi interpretate semantic.

Este, pe scurt, important să înŃelegem diferenŃa dintre etichetele conexioniste şi simbolurile prin care sunt definite computaŃiile clasice. DiferenŃa este aceasta: strict vorbind, etichetele nu joacă nici un rol în determinarea tipului de operaŃie al unei maşini conexioniste; în particular, operaŃiile maşinii sunt neafectate de relaŃiile sintactice şi semantice dintre expresiile folosite ca etichete. Altfel spus,

Conexionism şi arhitectură cognitivă: o analiză critică

14

etichetele nodurilor unei maşini conexioniste nu fac parte din structura cauzală a maşinii. Încât, maşina descrisă în figura 2 va continua să facă aceleaşi tranziŃii de stare indiferent de ce asignează etichetele nodurilor. Pe când, prin contrast, tranziŃiile de stare ale maşinilor clasice sunt determinate cauzal de structura - inclusiv structura constituentă - a şirurilor de simboluri pe care le transformă maşina: schimbă simbolurile şi maşina se va comporta diferit. (De fapt, întrucât comportamentul unei maşini clasice este sensibil la sintaxa reprezentărilor asupra cărora face calcule, chiar a schimba între ele reprezentări sinonime - semantic echivalente - afectează cursul calculului). Aşa încât, deşi atât etichetele conexioniste cât şi structurile de date clasice constituie limbaje, doar cele din urmă limbaje constituie un mijloc de calcul.12

2.1.2. ReŃele conexioniste şi structuri de grafuri

Al doilea motiv pentru care lipsa structurii sintactice şi semantice în reprezentările conexioniste a fost în mare măsura ignorată poate fi faptul că reŃelele conexioniste arată ca grafurile generale; şi, desigur, este perfect posibil să foloseşti grafuri pentru a descrie structura internă a unui simbol complex. Este exact ceea ce fac lingviştii când folosesc “arbori” pentru a arăta structura constituentă a propoziŃiilor. În mod corespunzător, cineva îşi poate imagina o notaŃie tip graf care să exprime structura internă a reprezentărilor mentale folosind arcuri şi noduri etichetate. Deci, de exemplu, se poate exprima sintaxa unei reprezentări mentale care corespunde ideii că John iubeşte fata în felul următor:

John loves the girl (John iubeşte fata) În interpretarea intenŃionată, aceasta ar fi descrierea structurală a reprezentării mentale al cărei conŃinut este că John iubeşte fata, şi ai cărei constituenŃi sunt: o reprezentare mentală care se referă la John, o reprezentare mentală care se referă la the girl (fata) şi o reprezentare mentală care exprimă relaŃia bilocalizată reprezentată de “ loves ".

12 Etichetele nu sunt parte a structurii cauzale a unei maşini conexioniste, dar pot juca un rol esenŃial în istoria sa cauzală, atâta timp cât proiectanŃii îşi construiesc maşinile ca să respecte relaŃiile semantice pe care le exprimă etichetele. De ex., în modelul conexionist de demonstrare a teoremei al lui Ballard (1987), există o procedură mecanică de construire a unei reŃele care va aduce dovezi prin unificare. Această procedură este o funcŃie de la un set de etichete ale nodurilor la o maşină cablată. Este, deci, un aspect interesant şi revelator în care etichetele nodurilor sunt relevante pentru operaŃiile care sunt realizate atunci când funcŃia este executată. Dar, desigur, maşina asupra căreia au efect etichetele nu e maşina ale cărei stări sunt etichetate; şi efectul etichetelor apare când maşina de demonstrare a teoremelor este construită, şi nu în momentul în care procesul de raŃionare este realizat. Acest tip de situaŃie în care etichetele “au efect” este diferit de modul în care simbolurile (de ex., structurile de date simbolice) pot afecta procesele cauzale ale maşinii clasice.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

15

Dar deşi grafurile pot susŃine o interpretare ce specifică sintaxa logică a unei reprezentări mentale complexe, această interpretare este nepotrivită pentru grafurile reŃelelor conexioniste. Grafurile conexioniste nu sunt descrieri structurale ale reprezentărilor mentale; ele sunt specificări ale relaŃiilor cauzale. Tot ceea ce poate un conexionist să înŃeleagă printr-un graf de forma X Y este: stările nodului X afectează cauzal stările nodului Y. În particular, graful nu înseamnă că X este constituent al lui Y sau că X este legat gramatical de Y etc., deoarece aceste tipuri de relaŃii nu sunt, în general, definite pentru tipurile de reprezentări mentale pe care le recunosc conexioniştii.

Un alt mod de a spune acest lucru este că legăturile în diagramele conexioniste nu sunt pointeri generalizaŃi, care primesc semnificaŃie funcŃional diferită de la un interpretator independent, ci înŃelesul lor este ceva de genul “a trimite activarea către”. Interpretarea legăturilor drept conexiuni cauzale este intrinsecă teoriei. Dacă ignori acest lucru, eşti gata să consideri conexionismul ca oferind o noŃiune mai bogată despre reprezentarea mentală decât o face de fapt.

2.1.3. Reprezentări distribuite

A treia greşeală ce poate duce la a nu constata faptul că în modelele conexioniste, reprezentărilor mentale le lipseşte structura semantică şi sintactică de tip combinatoric este faptul că mulŃi conexionişti văd reprezentările ca fiind neurologic distribuite; şi, probabil, orice este distribuit trebuie să aibă mai multe părŃi. Totuşi, aceasta nu înseamnă că orice este distribuit trebuie să aibă constituenŃi; a fi neurologic distribuit este foarte diferit de a avea structură constituentă sintactică sau semantică.

Există o structura constituentă atunci când (sau doar atunci când) părŃile entităŃilor semantic evaluabile sunt ele însele semantic evaluabile. RelaŃiile de constituenŃă, deci, se stabilesc între obiecte care sunt toate la nivel reprezentaŃional; ele sunt, în acest sens, relaŃii înăuntrul nivelului.13 Prin contrast, distribuirea neurală - tipul de relaŃie care se presupune că există între “noduri” şi “unităŃile” prin care ele sunt realizate - este o relaŃie între niveluri: nodurile, nu şi unităŃile, contează ca reprezentări. A afirma că un nod este distribuit neural înseamnă probabil a afirma că stările sale de activare corespund patternurilor de activitate neurală - ansamblurilor de “unităŃi” neurale - mai degrabă decât activărilor unor neuroni singulari. Este important faptul că nodurile, care sunt în acest sens distribuite, pot fi foarte bine atomice sintactic sau semantic: implementarea complexă spaŃial-distribuită nu implică în nici un fel structura constituentă.

Există, totuşi, un sens diferit în care stările reprezentaŃionale dintr-o reŃea pot fi distribuite, şi acest tip de distribuire ridică la rândul său întrebări relevante pentru chestiunea constituenŃei.

13 Orice relaŃie specificată dintre stările reprezentaŃionale este, prin definiŃie, înăuntrul “nivelului cognitiv”. Ceea ce nu înseamnă că relaŃiile ce sunt “înăuntrul nivelului” după acest criteriu nu pot conta ca fiind “între niveluri” dacă utilizăm criterii mai fine. De exemplu, nu există nimic care să împiedice existenŃa unor ierarhii ale nivelurilor stărilor reprezentaŃionale.

Conexionism şi arhitectură cognitivă: o analiză critică

16

2.1.4. Reprezentările “distribuite” la nivel de microtrăsături

MulŃi conexionişti consideră că reprezentările mentale care corespund unor concepte comune (CHAIR [SCAUN], JOHN, CUP [CANĂ]) sunt “distribuite” în galaxii de unităŃi de nivel inferior care au ele însele conŃinut reprezentaŃional. Pentru a folosi terminologia conexionistă uzuală (vezi Smolensky, 1988), unităŃile de nivel superior sau “conceptual” corespund unor vectori dintr-un spaŃiu “sub-conceptual” de microtrăsături. Modelul prezent este ceva asemănător cu relaŃia dintre o expresie definită şi analiza trăsăturilor prin care se defineşte: astfel, conceptul BACHELOR [BURLAC] ar putea fi gândit corespunzând unui vector în spaŃiul trăsăturilor care include ADULT, HUMAN, MALE [BĂRBAT], MARRIED [CĂSĂTORIT]; de ex., prin asignarea valorii + primelor două trăsături şi - ultimei. De notat că distribuŃia la nivel de microtrăsături (spre deosebire de distribuŃia la nivel de unităŃi neurale) este o relaŃie între reprezentări, deci o relaŃie la nivel cognitiv. Deoarece se presupune că microtrăsăturile derivă automat (de ex., via proceduri de învăŃare) din proprietăŃile statistice ale unor eşantioane de stimuli, le putem gândi ca exprimând acele tipuri de proprietăŃi care sunt relevate prin analiza multivariată a seturilor de stimuli (ex., scaling multidimensional al judecăŃilor de similaritate). În particular, nu trebuie să corespundă unor cuvinte englezeşti; ele pot fi mai fine decât, sau cumva atipice comparativ cu termenii de care are nevoie un non-specialist pentru a avea un cuvânt. Dincolo de aceasta, însă, sunt trăsături semantice perfect obişnuite, de felul celor pe care lexicografii le folosesc pentru a-şi reprezenta înŃelesurile cuvintelor.

În cele mai frecvente evaluări conexioniste, teorii articulate în termeni de vectori de microtrăsături sunt presupuse a arăta cum conceptele sunt de fapt codate, şi de aici cum vectorii de trăsături sunt meniŃi să înlocuiască specificări “mai puŃin precise” ale conceptelor de macronivel. De exemplu, acolo unde un teoretician clasic ar putea recunoaşte o stare psihologică ce conŃine conceptul CUP[CANĂ], un conexionist realizează doar o stare grosier analoagă de marcare a vectorului de trăsătură corespondent. (Un motiv pentru care analogia este doar grosieră este că acel vector de trăsătură care “corespunde” unui concept dat poate fi văzut ca fiind foarte dependent de context). Generalizările pe care le susŃin teoriile de “nivel conceptual” sunt doar cu aproximare adevărate, adevărul adevărat fiind statuabil doar în vocabularul microtrăsăturilor. Smolensky, de exemplu (p.11), este explicit în a nota acest lucru: “Descrieri precise şi formale ale procesorului intuitiv sunt în general detectabile nu la nivelul conceptual, ci doar la cel subconceptual.”14 Aceasta

14Smolensky (1988, p.14) remarca faptul că “spre deosebire de semnele simbolice, aceşti vectori se găsesc într-un spaŃiu tipologic, în care unii sunt foarte apropiaŃi, iar alŃii foarte depărtaŃi.” Oricum, aceasta pare să combine la modul radical afirmaŃiile asupra modelului conexionist şi cele asupra implementării sale (o combinare care nu este neobişnuită în literatura conexionistă, după cum vom vedea în partea a 4-a). Dacă spaŃiul în discuŃie este fizic, atunci Smolensky este de partea unor foarte puternice afirmaŃii despre relaŃiile de adiacenŃă din creier; afirmaŃii care, de fapt, nu prezintă nici un motiv pentru a fi crezute. Dar dacă, aşa cum pare mai plauzibil, spaŃiul în discuŃie este semantic, atunci ceea ce Smolensky spune nu e adevărat. Practic orice teorie cognitivă va implica măsurători ale distanŃei dintre reprezentările mentale. În teoriile clasice, de exemplu, distanŃa dintre două reprezentări

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

17

abordare a relaŃiei dintre concepte uzuale şi microtrăsături este exact analoagă abordării standard conexioniste a regulilor; în ambele cazuri, teoria de macronivel este presupusă a avea un vocabular adecvat pentru a formula generalizări care să aproximeze în mare dovezile asupra regularităŃilor de comportament. Dar structurile macroteoriei nu corespund mecanismelor cauzale care generează aceste regularităŃi. Dacă se doreşte o teorie a acestor mecanisme, e nevoie să se înlocuiasca discuŃia despre reguli şi concepte cu discuŃia despre noduri, conexiuni, microtrăsături, vectori şi aşa mai departe.15

Acum, între cele mai mari neajunsuri ale literaturii conexioniste se află faptul că problema reprezentării conceptelor uzuale prin seturi de microtrăsături s-a amestecat complet cu problema structurii combinatorice a reprezentărilor mentale. Enigma acestui amestec constă în aceea că seturile de microtrăsături pot să se suprapună, astfel încât, de exemplu, dacă o microtrăsătură corespunzând lui “+ are-un-mâner” este parte a ansamblului de noduri peste care este distribuit conceptul uzual CUP[CANĂ], atunci ne putem gândi că această teorie reprezintă pe “+ are-un-mâner” ca şi constituent al conceptului CUP[CANĂ]; de unde se poate conchide că şi conexioniştii au, în cele din urmă, o noŃiune de constituenŃă, fapt care contravine afirmaŃiei potrivit căreia conexionismul nu este o arhitectură a limbajului gândirii (a se vedea Smolensky, 1988).

O reflecŃie de moment va arăta, totuşi, clar cum, chiar şi atunci când considerăm conceptele ca fiind distribuite la nivelul microtrăsăturilor, “+ are-un-mâner” nu este constituent al CUP[CANĂ] în sensul în care “Mary” (cuvântul) este constituent al (propoziŃiei) “John o iubeşte pe Mary”. În acest ultim caz, “constituenŃa" este folosită (abuziv) pentru a face referire la o relaŃie semantică între predicate; în mare, ideea este că acele predicate de macronivel precum CUP[CANĂ] sunt definite printr-un set de microtrăsături precum “are-un-mâner”, astfel încât ne găsim în faŃa unui fel de adevăr semantic când CUP[CANĂ] se aplică unui subset al setului la care se aplică “are-un-mâner”. A se nota că în vreme ce extensiile acestor predicate se găsesc într-o relaŃie de set/subset, predicatele este în mod plauzibil legată de numărul de paşi computaŃionali necesari pentru a deriva o reprezentare din alta. În teoriile conexioniste, această distanŃă este în mod plauzibil legată de numărul de noduri care intervin (sau de gradul de întrepătrundere dintre vectori, în funcŃie de versiunea conexionistă pe care o are cineva în vedere). AfirmaŃia interesantă nu este aceea că arhitectura oferă o distanŃă. 15 Utilizarea primară a microtrăsăturilor de către conexionişti se află în demersurile lor de generalizare şi abstractizare (a se vedea, spre exemplu, Hinton, McClelland, & Rumelhart, 1986). În mare, se ajunge la generalizare prin folosirea suprapunerii de microtrăsături pentru a defini un spaŃiu de similaritate, şi se poate ajunge la abstractizare transformând vectorii care corespund unor tipuri în subvectori ai celor ce corespund semnelor lor. Propuneri similare au o destul de îndelungată istorie în analiza empiristă tradiŃională; şi au fost criticate cu succes de-a lungul secolelor. (Pentru o discuŃie despre abstracŃionism a se vedea Geach, 1957; că această similaritate este o relaŃie primitivă - deci ireductibilă la identitatea parŃială a seturilor de trăsături - a constituit, desigur, o dogmă principală a Gestalt psihologiei, ca şi a demersurilor mai recente bazate pe “prototipuri”). Tratarea microtrăsăturilor în literatura conexionistă apare foarte apropiată de variantele timpurii propuse de Katz şi Fodor (1963) şi Katz şi Postal (1964), unde au fost sprijinite atât ideea de analiză a trăsăturilor aplicată la concepte, cât şi ideea că relaŃiile de delimitare semantică dintre concepte ar trebui identificate cu relaŃiile teoretice de set dintre şiruri de trăsături.

Conexionism şi arhitectură cognitivă: o analiză critică

18

însele nu se află în nici o relaŃie de tip parte-a-întregului. Expresia “are-un-mâner” nu mai este parte a expresiei CUP[CANĂ], după cum nici fraza englezească “is an unmarried man [este un om necăsătorit]” nu este parte a frazei englezeşti “is a bachelor [este burlac]”.

ConstituenŃa reală are de-a face cu părŃi şi întreguri; simbolul “Mary” este, literal, o parte a simbolului “John loves Mary [John o iubeşte pe Mary]”. Aceasta deoarece simbolurile lor intră în relaŃiile de constituenŃă reală pe care le au limbajele naturale - atât limbajele atomice cât şi cele complexe. Prin contrast, relaŃia de definiŃie poate să reziste într-un limbaj în care toate simbolurile sunt atomice sintactic; de ex., un limbaj ce conŃine atât “cup[cană]” cât şi “has-a-handle[are-un-mâner]” ca predicate atomice. Acest punct merită să fie accentuat. Întrebarea dacă un sistem reprezentaŃional are constituenŃă reală este independentă de întrebarea legată de analiza microtrăsăturilor; ea este ridicată deopotrivă în sisteme în care CUP[CANĂ] e primitiv semantic, şi în sisteme în care primitivele semantice sunt de tipul “+ has-a-handle[are-un-mâner]” iar CUP[CANĂ] şi altele asemănătoare sunt definite în termenii acestor primitive. Este într-adevăr foarte important să nu se confunde distincŃia semantică între expresii primitive şi expresii definite cu distincŃia sintactică dintre simboluri atomice şi simboluri complexe.

Din câte ştim, nu s-au făcut încercări în literatura conexionistă de a trata problemele sintactice şi semantice ridicate de relaŃia de constituenŃă reală. Există, totuşi, o propunere care apare din când în când: anume, că cele ce în mod tradiŃional au fost considerate drept simboluri complexe să fie văzute ca seturi de unităŃi, având relaŃiile de rol, care tradiŃional sunt codate de structura constituentă, reprezentate de unităŃi aparŃinând acestor seturi. Încât, de exemplu, reprezentarea mentală corespunzătoare ideii că John o iubeşte pe Mary poate fi vectorul trăsătură { +John-subject; +loves; +Mary-object}. Aici “John-subject [John-subiect]”, “Mary-object [Mary-obiect]” şi altele asemănătoare sunt etichetele unităŃilor; adică, ele sunt trăsături atomice (deci microtrăsături), al căror status e analog cu “has-a-handle [are-un-mâner]”. În particular, ele nu au o analiză sintactică internă, şi nu există o relaŃie structurală (cu excepŃia celei ortografice) între trăsătura “Mary-object” care apare în setul {+John-subject; +loves; +Mary-object} şi trăsătura “Mary-subject” ce apare în setul {+ Mary- subject; +loves; + John- object }. (Vezi, de ex., discuŃia în Hinton, 1987, despre “descriptorii specifici rolului ce reprezintă conjuncŃia unei identităŃi şi a unui rol [prin intermediul cărora] putem implementa ierarhii parte-întreg folosind intersecŃia de set ca regulă de compoziŃie”. Vezi şi McClelland, Rumelhart şi Hinton, 1986, p. 82-85, unde ceea ce pare a fi aceeaşi concepŃie este propusă în termeni oarecum diferiŃi.)

Deoarece, după cum am remarcat, aceste tipuri de idei nu au fost elaborate în literatura conexionistă, o discuŃie detaliată nu e probabil îndreptăŃită aici. Dar merită spus măcar un cuvânt pentru a clarifica în ce tip de problemă ai intra dacă ar fi să îi iei în serios.

Din câte înŃelegem noi, propunerea are într-adevăr două părŃi: pe de-o parte, s-a sugerat că, deşi reprezentările conexioniste nu pot avea constituenŃă reală, totuşi distincŃia clasică dintre simbolurile complexe şi constituenŃii lor poate fi înlocuită

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

19

cu distincŃia dintre seturi de trăsături şi subseturi ale acestora; şi, pe de altă parte, este sugerat faptul că relaŃiile de rol pot fi prinse de trăsături. Vom considera aceste idei pe rând.

(1) În loc de a avea simboluri complexe precum "John o iubeşte pe Mary" în sistemul reprezentaŃional, vom avea seturi de trăsături de tipul {+John-subject; +loves; +Mary-object}. Întrucât acest set are pe {+John-subject},{ +loves; +Mary-object} şi aşa mai departe ca subseturi, se poate presupune că forŃa relaŃiei de constituenŃă a fost prinsă prin implicarea relaŃiei subset.

Totuşi, e clar că această idee nu va funcŃiona, întrucât nu toate subseturile de trăsături corespund unor constituenŃi adevăraŃi. De exemplu, între subseturile setului {+John-subject; +loves; +Mary-object} sunt incluse seturile {+John-subject; +Mary-object} şi setul { +John-subject; +loves } care, bineînŃeles, nu corespund constituenŃilor simbolului complex “John loves Mary”.

(2) În loc de a defini rolurile în termeni de relaŃii între constituenŃi, ca în cazul arhitecturii clasice, le vom introduce ca microtrăsături.

Să considerăm un sistem în care reprezentarea mentală ce e antrenată când cineva se gândeşte că John o iubeşte pe Mary este setul de trăsături {+John-subject; +loves; +Mary-object}. Ce reprezentare corespunde ideii că John o iubeşte pe Mary şi Bill o urăşte pe Sally? Să presupunem, într-un mod convingător pentru propunerea prezentă, că e setul {+John-subject; +loves; +Mary-object; +Bill-subject; +hates; +Sally-object}. Acum problema este de a o distinge de ideea că John o iubeşte pe Sally şi Bill o urăşte pe Mary; şi de ideea că John o urăşte pe Mary şi Bill o iubeşte pe Sally; şi de ideea că John le urăşte pe Mary şi pe Sally şi Bill o iubeşte pe Mary etc., întrucât aceste credinŃe vor corespunde toate precis aceluiaşi set de trăsături. Problema este, bineînŃeles, că nimic din reprezentarea lui Mary ca +Mary-object nu specifică dacă ea este obiectul iubirii sau al urii; mutatis mutandis, pentru reprezentarea lui John ca +John-subject.

Ceea ce merge prost nu e (încă) dezastruos. Nu se cere decât să se îmbogăŃească sistemul de reprezentări prin recunoaşterea trăsăturilor ce corespund nu doar faptului de a fi (de ex.) subiect, ci mai degrabă faptului de a fi subiect al iubirii de Mary (proprietatea lui John atunci când John o iubeşte pe Mary) şi de a fi subiect al urii de Sally (proprietatea lui Bill atunci când Bill o urăşte pe Sally). Încât, reprezentarea lui John care e antrenată când cineva se gândeşte că John o iubeşte pe Mary şi Bill o urăşte pe Sally ar putea fi ceva de genul +John-subject-hates-Mary-object.

Dezavantajul acestei propuneri este că necesită o mulŃime de microtrăsături.16 Cât de multe? Un număr în jurul ordinului de mărime al propoziŃiilor unui limbaj natural (presupunând că cineva s-ar putea descurca cu un vocabular al expresiilor de bază, care să nu fie cu mult mai bogat decât lexiconul unui limbaj natural; în fapt, limbajele naturale sunt mai bogate). Lăsăm la

16 Alt dezavantaj este că, strict vorbind, nu funcŃionează: deşi ne permite să distingem convingerea că John o iubeşte pe Mary şi că Bill o urăşte pe Sally de convingerea că John o iubeşte pe Sally şi Bill o urăşte pe Mary, nu avem încă o modalitate de a distinge credinŃa că (John o iubeşte pe Mary fiindcă Bill o urăşte pe Sally) de cea potrivit căreia (Bill o urăşte pe Sally pentru că John o iubeşte pe Mary).

Conexionism şi arhitectură cognitivă: o analiză critică

20

latitudinea cititorului să estimeze numărul microtrăsăturilor de care ar fi nevoie, presupunând că există o idee distinctă, corespunzătoare fiecărei propoziŃii gramaticale din engleză care are în jur de 15 cuvinte lungime, şi presupunând că există o medie de, să zicem, 5 roluri asociate fiecărei idei. (Sugestie: George Miller estima odată că numărul propoziŃiilor de 20 de cuvinte, bine structurate, din engleză este de ordinul magnitudinii numărului de secunde din istoria universului.)

Alternativa pentru această explozie grotescă de simboluri atomice ar fi să avem semantica şi o sintaxă combinatorică pentru aceste trăsături. Dar, desigur, asta înseamnă să renunŃi, de vreme ce relaŃiile sintactice şi semantice dintre părŃile trăsăturii complexe + ((John- subject) loves (pe Mary - object)) sunt exact aceleaşi care se manifestă în modelele clasice între constituenŃii simbolului complex “John o iubeşte pe Mary”; acestea includ relaŃiile de rol pe care conexioniştii le propuseseră pentru reconstrucŃie folosind doar seturi de trăsături atomice. Nu este, desigur, nici un accident că varianta conexionistă de a proceda cu relaŃiile de rol se izbeşte de aceste tipuri de probleme. Subiect, obiect-complement direct şi toate celelalte sunt definite în maniera clasică, respectându-se geometria arborilor sructurii constituente. Iar reprezentările conexioniste nu au constituenŃi.

Ideea că ar trebui să surprindem relaŃii de rol permiŃând trăsături precum John-subiect se dovedeşte astfel a fi falimentară; şi se pare că nu există nici un alt mod de a obŃine forŃa simbolurilor structurate într-o arhitectură conexionistă. Sau, dacă există, nimeni nu a dat nici o indicaŃie despre cum se poate să o faci. Acest lucru devine clar odată ce problema crucială a structurii în reprezentările mentale este despărŃită de problema relativ secundară (şi ortogonală) a reprezentării “distribuite" a conceptelor uzuale (i.e., de întrebări de tipul care din cele două: CUP[CANĂ] sau “are-un-mâner”, sau amândouă, sunt semantic primitive în limbajul gândirii).

Merită adăugat că aceste probleme despre exprimarea relaŃiilor de rol sunt de fapt doar un simptom al unei dificultăŃi mai penetrante: o consecinŃă a restrângerii vehiculelor de reprezentare mentală la seturi de simboluri atomice este o notare care aproape niciodată nu reuşeşte să exprime felul în care conceptele se grupează în propoziŃii. Pentru a vedea acest lucru, vom continua să presupunem că avem o reŃea în care nodurile reprezintă concepte, mai degrabă decât propoziŃii (astfel încât ceea ce corespunde gândului că John o iubeşte pe Mary este o distribuire a activării la nivelul unui set de noduri {JOHN; LOVES (IUBEŞTE); MARY} mai degrabă decât activarea unui singur nod desemnat prin JOHN LOVES MARY (JOHN O IUBEŞTE PE MARY)). A se nota că nu se poate presupune în mod plauzibil că toate nodurile care se întâmplă să fie active la un moment dat vor corespunde conceptelor care sunt constituenŃii unei aceleiaşi propoziŃii; în sfârşit dacă arhitectura este “masiv paralelă” astfel încât sunt permise multe lucruri înăuntrul ei - multe concepte sunt lăsate să fie întreŃinute - în mod simultan într-un sistem psihic dat. Să ne imaginăm atunci situaŃia următoare: în momentul t un om priveşte cerul (astfel încât nodurile corespunzând lui SKY [CER] şi BLUE [ALBASTRU] sunt active) şi se gândeşte că John îl iubeşte pe Fido (astfel încât nodurile corespunzând lui JOHN, LOVES [IUBEŞTE] şi FIDO sunt active), iar

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

21

nodul FIDO este legat de nodul DOG [CÂINE] (care este la rândul său legat de nodul ANIMAL), astfel încât şi DOG [CÂINE] şi ANIMAL sunt la rândul lor active. Putem, dacă doriŃi, susŃine că omul are o mâncărime, astfel încât ITCH [MÂNCĂRIME] este şi el activ.

Potrivit teoriei în vigoare a reprezentării mentale, mintea omului la momentul t este specificată de un vector {+ JOHN, + LOVES (IUBEŞTE), + FIDO, + DOG (CÂINE), + SKY (CER), + BLUE (ALBASTRU), + ITCH (MÂNCĂRIME), + ANIMAL}. Şi întrebarea este: care subvectori ai acestui vector corespund gândurilor pe care le gândeşte omul? Mai exact, ce determină în starea reprezentaŃională a omului ca activarea simultană a nodurilor, {JOHN, LOVES (IUBEŞTE), FIDO} să constituie gândul lui că John îl iubeşte pe Fido, dar activarea simultană a nodurilor FIDO, ANIMAL şi BLUE (ALBASTRU) să nu constituie gândul lui că Fido este un animal albastru? Se pare că simplificăm foarte mult când identificăm gândul că John o iubeşte pe Mary cu vectorul său {+ JOHN, + LOVES (IUBEŞTE), + MARY}; în cel mai bun caz acest lucru funcŃionează doar pentru presupunerea că JOHN, LOVES (IUBEŞTE) şi MARY sunt singurele noduri active când cineva gândeşte acel gând. Şi aceasta este o presupunere la care nu este îndreptăŃită nici o teorie a reprezentării mentale.

Este important să constatăm că această problemă se pune tocmai pentru că teoria încearcă să folosească seturi de reprezentări atomice pentru a realiza ceva pentru care e nevoie realmente de reprezentări complexe. Astfel, întrebarea la care dorim să răspundem este următoarea: dat fiind setul total de noduri active simultan, ce poate distinge subvectorii care corespund propoziŃiilor de cei care nu le corespund? Această întrebare are un răspuns foarte direct dacă, contrar încercării de faŃă, sunt presupuse reprezentări complexe: când reprezentările reprezintă concepte care aparŃin aceleiaşi propoziŃii, ele nu sunt numai active în mod simultan, ci încă în construcŃie unele cu celelalte. Prin contrast, reprezentările care exprimă concepte care nu aparŃin aceleiaşi propoziŃii pot fi simultan active; dar ele nu sunt ipso facto în construcŃie una cu cealaltă.

Pe scurt, ai nevoie de două grade de libertate pentru a specifica ideile pe care un sistem intenŃional le are la un moment dat: un parametru (activ vs inactiv) selectează nodurile ce exprimă concepte pe care le are sistemul în minte; celălalt (în construcŃie vs nonconstrucŃie) determină în ce fel conceptele pe care le are sistemul în minte sunt distribuite în propoziŃiile pe care le produce. Pentru ca simbolurile să fie “în construcŃie” în acest sens trebuie ca ele să fie constituenŃi ai unui simbol complex. Reprezentările care sunt în construcŃie formează părŃi ale unui întreg geometric, unde relaŃiile geometrice sunt ele însele semnificative semantic. Deci, reprezentarea care corespunde gândului că John îl iubeşte pe Fido este nu un set de concepte, ci ceva asemănător unui arbore de concepte, şi relaŃiile geometrice din interiorul acestui arbore sunt cele care marchează (de ex.) diferenŃa dintre gândul că John îl iubeşte pe Fido de gândul că Fido îl iubeşte pe John.

Ocazional am auzit sugerându-se faptul că s-ar putea rezolva prezenta problemă, în consonanŃă cu restricŃia împotriva reprezentărilor complexe, dacă s-ar permite o reŃea de tipul:

Conexionism şi arhitectură cognitivă: o analiză critică

22

SUBJECT-OF [SUBIECT AL] FIDO BITES [MUŞCĂ]

Conform interpretării intenŃionate, gândul că Fido muşcă ar corespunde activării simultane a acestor noduri; adică, vectorului {+FIDO, +SUBJECT OF, + BITES} - cu vectori similari, dar mai lungi pentru relaŃiile de rol mai complexe.

Dar, la o examinare mai profundă, această propunere abia dacă aduce în discuŃie problema pe care o are de rezolvat. Pentru că, dacă există o problemă în legătură cu ceea ce justifică asignarea propoziŃiei John loves Fido drept conŃinut al setului {JOHN, LOVES, FIDO}, cu siguranŃă există aceeaşi problemă în legatură cu ceea ce justifică asignarea propoziŃiei Fido is the subject of bites (Fido este subiectul muşcăturilor) setului {FIDO, SUBJECT-OF, BITES}. ConŃinutul propoziŃional este că Fido muşcă sau că John muşcă ?17

Destul de surprinzător, argumentul adus de noi în ultimele paragrafe este foarte aproape de cel al lui Kant împotriva asociaŃioniştilor vremii sale. În “DeducŃia transcendentă” a Primei Critici, Kant remarca: ...dacă eu cercetez...relaŃia dintre modalităŃile de cunoaştere date în orice judecată, şi o disting, ca aparŃinând înŃelegerii, de relaŃia corespunzătoare legilor imaginaŃiei reproductive [de ex., potrivit principiilor asociaŃiei], care are doar validitate subiectivă, găsesc că o judecată nu e altceva decât maniera în care modalităŃile de cunoaştere date sunt aduse la unitatea obiectivă a apercepŃiei. Acesta este lucrul intenŃionat prin copula “is [este]”. El este implicat pentru a distinge unitatea obiectivă a reprezentărilor date de cea subiectivă... Doar în acest fel din relaŃie apare o judecată, care este o relaŃie obiectiv validă, şi aşa poate fi distinsă de o relaŃie dintre aceleaşi reprezentări care ar avea doar validitate subiectivă - ca atunci când sunt conectate potrivit legilor asociaŃiei. În cel din urmă caz, tot ce aş

17 În acest punct este important în mod special să nu facem greşeala de a confunda diagramele reŃelelor conexioniste cu diagramele structurii constituente (vezi secŃiunea 2.1.2 de mai sus). A conecta SUBJECT-OF cu FIDO şi BITES nu înseamnă că atunci când toate acestea trei sunt activate FIDO este subiectul lui BITES. O diagramă a reŃelei nu e o specificare a structurii interne a unei reprezentări mentale complexe. Mai degrabă, e o specificare a unui pattern de dependenŃe cauzale între stări de activare ale nodurilor. Conectivitatea într-o reŃea determină care seturi de noduri activate simultan sunt posibile; dar nu are semnificaŃie semantică.

DiferenŃa între legăturile dintre nodurile pe care le prezintă diagramele reŃelelor şi legăturile dintre nodurile diagramelor structurii constituente este exact aceea că cele din urmă, dar nu şi primele, specifică parametri ai reprezentărilor mentale. (În particular, ele specifică relaŃii parte/întreg între constituenŃii simbolurilor complexe). În timp ce teoriile reŃelelor definesc interpretările semantice pe baza unor seturi de reprezentări de concepte (interconectate cauzal), teoriile care recunosc simbolurile complexe definesc interpretările semantice pe baza unor seturi de reprezentări ale conceptelor împreună cu specificaŃiile relaŃiilor de constituenŃă care se stabilesc între aceste reprezentări.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

23

putea spune ar fi “If I support a body, I feel an impression of weight [Dacă sprijin un corp, am o impresie de greutate]”; nu aş putea spune “It, the body, is heavy [El, corpul, este greu]”. Încât a spune “The body is heavy [Corpul este greu]” nu înseamnă doar a afirma că cele două reprezentări au fost întotdeauna legate în percepŃia mea...ceea ce asertăm este faptul ca ele sunt combinate în obiect...(CPR, p.159; sublinierile îi aparŃin lui Kant).

O parafrază modernă ar putea fi: O teorie a reprezentării mentale trebuie să distingă cazul în care două concepte (de ex., THIS BODY [acest corp], HEAVY [greu]) doar apar simultan de cazul în care, în principiu, proprietatea pe care o exprimă un concept este predicată (afirmată) de obiectul pe care celălalt concept îl denotează (ca în ideea: THIS BODY IS HEAVY). DistincŃia relevantă este că, dacă ambele concepte sunt “active” în ambele cazuri, în cel din urmă caz, dar nu şi în primul, conceptele active sunt în construcŃie. Kant crede că “acesta este lucrul intenŃionat prin copula “is [este]”. Dar bineînŃeles că există alte mijloace notaŃionale ce pot servi la specificarea faptului că aceste concepte sunt în construcŃie; remarcabilă e structura arborilor de constituenŃă.

Există, pentru a reitera, două probleme la care trebuie să răspunzi pentru a specifica în ce constă conŃinutul stării mentale: “Care concepte sunt “active?” şi “Care din conceptele active sunt în construcŃie cu care altele ?” Identificarea stărilor mentale cu seturile de noduri active oferă resurse pentru a răspunde la prima, dar nu şi la a doua din aceste întrebări. Este motivul pentru care acea versiune a teoriei reŃelei care postulează seturi de reprezentări atomice dar nu şi de reprezentări complexe nu reuşeşte, într-un număr mare de cazuri, să distingă între stări mentale care sunt de fapt distincte.

Dar noi nu afirmăm că nu se poate reconcilia o arhitectură conexionistă cu o teorie adecvată a reprezentărilor mentale (în mod specific cu o semantică şi sintaxă combinatorică a reprezentărilor mentale). Din contră, bineînŃeles că se poate: tot ceea ce se cere este să foloseşti o reŃea pentru a implementa o maşină Turing, şi să specifici o structură combinatorică pentru limbajul său computaŃional. Ceea ce se pare că nu poŃi realiza, totuşi, este să ai atât un sistem reprezentaŃional combinatoric cât şi o arhitectură conexionistă la nivel cognitiv.

2.2 OperaŃii sensibile la structură Atât clasiciştii cât şi conexioniştii oferă explicaŃii ale proceselor mentale,

dar teoriile lor diferă semnificativ. În particular, teoria clasică se bazează pe concepŃia de formă logico/sintactică a reprezentărilor mentale, pentru a defini ariile şi domeniile operaŃiilor mentale. Această concepŃie este, totuşi, absentă la conexioniştii ortodocşi, deoarece presupune că există reprezentări mentale nonatomice.

ConcepŃia clasică despre procesele mentale se bazează pe două idei, fiecare corespunzând unui aspect al teoriei clasice a computaŃiei. Împreună, ele explică de ce viziunea clasică postulează cel puŃin trei niveluri distincte de organizare în sistemele computationale: nu doar un nivel fizic şi un nivel semantic (sau al “cunoaşterii”), dar şi un nivel sintactic.

Conexionism şi arhitectură cognitivă: o analiză critică

24

Prima idee este că e posibil să construieşti limbaje în care anumite trăsături ale structurilor sintactice ale formulelor corespund sistematic anumitor trăsături semantice. Intuitiv, ideea este că în astfel de limbaje sintaxa unei formule codează sensul său; în special, acele aspecte ale sensului care îi determină rolul său în inferenŃă. Toate limbajele artificiale care sunt folosite pentru logică au această proprietate şi limba engleză le are şi ea, mai mult sau mai puŃin. Clasiciştii cred că aceasta este o proprietate crucială a limbajului gândirii.

Un exemplu simplu al modului în care limbajul poate utiliza structura sintactică pentru a coda roluri şi relaŃii inferenŃiale între sensuri poate fi utilă pentru ilustrarea acestui fapt. Deci, să considerăm relaŃia dintre următoarele două propoziŃii: (1) John went to the store and Mary went to the store. (John a mers la magazin şi Mary a mers la magazin.) (2) Mary went to the store. (Mary a mers la magazin.)

Desigur, inferenŃele de la (1) la (2) conservă valoarea de adevăr. Pe de altă parte, din punct de vedere sintactic, (2) e un constituent al lui (1). Aceste două lucruri pot fi aduse la un numitor comun exploatând principiul că propoziŃiile cu structura sintactică “(S1 şi S2)S” determină constituenŃii propoziŃiei. ObservaŃi că acest principiu face legătura dintre sintaxa acestor propoziŃii şi rolurile lor inferenŃiale. ObservaŃi, de asemenea, că totul se bazează pe realităŃi ale gramaticii limbii engleze; lucrurile n-ar fi funcŃionat într-un limbaj în care formularea care exprimă conŃinutul conjunctiv John went to the store and Mary went to the store ar fi atomică din punct de vedere sintactic.18

Să considerăm un alt exemplu. Putem reconstrui astfel de inferenŃe care conservă valoarea de adevăr, cum ar fi if Rover bites then something bites pe baza presupunerii că (a) propoziŃia ‘Rover bites’ este de tipul sintactic Fa, (b) propoziŃia ‘something bites‘ este de tipul sintactic ∃x (Fx) şi (c) fiecare formulare de primul tip determină o formulare corespunzătoare de cel de-al doilea tip (unde noŃiunea ‘formulare corespunzătoare’ este relativă la sintaxă; în mare, cele două formulări trebuie să difere doar prin faptul că una dintre ele conŃine o variabilă legată existenŃial în poziŃia sintactică ocupată de o constantă în cealaltă). Încă o dată, ideea care trebuie observată este amestecarea noŃiunilor sintactice cu cele semantice: regula generalizării existenŃiale se aplică formulărilor în virtutea formei lor sintactice. Dar proprietatea remarcabilă care se păstrează în urma aplicării regulii este semantică: ceea ce se afirmă în legătură cu transformarea realizată de regulă

18 Aceasta nu funcŃionează uniform pentru conjuncŃiile din limba engleză. ComparaŃi: John and Mary are friends → John are friends; sau The flag is red, white and blue → The flag is blue. Astfel de cazuri arată fie că limba engleză nu este limbajul gândirii, fie că, dacă este, relaŃia dintre sintaxă şi semantică este mult mai subtilă pentru limbajul gândirii decât este pentru limbajele logice standard.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

25

este faptul că aceasta conservă valoarea de adevăr.19

Există, însă, şi exemple care sunt mult mai complicate decât acestea. Întreaga ramură a logicii cunoscută drept teoria demonstraŃiei e dedicată explorării acestora.20 Nu ar fi rezonabil să descriem ştiinŃa cognitivă clasică drept o încercare extinsă de a aplica metodele teoriei demonstraŃiei asupra modelării gândirii (şi în mod similar asupra oricăror altor procese mentale care sunt văzute, în mod plauzibil, ca implicând inferenŃe; în special învăŃarea şi percepŃia). ConstrucŃia teoriei clasice se bazează pe speranŃa că analogii sintactici pot fi construiŃi pentru inferenŃe nondemonstrative (sau pentru raŃionarea informală, uzuală) într-un mod asemănător celui în care teoria demonstraŃiei a pus la dispoziŃie analogi sintactici pentru validitate.

A doua idee principală care stă la baza concepŃiei clasice despre procesele mentale este că e posibil să se proiecteze maşini ale căror funcŃie este transformarea simbolurilor, şi ale căror operaŃii sunt sensibile la structura sintactică a simbolurilor asupra cărora operează. Aceasta este concepŃia clasică despre computer: este ceea ce au în comun toate tipurile variate de arhitecturi care provin din maşinile Turing sau Von Neumann.

Poate că este evident modul în care cele două “idei principale” se potrivesc una cu cealaltă. Dacă, în principiu, relaŃiile sintactice pot fi făcute paralele cu relaŃiile semantice, şi dacă, în principiu, poŃi avea un mecanism ale cărui operaŃii asupra formulelor sunt sensibile la sintaxa acestora, atunci poate fi posibil de construit o maşină care să fie acŃionată sintactic, ale cărei tranziŃii de stare să satisfacă criteriile semantice de coerenŃă. O astfel de maşină ar fi exact ceea ce se cere unui model mecanic al coerenŃei semantice a gândirii; în mod corespunzător,

19 N-ar fi obligatoriu, oricum, ca exact conservarea valorii de adevăr să facă aspectul sintactic relevant pentru cogniŃie. Alte proprietăŃi semantice ar putea fi conservate în urma transformării sintactice pe parcursul procesării mentale - de exemplu, garanŃie, plauzibilitate, valoare euristică sau pur şi simplu non-arbitraritate semantică. Ideea modelării clasice nu este caracterizarea gândirii umane, în mod suprem, drept logică; mai degrabă este demonstrarea felului în care o familie de tipuri de raŃionări coerente semantic (sau dependente de cunoştinŃe) este posibilă din punct de vedere mecanic. InferenŃa validă este o paradigmă numai prin aceea că este cel mai bine înŃeles membru al familiei sale; cel pentru care analogiile sintactice pentru relaŃiile semantice au fost elaborate cât mai sistematic. 20 Nu este neobişnuit pentru conexionişti să facă remarci peiorative în legătură cu relevanŃa logicii pentru psihologie, deşi ei acceptă ideea că inferenŃa este implicată în raŃionare. Uneori, sugestia pare să fie că, deşi conexionismul nu poate reconstrui acea teorie a inferenŃei pe care o furnizează logica formală deductivă, totul este în regulă, atâta timp cât el are de oferit ceva mult mai bun. De exemplu, în raportul lor pentru U.S. National Science Foundation, McClelland, Feldman, Adelson, Bower & McDermott (1986) afirmă că “...modelele conexioniste realizează o logica evidenŃială (verificată) în contrast cu logica simbolică a modului de calcul convenŃional (sublinierea ne aparŃine)” şi că “logicile evidenŃiale devin din ce în ce mai importante în ştiinŃa cognitivă şi au un corespondent natural în modelarea conexionistă” (p. 7). Este oricum greu de înŃeles contrastul implicit, de vreme ce, pe de o parte, logica evidenŃială trebuie să fie, cu siguranŃă, o extensie destul de conservativă a “logicii simbolice a modului de calcul convenŃional” (de exemplu, cele mai multe din teoremele celei din urmă trebuie să fie demonstrate ca adevărate de către prima) şi, pe de altă parte, nu este nici cel mai mic motiv să ne îndoim că o logica evidenŃială va ‘rula’ pe o maşină clasică.

Conexionism şi arhitectură cognitivă: o analiză critică

26

ideea că creierul este o astfel de maşină este ipoteza de la baza ştiinŃei cognitive clasice. Şi cam atât despre povestea clasică a proceselor mentale. Povestea conexionistă trebuie să fie, bineînŃeles, diferită. Întrucât conexioniştii se abŃin de la a postula reprezentări mentale cu o structură combinatorică sintactică/semantică, ei sunt excluşi de la postularea proceselor mentale care operează asupra reprezentărilor mentale într-un mod care e sensibil la structura acestora. Tipurile de operaŃii pe care le au modelele conexioniste sunt de două feluri, depinzând de procesul în discuŃie, care este fie învăŃarea, fie raŃionamentul. 2.2.1. ÎnvăŃarea Dacă un model conexionist este conceput pentru învăŃare, vor exista procese care să determine ponderile conexiunilor dintre unităŃile sale în funcŃie de caracterul antrenamentului său. În mod tipic, într-o maşină conexionistă (ca “maşina Boltzman”) ponderile conexiunilor sunt ajustate până când comportamentul sistemului ajunge să modeleze proprietăŃile statistice ale inputurilor sale. La limită, relaŃiile stohastice dintre stările maşinii recapitulează relaŃiile stohastice dintre evenimentele mediului pe care le reprezintă. Acest lucru ar trebui să ne amintească de vechiul principiu asociaŃionist, care spune că tăria asociaŃiilor dintre “idei” este o funcŃie a frecvenŃei cu care ele formează perechi “în experienŃă”, şi de principiul teoriilor învăŃării, care afirmă că tăria conexiunii stimul-răspuns este o funcŃie a frecvenŃei cu care răspunsul este întărit în prezenŃa stimulului. Dar deşi conexioniştii, ca şi alŃi asociaŃionişti, sunt devotaŃi proceselor de învăŃare care modelează proprietăŃile statistice ale inputurilor şi outputurilor, mecanismele simple bazate pe statistici de co-ocurenŃă, care au fost semnul distinctiv al asociaŃionismului de modă veche, au fost augmentate în modelele conexioniste de un număr de procedee tehnice. (De aici elementul “nou” al “neoconexionismului”). De exemplu, unele din limitările anterioare ale mecanismelor asociative au fost depăşite prin faptul că reŃelelor li s-a permis să conŃină unităŃi (sau ansambluri de unităŃi) “ascunse”, care nu sunt direct conectate la mediu şi al căror scop este, de fapt, să detecteze patternurile statistice din activitatea unităŃilor “vizibile” incluzând, poate, patternuri care sunt mai abstracte sau mai “globale” decât cele care au putut fi detectate de perceptronii de modă veche.21

Pe scurt, versiuni sofisticate ale principiilor asociative pentru ajustarea ponderii sunt oferite de către literatura conexionistă. Totuşi, problema abordării prezente o constituie ceea ce toate versiunile acestor principii au în comun unele cu altele şi cu tipuri mai vechi de asociaŃionism: anume, toate aceste procese sunt sensibile la frecvenŃă. Pentru a ne întoarce la exemplul discutat anterior: dacă o maşină conexionistă pentru învăŃare converge într-o stare în care este pregătită să infereze A din A&B (de ex., o stare care, când nodul “A&B” este excitat, tinde să 21 A se compara “micii s” şi “micii r” ai asociaŃioniştilor “mediaŃionali” de formaŃie neo-hulleană, precum Charles Osgood.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

27

se transforme într-o stare în care nodul “A” este excitat) convergenŃa va fi cauzată în mod tipic de proprietăŃile statistice ale experienŃei de învăŃare a maşinii: de ex., prin corelaŃia între activarea nodului “A&B” şi activarea nodului “A”, sau prin corelaŃiile dintre activările ambelor noduri şi un semnal de feedback. Ca şi asociaŃionismul clasic, conexionismul consideră învăŃarea ca fiind în esenŃă un gen de modelare statistică. 2.2.2. RaŃionamentul AsociaŃia operează pentru a altera structura unei reŃele în mod diacronic, în funcŃie de experienŃa sa. Modelele conexioniste conŃin, de asemenea, o varietate de tipuri de procese de “relaxare” care determină comportamentul sincronic al unei reŃele: în mod specific, ele determină ce output oferă mecanismul pentru un pattern dat de inputuri. În această privinŃă, cineva se poate gândi la un model conexionist ca la un tip de maşină analoagă construită pentru a realiza o anumită funcŃie. Inputurile funcŃiei sunt (i) o specificare a conectivităŃii maşinii (a nodurilor care sunt interconectate); (ii) o specificare a poderilor legăturilor; (iii) o specificare a valorilor unei varietăŃi de parametri idiosincratici ai nodurilor (de ex., praguri intrinseci; timpul de la ultima activare etc.) (iv) o specificare a patternului de excitare a nodurilor input. Outputul funcŃiei este o specificare a unui pattern de activare a nodurilor output; intuitiv, maşina alege patternul output care este cel mai puternic asociat cu inputul său. În mare măsură aparatul matematic sofisticat al teoretizării conexioniste a fost devotat proiectării de soluŃii analoage pentru problema găsirii “celui mai puternic asociat” output corespunzând unui input arbitrar; dar, din nou, detaliile nu trebuie să ne preocupe. Ceea ce e important, pentru scopurile noastre, este o altă proprietate pe care teoriile conexioniste o au în comun cu alte forme de asociaŃionism. În asociaŃionismul tradiŃional, probabilitatea că o idee va scoate la iveală o alta este sensibilă la tăria asociaŃiei dintre ele (incluzând şi asociaŃii “mediatoare”, dacă există). Şi tăria acestei asocieri este la rândul său sensibilă la măsura în care ideile au fost anterior corelate. Tăria asociativă nu a fost, totuşi, socotită sensibilă la trăsăturile conŃinutului sau la structura reprezentărilor per se. În mod similar, în modelele conexioniste, selecŃia unui output corespunzător unui input dat este o funcŃie a proprietăŃilor legăturilor dintre ele (incluzând ponderile, stările unităŃilor intermediare etc.) Şi ponderile, la rândul lor, sunt o funcŃie a proprietăŃilor statistice ale evenimentelor din mediu (sau a relaŃiilor dintre patternuri de evenimente din mediu şi “predicŃii” implicite f ăcute de către reŃea etc.). Dar structura sintactic/semantică a reprezentării unui input nu se presupune că ar fi un factor în determinarea selecŃiei unui output corespunzător, întrucât, după cum am văzut, structura sintactic/semantică nu este definită pentru tipurile de reprezentări pe care le recunosc modelele conexioniste. Pentru a sumariza: teoriile clasice nu sunt de acord cu cele conexioniste în legătură cu natura reprezentărilor mentale; pentru primele, dar nu şi pentru cele din urmă, reprezentările mentale prezintă în mod caracteristic o structură constituentă

Conexionism şi arhitectură cognitivă: o analiză critică

28

combinatorică şi o semantică tot combinatorică. Teoriile clasice nu cad de acord cu cele conexioniste nici în legătură cu natura proceselor mentale; cele dintâi, spre deosebire de celelalte, consideră procesele mentale ca fiind sensibile la structura combinatorică a reprezentărilor asupra cărora operează.

Considerăm că aceste două chestiuni definesc disputa prezentă legată de natura arhitecturii cognitive. Ne propunem acum să argumentăm că în ambele probleme conexioniştii greşesc.

3. NEVOIA DE SISTEME SIMBOL: PRODUCTIVITATE, SISTEMATICITATE, COMPOZI łIONALITATE ŞI COE-RENłĂ INFERENłIAL Ă Teoriile psihologice clasice apelează la structura constituentă a

reprezentărilor mentale pentru a explica trei trăsături strâns legate ale cogniŃiei: productivitatea sa, compoziŃionalitatea sa şi coerenŃa sa inferenŃială. Argumentul tradiŃional a fost că aceste trăsături ale cogniŃiei sunt, pe de-o parte, pervasive şi, pe de altă parte, explicabile doar pe baza asumpŃiei că reprezentările mentale au structură internă. Acest argument - familiar în versiuni mai mult sau mai puŃin explicite ale ultimilor peste treizeci de ani - este încă intact, după părerea noastră. El pare să ofere ceva apropiat unei demonstraŃii a faptului că o teorie cognitivă adecvată din punct de vedere empiric trebuie să recunoască nu doar relaŃii cauzale între stări reprezentaŃionale, dar şi relaŃii de constituenŃă sintactică şi semantică; încât psihicul nu poate fi, în structura sa generală, o reŃea conexionistă.

3.1 Productivitatea gîndirii Există un argument clasic al productivităŃii, adus în favoarea existenŃei unei

structuri combinatorice în orice sistem reprezentaŃional bogat (inclusiv în limbajele naturale şi în limbajul gândirii). CapacităŃile reprezentaŃionale ale unui astfel de sistem sunt, se presupune, nelimitate, în această idealizare; în particular există un număr nedefinit de propoziŃii pe care sistemul le poate coda.22 Totuşi, această capacitate expresivă nelimitată trebuie că poate fi obŃinută prin mijloace finite. Modul de a realiza acest lucru este cel de a trata sistemul de reprezentări ca şi cum ar consta din expresii aparŃinând unui set generat. Mai precis, corespondenŃa între o reprezentare şi propoziŃia pe care o exprimă este, în multe cazuri în mod arbitrar, construită recursiv înafara corespondenŃelor între părŃi ale expresiei şi părŃi ale

22 Formulat în acest mod, argumentul productivităŃii poate fi identificat cu teza lui Chomsky (1965, 1968). Totuşi, nu este necesar ca argumentul să se bazeze pe asumpŃia fundamentală a unei capacităŃi generative infinite. Capacitatea generativă infinită poate fi văzută ,în schimb, ca o consecinŃă sau ca un corolar al unor teorii, formulate astfel încât să surprindă un număr maxim de generalizări cu ajutorul unui număr minim de principii independente. De fapt, cel mai neutru demers poate fi formulat în spiritul a ceea ce vom propune în continuare. Am folosit formularea prezentă din raŃiuni expozitorii şi istorice.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

29

propoziŃiei. Dar, desigur, această strategie poate opera doar atunci când un număr nelimitat de expresii sunt non-atomice. Aşa încât reprezentările lingvistice (şi mentale) trebuie să constituie sisteme simbol (în sensul notei 8). Deci psihicul nu poate fi constituit din procesări paralele distribuite.

Foarte adesea, când oamenii resping acest mod de a raŃiona, este din cauză că ei se îndoiesc de aprecierea corectă a capacităŃilor cognitive umane ca fiind productive. Nu pot exista argumente a priori pentru (sau împotriva) idealizării acestor capacităŃi drept capacităŃi productive; a accepta idealizarea depinde de faptul de a crede că inferenŃa de la performanŃă finită la capacitate finită este justificată, sau a crede că performanŃa finită este în mod tipic rezultatul interacŃiunii unei competenŃe nelimitate cu constrângerile resurselor. Clasiciştii au oferit în mod tradiŃional un amestec de consideraŃii metodologice şi empirice în favoarea celei din urmă perspective.

Sub aspect metodologic, minimumul ce poate fi spus pentru a presupune productivitatea este că ea exclude soluŃii bazate pe stratageme necorespunzătoare (cum ar fi stocarea tuturor perechilor care definesc o funcŃie); stratageme care ar fi irealizabile practic chiar şi pentru rezolvarea unor sarcini finite, care impun solicitări suficient de mari memoriei. Idealizarea unei capacităŃi productive nelimitate forŃează teoreticianul să separe specificarea finită a unei metode de rezolvare a problemei computaŃionale de factori precum resursele pe care sistemul (sau persoana) le pune la dispoziŃia problemei în orice moment.

Argumentele empirice ale productivităŃii au fost cel mai adesea concepute în conexiune cu competenŃa lingvistică. Ele sunt familiare prin scrierile lui Chomsky (1968), care a afirmat (convingător, după părerea noastră) despre cunoaşterea ce stă la baza competenŃei lingvistice că este generativă - adică ne permite în principiu să generăm (/înŃelegem) un număr nelimitat de propoziŃii. Fără a spune că nimeni nu poate, sau n-ar putea de fapt să pronunŃe sau să înŃeleagă mai multe simboluri decât cele ale unui număr finit de propoziŃii; aceasta este o consecinŃă banală a faptului că nimeni nu poate să pronunŃe sau să înŃeleagă mai mult decât un număr finit de simboluri propoziŃionale. Dar există un număr de consideraŃii care sugerează că, în ciuda constrângerilor de facto impuse performanŃei, cunoştinŃele cuiva despre propriul limbaj sprijină o capacitate productivă nelimitată cam în acelaşi fel în care cunoştinŃele despre adunare susŃin un număr nelimitat de sume. Printre aceste consideraŃii este, de exemplu, şi faptul că performanŃa unui vorbitor ascultător poate fi îmbunătăŃită prin slăbirea constrângerilor temporale, creşterea motivaŃiei sau punerea la dispoziŃie de creion şi hârtie. Pare foarte natural să consideri că astfel de manipulări afectează starea tranzitorie a memoriei şi atenŃiei vorbitorului, mai degrabă decât cunoştinŃele sale despre - sau modul în care el îşi reprezintă - propriul limbaj. Dar acest mod de a vedea lucrurile este valabil doar pornind de la asumpŃia că natura performanŃei subiectului este determinată de interacŃiunea dintre baza de cunoştinŃe disponibile şi resursele computaŃionale disponibile.

Teoriile clasice sunt în stare să accepte aceste tipuri de consideraŃii, deoarece presupun arhitecturi în care există o distincŃie funcŃională între memorie şi

Conexionism şi arhitectură cognitivă: o analiză critică

30

program, ca, de exemplu, în cazul maşinii Turing. Prin contrast, într-un automat cu stări finite sau într-o maşină conexionistă, adăugarea unor elemente noi la memorie (de ex., prin adăugarea de noduri la o reŃea) duce la alterarea relaŃiilor de conectivitate dintre noduri şi astfel afectează structura computaŃională a maşinii. Arhitecturile cognitive conexioniste nu pot, prin însăşi natura lor, să susŃină o memorie expandabilă, deci nu pot susŃine nici capacităŃi cognitive productive. Rezultă că, dacă sunt luate în considerare argumentele productivităŃii, arhitectura psihicului nu poate fi de tip conexionist. Conexioniştii înşişi au recunoscut acest lucru; de aceea ei au fost forŃaŃi să respingă argumentele productivităŃii.

Testul unei bune idealizări ştiinŃifice este pur şi simplu faptul de a avea producŃii ştiintifice de succes pe termen lung. Ni se pare că idealizarea productivităŃii şi-a câştigat toate drepturile, în special în lingvistică şi în teoriile raŃionamentului. Conexioniştii, totuşi, nu au fost convinşi. De exemplu, Rumelhart şi McClelland (1986a, p.119) spun că “... nu suntem de acord că esenŃa procesării de informaŃie de către psihicul uman o reprezintă capacităŃile [productive]. Cum poate arăta oricine care a încercat vreodată să proceseze propoziŃii precum “The man the boy the girl hit kissed moved”, capacitatea noastră de a procesa chiar grade moderate de structuri imbricate (center-embedded structure) este puternic afectată relativ la un analizator ATN [Augmented Transition Network]... Ceea ce este necesar, deci, nu e un mecanism pentru procesarea fără imperfecŃiuni şi fără efort a construcŃiilor imbricate... Provocarea constă în a explica în ce fel acele procese pe care alŃii au ales să le explice în termeni de mecanisme recursive pot fi mai bine explicate de către acele tipuri de procese naturale pentru reŃelele PDP.”

Aceste remarci sugerează că Rumelhart şi McClelland consideră dificultatea propoziŃiilor imbricate drept un impediment pentru teoriile care văd capacităŃile lingvistice ca fiind productive. Dar bineînŃeles că nu este un impediment, atâta timp cât, în acord cu aceste teorii, performanŃa este un efect al interacŃiunilor între o competenŃă productivă şi resurse restrânse. Există, de fapt, demersuri clasice destul de plauzibile ce motivează de ce asemenea imbricări (center-embeddings) trebuie să impună anumite cerinŃe dificile resurselor, şi există o cantitate considerabilă de dovezi experimentale în sprijinul acestor modele (vezi, spre exemplu, Wanner & Maratsos, 1978).

În orice caz, ar trebui să fie clar că dificultatea de a analiza imbricările (center-embeddings) nu poate fi o consecinŃă a recursivităŃii lor per se, atâta timp cât există multe structuri recursive care sunt surprinzător de uşor de înŃeles. Să considerăm fraza: ”acesta este câinele care a fugărit pisica ce a mâncat şobolanul care a trăit în casa pe care a construit-o Jack.” Argumentul clasic în favoarea capacităŃilor productive de analiză se bazează pe transparenŃa unor propoziŃii de acest fel.23 Pe scurt, faptul că propoziŃiile imbricate (center embedded) sunt tari 23 McClelland şi Kawamoto (1986) discută acest tip de recursivitate pe scurt. Sugestia lor pare a fi ca în analiza unor astfel de propoziŃii recursive să se detecteze contextul local al expresiilor. O reprezentare de acest fel poate fi suficentă pentru a ne permite să reconstruim legăturile corecte ale substantivelor cu verbele şi prepoziŃiile din studiul substantivelor şi verbelor învecinate (p. 324; sublinierea ne aparŃine). Nu este însă nici pe departe adevărat că toate relaŃiile gramaticale relevante semantic, ce sunt uşor inteligibile în propoziŃiile imbricate, ar fi locale în structura de suprafaŃă. Să

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

31

indică probabil că există unele structuri recursive pe care nu le putem analiza. Dar ipoteza de care au nevoie Rumelhart şi McClelland pentru a nega productivitatea capacităŃilor lingvistice este aceea, mult mai tare, că nu există nici o structură recursivă pe care o putem analiza; iar această ipoteză mai tare ar apărea ca fiind pur şi simplu falsă. Cu toate acestea, discuŃia lui Rumelhart şi McClelland despre recursivitate (pp. 119-120) merită o atenŃie sporită. Ei par să fie pregătiŃi să admită că PDP-urile pot modela capacităŃi recursive numai indirect - adică, prin implementarea unor arhitecturi clasice cum ar fi ATN-urile; aşa încât, în cazul în care cunoaşterea umană ar prezenta capacităŃi recursive, aceasta ar fi suficient pentru a arăta că sistemele psihice au mai degrabă o arhitectură clasică decât una conexionistă. "Noi nu am continuat cu implementări PDP de maşini Turing şi motoare de procesare recursive, deoarece noi nu suntem de acord cu cei care argumentează că asemenea capacităŃi Ńin de esenŃa computaŃiei umane" (p.119, sublinierea noastră). Argumentul lor relativ la capacităŃile recursive care nu Ńin "de esenŃa computaŃiei umane" constă, oricum, numai din materialul neconvingător despre imbricare (center-embedding) citat mai sus. Aşa încât punctul de vedere al lui Rumelhart şi McClelland pare a fi acela că dacă presupunem ca fiind - în mod independent - evident faptul că unele capacităŃi cognitive sunt productive, atunci ar trebui să considerăm existenŃa acestor capacităŃi ca argument în favoarea arhitecturii cognitive clasice şi, deci, putem trata conexionismul ca, cel mult, o teorie implementaŃională. Credem că aceasta este o interpretare destul de plauzibilă a consecinŃelor pe care aspectele legate de productivitate şi recursivitate le au asupra problemelor arhitecturii cognitive; în secŃiunea 4 ne vom întoarce la sugestia că modelele conexioniste pot fi interpretate în mod plauzibil ca modele ale implementării arhitecturii clasice.

Între timp, oricum, propunem să punem în discuŃie statutul argumentelor productivităŃii în arhitecturile clasice; urmează să prezentăm un argument de tip diferit pentru ipoteza că reprezentările mentale necesită o structură internă articulată. Aceasta este puternic legată de argumentul productivităŃii, dar nu necesită idealizarea către o competenŃă nelimitată. Presupunerile ei ar trebui astfel să fie acceptabile chiar şi pentru teoreticieni care - ca şi conexioniştii - consideră caracterul finitistic (finitistic) al capacităŃilor cognitive intrinsec arhitecturii lor.

3.2 Sistematicitatea reprezentării cognitive Forma argumentului este aceasta: indiferent de natura realmente productivă

sau nonproductivă a capacităŃilor cognitive, pare indubitabil faptul că ele sunt ceea ce vom numi capacităŃi 'sistematice'. Şi vom vedea că sistematicitatea cunoaşterii

luăm în considerare propoziŃii de tipul "Unde a spus omul care are pisica ce a urmărit şobolanul care a speriat-o pe fată că urmează să se mute (X)?" sau "Ce a spus fata pe care copiii o ascultă cu plăcere că a promis prietenilor tăi că le va citi (X)?" Este de notat faptul că în asemenea exemple elementul de legătură (scris cu caractere italice) poate fi arbitrar mutat din poziŃia a cărei interpretare o controlează (marcată cu "X") fără a modifică sensul propoziŃiei.

Conexionism şi arhitectură cognitivă: o analiză critică

32

furnizează, la fel de bine ca şi productivitatea cunoaşterii, un motiv pentru postularea structurii combinatorice în reprezentarea mentală: se obŃine, ca efect, aceeaşi concluzie, dar pornind de la o premisă mai slabă. Cea mai uşoară cale de înŃelegere a ceea ce cuprinde sistematicitatea capacităŃilor cognitive este de a ne îndrepta atenŃia spre sistematicitatea înŃelegerii limbajului şi a producerii limbajului. De fapt, argumentul de sistematicitate pentru structurile combinatorice din gândire reiterează exact argumentul structuralist tradiŃional cu privire la structura constituentă a propoziŃiilor. Dar ne oprim acum cu remarcile asupra unui punct pe care îl vom trata mai amănunŃit mai tîrziu; capacitatea lingvistică este o paradigmă a cunoaşterii sistematice, dar este foarte improbabil că acesta este singurul exemplu. Din contră, există toate motivele să credem că sistematicitatea este o trăsătură universală profundă a gândirii umane şi infraumane. Când spunem despre capacităŃile lingvistice că sunt sistematice înŃelegem faptul că abilitatea de a produce/înŃelege unele propoziŃii este conectată intrinsec cu abilitatea de a produce/înŃelege alte propoziŃii. Puterea acestei conexiuni se poate vedea dacă se compară învăŃarea limbajelor în modul în care noi le învăŃăm efectiv, cu învăŃarea unui limbaj prin memorarea unui volum enorm de fraze. Chestiunea nu este că volumele de fraze sunt finite şi, ca urmare, permit specificarea exhaustivă doar a limbajelor non-productive; acest lucru e adevărat, dar noi ne-am propus să nu ne bazăm pe argumente de productivitate pentru scopurile noastre actuale. Părerea noastră e mai degrabă aceea că se poate învăŃa orice parte a unui volum de fraze fără învăŃarea restului. Astfel, în modelul volumului de fraze, ar fi perfect posibil să învăŃăm că pronunŃarea formei cuvintelor "Granny's cat is on Uncle Arthur's mat" [Pisica bunicii stă pe covoraşul unchiului Arthur] este modul de a spune (în limba engleză) că pisica bunicii stă pe covoraşul unchiului Arthur, şi totuşi să nu avem nici o idee despre cum să spunem că plouă (sau, în context, că pisica unchiului Arthur stă pe covoraşul bunicii). Probabil este de la sine înŃeles că scenariul cu volumul de fraze tratează greşit învăŃarea limbajelor, deoarece cunoştinŃele unui vorbitor despre limba sa maternă nu sunt niciodată de acest fel. De exemplu, nu vom găsi un vorbitor nativ care să ştie să spună (în engleză) că John o iubeşte pe fată, dar să nu ştie cum să spună (în engleză) că fata îl iubeşte pe John. Să observăm, în trecere, că sistematicitatea este o proprietate a stăpânirii sintaxei unui limbaj. Şi să ne imaginăm cum ar fi să înveŃi vocabularul limbii engleze aşa încât atunci când înveŃi vocabularul limbii engleze să dobândeşti o mulŃime de aptitudini fundamental independente. Aşa ai putea foarte bine să înveŃi că folosirea expresiei "cat" [pisică] este modul în care te referi la pisici şi, totuşi, să nu ai încă idee că folosind expresia "conifer foios" te referi la coniferele foioase. Sistematicitatea, ca şi productivitatea, este tipul de proprietate a aptitudinilor cognitive pe care ai putea s-o scapi din vedere dacă te concentrezi asupra psihologiei învăŃării şi a listelor de căutare. Există, aşa cum am remarcat, un argument direct (şi destul de tradiŃional) din partea sistematicităŃii capacităŃii lingvistice, în favoarea concluziei că

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

33

propoziŃiile trebuie să aibă o structură sintactică şi (una) semantică: dacă presupunem că propoziŃiile sunt formate din cuvinte şi expresii, şi că multe secvenŃe diferite de cuvinte pot fi expresii de acelaşi tip, faptul că o anumită formulare este o propoziŃie a limbajului va implica adesea că şi alte formulări trebuie să fie la fel: de fapt, sistematicitatea decurge din postularea structurii constituente. Să presupunem, de exemplu, că avem o regulă în limba engleză care spune că formulele cu structura constituentă 'NP Vt NP' sunt corect formate; considerăm că 'John' şi 'the girl' sunt NP-uri şi 'loves' este un Vt. Rezultă din aceste ipoteze că 'John loves the girl', 'the girl loves the girl' şi 'the girl loves John' trebuie să fie toate propoziŃii. Rezultă, de asemenea, că oricine îşi însuşeşte gramatica limbii engleze trebuie să aibă aptitudini lingvistice care sunt sistematice relativ la aceste propoziŃii; el nu poate decât să presupună că toate sunt propoziŃii dacă presupune că vreuna dintre ele este. Să comparăm această situaŃie cu cea în care toate propoziŃiile din limba engleză sunt atomice. Atunci nu există nici o analogie structurală între 'John loves the girl' şi 'the girl loves John' şi, deci, nici un motiv pentru care înŃelegerea unei propoziŃii să implice şi înŃelegerea celeilalte; nu mai mult decât înŃelegerea termenului 'iepure' implică înŃelegerea termenului 'copac'. 24 În ideea că propoziŃiile sunt atomice, sistematicitatea capacităŃilor lingvistice reprezintă un mister; în ideea că acestea au o structură constituentă, sistematicitatea capacităŃilor lingviste este exact acel lucru la care ne-am aştepta. Deci ar trebui să preferăm ultima variantă. ObservaŃi că acest argument pentru o structură constituentă a propoziŃiei poate fi adus fără a fi necesară idealizarea unor aptitudini computaŃionale astronomice. Există argumente de productivitate pentru structura constituentă, dar ele sunt în legătură cu abilitatea noastră - în principiu - de a înŃelege propoziŃii de lungime arbitrară. Sistematicitatea, prin contrast, apelează la premise mult mai familiare, cum ar fi consideraŃii ca cele menŃionate anterior, că nici un vorbitor nu înŃelege grupul de cuvinte 'John loves the girl' dacă nu înŃelege şi grupul de cuvinte 'the girl loves John'. Presupunerea că aptitudinile lingvistice sunt "în principiu" productive este una pe care un conexionist ar putea să refuze s-o garanteze. Dar că acestea sunt sistematice de fapt nimeni nu poate nega în mod convingător. Putem acum, în sfârşit, să ajungem la ideea principală: argumentul adus de sistematicitatea capacităŃilor lingvistice în favoarea structurii constituente a propoziŃiei este destul de clar. Dar şi gândirea este sistematică la rândul ei, deci există un argument exact paralel adus de sistematicitatea gândirii în favoarea structurii sintactice şi semantice a reprezentărilor mentale. Ce înŃelegem atunci când spunem că gândirea e sistematică? Ei bine, la fel cum nu puteŃi găsi oameni care să poată înŃelege propoziŃia 'John loves the girl' dar nu şi 'the girl loves John', nu veŃi găsi oameni care gândesc că John o iubeşte pe fată, dar care nu pot gîndi că fata îl iubeşte pe John. Într-adevăr, în cazul

24 Vezi Pinker (1984, Capitolul 4) pentru dovezi despre faptul că …niciodată copiii nu trec printr-o etapă în care fac distincŃie între structurile interne ale NP-urilor în funcŃie de poziŃia acestora (subiect sau obiect); dialectele pe care le vorbesc copiii sunt întotdeauna sistematice în raport cu structurile sintactice care apar...

Conexionism şi arhitectură cognitivă: o analiză critică

34

organismelor verbale sistematicitatea gândirii rezultă din sistematicitatea limbajului, dacă presupunem - ca cei mai mulŃi psihologi - că înŃelegerea unei propoziŃii presupune asmiliarea ideii pe care aceasta o exprimă; pe baza acestei presupuneri, nimeni nu ar putea înŃelege ambele propoziŃii despre John şi fată dacă n-ar fi capabil să gândească ambele afirmaŃii despre John şi fată. Dar dacă abilitatea de a gândi că John o iubeşte pe fată este intrinsec legată de abilitatea de a gândi că fata îl iubeşte pe John, acest fapt ar trebui cumva explicat. Pentru un reprezentaŃionalist (cum, aşa cum am văzut, sunt conexioniştii) explicaŃia este evidentă: abordarea gândurilor necesită ca acestea să fie în stări reprezentaŃionale (adică, necesită reprezentări mentale simbolice). Şi, la fel cum sistematicitatea limbajului arată că trebuie să existe relaŃii structurale între propoziŃia 'John loves the girl' şi propoziŃia 'The girl loves John', la fel arată sistematicitatea gândirii că trebuie să existe relaŃii structurale între reprezentarea mentală care corespunde gândului că John o iubeşte pe fată şi reprezentarea mentală care corespunde gândului că fata îl iubeşte pe John;25 şi anume, cele două reprezentări mentale, ca şi cele două propoziŃii, trebuie să fie construite din aceleaşi părŃi componente. Dar dacă această explicaŃie e corectă, (şi nu par a fi şi altele disponibile), atunci reprezentările mentale au o structură internă şi există un limbaj al gândirii. Atunci arhitectura minŃii nu este o reŃea conexionistă. 26

Pentru a rezuma discuŃia de până acum: argumentele productivităŃii deduc structura internă a reprezentărilor mentale din presupunerea faptului că nimeni nu are o competenŃă intelectuală finită. Prin contrast, argumentele sistematicităŃii deduc structura internă a reprezentărilor mentale din faptul evident că nimeni nu are o competenŃă intelectuală punctată (punctate). Aşa cum nu găsiŃi aptitudini lingvistice care să consiste din abilitatea de a înŃelege şaizecişişapte de propoziŃii

25 Ar putea fi util să subliniem cum complexitatea structurală a reprezentării mentale nu este aceeaşi cu şi nu decurge din complexitatea structurală a conŃinutului său propoziŃional (adică ceea ce numim "gândul care îi trece cuiva prin minte"). Atunci, conexioniştii şi clasiciştii pot stabili că sunt de acord asupra faptului că ideea că P&Q este complexă (şi conŃine ideea că P) în timp ce pot stabili că nu sunt de acord că reprezentările mentale au structura sintactică internă. 26 Aceste consideraŃii pun într-o nouă lumină o propunere pe care am discutat-o în secŃiunea 2. Presupunem că reprezentarea mentală corespondentă gândului că John o iubeşte pe fată este vectorul caracteristic {+ John-subject; +loves; +the-girl-object} unde 'John-subject' şi 'the-girl-object' sunt caracteristici atomice; astfel acestea nu dau naştere la mai multe relaŃii structurale între 'John-subject' şi 'the-girl-object' decât o fac între ele sau decât în raport cu, să zicem, "has-a-handle" [are-un-mâner]. De vreme ce această teorie nu recunoaşte relaŃii structurale între 'John-subject' şi 'John-object', nu oferă motive ca un sistem reprezentaŃional care deŃine mijloacele de a exprima unul dintre aceste concepte, ar trebui să furnizeze şi mijloacele de exprimare ale celuilalt. Această tratare a relaŃiilor dintre roluri face atunci un mister din faptul (presupus) că oricine care poate procesa ideea că John o iubeşte pe fată poate, de asemenea, procesa ideea că fata îl iubeşte pe John (şi, mutatis mutandis, că orice limbaj natural care poate exprima propoziŃia că John o iubeşte pe fată poate exprima şi propoziŃia că fata îl iubeşte pe John). ConsecinŃa propunerii ca relaŃiile de rol să fie tratate de "descriptori specifici rolului care reprezintă conjuncŃia unei identităŃi cu un rol" (Hinton, 1987) oferă un exemplu particular evident despre modul în care eşecul de a postula structura internă a reprezentărilor mentale duce la eşecul în surprinderea sistematicităŃii sistemelor reprezentaŃionale.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

35

fără legătură între ele, la fel nu veŃi găsi capacităŃi cognitive care să consiste în abilitatea de a gândi şaptezecişipatru de idei diferite. Noi afirmăm că nu este, în nici un caz, un accident: o teorie lingvistică care a admis posibilitatea limbajelor punctate nu s-ar fi dovedit doar greşită ci profund greşită. Fapt similar şi pentru o teorie cognitivă care ar admite posibilitatea unor sisteme psihice punctate. Dar probabil proprietatea de a nu fi punctate este caracteristică numai sistemelor psihice ale celor care folosesc limbajul; oare capacităŃile reprezentaŃionale ale organismelor infraverbale au acelaşi fel de lacune ca şi cele permise de modelele conexioniste? Un conexionist ar putea atunci să afirme că poate face totul "până la limbaj" pe baza presupunerii că reprezentările mentale sunt lipsite de structură combinatorică sintactică şi semantică. Totul până la limbaj poate să nu fie tot, dar este mult. (Pe de altă parte, mult poate fi mult, dar nu este tot. Arhitectura cognitivă infraverbală nu trebuie reprezentată astfel încât achiziŃia ulterioară a limbajului în filogenie şi ontogenie să necesite un miracol.) Nu este plauzibil, oricum, ca doar sistemele psihice verbale să fie sistematice. GândiŃi-vă ce ar însemna aceasta. Ar fi ceva destul de obişnuit să găsim animale capabile să reprezinte starea aRb, dar incapabile să reprezinte starea bRa. Astfel de animale ar fi receptive la aRb dar nu şi la bRa, de vreme ce, probabil, capacităŃile de reprezentare ale minŃii lor afectează nu numai ceea ce poate gândi un organism, dar şi ceea ce acesta poate percepe. În consecinŃă, astfel de animale ar fi capabile să înveŃe să răspundă selectiv la situaŃiile aRb, dar incapabile să înveŃe să răspundă selectiv la situaŃii bRa. (Astfel că, deşi aŃi putea învăŃa creatura să aleagă imaginea cu pătratul mai mare decât triunghiul, nu aŃi putea să o învăŃaŃi, chiar dacă aŃi încerca toată viaŃa, să o faceŃi să aleagă imaginea cu triunghiul mai mare decât pătratul.)

Dacă aşa sunt structurate adesea capacităŃile cognitive ale organismelor infraverbale este, desigur, o problemă empirică, dar noi suntem pregătiŃi să pariem că nu e aşa. Cazurile etologice sunt excepŃiile care probează regula. Există exemple unde configuraŃii remarcabile de mediu reacŃionează ca "gestalten": în astfel de cazuri e rezonabil să ne îndoim că reprezentarea mentală a stimulului e complexă. Dar ideea este exact aceea că astfel de cazuri sunt excepŃionale; sunt exact acele cazuri de la care te-ai aştepta să afli ceva special despre semnificaŃia ecologică a stimulului: aceasta este forma unui răpitor, sau cîntecul unui conspecific... etc. Invers, atunci când nu e nimic special de aflat, aştepŃi ca stimuli similari din punct de vedere structural să solicite în mod corespunzător capacităŃi cognitive similare. Acesta, cu siguranŃă, este ultimul lucru pe care ar trebui să-l necesite un principiu respectabil al generalizării stimulului. Faptul că, în general, cogniŃia infraverbală e destul de sistematică pare a fi, pe scurt, la fel de sigur pe cât poate fi o premisă empirică în acest domeniu. Şi, aşa cum tocmai am văzut, e o premisă din care inadecvarea modelelor cognitive ca teorii cognitive decurge destul de direct; la fel de direct, în orice caz, cum ar decurge din afirmaŃia că astfel de capacităŃi sunt în general productive.

Conexionism şi arhitectură cognitivă: o analiză critică

36

3.3. CompoziŃionalitatea reprezentărilor CompoziŃionalitatea este în relaŃie apropiată cu sistematicitatea; poate că

ele sunt cel mai bine privite ca aspecte ale aceluiaşi fenomen. Vom urma, deci, un curs foarte asemănător cu cel din discuŃia anterioară: mai întâi vom introduce conceptul, reamintind argumentele standard în favoarea compoziŃionalităŃii limbajelor naturale. Vom sugera apoi că argumente paralelele garantează compoziŃionalitatea reprezentărilor mentale. Dacă compoziŃionalitatea are nevoie de structuri sintactice şi semantice combinatorice, compoziŃionalitatea gândirii este dovada că psihicul nu este o reŃea conexionistă. Am afirmat că sistematicitatea competenŃei lingvistice consistă în faptul că "abilitatea de a produce/înŃelege unele dintre propoziŃii este intrinsec legată de abilitatea de a produce/înŃelege unele dintre celelalte". Adăugăm acum că dintr-un punct de vedere semantic, nu este arbitrar care anume dintre propoziŃii sunt legate sistematic. De exemplu, capacitatea de a înŃelege că "John loves the girl" merge împreună cu capacitatea de a înŃelege că "The girl loves John", şi există în mod corespunzător strânse relaŃii semantice între aceste două propoziŃii: pentru ca prima să fie adevărată, John trebuie să fie faŃă de fată în aceeaşi relaŃie pe care adevărul celei de-a doua o impune fetei faŃă de John. Prin contrast, nu există nici o legătură intrinsecă între înŃelegerea vreuneia dintre propoziŃiile referitoare la John/fată şi înŃelegerea unor formulări nelegate semantic cum ar fi "quarks are made of gluons" [quarcurile sunt compuse din gluoni] sau "the cat is on the mat" [pisica este pe covoraş] sau "2+2=4"; se pare că, totuşi, înrudirea semantică şi sistematicitatea se regăsesc adesea împreună. AŃi putea presupune că această covarianŃă e acoperită de aceeaşi explicaŃie ca şi sistematicitatea per se; în mare, aceea că propoziŃiile care sunt legate sistematic sunt compuse din aceiaşi constituenŃi sintactici. Dar, de fapt, veŃi avea nevoie de o presupunere suplimentară, pe care o vom numi "principiul compoziŃionalităŃii": atâta timp cât un limbaj e sistematic, un element lexical trebuie să aibă aproximativ aceeaşi contribuŃie semantică la fiecare expresie în care apare. De exemplu, numai atâta timp cât "the" "girl", "loves" şi "John" au aceeaşi contribuŃie semantică la "John loves the girl" cât şi la "The girl loves John", înŃelegerea uneia dintre propoziŃii implică şi înŃelegerea celeilalte. Similaritatea structurii constituente sprijină înrudirea semantică dintre propoziŃiile legate sistematic numai în măsura în care proprietăŃile semantice ale constituenŃilor comuni sunt independente de context. Iată expresii care demonstrează regula: capacitatea de a înŃelege termenii "the", "man" [bărbat], "kicked" [a lovit cu piciorul] şi "bucket" [găleată] nu e de mare ajutor în înŃelegerea expresiei "the man kicked the bucket" [bărbatul a murit], de vreme ce "kicked" şi "bucket" nu au semnificaŃiile lor obişnuite în acest context. Şi, exact cum v-aŃi aştepta, "the man kicked the bucket" nu e sistematică nici chiar în raport cu propoziŃii apropiate sintactic ca "the man kicked over the bucket" (din acest motiv, nu e sistematică nici în raport cu "the man kicked the bucket", citită literal).

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

37

Nu se ştie exact cât de compoziŃionale sunt de fapt limbajele naturale (la fel cum nu se ştie exact cât de sistematice sunt). Noi bănuim că mărimea variaŃiei introduse de context a semnificaŃiei lexicale este adesea supraestimată din cauza altor tipuri de senzitivitate contextuală care sunt greşit construite ca violări ale compoziŃionalităŃii. De exemplu, diferenŃa dintre "feed the chicken" [a hrăni puii] şi "chicken to eat" [(carne de) pui pentru mâncare] implică o ambiguitate animal/hrană la nivelul lui "chicken", mai degrabă decât o violare a compoziŃionalităŃii, de vreme ce, dacă contextul "feed the ..." ar induce (mai degrabă decât ar selecta) semnificaŃia de animal, v-aŃi aştepta la propoziŃii de genul 'feed the veal' [a hrăni carnea de viŃel] sau 'feed the pork' [a hrăni carnea de porc].27 Similar, diferenŃa dintre 'good book' [carte bună], 'good rest' [odihnă bună] şi 'good fight' [luptă, bătaie bună] are probabil nu semnificaŃia de schimbare, ci de sincategorematicitate (syncategorematicity). 'Good NP' [noun phrase-substantiv] înseamnă ceva de genul NP care răspunde interesului nostru faŃă de NP-uri: o carte bună este una care răspunde nevoii noastre de cărŃi (cu alte cuvinte, e bună de citit); o odihnă bună este una care răspunde nevoii noastre de odihnă (cu alte cuvinte, te reface); o bătaie bună este una care răspunde nevoii noastre de bătăi (cu alte cuvinte, e distractiv s-o priveşti sau să participi la ea, sau descarcă atmosfera); şi aşa mai departe. Asta deoarece semnificaŃia lui 'good' este sincategorematică şi conŃine o variabilă pentru interese relevante, astfel încât ne putem da seama că un flurg bun este un flurg care răspunde interesului nostru în flurg i fără ca să ştim ce sunt flurg ii sau care este interesul faŃă de aceştia. (vezi Ziff, 1960). În orice caz, principalul argument este: sistematicitatea depinde de compoziŃionalitate, astfel încât în măsura în care un limbaj natural este sistematic el trebuie să fie, de asemenea, compoziŃional. Aceasta ilustrează un alt aspect în care argumentele sistematicităŃii pot înlocui argumentele productivităŃii. Argumentul tradiŃional în favoarea compoziŃionalităŃii este că aceasta e necesară pentru a explica cum un limbaj reprezentabil finit poate conŃine un număr infinit de expresii nesinonime. ConsideraŃiile asupra sistematicităŃii oferă un argument pentru compoziŃionalitate; consideraŃiile de determinare oferă un altul. Să considerăm predicate ca '...it's a brown cow' [este o vacă maro]. Această expresie dă naştere la o relaŃie semantică directă între predicatele '... is a cow' [este o vacă] şi '... is brown' [este maro]; cu alte cuvinte, primul predicat este adevărat despre un anumit obiect dacă şi numai dacă următoarele predicate sunt ambele adevărate. Adică, '... is a brown cow' determină simultan '... is brown' şi '... is a cow' şi e determinată de conjuncŃia acestora. În plus - şi asta e important - modelul semantic nu e caracteristic cazurilor citate. Din contră, e valabil pentru un mare număr de predicate (vezi '... is a red square' [este un pătrat roşu], '...is a funny old German soldier' [este un soldat german bătrân şi caraghios], '...is a child prodigy' [este o minune de copil]; şi aşa mai departe). Cum am putea califica aceste tipuri de regularităŃi? Răspunsul pare destul de clar: '...is a brown cow' implică '...is brown' deoarece (a) a doua expresie e un 27 Îi sîntem datori lui Steve Pinker pentru această idee.

Conexionism şi arhitectură cognitivă: o analiză critică

38

element constituent al primeia; (b) formularea sintactică '(adjectiv substantiv)' are (în multe cazuri) forŃa semantică a unei conjuncŃii, şi (c) 'brown' îşi impune valoarea sa semantică în urma simplificării conjuncŃiei. Observăm că avem nevoie de (c) pentru a elimina posibilitatea ca 'brown' să însemne maro când e legat de un substantiv, dar să însemne mort când e un adjectiv predicativ; în care caz '... it's a brown cow' nu ar implica deloc că '...is brown'. Să observăm şi că (c) este doar un caz particular al principiului compoziŃiei. Deci, ideea de până acum este următoarea: trebuie să presupunem un anume grad de compoziŃionalitate a propoziŃiilor din limba engleză, ca răspuns la faptul că propoziŃiile înrudite sistematic sunt întotdeauna înrudite semantic; şi ca răspuns la un anume paralelism regulat între structura sintactică a propoziŃiilor şi semnificaŃiile lor. Deci, în afara oricărei îndoieli serioase, propoziŃiile din limba engleză trebuie să fie într-o mare măsură compoziŃionale. Dar principiul compoziŃionalităŃii guvernează relaŃiile semantice dintre cuvinte şi expresiile constituite cu ajutorul acestora. Deci, compoziŃionalitatea implică faptul că (anumite) expresii au constituenŃi. Deci, compoziŃionalitatea aduce argumente pentru o structură sintactică/semantică (caracteristică, se presupune) a propoziŃiilor. Dar ce putem spune despre compoziŃionalitatea proceselor mentale? Există, aşa cum vă aşteptaŃi, un argument corelativ bazat pe presupunerea psiholingvistică uzuală că limbajul este folosit pentru exprimarea gândurilor: propoziŃiile sunt folosite pentru a exprima gândurile cuiva; deci, dacă abilitatea cuiva de a folosi anumite propoziŃii este legată de abilitatea de a le folosi pe altele, înrudite semantic cu acestea, atunci abilitatea gândirii unor idei trebuie să fie conectată corespunzător cu abilitatea de gândire a altora, legate semantic de acestea. Dar nu puteŃi gândi decât ideile pe care reprezentarea dumneavoastră mentală le poate exprima. Deci, dacă abilitatea de a gândi anumite idei e interconectată, atunci capacităŃile de reprezentare corespunzătoare trebuie să fie, de asemenea, interconectate; şi anume, capacitatea situării în anumite stări reprezentaŃionale trebuie să implice abilitatea situării în alte stări reprezentaŃionale, înrudite semantic cu acestea. Dar atunci apare următoarea problemă: cum poate să fie alcătuit psihicul astfel încât abilitatea de a fi într-o stare reprezentaŃională să fie legată de abilitatea de a fi în altele, alăturate semantic acesteia? Ce consecinŃă va avea aceasta asupra reprezentării mentale? Răspunsul este exact cel pe care l-aŃi aştepta de la discuŃia asupra materialului lingvistic. Reprezentările mentale trebuie să aibă structuri interne, la fel cum au propoziŃiile. În particular, trebuie ca reprezentarea mentală care corespunde gândului că John o iubeşte pe fată să aibă ca părŃi componente aceiaşi constituenŃi ca şi gândul că fata îl iubeşte pe John. Aceasta ar explica de ce aceste gânduri sunt legate sistematic; şi, în măsura în care valoarea semantică a acestor părŃi componente este independentă de context, aceasta ar putea explica de ce aceste gânduri legate sistematic sunt de asemenea legate semantic. Deci, urmând acest fir al argumentaŃiei, dovada pentru compoziŃionalitatea propoziŃiilor este o dovadă pentru compoziŃionalitatea stărilor reprezentative ale ascultătorilor vorbitorului.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

39

În sfârşit, ce putem spune despre compoziŃionalitatea gândirii infraverbale? Argumentele nu sunt prea diferite de cele pe care tocmai le-am trecut în revistă. Noi presupunem că gândirea animală e puternic sistematică: organismele care pot percepe (deci învăŃa) că aRb pot în general să perceapă (/înveŃe) că bRa. Dar, gândurile înrudite sistematic (ca şi propoziŃiile înrudite sistematic) sunt în general şi înrudite semantic. Nu e o surpriză că faptul de a fi capabil să înveŃi că triunghiul e situat deasupra pătratului implică şi capacitatea de a învăŃa că pătratul e deasupra triunghiului; pe de altă parte, ar fi foarte surprinzător ca abilitatea de a învăŃa situaŃiile pătrat/triunghi să implice abilitatea de a învăŃa că quarcurile sunt compuse din gluoni sau că Washington a fost primul preşedinte al Americii.

Există, deci, o corelaŃie între relaŃiile sistematice şi cele semantice în gândirea infraverbală? În mod clar, modelele conexioniste nu-şi pun această întrebare; faptul că o reŃea conŃine un nod etichetat cu X nu are, în ceea ce priveşte constrângerile impuse de arhitectura conexionistă, nici o implicaŃie asupra etichetărilor celorlalte noduri din reŃea; în particular, nu implică faptul că vor exista noduri care reprezintă gânduri apropiate semantic de X. Acesta este doar aspectul semantic al faptului că arhitecturile de tip reŃea permit vieŃi mentale arbitrar punctate. Dar dacă, pe de altă parte, pornim de la presupunerea obişnuită clasicistă (cu alte cuvinte, aceea că gândurile înrudite sistematic au constituenŃi comuni şi că valorile semantice ale acestor constituenŃi sunt independente de context) corelaŃia dintre sistematicitate şi înrudire semantică este imediată. Pentru un clasicist, această corelaŃie e o proprietate 'arhitecturală' a sistemelor psihice, ce nu poate decât să susŃină că reprezentările mentale au proprietăŃile generale presupuse de modelele clasice. Ce au conexioniştii de spus în legătură cu aceste chestiuni? Există unele dovezi textuale că ei sunt tentaŃi să nege în bloc argumentele compoziŃionalităŃii. De exemplu, Smolensky (1988) afirmă: "Cu siguranŃă... am obŃine o reprezentare destul de diferită a termenului 'coffee' [cafea] dacă am examina diferenŃa dintre 'can with coffee' [cutie cu cafea] şi 'can without coffee' [cutie fără cafea] sau 'tree with coffee' [arbore cu cafea] şi 'tree without coffee' [arbore fără cafea]; sau dintre 'man with coffee' [om cu cafea] şi 'man without coffee' [om fără cafea] ... insenzitivitatea faŃă de context nu e ceva care ne-am aştepta să fie oglindit în reprezentările conexioniste...". Este adevărat, compoziŃionalitatea nu e în general o caracteristică a reprezentărilor conexioniste. Conexioniştii nu pot asimila realităŃile compoziŃionalităŃii, deoarece ei presupun reprezentări mentale care nu au o structură combinatorică. Dar renunŃarea la compoziŃionalitate este ca şi cum am considera 'kick the bucket' ca model pentru relaŃia dintre sintaxă şi semantică, iar consecinŃa ar fi, aşa cum am văzut, că sistematicitatea limbajului (şi a gândirii) devine un mister. Pe de altă parte, a spune că 'kick the bucket' e aberant, şi că modelul corect pentru relaŃia sintaxă/semantică este (de exemplu) 'brown cow', înseamnă a te lansa într-o încercare care conduce, destul de inevitabil, la asimilarea

Conexionism şi arhitectură cognitivă: o analiză critică

40

structurii combinatorice a reprezentărilor mentale, deci la respingerea faptului că reŃelele conexioniste sunt modele cognitive. Nu credem că asimilarea compoziŃionalităŃii limbajelor naturale şi a reprezentărilor mentale poate fi evitată. Oricum, s-a sugerat (vezi Smolensky, op cit.) că, dacă principiul compoziŃionalităŃii e fals (deoarece conŃinutul nu este invariant faŃă de context), nu există, cu toate acestea, o "asemănare familială" între diferitele semnificaŃii pe care un simbol le are în contextele diferite în care apare. Dat fiind că astfel de propuneri nu sunt în general elaborate, nu este clar modul în care vor trata realităŃile pregnante despre sistematicitate şi inferenŃă. Dar cu siguranŃă vor apărea probleme serioase. Să considerăm, de exemplu, nişte inferenŃe de genul: (i) łestoasele sunt mai lente decât iepurii. (ii) Iepurii sunt mai lenŃi decât Ferrari-urile. ....... (iii)łestoasele sunt mai lente decât Ferrari-urile. Soliditatea acestei inferenŃe pare să depindă de (a) faptul că aceeaşi relaŃie (cu alte cuvinte, slower than [mai lent decât]) leagă, pe de o parte, Ńestoasele de iepuri şi, pe de altă parte, iepurii de Ferrari-uri; şi de (b) faptul că această relaŃie e tranzitivă. Dacă, totuşi, se presupune (contrar principiului compoziŃionalităŃii) că 'mai lent decât' are o semnificaŃie diferită în premisele (i) şi (ii) (şi probabil şi în (iii)) - astfel încât, strict vorbind, relaŃia care leagă Ńestoasele de iepuri nu e aceeaşi cu cea care leagă iepurii de Ferrari-uri - atunci e greu de văzut de ce ar fi validă inferenŃa. DiscuŃia despre 'similaritatea' relaŃiilor tapetează numai dificultăŃile, de vreme ce problema devine stabilirea unei noŃiuni de similaritate care va garanta că dacă (i) şi (ii) sunt adevărate, atunci şi (iii) este adevărată. Şi, cel puŃin până acum, n-a apărut nici o astfel de noŃiune de similaritate. Să observăm că n-ar fi de ajuns doar să cerem ca toate relaŃiile să fie similare relativ la tranzitivitatea lor, adică, să fie toate tranzitive. Pe baza acestui fapt, inferenŃa de la 'Ńestoasele sunt mai lente decât iepurii' şi 'iepurii sunt mai îmblăniŃi decât Ferrari-urile' la 'Ńestoasele sunt mai lente decât Ferrari-urile' ar fi validă dacă 'mai îmblănit' ar fi şi el tranzitiv. Atâta timp cât ne vom lovi de acest gen de probleme, propunerea de a înlocui principiul compoziŃional al invarianŃei de context cu o noŃiune de "aproximare a echivalenŃei...între contexte"(Smolensky, 1988) pare a nu fi decât un gest gratuit.

3.4. Sistematicitatea inferenŃei În capitolul 2 am văzut că, în concordanŃă cu teoriile clasice, sintaxa

reprezentărilor mentale se interpune între proprietăŃile lor semantice şi rolul lor cauzal în procesele mentale. Să luăm un caz simplu: e un principiu 'logic' acela că, conjuncŃiile îşi determină constituenŃii (deci din P&Q se deduc şi P şi Q). Corespunzător, există o lege psihologică care spune că ideea că P&Q tinde să

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

41

conducă la ideea că P şi la ideea că Q, toate celelalte fiind egale. Teoria clasică cercetează structura constituentă a reprezentărilor mentale astfel încât să Ńină cont de ambele lucruri, de primul, presupunând că semantica de tip combinatoric a reprezentărilor mentale e senzitivă la sintaxa acestora, iar de al doilea, presupunând că procesele mentale se aplică reprezentărilor mentale în virtutea structurii lor constituente. O consecinŃă a acestor presupuneri este că teoriile clasice duc la următoarea afirmaŃie frapantă: inferenŃele care sunt de tip logic similar ar trebui, în general,28 să extragă în mod corespunzător capacităŃi cognitive similare. N-ar trebui, de exemplu, să găsiŃi vreun tip de viaŃă mentală în care să aveŃi inferenŃe de la P&Q&R la P, dar să nu aveŃi inferenŃe de la P&Q la P. Aceasta pentru că, în concordanŃă cu părerea clasică, această clasă omogenă logic de inferenŃe este rezultatul unei clase omogene corespunzătoare de mecanisme psihologice: premisele ambelor inferenŃe sunt exprimate prin reprezentări mentale care satisfac aceeaşi analiză sintactică (adică, S1&S2&S3&... SN); iar procesele de trasare a inferenŃei corespund, în ambele cazuri, aceleiaşi operaŃii formale de detaşare a constituentului care exprimă concluzia. Ideea că organismele ar trebui să prezinte capacităŃi cognitive similare relativ la inferenŃe logice similare este atât de naturală încât ar putea părea inevitabilă. Dar, dimpotrivă: nu ne împiedică nimic, în principiu, să excludem un gen de model cognitiv, în care inferenŃele care sunt destul de asemănătoare din punctul de vedere al logicianului să fie cu toate acestea realizate de mecanisme destul de diferite; sau în care unele inferenŃe de un anume tip logic să fie realizate, iar alte inferenŃe de acelaşi tip să nu fie. Să considerăm, în particular, punctul de vedere conexionist. Un conexionist poate cu siguranŃă să modeleze o viaŃă mentală în care, dacă poŃi raŃiona de la P&Q&R la P, atunci poŃi raŃiona şi de la P&Q la P. De exemplu, aşa face reŃeaua din (Figura 3):

Fig. 3. O posibilă reŃea conecŃionistă care trasează inferenŃe

de la P&Q&R la P şi, de asemenea, de la P&Q la P.

28 Legătura se presupune că exclude cazurile în care inferenŃe de acelaşi tip logic pot totuşi să difere la nivel de complexitate în virtutea, de exemplu, a lungimii premiselor lor. InferenŃa de la (AvBvCvDvE) şi (-B&-C&-D&-E) la A este de acelaşi tip logic ca şi inferenŃa de la AvB şi -B la A. Dar n-ar fi foarte surprinzător, sau foarte interesant, dacă ar exista sisteme psihice care să poată trata cea de-a doua inferenŃă, dar nu şi pe prima.

2

P

P&Q

P&Q&R

Q

R3

54

Conexionism şi arhitectură cognitivă: o analiză critică

42

Dar observaŃi că un conexionist poate la fel de bine modela o viaŃă mentală în care se obŃine una din aceste inferenŃe, dar nu şi o alta. În cazul de faŃă, dat fiind că nu există o relaŃie structurală între nodul P&Q&P şi nodul P&Q (să ne reamintim că toate nodurile sunt atomice; nu vă lăsaŃi induşi în eroare de etichetările nodurilor), nu există nici un motiv pentru care un sistem psihic care o conŃine pe una trebuie să o conŃină şi pe a doua, sau vice versa. Prin analogie, nu există nici un motiv pentru care să nu poŃi obŃine sisteme psihice care simplifică premisa “John o iubeşte pe Mary şi Bill o urăşte pe Mary”, dar nu şi alte premise; sau care simplifică premise cu 1, 3 sau 5 conjuncŃii, dar nu simplifică şi premise cu 2, 4 sau 6 conjuncŃii; sau care simplifică doar premise care au fost însuşite marŃi ... etc.

De fapt, arhitectura conexionistă este absolut indiferentă la aceste posibilităŃi. Aceasta fiindcă nu recunoaşte nici o noŃiune de sintaxă potrivit căreia idei cu rol inferenŃial asemănător (de ex. idei care sunt toate subiecte ale simplificării conjuncŃiei) sunt exprimate prin reprezentări mentale ale unei forme sintactice similare corespunzătoare (de ex. prin reprezentări mentale care sunt toate conjunctive sintactic). Deci, arhitectura conexionistă tolerează lacune în capacităŃile cognitive; nu are un mecanism care să impună necesitatea ca inferenŃele logic omogene să fie executate prin procese de calcul omogene corespunzătoare.

Dar noi susŃinem că nu găsiŃi capacităŃi cognitive care au acest gen de lacune. De ex., nu găsiŃi sisteme psihice care să deducă John went to the store [John a mers la magazin] din John and Mary and Susan and Sally went to the store [John şi Mary şi Susan şi Sally au mers la magazin] şi din John and Mary went to the store [John şi Mary au mers la magazin], dar nu şi din John and Mary and Susan went to the store [John şi Mary şi Susan au mers la magazin]. Fiind dată o noŃiune de sintaxă logică - chiar acea noŃiune necesară teoriei clasice a gândirii pentru a se urni din loc în abordarea proceselor mentale - este un truism faptul că nu găseşti asemenea sisteme psihice. În absenŃa unei noŃiuni de sintaxă logică, este un mister faptul că nu le găseşti.

3.5. Rezumat Probabil că în momentul de faŃă este evident că toate argumentele pe care

le-am trecut în revistă - argumentul de sistematicitate, argumentul de compoziŃionalitate şi argumentul de coerenŃă inferenŃială - sunt în mare parte la fel: dacă susŃineŃi acel gen de teorie care acceptă reprezentările structurate, aceasta trebuie neapărat să accepte reprezentări cu structuri similare sau identice. În cazurile lingvistice, analiza constituentă implică o taxonomie a propoziŃiilor pe baza formei lor sintactice, iar în cazurile inferenŃiale, implică o taxonomie a argumentelor pe baza formei lor logice. Deci, dacă teoria voastră acceptă şi procesele mentale care sunt sensibile la structură, atunci aceasta va prezice că reprezentări similar structurate vor avea în general roluri similare în gândire. O teorie care spune că propoziŃia “John loves the girl” este formată din aceleaşi componente, şi prin aplicarea aceloraşi reguli de compunere, ca şi propoziŃia “the girl loves John”, va trebui să se dea peste cap pentru a explica o competenŃă lingvistică ce acceptă una, dar nu şi pe cealaltă din propoziŃii. În mod similar, dacă

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

43

o teorie spune că reprezentarea mentală care corespunde raŃionamentului P&Q&P are aceeaşi sintaxă (conjunctivă) ca şi reprezentarea mentală care corespunde raŃionamentului P&Q, şi că procesele mentale de deducŃie includ reprezentări mentale în virtutea sintaxei lor, această teorie va trebui să se dea peste cap pentru a explica acele capacităŃi deductive care acceptă un raŃionament, dar nu şi pe celălalt. O asemenea competenŃă ar fi în cel mai bun caz un neajuns pentru teorie, iar în cel mai rău caz, un motiv pentru a o refuta.

Dimpotrivă, de vreme ce arhitectura conexionistă nu recunoaşte structuri combinatorice în reprezentările mentale, lipsurile din competenŃa cognitivă ar trebui să prolifereze în mod arbitrar. Nu numai că te-ai aştepta să le găseşti din când în când; dar în povestea “fără-structură”, lacunele sunt cazul nespecific/neremarcat. Teoria trebuie să trateze competenŃa sistematică drept piedică. Dar, de fapt, competenŃele inferenŃiale sunt ostentativ sistematice. Deci, trebuie să fie ceva în neregulă cu arhitectura conexionistă.

Eroarea profundă a arhitecturii conexioniste este aceasta: fiindcă nu acceptă în reprezentările mentale nici structura sintactică, nici pe cea semantică, le tratează vrând-nevrând ca pe o listă şi nu ca pe un set generat. Dar listele nu au structură; orice colecŃie de elemente este o posibilă listă. Iar după principiile conexioniste, prin analogie, orice colecŃie de stări reprezentaŃionale (conectate cauzal) este un posibil sistem psihic. Deci, în ceea ce priveşte arhitectura conexionistă, nu există nimic care să împiedice existenŃa unor sisteme care sunt în mod arbitrar nesistematice. Dar acest rezultat este absurd. CapacităŃile cognitive vin în grupuri înrudite structural; sistematicitatea lor este pervasivă. Toate dovezile sugerează că nu există sisteme psihice punctate. Acest argument părea decisiv împotriva conexionismului lui Hebb, Osgood şi Hull acum douăzeci sau treizeci de ani. Din câte ştim noi, de atunci nu s-a întâmplat nimic important care să schimbe situaŃia.29

29 Notă istorică: conexioniştii sunt asociaŃionişti, dar nu orice asociaŃionist afirmă că reprezentările mentale sunt nestructurate. Hume, de exemplu, nu a făcut-o. Hume considera că reprezentările mentale sunt ca imaginile, iar imaginile au o semantică a lor compoziŃională: părŃile imaginii unui cal sunt în general imagini ale părŃilor calului.

Pe de altă parte, a permite o semantică de tip compoziŃional pentru reprezentările mentale nu îi face unui asociaŃionist mult bine, atâta timp cât el este cu adevărat în spiritul asociaŃionismului. Calitatea de a avea reprezentări mentale cu structură este cea care permite operaŃiilor sensibile la structură să fie definite asupra acestora; în mod specific, o permite pentru acel tip de operaŃii care se rezolvă prin productivitate şi sistematicitate. AsociaŃia nu este totuşi o astfel de operaŃie; tot ceea ce poate ea face este să construiască un model intern al redundanŃelor în experienŃă prin alterarea probabilităŃilor tranziŃiilor între stările mentale. În privinŃa problemelor productivităŃii şi sistematicităŃii, un asociaŃionist care recunoaşte reprezentările structurate este în poziŃia celui care are conserva, dar nu are deschizătorul de conserve.

Hume, de fapt, a trişat: el şi-a permis nu doar asociaŃia, ci şi “imaginaŃia”, pe care a considerat-o o facultate “activă” care poate produce concepte noi din părŃi vechi prin procesul de analiză şi recombinare. (Ideea de unicorn este alcătuită din ideea de cal şi ideea de corn, de ex.). Ca asociaŃionist, Hume nu avea nici un drept să activeze facultăŃile mentale. Dar a permite imaginaŃia ca Hume este exact ceea ce lipseşte conexioniştilor moderni: adică, un răspuns la întrebarea: în ce fel procesele mentale pot fi productive? Morala este că, dacă ai reprezentări structurate, tentaŃia de a postula operaŃii sensibile la structură şi o capacitate executivă care să le aplice este practic irezistibilă.

Conexionism şi arhitectură cognitivă: o analiză critică

44

Un comentariu final pentru a rotunji această parte a discuŃiei. Este posibil de imaginat un conexionist pregătit să admită că deşi sistematicitatea nu rezultă din - şi din această cauză nu este explicată de - arhitectura conexionistă, ea este totuşi compatibilă cu acea arhitectură. Până la urmă, este perfect posibil să urmezi o politică de construire de reŃele care au noduri aRb doar dacă au şi noduri bRa ...etc. Astfel nu există nimic care să-l oprească pe conexionist de la a stipula - ca un postulat independent al teoriei sale asupra psihicului - că toate reŃelele instanŃiate biologic sunt, de facto, sistematice.

Dar aceasta omite un punct crucial: nu este de ajuns să stipulezi sistematicitatea; se cere şi să specifici un mecanism care să poată impune stipulaŃia. Altfel spus, nu este de ajuns pentru un conexionist să fie de acord că toate sistemele psihice sunt sistematice; el trebuie să şi explice cum reuşeşte natura să producă doar sisteme psihice sistematice.

Probabil că ar trebui să aibă un anumit tip de mecanism, înafara celor pe care conexionismul per se le postulează, a cărui funcŃionare asigură sistematicitatea reŃelelor instanŃiate biologic; un mecanism în virtutea operării căruia orice reŃea să aibă un nod aRb şi un nod bRa ...şi aşa mai departe. Oricum, nu există propuneri pentru un astfel de mecanism. Sau, mai degrabă, există numai o singură propunere. Singurul mecanism care se ştie că poate produce sistematicitate pervasivă este arhitectura clasică. Şi, după cum am văzut, arhitectura clasică nu este compatibilă cu conexionismul, de vreme ce necesită reprezentări structurate intern.

4. TENTAłIA CONEXIONISMULUI

Popularitatea prezentă a concepŃiei conexioniste printre psihologi şi filosofi

te intrigă din perspectiva tipurilor de probleme ridicate mai sus, probleme care au fost în mare măsură răspunzătoare pentru dezvoltarea unei noŃiuni (demonstrate teoretic) de calcul bazat pe sintaxă, şi în primul rând a unei noŃiuni de arhitectură cognitivă în stil Turing, de procesare a simbolurilor. Există, totuşi, o sumă de argumente aparent plauzibile, întâlnite în mod repetat în literatură, care accentuează anumite limitări ale computerelor convenŃionale ca modele ale creierului. Acestea ar putea fi considerate ca favorizând alternativa conexionistă. Vom schiŃa câteva dintre acestea, înainte de a discuta problemele generale pe care par să le ridice. • Rapiditatea proceselor cognitive în relaŃie cu vitezele neurale: constrângerea

celor “o sută de paşi”. S-a observat (de ex., Feldman & Ballard, 1982) că timpul de execuŃie a instrucŃiunilor computerului este de ordinul nanosecundelor, în timp ce neuronii au nevoie de zeci de milisecunde pentru a fi activaŃi. În consecinŃă, în timpul necesar oamenilor pentru a duce la îndeplinire multe dintre sarcinile pe care le realizează uşor (ca de ex. să recunoască un cuvânt sau un desen, amândouă activităŃile necesitând mult mai puŃin de o secundă) un program serial instanŃiat neural va fi în stare să îndeplinească aproximativ 100 de instrucŃiuni. Şi totuşi, asemenea sarcini necesită în mod tipic câteva mii - sau

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

45

chiar milioane - de instrucŃiuni în computerele zilelor noastre (în cazul în care pot fi îndeplinite). Deci, s-a spus, creierul trebuie că este organizat într-o manieră extrem de paralelă (“masiv paralelă” este termenul preferat).

• Dificultatea realizării unei capacităŃi de recunoaştere a pattern-urilor de capacitate mare şi a unei capacităŃi de reactualizare bazate pe conŃinut în arhitecturile convenŃionale. Strâns legat de problemele constrângerilor temporale este faptul că oamenii pot stoca şi folosi o cantitate enormă de informaŃii - aparent fără efort (Fahlman & Hinton, 1987). O însuşire spectaculoasă a oamenilor este capacitatea de recunoaştere a patternurilor dintre zeci sau chiar sute de mii de alternative (de ex., recunoaşterea cuvintelor sau a fizionomiilor). De fapt, există motive să credem că multe abilităŃi ale experŃilor se bazează pe memoria de recunoaştere foarte rapidă (vezi Simon & Chase, 1973). Dacă ar trebui ca cineva să-şi cerceteze memoria serial, aşa cum o fac computerele convenŃionale, complexitatea ar copleşi orice maşină. Astfel, modul în care oamenii stochează şi regăsesc cunoştinŃele trebuie să fie diferit de felul în care o fac computerele convenŃionale.

• Modelele computerelor convenŃionale prezintă o etiologie diferită pentru comportamentul “guvernat de reguli", respectiv pentru comportamentul “excepŃional”. Teoriile psihologice clasice, bazate pe ideea de computer convenŃional, fac distincŃie între mecanisme care cauzează comportamentul obişnuit şi cele care cauzează comportamentul divergent, postulând sisteme de reguli inconştiente explicite pentru a le explica pe primele, şi apoi atribuind abateri de la aceste reguli unor factori secundari (de performanŃă). Cum comportamentele divergente au loc foarte des, o strategie mai bună ar fi încercarea de a explica ambele tipuri de comportament în termenii aceluiaşi mecanism.

• Lipsa progresului în abordarea proceselor care sunt nonverbale sau intuitive. Marea parte a abilităŃilor noastre cognitive fluente nu constau în accesarea cunoştintelor verbale sau în raŃionarea conştientă şi deliberată (Fahlman & Hinton, 1987; Smolensky, 1988). Se pare că ştim multe lucruri pe care ar fi foarte greu să le descriem verbal, de ex. cum să mergi pe bicicletă, cum arată prietenii noştri apropiaŃi sau cum să ne amintim numele preşedintelui etc. Se spune că aceste cunoştinŃe nu trebuie stocate în formă lingvistică, ci într-o altă formă “implicit ă”. Faptul că în mod tipic computerele convenŃionale operează într-un “mod lingvistic”, dat fiind că procesează informaŃii prin operarea asupra unor expresii structurate sintactic, poate explica de ce modelarea cunoştinŃelor implicite a avut destul de puŃin succes.

• Sensibilitatea acută a arhitecturilor convenŃionale la deteriorare şi zgomot. Spre deosebire de circuitele digitale, circuitele creierului trebuie să tolereze zgomotul provenit de la activitatea neuronală spontană. Mai mult, ele trebuie să suporte un grad moderat de deteriorare fără a se prăbuşi complet. Cu puŃine excepŃii notabile, dacă o parte din creier este deteriorată, degradarea funcŃionării nu este de obicei catastrofală, ci variază mai mult sau mai puŃin gradual cu proporŃiile deteriorării. Acest lucru se întâmplă mai ales cu memoria. Deteriorarea

Conexionism şi arhitectură cognitivă: o analiză critică

46

cortexului temporal (de obicei considerat sediu al memoriei) nu are ca rezultat o pierdere selectivă a anumitor date sau amintiri. Acest lucru, ca şi alte date similare despre pacienŃi cu leziuni cerebrale, sugerează că reprezentările memoriei umane, şi probabil şi alte abilităŃi cognitive, sunt distribuite spaŃial, mai degrabă decât localizate neural. Aceasta pare să contrasteze cu computerele convenŃionale, unde controlul de tip ierarhic păstrează deciziile importante în locaŃii precise şi unde stocarea în memorie constă într-un şir de registre cu locaŃie adresabilă.

• Stocarea în structuri convenŃionale este pasivă. Computerele convenŃionale au un stoc de memorie pasivă, care poate fi accesat prin aşa-numitul “fetch and execute cycle” [ciclul extrage şi execută]. Acest lucru pare să fie destul de deosebit de memoria umană. De exemplu, după Kosslyn şi Hatfield (1984, pp.1022, 1029): în computere memoria este statică: odată ce o intrare este pusă într-o locaŃie dată, ea rămâne acolo pur şi simplu, până CPU [unitatea centrală] operează asupra ei... Dar să considerăm un experiment foarte simplu: să ne imaginăm litera A în mod repetat... apoi să trecem la litera B. Într-un model care foloseşte o arhitectură Von Neumann, “oboseala” care inhibă imaginarea lui A ar trebui să se datoreze unui tertip în modul în care CPU execută o instrucŃie dată... O asemenea oboseală ar trebui să se generalizeze la toate obiectele imaginate, deoarece rutina responsabilă pentru imaginare a fost mai puŃin eficientă. Dar experimentele au demonstrat că acest lucru nu e adevărat: obiecte specifice devin mai greu de imaginat, nu toate obiectele. Acest fapt este mai uşor de explicat printr-o analogie cu modul în care cerneala invizibilă dispare de bună voie...: cu cerneală invizibilă, reprezentarea însăşi face ceva - nu există un procesor separat care operează asupra ei...

• Sistemele convenŃionale bazate pe reguli descriu cogniŃia în termeni de “totul-sau-nimic”. Dar aptitudinile cognitive par a fi caracterizate de diferite tipuri de continuităŃi. De exemplu:

• VariaŃia continuă în gradul de aplicabilitate al diferitelor principii, sau în gradul de relevanŃă al diferitelor constrângeri, “reguli” sau proceduri. Există cazuri frecvente (mai ales în percepŃie şi reactualizare) în care se pare că o varietate de constrângeri diferite exercită simultan presiuni asupra unei probleme, iar rezultatul este un efect combinat al diferiŃilor factori (vezi, de ex., discuŃia informală propusă de McClelland, Rumelhart & Hinton, 1986, pp.3-9). De aceea tehnicilor de “propagare constrânsă” li se acordă o mare atenŃie în inteligenŃa artificială (vezi Mackworth, 1987).

• Nondeterminismul comportamentului uman. Procesele cognitive nu sunt niciodată determinate rigid sau precis replicabile. Mai degrabă, ele par să aibă o componentă semnificativ aleatoare sau stohastică. Acest lucru se datorează poate aleatorului de la nivel microscopic, cauzat de activitate biochimică sau electrică întâmplătoare sau chiar de procese de mecanică cuantică. Modelarea acestei activităŃi cu ajutorul unor reguli deterministe rigide nu poate duce decât la predicŃii slabe, deoarece ignoră natura fundamental stohastică a mecanismelor de

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

47

bază. Mai mult chiar, modelele deterministe, de tip “totul-sau-nimic” nu pot să explice aspectul gradual al învăŃarii sau al dobândirii de aptitudini.

• Eşecul în manifestarea unei degradări fine. Când oamenii nu sunt în stare să realizeze o sarcină perfect, ei fac totuşi ceva raŃional. Dacă o sarcină particulară nu se potriveşte exact cu un pattern cunoscut, sau dacă e doar parŃial înŃeleasă, persoana nu va renunŃa la ea şi nici nu va avea un comportament lipsit de sens. Din contră, dacă un program al unui computer clasic, bazat pe reguli, nu recunoaşte sarcina, sau nu reuşeşte să potrivească un pattern cu reprezentările regulilor stocate în memoria sa, de obicei nu va fi în stare să facă nimic. Acest fapt sugerează că pentru a manifesta o degradare fină trebuie să fim în stare să ne reprezentăm prototipuri, să potrivim patternuri, să recunoaştem probleme etc. în grade diferite.

• Modelele convenŃionale sunt impuse de trăsăturile tehnice curente ale computerelor şi nu Ńin seama decât într-o mică măsură sau chiar deloc de datele din neuroştiinŃe. Sistemele clasice de procesare de simboluri nu oferă nici o indicaŃie despre modul în care tipurile de procese pe care le postulează pot fi realizate de către creier. Faptul că această breşă între sistemele de nivel superior şi arhitectura creierului este atât de mare ar putea fi o indicaŃie a faptului că aceste modele sunt pe o pistă greşită.

În vreme ce arhitectura psihicului a evoluat sub presiunile selecŃiei naturale,

unele din ipotezele clasice asupra sistemului psihic pot deriva din caracteristici pe care le au calculatoarele doar pentru că acestea au fost proiectate în folosul programatorilor. Acest fapt include probabil chiar şi ipoteza că descrierea la nivel cognitiv a proceselor mentale poate fi separată de descrierea realizării lor fizice. În mod minimal, construindu-ne modelele astfel încât să Ńină cont de ceea ce se cunoaşte despre structurile neuronale, putem reduce riscul de a fi induşi în eroare de către metafore bazate pe arhitecturile contemporane ale calculatoarelor.

Replică: Din ce cauză nu sunt valide motivele invocate în mod obişnuit în favoarea unei arhitecturi conexioniste?

După părerea noastră, ca argumente împotriva arhitecturii cognitive clasice,

toate aceste motive suferă de unul sau altul dintre următoarele două defecte: (1) ObiecŃiile depind de proprietăŃi care nu sunt de fapt intrinseci

arhitecturilor clasice, de vreme ce pot exista modele clasice perfect naturale care nu prezintă caracteristicile criticate. (Credem că acest lucru este adevărat, de exemplu, pentru argumentele că regulile clasice sunt explicite şi că operaŃiile clasice sunt de tipul "tot sau nimic".)

(2) ObiecŃiile sunt corecte relativ la arhitecturile clasice, în măsura în care acestea sunt implementate pe calculatoarele curente, dar nu e necesar să fie corecte dacă ele sunt implementate diferit (de ex. prin reŃele neuronale). Cu alte cuvinte, acestea sunt direcŃionate mai degrabă către nivelul implementaŃional decât către nivelul cognitiv, aşa cum au fost ele diferenŃiate în discuŃia anterioară. (Credem că

Conexionism şi arhitectură cognitivă: o analiză critică

48

acest lucru este adevărat, de exemplu, pentru argumentele privind viteza, rezistenŃa la deteriorare şi zgomot şi pasivitatea memoriei.)

În continuarea acestei secŃiuni vom dezvolta aceste puncte şi le vom corela cu unele din argumentele prezentate anterior. După această analiză vom prezenta ceea ce noi credem a fi cea mai solidă perspectivă asupra conexionismului; şi anume că este o teorie despre modul în care sistemele cognitive (clasice) pot fi implementate, fie în creiere reale, fie într-o "neurologie abstractă".

Calculul paralel şi problema vitezei Fie argumentul că procesele cognitive trebuie să implice un calcul paralel

pe scară largă. În forma pe care o ia în cadrul discuŃiilor tipic conexioniste, această problemă este irelevantă din punct de vedere al adecvării arhitecturii cognitive clasice. "Constrîngerea celor 100 de paşi", de exemplu, este în mod clar introdusă la nivel implementaŃional. Toate acestea conduc la ipoteza (absurdă) că arhitecturile cognitive sunt implementate în creier în acelaşi fel în care sunt implementate în calculatoarele electronice. Dacă aŃi avut vreodată îndoieli în legătură cu nivelul, implementaŃional sau simbolic, la care se referă o anumită propunere, o euristică folositoare ar fi să vă întrebaŃi dacă ceea ce se presupune despre un calculator convenŃional - cum ar fi DEC VAX - este adevărat la nivelul implementaŃional. Astfel, deşi cei mai mulŃi algoritmi care rulează pe VAX sunt seriali 30, la nivel implementaŃional astfel de calculatoare prezintă un "masiv paralelism"; funcŃionarea lor presupune efectiv activităŃi electrice simultane în cadrul aproape al întregului dispozitiv. De exemplu, fiecare ciclu de acces la memorie presupune propagarea fiecărui bit într-o fracŃiune semnificativă a regiştrilor de memorie ai sistemului - întrucât accesul la memorie constă practic dintr-un proces de citire destructivă şi rescriere, ceasul sistemului pulsează regulat, activând cea mai mare parte a unităŃii centrale, şi aşa mai departe. Morala este că viteza absolută a unui proces e prin excelenŃă o proprietate a implementării sale. (Prin contrast, viteza relativă de răspuns a sistemului la diferite semnale de intrare are adesea valoare diagnostică pentru procesele individuale; dar aceasta a fost întotdeauna o primă bază empirică de alegere între algoritmi alternativi în psihologia prelucrării informaŃiei). Astfel, faptul că neuroni individuali au nevoie de zeci de milisecunde pentru a reacŃiona nu are legătură cu viteza estimată de rulare a unui algoritm în afară de cazul în care există cel puŃin o teorie parŃială, motivată independent, despre modul în care operaŃiile arhitecturii funcŃionale sunt implementate la nivelul neuronilor. Dacă, în cazul creierului, nu

30 În cazul unui calculator convenŃional, acesta poate fi văzut ca executând fie un algoritm serial, fie unul paralel, în funcŃie de ce "maşină virtuală" este considerată în cazul respectiv. La urma urmei, un computer poate fi folosit pentru a simula (implementa) o maşină virtuală cu arhitectură paralelă. În acest caz algoritmul său va fi unul paralel.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

49

este absolut sigur că excitaŃia31 neuronilor este invariabil proprietatea semnificativă a implementării (cel puŃin pentru procesele cognitive de nivel înalt, cum ar fi învăŃarea şi memoria), "constrângerea" celor 100 de paşi nu exclude nimic. În final, constrângeri absolute asupra numărului de paşi seriali necesari unui proces sau asupra timpului necesar execuŃiei sale furnizează argumente insuficiente împotriva arhitecturii clasice, pentru că arhitectura clasică nu exclude în nici un fel execuŃia paralelă a proceselor simbolice multiple. Într-adevăr, pare extrem de probabil că multe procese simbolice clasice funcŃionează în paralel în cadrul procesului de cunoaştere şi că aceste procese interacŃionează între ele (de ex. pot fi implicate într-o anumită propagare a unei constrângeri simbolice). Operarea cu simboluri poate implica chiar organizări "masiv paralele"; ceea ce ar putea într-adevăr să ducă la noi arhitecturi, dar acestea sunt toate clasice în accepŃiunea noastră, deoarece toate împărtăşesc concepŃia clasică a calculului ca procesare de simboluri. (Pentru exemple de propuneri serioase şi interesante pentru organizarea procesoarelor clasice în cadrul unor reŃele paralele de dimensiuni mari, vezi sistemul Actor al lui Hewett (1977), "Connection Machine" a lui Hillis (1985), ca şi oricare dintre noile maşini comerciale multi-procesor). Ideea este că un argument pentru o reŃea de calculatoare paralele nu este în sine nici un argument împotriva arhitecturii clasice, nici un argument în favoarea arhitecturii conexioniste.

RezistenŃa la zgomot şi distrugere fizică (şi argumentul pentru reprezentarea distribuită)

Unele dintre celelalte avantaje pretinse de arhitecturile conexioniste asupra

arhitecturilor clasice sunt la fel de clar localizate la nivelul implementaŃional. De exemplu, criteriul "rezistenŃei la distrugere fizică" este atât de evident o chestiune de implementare încât cu greu ar putea fi luat în discuŃie de teoriile de nivel cognitiv. Este adevărat că un anumit tip de rezistenŃă la distrugere pare a fi incompatibilă cu localizarea, şi este de asemenea adevărat că reprezentările în PDP-uri sunt distribuite pe grupuri de unităŃi (cel puŃin când e folosită "codarea brută"). Dar distribuirea pe unităŃi prezintă rezistenŃă la distrugere numai dacă presupune că reprezentările sunt de asemenea distribuite neuronal32. Oricum, distribuirea

31 Există de fapt un anumit număr de de mecanisme diferite de interacŃiune neuronală (de ex. "interacŃiunile locale" descrise de Rakic, 1975). De asemenea, un mare număr de procese chimice au loc la nivelul dendritelor, la diferite scale temporale, astfel încât chiar dacă transmisia dendritică ar fi unicul mecanism relevant, nu putem şti ce scală temporală să folosim pentru a estima activitatea neuronală în general (vezi de ex. Black., 1986). 32 Exceptând cazul în care "unităŃile" unei reŃele conexioniste sunt presupuse a avea diferite localizări spaŃiale în cadrul creierului, pare a fi absolut greşit să vorbim despre reprezentare distribuită. În particular, dacă acestea sunt individualizate în primul rînd funcŃional, orice grad de distribuire a entităŃilor funcŃionale e compatibil cu orice grad de solidaritate spaŃială a reprezentărilor neuronale corespunzătoare. Dar nu este evident că unităŃile o fac, în vreun mod corespunzător unei locaŃii identificabile anatomic din creier. După felul în care sunt proiectate mecanismele conexioniste, pare a

Conexionism şi arhitectură cognitivă: o analiză critică

50

neuronală a reprezentărilor este compatibilă în aceeaşi măsură şi cu arhitecturile clasice şi cu reŃelele conexioniste. În cazul clasic nu aveŃi nevoie decât de regiştrii de memorie care îşi distribuie conŃinutul în spaŃiul fizic. PuteŃi obŃine aceasta cu sisteme de memorie fanteziste cum ar fi cele optice sau cele chimice sau chiar cu regiştrii formaŃi din reŃele conexioniste. GîndiŃi-vă că distribuirea deja exista la vechile memorii cu "inele de ferită"! NecesităŃile din punct de vedere fizic ale unui sistem clasic de prelucrare a simbolurilor sunt destul de uşor înŃelese în mod greşit. (Confuzia dintre proprietăŃile fizice şi cele funcŃionale este foarte răspândită în teoretizarea psihologică în general; pentru o dezbatere asupra acestei confuzii, în legătură cu proprietăŃile metrice în modelele imagisticii mentale, vezi Pylyshyn 1981.) De exemplu, arhitectura convenŃională necesită existenŃa unor expresii simbolice distincte pentru fiecare stare pe care o poate reprezenta. Deoarece aceste expresii prezintă adesea o structură constituită din părŃi concatenate, relaŃia de adiacenŃă va trebui instanŃiată printr-o anumită relaŃie fizică la momentul implementării arhitecturii. (vezi discuŃia din nota 9). Oricum, dacă relaŃia care trebuie să fie realizată fizic este de adiacenŃă funcŃională, nu este necesar ca instanŃierile fizice ale simbolurilor adiacente să fie spaŃial adiacente. Similar, deşi expresii complexe sunt alcătuite din elemente atomice, iar deosebirea dintre simbolurile atomice şi cele complexe trebuie să fie cumva instanŃiată fizic, nu este necesar ca semnului unui simbol atomic să-i fie asignată o zonă din spaŃiu mai mică decât semnului unui simbol complex, chiar dacă e vorba de un simbol complex care îl conŃine. În arhitecturile clasice, ca şi în cele conexioniste, elemente funcŃionale pot fi distribuite fizic sau localizate în orice măsură. La VAX (pentru a ne folosi din nou euristica), perechi de simboluri pot fi adiacente funcŃional, semnele simbolurilor sunt - cu toate acestea - răspândite spaŃial prin multe zone din memoria fizică. Pe scurt, faptul că o proprietate (cum ar fi poziŃia unui simbol în cadrul unei expresii) este locală din punct de vedere funcŃional nu are implicaŃii de nici un fel asupra rezistenŃei la distrugere sau asupra toleranŃei la zgomot, în afară de cazul când metrica vecinătăŃii funcŃionale corespunde unei dimensiuni fizice potrivite. În acest caz, am putea fi capabili să estimăm reacŃiile adverse pe care variaŃia proprietăŃii fizice le produce asupra obiectelor localizate în spaŃiul funcŃional (de ex, variind tensiunea sau frecvenŃa am putea afecta partea stângă a unei expresii). Dar, desigur, situaŃia este identică pentru sistemele conexioniste: chiar dacă acestea sunt rezistente la distrugeri locale din punct de vedere spaŃial, ele ar putea să nu fie rezistente la distrugeri locale la nivelul altor dimensiuni fizice. Deoarece distrugerea locală din punct de vedere spaŃial este frecventă în mod special în traumele din lumea reală, aceasta poate avea importante consecinŃe practice. Dar atâta timp cât cunoştinŃele noastre despre modul în care procesele cognitive sunt implementate în

fi potrivit să vedem unităŃile şi legăturile dintre ele ca entităŃi funcŃionale/matematice (ceea ce psihologii ar numi "construcŃii ipotetice") a căror interpretare neurologică rămâne încă deschisă. (Acesta este, de fapt, punctul de vedere al unor conexionişti; vezi Smolensky, 1988). Ideea este că distribuŃia întâlnită în construcŃiile matematice nu asigură rezistenŃa la distrugere; doar distribuŃia neuronală o poate face.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

51

Ńesutul cerebral rămân atât de inconsistente, mesajul său către ştiinŃele cognitive rămâne îndoielnic.

Constrângeri "uşoare", mărimi continue, mecanisme stohastice şi simboluri active

Părerea că acele constrângeri "uşoare", care pot varia continuu (ca şi

gradele de activare), sunt incompatibile cu sistemele clasice simbolice bazate pe reguli e un alt exemplu al imposibilităŃii de a păstra separate nivelul psihologic (sau al prelucrării de simboluri) de nivelul implementaŃional. Ar putea exista un sistem clasic bazat pe reguli, în care aplicarea unei anumite reguli e decisă la nivelul arhitecturii funcŃionale şi depinde de mărimi care variază continuu. Într-adevăr, aceasta se întîmplă de obicei în cazul "sistemelor expert" clasice care, de exemplu, folosesc în cadrul interpretorului de reguli al sistemului de producere un mecanism Bayesian. UşurinŃa sau natura stohastică a proceselor bazate pe reguli apare din interacŃiunea regulilor deterministe cu proprietăŃile reale ale implementării sau cu intrările zgomotoase sau cu transmisia de informaŃie zgomotoasă. Ar trebui de asemenea remarcat că aplicările de reguli nu trebuie să conducă la comportamente de tip "totul sau nimic", deoarece mai multe reguli pot fi activate simultan şi pot avea efecte interactive în cadrul rezultatului. Sau, pe de altă parte, fiecare din regulile activate poate genera efecte paralele independente, care ar putea fi ordonate mai tîrziu - în funcŃie de, să zicem, care dintre curenŃii paraleli atinge primul un anumit scop. Un punct de vedere important, deşi uneori neglijat, asupra unor asemenea proprietăŃi agregate de comportament deschis, cum ar fi continuitatea, "neclaritatea" (fuzziness), randomizarea etc, este că acestea nu provin neapărat din mecanismele de la nivel inferior, care sunt la rândul lor fuzzy, continue sau aleatoare. Nu numai că în principiu este posibil, dar adesea este chiar rezonabil practic să presupunem că unele comportări aparent variabile sau nondeterministe apar din interacŃiunea mai multor surse deterministe. O idee similară poate fi emisă în legătură cu problema "degradării fine". Arhitectura clasică nu necesită ca, atunci când condiŃiile necesare aplicării regulilor disponibile nu sunt complet îndeplinite, procesul să eşueze pur şi simplu. Aşa cum am remarcat anterior, regulile pot fi activate într-o anumită măsură în funcŃie de cât de apropiate sunt condiŃiile reale de cele necesare. Ceea ce se întâmplă exact în astfel de cazuri poate depinde de modul în care e implementat sistemul de reguli. Pe de altă parte, s-ar putea ca imposibilitatea manifestării "degradării fine" să fie o limită intrinsecă a clasei curente de modele sau chiar a abordărilor actuale în proiectarea sistemelor inteligente. Pare evident că modelele psihologice disponibile în momentul de faŃă sunt inadecvate faŃă de un spectru larg de măsurători, aşa încât problemele lor relativ la degradarea fină pot fi doar un caz particular al lipsei lor generale de inteligenŃă: ele ar putea ca pur şi simplu să nu fie suficient de inteligente pentru a şti ce trebuie să facă atunci când un set limitat de reguli nu pot fi aplicate. Dar aceasta nu trebuie să fie o limitare principială a arhitecturilor clasice: nu există, după cunoştinŃele noastre, nici un motiv ca ceva de tipul

Conexionism şi arhitectură cognitivă: o analiză critică

52

"ierarhiei metodelor slabe" a lui Laird şi Rosenberg sau de tipul "subscopurilor universale" ale lui Newell (1986) să fie incapabil principial să trateze problema degradării fine. (După cunoştinŃele noastre, n-a fost oferit încă nici un argument că arhitecturile conexioniste ar putea fi principial capabile să trateze această problemă. De fapt, modelele conexioniste curente sunt, punct cu punct, la fel de lipsite de fineŃe în modul lor de eşec ca şi cele bazate pe arhitecturile clasice. De exemplu, contrar unor estimări, modele ca cele ale lui McClelland şi Kawamato, 1986, eşuează destul de nenatural la primirea unor informaŃii incomplete.) Pe scurt, teoreticienii clasici pot vedea proprietăŃile stohastice ale comportamentului ca o consecinŃă a interacŃiunilor dintre model şi proprietăŃile intrinseci ale mediului fizic în care acesta este realizat. Este esenŃial să amintim că, din punctul clasic de vedere, comportamentul deschis este prin excelenŃă un efect al interacŃiunii, şi că manipulările simbolurilor sunt presupuse a fi unicele cauze ale interacŃiunii. Aceleaşi consideraŃii se aplică remarcilor lui Kosslyn şi Hatfield (citaŃi anterior) în legătură cu angajarea modelelor clasice în reprezentări "active" / "pasive". Este adevărat că, aşa cum spun Kosslyn şi Hatfield, reprezentările manipulate de maşinile Von Neumann "nu fac nimic" fără ca o CPU [unitate centrală] să acŃioneze asupra lor (ele nu se deteriorează, de exemplu). Dar chiar dacă presupunem prin absurd că mintea umană ar avea exact aceeaşi arhitectură ca şi unele computere contemporane (Von Neumann), este evident că nici comportamentul lor, şi deci nici comportamentul unui organism, nu e determinat doar de maşina logică pe care o instanŃiază psihicul, ci şi de maşina protoplasmatică ce implementează logica. Reprezentările instanŃiate sunt, deci, obligatoriu active, chiar în contextul modelelor clasice; întrebarea este dacă tipul de activitate pe care acestea îl prezintă ar trebui să fie explicat de modelul cognitiv sau de teoria implementării sale. Această problemă este una empirică şi nu trebuie pusă în sprijinul punctului de vedere conexionist. (Aşa cum este, de exemplu, în pasaje ca "Creierul însuşi nu manipulează simboluri; creierul este mediul în interiorul căruia plutesc simbolurile, activându-se unul pe celălalt. Nu există un manipulator central sau un program central. Există pur şi simplu o vastă colecŃie de "echipe" - patternuri de activare neuronală care, ca nişte echipe de furnici, activează alte patternuri de activare neuronală ... . SimŃim aceste simboluri agitându-se în interiorul nostru cam în acelaşi fel în care simŃim agitaŃia din stomac" (Hofstadter, 1983, p.279). Acesta pare a fi un caz grav de Formicidae ex machina: furnici în stomacul duhului maşinii.)

Caracterul explicit al regulilor

În concordanŃă cu McClelland, Feldman, Adelson, Bower şi McDermott (1986, p.6), "...modelele conexioniste conduc la o reconceptualizare a unor probleme psihologice cheie, cum ar fi natura reprezentării cunoştinŃelor... . O abordare tradiŃională a unor astfel de probleme tratează cunoştinŃele drept un corp de reguli consultate de mecanismele de procesare pe parcursul procesării; în cazul

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

53

modelelor conexioniste, aceste cunoştinŃe sunt reprezentate, adesea într-o formă puternic distribuită, prin conexiunile dintre unităŃile de procesare." Aşa cum observam în introducere, noi credem că atât afirmaŃia că cele mai multe procese psihologice sunt bazate implicit pe reguli, cât şi afirmaŃia corespondentă că anumite comportamente divergente sunt rezultatul aceloraşi mecanisme cognitive, sunt deopotrivă interesante şi tendenŃioase. Noi vedem aceste probleme ca fiind în întregime empirice şi, în multe cazuri, deschise. Oricum, nimeni n-ar trebuie să facă o confuzie între distincŃia reguli implicite/reguli explicite şi distincŃia dintre arhitectura clasică şi cea conexionistă33. Confuzia este omniprezentă tocmai în literatura conexionistă: este universal asumat de către conexionişti că modelele clasice consideră comportamentele uzuale derivate din reguli explicite codate. Dar aceasta pur şi simplu nu e adevărat. Nu numai că nu există nici un motiv pentru care modelele clasice să aibă obligatoriu reguli explicite, dar - de fapt - argumentele după care regulile sunt explicit reprezentate mental au fost ironizate de zeci de ani în tabăra clasiciştilor. (Vezi, pentru exemple relativ recente, discuŃiile despre caracterul explicit al regulilor gramatice în Stabler, 1985; pentru o dezbatere filozofică vezi Cummings, 1983.) Unicul fapt cu care teoreticienii clasici sunt de acord este că nu se poate ca toate comportările uzuale să fie determinate de reguli explicite; cel puŃin unele dintre cauzele de determinare a comportamentului trebuie să fie implicite. (Argumentele pentru aceasta sunt în paralel cu observaŃiile lui Lewis Caroll din "Ce i-a spus Ńestoasa lui Ahile"; vezi Caroll 1956). Toate celelalte probleme legate de caracterul explicit al regulilor sunt văzute de clasicişti ca fiind discutabile; şi o mulŃime de nuanŃe de opinii pe marginea acestui subiect pot fi găsite în tabăra clasiciştilor. Ideea principală este aceasta: nu toate funcŃiile unui calculator clasic pot fi codificate sub forma unui program explicit; unele dintre ele trebuie cablate în interiorul său. De fapt, întregul program poate fi cablat hard în cazul în care el nu necesită modificări ulterioare. În aceste cazuri, maşinile clasice pot fi bazate pe

33 Un exemplu în mod special flagrant despre cum problemele legate de arhitectură sunt confundate cu problemele legate de caracterul explicit al regulilor în literatura conexionistă apare în PDP, Capitolul 4, unde Rumelhart şi McClelland afirmă că modelele PDP asigură "... o explicaŃie destul de plauzibilă a modului în care putem ajunge să avem "cunoştinŃe" înnăscute. La proporŃia de cunoştinŃe stocate, presupuse a se afla sub formă de reguli explicite, inaccesibile ..., e greu de imaginat cum ar putea acestea "intra în capul" nou-născutului. Ni se pare implauzibil ca nou-născutul să posede sisteme elaborate de simboluri, şi sistemele necesare pentru interpretarea acestora şi formarea de reguli explicite, inaccesibile, care vor fi folosite în ghidarea comportamentului. După părerea noastră, nu e nevoie să-i atribuim o maşinărie atât de complexă. Dacă prin cunoştinŃe înnăscute înŃelegem pur şi simplu conexiunile pre-cablate, acestea sunt codificate din start în forma necesară mecanismelor de procesare." p.42. O anticipare a ceea ce pare sau nu pare să posede nou-născutul ni se pare o cale greşită pentru a face psihologia cognitivă a dezvoltării. Dar argumentul lui Rumelhart şi McClelland este de două ori pe lângă subiect, din moment ce un clasicist care le împărtăşeşte prejudecăŃile se poate folosi la rândul său de aceeaşi rezolvare. Arhitectura clasică nu necesită o "maşinărie complexă" pentru "interpretarea" regulilor explicite, deoarece maşinile clasice nu necesită deloc reguli explicite. Arhitectura clasică este, deci, neutră faŃă de problema empirism/nativism (la fel ca şi conexionismul, aşa cum corect remarcau Rumelhart şi McClelland în altă parte).

Conexionism şi arhitectură cognitivă: o analiză critică

54

reguli implicite relativ la programele lor, iar mecanismul lor de tranziŃie între stări e în întregime subcomputaŃional (adică subsimbolic). Ceea ce trebuie să fie explicit în cazul unei maşini clasice nu este programul său, ci simbolurile pe care le înscrie pe benzile sale (sau le memorează în regiştrii). Acestea, oricum, nu corespund regulilor maşinii de tranziŃie între stări, ci structurilor sale de date. Structurile de date sunt obiectele pe care maşina le transformă, şi nu regulile transformării . În cazul programelor care analizează limbajul natural, de exemplu, arhitectura clasică pretinde o reprezentare explicită a descrierilor structurale ale propoziŃiilor, dar este total indiferentă faŃă de caracterul explicit al gramaticilor, contrar credinŃei multor conexionişti. Una dintre invenŃiile importante din istoria calculatoarelor - calculatorul cu program memorat - face posibil ca programele să preia rolul structurilor de date. Dar nimic din cadrul arhitecturii nu ne impune ca aceasta să se întîmple întotdeauna. Asemănător, Turing a demonstrat existenŃa unei maşini abstracte (aşa numita Maşină Universală Turing) care poate simula orice maşină Ńintă (de tip Turing). O maşină universală e "bazată pe reguli explicite" relativ la maşina pe care o simulează (în sensul că deŃine o reprezentare explicită a maşinii, care e suficientă pentru a specifica în mod unic comportamentul acesteia). În acelaşi timp, maşina Ńintă poate foarte bine să fie "bazată pe reguli implicite" relativ la regulile care îi guvernează comportamentul. Deci, nu puteŃi ataca teoriile clasice ale arhitecturii cognitive arătând că un proces cognitiv e bazat pe reguli implicite; arhitectura clasică permite procese bazate pe reguli explicite, dar nu le impune. Pe de altă parte, puteŃi ataca arhitecturile conexioniste arătând că un proces cognitiv e bazat pe reguli explicite deoarece, prin definiŃie, arhitectura conexionisă exclude tipurile de capacităŃi logico-sintactice necesare codificării regulilor, precum şi tipurile de mecanisme de execuŃie necesare aplicării acestora.34 În acest caz, ar fi foarte stânjenitor pentru conexionişti dacă s-ar dovedi că există argumente convingătoare în favoarea proceselor cognitive bazate pe reguli explicite. Un loc potrivit în care să căutăm aceste argumente ar fi teoria achiziŃiei competenŃelor cognitive. De exemplu, multe lucrări tradiŃionale din domeniul lingvistic (vezi Prince & Pinker, 1988) şi toate lucrările recente din teoria învăŃării matematice (vezi Osherson, Stov, & Weinstein, 1984), afirmă că outputul caracteristic unui dispozitiv de achiziŃie cognitivă este un sistem recursiv de reguli (în cazul lingvistic, o gramatică). Să presupunem că astfel de teorii se dovedesc a fi bine fundamentate; atunci acest lucru ar fi incompatibil cu presupunerea că arhitectura cognitivă a calităŃilor dobândite e conexionistă.

34 Desigur, e posibil să fie simulat un "proces bazat pe reguli explicite" de către o reŃea conexionistă, implementând întâi o arhitectură clasică în reŃea. Trecerea de la reŃele privite ca arhitecturi la reŃele considerate ca implementări este omniprezentă în lucrările conexioniste, aşa cum am remarcat anterior.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

55

A modela "stilul creierului"

RelaŃia modelelor conexioniste cu neuroştiinŃa e favorabilă multor interpretări. Pe de o parte, oameni ca Ballard (1986) şi Sejnowski (1981) încearcă în mod explicit să construiască modele bazate pe proprietăŃile neuronilor şi ale organizărilor neuronale, chiar dacă respectivele unităŃi neuronale sunt puŃin idealizate (s-ar putea spune chiar mai mult decât puŃin idealizate: vezi, de exemplu, comentariile despre Ballard, 1986, articol). Pe de altă parte, Smolensky (1988) consideră unităŃile conexioniste ca fiind obiecte matematice cărora li se poate da o interpretare fie în termeni neuronali, fie în termeni psihologici. Cei mai mulŃi conexionişti se situează pe o poziŃie intermediară, referindu-se frecvent la încercările lor ca teoretizări ale "stilului creierului".35

ÎnŃelegerea atât a principiilor psihologice cât şi a modului în care acestea sunt implementate neurofiziologic este mult mai folositoare (şi, într-adevăr, mult mai sigură empiric) decât înŃelegerea doar a uneia dintre ele. Acest lucru este indiscutabil. Întrebarea este dacă avem ceva de câştigat proiectînd modele "stil creier" care nu spun nimic despre felul în care modelul se proiectează la nivelul creierului . Probabil că ideea modelării "stil creier" este aceea că teoriile procesării cognitive ar fi influenŃate de fapte biologice (în mod special de cele ale neuroştiinŃei). Printre faptele biologice care influenŃează modelele conexioniste par a fi următoarele: conexiunile neuronale sunt importante pentru patternurile activităŃii creierului; "engrama" memoriei nu pare să fie localizată spaŃial; la o primă aproximare, neuronii par a fi elemente prag care însumează activitatea recepŃionată la nivelul dendritelor lor; mare parte din neuronii din cortex posedă "câmpuri receptive" multidimensionale, sensibile la o scară îngustă de valori ca număr de parametri; tendinŃa ca activitatea unei sinapse să ducă la "excitarea" unui neuron e modulată de frecvenŃa şi recenŃa excitărilor anterioare. Să presupunem că aceste afirmaŃii, ca şi altele asemănătoare, sunt deopotrivă adevărate şi relevante pentru modul în care funcŃionează creierul - o presupunere care nu pune nici un fel de probleme. Întrebarea pe care noi am putea s-o punem este: ce anume rezultă din aceste fapte, rezultat care să fie relevant pentru deducerea naturii arhitecturii cognitive? Răspunsul inevitabil este că foarte puŃin. Aceasta nu este o afirmaŃie a priori. Gradul relaŃiei dintre faptele de la diferite nivele ale organizării unui sistem este o chestiune empirică. Oricum, n-avem motive să fim sceptici dacă tipurile de proprietăŃi listate anterior se reflectă în vreun fel mai mult sau mai puŃin direct asupra structurii sistemului care realizează raŃionarea.

35 Grupul de Cercetare PDP vede scopul său ca fiind "înlocuirea 'metaforei calculatorului' ca model al psihicului cu 'metafora creierului' ..." (Rumelhart & McClelland, 1986a, Ch. 6, p.75). Dar problema nu e deloc care metaforă ar trebui adoptată; metaforele (fie 'calculator' fie 'creier') tind să fie o acreditare a ceea ce afirmă cineva când are la dispoziŃie mai puŃin decât o ipoteză serioasă. Aşa cum arăta Pylyshyn (1984a), afirmaŃia că mintea umană ar avea arhitectura unui calculator clasic nu este o metaforă, ci o ipoteză literal empirică.

Conexionism şi arhitectură cognitivă: o analiză critică

56

Să considerăm, de exemplu, una dintre cele mai proeminente proprietăŃi ale sistemelor neuronale: sunt reŃele care transmit activări care culminează cu schimbări de stare ale unor elemente quasi-prag. Cu siguranŃă, afirmaŃia că raŃionamentul este răspîndirea excitaŃiei de-a lungul reprezentărilor, sau chiar de-a lungul componentelor semantice ale reprezentărilor n-ar fi o concluzie garantată. La urma urmei, un VAX poate fi la fel de bine caracterizat ca fiind o reŃea de-a lungul căreia sunt transmise excitaŃii care culminează cu schimbări de stare ale elementelor. Chiar şi la nivelul la care operează cu reprezentări, un VAX are literal o arhitectură Von Neumann. Ideea este că structura "nivelelor mai înalte" ale unui sistem este foarte rar izomorfă, sau măcar similară, cu structura "nivelelor mai joase" ale sistemului. Nimeni nu se aşteaptă ca teoria protonilor să fie foarte asemănătoare cu teoria stâncilor sau a rîurilor, deşi putem fi siguri că din aşa ceva sunt "implementate" şi stâncile şi rîurile. Lucretius se înşela cu siguranŃă crezând că trebuie să existe o corespondenŃă simplă între structura teoriilor de macronivel şi cea a teoriilor de micronivel. El credea, de exemplu, că atomii sunt legaŃi prin cîrlige şi găuri. Aşa cum s-a demonstrat, el greşea. Există, fără îndoială, cazuri în care consideraŃii empirice speciale sugerează corespondenŃe detaliate structură/funcŃie sau alte analogii între nivele diferite ale organizării unui sistem. De exemplu, inputul pentru stadiile periferice ale controlului percepŃiei vizuale şi ale locomoŃiei trebuie să fie specificat în termenii unor patternuri proiectate anatomic (ale luminii, în primul caz, şi ale activităŃii musculare, în cel de-al doilea); iar independenŃa dintre structură şi funcŃie este probabil mai redusă în cazul unui sistem ale cărui inputuri şi outputuri trebuie specificate somatotopic. Deci, în aceste stadii e rezonabil să ne aşteptăm ca o structură distribuită anatomic să fie reflectată în cadrul unei arhitecturi distribuite funcŃional. Atunci când procesul cognitiv investigat este la fel de abstract ca raŃionamentul, nu există nici un motiv să ne aşteptăm la izomorfism între structură şi funcŃie: aşa cum, într-adevăr, demonstrează cazul calculatorului. Poate că totul este prea evident pentru ca să merite să fie spus. Însă se pare că trecerea la modelarea "stil creier" conduce la multe din caracteristicile pe care conexioniştii le atribuie psihologiei, şi că asta se întâmplă prin intermediul afirmaŃiei implicite - şi negarantate - că ar putea să existe o asemănare între diferitele nivele ale organizării unui sistem de calcul. Acest lucru este supărător, deoarece cea mai mare parte a psihologiei care a căutat să găsească analogii structurale este puternic recidivistă. Încât ideea că creierul este o reŃea neuronală motivează revenirea unei puternic discreditate psihologii asociaŃioniste. Similar, ideea că activitatea creierului este distribuită anatomic conduce la reprezentări distribuite funcŃional ale unor concepte care, la rândul lor, duc la presupunerea unor microtrăsături; iar erorile teoriilor despre concepte bazate pe caracteristici sunt binecunoscute şi, după cunoştinŃele noatre, teoria microtrăsăturilor n-a făcut nimic pentru corectarea acestora (vezi Bolinger, 1965; J.D. Fodor, 1977). Şi din nou, ideea conform căreia tăria unei conexiuni dintre neuroni e afectată de frecvenŃa co-activărilor lor e proiectată la nivel cognitiv. ConsecinŃa este o revenire a modelelor

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

57

statistice ale învăŃării care sunt arhicunoscute (atât în psihologie cât şi în IA) pentru extrema lor limitare din punct de vedere al aplicabilit ăŃii (Minsky & Papert, 1972; Chomsky, 1957). Atunci deşi, în principiu, cunoştinŃele despre funcŃionarea creierului ar putea direcŃiona modelarea cognitivă într-o manieră benefică, în practică o strategie de cercetare trebuie judecată după rezultatele sale. Principalul rezultat al "modelării stil creier" a fost reînvierea unor teorii psihologice ale căror limitări au fost cunoscute anterior pe scară largă. Pe scară largă, pentru că presupuneri asupra structurii creierului au fost adoptate într-o manieră prea directă ca ipoteze asupra arhitecturii cognitive; este un paradox instructiv faptul că încercările actuale de a fi absolut modern şi de "a lua creierul în serios" ar duce la o psihologie greu de diferenŃiat de cele mai nereuşite modele ale lui Hume şi Berkeley. Morala pare să fie că ar trebui să fim puternic suspicioşi faŃă de tipul eroic de modelare a creierului care pretinde că se adresează problemelor cunoaşterii. Simpatizăm cu dorinŃa pentru teorii biologice respectabile pe care o au mulŃi psihologi. Dar, dacă avem de ales, adevărul este mult mai important decât onorabilitatea.

Comentarii finale: conexionismul ca o teorie a implementării

O temă recurentă în discuŃia anterioară este aceea că multe din argumentele în favoarea conexionismului sunt cel mai bine construite ca postulând o arhitectură cognitivă implementată printr-un fel de reŃea (de "unităŃi" abstracte). Văzute astfel, aceste argumente sunt neutre relativ la întrebarea ce este arhitectura cognitivă.36 În cadrul acestor concluzii vom considera pe scurt conexionismul din acest punct de vedere. Aproape fiecare student care începe un curs de modele computaŃionale sau de procesare a informaŃiei ale cogniŃiei trebuie că e dezorientat de o foarte des întâlnită neînŃelegere privind rolul calculatorului fizic în astfel de modele. StudenŃii sunt aproape întotdeauna sceptici în legătură cu "calculatorul ca model al cunoaşterii" pe motive de tipul: "calculatoarele nu uită şi nu fac greşeli", "calculatoarele funcŃionează pe baza unei căutări complete", "calculatoarele sunt prea logice şi nemotivate", "calculatoarele nu pot învăŃa singure: ele pot doar să facă ceea ce li s-a spus" sau "calculatoarele sunt prea rapide (sau prea lente)" sau "calculatoarele nu obosesc şi nu se plictisesc niciodată" şi aşa mai departe. Dacă adăugăm la această listă unele critici ceva mai sofisticate cum ar fi "calculatoarele

36 Rumelhart şi McClelland susŃin că modelele PDP sunt mai mult decât doar teorii ale implementării, fiindcă (1) ajută la o mai bună înŃelegere a problemei (p.116), (2) studiul PDP-urilor poate conduce la presupunerea unor diferite procese de la nivel macro (p. 126). Ambele puncte se referă la valoarea euristică a teoretizării "brain style". Deci, deşi corecte în principiu, acestea sunt irelevante pentru întrebarea crucială dacă conexionismul este înŃeles mai degrabă ca o încercare de implementare a modelului neuronal sau într-adevăr .....o "nouă teorie a psihicului" incompatibilă cu modelele clasice de procesare a informaŃiei. Este o problemă empirică dacă valoarea euristică a acestei încercări se va demonstra a fi pozitivă sau negativă. Noi ne-am spus deja părerea despre istoria recentă a acestei încercări.

Conexionism şi arhitectură cognitivă: o analiză critică

58

nu prezintă degradare fină" sau "calculatoarele sunt prea sensibile la degradare fizică" lista începe să semene cu argumentele avansate de conexionişti. Răspunsul la toate aceste critici a fost întotdeauna că implementarea, şi toate proprietăŃile asociate cu realizarea particulară a algoritmului pe care teoreticianul îl foloseşte într-un caz particular, este irelevantă pentru teoria psihologică; numai algoritmul şi reprezentările asupra cărora operează acesta sunt presupuse a fi ipoteze psihologice. StudenŃii sunt învăŃaŃi noŃiunea de "maşină virtuală", şi li se demonstrează că anumite maşini virtuale pot învăŃa, uita, face greşeli, se pot plictisi, şi orice altceva ar putea dori cineva, cu condiŃia ca acel cineva să aibă o teorie asupra originii fenomenului empiric respectiv.

Fiind dată această distincŃie principială dintre un model şi implementarea sa, un teoretician impresionat de virtuŃile conexionismului are posibilitatea de a propune PDP-urile ca teorii ale implementării. Dar atunci, departe de a furniza noi baze revoluŃionare pentru ştiinŃa cognitivă, aceste modele sunt în principiu neutre faŃă de natura proceselor cognitive De fapt, ele ar putea fi văzute ca promovând scopurile psihologiei clasice a prelucrării informaŃiei, prin încercarea de a explica modul în care creierul (sau poate o reŃea idealizată de tip creier) poate realiza tipurile de procese pe care le presupune ştiinŃa cognitivă tradiŃională. Conexioniştii îşi consideră uneori explicit propriile modele ca fiind teorii ale implementării. Ballard (1986) se referă chiar la conexionism ca la "încercarea implementaŃională (...)". Touretzky (1986) îşi priveşte în mod clar astfel modelul său BoltzCONS; el foloseşte tehnicile conexioniste pentru a implementa mecanisme convenŃionale de procesare simbolică, cum ar fi stive pushdown sau facilităŃi LISP.37 Rumelhart şi McClelland (1986a, p.117), care sunt convinşi că prin conexionism se dă semnalul unei despărŃiri radicale de încercările convenŃionale de tip procesare de simboluri, se referă cu toate acestea la "implementări PDP" ale unor mecanisme cum ar fi atenŃia. Mai tîrziu, în acelaşi eseu, ei îşi afirmă explicit poziŃia: contrar "reducŃioniştilor", ei cred " ... că noi şi folositoare concepte apar la diferite nivele de organizare". Deşi ei astfel apără afirmaŃia că nivelele mai înalte ar putea fi înŃelese "... cu ajutorul studiului interacŃiunilor dintre unităŃile de la nivelele inferioare", ideea de bază că există nivele autonome apare implicit pe tot parcursul eseului. Dar odată ce cineva admite că există cu adevărat principii de nivel cognitiv diferite de principiile arhitecturale (prezumtive) pe care le susŃin conexioniştii, par să rămână foarte puŃine de dezbătut. Evident că nu are sens să ne întrebăm dacă

37 Chiar în acest caz, când modelul este proiectat special pentru a implementa caracteristici de tip LISP, unii conexionişti uită să păstreze distincte nivelele implementaŃional - algoritmic. Aceasta conduce la discuŃii despre "proprietăŃi emergente" şi la afirmaŃia că, chiar atunci când implementează mecanisme de tip LISP, sistemele conexioniste "pot face lucrurile în moduri în care maşinile Turing sau calculatoarele Von Neumann nu pot." (Touretzky, 1986). O asemenea afirmaŃie sugerează că Touretzky face deosebire între diferite "moduri de calcul" nu în termeni de algoritmi diferiŃi, ci în termeni de diferite moduri de implementare ale aceluiaşi algoritm. Dat fiind că nimeni nu deŃine o definiŃie brevetată a unor termeni ca "mod de calcul", acesta pare un mod eronat de a pune problema; înseamnă că o maşină DEC foloseşte un "mod diferit de calcul" faŃă de o maşină IBM atunci când execută acelaşi program.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

59

cineva ar trebui sau nu să abordeze ştiinŃa cognitivă prin intermediul studiului "interacŃiunii dintre nivelele inferioare" sau -dimpotrivă- prin intermediul studiului proceselor de la nivel cognitiv, de vreme ce cu siguranŃă trebuie făcute amândouă. Unii oameni de ştiinŃă studiază principiile geologice, alŃii studiază "interacŃiunea unităŃilor de la nivelul inferior", adică moleculele. Dar de vreme ce faptul că există principii originale, autonome, ale geologiei nu este niciodată pus în discuŃie, cei care construiesc modele la nivel molecular nu afirmă că ar fi inventat "o nouă teorie a geologiei" care va renunŃa la toată discuŃia aceea de modă veche de tip "folclor geologic" despre stânci, râuri şi munŃi! Nu avem, pe scurt, nici o obiecŃie faŃă de ideea reŃelelor ca modele potenŃiale de implementare, nici nu presupunem că vreunul din argumentele pe care vi le-am oferit sunt incompatibile cu această propunere. Problema este, oricum, că în cazul în care conexioniştii vor ca modelele lor să fie construite aşa, atunci vor trebui să-şi modifice radical practica. Pentru că pare absolut evident că cele mai multe din modelele conexioniste, care au fost efectiv propuse, trebuie interpretate ca teorii ale cunoaşterii şi nu ca teorii ale implementării. Aceasta reiese din faptul că este intrinsec acestor teorii faptul că atribuie un conŃinut reprezentaŃional unităŃilor (şi/sau ansamblurilor de unităŃi) pe care le presupun. Şi, aşa cum am remarcat la început, o teorie a relaŃiilor dintre stările reprezentaŃionale este ipso facto o teorie la nivelul cogniŃiei şi nu la nivelul implementării. A fost un refren al discuŃiei noastre faptul că, atunci când e înŃeles mai degrabă ca o teorie cognitivă decât ca una a implementării, conexionismul pare să prezinte limitări fatale. Problema cu modelele conexioniste este că toate motivele care ne fac să credem că ele ar putea fi corecte ne conduc la a crede că aceasta nu poate fi psihologie.

CONCLUZIE

Care sunt, în concluzie, opŃiunile pentru dezvoltarea ulterioară a teoriilor

conexioniste? Atât cât ne putem da seama, există patru căi pe care acestea le-ar putea urma: (1) Să menŃină reprezentările mentale nestructurate împotriva punctului de vedere

clasicist conform căruia reprezentările mentale au semantică şi sintaxă combinatorică. Argumentele productivităŃii şi sistematicităŃii fac ca această opŃiune să nu pară atractivă.

(2) Să abandoneze arhitectura de tip reŃea în favoarea reprezentărilor mentale structurate, dar să continue să insiste asupra unui demers asociaŃionist al naturii proceselor mentale. Aceasta este, în fapt, o revenire la abordarea psihicului de către Hume (vezi nota de subsol 29), şi prezintă o problemă care noi nu credem că poate fi rezolvată: deşi reprezentările mentale sunt, după presupunerile actuale, obiecte structurate, asociaŃia nu este o relaŃie sensibilă la structură". Problema e atunci cum să reconstruim coerenŃa semantică a gândirii fără a presupune procese psihologice sensibile la structura reprezentărilor mentale. (Echivalent, în termeni mai moderni, ar fi: cum să facem relaŃiile cauzale din

Conexionism şi arhitectură cognitivă: o analiză critică

60

cadrul reprezentărilor mentale să oglindească relaŃiile semantice fără să presupunem o tratare în spiritul teoriei demonstraŃiei a inferenŃei şi - mai general - o tratare a coerenŃei semantice care e exprimată sintactic, în spiritul acestei teorii.) Aceasta este problema în care s-a împotmolit asociaŃionismul tradiŃional, iar perspectivele actuale de soluŃionare nu par mai bune decât acum două sute de ani. Altfel spus: dacă ai nevoie de structură în reprezentările mentale, fără a Ńine cont de productivitatea şi sistematicitatea sistemelor psihice, de ce să nu postulezi procese mentale care sunt senzitive structural în contul coerenŃei proceselor mentale? Pe scurt, de ce să nu fii un clasicist?

În orice caz, observaŃi că opŃiunea curentă dă imaginii clasiciste o mare parte din ceea ce îşi doreşte: anume, identificarea stărilor semantice cu relaŃii între şiruri structurate de simboluri şi identificarea proceselor mentale cu transformările acestor şiruri. ObservaŃi de asemenea că, aşa cum stau acum lucrurile, această propunere e utopică, dat fiind faptul că nu există propuneri serioase de încorporare a structurilor sintactice în cadrul arhitecturilor conexioniste.

(3) Să trateze conexionismul ca o teorie a implementării. Nu avem obiecŃii principiale faŃă de acest punct de vedere (deşi există, aşa cum unii conexionişti au descoperit, motive tehnice pentru care reŃelele reprezintă adesea o cale ciudată de a implementa maşini clasice). Această opŃiune ar necesita rescrierea unei mari cantităŃi de material polemic, legat de ceea ce fac reŃelele operând asupra structurilor simbolice, mai degrabă decât răspândind activarea de-a lungul unor noduri interpretate semantic.

Pe deasupra, această revizuire a politicii va duce cu siguranŃă la pierderea multor fani ai mişcării. Aşa cum am arătat, mulŃi oameni au fost atraşi de încercările conexioniste datorită promisiunilor de a: (a) desfiinŃa nivelul simbolic al analizei, şi (b) de a ridica neuroştiinŃa la tratarea directă a problemelor cogniŃiei. Dacă conexionismul e considerat pur şi simplu ca o teorie a modului în care cogniŃia este implementată neuronal, el nu poate constrânge modelele cognitive mai mult decât teoriile din biofizică, biochimie sau, în acest caz, din mecanica cuantică. Toate aceste teorii se ocupă de asemenea cu procesele care implementează cogniŃia, şi toate par a presupune structuri destul de diferite de arhitectură cognitivă. Ideea este că "implementează" este tranzitiv, şi se aplică descendent.

(4) Să renunŃe la ideea că reŃelele oferă (ca să-i cităm pe Rumelhart şi McClelland, 1986a, p.110) "... o bază rezonabilă pentru modelarea proceselor cognitive în general". S-ar putea încă păstra ideea că reŃelele susŃin unele procese cognitive. E probabil că ele susŃin procese care pot fi evidenŃiate prin inferenŃe statistice; atât cât ne putem da seama, modelele de tip reŃea sunt doar maşini analogice pentru calcularea acestor inferenŃe. De vreme ce ne îndoim că procesarea cognitivă ar consta în mare parte din analizarea relaŃiilor statistice, aceasta ar fi o estimare modestă a perspectivelor teoriei reŃelelor comparativ cu ceea ce au oferit înşişi conexioniştii.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

61

Aceasta e, de exemplu, o cale de a înŃelege ce se întîmplă în dialogul dintre Rumelhart şi McClelland (1986b), respectiv Prince şi Pinker (1988), deşi nici un articol nu pune problema exact în aceşti termeni. În fapt, Rumelhart şi McClelland presupun un mecanism care, primind ca date de intrare un set de stimuli-perechi furnizate de un "profesor", calculează corelaŃia statistică dintre forma fonologică a terminaŃiei verbului şi forma fonologică a articulării la participiu trecut. (Mărimea corelaŃiilor astfel calculate este reprezentată analogic prin ponderile pe care reŃeaua le arată pe asimptotă). Dată fiind problema articulării unei noi rădăcini verbale cu terminaŃia specificată fonologic, maşina alege forma de participiu trecut cel mai des corelată cu secvenŃa din setul de antrenament. Prin contrast, Prince şi Pinker argumentează (de fapt) că, în învăŃarea morfologiei timpului trecut, trebuie să fie implicat mai mult decât simpla estimare de corelaŃii, deoarece ipoteza statistică verifică prea puŃin din datele ontogenetice.

Există o alternativă la ideea empiristă, care afirmă că toată învăŃarea constă într-un fel de inferenŃă statistică, realizată prin ajustarea unor parametri; aceasta este ideea raŃionalistă, ce postulează că un anumit tip de învăŃare este un fel de costrucŃie a unei teorii, realizată prin formularea de ipoteze şi testarea acestora. Ni se pare că am mai văzut acest argument undeva. Ne aflăm în faŃa unei senzaŃii chinuitoare de deja vu.

REFERINłE

Arbib, M.(1975). Artificial intelligence and brain theory: Unities and diversities. Biomedical Engineering, 3, 238-274.

Ballard, D.H. (1986). Cortical connections and parallel processing: Structure and function. The Behavioral and Brain Sciences, 9, 67 -120.

Ballard, D.H. (1986). Parallel Logical Inference and Energy Minimization. Report TR142, Computer Science Department, University of Rochester.

Black, I.B. (1986). Molecular memory mechanisms. In Lynch, G. (Ed.), Synapses, circuits, and the beginnings of memory, Cambridge, MA: M.I.T. Press, A Bradford Book.

Bohnger. D. (1965). The atomization of meaning. Language, 41, 555-573. Benadbent, D. (1985). A question of levels: Comments on McClelland and

Rumelhart. Journal of Experimental Psyhology: General,144, 189-192. Caroll, L. (1956). What the tortoise said to Achilles and other riddles. In

Newman, J.R.(Ed.), The world of mathematics: Volume Four. New York: Simon and Schuster.

Chomsky, N. (1957).Syntactic structures. The Hague: Mouton. Chomsky, N. (1965). Aspects of the theory of syntax. Cambridge: MA;

M.I.T.Press. Chomsky, N. (1968). Language and mind. New York: Harcourt, Brace and

World.

Conexionism şi arhitectură cognitivă: o analiză critică

62

Churchland, P.M. (1981). Eliminative materialism and the propositional attitudes. Journal of Philosophy, 78, 67-90.

Churchland, P.S. (1986). Neurophilosophy. Cambridge, M.A.: M.I.T. Press. Cummings (1983). The nature of psyhological explanation. Cambridge,

M.A.: M.I.T. Press. Denett, D. (1986).The logical geography of computational approaches: A

view from the east pole. In Brand, M., & Harnish, M.(Eds.), The representation of knowledge. Tuscon, AZ: The University of Arizona Press.

Dreyfus, H., & Dreyfus, S. (in press). Making a mind vs. modelling the brain: A.I. back at a branch point. Daedalus.

Fahlman, S.E., & Hinton, G.E. (1987). Connectionist architectures for artificial intelligence. Computer, 20, 100-109.

Feldman, J.A. (1986). Neural representation of conceptual knowledge. Report TR189. Department of Computer Science, University of Rochester.

Feldman, J.A., & Ballard, D.H. (1982). Connectionists models and their properties. Cognitive science, 6. 205-254.

Fodor, J. (1976). The language of thought. Harvester Press, Sussex. (Harvard University Press paperback).

Fodor, J.D. (1977). Semantics: Theory of meaning in generative grammar. New York: Thomas Y. Crowell.

Fodor, J. (1987). Psychosemantics. Cambridge, MA: M.I.T. Press. Geach, P. (1957). Mental acts. London: Routledge and Kegan Paul. Hewett, C. (1977). Viewing control structures as patterns of passing

messages. The Artificial Intelligence Journal, 8, 232-364. Hillis, D. (1985). The connection machine. Cambridge, MA: M.I.T. Press. Hinton, G. (1987). Representing part-whole hierarchies in connectionist

networks. Unpublished manuscript. Hinton, G.E., McClelland, J.L., & Rumelhart, D.E. (1986). Distributed

representations. In Rumelhart, D.E., McClelland, J.L. and the PDP Research Group, Parallel distributed processing: Explorations in the microstructure of cognition. Volume I: Foundations. Cambridge, MA: M.I.T. Press/Bradford Books.

Hofstadter, D.R. (1983). Artificial intelligence: Sub-cognition as computation. In F. Machlup & U. Mansfield (Eds.), The study of information: Interdisciplinary messages. New York: John Wiley & Sons.

Kant, I. (1929). The critique of pure reason. New York: Harper & Row. Katz, I. (1929). Semantic theory. New York: Harper & Row. Katz, J.J., & Fodor, J.A. (1963). The structure of a semantic theory,

Language, 39, 170-210. Katz, J., & Postal, P. (1964). An integrated theory of linguistic descriptions.

Cambridge, MA: M.I.T. Press. Kosslyn, S.M., & Gatfield, G. (1984). Representation without symbol

systems. Social Research, 51, 1019-1054.

Martie – Iunie 1999 •••• CogniŃie, Creier, Comportament

63

Laird, J.E., Rosenbloom, P.S., & Newell, A. (1986). Universal subgoaling and chunking: The automatic generation and learning of goal hierarchies. Boston, MA, Kluwer Hingham Publishers.

Lakoff, G. (1986). Connectionism and cognitive linguistics. Seminar delivered at Princeton University, December 8, 1986.

Makworth, A. (1987). Constraint propagatio. In Shapiro, S.C. (Ed.), The encyclopedia of artificial intelligence, Volume 1. New York: John Wiley & Sons.

McClelland, J.L., Feldman, J., Andelson, B., Bower, G., & McDermott, D. (1986). Connectionist models and cognitive science: Goals, directions and implications. Report to the National Science Foundation, June 1986.

McClelland, J.L., & Kawamoto, A.H. (1986). Mechanism of sentence processing: Assigning roles to constituents. In McClelland, Rumelhart and the PDP Research Group (Eds.), Parallel distributed processing: volume 2. Cambridge, MA: M.I.T. Press, Bradford Books.

McClelland, J.L., Rumelhart, D.E., & Hinton, G.E. (1986). The appeal of parallel distributed processing. In Rumelhart, McClelland and the PDP Research Group, (Eds.), Parallel distributed processing: volume 1. Cambridge, MA: M.I.T. Press/Bradford Books.

Minsky, M., & Papert, F. (1972). Artificial Intelligence Progress Report, AI Memo 252, Massachusetts Institute of Technology.

Newell, A. (1969). Heuristic programming: Ill-structured problems. In Aronofsky, J. (Ed.), Progress in operations research, III. New York: John Wiley & Sons.

Newell, A. (1980). Physical symbol systems. Cognitive Science, 4, 135-183.

Newell, A. (1982). The knowledge level. Artificial Intelligence, 18, 87.127. Osherson, D., Stov, M., & Weinstein, S. (1984). Learning theory and

natural language. Cognition, 17, 1-28. Pinker, S. (1984). Language, learnability and language development.

Cambridge: Harvard University Press. Prince, A., & Pinker, S. (1988). On language and connectionism: Analysis

of a parallel distributed processing model of language acquisition. Cognition, 28, this issue.

Pylyshyn, Z.W. (1980). Cognition and computation: Issues in the foundations of cognitive science. Behavior and Brain Sciences, 3:1, 154-169.

Pylyshyn, Z.W. (1981). The imagery debate: Analogue media versus tacit knowledge. Psychological Review, 88, 16-45.

Pylyshyn, Z.W. (1984a). Computation and cognition: Toward a foundation for cognitive science. Cambridge, MA: M.I.T. Press, A Bradford Book.

Pylyshyn, Z.W. (1984b). Why computation requires symbols, Prooceedings of the Sixth Annual Conference of the Cognitive Science Society, Bolder, Colorado, August, 1984. Hillsdale, NJ: Erlbaum.

Rakic, P. (1975). Local circuit neurons. Neurosciences Research Program Bulletin, 13, 299-313.

Conexionism şi arhitectură cognitivă: o analiză critică

64

Rumelhart, D.E. (1984). The emergence of cognitive phenomena from sub-simbolic processes. In Proceedings of the Sixth Annual Conference of the Cognitive Science Society, Bolder, Colorado, August, 1984, Hillsdale, NJ: Erlbaum.

Rumelhart, D.E., & McClelland, J.L. (1985). Level’s indeed! A response to Broadbent. Journal of Experimental Psychology: General, 114, 193-197.

Rumelhart, D.E., & McClelland, J.L. (1986a). PDP Models and general issues in cognitive science. In Rumelhart, D.E., McClelland and PDP Research Group (Eds.), Parallel distributed processing, volume 1. Cambridge, MA: M.I.T. Press, A Bradford Book.

Rumelhart, D.E., & McClelland, J.L. (1986b). On learning the past tenses of English verbs. In Rumelhart, D.E., McClelland and PDP Research Group (Eds.), Parallel distributed processing, volume 1. Cambridge, MA: M.I.T. Press, A Bradford Book.

Schneider, W. (1987). Connectionism: Is it a paradigm shift for psychology? Behavior Research Methods, Instruments, & Computers, 19, 73-83.

Sejnowsky, T.J. (1981). Skeleton filters in the brain. In Hinton, G.E., & Anderson, A.J. (Eds.), Parallel models of associative memory. Hillsdale, NJ: Erlbaum.

Simon, H.A., & Chase, W.G. (1973). Skill in chess. American Scientist, 621, 394-403.

Smolensky, P. (1988). On the proper treatment of connectionism. The Behavioral and Brain Sciences, 11, 1-74.

Stabler, E. (1985). How are grammars represented? Behavioral and Brain Science, 6, 391-420.

Stich, S. (1983). From folk psychology to cognitive science. Cambridge, MA: M.I.T. Press.

Touretzky, D.S. (1986). BoltzCONS: Reconciling connectionism with the recursive nature of stacks and trees. Proceedings of the Eighth Annual Conference of the Cognitive Science Society. Amherst, MA, August, 1986, Hillsdale, NJ: Erlbaum.

Wanner & Maratsos, M. (1978). An ATN approach to comprehension. In Halle, M., Nresnan, J., & Miller, G.A. (Eds.), Linguistic theory and psychological reality. Cambridge, MA: M.I.T. Press.

Watson, J. (1930). Behaviorism. Chicago: University of Chicago Press. Ziff, P. (1960). Semantic analysis. Ithaca, NY: Cornell University Press.