262
Poukladać matematykę (lub przynajmniej próbować) Grzegorz Jarzembski Wydzial Matematyki i Informatyki Uniwersytet M. Kopernika w Toruniu

Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Poukładać matematykę(lub przynajmniej próbować)

Grzegorz JarzembskiWydział Matematyki i Informatyki

Uniwersytet M. Kopernika w Toruniu

Page 2: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Spis treści

1 Liczby naturalne 91.1 Liczba naturalna - co to jest? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1.1 Liczby naturalne w teorii mnogości . . . . . . . . . . . . . . . . . . . . . . . . 111.2 Nieskończoność potencjalna czy aktualna? . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Nieskończoność kontrolowana 152.1 Matematyczny konstruktywizm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Struktury rekurencyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.3 Struktury rekurencyjne w metamatematyce . . . . . . . . . . . . . . . . . . . . . . . 22

2.3.1 Gramatyki i języki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.3.2 Dowodzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.3.3 Dodatek: jaką nieskończoność tolerują komputery? . . . . . . . . . . . . . . . 26

3 Przestrzeń - matematycznie 283.1 Przestrzeń - co to jest? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.2 Kontinuum - przedmiot (ciągłego) sporu . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.1 Metafora geometryczno-liczbowa . . . . . . . . . . . . . . . . . . . . . . . . . 323.2.2 Wielkości graniczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.2.3 Od Kartezjusza do przestrzeni Hilberta . . . . . . . . . . . . . . . . . . . . . 37

3.3 O continuum nieco inaczej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.3.1 Liczby p-adyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4 Zadziwiająca kariera dodawania i mnożenia . . . . . . . . . . . . . . . . . . . . . . . 45

4 Spór o istotę matematycznego bytu 484.1 Koncepcja Hilberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.2 Rola teoria mnogości w koncepcji Hilberta . . . . . . . . . . . . . . . . . . . . . . . . 544.3 Opozycja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.4 Czy jest coś oprócz języka? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.4.1 O konstruktywiźmie Brouwera (subiektywnie) . . . . . . . . . . . . . . . . . . 62

5 Język matematyki 705.1 Języki naturalne i formalne: dwa mity. . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.1.1 Logika języka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715.2 Język matematyki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5.2.1 Co to jest „własność”? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745.2.2 Genialny wynalazek: formuła . . . . . . . . . . . . . . . . . . . . . . . . . . . 775.2.3 Równie genialny pomysł - termy . . . . . . . . . . . . . . . . . . . . . . . . . 78

5.3 Diabelska sztuczka - kwantyfikatory . . . . . . . . . . . . . . . . . . . . . . . . . . . 795.3.1 Nowy rodzaj zdań . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 805.3.2 Dodatek: zmienne w informatyce . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.4 Skąd się biorą teorie? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 865.4.1 Rozwój teorii matematycznej . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

1

Page 3: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

SPIS TREŚCI 2

5.4.2 Trzeci wymiar języka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6 Arytmetyka 926.1 Język arytmetyki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 936.2 Ważne pytanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

6.2.1 Orzekać = rozstrzygać? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 946.2.2 Orzekać = dowodzić? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.3 Twierdzenie Godla - po raz pierwszy . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

7 Obliczalność 1027.1 Maszyna Turinga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

7.1.1 Klasyfikacja języków Chomsky’ego revisited . . . . . . . . . . . . . . . . . . . 1067.1.2 Maszyna uniwersalna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

7.2 Funkcje obliczalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1097.2.1 Funkcje obliczalne według Kleene’ego . . . . . . . . . . . . . . . . . . . . . . 1107.2.2 Efektywna numeracja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7.3 Maszyny Turinga z wyrocznią . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1147.3.1 Arytmetyki słabsze niż PA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1157.3.2 Krok w bok: rekurencja, iteracja i fraktale . . . . . . . . . . . . . . . . . . . . 117

1207.4.1 Systemy redukcji wyrażeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

7.5 λ-rachunek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1247.5.1 Maszyny Turinga a λ-rachunek . . . . . . . . . . . . . . . . . . . . . . . . . . 1277.5.2 Glossa: skąd się wziął λ-rachunek? . . . . . . . . . . . . . . . . . . . . . . . . 128

7.6 Hipoteza Churcha i twierdzenie Tennenbauma . . . . . . . . . . . . . . . . . . . . . 1307.6.1 Obliczalność funkcji rzeczywistych . . . . . . . . . . . . . . . . . . . . . . . . 131

7.7 Złożoność obliczeniowa czyli o pragmatyce języka obliczeń . . . . . . . . . . . . . . . 1327.7.1 Algorytmy kwantowe - krótko . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.8 Liczba Ω Chaitina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1367.8.1 Wielki Wybuch i Collapsing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

8 Twierdzenia Godla 1428.0.1 Niezupełność PA - pierwsze twierdzenie Godla . . . . . . . . . . . . . . . . . 1428.0.2 Powrót do źródeł . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

8.1 Zdanie godlowskie G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1458.1.1 O praprzyczynie pewnych niemożności . . . . . . . . . . . . . . . . . . . . . . 147

8.2 Niesprzeczność arytmetyki Peano - drugie twierdzenie Godla . . . . . . . . . . . . . . 1508.3 Próba bilansu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

9 Wokół koncepcji prawdy Tarskiego 1569.1 Koncepcja Tarskiego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1569.2 Syntaktyka - składnia języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . 1589.3 Modele logiki pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

9.3.1 Pierwotny model logiki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1599.4 Teoriomnogościowe modele języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . 161

9.4.1 Jeszcze jedno twierdzenia Godla . . . . . . . . . . . . . . . . . . . . . . . . . 1619.4.2 Ograniczenia języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . 163

9.5 Modele teoriomnogościowe i nominalizm . . . . . . . . . . . . . . . . . . . . . . . . . 1669.5.1 Dodatek: intuicjonistyczna logika temporalna (tekst roboczy) . . . . . . . . . 168

Page 4: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

SPIS TREŚCI 3

10 Pewna szczególna teoria - ZFC 17010.1 Modele ZFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

10.1.1 ZFC, ZFC− i arytmetyka Peano . . . . . . . . . . . . . . . . . . . . . . . . 17410.1.2 Kłopoty (to moja specjalność)... . . . . . . . . . . . . . . . . . . . . . . . . . 17510.1.3 Twierdzenie Łosia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

10.2 Konsekwencje twierdzenia Łosia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18010.3 Matematyczne uniwersum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

10.3.1 Model zamierzony ZFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18410.3.2 Superstruktury i niestandardowe uniwersa . . . . . . . . . . . . . . . . . . . . 18710.3.3 Wilk w owczej skórze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18910.3.4 Dlaczego ZFC? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

11 Logika intuicjonistyczna 19311.1 Konsekwencja i implikacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19311.2 Źródła logiki intuicjonistycznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

11.2.1 Formalizacja zdaniowej logiki intuicjonistycznej . . . . . . . . . . . . . . . . . 19611.3 Semantyka Kripkego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

11.3.1 Semantyka algebraiczna i topologiczna . . . . . . . . . . . . . . . . . . . . . 20211.4 Logika intuicjonistyczna pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . 203

11.4.1 Arytmetyka intuicjonistyczna . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

12 Kategorie, funktory i toposy 20612.1 Język kategorii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

12.1.1 Teoria mnogości v. teoria kategorii - okiem pragmatyka . . . . . . . . . . . . 21012.1.2 Izomorfizm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

12.2 Toposy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21112.3 Przykłady toposów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21312.4 Logika toposu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

12.4.1 Semantyka języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . 22012.5 Teoria zbiorów a teoria toposów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

13 Od logiki do toposów 22413.1 Topos snopów revisited . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22413.2 Topos H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

13.2.1 Punkty i elementy - od H-obiektów do H-snopów . . . . . . . . . . . . . . . 22613.2.2 Podobiekty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22913.2.3 Matematyka toposa - więcej niż przykład . . . . . . . . . . . . . . . . . . . . 231

13.3 Morfizmy geometryczne, teorie geometryczne . . . . . . . . . . . . . . . . . . . . . . 23413.3.1 Frames, locales i algebry Heytinga . . . . . . . . . . . . . . . . . . . . . . . . 23513.3.2 Teorie geometryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23513.3.3 Funktory logiczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

13.4 Czy nieskończona logika jest logiką? . . . . . . . . . . . . . . . . . . . . . . . . . . . 23813.4.1 Czy przestrzeń topologiczna powinna być trzeźwa? . . . . . . . . . . . . . . . 239

14 Od realizowalności do toposu Hylanda 24214.1 Realizowalność Kleene’ego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24214.2 Kategoria zbiorów efektywnych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24614.3 Topos Hylanda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

14.3.1 Logika toposu Hylanda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

Page 5: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Proces nie jest rzeczą.Raczej rzecz jest stanem procesu.

Jeśli uważasz, że trud poznania jest uzasadniony tylko wtedy, gdy przynosi praktyczną korzyść- daj sobie spokój.

Jeśli choć raz na jakiś czas pytasz o sens tego, co robisz, to ten tekst jest dla ciebie. To tekstdla tych, którzy zechcą zmierzyć się z pytaniem „czym jest matematyka?” w sposób wolny od edu-kacyjnego przymusu, powodowani li tylko czystą ciekawością. Wykształcenie matematyczne jakiezdobywamy w szkołach i na uczelniach jest, delikatnie mówiąc, niedoskonałe1. We wspomnieniachwiększości edukacja matematyczna to ciągła konfrontacja naszych ograniczonych zdolności z do-skonałością jaką w wydaniu szkolnym i uniwersyteckim jest matematyka. Ta konfrontacja zawsze -wcześniej lub poźniej - kończy sie kapitulacją2.

Powszechne przekonanie o doskonałości matematyki to skutek edukacji, która z bezwarunkowejakceptacji jej podstawowych i jednocześnie wysoce abstrakcyjnych założeń czyni warunek przyna-leżności do grona wtajemniczonych. Trafnie - choć nie wiem, czy w sposób zamierzony - napisało tym J. Pogonowski rozpoczynając jeden ze swoich wykładów: „Proszę, aby słuchacze na czastego wykładu uwierzyli w pewne dogmaty. Nie jest tego wiele: aksjomaty teorii mnogości (Zermelo-Fraenkla) oraz aksjomaty arytmetyki Peana (...) . W szczególności, proszę (...) wierzyć w istnienieco najmniej jednego zbioru nieskończonego.” [93]. Te słowa, kierowane do słuchaczy popularnonau-kowego wykładu, zdają się sugerować, że matematycy potrafią zastąpić wiarę wiedzą o słusznościi niepodważalności podstawowych założeń matematyki. Ale to nieprawda.

Matematyka szkolno-uniwersytecka to świat aż nadto poukładany, bez luk i czarnych dziur.Pewność i niezawodność. Raj3. Ogrom matematyki przytłacza jak rzymska bazylika św. Piotra.Jako studenci przyjmujemy z pokorą, że nie wszystko rozumiemy. Gotowi jesteśmy akceptowaćprezentowane (narzucane) koncepcje w nadziei, że kiedyś poznamy argumenty przekonujące o ichsłuszności. Ale to zdarza się nader rzadko - wiekszość studentów matematyki opuszcza uniwersytetyraczej z wiarą w sens matematyki niż ze zrozumieniem jej źródeł i podstaw4.To nie ich wina. Tak jest, bo - w większości - wykładowcy zachowują się tak, jakby dyskusja o pod-stawach matematyki była czymś wstydliwym. Niby znamy ograniczenia teorii mnogości ujawnioneprzez Godla i Cohena, ale rzadko o tym mówimy (myślimy)5. Uznajemy, że podstawy matematy-ki to tylko jeden z wielu działów matematyki, domena grupy specjalistów, tzw. „podstawowców”.Nam nic do tego.M. Kordos pisał o takim kształtowaniu postaw adeptów matematyki tak: „Model jest jasny. Wpra-wiamy siebie i swoich uczniów w pewnego rodzaju mistyczny sen, w którym przeżywamy naszematematyczne sukcesy, porażki, odkrycia i rozczarowania. I można by to nawet prześladować, jakozbiorową hipnozę, (...) gdyby nie jedno, co budzi w pospólstwie zabobonny lek:

1Nikt nic nie czyta, a jeśli czyta, to nic nie rozumie, a jeśli nawet rozumie, to nic nie pamięta. - S. Lem.2Nie dotyczy to nielicznej grupy prawdziwych matematyków i licznej grupy zarozumialców. Trzeba bowiem ogrom-

nej wiedzy (bądź równie wielkiej zarozumiałości) by stwierdzić „ogarniam i rozumiem matematykę”. Nawet będącwybitnym specjalistą w jednej dziedzinie matematycznej skazani jesteśmy na ignorancję w innych.3”Nikt nas nie wyprowadzi z raju stworzonego przez Cantora”4Są i tacy, którzy kończą studia z mniejszą wiarą niż ta, z którą zaczynali edukację...5B. Russell, jedna z głównych postaci tego tekstu twierdził, że jego (wspólne z A. Whiteheadem) dzieło „Principia

Mathematica” przeczytało ... pięć osób. A liczba odwołań do niego jest niemal nieskończona. Dla ścisłosci: ja też nie.

4

Page 6: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

SPIS TREŚCI 5

zdumiewająca i niewytłumaczalna skuteczność matematyki.” [63]6

The courses in the foundations of mathematics (...) emphasize the mathematical analysis offormal systems, at the expense of philosophical substance. Thus it is the mathematical professionthat tends to equate philosophy with the study of formal systems, which require knowledge oftechnical theorems for comprehension. They do not want to learn yet another branch of mathematicsand therefore leave the philosophy to the experts. As a consequence, we prove these theoremsand we do not know what they mean. - to z kolei opinia E. Bishopa7.

Myśla tyle, co wartoani chwili dłużej,bo za tą chwilączai się wątpliwość ...8

Czasem jednak zdarza się coś szczególnego. Oto jak swój przypadek opisał P.J. Davis, współ-autor książki „Świat matematyki” [36]: „Jeszcze pięć lat temu byłem normalnym matematykiem.(...) Miałem swoją dziedzinę - równania różniczkowe cząstkowe - i w niej tkwiłem (...). Mój sposóbmyślenia i moje prawdziwe życie intelektualne opierały się na kategoriach i metodach analizy, któreprzyswoiłem wiele lat temu (...). Ponieważ nie wychylałem się daleko poza te kategorie i metody,miałem jedynie ich niejasną świadomość. (...) Mój awans zależał od moich badań i publikacji (...)Osąd innych osób pracujących w mojej dziedzinie decydował o wartości tego, co robiłem. Nikt innynie miał po temu kwalifikacji i jest wątpliwe, czy ktokolwiek poza nimi byłby tym zainteresowa-ny. Moje uwolnienie od takiej postawy tzn. uświadomienie sobie, że jest ona tylko jednym z wielusposobów patrzenia na świat, (...) wcale nie było potrzebne w mojej karierze. Przeciwnie, takie nie-ortodoksyjne i wątpliwe przedsięwzięcie w najlepszym razie mogły się wydać głupim marnowaniemczasu, a w najgorszym - rozwiązłym zanurzeniem w tak wątpliwych i podejrzanych sprawach jakpsychologia, socjologia czy filozofia...”

Refleksja nad istotą matematyki ustąpiła pragmatyzmowi... To postawa „pracujących matematyków”,którzy stanowią zdecydowaną większość matematycznej społeczności9. Rozważanie podstawowych dyle-matów jest dla niespecjalistów przedsięwzięciem wysokiego ryzyka, gdyż -jak miał odwagę napisać L.Susanka -„dithering about foundational matters can easily get you branded as a crank or a heretic, nota career enhancing event” [115]10.

Paradoksalnie, taką postawę większości matematyków można tłumaczyć... chęcią sprostania wy-magom naukowej rzetelności. Przecież przed sformułowaniem własnego sądu w kwestii podstaw ma-tematyki, winniśmy poznać i zrozumieć(?) poglądy genialnych myślicieli, logików i matematyków,od Arystotelesa do Godla. A my, zajęci karierą, zobowiązani do zdobywania kolejnych stopni, poprostu nie mamy czasu! Jeśli nawet podejmiemy wyzwanie, to szybko odkrywamy, że utknęliśmy wgąszczu specjalistycznej terminologii i utonęliśmy w morzu cytatów. Jeśli cudem przebrniemy przezchoćby ułamek tego, co dostępne w bibliotekach i internecie, to stwierdzamy, że poznanie różnych -często przeciwstawnych - poglądów niewiele zbliżyło nas do określenia własnego stanowiska. Ogar-nia nas zwątpienie i zniechęcenie. Jaką mamy szansę powiedzieć coś własnego o fundamentalnychproblemach dogłębnie przemyślanych przez takich geniuszy jak Arystoteles, Leibniz, Kartezjusz,Cantor, Hilbert, Church, Godel, Tarski? Narasta poczucie, że jesteśmy intruzem w świecie gigan-tów. A skoro tak, to jakie mamy prawo do głoszenia własnego sądu? Jaką szansę, że będzie on choćodrobinę oryginalny?

To nie jest zażalenie na reguły współczesnej nauki. Tak nie tylko jest, ale tak powinno być.Brutalnie kawę na ławę wyłożył C. F. von Weizsacker:

6Profesorowie J. Pogonowski i M.Kordos to znakomici polscy popularyzatorzy matematyki.7E. Bishop: The Crisis in Contemporary Mathematics, Historia Mathematica 2, 507-515, 1975.Erret Bishop (1928-

1983), amerykański matematyk-konstruktywista, autor „Foundations of Constructive Analysis”.10Pragmatyk = człowiek odznaczający się praktycznym sposobem myślenia i działania. „ primum vivere, dein-

de philosophari”- najpierw żyć, potem filozofować. A termin „pracujący matematyk” („robotnik matematyki”) -„working mathematician” pożyczyłem od S. McLane’a [73].

Page 7: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

SPIS TREŚCI 6

Ogólnie rzecz biorac, fizyk podobnie jak każdy inny naukowiec - ma za zadanie odpowiedziećna (...) pytania, na które aktualnie jest w stanie odpowiedzieć. Nie wolno mu stawiać pytań zatrudnych.(...) Fizyk nie może pytać: co to jest materia? co to jest czas lub przestrzeń? Biolog niemoże pytać: co to jest życie? Psycholog nie może pytać: co to jest umysł? Wszyscy oni stawiająszczegółowe pytania, na które da się odpowiedzieć przy pomocy stosowanych przez nich metod. Wtym sensie unikanie filozofii jest warunkiem możliwości uprawiania nauk11

Mowa tu wprawdzie o fizyce, ale to bez znaczenia: aby być skutecznym, należy zadawać tylko takiepytania, które można zadać. Ale za chwilę, w tym samym artykule, Weizsacker pisze:„(...) reguła ta załamuje się, gdy nauka dokonuje tzw. wielkich kroków. Nawiązuję tu do znanejkoncepcji (...) T. Kuhna12. Według niego nauka rozwija się wzdłuż łańcucha składającego się z dwutypów ogniw. Ogniwa jednego typu to tzw. normalne okresy rozwoju, kiedy to naukowcy stawiająi rozwiazują zagadnienia wewnaątrz określonego paradygmatu, posługując się dobrze ustalonymimetodami. Normalne okresy są oddzielone od siebie przez fazy drastycznych zmian, zwane rewolu-cjami naukowymi; polegają one na przejściu od jednego paradygmatu do drugiego. Podczas takichprzejść (...) naukowiec musi filozofować, musi stawiać przynajmniej niektóre z tych pytań, którychw okresach normalnych należy unikać.”

Ostatnią rewolucję matematyka przeżyła za sprawą matematyków dwóch pokoleń - Hilberta iGodla. Współczesny mainstream matematyczny został wyznaczony przez teorię mnogości i wspie-rającą ją klasyczną logikę. To teraźniejszy paradgmat. Dziś jesteśmy zanurzeni w teorii mnogościpo uszy i czubek rozumu. Trwa stan upojenia jej oszałamiającymi sukcesami w XX wieku. Takzostaliśmy wychowani i tak kształcimy studentów.

Czy matematyka ma przetrwać nietknięta w czasie największej od wynalezienia druku rewolucjitechnologiczno-cywilizacyjnej, która zmienia wszystkie dziedziny nauki, kultury i obyczajowości?Trzeba szczególnego rodzaju ortodoksji by trwać w przekonaniu, że matematyka jest ponad tę rewolucję.

Sądzę, że właśnie teraz warto pytać, czym właściwie jest matematyka. Jednak by dać sobieszansę zrozumienia istoty matematyki nie wystarczy czytać i kolekcjonować bezrefleksyjnie poglądywielkich. Trzeba wyjść poza ograniczenia wyznaczone przez edukacyjne schematy i podjąć ryzykosformułowania własnego sądu. Bez tego nie mamy szans na zrozumienie czegokolwiek. To tak, jakbypróbować nauczyć się matematyki nie rozwiazując samodzielnie żadnego zadania.

„To really understand something, I believe that one must discover it oneself, not learn it from anyoneelse!”13.Nie szukajcie tu odpowiedzi na te podstawowe pytania a jedynie pomocy i zachęty do poszukiwaniawłasnych.

Cztery uwagi, a nawet sześć

1. Ten tekst nie jest przeznaczony do druku a jedynie do rozpowszechniania elektronicznego. Wra-cam do niego i go zmieniam, poprawiam, uzupełniam. Twierdzenie, że można napisać o podstawachmatematyki w sposób kompletny, bez luk, niedopowiedzeń i błędów, to czysta arogancja. „Plainsuccess is not the only possible goal; this might simply be the exposition of a disorder in thisapparently well-organised universe”. J.-Y. Girard [41]

2. Będę starał się oszczędzić czytelnikom zmagań ze specjalistycznym językiem i rozbudowanymformalizmem. Ale bez przesady. Podziwiam fizyków, którzy wychodzą ze skóry by wytłumaczyć za-

11Filozofia grecka a fizyka współczesna, Zagadnienia Filozoficzne w Nauce II, 1979/80. Carl Friedrich Freiherr baronvon Weizsacker (1912 - 2007), niemiecki fizyk i filozof.12Thomas Kuhn (1922-1996) amerykanski filozof nauki autor dzieła „The Structure of Scientific Revolutions” w

którym wprowadził pojęcie paradygmatu. Paradygmat to zbiór pojęć, stwierdzeń, teorii stanowiacych podstawę danejdziedziny nauki. W odróżnieniu od dogmatu paradygmat nie jest wieczny, jest rodzajem „umowy społecznej” badaczyodgrywających w danym czasie dominująca rolę.13G.J. Chaitin - „Information Theoretic Incompleteness”

Page 8: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

SPIS TREŚCI 7

wiłości teorii kwantów czy teorii względności pomijając zupełnie opis matematyczny14. Ale to tylkozabieg marketingowy. Bezskuteczny, o czym świadczy to, że książka S.Howkinga „Krótka hstoriaczasu” zajmuje drugie miejsce na liści tzw. „unread bestseller” („the books many start but fewfinish”) (za Biblią). Może pora uznać, że bez matematyki nie da się pewnych rzeczy wytłumaczyć?Podzielam pogląd prof. M. Hellera, który w książce pt. „Elementy mechaniki kwantowej” napisał:„Trzeba po prostu bardzo ściśle trzymać się struktur matematycznych; interpretacja teorii winnabyć „egzegezą” jej matematycznej struktury.”.

3. Nie traciłem (niestety) zbyt dużo czasu na tworzenie hiperpoprawnej dokumentacji źródeł. Alezapewniam, że szanuję reguły obowiązujące w świecie akademickiej nauki parametryzowanej i punk-towanej na wszelkie sposoby. Dlatego nazywam ten tekst „notatkami” a nie pracą (para)naukową.

4. Cytatów jest tu wiele. Ktoś powie - zbyt wiele. Ale dlaczego mam szukać własnych sformu-łowań, gdy uznaję cudzą wypowiedź za trafną? A że po angielsku? No cóż, w tym kraju prawie nakażdych drzwiach widzimy słowa „push” lub „pull”. A tłoku jakoś nie ma...15

5. „Im bardziej zaawansowane technicznie (doskonalsze) medium, tym bardziej prymitywne,błahe i bezużyteczne wiadomości są przy jego pomocy przekazywane” - S. Lem (Gazeta Wyborcza,lipiec 2011). Zapewniam, że starałem się pamiętać o tej złośliwie przenikliwej uwadze ... .

6. Nie należy tych zapisków traktować ze śmiertelną powagą. To tylko rodzaj zabawy (inte-lektualnej - jeśli mogę nieskromnie dodać), rezultat subiektywnych doświadczeń a nie dogłębnych,obiektywnych i niesłychanie wnikliwych studiów nad podstawami matematyki.

O roli wątpienia

1. Kartezjusz16 „Rozprawa o metodzie”:

Poznanie zaczyna się od wątpienia17. „Dawno już dostrzegłem, że (...) zachodzi czasem potrze-ba, by dać się wieść mniemaniom, o których wiemy, że są bardzo niepewne (...); ponieważ jednakwówczas pragnąłem oddać się wyłącznie poszukiwaniom prawdy, pomyślałem, że należało postąpićwręcz przeciwnie i odrzucić jako bezwzględnie fałszywe wszystko, co do czego mógłbym sobie wy-obrazić najlżejszą nawet wątpliwość, aby zobaczyć, czy potem nie zostałoby w zespole mych wierzeńnic takiego, co by było całkowicie niewątpliwe. Tak więc (...) zamierzałem przyjąć, że nie istniejeani jedna rzecz, która by była taka, jaka wydaje nam się za ich sprawą. Ponieważ zaś są ludzie,którym się zdarza, że mylą się (...) , to sądząc, iż tak jak każdy inny byłem podatny omyłkom,odrzuciłem jako błędne wszystkie racje, które brałem poprzednio za dowody.”

2. O. Tilmann Pesch SI, „Chrześcijańska filozofia życia”. Wydanie drugie. Kraków, 1930 (tekstznaleziony w internecie),

„Jednym z najsilniejszych dowodów słabości ludzkiego rozumu jest (...) mania powątpiewania,która jak niebezpieczna choroba grozi wszystkim myślącym. Nierozumne powatpiewanie pochodzitak samo ze słabości ducha, jak nierozumna łatwowierność. Człowiek zarażony tą choroba, jestniezadowolony z tego, co na pewno wiemy. A poniewaz tyle jest rzeczy, których umysł ludzki niemoże do gruntu zbadać, chciałby i te nieliczne pewne rzeczy usunąć, aby mógł o wszystkim wątpić.(...) watpienie pochodzące ze sceptycyzmu prowadzi do wolnodumstwa; gdyż polega na niechęci dowszelkich przekonań. Wolnodumstwo rodzi się z dążności do umysłowej niesforności, z usposobienialekkomyślnego, nie lubiącego obowiązków, dlatego swawola i wolnodumstwo tak ściśle ze sobą sięłączą. Wątpienie jest wtedy nierozumne, kiedy się wątpi w te prawdy, do których przyjęcia sąwystarczające powody.14Popularne wśród nich jest stwierdzenie, że „każdy wzór w książce zmniejsza liczbę potencjalnych czytelnikow o

połowę” (S.W. Hawking, R. Penrose). C.Rovelli w książce „Tajemnica czasu” wręcz „przeprasza” za przytoczeniejednego jedynego równania.15Można tę ilość cytatów tłumaczyć inaczej: „Mam okulary (...) i stawiam wniosek, że to one, w połączeniu z

wrodzoną smykałką do przywłaszczania sobie urywków erudycyjnych dzieł, które są zbyt głebokie, bym je zrozumiał,(...) (mogą) wywrzeć mylne wrażenie, iż wiem więcej, niż wiem.” - W.Allen.16Kartezjusz ( Rene Descartes, 1596 - 1650), francuski filozof, matematyk i fizyk.17Najlepsi studenci to ci, którzy nie przyjmują do wiadomości, że „Słowacki wielkim poetą był”.

Page 9: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

SPIS TREŚCI 8

Gdzie jest przyczyna tej wadliwej skłonności do powątpiewania? Zawsze albo w słabości ducha,albo w namiętności. Pierwsza prowadzi do gnuśnej bezmyślności i obojętności, a druga kryje siępoza fałszywym wyobrażeniem o istocie i zadaniu nauki.”

I jeszcze jedno zdanie tegoż Autora:„Matematyczną pewność spotykamy tylko w matematyce; czyż dlatego wszystko inne ma być

niepewne?”

Zamiast komentarza, takie oto poruszające wyznanie Bertranda Russella18:

Pożądałem pewności, jak ludzie pożadają religijnej wiary. Sądziłem, że łatwiej znaleźć pewnośćw matematyce niż gdziekolwiek indziej. Odkryłem wszakże, że liczne matematyczne dowody (...)pełne były zwodniczych argumentów i że, o ile pewność daje się w matematyce odkryć, powinnabyć ona w jakiejś nowej dziedzinie matematyki. (...) Jednakże w miarę postępów w pracy staleprzypominałem sobie bajkę o słoniu i żółwiu. Skonstruowawszy słonia, na którym matematykamogłaby się opierać, zauważyłem, że się on chwieje. Przystąpiłem zatem do skonstruowania żółwia,by powstrzymywał przed upadkiem słonia. Ale i żółw nie był pewniejszy i po dwudziestu latachwysiłków doszedłem do przekonania, że niczego więcej dla zapewnienia matematyce pewności niepotrafię zrobić” .19

Czy poukładałem matematykę? Nie sądzę.

„Niels Bohr (...) uczestniczył kiedyś w konferencji filozofów - pozytywistów. Wygłosił tam odczyt o naj-nowszych postępach mechaniki kwantowej. Następnego dnia był... powiedzmy, w złym humorze; najwi-doczniej konferencja nie przypadła mu do gustu. Gdy zapytaliśmy go dlaczego, odparł: „Ależ oni wszyscyzgadzają się ze mną! Gdy ktoś po raz pierwszy słyszy o teorii kwantów i nie budzi to w nim głębokiegosprzeciwu, to znaczy, że niczego nie zrozumiał” [127]

18Bertrand Arthur William Russell (1872-1970), angielski arystokrata, logik, matematyk, filozof. Laureat NagrodyNobla w dziedzinie literatury (1950).19Bertrand Russell , „Portraits from Memory”

Page 10: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 1

Liczby naturalne

Co Pan uważa za główne zadanie matematyków?Dostrzec, które twierdzenia są ciekawe.

K. Godel [30]

Zdarza się, że opracowania przedstawiające problemy leżące u podstaw matematyki rozpoczynają się odprezentacji teorii mnogości. Radzę porzucić taką lekturę. Cantorowska teoria zbiorów ze swoja stukilku-dziesięcioletnią historią to ledwie jeden z rozdziałów matematyki. Wspaniały, zgoda. Ale ogląd matematy-ki przez pryzmat teorii mnogości jest ex definitione zawężony1. Jeśli tak widzimy matematykę, to trudnodyskutować o jej podstawowych problemach. Można jedynie rozmawiać o problemach teorii mnogości.Lepiej zacząć budować zrozumienie matematyki od tego, co było w niej zawsze. Od liczb naturalnych.

1.1 Liczba naturalna - co to jest?

Natural numbers were made by God; all elsebeing the works of Man.

L. Kronecker2

Liczby naturalne to najprostszy zbiór liczbowy i zarazem fundament konstrukcji większychzbiorów liczbowych - liczb całkowitych, wymiernych, itd. To jądro matematyki.

Stwierdzenie Kroneckera, sformułowane zapewne w okresie jego sporu z Cantorem, winniśmydziś odczytać tak: „liczby naturalne są dobrem powszechnym. Są wytworem cywilizacji stworzonymprzez wszystkich dla wszystkich. Reszta jest dziełem... matematyków”.Liczby naturalne zostały utworzone, bo były potrzebne. By panować nad rzeczywistościa, musimyumieć nazywać rzeczy i zjawiska. „Man gave names to all the animals, in the beginning” - pisał(śpiewał) Bob Dylan. G.G. Marquez w „Stu latach samotności” napisał jeszcze piękniej:„Światbył jeszcze tak młody, że wiele rzeczy nie miało nazwy i mówiąc o nich trzeba było wskazywać jepalcem.” Zdolność do tworzenia nazw nie tylko indywiduowych, ale i takich, które obejmują klasyobiektów wyróżnionych w procesie abstrakcji3, to podstawowa cecha umysłowości człowieka.

Człowiek stworzył liczby naturalne bo potrzebował uniwersalnego systemu nazw. Na czym po-lega ta uniwersalność?Nazwy-liczby nie nawiązują w żaden sposób do fizycznych cech nazywanych (numerowanych) przed-miotów. Możemy nazywać-numerować elementy dowolnej skończonej kolekcji, niezależnie od cha-rakteru jej elementów. To sprawiło, ze człowiek zaczął posługiwać się abstrakcyjnym pojęciem „li-czebności zbioru”. Zaczął porównywać zbiory fizycznie nieporównywalne. Dzięki temu jeden władca

1„Jednym z bardziej szokujących faktów jest to, że wszystko w matematyce można sprowadzić do zbioru” (internet- (jabba.pl/hyperreal/klucz/teoria-mnogosci). Straszne są skutki edukacji matematycznej opartej na jedynie słusznejteorii mnogości... .2Leopold Kronecker, matematyk niemiecki (1823-91). Wielki i nieprzejednany oponent Cantora.3Abstrahować - pomijać pewne cechy, sprawy na rzecz innych (...) - słownik W. Kopalińskiego.

9

Page 11: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 1. LICZBY NATURALNE 10

mógł powiedzieć do drugiego satrapy (chcąc go pognębić): „mam więcej żon niż ty wojowników”. Ibyło to stwierdzenie, które można było weryfikować.Ten zasób nazw jest niewyczerpywalny. Liczb naturalnych jest wystarczająco wiele, by za ich po-mocą nazywać-numerować wszystko, co spotkamy w otaczającym nas świecie.Te liczby to nie tylko zasób, ale uporządkowany liniowo system nazw. Z każdą liczbą-nazwą związa-ny jest jej następnik - „dwa - trzy” „sto - sto jeden”,... . Dlatego nazywanie-numerowanie elementówdowolnej kolekcji oznacza automatycznie jej uporządkowanie, ustalenie kolejności4.

Liczby naturalne są uniwersalnym systemem zliczania i kolejkowania5.

Zliczanie i kolejkowanie to procesy - czynności dziejące się w czasie. Dlatego człowiek wpadłna pomysł by wykorzystać liczby naturalne do (dyskretnego) skalowania czasu. To konieczne, bypróbować zrozumieć dziejące się procesy i planować działania. Któż nie zna dziecięcego „Raz, dwa,trzy,..., piętnaście - szukam!”? Dzięki temu umownemu skalowaniu czasu chowający się wiedzą, ilemają czasu na znalezienie kryjówki a szukający może określić granice obszaru poszukiwań.

Odpowiedź na pytanie „do czego są potrzebne liczby naturalne?” jest ważniejsza niż rozważania o tym,„co to jest liczba naturalna?” Poza matematyką liczba jest narzędziem opisu rzeczy a nie rzeczą. Jestnośnikiem informacji6..

Liczby naturalne nie należą do matematyków. Są dobrem powszechnym. Każdy człowiek wwieku powyżej trzech lat łatwo wskaże kolekcje złożone z dwóch, trzech, itd. elementów, znajdującw tym oparcie dla swego wyobrażenia o liczbach. A pytany „cóż to jest liczba trzy?” ograniczy siędo takiego wskazania, nie siląc się na formułowanie definicji. I ma rację.

To jest sens stwierdzenia Kroneckera.Ten pogląd podzielał Hilbert7 który mówił, że - w odróżnieniu od innych pojęć matematycznych- „liczby naturalne są obecne w naszej intuicji.” Podobnie myślał Poincare8: „the structure ofnatural numbers and the associated principle of induction are given in intuition and do not requirea foundation; indeed, (...) they are presupposed in any attempt at such a foundation”[38].

„Uniwersalny, uporządkowany i niewyczerpywalny system nazw” to jeden z najbardziej uda-nych pomysłów człowieka. Liczby naturalne są obecne w każdej kulturze, są elementem każdegojęzyka. Wraz z postępem cywilizacyjnym rósł zakres ich zastosowań9. Jednym z najwcześniejszychprzełomowych momentów była działalność Pitagorasa i jego ucznów, którzy skojarzyli arytmety-kę z geometrią i zaczęli używać liczb do badania obiektów geometrycznych, do opisu rezultatów

4Używając języka mainstreamowej matematyki: liczby naturalne to zbiór dobrze uporządkowany.5Ta podwójna rola liczb naturalnych została odwzorowana w teorii mnogości: liczby natutralne to jednocześnie

najprostsze liczby kardynalne (zliczanie) i liczby porządkowe (kolejkowanie). W gramatyce języka polskiego mówimyo liczebnikach głównych i porządkowych. A kognitywiści mówią o kardynalnym i porządkowym aspekcie liczb [13].6„Jeden, dwa, trzy...” to liczebniki a nie rzeczowniki.7David Hilbert (1862 - 1943) - genialny matematyk niemiecki. To jeden z głównych bohaterów tego tekstu.8Jules H. Poincare (1854- 1912).9Dziś trudno sobie wyobrazić, jak ważny był wynalazek zera. „Zero” nie jest tak intuicyjnie oczywiste jak inne

liczby naturalne. Nawet twórcy Europy, Rzymianie go nie znali. A stało się to w Indiach około V wieku naszej ery.Był sobie raz. Wymyślił zero.W kraju niepewnym. Pod gwiazdą

dzidż˝ może ciemną. Pomiędzy datami,na które któż przysięgnie. Bez imienianawet spornego. Nie pozostawiającponiżej swego zera żadnej myśli złotejo życiu, które jest jak. Ani legendy,że dnia pewnego do zerwanej różyzero dopisał i związał je w bukiet.że kiedy miał umierać, odjechał w pustynię

na stugarbnym wielbłądzie. Że zasnął

w cieniu palmy pierwszeństwa. Że się zbudzi,kiedy już wszystko zostanie przeliczoneaż do ziarenka piasku. Cóż za człowiek.Szczeliną między faktem a zmyśleniemuszedł naszej uwagi. Odpornyna każdy los. Strżca ze siebiekażdą, jaką mu daję, postać˝.Cisza zrosła się nad nim, bez blizny po głosie.Nieobecność przybrała wygląd horyzontu.Zero pisze się samo.

W. Szymborska, „Wiersz ku czci”:(równie zaskakujące jest to, że symbol równości - „=” pojawił się w matematyce dopiero w ... XVI wieku).

Page 12: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 1. LICZBY NATURALNE 11

mierzenia odległości i ich porównywania10.

1.1.1 Liczby naturalne w teorii mnogości

Liczba staje się rzeczą gdy czynimy ją przedmiotem badań. Dlatego liczba jest obiektem (rzeczą)w matematyce.Język teorii mnogości - w zamierzeniu jej twórców - miał objąć wszystkie rodzaje matematycznejaktywności. Dlatego teoria mnogości musiała zaproponować własną definicję liczb naturalnych.

Teoria mnogości odrzuca wszelkie pre-intuicje. Poza jedną - jedynym pierwotnym pojęciem teorii mnogościjest „zbiór”11. Dlatego liczby naturalne musiały być zdefiniowane w tej teorii jako pojęcie wtórne, poprzezodwołanie do tego jedynego pojęcia podstawowego.

Popatrzmy jak to zrobiono. Jeden z aksjomatów ZFC12 to postulat istnienia zbioru induktywnego:

„Zbiór A jest induktywny, jeżeli zawiera zbiór pusty i wraz z każdym zbiorem B zawiera zbiórB ∪ B.13

Zbiór liczb naturalnych N to najmniejszy zbiór induktywny14. Jego pierwszym elemen-tem - zerem - jest zbiór pusty ∅. Jedynką - zbiór ∅. Dwójką - zbiór ∅, ∅.Następnikiem dowolnego zbioru-liczby A ∈ N jest zbiór A ∪ A.

Niech to nie umknie naszej uwadze: pojęciem definiowanym jest zbiór liczb naturalnych. Same liczbysą „tylko” elementami tego zbioru. I też są zbiorami.Liczba abdykowała na rzecz zbioru15..

To nie jest miła definicja. Jaki pożytek ze stwierdzenia, że liczba to zbiór? Przecież to w żadensposób nie pomaga zrozumieć dlaczego 2 + 2 = 4... .

∅, ∅+ ∅, ∅ ?= ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅,

Nie w tym rzecz. Ta teoriomnogościowa definicja to element języka metaarytmetyki. Nie ma służyćprowadzeniu obliczeń, ale badaniu własności tych obliczeń. Nie ma ułatwiać obliczenia, że 3+4 = 7,ale ma pomóc zrozumieć (uprawomocnić?) zasadę indukcji matematycznej16.

To pierwsze to rachunki, to drugie to matematyka.

10Pitagorejczycy byli tak zachwyceni swoim pomysłem, że popadli w przesadę. Uznali, że istotne w rzeczach jesttylko to, co można wyrazić liczbowo. Wyróżniamy te obiekty przestrzenne (i nazywamy geometrycznymi), którecharakteryzuje pewna doskonałość stosunków liczbowych - trójkąt (równoboczny), kwadrat, koło, kula. Zdumienimożliwościami jakie dawał taki opis świata uznali, że „liczbowy ład” nie jest przez nich kreowany ale odkrywany.Jest zasadą organizującą rzeczywistość. To stało się paradygmatem ich oglądu świata - doszukiwać się we wszystkim„ładu liczbowego i geometrycznego”. Dlatego np. Ziemia - centrum ich wszechświata - winna być kulą. „Sens istnieniaczłowieka polega na poszukiwaniu harmonii, którą się utrzymuje wszystko, nie wyłączając bogów” [63]11Pojęcie pierwotne danej teorii to takie, które nie jest w niej definiowane (np. punkt w geometrii).12ZFC - aksjomaty teorii mnogości Zermelo-Fraenkla wraz z pewnikiem wyboru. Będę często pisał „teoria ZFC”

zamiast „teoria mnogości”.13B to oznaczenie zbioru, którego jedynym elementem jest zbiór B. Teoria mnogości tak ma. Musisz się z tym

pogodzić i np. zrozumieć, że zbiór pusty ∅ to nie to samo co ∅.14Nazywany też modelem standardowym arytmetyki.15„(...) starting from ZFC each mathematical entity, in particular each natural number, is some set. From a formal

point of view the latter has the advantage that there is just one primitive notion, but (...) why numbers should besets (in formalistic mathematics after the natural numbers come to life in the form of sets, this fact is concealed assoon as possible)? Moreover, arend’t we presupposing at least the order of the natural numbers already when writingdown axioms by means of suitable symbols? - J. Ponstain, Nonstandard Analisys (internet)16Teoriomnogościowe sformułowanie zasady indukcji wygląda tak: jeśli podzbiór A ⊆ N zawiera zbiór pusty i wraz

z kadżdym zbiorem B zawiera zbiór B ∪ B to A = N. Pomyśl: skoro N to najmniejszy zbiór induktywny, toinduktywny zbiór w nim zawarty musi mu być mu równy.

Page 13: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 1. LICZBY NATURALNE 12

1.2 Nieskończoność potencjalna czy aktualna?

Gdyby oczyścić drzwi percepcji, każda rzecz ja-wiłaby się taka, jaka jest: nieskończona.

W. Blake17

The existence of ... infinite object? Show meone and I will then show you a cuple of angelsengaged in the ”macarena” on the head ofthe pin [115]

.

Zasób uniwersalnych nazw - liczb naturalnych - jest niewyczerpywalny. Nie jest skończony.Teoriomnogościowcy idą krok dalej: mówią, że definiowany w teorii mnogości zbiór liczb naturalnychjest zbiorem nieskończonym.

Stwierdzenie: „liczby naturalne nie tworzą zbioru skończonego” nie musi oznaczać, że tworzą one zbiórnieskończony. Ale teoriomnogościowcy, nie akceptujący niczego co nie jest zbiorem, musieli uznać, żeliczby naturalne tworzą inny rodzaj zbioru - zbiór nieskończony.

Pytanie o nieskończoność to nie problem wyłącznie matematyczny. To jedno z fundamentalnychpytań człowieka myślącego. Każdy kiedyś przeżył to szczególne uczucie, jakie budzi ogrom i fizyczneniemal odczucie nieskończoności rozgwieżdzonego nieba i świadomość „bycia cząstką kosmosu”.Nieskończoność fascynuje. Czy wszechświat jest nieskończony? Czy czas jest nieskończony? Tokontrapunkt dla naszej egzystencji zdeterminowanej przez skończoność18 Niepogodzeni, chętniewierzymy w nieskończoność czasu i przestrzeni. Jako rodzaj absolutu nieskończoność jest obecna wniemal każdej religii, a obietnica nieskończonego istnienia jest największą wartością.

Jest jednak przepaść między uzasadnioną psychologicznie potrzebą odniesienia się do nieskoń-czoności a świadomą akceptacją jej istnienia. Wbrew temu, że to pojęcie nie ma żadnego desygnatuw fizycznej czasoprzestrzeni.

Nieskończoność... ale jaka? Ciut upraszczając można powiedzieć, że spór o nieskończoność tościeranie się dwóch koncepcji ukształtowanych i dyskutowanych zawzięcie już w starożytności.

Arystoteles19 uważał, że istnieje tylko nieskończoność potencjalna. „Nieskończoność istnieje wten sposób, że jedna rzecz występuje zawsze po drugiej i każda rzecz tego ciągu jest skończona izawsze różna” (...) Nieskończoność jest przeciwieństwem tego, co się tak zazwyczaj określa. Nie tobowiem jest nieskończone, co już nie ma niczego poza sobą, lecz właśnie to, co zawsze ma coś pozasobą” (Arystoteles, Fizyka)20. Stanowisko przeciwne to uznanie istnienia nieskończonosci aktualnej,akceptacja „bytów nieskończonych”. Arystotelesowska nieskończoność potencjalna to teraz tylkopróba poznania „właściwej” nieskończoności.

Liczby naturalne postrzegane jako niewyczerpywalny zasób nazw to nieskończoność potencjalna.Definiowany w teorii mnogości zbiór liczb naturalnych jest zbiorem aktualnie nieskończonym.„Nieskończoność potencjalna oznacza nieograniczoną zdolność umysłu do konstruowania obiektów. W tymujęciu sama nieskończoność nie jest obiektem podlegającym operacjom matematycznym, alewyłącznie źródłem tych obiektów.Nieskończoność aktualna charakteryzuje się tym, że sama jest obiektem podlegającym rozmaitym opera-cjom” [44].

Uznanie nieskończoności aktualnej w matematyce teoriomnogociowej oznacza, że staje się onaprzedmiotem badań. Zgodzono się też - nieco bezkrytycznie - że w świecie zbiorów nieskończonych

17Willam („Mad”) Blake (1757-1827)- poeta i mistyk angielski. Ten cytat to ukłon w stronę tych, którzy wiedzą,czym była grupa „The Doors”.18(6.08. 2011 roku zmarł polski malarz-konceptualista, Roman Opałka, który od 1965 roku tworzył˝ cykl „Opałka

1965/1 - ∞”. Ten cykl to wypisywanie na obrazach kolejnych liczb naturalnych...„Jestem przejęty czasem i jegoupływem. Idea malowania czasu stała się moim programem, który zostanie zakończony wraz z moją śmiercią.”.19Arystoteles, (384 - 322 p.n.e.) - jeden z trzech, obok Platona i Sokratesa, najważniejszych filozofów greckich.20Jeszcze jeden cytat z tego dzieła:„Now ’to be’ means either ’to be potentially’ or ’to be actually’, and a thing

may be infinite either by addition or by division. I have argued that no actual magnitude can be infinite, but it canstill be infinitely divisible (it is not hard to disprove the idea that there are indivisible lines), and we are left withthings being infinite potentially” (cytuję za [64]).

Page 14: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 1. LICZBY NATURALNE 13

obowiązuje większość praw świata obiektów-zbiorów skończonych. Na przykład zgodzono się, żwolno mówić o „zbiorze wszystkich podzbiorów zbioru liczb naturalnych” tak samo jak o zbiorzepodzbiorów zbioru sześcioelementowego... . Wolno, ale trzeba pamiętać, że to jedynie apriorycznieprzyjęte założenie a nie fakt, który można jakkolwiek potwierdzić.

Teoria mnogości nie tylko akceptuje, ale wręcz afirmuje nieskończoność aktualną. E. Zermelonazywał matematykę „logiką nieskończoności”. Ta teoria odwraca relację między skończonością anieskończonością: początkujący adept matematyki dowiaduje się, że „zbiór skończony to taki, którynie jest nieskończony”. Skołowany nie pyta, czy to jest zgodne z intuicją skończoności, czy np. takrozumiany skończony zbiór można opróżnić w skończonym czasie wyjmując kolejno pojedynczeelementy...21

Dzielenie włosa na czworo? Z dzisiejszej perspektywy - tak. Ale przed Cantorem nieskończonośćaktualna wcale nie dominowała w matematyce. W antycznej Grecji wręcz jej unikano: „Nieskoń-czoności (aktualnej - GJ) unikano zarówno w filozofii jak i geometrii. Rozważania matematyczne,w których (...) pojawiała się nieskończoność, prowadziły do paradoksów i różnego rodzaju aporii(trudności). Dlatego w miarę możliwości eliminowano z matematyki wszelkie takie „podejrzane”sytuacje. Jeśli przyjrzymy się dokładnie „Elementom”, to zauważymy, ze nieskończoność jest z nichwyeliminowana całkowicie. Linia prosta jest ograniczona - kończy się punktami (...)”22.

Oto jedna z takich podejrzanych sytuacji:„Czy Achilles dogoni żółwia, od którego dzieli go (skończony) dystans D? Achilles biega dziesięćrazy szybciej i dlatego musi dogonić zwierzę - tak nam się zdaje. Ale gdy Achilles, przebiegniedystans D, to żółw przeczłapie jedną dziesiątą tego dystansu i odległość między nimi będzie wtedyrówna 1

10D. Gdy Achilles przebiegnie dystans równy tej nowej odległości, to żółw w tym czasieoddali się na odległość równą 1

100D. I tak dalej, w nieskończoność... . Dystans między Achillesemi żółwiem będzie coraz mniejszy, ale Achilles nigdy nie dogoni gada...”.

To jeden z paradoksów Zenona z Elei23. Są dwa powody zamieszania wokół tej opowiastki, obazwiązane z nieskończonością. Pierwszy to przekonanie, że możliwe jest nieskończone dzielenie skoń-czonego odcinka - dystansu w rzeczywistej przestrzeni. Grecy tego nie wiedzieli, ale my wiemy(powinniśmy wiedzieć), że „jeżeli będziemy wciąż zmniejszać odległość między dwoma punktami,to w pewnym momencie dosięgniemy tak małej skali, że samo pojęcie odległości straci swójzwykły sens” [87]24. Ten sens utracimy szybciej, niż się zdaje: gdy, na przykład, pierwotna od-ległość między Achillesem a żółwiem to kilometr, to już przy 13-15 pomiarze odległości będziemyoperowali wielkościami porównywalnymi ze średnicą atomu wodoru... .

Paradoks Zenona nie dotyczy rzeczywistości, ale jej modelowania matematycznego. Opowieść o pogoniAchillesa jest tylko bajką dla ludu25.

Drugi powód zamieszania to dość niefrasobliwe przekonanie, że „nieskończone sumowanie” skoń-czonych wielkości (odcinków drogi, czasu) musi dać wynik nieskończony. Zatem jeśli Achilles dogoniżółwia, to tylko po nieskończenie długiej pogoni, czyli nigdy. Współczesna matematyka zamiast o„sumach nieskończonych liczb” mówi precyzyjnie o szeregach liczbowych i ich zbieżności. Korzy-stając z tych narzędzi przekonujemy się, że „suma nieskończonej ilości skończonych liczb” (sumaszeregu liczbowego) może być liczbą skończoną i że Achilles dogoni żółwia26.

21Może i lepiej, bo to pytanie byłoby nielichym kłopotem dla wielu wykładowców. A wprowadzenie wykładowcy wzakłopotanie może (musi) oznaczać kłopoty pytającego ... . Szanowny studencie, masz rację: tego nie można dowieść!Wykażemy to, gdy będzie tu mowa o twierdzeniu Łosia.22M.Heller, Z.Pogoda: „Geometria i kosmologia - historia wzajemnych związków - http://www.msn.ap.siedlce.pl/

smp/msn/3/27-31.pdf. „Elementy” to słynne dzieło Euklidesa (ok. 365 - ok. 300 r. p.n.e.).To szczególne poczucie bezradności antycznychnych Greków określane jest mianem „horror infinity” - strach przednieskończonością. Niektórzy przypisują autorstwo tego określenia Cantorowi.23Zenon z Elei ( ok. 490 p.n.e. - ok. 430 p.n.e.), filozof.24Penrose nawiązuje tu do osiągnięć fizyki kwantowej, do zasady nieoznaczoności Heisenberga.25Nic w tym dziwnego: wszak i dziś od wykładowców wymaga się, by mówili „łatwo i przystępnie”... .26Różnicę odległości między Achillesem a żółwiem w chwili n-tego pomiaru, obliczymy tak;

Page 15: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 1. LICZBY NATURALNE 14

Teoria szeregów i jej wyniki usprawiedliwiają (umożliwiają) modelowanie przestrzeni, w którym do-puszczalne są nieskończone podziały. Tak matematyka rozwiązała problem, który sama wykreowaładopuszczając użycie nieskończoności do opisu rzeczywistości.

Cantor nie był pionierem uznania nieskończoności aktualnej w matematyce. Pięć wieków wcze-śniej Mikołaj z Kuzy głosił: „wszystko, co skończone, ma swe zródło w zasadzie nieskończoności”[32]27. Już Bolzano wskazywał zbiory, dla których można ustalić wzajemnie jednoznaczną odpo-wiedniość między elementami tych zbiorów a elementami ich istotnie mniejszych podzbiorów (cow teorii mnogości jest wyróżnikiem zbiorów nieskończonych)28. Ale to Cantor uczynił nieskończo-ność aktualną centralnym pojęciem matematyki i przeciął węzeł gordyjski odwiecznych sporów onieskończoność.

Uznanie nieskończoności aktualnej w matematyce nie było oczywistością. Była to świadomadecyzja twórców teorii mnogości a w szczególności Cantora. To rewolucja, akt intelektualnej odwagi,porównywalny z rewolucja kopernikańską29. Zdominowała matematyke XX wieku.

„Nikt nas nie wygna z raju, który stworzył Cantor” - D. Hilbert30.

Puenta

Czy dyskusja o nieskończoności może mieć puentę?

Spór o nieskończoność nie zawsze był dyskusją szanujących się adwersarzy. Kiedy w XV wieku Mikołajz Kuzy zaczął głosić, ze wszechświat jest nieskończony, Kościół szybko przystąpił do kontrofensywy. Jejofiarą stał się Giordano Bruno, wyznawca poglądu o nieskończoności wszechświata. Pogląd ten (wraz zinnymi głoszonymi przez niego) uznano za herezję. G. Bruno został uwięziony, torturowany przez długielata i spalony na stosie w 1600 roku... ’

(D + (Σnk=1110k )D)− (Σnk=1

110k−1 )D

Ta różnica zmniejsza się w miarę upływu czasu - „gdy n zmierza do nieskończoności”. Gdy wykorzystamy szkolnywzór na sumę szeregu geometycznego to zauważymy, że mamy równość

(D + (Σnk=1110k )D) = (Σnk=1

110k−1 )D (= 10

9 )

To oznacza, że Achilles jednak dogoni żółwia po skończonym czasie: np. jeśli Achilles przebiegł dystans D w ciągu90 sekund to dogoni żółwia po kolejnych 10 sekundach.27Wraz z Kuzańczykiem (Mikołaj z Kuzy, a własciwie: Nicolaus Krebs (1401-1464), filozof i teolog niemiecki - GJ)

zarysowuje się wyobrażenie wszechświata jako otwartego w nieskończoność mającego środek wszędzie a obwód nigdzie(...) Gdy wydłuża się tedy średnica okręgu maleje jego krzywizna: nieskończony obwód staje się nieskończoną prostą:w Bogu zbiegają się wszelkie przeciwieństwa” [29].28Przyporządkowując każdej liczbie naturalnej n liczbę 2 · n ustalamy wzajemnie jednoznaczną odpowiedniość

między zbiorem wszystkich liczb naturalnych i zbiorem liczb parzystych. Te zbiory mają „tyle samo” elementów - sąrównoliczne - choć „oczywiście” liczby parzyste to zbiór istotnie mniejszy do zbioru wszystkich liczb naturalnych.29Nie jest prawdą, że idee Cantora uzyskały powszechną i natychmiastową akceptację. W rzeczywistości Cantor

nie doczekał się należnego uznania. To było jedna z przyczyn załamania się jego działalności naukowej już ok. czter-dziestego roku życia (Cantor żył 73 lata). Towarzyszyły temu depresje związane m.in. z niemożnością rozstrzygnięciahipotezy continuum (o czym jeszcze coś tu powiemy).30Hilbert spoke of Cantor’s set theory as one of the most beautiful creations of the human intellect, and the

Continuum Hypothesis as one of the most fundamental questions in mathematics” [22].

Page 16: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 2

Nieskończoność kontrolowana

„Nie o to chodzi, by złowić króliczka, ale by gonić go...”

Agnieszka Osiecka

Czy nieskończoność aktualna jest konieczna? Czy jest alternatywa dla raju Cantora? Czy ma-tematyka potrafi modelować nieskończoność potencjalną?

Mówiąc „zbiór liczb naturalnych” traktujemy wszystkie liczby w sposób równouprawniony. Aprzecież Russell zatytułował rozdział w [99] poświęcony liczbom naturalnym nie „zbiór...” a „ciągliczb naturalnych”. A G. Mannoury już w 1909 roku wskazywał na pułapkę ukrytą w stwierdzeniuże np. liczba 3 to taka sama liczba jak 999 . Skończoność to więcej niż kosmos1.

Niektórzy matematycy gotowi są utożsamiać skończoność obiektu matematycznego z jego try-wialnością. Być może ogłoszenie w 1976 roku komputerowego rozwiązania problemu czterech barwskłoniło część z nich do rewizji poglądów2. Ale nie wywołało rewolucji.

Osią sporów wokół nieskończoności aktualnej i potencjalnej jest stosunek do roli czasu w kreacji obiektówmatematycznych. Teoria mnogości jako spadkobierczyni platonizmu pojmuje obiekty matematyczne jakowieczne i niezmienne w czasie. Rozszerzając świat platońskich idei o nowy byt - nieskończoność - musiałaprzyjąć, że jest to nieskończoność aktualna.Dla konstruktywistów - zwolenników nieskończoności potencjalnej - kreacja to konstrukcja, proces prze-biegający w czasie. Każda liczba naturalna powstaje z zera w wyniku skończonego procesu. A wtedyliczba 3 zaczyna się różnić od 99

9- jest łatwiej dostępna3.

Skoro każdy rodzaj bytu może być wyróżniony bądź jako potencjalny bądź jako w pełni urze-czywistniony, wobec tego urzeczywistnianie bytu potencjalnego jako takiego będzie właśnieruchem” - Arystoteles, Fizyka, Ks. III. Minęlo ponad dwa tysiące lat i M.Atiyah4 napisał tak: Wstatycznym wszechświecie nie można sobie wyobrazić algebry, ale geometria jest zasadniczo statycz-na. Mogę tu siedzieć i patrzeć i nic się może nie zmieniać, a mimo to mogę widzieć. Algebra wszakżema do czynienia z czasem, ponieważ jej operacje trzeba wykonywać kolejno (...). Każdy algorytm,każdy proces rachunkowy, jest ciągiem kroków wykonywanych jeden po drugim. Współczesny kom-puter wyraźnie to nam uświadamia (...). Algebra dotyczy manipulacji w czasie, a geometria dotyczyprzestrzeni. Są to dwa ortogonalne aspekty świata, przedstawiające dwa różne punkty widzenia na0Gerrit Mannoury (1867 - 1956) matematyk i filozof holenderski, którego uczniem był Brouwer.1It should be pointed out that already here an element of idealization enters. We regard 5, 1000 and 1010

10as

objects of ”the same sort” though our mental picture in each of these cases is different: we can grasp ”five” immediatelyas a collection of units, while on the other hand 1010

10can only be handled via the notion of exponentiation [124]

Liczbę atomów we wszechświecie szacuje się na 6 · 1078. Co robię, gdy piszę „dodajmy liczbę 1 do 1097” ???.2Czy każdą mapę można pokolorować za pomocą czterech barw tak, by sąsiadujące państwa (mające wspólną,

ale nie jednopunktową, granicę) nie miały tego samego koloru? Komputerowy dowód potwierdzający taką możliwośćpolegał na rozpatrzeniu prawie 2000 różnych możliwych przypadków.3Terminy „następnik”, „poprzednik” używane do opisu struktury liczb naturalnych zdradzają pierwotny związek

tego systemu nazw z czasem.4Michael F. Atiyah (ur. 1929) – matematyk brytyjski, laureat medalu Fieldsa w 1966 roku.

15

Page 17: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 16

matematykę. Czas jest czymś, co istnieje w algebrze, a nie istnieje w geometrii.” [2]

Te „dwa ortogonalne5 (...) punkty widzenia” teoria mnogości usiłuje opisywać tym samym ję-zykiem, którego pierwotnym pojęciem jest statyczny „zbiór”. W konsekwencji te dwa „aspektymatematyki ” nie są w mainstreamowej matematyce równouprawnione. Nieco zmieniając zakoń-czenie wypowiedzi Atiyaha można powiedzieć, że „czas jest czymś, co istnieje w matematyce, a nieistnieje w teorii mnogości”.6

2.1 Matematyczny konstruktywizm

To know that A is a set is to know how to formthe canonical elements in the set and under whatconditions two canonical elements are equal.

P. Martin-Lof

Czy o liczbach naturalnych można mówić matematycznie, ale inaczej? Można, jeśli uwierzymyw istnienie matematyki poza teorią mnogości.

Martin-Lof mówi: „wiedzieć, że A jest zbiorem oznacza, że wiemy jak konstruować (formować,kształtować) jego elementy”7. Zbiór jest opisem (specyfikacją) warunków, jakie muszą być spełnionew procesie konstrukcji jego elementów8.

„To form” to czasownik. Formowanie odbywa się w dyskretnym czasie, krok po kroku.Spójrzmy oczami Martin-Lofa na konstrukcję liczb naturalnych. Zaczynamy od pojedynczej wiel-kości początkowej - liczby 0. W każdym kroku dodajemy jedną nową wielkość - następnik ostatnioskonstruowanej liczby9. Wszystko, co utworzymy w ten sposób w rezultacie dowolnie długiego, aleskończonego ciągu kroków, jest liczbą naturalną. I nic ponad to10.

Zapiszmy reguły tego procesu w sugestywnej formie:

(Nat)0 : N

n : Nsucc(n) : N

Brak licznika w pierwszej regule-ułamku oznacza, że zero jest bezwarunkowo liczbą naturalną. Dru-ga reguła mówi, że napis succ(n) jest liczbą, o ile jest nią napis n11.Skutkiem stosowania tych reguł jest kreacja (potencjalnie) nieskończenie wielu obiektów matema-tycznych. Dopiero w drugiej kolejności można uznać, że jest nim kreacja pojedynczego obiektu -(aktualnie) nieskończonego zbioru liczb naturalnych. Ale czy musimy?

Poszukiwaczom dziury w całym (wyznawcom teorii mnogości) pytającym o definicję „skończonego ciągukroków” odpowiem: skończoność - w odróżnieniu od nieskończoności - to termin, który jak żaden inny

5„Wzajemnie prostopadłe”6Kantowski rozdział „czasu” i „przestrzeni” zanegował Einstein w szczególnej teorii względności, w której współ-

zależność tych pojęć została zrealizowana pod hasłem „czasoprzestrzeń”. Matematyczne podstawy tego pojęcia zbu-dował Minkowski (przestrzeń Minkowskiego”) którego wykładów na politechnice w Zurychu słuchał Einstein.7Per Martin-Lof ( 1942 -) szwedzki logik i filozof, twórca tzw. intuicjonistycznej teorii typów.8Aby uniknąć niepożądanych skojarzeń możemy mówić o „typach” zamiast o „zbiorach” rozumiejąc ten termin

tak, jak współczesna informatyka (a nie jak np. B. Russell).9n succ(n) = n+ 1.10Dodajmy wartą uwagi wypowiedź H. Curry’ego: A formalist would not speak of „the natural numbers” but ofa set or system of natural numbers. Any system of objects (...) which is generated from a certain initial object by acertain unary operation in such a way that each newly generated object is distinct from all those previously formedand that the process can be continued indefinitely, will do as a set of natural numbers. He may (...) objectify thisprocess by representing the numbers in terms of symbols; he chooses some symbol, let us say a vertical stroke „|”,for the initial object, and regards the operation as the affixing of another „|” to the right of the given expression.But he realizes there are other interpretations; in particular, if one accepts the platonist or intuitionist metaphysics,their systems will do perfectly well”. [105]. Haskell Curry (1900-1982)- amerykański matematyk i logik. Ciekawostka:język programowania funkcyjnego Haskell został tak nazwany właśnie na cześć Curry’ego.11Takie odczytanie reguł to intepretacja „z dołu do góry” („backward”) - stwierdzenie zapisane w mianowniku jest

zasadne o ile zasadna jest przesłanka zapisana w liczniku. Te reguły można też czytać „z góry w dół” („forward”) -„jeżeli przesłanka zapisana w liczniku jest zasadna, to stwierdzenie zapisane w mianowniku jest też zasadne”.

Page 18: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 17

jest związany z istotą naszej egzystencji. Operowanie pojęciem „dowolnie długi, lecz skończony proces”nie może budzić sprzeciwu. Jest intuicyjnie oczywiste.

Skoro tak, to mamy dwie definicje liczb naturalnych. Porównajmy:

definicja teoriomnogościowa1. ∅ ∈ N,2. n ∈ N→ n ∪ n ∈ N,3. N to najmniejszy spośród zbiorów speł-niających warunki 1. i 2.

.

definicja konstruktywna1. 0 ∈ N,2. n ∈ N→ succ(n) ∈ N,3. liczbą naturalną jest to, co potrafimy skon-struować za pomocą reguł 1. i 2. w skończo-nym czasie.

Pomijając kwestię oznaczeń, dwa pierwsze punkty obu definicji mówią to samo. Ale ostatniepunkty są istotnie różne: jeden z nich opisuje zbiór N, drugi mówi o procesie tworzenia liczb.

A jednak spodziewamy się - jesteśmy przekonani (?) - że są to definicje równoważne, opisują tensam obiekt matematyczny. Piszemy (dość beztrosko)

N = ∅, ∅, ∅, ∅, . . .i mówimy „liczbą naturalną jest zero (zbiór pusty) i wszystko, co z niego skonstruujemy w skoń-czonej liczbie kroków korzystając z operacji A A ∪ A”.Pięknie, ale ... tego się nie da dowieść - w ZFC!12. Dowodliwe jest tylko zawieranie

∅, ∅, ∅, ∅, . . . ⊆ N

choć i to nie jest prawdą! Można tylko pokazać, że każdy z kolejno budowanych zbiorów ∅, ∅, ∅, ∅, . . .należy do N - jest liczbą. To „coś” po lewej stronie symbolu „⊆” wcale nie musi być zbiorem13!

Czym więc są liczby naturalne? Są tym, co uznaliśmy za pierwotną intuicję - uniwersalnym systememnazw. Definicja teoriomnogościowa to tylko ich opis (próba opisu) w specyficznym języku14.

I takie założenie przyjmujemy w tym tekście.

„Formalistycznie pojmowana teoria zbiorów odseparowana jest od wszystkiego co intuicyjne” - pisałvon Neumann15 . Nie sposób posługiwać się teoriomnogościową definicją liczb naturalnych bez tejpierwotnej intuicji. A że przy tej okazji dokonujemy ich nieuprawnionego utożsamienia... . No cóż,nobody’s perfect...16.

2.2 Struktury rekurencyjne

„Recursion is frequently used in mathematics and program-ming in the construction of classes of objects and in the defi-nition of functions and programs. A. Bundy [15]

12Teoria mnogości nie zna pojęcia „w skończonej liczbie kroków”. Można w niej mówić o „konstruowaniu w nkrokach”, gdzie n to liczba naturalna. Ale czy można konstruować liczby naturalne odwołując się do liczb naturalnych?13Wbrew przekonaniu 99% studentów teoria zbiorów nie przesądza, że „część zbioru” musi być jego podzbiorem.14Podobnie „konstruowalność w n-krokach, gdzie n to pewna liczba naturalna”, którą posługujemy się w teorii

mnogości, to jedynie teoriomnogościowa implementacja „konstruowalności w skończonej liczbie kroków”.Teoriomnogościwym ortodoksom uświadamiam, że nie wszyscy podzielają pogląd o definiowalności liczb naturalnychw ZFC. W [57] napisano ostrożnie bardzo: „The finite ordinals in the standard model of ZFC resemble the usualnatural numbers.” Resemble = być podobnym.15The meaning of mathematical symbols is not the symbols alone (...). Nor is the meaning of symbols in the

interpretation (...) in terms of set theoretical models(...). Ultimately, mathematical meaning is like everydaymeaning. It is a part of embodied cognition.- [68]. Na formu internetowym, gdzie dyskutowano w subtelnosciachcohenowskiego forsingu pewien student (Cambridge Univ.) napisał: „I think that the formality is crucial, but onlyafter you have a basic intuitive idea of whats going on. We are humans not computers. Without basic intuitionthe formality worth nothing.” A Beatelsi mówią o tym tak: „Hey Jude, don’t make it bad, take a sad song andmake it better. Remember to let her under your skin, then you begin to make it better.” .16Nobody’s perfect - nie jesteśmy doskonali to ostatnia kwestia filmu „Pół żartem, pół serio”.

Page 19: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 18

Najprostsze specyfikacje zbiorów spełniające warunki Martin-Lofa to struktury rekurencyjne.- Rekurencja17 to mechanizm tworzenia potencjalnie nieskończonych kolekcji. Tak człowiek za-

panował nad liczbami naturalnymi. Tak też osiągnął drugi fenomenalny sukces - zaczął zapisywaćto co mówi za pomocą słów (nad ustalonym alfabetem)18. Współczesna matematyka opisuje tędrugą konstrukcję tak:

punktem wyjścia - wielkością początkową - jest jedno jedyne słowo puste - ε. Konstruktorówsłów jest tyle, ile liter w alfabecie A: jeżeli a ∈ A a „w” jest wcześniej utworzonym słowem nadalfabetem A, to napis „wa” jest słowem nad alfabetem A.Oznaczając przez A∗ zbiór wszystkich słów utworzonych z liter alfabetu A zapiszemy to tak:

ε ∈ A∗w ∈ A∗

wa ∈ A∗a ∈ A

Jeżeli cokolwiek ma być uznane za fundament naszej cywilizacji, to musi to być zdolność człowieka doprzekazywania i odbioru informacji kodowanych jako skończone ciągi sygnałów (znaków, liter).

„Bo przecież gdy się dobrze zastanowić, zdumienie człowieka ogarnia, dwadzieścia kilka liter, winnych alfabetach mniej czy więcej, (...) a cały świat, jaki był, jaki jest i jaki będzie”19.

Opiszmy istotę konstrukcji rekurencyjnych za pomocą mało precyzyjnej ale (mam nadzieję)zrozumiałej quasidefinicji:

Struktura rekurencyjna to para (P,K) w której P to skończony zbiór wielkości początkowych a K- skończony zbiór konstruktorów.Konstruktor k ∈ K przyporządkowuje pewnym, wcześniej skonstruowanym, skończonym ciągomobiektów (Ob1, . . . , Obnk) nowy jednoznacznie określony obiekt k(Ob1, . . . , Obnk).

ObOb ∈ P Ob1, . . . , Obnk

k(Ob1, . . . , Obnk)k ∈ K

Wymagamy, by konstruktory były rozstrzygalne: byśmy mogli - dla dowolnego konstruktora k ∈ Ki każdego ciągu obiektów (Ob1, . . . , Obnk , Ob) - rozstrzygać, czy Ob = k(Ob1, . . . , Obnk).

Podobnie jak wcześniejsze pojęcie „skończonej liczby kroków” tak i przywoływaną teraz „zdolność dorozstrzygania” (czy Ob = k(Ob1, . . . , Obnk)) rozumiemy jako przyrodzoną i wzmacnianą przez edukacjęumiejętność oceny, czy dany obiekt jest tym, czego oczekujemy.20

Do kolekcji wyznaczonej przez taką strukturę włączamy każdy obiekt, który:- jest wielkością początkową ze zbioru P ,- można go utworzyć z wielkości początkowych w skończonej liczbie kroków, korzystając z

konstruktorów ze zbioru K.W matematyce mainstreamowej tak opisane kolekcje to zbiory rekurencyjne..

Choć ta definicja nie grzeszy precyzją, to nieźle oddaje sens: na pierwszym planie są narzędziatworzenia. Kolekcja kreowanych obiektów jest wtórna. Ta kolekcja jest potencjalnie nieskoń-czona - w skończonym czasie zbudujemy skończenie wiele elementów tej kolekcji.21.Stwierdzenie: „obiekt należy do kolekcji wyznaczonej przez daną strukturę rekurencyjną” jest we-ryfikowalne: głoszący ten sąd ma obowiązek przedstawić konstrukcję obiektu. Wymóg roz-

17recurrere (łac.) - przybiec z powrotem. Tworzymy nowe, odwołując się do tego, co stworzyliśmy wcześniej.18Jeśli wśród znaków alfabetu mamy znaki interpunkcyjne i spację, to dowolny tekst jest pojedynczym słowem.

A „litera wcale nie musi być pojedynczym znakiem graficznym. Może być ciągiem zna”ków (czyli słowem nad innymalfabetem). To rozpowszechniona praktyka, szczególnie w informatyce. Takie litery-słowa to tokeny.19W. Myśliwski, Ostatnie rozdanie. Jeszcze jedno zdanie z tej książki: „Drugi taki porządek to kolejno liczby: jeden,

dwa, trzy, cztery i tak dalej. Zastanawiam się nawet, czy to nie jedyne porządki, którym można jeszcze zaufać.”20Na matematyczną definicję rozstrzygalności przyjdzie czas poźniej.21Jak mawiał prezydent L. Wałęsa: „Jeśli chcesz komuś naprawdę pomóc, to daj mu wędkę, a nie rybę”...

Page 20: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 19

strzygalności i finitarności konstruktorów sprawia, że każdy może sprawdzić poprawność tej kon-strukcji22.

Relacja przynależności - „∈” - to pojęcie pierwotne matematyki teoriomnogościowej. Wszystko, o czymmówi teoria mnogości (i oparta na niej matematyka) da się wyrazić za pomocą zdań budowanych z dwóchprostych stwierdzeń: „zbiory A i B są równe” - A = B - oraz „zbiór A należy do zbioru B” - A ∈ B.Pojęcia pierwotnego nie można opisać odwołując się do innych pojęć tej teorii. Dlatego z teoriomnogo-ściową relacją przynależności nie jest związana żadna procedura weryfikująca stwierdzenie, że A ∈ B23.To jest fundamentalna różnica między matematyką teoriomnogościową a konstruktywną.

Struktura rekurencyjna Nat opisująca liczby naturalne jest najprostsza z możliwych: mamy tupojedynczą wielkość początkową i jeden jedyny konstruktor.

Matematyka kocha byty czyste. Proste, ale posiadające wszystkie istotne cechy interesujących nas obiek-tów. To piękna zasada decydująca o estetycznych walorach królowej nauk24. Koncentrujemy uwagę naobiektach idealnych, pozbawionych zbędnych elementów, co ułatwia odkrycie istoty problemu.

Wiedza o liczbach naturalnych - arytmetyka - jest esencją wiedzy o strukturach rekurencyjnych, o „nie-skończoności kontrolowanej” - „(Arithmetics is) the science that elaborates the abstract structures thatall progressions have in common merely in virtue being progression”25.

Liczby całkowite i wymierne

Liczby całkowite i wymierne to też struktury rekurencyjne.

Liczby całkowite to rozszerzenie uniwersalnego systemu nazw - liczb naturalnych - które wprowadziłonową jakość i nowy rodzaj uporządkowania. Od „środka” - zera - rozwijamy się w dwóch kierunkach - doplus- i minus nieskończoności. Potrzebę takiego uporządkowania poczuli zapewne jako pierwsi ci spośródnaszych przodków, którzy zaczęli pożyczać pieniądze...26

Aby opisać rekurencyjnie liczby całkowite wystarczy potraktować liczby naturalne jako wielkościpoczątkowe i „uruchomić” dwa nowe konstruktory:

n : Nn : Z

n : N−n : Z

(n 6= 0)

Liczby wymierne to kolejne, uzasadnione cywilizacyjnie rozszerzenie systemu nazw. I ten zbiórmożna opisać rekurencyjnie - przedstawić jako „ułamki” skonstruowane z liczb całkowitych...

Zbyt to proste by było matematyką? Tak można sądzić widząc, co z tymi liczbami wyczyniateoria mnogości. Każdy student matematyki „wie” (bo musi), że liczby całkowite to elementy zbioruilorazowego (N ×N)/ ∼= dla odpowiednio określonej równoważności ∼= . Zatem każda pojedynczaliczba całkowita to ... zbiór nieskończony!27 „Who care about?”22Czasem zamiast o konstrukcji mówimy o wyprowadzeniu danego obiektu. A nawet o „uprawomocnieniu” - kon-

struktywnym dowodzie istnienia.23To stwierdzenie wymaga doprecyzowania. Zrobimy to, gdy będziemy wiedzieli więcej o rozstrzygalności.24Zwana czasem „brzytwą Ockhama”. Oczywiście nie królowa, tylko zasada. „Pluralis non est ponenda sine”.

„Bytów nie mnożyć, fikcji nie tworzyć, tłumaczyć rzeczy jak najprościej”.. Wilhelm Ockham to XIV-wieczny teologangielski, franciszkanin. Wyrzucony z uniwersytetu oksfordzkiego udał się do Avinionu gdzie oskarżył papieża JanaXXII o ... herezję, co musiało skończyć się jego ekskomuniką.25P. Benacerraf, „What numbers could not be”, Philosophy of Mathematics, 1983. E. Nelson w [83] pisze o „gene-

tycznym” charakterze liczb naturalnych: „Numerals” - terms containing only unary symbol S and a constant 0 aregenetic; they are formed by human activity.26Na jednej ze stron internetowych napisano inaczej (ale tyż piknie): „The addition of 0 to the natural numbers was

a major intellectual accomplishment in its time. The addition of negative integers to form Z already constituted adeparture from the realm of immediate experience to the realm of mathematical models.”. Świadectwem porzuceniuświata bezpośredniego doświadczenia jest stwierdzenie, że (−2) · (−2) = 4.27(m,n) ∼= (m1, n1) gdy m− n = m1 − n1. Liczby całkowite to klasy abstrakcji tej relacji.

Page 21: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 20

Równie niemiło wygląda teoriomnogościowa definicja zbioru liczb wymiernych - ponownie ko-rzystamy z możliwości tworzenia zbiorów ilorazowych, tym razem rozpoczynając konstrukcję odzbioru liczb całkowitych. Pojedyncza liczba wymierna to też nieskończony zbiór... .

Powtórzmy co powiedzieliśmy już o teoriomnogościowej definicji liczb naturalnych: te definicjeto tylko opisy tych zbiorów liczb w języku teorii mnogości. Niezbędne, by włączyć je do matematykiktórej paradygmatem jest stwierdzenie, że „obiekty matematyczne to zbiory”.

Nie jest też tak, że rozwój systemów liczbowych przebiegał zgodnie ze schematem liczby na-turalne liczby calkowite liczby wymierne. Te ostatnie znane już były w antycznej Grecji,ale tylko w ograniczonym zakresie, jako opis proporcji mierzalnych wielkości. Ale tylko wielkości„homogenicznych”. Np. nie znano wówczas pojęcia prędkości średniej definiowanej jako stosunekdługości drogi do czasu podróży bo „długość” i „czas” to nie są wielkości homogeniczne.

Można zaryzykować twierdzenie, że „na początku” liczby nie były samodzienymi pojęciami abstrakcyj-nymi: sens (znaczenie) miały stwierdzenia: „trzech ludzi”, „trzy domy” ale nie miało go stwierdzenie„trzy”28.

Ujemne liczby całkowite pojawiły się dużo później: „liczb ujemnych użył Chuquet w XV wieku(...) nazywając je „liczbami absurdalnymi” (...). Większość europejskich matematyków odrzucałakoncepcję liczb ujemnych aż do XVII wieku”. (wikipedia)

A co z liczbami rzeczywistymi? Powiedzmy krótko: to nie jest zbiór rekurencyjny. To nie jest„system nazw”. To jest miejsce, w którym (prawie) ostatecznie rozchodzą się drogi matematycznychkonstruktywistów i platoników. Opowiemy o tym w rozdziale „Przestrzeń matematyczna”.

Liczby - słowa - numerały

Elementy dowolnego zbioru rekurencyjnego można efektywnie ponumerować. To proste: najpierwnumerujemy wielkości początkowe (których jest skończenie wiele) potem numerujemy te, które sąkonstruowane „w jednym kroku”, po jednokrotnym użyciu jednego konstruktorów wymienionychw opisie rozważanej struktury rekurencyjnej. Następnie numerujemy wielkości skonstruowane „wdwóch krokach”. I tak dalej29.Można tak ponumerować słowa nad dowolnym (skończonym) alfabetem. Z drugiej strony, liczbynaturalne to nazwy-słowa 0, succ(0), succ(succ(0)), . . . konstruowane zgodnie z regułami opisanejwcześniej struktury rekurencyjnej Nat.

Liczby to słowa. Słowa można ponumerować. Co jest wcześniejsze, ważniejsze: słowo czy liczba? Tokiepskie pytanie. To są dwie wyróżnione, pierwotne struktury rekurencyjne. Pojęcia komplementarne,wzajemnie się dopełniające, a nie konkurencyjne30.

Normalni ludzie - nie-matematycy - nie kojarzą liczb naturalnych z (koszmarnymi) napisamipostaci 0, succ(0), succ(succ(0)) . . .. Oni korzystają z reprezentacji tych liczb - numerałów.

Jest wiele systemów numerałów. Nasz przodek chcąc zapisać liczbę „siedem” rył na ścianie ja-skini siedem kresek - reprezentował liczby jako słowa nad jednoelementowym alfabetem. Dziś światposługuje się systemem dziesiętnym - reprezentacją liczb naturalnych za pomocą słów-numerałównad alfabetem 0, 1, 2, 3, 4, 5, 6, 7, 8, 931. A symbolem ery komputerów stał się zapis binarny.Zapisy liczb w systemie dziesiętnym (dwójkowym, rzymskim) to synonimy podstawowych nazw. 3jest synonimem napisu succ(succ(succ(0))). Synomimy nie są potrzebne matematykom. Taka repre-zentacja staje się istotna, gdy interesują nas „praktyczne aspekty wykorzystania liczb naturalnych”

28Nie tylko na początku. Galileusz (1564-1642) też nie używał pojęcia prędkości chwilowej. Mówił wprawdzie, że„A jest szybszy od B jeśli w tym samym czasie może przebyyć dłuższą drogę” ale to przecież nie to samo.29Znaczenie terminu „efektywna numeracja” wyjaśnimy w przyszłości. Teraz niech nam wystarczy nasza intuicja.30Możliwość zamiana słowa (tekstu) w liczbę odgrywa fundamentalną rolę w kryptografii. Np. podstawą niezawod-

ności systemu kodowania RSA jest to, że rozkład liczby naturalnej na czynniki pierwsze jest problemem algorytmicz-nym o dużej złożonści.31Ten system, importowany z Indii za pośrednictwem Arabów wyparł produkt europejski - system rzymski.

Page 22: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 21

czyli, mówiąc po ludzku, rachunki. Nasz przodek chcąc obliczyć iloczyn „sto jeden razy sto dwa”musiał by sto i dwa razy wyryć sto jeden kresek - zajęcie na cały sezon łowiecki. A korzystającnp. z systemu dziesiętnego i prostych algorytmów dodawania i mnożenia, które otrzymaliśmy wpakiecie z tym systemem, średnio rozgarnięty uczeń gimnazjum rozwiąże to zadanie w minutę32.

Dodatek: struktury rekurencyjne w teorii mnogości

Teoria mnogości miała być w zamierzeniu podstawą wszelkich działań matematycznych. Jak zatemradzi sobie ze strukturami rekurencyjnymi? Całkiem nieźle. Teoriomnogościowe twierdzenie, któreujmuje istotę tej metody konstruowania zbiorów to twierdzenie Tarskiego o punkcie stałym.

Aksjomatyka teorii mnogości postuluje istnienie - dla dowolnego zbioru A - zbioru potęgowego2A , którego elementami są wszystkie podzbiory zbioru A:

B ∈ 2A wtw B ⊆ APowiemy, że operator działający na podzbiorach A - czyli funkcja F : 2A → 2A - jest monotoniczny,jeżeli dla dowolnych podzbiorów B,C ⊆ A, F (B) ⊆ F (C) jeśli tylko B ⊆ C. Operator F jestfinitarny, gdy:

F (B) =⋃F (Bf ) : Bf − skończony podzbiór B

dla dowolnego podzbioru B33.

Twierdzenie o punkcie stałym mówi, że:34 „każdy monotoniczny i finitarny operator F : 2A → 2A

ma (najmniejszy) punkt stały - istnieje zbiór Fix(F ) ⊂ A taki, że F (Fix(F )) = Fix(F ). Co więcej:

Fix(F ) =⋃n∈N

Fn(∅) = ∅ ∪ F (∅) ∪ F 2(∅) ∪ · · · ∪ Fn(∅) ∪ · · ·

Zbiór rekurencyjny wyznaczony przez jakąkolwiek strukturę rekurencyjną (P,K) to punkt stałyfinitarnego i monotonicznego operatora związanego z tą strukturą. Ten operator - oznaczmy goprzez PK - „dorzuca” do dowolnego zbioru B wszystkie elementy zbioru P i te, które skonstruuje-my aplikując jednokrotnie dopuszczalne konstruktory do elementów zbioru B 35.Początek konstrukcji zbioru rekurencyjnego to zbiór wielkości początkowych P = PK(∅). ZbiórPKn(∅) zawiera elementy skonstruowane „w co najwyżej n krokach”. Zbiór Fix(PK), jako sumawszystkich takich zbiorów, składa się z elementów konstruowalnych w skończonej liczbie kroków,czyli jest to zbiór rekurencyjny wyznaczony przez strukturę (P,K). To, że jest on punktem sta-łym operatora PK oznacza, że dalsze próby konstrukcji nowych elementów są bezowocne - nieskonstruujemy nic nowego aplikując dostępne konstruktory do elementów zbioru Fix(PK).

Równanie Fix(PK) = PK(Fix(PK)) to równanie rekurencyjne zbioru wyznaczonego przezstrukturę (P,K). To powszechnie przyjęty sposób opisu zbiorów rekurencyjnych - można w nimodnaleźć wszystkie składowe struktury odpowiedzialnej za jego konstrukcję. Na przykład równanierekurencyjne opisujące liczby naturalne wygląda tak:

N = 0 ∪ succ(n) : n ∈ N

Tak oto potencjalnie nieskończone zbiory rekurencyjne stały się zbiorami aktualnie nieskończnymi- ale istniejącymi tylko wewnątrz teorii mnogości36.

Ważne pytanie. I ważna odpowiedź

32Gimnazja to szkoły istniejące w słusznie minionym okresie... Aby docenić zalety systemu dziesiętnego proszęspróbować opracować algorytmy realizujące dodawanie i mnożenie w systemie rzymskim.33To oznacza, że operator finitarny jest jednoznacznie wyznaczony przez swoje działanie na zbiorach skończonych.34W istocie mówimy tu tylko o pewnym zastosowaniu tego twierdzenia.35PK(B) = B ∪ P ∪ k(b1, . . . , bn) : b1, . . . , bn ∈ B, k ∈ K36Nie dajmy się zwieść: nie można twierdzić, że wewnątrz teorii mnogości można „utworzyć” w opisany sposób zbiór

liczb naturalnych. A to dlatego, że opisując zbiórN korzystamy z twierdzenia Tarskiego, które niesposób sformułowaći dowieść bez założenia, że ... mamy do dyspozycji zbiór liczb naturalnych N.

Page 23: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 22

Zbiór Fix(PK) jest domknięty w tym sensie, że zastosowanie dostępnych konstruktorów do ele-mentów tego zbioru nie da nic nowego. Tak jest, bo dostępne konstruktory są finitarne. Ale cosię stanie, gdy zrezygnujemy z warunku finitarności, gdy choćby jeden z konstruktorów potrzebujeprzeliczalnej liczby argumentów? Intuicja podpowiada, że ów „punkt stały operatora PK” możnakonstruować podobnie, tylko nie można poprzestać na sumie

⋃n∈N PKn(∅). Trzeba iść „dalej”.

Ale jak numerować kolejne kroki konstrukcji, skoro już wyczerpaliśmy wszystkie liczby naturalne?Takie pytania postawił sobie kiedyś Cantor. I udzielił odważnej odpowiedzi ktora jest (pra)początkiem

matematyki jaką dziś znamy, matematyki, która nie boi się nieskończonści. Opowiemy o tym gdybędziemy do tego przygotowani (str. 58).

2.3 Struktury rekurencyjne w metamatematyce

Rezygnacja z wymogu konstruowalności obiektów w matematyce teoriomnogościowej może suge-rować, że struktury rekurencyjne pełnią w niej marginalną rolę. Jest wręcz odwrotnie: strukturyrekurencyjne są narzędziem sprawowania kontroli nad matematyką.

2.3.1 Gramatyki i języki

Strukturę języków naturalnych badają językoznawcy. To trudne, bo pracują na żywym i zmiennymorganizmie i mają minimalny (żaden?) wpływ na kształt badanego języka.Matematyka i logika potrzebują języków formalnych o czytelnej i jednoznacznej strukturze. Jeste-śmy twórcami tych języków, więc możemy ich strukturę planować tak, by zapewnić sobie pełnąnad nimi kontrolę. Chcemy też, by - podobnie jak języki naturalne - języki formalne były zbioramipotencjalnie nieskończonymi37. Dlatego do opisu tych języków wykorzystuje się rekurencję.

Zmodyfikujmy nieco wcześniejszą (quasi)definicję struktury rekurencyjnej dostosowując ją doopisu języków: struktura rekurencyjna nad (skończonym) alfabetem A to każda para (P,K), wktórej P ⊂ A∗ to skończony zbiór słów a K to skończony zbiór konstruktorów.Konstruktor k ∈ K przyporządkowuje pewnym (wcześniej skonstruowanym) skończonym ciągomsłów (w1, . . . , wnk) nowe, jednoznacznie określone słowo k(w1, . . . , wnk).Jak uprzednio, wymagamy by konstruktory były rozstrzygalne.

ww ∈ P w1, . . . , wnk

k(w1, . . . , wnk)k ∈ K

Słowo w należy do języka opisanego przez strukturę (P,K) wtedy, gdy jest słowem początkowym- w ∈ P - lub można je skonstruować ze słów początkowych w skończonej liczbie kroków, za pomocądostępnych konstruktorów.

Jednak to wciąż tylko quasidefinicja języka rekurencyjnego, bo odwołujemy się w niej do intu-icyjnie rozumianej rozstrzygalności38. Aby wyeliminować tę nieścisłość musimy posłużyć się niecobardziej skomplikowanym pojęciem gramatyki:

Gramatyka to układ trzech skończonych zbiorów: G = (NT, T, P ) nazywanych odpowiednio: al-fabetem pomocniczym (NT ), alfabetem właściwym (terminalnym) (T ) i zbiorem produkcji (P ).Wyróżniamy też symbol początkowy - S ∈ NT .Pojedyncza produkcja to para słów nad alfabetem NT ∪T -zapisywana sugestywnie jako „u→ v”.

37Język polski to nie tylko słowa utworzone z liter polskiego alfabetu ale - po rozszerzeniu alfabetu o znaki inter-punkcyjne i spacje - dowolny tekst (wypowiedź) w języku polskim. I nikt rozsądny nie określi maksymalnej długościwypowiedzi sformułowanej w języku polskim (co jednak nie jest przyzwoleniem na nieskończone ględzenie...).38Termin „rozstrzygalny” używamy tu w znaczeniu, jakie przypisujemy mu w języku naturalnym. Ponieważ Wielki

Słownik PWN traktuje czasownik „rozstrzygać” po macoszemu - jako synonim stwierdzenia „decydować w sposóbostateczny” - wytłumaczmy (nieformalnie) o co nam chodzi: definiując wielkości i konstruktory musimy zachowaćzdolność oceny (rozstrzygania) czy „coś” - obiekt matematyczny - jest czy nie jest wielkością początkową. I czy danykrok konstrukcji jest wykonany zgodnie z jednym z konstruktorów czy też jest to nieprawdą.Rozstrzygalność doczeka się w tym tekście ścisłej definicji matematycznej.

Page 24: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 23

Poprzednik reguły - słowo u - musi zawierać choćby jedną literę pomocniczą.Wyprowadzenie słowa (z symbolu początkowego S za pomocą produkcji ze zbioru P ) rozumiemytak, jak się nam wydaje.

Nie dajmy się zwieść zmianie terminologii: gramatyka to struktura rekurencyjna z jedną wielkością po-czątkową S i konstruktorami odpowiadającymi poszczególnym produkcjom39. A „wyprowadzenie” to tosamo, co wcześniejsza „konstrukcja”.

Język generowany przez gramatykę G to te wyprowadzalne słowa, które są złożone wyłącznie z literalfabetu terminalnego.

Przykład. Gramatyka (znanych ze szkoły) wyrażeń arytmetycznych. Jej alfabet terminalny tozbiór 0, succ,+, ·, ), (, x, y, z40 . Symbole pomocnicze to trzy tokeny - liczba, zmienna, wa. wato symbol początkowy. Produkcje tej gramatyki definiujemy tak:

wa → liczba, wa→ zmienna , wa → (wa+ wa) ,wa→ ( wa · wa) wa→ succ(wa), liczba → 0, liczba → succ(Liczba) ,zmienna → x, zmienna → y , zmienna → z,

Wyprowadzenie wyrażenia arytmetycznego (succ(0) + x) wygląda tak:

wa (wa + wa) (succ(wa)+wa) (succ(liczba)+wa) (succ(0)+zmienna) (succ(0)+x)

Opis języków za pomocą gramatyk otworzył możliwość ich klasyfikacji. Piękną, przejrzystąklasyfikację zaproponował Noam Chomsky41:

I. Język jest regularny gdy jest opisany przez gramatykę regularną - taką, która zawiera jedynieprodukcje postaci A→ Ba , A→ B, A→ ε (A,B to symbole nieterminalne, a - terminalny a „ε”to słowo puste).II. Język bezkontekstowy jest opisany przez gramatykę (bezkontekstową) w której dopuszczalne sąprodukcje postaci A→ w (gdzie A to symbol nieterminalny a w ∈ (NT ∪X)∗).III. Język kontekstowy jest opisany przez gramatykę (kontekstową), której produkcje mają kształtαAβ → αγβ gdzie A to symbol nieterminalny a α, β, γ - słowa nad (NT ∪X)∗.IV. Język kombinatoryczny to taki, który można opisać za pomocą dowolnej gramatyki.

Cóż w tym pięknego? Cierpliwości - do tej klasyfikacji powrócimy w przyszłości.

2.3.2 Dowodzenie

Cel dowodzenia to bezsporne wykazanie związku przyczynowo-skutkowego między stwierdzeniami-założeniami i stwierdzeniem - tezą. Ten cel osiągamy poprzez formalizację dowodzenia, co umożliwiaobiektywną kontrolę poprawności tego procesu. Zapewniają to takie oto paradygmaty:42

- dowodzenie jest skończoną i dyskretną procedurą, sekwencją kroków dowodowych,- wykonanie pojedynczego kroku sprowadza się do przywołania aksjomatu-założenia lub użycia

pewnej reguły dowodzenia.

Reguły dowodzenia to opisy warunków, jaki ma spełniać skończony zbiór stwierdzeń P1, . . . , Pn ipojedyncze stwierdzenie K, by móc uznać, że między przesłankami P1, . . . , Pn a konkluzją K istniejezwiązek przyczynowo-skutkowy: „uznając przesłanki reguły, mamy prawo uznać jej konkluzję”.

P1, . . . , PnK

39Aby to zauważyć wystarczy zapisać produkcje w postaci „ułamków”: zamiast u→ v pisz uv

.40Ograniczamy się do wyrażeń arytmetycznych zawierających te trzy zmienne tylko po to, by było prościej.41N. Chomsky, (1928 - ) twórca podstaw współczesnej lingwistyki matematycznej. Zacytujmy wypowiedź Chom-

sky’ego wpisującą się w dyskusję o nieskończoności kontrolowanej: „znajomość języka zakłada niejawną znajomośćnieskończenie wielu zdań...”[13]42Mówimy tu o hilbertowskiej koncepcji dowodu.

Page 25: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 24

Np. fundamentalna dla klasycznej logiki reguła odrywania („modus ponens”) stanowi, że „uznającstwierdzenie A i implikację A→ B mamy prawo uznać stwierdzenie B”:

A,A→ B

B

Dowód związku przyczynowo-skutkowego: „stwierdzenie-teza ST jest konsekwencją zbioru stwier-dzeń - założeń (aksjomatów) A ” - to skończony ciąg stwierdzeń:

ST0 ST1 · · ·STi STi+1 · · · STn = ST

taki, że każde stwierdzenie STi jest:- jednym z wyjściowych założeń (aksjomatów), lub- konkluzją pewnej reguły, której przesłanki można odnaleźć w podciągu poprzedzającym STi.

Mówimy wtedy, że ST jest wywodliwe (da się wywieść, ma dowód) ze zbioru założeń A.

System dowodzenia to struktura rekurencyjna: aksjomaty to wielkości początkowe a reguły dowodzeniato konstruktory43.

Obiekty konstruowane w tej strukturze to stwierdzenia dowodliwe - konsekwencje aksjomatów rozważa-nego systemu dowodzenia. Dowody to konstrukcje stwierdzeń.Wiedza o konsekwencjach zbioru aksjomatów ma cechy zbioru potencjalnie nieskończonego: do dziś zbu-dowaliśmy jego skończony fragment złożony z udowodnionych twierdzeń. Jutro ten zbiór rozszerzymy44.

Przykład „z życia wzięty”: uznajmy za aksjomaty informacje: „istnieje bezpośrednie połącze-nie lotnicze z miasta A do B” a za regułę stwierdzenie: „jeśli istnieją połączenia lotnicze z A do Bi z B do C, to istnieje połączenie między miastami A i C”.

Warszawa ParyżA B,B C

A C

(to tylko przykładowy „aksjomat”. Ich pełny zbiór to „Światowy Rozkład Lotów”). Możemy terazpróbować bezspornie dowieść istnienia połączenia lotniczego (z przesiadkami) np. z Warszawy doSydney. Gdy marzymy o komfortowych podróżach, to wystarczy zmienić regułę na bardziej re-strykcyjną: „jeżeli istnieją wygodne połączenia z A do B i z B do C, a czas oczekiwania w B nieprzekracza 3 godzin, to uznajemy, że istnieje wygodne połączenie z A i C”.45

Wymóg rozstrzygalności zbioru aksjomatów i reguł sprawia, że potrafimy rozstrzygać o poprawności do-wodu - „we recognise a proof when we see one”46. To umożliwia społeczną kontrolę nad matematyką: jeślimówisz, że twoje twierdzenie jest prawdziwe, to pokaż jego dowód. A my zweryfikujemy jego poprawność.Przyjęcie hilbertowskiej koncepcji dowodu uczyniło z matematyki naukę tak pewną, jak to tylko możli-we: liczba kontrolujących poprawność głoszonych „prawd matematycznych” - dowiedzionych twierdzeń- jest nieograniczona (potencjalnie nieskończona). Wymóg rozstrzygalności aksjomatów i reguł systemudowodzenia wyklucza jakiekolwiek spory interpretacyjne.

Jest wiele systemów dowodzenia. Praktycznie każda dziedzina współczesnej matematyki ma sweaksjomatyczne przedstawienie, swój własny system dowodzenia. Systemy dowodzenia pojawiają sięteż w matematyce stosowanej. Stworzono nawet specjalny język programowania Prolog, w którym

43Przyjmijmy tu jednak nieco bardziej liberalną definicję struktury rekurencyjnej: uznajmy, że zbiór wielkościpoczątkowych i konstruktorów nie musi być skończony ale jedynie rozstrzygalny, czyli „pod kontrolą”.44Zwolennicy matematycznej transcednecji powiedzą, że my nie budujemy, ale odkrywamy coraz to większe frag-

menty aktualnie istniejącego nieskończonego zbioru prawd matematycznych.45Moi rówieśnicy pamiętają dworcowe „okienko informacji PKP” gdzie pani zapytana o połączenie Gdynia - Ustrzy-

ki Górne z zadziwiajacą biegłością, korzystając z aksjomatów (rozkładu jazdy), swojej wiedzy i doświadczenia, wska-zywała stosowne połączenia. Dziś tę rolę pełnią programy komputerowe...46G. Suldholm, „Vestiges of realism” - artykuł w książce The Philosophy of Michael Dummett.

Page 26: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 25

możemy zbudować swój własny system - taki jak np. „światowy system połączeń lotniczych” - iwykorzystać Prolog do automatycznego dowodzenia twierdzeń w tym systemie47.

Niech nam jednak nie przyjdzie do głowy utożsamiać hilbertowski zapis dowodu z procesem dowodzenia!Więcej o tym w rozdziale poświęconym językowi matematyki i logice języka.

Więcej niż przykład: równoważność kontrolowana

Krótko(!) po wynalezieniu liczb naturalnych ludzie zaczęli ich używać nie tylko do prostego zliczania ikolejkowania, ale w sposób bardziej zaawansowany - do usprawniających te czynności obliczeń48. Językarytmetyki został rozszerzony. Zaczęto mówić o sumie i iloczynie liczb. Pojawiły się napisy, które dziśnazywamy wyrażeniami (termami) arytmetycznymi, a wraz z nimi konieczność oceny, czy takie napisy„znaczą to samo”, są równoważne? Czy 3 · (2 + 11) to to samo, co 5 · 3 + 2 · 7?.

Czy potrafimy kontrolować równoważność wyrażeń?Matematyk to pytanie sformułuje tak: czy potrafimy wskazać system formalny - zbiór aksjoma-

tów i reguł - pozwalający dowodzić równoważności wyrażeń w językach rekurencyjnych?To możliwe. Nie zawsze, ale w większości „interesujących” przypadków. Pokażemy, jak to zrobić.

Chcąc zachować sens stwierdzenia „wyrażenia znaczą to samo” musimy się zgodzić, że równo-ważność wyrażeń ma trzy podstawowe cechy: dla dowolnych wyrażeń t, r, s :

- „t znaczy to samo co t”,- „ jeśli t znaczy to samo co p, to p znaczy to samo co t”,- „ jeśli t znaczy to samo co p, a p to samo co r, to p znaczy to samo co r”,

Te cechy - nazywane przez matematyków zwrotnością, symetrycznościa i przechodniością - posłu-żą do sformułowania reguł poszukiwanego systemu dowodzenia. Gdy użyjemy napisu t ≡ p dlaoznaczenia stwierdzenia „t jest równoważne p” to zapiszemy je tak:

t ≡ t,

t ≡ p

p ≡ t,

t ≡ p, p ≡ rt ≡ r

Czwarta reguła odnosi się do rekurencyjnego charakteru języka wyrażeń i mówi tyle: „jeśli pew-ne wyrażenia są parami równoważne, to i wyrażenia utworzone z nich za pomocą tego samegokonstruktora są równoważne”:

t1 ≡ p1, . . . tk ≡ pkk(t1, . . . , tk) ≡ k(p1, . . . , pk)

dla dowolnego konstruktora k

To wszystko - jeśli mówimy o regułach. Opis pojedynczej równoważności sprowadza się teraz dowskazanie rozstrzygalnego zbioru równoważności bazowych ti ≡ pi : i ∈ I - aksjomatów budowa-nego systemu.

„Wiedzieć” że wyrażenia t i p są równoważne oznacza teraz, że potrafimy zbudować dowódstwierdzenia t ≡ p w tak skonstruowanym systemie. Możemy kontrolować równoważność kontrolującpoprawność dowodu. Jest tak, jak chciał Martin-Lof.

Z równoważnością jest trochę tak jak z nieskończonością. Można przyjąć, że równoważność musi być podkontrolą, musi mieć rozstrzygalny zbiór bazowych równoważności. Tak chcą konstruktywiści.Ale gdy przyjmiemy teoriomnogościowy punkt wiedzenia i uznamy, że równoważność to każda relacjazwrotna, symetryczna i przechodnia na dowolnym zbiorze to - na własne życzenie! - mamy problem: niekażda taka równoważność ma rozstrzygalny podzbiór równoważności bazowych, który pełniłyby rolę

47W Prologu można implementować tylko systemy dowodzenia należące do pewnej, ścisle określonej klasy. Jestjednak ona na tyle duża, że programy logiczne - implementacje systemów dowodzenia - znajdują liczne zastosowania.Dodajmy dla porządku: hilbertowska koncepcja dowodu nie jest niekwestionowanym paradygmatem matematycznym.Akceptacja nieskończoności aktualnej zachęciła niektórych do rozważania logik infinitarnych w których odchodzi sięod finitarnego charakteru procesu dowodzenia. Ale to nie jest temat, którym będziemy się tu zajmować.48Słowo „arytmetyka” można wywieść od greckiego arithmein – liczyć. A liczyć to nie to samo co zliczać.

Page 27: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 26

aksjomatów systemu pozwalającego „orzekanie o równoważności” zastąpić dowodzeniem. Takiej równo-ważności nie potrafimy kontrolować.Który definicja równoważności jest właściwa? A która matematyka jest właściwa - konstruktywna czy ta,ktorą zaproponowali Cantor i Hilberta?

Na koniec wróćmy do początku, czyli do równoważności wyrażeń arytmetycznych. Ta równo-ważność jest, na szczęście, „konstruktywna”49. Równoważności bazowe - aksjomaty systemu po-zwalającego na dowodzenie równoważności wyrażeń arytmetycznych - opisujemy sprytnie tak:

x+ 0 ≡ x x · 0 ≡ 0x+ succ(y) ≡ succ(x+ y) x · succ(y) ≡ (x · y) + x

Dlaczego sprytnie? Te cztery zapisy to „schematy”. Każdy taki schemat opisuje nieskończony zbiórbazowych równoważności, które otrzymamy zastępując zmienne w nich występujące - litery x i y- wyrażeniami arytmetycznymi. Np. do zbioru opisanego przez schemat x + 0 ≡ x należy rów-noważność succ(succ(0) + succ(0)) + 0 ≡ succ(succ(0) + succ(0)) otrzymana przez podstawienie[x := succ(succ(0) + succ(0))].

Użycie schematów pozwola na skończony opis nieskończonego, ale rozstrzygalnego zbioru bazo-wych równoważności.

Twierdzisz, że 2 + 2 ≡ 4? No to przedstaw dowód50

Czy takie rozwiązanie problemu równoważności wyrażeń jest satysfakcjonujące? Nie dla wszystkich.A dlaczego, powiemy gdy będziemy wiedzieć więcej - w rozdziale „Obliczalność”

2.3.3 Dodatek: jaką nieskończoność tolerują komputery?Nie pytaj o znaczenie. Pytaj o użycie.

L. Wittgenstein51

Komputery liczą. We wielu językach programowania mamy do dyspozycji tzw. typ całkowity (w C,C++ - „int”, w Pascalu - „integer”) – który jest zbiorem liczb całkowitych, ale tylko z pewnegozakresu. Ten zakres może być nawet bardzo duży, ale zawsze jest skończony. Te zbiory (typy) tylkoudają nieskończoność aktualną.

Ale są języki, które swobodnie posługują się nieskończonością potencjalną. To możliwe, bopotrafimy zmusić komputery do odczytywania równań rekurencyjnych52. Np. w języku programo-wania funkcyjnego Haskell możemy jako deklaracji typu użyć takiego zapisu:

data Nat = Zero | Succ NatPodobieństwo do równania rekurencyjnego opisującego liczby naturalne - N = 0 ∪ succ(n);n ∈N - jest widoczne. Ale - z oczywistych powodów - po wczytaniu takiej specyfikacji komputer niewygeneruje w swej pamięci aktualnie nieskończonego zbioru liczb naturalnych. Kompilator Haskellaodczyta to równanie jako opis rekurencyjnej procedury pozwalającej rozstrzygać, czy dany napisjest numerałem - wyrażeniem typu Nat.

Komputery nie rozumieją, czym jest liczba naturalna. One tylko potrafią je rozpoznawać - rozstrzygać,czy dany napis reprezentuje liczbę naturalną.

Pięknym przykładem wykorzystania możliwości operowania nieskończonością potencjalną w Ha-skellu jest implementacja sita Eratostenesa - procedury budowy listy liczb pierwszych. Przypomnij-my tę procedurę.

49„Na szczęście” bo w przeciwnym razie najprawdopodobniej mieszkalibyśmy wciąż w jaskiniach... .50Pzypomnijmy, że „2” to succ(succ(0)) a „4” to succ(succ(succ(succ(0)))).51Ludwig Wittgenstein (1889 - 1951) – filozof, którego będziemy wielokrotnie tu przywoływać.52Ciekawe: komputery „rozumieją” równania rekurencyjne a studenci już niekoniecznie... .

Page 28: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 27

dane początkowe to nieskończona lista liczb naturalnych uporządkowana rosnąco, bez 0 i 1,krok pierwszy: z listy początkowej wyrzuć wszystkie wielokrotności 2 z wyjątkiem pierwszegoelementu listy,krok rekurencyjny: z listy utworzonej w k-tym kroku, usuń wszystkie wielokrotności liczbystojącej na k + 1 miejscu (z wyjątkiem k + 1 elementu listy).

W tym opisie swobodnie korzystamy z aktualnej nieskończoności liczb naturalnych. Budującimplemantację tej procedury - trzeba zastąpić nieskończoność aktualną przez potencjalną: musimyopisać strukturę rekurencyjną generującą taką potencjalnie nieskończoną listę.W Haskellu wygląda to tak:

sieve (p : xs) = p : sieve [x | x <- xs, x ‘mod‘ p > 0]primes = sieve [2..]

(Napis [2.. ] to haskellowa deklaracja procedury generującej listę liczb naturalnych bez zerai jedynki53. A deklarację „sieve [x | x <- xs, x ‘mod‘ p > 0]" czytamy tak: „z listy xswybierz te liczby, które nie dzielą się przez p”.54)Wywołanie procedury „primes” to inicjacja nieograniczonego w czasie procesu generowania po-tencjalnie nieskończonej listy liczb pierwszych. Jeśli tak, to sens uruchomienia tej procedury jestwątpliwy - komupter nigdy nie skończy pracy, nie wyprodukuje kompletnej listy liczb pierwszych.

To oczywiste. Ale możemy skorzystać z dostępnej w Haskellu procedury „take n”, która za-aplikowana do listy zwraca jej pierwszych n elementów.Program „take n primes” wygeneruje listę n najmniejszych liczb pierwszych!Wyjaśnienie, w języku mainstreamowej matematyki, dlaczego tak to działa, jest nieco kłopotliwe.No bo tak: żeby wybrać n elementów listy primes muszę najpierw tę (aktualnie nieskończoną) listęumieścić w pamięci komputera i dopiero potem uruchomić procedurę take n. Niemożliwe...A jednak. Wystarczy przyjąć, że primes to proces (generowania listy) a nie rzecz (lista) a apli-kacja procedury take n do primes to ingerencja w ten proces - przerywa go po wygenerowaniupoczątkowego fragmentu długości n. Proste?

Proste, bo zamiast o rzeczach, zaczęliśmy myśleć o procesach. Struktura rekurencyjna jest teraz interpre-towana nie jako opis zbioru, ale procesu.Komputery nigdy nie zaakceptują nieskończoności aktualnej. Ale potrafią korzystać z nieskończonościpotencjalnej (jeśli je tego nauczymy).

53Działa to podobnie jak wyżej opisana procedura produkująca dowolnie długą listę jedynek.54Spróbuj się przekonać, że sieve [2..] to rzeczywiście (potencjalnie) nieskończona lista liczb pierwszych. To nie

takie trudne - jeśli czujesz rekurencję...

Page 29: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 3

Przestrzeń - matematycznie

„Przestrzeń stanowi aprioryczną formę ujmowania zjawisk, for-mę porządkującą napływ wrażeń zmysłowych.” I. Kant1

Matematyka konstruktywna dysponuje liczbami naturalnymi, całkowitymi, wymiernymi, słowa-mi, językami i dowodami. Dlaczego to za mało?

O kształcie matematyki zdecydowały osiągnięcia cywilizacyjne starożytnej Grecji. To wtedywypracowano podstawy arytmetyki i geometrii - dwóch fundamentalnych teorii matematycznych.Do tych teorii odniósł się Kant gdy prawie dwa tysiące lat później definiował matematykę jako„logiczną analizę stosunków czasowych i przestrzennych. Pierwsze zadanie matematyka realizuje zapomocą arytmetyki, drugie - geometrii”.Geometria Greków miała dwa źródła: pierwsze to problemy praktyczne, związane z pomiaramiziemi, budownictwem itp.. Drugie to astronomia2. Wykorzystanie liczb do opisu proporcji międzyporównywalnymi obiektami geometrycznymi (np. długościami odcinków) to kolejne, odwieczne za-stosowanie liczb (naturalnych). Bardziej wyrafinowane od zliczania i kolejkowania i w konsekwencjiprowadzące do akceptacji nowego rodzaju liczb - liczb wymiernych - ułamków. To o tych liczbachmyśleli pitagorejczycy głosząc pogląd, że „wszystko co istotne jest liczbą”3.To był niepodważalny paradygmat wsparty codziennym doświadczeniem. Do czasu, gdy te do-świadczenia mierniczych, budowniczych, etc. postanowiono przenieść do świata platońskich bytówidealnych. Wtedy okazało się, że w idealnym kwadracie proporcja długości przekątnej i boku wcalenie jest liczbą wymierną... . To był szok4 i przyczyna tzw. pierwszego wielkiego kryzysu w mate-matyce: liczb, które możemy finitarnymi metodami skonstruować z liczb naturalnych jest za mało.Sto lat po tej katastrofie Eudoksos zaproponował rozwiązanie problemu - teorię proporcji. W dużymskrócie: źródłem liczb u Eudoksosa są proporcje porównywalnych wielkości - np. długości odcinków.Liczby (dzisiaj powiemy: liczby rzeczywiste dodatnie) to miary proporcji:

√2 jest miarą proporcji

długości przekątnej i boku kwadratu5.

1Immanuel Kant (1724-1804) – niemiecki filozof, profesor Uniwersytetu w Królewcu. Był też wykładowcą mate-matyki. Nie wiem wystarczająco dużo o jego koncepcjach filozoficznych by móc z pełnym przekonaniem tłumaczyćje innym. To, co piszę, jest jedynie wybiórczą (nad)interpretacją poglądów Kanta. Spragnionych wiedzy rzetelnejodsyłam np. do [34] gdzie opisano wpływ Kanta na filozofię matematyki.2Polecam artykuły J. Waszkiewicza „Wpływ astronomii greckiej na powstanie geometrii” (http://www.msn.ap.

siedlce.pl/smp/msn/1/34-44.pdf) i M. Hellera, Z. Pogody Geometria i kosmologia - historia wzajemnych związków(http://www.msn.ap.siedlce.pl/smp/ msn/3/27-31.pdf3Sprowadzenie filozofii pitagorejczyków - uczniów i następców Pitagorasa (572 - 497 p.n.e.) - do jednego hasła jest

oczywiście uproszczeniem.4Legenda głosi, iż odkrywca niewymierności „liczby”

√2 został z tego powodu uśmiercony... . Ciekawostka: w

jęz. angielskim liczby wymierne to rational numbers - liczby „racjonalne”. Pozostałe liczby rzeczywiste - liczbyniewymierne - są irrational. Tak samo jest w jęz.niemieckim... .5Eudoksos (ok. 408 - ok. 355 p.n.e.). Proporcje porównujemy „geometrycznie”: a

b> c

dgdy można wskazać dwie

liczby naturalne m,n takie, że n-krotnie przedłużony odcinek a jest dłuższy od m-krotnie przedłużonego odcinka b ijednocześnie m-krotnie przedłużony odcinek d jest dłuższy od n-krotnie przedłużonego odcinka c (dziś - korzystającz ustalenia, że długość odcinka to liczba rzeczywsta - można napisać: a

b> m

n> c

d). Dwie proporcje wyznaczają tę

28

Page 30: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 29

Konieczność wyjścia poza liczby wymierne to nie jedyny kłopot z jakim trzeba się zmierzyć, byobjąć metodami obliczeniowymi geometrię Greków. Ból głowy narasta, gdy mamy odpowiedzieć -matematycznie - na pytanie „co to jest przestrzeń?” i „czym jest ciągłość przestrzeni?”

3.1 Przestrzeń - co to jest?

„Czas i przestrzeń nie są własnościami rzeczy, lecz właściwościami podmiotowego sposobu ujmowa-nia zjawisk; są formami naszej zmysłowości; są siecią, za pomocą której łowimy to, co postrzegamy.Poznać przedmiot to ująć go w czasie i przestrzeni” - to znowu Kant6.: „Każda rzecz jest niejako w przestrzeni możliwych stanów rzeczy. Przestrzeń mogę pomyśleć jakopustą, ale rzeczy bez przestrzeni nie. Przedmiot przestrzenny musi leżeć w nieskończonej przestrze-ni” - Wittgenstein. I jeszcze jedno zdanie z „Traktatu”: „to czego nie uda się ująć matematycznie,co nie ma formy przestrzenno-czasowej, jest poza doświadczeniem”.Współcześnie kognitywiści7 o przestrzeni mówią tak: „Space does not consists of objects. Rather,it is the background settings the objects are located in. Space exists independly of, and priorto, any object located in the space” [68]8.

Ujmowanie zjawisk to funkcja mózgu który rejestruje bodźce, porównuje z wcześniejszymi, za-pamiętuje. To proces permanentny i w części niezależny od naszej świadomości. Ale zdolność dorejestracji nie jest tożsama z umiejętnością analizy, ujawniania powiązań między zjawiskami copozwala na podjęcie prób dotarcia do ich istoty. Do tego niezbędny jest adekwatny język9. Jegoosnową jest siatka pojęć - zbiór strukturalnie powiązanych nazw wskazujących kluczowe elementywybranej formy ujmowania zjawisk10.

Kluczowe pojęcie klasycznego języka opisu przestrzeni to punkt: „Punkt jest tym, co nie ma częścilub nie ma żadnej wielkości”- Euklides. Kognitywiści dodają: „Points are locations in space, onlines, or on planes. They are not objects that can exists independly of the line, plane or space [68].”

Jak to się stało, że abstrakcyjne pojęcie bezwymiarowego punktu zyskało akceptację starożytnych? Możedlatego, że wszyscy mamy nad głową mamy ten sam podręcznik „geometrii przestrzeni” - bezkresneniebo z nieosiągalnymi (i tym samym abstrakcyjnymi, pozbawionymi fizyczności) gwiazdami-punktami.Te punkty łatwo - w wyobraźni - łączyć prostymi tworząc idealne figury geometryczne11.

Geometria operuje też pojęciami linii, płaszczyzny, przestrzeni. Jaka jest relacja między punk-tem a linią? Czy linia (płaszczyzna, przestrzeń) jest zbiorem punktów, czy też punkty jedynie leżąna linii (płaszczyźnie, w przestrzeni)? Te pytania można by uznać za błahe gdyby nie to, że linii(płaszczyźnie, przestrzeni) przypisuje się niezwykły atrybut - ciągłość.

samą liczbę rzeczywistą gdy nie jest prawdą, że ab< c

doraz c

d< a

b. [87].

6http://www.kul.pl/files/450/Kant.pdf7Kognitywistyka to młoda dziedzina nauki zajmująca się analizą działania zmysłów, mózgu i umysłu. W pewnym

sensie uzupełnia ona tradycyjną epistemologię - teorię poznania, korzystając z dorobku współczesnej medycyny,psychologii czy lingwistyki.8Pozwolę sobie na ekstrawagancję: w muzyce baroku funkcjonuje termin „basso continuo” „Continuo” po włosku

to „ciągle, nieprzerwanie”. A chodziło o „głos basowy tworzący podstawę harmoniczną utworu”..9W cytowanym wyżej internetowym wykładzie poświęconym filozofii Kanta znalazło się ładne zdanie: „Podmiot

w poznaniu jest aktywny – dokonuje syntezy tego, co dane. Podmiot konstytuuje świat swojego doświadczenia, alenie w sensie jego istnienia, lecz w sensie wprowadzenia ładu w chaotyczną rapsodię wrażeń”.10Oto (niepełna) lista funkcjonujących w matematyce „przestrzeni” zamieszczona na stronie http://mathworld.

wolfram.com/Space.html : affine s. (space), Baire s., Banach s., Base s., Bergman s., Besov s, Borel s., Calabi-Yau s.,Cellular c., Chu s., Drinfeld’s Symmetric s., Eilenberg-Mac Lane s., Euclidean s., Fiber s., Finsler s., First-Countables., Frechet s., Function s., G-Space, Green s., Heisenberg s., Hilbert s., Inner Product s., L2-Space, Lens s., Liouvilles., Locally Finite s., Loop s., Mapping s., Measure s., Metric s., Minkowski s., Muntz s., Normed s., Paracompacts., Planar s., Polish s., Probability s., Projective s, Riemann’s Moduli s., Sample s., Standard s., State s., Stone s.,Symplectic s., T2-Space, Teichmuller s., Tensor s., Topological s., Topological Vector s., Total s., Vector s..11Dodajmy, że około stu lat przed Euklidesem Demokryt stworzył teorię, w której materia składała się z niepo-

dzielnych („punktowych”) i zapewne bezwymiarowych, atomów...

Page 31: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 30

3.2 Kontinuum - przedmiot (ciągłego) sporu

Natura non facit saltus (natura nie skacze) - G.F.Leibniz12

Liczby naturalne to struktura dyskretna. Podobnie liczby całkowite. Liczby wymierne to struk-tura gęsta - między każde dwie takie liczby można wstawić trzecią od nich różną.Ale matematyka potrzebuje czegoś więcej - potrzebuje ciągłości, potrzebuje swego kontinuum13.Na jednej ze stron internetowych (bodajże wikipedii) napisano tak:

Continuum (...) anything that goes through a gradual transition from one condition, to a differentcondition, without any abrupt changes14.

Ciągłość to niepodzielność, brak luk i skoków. Antyteza dyskretności15. Zmiany wysokości to-nu skrzypiec odbieramy jako ciągłe a fortepianu - jako dyskretne, „schodkowe”. Ciągłość nie bu-dzi sprzeciwu. Przeciwnie: z niedowierzaniem przyjmujemy informację, że coś, co odbieramy jakoprzekaz ciągły, jest w istocie gęstym przekazem dyskretnych sygnałów. To jest własność naszychzmysłów i umysłu: mamy w sobie mechanizm wygładzania sekwencji odbieranych sygnałów16. Wtakim widzeniu świata utwierdzali nas wielcy: „Natura nie skacze” - Leibniz, „czas i przestrzeń tociągłe wielkości” (quanta continua) - Kant17. Dziś kognitywiści mówią to samo: „Space is absolutelycontinuous” [68]. My tak postrzegamy przestrzeń i procesy w niej zachodzące18.

Tylko postrzegamy. Od czasów Maxa Plancka wiemy, że przynajmniej na poziomie kwantów założenieciągłości procesów nie jest niepodważalne.

Antyczni Grecy mieli z ciągłością kłopot. Dla Arystotelesa continua to „odległość, czas i ruch”[64]. W „Fizyce” napisał: „Continuum nie może być utworzone z niepodzielnych wielkości” (np.punktów)”19. Arystoteles opisywał kontinuum tak:1. „kontinuum składa się z części”,2. „ich stykające się granice są te same i zawierają się w sobie nawzajem”,3. części te są „podzielne w nieskończoność”20

Dla Euklidesa linia to drugie, obok punktu, pojęcie pierwotne geometrii. „Linia to długość bezszerokości”. „Linią prostą jest ta, która jest jednakowo położona względem punktów na niej leżą-cych”. Pierwsze zdanie wydaje się naiwne, drugie niezrozumiałe. Ale z tego drugiego wynika, żew koncepcji Euklidesa linia nie jest zbiorem punktów! Punkty leżą na linii ale jej nie tworzą.„Końcami (kresami) linii są punkty”, „prostą można ciągle przedłużać po prostej”21.

12Gottfierd Leibniz (1646-1716) filozof, matematyk, prawnik i ... dyplomata.13Kontinuum - słowo łacińskie, które w [9] objaśniono (po angielsku) tak: „the word “continuous” derives from a

Latin root meaning “to hang together” or “to cohere”; this same root gives us the nouns “continent” — an expanseof land unbroken by sea — and “continence” — self-restraint in the sense of “holding oneself together”. Synonymsfor “continuous” include: connected, entire, unbroken, uninterrupted.”14abrupt - nagły, gwałtowny.15Polski termin „matematyka dyskretna” jest dość nieszczęśliwy. „Dyskrecja” ma w języku polskim inne znaczenie,

bliższe angielskiemu „discreet” (a nie „discrete”) . A nikt na świecie nie słyszał o „discreet mathematics”...16Bezwładność oka sprawia, że po zarejestrowaniu wrażenia wzrokowego przez krótki czas oko nie jest w stanie

odebrać nowego obrazu. To pozwala na oglądanie ruchomych obrazów w telewizji - obrazy pojawiające się na ekranieczęściej niż co 0,1 sekundy zlewają się ze sobą i dają wrażenie ciągłego ruchu.17„Space and time are quanta continua ...points and instants mere positions.. and out of mere positions viewed as

constituents capable of being given prior to space and time neither space nor time can be constructed.”18Dawno temu, jeden z moich przyjaciół, astronom, pasjonował się pionierskim w owym czasie „komputerowym

oczyszczaniem” wyników nasłuchów radioteleskopowych, rejestrowanych w postaci nieregularnej krzywej, z gwałtow-nymi zmianami, skokami. Oczyszczanie polegało na „wygładzeniu” tej krzywej w przekonaniu, że to, co jej gładkość(ciągłość) psuje, to zakłócenia nakładające się na sygnał przychodzący z wszechświata. Wszak natura nie skacze...19„No continuum can be made up of indivisibles, as for instance a line out of points, granting that the line is

continuous and the point indivisible”. [9]20Ta „nieskończona podzielność” jest potencjalna..21Cytuję za artykułem „O „elementach” Euklidesa” - http://www.math.uni.opole.pl/ ebryniarski Elementy Eukli-

desa.pdf (z czego wnoszę, że autorem tego tekstu jest E. Bryniarski). Linia prosta nie jest nieskończona, ale jestnieskończenie przedłużalna, „rozciągliwa”, jest potencjalnie nieskończona.

Page 32: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 31

Teoria mnogości, która narzuciła sobie ograniczenie podstawowych schematów wyobrażeniowychdo jednego - zbioru - nie ma - bo mieć nie może - wątpliwości: linia to zbiór punktów.

W 1872 roku Dedekind przedstawił konstrukcję, która przez matematykę mainstreamową zo-stała uznana za satysfakcjonujące rozwiązanie problemu kontinuum22. Zaproponował on taki otosposób konstruowania zbioru liczbowego istotnie większego od zbioru liczb wymiernych:jeżeli gęsty zbiór liczb wymiernych rozdzielimy na niepuste zbiory A i B tak, by każda liczba z Abyła mniejsza od każdej liczby z B, to może się zdarzyć jedna z trzech sytuacji: albo zbiór A maelement najmniejszy, albo B najmniejszy albo między tymi zbiorami jest luka - w A nie ma liczbynajwiększej, a w B - najmniejszej. Tak jest gdy np. przyjmiemy B = a ∈ Q : a2 > 2.Sens defincji Dedekinda to stwierdzenie, że tam nie ma luki - tam jest liczba rzeczywista

√2:

jakikolwiek podział zbioru liczb wymiernych na dwa zbiory spełniający opisane wyżej warunki -przekrój Dedekinda - wyznacza liczbę rzeczywistą. Jeśli to jest „przekrój z luką” to wyznacza liczbęniewymierną a jeśli nie, to liczbę wymierną.

Twierdzenie, że coś istnieje tam, gdzie niczego nie ma, to niedorzeczność - gdy traktujemy matematykęjako odkrywanie. Ale ma sens, gdy ją tworzymy.

Dlaczego propozycja Dedekinda spotkała się z tak powszechną aprobatą? Oto jak tłumaczy topolski matematyk, R. Sikorski23:(...) zbiór liczb wymiernych ma wady. Wprawdzie jest gęsty, (ale) jest jednak dziurawy (...). Istnieniedziur w zbiorze liczb wymiernych jest źródłem wielu kłopotów. Obrazowo można powiedzieć, żeprzez te dziury wycieka treść matematyczna wielu pięknych twierdzeń (...) . Zbiór liczb wymiernychjest świetny do rachunków na liczbach konkretnych, ale zły dla wielu celów teoretycznych (...). Woparciu o pojęcie liczby rzeczywistej można zbudować całą analizę matematyczną (...). U podstawwszystkich twierdzeń tej części matematyki leży „szczelność” zbioru liczb rzeczywistych.

Budowanie wyobrażenia ciągłości w matematyce zaczynamy od intuicyjnego stwierdzenia, że„funkcja jest ciągła, jeżeli jej wykres można narysować bez odrywania ołówka od papieru”. Towystarczy, by zgodzić się z twierdzeniem Darboux: „jeśli funkcja f : R → R jest ciągła i f(a) <0 < f(b) , to istnieje punkt-liczba rzeczywista c ∈ [a, b] taka, że f(c) = 0”24.

To przestaje być prawdą, gdy liczby rzeczywiste zastąpimy wymiernymi. Wystarczy pomyślećo funkcji f : Q → Q opisanej wzorem f(x) = x2 − 2 : oczywiście f(0) < 0 < f(2) ale nie istniejeliczba wymierna c taka, że f(c) = 0.

Twierdzenie Darboux to jeden z tych wyników, które „wyciekną” gdy nie uszczelnimy strukturyliczb wymiernych za pomocą liczb rzeczywistych... .

W dowodzie twierdzenia Darboux wykorzystujemy to, że „niepusty podzbiór liczb rzeczywistych, któryjest ograniczony z góry, ma kres górny”. Ta nieco zawiłe i wysoce abstrakcyjne stwierdzenie zostało przezDedekinda wyniesione do rangi matematycznej definicji ciągłości.Dedekind wiedział, że jedynie modeluje ciągłość matematycznie (teoriomnogościowo). Pisał: „przyjęcietej własności linii prostej jest (...) aksjomatem dopiero na mocy którego przyznajemy linii prostejjejciągłość” [95]25.

22Julius Dedekind (1831 -1916) – niemiecki matematyk, uczeń Gaussa.23Roman Sikorski (1920 - 1983). Cytat pochodzi z artykułu „Czy liczby rzeczywiste są rzeczywiste?” (Delta

01/1974). Niech nas nie zwiedzie to, że adresatem artykułu są dzieci: aby coś wytłumaczyć dziecku trzeba byćlepiej przygotowany niż do wygłoszenia wykładu „ex cathedra”...24Wykres takiej funkcji ciągłej f , rozpoczynamy rysować pod prostą x = 0 a kończymy powyżej niej, nie odrywając

ołówka od papieru. Dlatego wykres musi przeciąć tę prostą - mieć z nią punkt wspólny.25„Continuum, tak rozumiane, jest zbiorem poszczególnych elementów, uszeregowanych w pewnym porządku; jest

ich wprawdzie nieskończenie wiele, ale poszczególne elementy są całkowicie rozdzielone. Nie odpowiada to zwykłe-mu rozumieniu continuum, zgodnie z którym poszczególne elementy są połączone i tworzą całość, dzięki czemu niepunkt istnieje przed linią, lecz linia przed punktem. Ze słynnej formuły ”continuum to jedność w wielości” pozostałatylko wielość, jedność znikła. Analitycy mają jednak słuszność, gdy określają swoje continuum tak, jak to opisaliśmypowyżej, gdyż takie pojęcie continuum jest przedmiotem ich rozważań, od kiedy w rozważaniach tych zaczęli prze-

Page 33: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 32

Skuteczność analizy matematycznej, której podstawą jest taka interpretacja ciągłości, to ważkiargument na rzecz propozycji Dirichleta. Ale to nie oznacza, że wszystko jest jasne: definicja Dede-kinda może (powinna) napotkać na wewnętrzny opór. Jak można twierdzić, że istnieje „coś” tam,gdzie nie ma nic, gdzie jest luka? Przecież:

„powiedzieć, że istnieje, o czymś, czego nie ma, jest fałszem. Powiedzieć o tym, co jest, że jest,a o tym, czego nie ma, że go nie ma, jest prawdą”. („Metafizyka”, Arystoteles) .

To, co zrobił Dedekind zdaje się być jawnie sprzeczne z tą zasadą. Co z tym zrobić?Formalista powie: w teorii mnogości uznajemy aktualne istnienie dowolnych podzbiorów liczb wy-miernych. Liczbą niewymierną nie jest „coś” w luce między zbiorami. Ta liczba to wskazana parazbiorów liczb wymiernych - przekrój Dedekinda. Napis

√2 to tylko nazwa jednej z takich par26. Nic

w tym dziwnego, bo w matematyce teoriomnogościowej wszystkie wcześniej konstruowane liczby -naturalne, całkowite i wymierne - też są zbiorami. To co proponuje Dedekind jest konstrukcjąjeśli tylko akceptujemy aktualne istnienie nieskończonych zbiorów.

To wyjaśnienie, choć formalnie poprawne, nie do końca przekonuje. Liczba to para (nieskończo-nych) zbiorów liczb? I jeszcze mam to „coś” nazywać liczbą rzeczywistą?

3.2.1 Metafora geometryczno-liczbowa

„Analiza matematyczna (...) opierała swoje znaczenie i poczu-cie słuszności na związku z geometrią”. [36] str. 289.

Cantor nie miał wątpliwości. Pisał „continuum is the arithmetical continuum of all real numbers,defined by means of the method of the Dedekind cuts”. Dedekindowskie ontinuum to centralnyobiekt jego matematyki27.

Formalizm to nie najlepszy sposób postrzegania matematyki. Ani jej objaśniania. Gdzie więcszukać źródeł intuicji pozwalającej na mentalną akceptację tak definiowanych „liczb”? Odwołajmysię powtórnie do odwiecznego współistnienia arytmetyki i geometrii. Te dwa „ortogonalne” aspektymatematyki wzajemnie na siebie oddziaływują i inspirują. To siła matematyki.

Kognitywiści G. Lakoff i R.E. Nunez formułują w [68] tezę, że jednym z motorów poznaniamatematycznego jest metafora.

Metafora to zabieg pozwalający cechy jednego obiektu (zjawiska, procesu) przypisać innemu. Np. z uczu-ciami wiążemy metaforycznie temperaturę. Wystarczy powiedzieć „jesteś zimna jak lód” i wiadomo, wczym rzecz. Tworzenie metafor to domena poetów - Like a bird on the wire, Like a drunk in a midnightchoir I have tried in my way to be free. (L.Cohen).„Gdy w XV w. pojawiły się pierwsze mechaniczne zegary (...) wszyscy zgodzili się z tym, ze Wszechświatjest zegarem. Ale w gruncie rzeczy nawet wtedy zdawano sobie sprawę, że zegar to tylko metafora -Wszechświat jest czymś bardziej skomplikowanym(...)” - M.Heller, „Czy fizyka jest nauką humanistyczną”„Metafory i analogie, poprzez zestawienie razem różnych kontekstów, prowadzą do powstawania nowychsposobów patrzenia. Prawie wszystko to, co wiemy, łącznie z poważną nauką, opiera się nametaforze. I dlatego nasza wiedza nie jest absolutna” – J. Weizenbaum28.

Kontinuum Dedekinda jest realizacją jednej z podstawowych metafor matematycznych, którąnazywam „metaforą geometryczno-liczbową” a która polega na utożsamieniu liczb rzeczywistych z

strzegać ścisłości. To wystarczy, byśmy zdali sobie sprawę, że continuum matematyczne jest czymś zupełnie innymniż continuum fizyków lub metafizyków.” - to H. Poincare (Nauka i Hipoteza)Niesposób dowieść twierdzenia Darboux nie korzystając z tej definicji ciagłości.26„Zgodnie z definicją Dedekinda, liczba niewymierna nie jest niczym innym, jak symbolem tego szczególnego

podziału liczb wymiernych. Każdemu podziałowi odpowiada liczba (...), która jest jego symbolem” [92].27„If the object of study is formed by the real numbers, then the real line R,could be the universe under considera-

tion. Implicitly, this is the universe that Georg Cantor was using when he first developed modern naive set theoryand cardinality in the 1870’s and 1880’s in applications to real analysis. The only sets that Cantor was originallyinterested in were subsets of R”(http://en.wikipedia.org/wiki/Universe (mathematics).28J. Weizenbaum (1923 - 2008), twórca (w 1966r!) programu ELIZA, który umożliwiał prowadzenie prostej rozmowy

z komputerem.

Page 34: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 33

punktami prostej. Kontinuum to prosta rzeczywista

Punkt to liczba (rzeczywista). Liczba to punkt (na prostej). Dwa abstrakcyjne pojęcia, które postrzeganeosobno nie są oczywiste, dzięki tej geometryczno-liczbowej metaforze stają się „realne”. „Intuicja prze-strzenna (...) jest potężnym narzędziem i dlatego geometria jest w tak potężną częścią matematyki– nietylko dla rzeczy, które są oczywiście geometryczne, ale nawet dla tych, które takimi nie są. Usiłujemy imnadać postać geometryczną, bo to pozwala nam posługiwać się naszą intuicją” - M. Atiyah [2].

Liczby wspierają geometrię. A geometria dostarcza „dowodów istnienia” takich liczb jak√n

czy π . Umiemy „podnosić liczby do kwadratu”. Rozumiemy, co to „pierwiastek kwadratowy”.Akceptujemy stwierdzenie, że liczby rzeczywiste są miarą odległości między „realnymi obiektamigeometrycznymi” - punktami prostej. Dzięki tej metaforze bez sprzeciwu akceptujemy nazwę „liczbyrzeczywiste” dla tego, co jest rezultatem konstrukcji Dedekinda29. Takiego metaforycznego wsparciazabrakło przy konstrukcji większego zbioru liczbowego - liczb zespolonych (patrz str.46). Dlategoo liczbach rzeczywistych uczymy w szkole a o liczbach zespolonych - nie.

3.2.2 Wielkości graniczne

Metaforyczne wsparcie ze strony geometrii funkcjonuje w sposób szczególny gdy myślimy o kon-strukcjach i wielkościach granicznych. Takie wielkości pojawiają się w alternatywnym opisie liczbrzeczywistych:

każda liczba rzeczywista - w sensie Dedekinda - jest granicą pewnego ciągu liczb wymiernych.

To twierdzenie udowodnił Cantor łącząc w ten sposób teoriomnogościową konstrukcję Dedekindaz wcześniejszymi pomysłami A.Cauchy’ego30. Cauchy to geniusz, któremu zawdzięczamy uprawo-mocnienie obecności wielkości granicznych w matematyce.

Zacznijmy tak: obwód kwadratu wpisanego w okrąg

&%'$

jest pewnym przybliżeniem, aproksymacją długości tego okręgu. Marnym, ale zawsze. Łatwo topoprawić: jeśli kwadrat zastąpimy ośmiokątem foremnym

&%'$PP

BB

BBPP

to otrzymamy lepsze przybliżenie - obwód ośmiokata jest bliższy długości okręgu niż obwód kwadra-tu. Podwajając w każdym kolejnym kroku liczbę boków wpisywanego wielokąta, otrzymamy ciągliczb - obwodów kolejnych wielokątów - coraz lepiej aproksymujących długość okręgu. Można wy-obrazić sobie potencjalnie nieskończony ciąg takich wielokątów. Długość okręgu nie jest elementemtego ciągu, ale jest z nim ściśle związana - to wyznaczona przezeń wielkość graniczna31.

Proste? Niekoniecznie. To, że można mówić o odległości między punktami na płaszczyźnie (wprzestrzeni) jest paradygmatem geometrii euklidesowej. „Długość okręgu” nie jest już tak intuicyj-nie oczywista. Jak ją zdefiniować? Jako długość odcinka powstałego przez „rozcięcie” i „rozpro-stowanie” okręgu? Ale co to znaczy? Dlatego propozycja, by długość okręgu przybliżać mierząc

29Zaufanie pokładane w metaforze grometryczno-liczbowej czasem prowadzi za daleko. Np. patrząc na prostąrzeczywistą łatwo wierzymy w słuszność prawa trychotomii - dla dowolnch dwóch liczb rzeczywistych a, b , a = b luba < b lub b < a. Trudno przekonać studentów, że to prawo wymaga (niebanalnego) dowodu.30Augustin L. Cauchy (1789 - 1857) – francuski matematyk.31Takie działanie to znana matematykom starożytnej Grecji metoda wyczerpywania pozwalająca na wyznaczanie

przybliżonych wartości obwodów i pól różnych figur. Archimedes wykorzystując 96-kąt foremny pokazał, że liczba πmieści się w przedziale 3 1070 , 3

171 .

Page 35: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 34

obwody wpisywanych w okrąg wielokątów foremnych o coraz to większej liczbie boków wyglądaobiecująco - wszak obwód wielokąta to - bezdyskusyjnie - wielokrotność długości jego boku (któryjest odcinkiem). A tę długość można próbować obliczyć.

Ale skąd wiemy, że taka liczba - wielkość graniczna związana z ciągiem obwodów wpisanychw okrąg wielokątów - istnieje i jest jedna jedyna? Sądzę, że większość z nas zaakceptuje takąargumentację: „powierzchnia pomiędzy okręgiem a aproksymujacymi je wielokątami jest - w miaręzwiększania liczby boków - coraz mniejsza, a boki wielokątów coraz bliższe okręgowi. To musioznaczać, że obwody kolejnych wielokątów są coraz bliższe długości okręgu”.

Czy rzeczywiście? Przeanalizujmy podobny przykład. Przyjmijmy, że wędrówka z A do B przeztrzeci wierzchołek trójkąta równobocznego - C - jest pierwszym elementem ciągu wędrówek aprok-symujących wędrówkę po prostej - wzdłuż odcinka z A do B:

A BAAAAA

C

Gdy zastąpimy ten trójkąt dwoma mniejszymi trójkątami równobocznymi to otrzymamy nową,„zygzakowatą” trasę wędrówki z A do B:

AAA

A BAAA

Gdy teraz zastąpimy każdy z tych dwóch trójkątów dwoma mniejszymi (postępując tak, jak przedchwilą) to wyznaczymy kolejną trasę zygzakowatej wędrówki z A do B. I tak dalej... .

Wydaje się, że sytuacja jest taka jak poprzednio: suma pól figur ograniczonych odcinkiem ABi kolejnym zygzakami jest coraz mniejsza a trasy kolejnych wędrówek coraz bliższe prostej drodzez A do B. Zatem długość zygzakowatej wędrówki, w miarę zwiększania liczby trójkatów, powinnazbliżać się do długości odcinka AB... . Ale przecież długość zygzakowatych wędrówek jest zawszetaka sama i równa podwojonej długości odcinka AB... .Przekonanie, że „zmniejszając pole powierzchni zawartej między dwiema liniami łączącymi punktyA i B sprawiamy, że długości tych linii zbliżają się do siebie” okazało się naiwnością.

Jak z tego wybrnąć? Przede wszystkim musimy jasno powiedzieć jak rozumiemy „aproksymu-jący ciąg” liczbowy i jak definiujemy wielkość graniczną - liczbę związaną z takim ciągiem.

Trudno uwierzyć, ale na precyzyjny matematyczny opis takiej „aproksymacji” trzeba było czekaćaż do XIX wieku. Taką definicję sformułował A. Cauchy32.

Cauchy za własność definiującą liczbowy ciąg aproksymujący (an : n ∈ N) uznał to, że wy-razy takiego ciągu są „od pewnego miejsca blisko siebie” - niezależnie od tego, jak rygorystycznierozumiemy „bliskość”.

To opis geometryczny operujący intuicyjnym, ale nieprecezyjnym pojęciem bliskości liczb-punktów. Ana-litycznie ten warunek formułujemy tak: dla dowolnej liczby m można wskazać numer nm taki, że bez-względna różnica - liczba |ai − aj | - jest mniejsza od 1

2m jeśli tylko i, j > nm .Precyzyjnie, ale czy nadal intuicyjnie prosto?

Ciągi spełniające ten warunek to ciągi Cauchy’ego. Wielkość graniczna związana z takim cią-giem (an) to taka liczba a , że „prawie wszystkie” wyrazy tego ciągu są jej bliskie - ponownieniezależnie od tego jak precyzyjnie zinterpretujemy „bliskość”. Analitycznie: dla dowolnej liczby mmożna wskazać numer km taki, że |as − a| < 1

2m jeśli tylko s ­ km.Tak definiowaną wielkość graniczną nazywamy granicą ciągu.Czy każdy ciąg Cauchy’ego wyznacza wielkość graniczną, czy aproksymuje pewną liczbę? Gdy my-ślimy o liczbach wymiernych to odpowiedź brzmi „nie”. Ale gdy mówimy o dedekindowskich liczbach

32Gwoli ścisłości: pierwszeństwo należało by przypisać B. Bolzano. Jednak jego praca opublikowana w 1816 roku„pozostała niezauważona” jak napisano w wikiedii. Cauchy przedstawił swoją definicję w 1821 roku.

Page 36: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 35

rzeczywistych to odpowiedź brzmi „tak” - w tym zbiorze każdy ciąg Cauchy’ego ma granicę33.

Prosta rzeczywista jest ockhamowskim domknięciem prostej wymiernej ze względu na konstrukcje granicciągów Cauchy’ego zbudowanych z liczb wymiernych. Akceptacja dedekindowskich liczb rzeczywistych toprzyznanie konstrukcjom granicznym pełni praw obywatelskich (w krainie matematyki).Teoriomnogościowe continuum to w pewnym sensie ukoronowanie programu arytmetyzacji matematyki -stworzenia hierarchii struktur liczbowych, której podstawą są liczby naturalne. Kolejne, bogatsze systemysą konstruowane z tych prostszych. Liczby rzeczywiste są „konstruowalne”, jeśli tylko zaakceptujemy nowąjakość - konstruktory, które tworząc nowe wielkości korzystają z nieskończonego zbioru elementów. Takjak konstruktor granic ciągów liczb wymiernych spełniających warunek Cauchy’ego.

Uznanie wielkości granicznych rozwiązało też problem „nieskończonych sum”: suma ciągu liczbrzeczywistych (an) to granica ciągu sum a1 + · · ·+ an - o ile jest to ciąg Cauchy’ego34.

Wróćmy do liczby π. Można wierzyć, że okrąg ma długość a liczba π wyraża stosunek międzyjego długością i średnicą - uznać, że jest to definicja pierwotna, geometryczna. Jeśli tak (i jeśliuznamy, że π jest liczbą rzeczywistą(!)) to „aproksymacja wielokątami” niesie jedynie dodatkowąinformację o tej liczbie. Ale można też przyjąć, że liczba π jest definiowana jako granica zbudo-wanego w ten sposób ciągu Cauchy’ego. Akceptacja metafory geometryczno-liczbowej sprawia, żemało kto rozważa ten dylemat... . 35.

Jest jeszcze coś, co jakościowo różni liczby rzeczywiste od naturalnych, całkowitych i wymier-nych: tylko niektóre liczby rzeczywiste maja unikatowe nazwy - π ,

√2 czy 121. Ale nie wszystkie.

Więcej: nie mogą ich mieć36. Nie są nazwami. Czym więc są?

Funkcje ciągłe

Ciągłe są nie tylko przestrzeń i czas. Ciągłe są też procesy. Matematyka opisuje je - w najprostszymprzypadku - za pomocą funkcji ciągłych postaci φ : R → R :

„Funkcja ciągła charakteryzuje się tym, że małym zmianom jej argumentu odpowiadają małezmiany wartości funkcji” .

Ta intuicyjna i geometryczna charakteryzacja ciągłości funkcji długo i skutecznie opierała sięmatematycznej formalizacji. Np. Leibniz do opisu ciągłości używał wielkości nieskończenie małych,które jednak dla wielu były „ciałem obcym” w matematyce. Cantor nazywał je „bakcylami cholery,które zainfekowały matematykę” [9]37.Akceptacja konstrukcji granicznych pozwoliła rozwiązać i ten problem Wystarczyło do tego (nie-banalne) pojęcie - „granicy funkcji f w punkcie a”:

liczba b jest granicą funkcji f w punkcie a jeżeli dla dowolnego ciągu an zbieżnego do a. ciągwartości f(an) zbiega do b38.

Piszemy wtedy b = limx→a f(x). A ciągłość funkcji rzeczywistej rozumiemy tak:„funkcja f : R → R jest ciągła, jeśli33I jest ona wyznaczona jednoznacznie. Mam wrażenie, że słowo „granica” nie najlepiej przystaje do matematycznej

treści jaką z nim wiążemy. To słowo jest raczej kojarzone z linią, której przekroczenie jest szczególnym krokiem- np. z granicą państwa. Odpowiada to bardziej angielskim słowom border lub frontier. Matematyczny sens tegoterminu nie w tym, że „przekraczamy granice” ale w tym, że granica to wielkość do której można zbliżyć się dowolnieblisko a której nie można osiągnąć. Anglicy mają łatwiej: słowa limit i border nie są synonimami. Jeszcze jedno: istotęterminu „opis analityczny” wyjaśnimy już wkrótce (str.38)34Sumujemy elementy ciągu a nie zbioru. „Suma nieskończonego zbioru liczb” nie jest pojęciem matematycznym.35To, co napisałem NIE wyjaśnia oczywiście różnicy między „aproksymacją długości okręgu obwodami wpisanych

wielokątów” a „aproksymacją odcinka zygzakami”. Ale opisuje język w którym można udowodnić istnienie i jedno-znaczność liczby rzeczywistej aproksymowalnej obwodami wielokątów..36Dlaczego tak jest stanie się jasne w przyszłości.37Nieskończenie małe - wielkości, które otaczają każdą liczbę rzeczywistą odgrywały kluczową rolę nie tylko w ana-

lizie matematycznej Leibniza, ale również w jego koncepcjach filozoficznych (tzw. monady Leibniza)[9]. W interneciedostępna jest książka J.L.Bella „The Continuous and the Infinitesimal in Mathematics and Philosophy”.38Podkreślmy: tak ma być dla dowolnego ciągu (an) zbieżnego do a! Może on zbiegać z „lewej” lub „prawej”

strony, może też naprzemiennie. I m.in. dlatego funkcja może nie mieć granicy w pewnych punktach. Np. funkcjaprzyporządkowująca rzeczywistym liczbom dodatnim wartość 1 a pozostałym 0, nie ma granicy w punkcie 0.

Page 37: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 36

f(a) = limx→a f(x)

dla każdej liczby rzeczywistej a39.Skoro każda liczba rzeczywista jest granicą pewnego ciągu liczb wymiernych, to każda rzeczy-

wista funkcja ciągła jest jednoznacznie wyznaczona przez to, jak działa na liczbach wymiernych.

I dlatego - tylko dlatego! - matematycy potrafią dodawać i mnożyć liczby rzeczywiste. Wystarczyłoprzyjąć, że te działania - dwuargumentowe funkcje rzeczywiste - są ciągłe. Suma liczb rzeczywistych a i b,aproksymowalnych odpowiednio przez ciągi wymierne (an) i (bn), to liczba-granica ciągu (wymiernych)sum (an + bn). Podobnie z mnożeniem.Dlatego wszystkie funkcje rzeczywiste wielomianowe są ciągłe.

Różniczkowanie

Różniczkowanie i całkowanie to działania matematyków, które zdrowa część społeczeństwa traktujez respektem ale właściwie na równi z czarną magią.

A przecież wystarczy zacząć od „geometrycznego” spojrzenia na problem. Wykres ciągłej funkcjirzeczywistej to krzywa na płaszczyżnie. Dowolne dwie liczby rzeczywiste a, x ∈ R wyznaczają dwapunkty na wykresie: (a, f(a) i (x, f(x)). Prosta, która przechodzi przez te dwa punkty to sieczna.Teraz wyobraźmy sobie, że przesuwamy punkt x po prostej rzeczywistej w kierunku punktu a.Towarzyszy temu przesuwanie punktu (x, f(x)) po wykresie w kierunku punktu (a, f(a)). Blisko,coraz bliżej. Im bliżej, tym bardziej sieczna jest bliska stycznej do wykresu f w punkcie (a, f(a)).

Styczna to wielkość graniczna.

a ← x

Ta opowieść nie grzeszy precyzją. Ale przecież nie tego oczekujemy od geometrycznych intuicji.Precyzyjny ma być opis analityczny.Iloraz różnicowy to ułamek postaci f(x)−f(a)

x−a . To współczynnik kierunkowy (miara „kąta nachyle-nia”) siecznej przecinającej wykres funkcji f w punktach (a, f(a)) i (x, f(x)). Ponieważ „a” jestustaloną liczbą, możemy patrzeć na ten ułamek jak na wzór analityczny opisujący funkcję (zmiennejx). Granicę tej funkcji - o ile istnieje - nazywamy pochodną funkcji f w punkcie a:

f ′(a) = limx→af(x)−f(a)

x−aLiczba f ′(a) to współczynnik kierunkowy („miara nachylenia”) stycznej do wykresu w punkcie(a, f(a))40.

Zdefiniowana analitycznie pochodna żyje własnym życiem. W oparciu o to pojęcie zbudowanojęzyk umożliwiający precyzyjną analizę przebiegu (ciągłych) funkcji rzeczywistych - orzekania, gdzie- dla jakich punktów prostej rzeczywistej - taka funkcja rośnie (maleje) i jak szybko to się dzieje,gdzie ma lokalne ekstrema (maxima i minima), jak się zachowuje, gdy jej argument „zmierza doplus (minus) nieskończoności”41 Możliwa stała się klasyfikacja funkcji ciągłych ze względu na ich(intuicyjnie trudno uchwytną) gładkość42.

39Prościej: dla dowolnej liczby a i ciągu liczb rzeczywistych (an) zbieżnego do a, ciąg wartości f(an) zbiega dogranicy, którą jest liczba f(a)” - f(lim an) = lim f(an).40Granica funkcji nie musi istnieć więc może się zdarzyć, że styczna do wykresu nie istnieje - wystarczy zapytać o

styczną do wykresu funkcji abs (przyporządkowujacej liczbie jej wartość bezwzględną) w punkcie (0, 0) .41Badanie przebiegu funkcji to domena rachunku różniczkowego którego podstawy tworzyli równocześnie i nieza-

leżnie Newton i Leibniz.42Jeśli funkcja f ma pochodną w każdym punkcie - tzn. przyporządkowanie x → f ′(x) jest funkcją, to można

rozważać istnienie „pochodnej funkcji f ′ w punkcie a” nazywając ją drugą pochodną funkcji f w tym punkcie. I takdalej... .W klasie gładkości Ck są funkcje, które mają pochodne rzędu ¬ k w każdym punkcie. W klasie C∞ znajdują

Page 38: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 37

Język korzystający bez ograniczeń z konstrukcji granicznych okazał się niezwykle skuteczny.Popatrzmy czego się dowiemy, gdy użyjemy tego języka do badania liczby „e” - stałej Eulera.Ta liczba jest definiowana jako granica ciągu liczb wymiernych postaci ((1 + 1

n)n : n ∈ N). Eulerudowodnił, że nie jest to liczba wymierna43. Jej „istnienie” jest więc wyłącznie konsekwencją przy-jętej definicji liczb rzeczywistych.Takich samych argumentów trzeba użyć by uzasadnić istnienie potęg liczby e o wykładniku rzeczy-wistym. Jeśli a jest liczbą naturalną, całkowitą lub wymierną, to definicja „potęgi e o wykładnikua” nie budzi naszych wątpliwości. Ale zdefiniowanie i uzasadnienie istnienia potęg liczby e o wy-kładniku rzeczywistym jest możliwe tylko wtedy gdy założymy, że przyporządkowanie a ea jestfunkcją ciągłą. Wówczas liczbę ea definiujemy jako granicę ciągu liczb (ean), gdzie (an) to ciągliczb wymiernych aproksymujący a.Funkcja wykładnicza exp(x) = ex jest gładka. Można więc - dla dowolnej liczby naturalnej m -rozważać wielomian postaci

sm(x) = exp(0)0! x0 + exp(1)(0)

1! x1 + · · ·+ exp(m)(0)m! xm

gdzie exp(k) to k-ta pochodna funkcji exp .Te wielomiany aproksymują funkcję exp punktowo - ea = limm→∞ s

m(a) dla każdej liczby a 44.Co zadziwiające, wszystkie pochodne funkcji exp są jej równe, exp = exp(k)! Zatem wszystkie

te pochodne w punkcie 0 są równe exp(0) = 1. Stąd

e = limn→∞( 10! + 1

1! + 12! + · · ·+ 1

n!) .

Liczba e jest też podstawą logarytmu naturalnego. Dlaczego naturalnego? Może dlatego, żestyczna do wykresu funkcji logarytmicznej o tej podstawie w punkcie (1, 0) ma współczynnik kie-runkowy równy 1 45

Magia. Ciągi, liczb naturalnych, granice, inspiracje geometryczne, pochodne, silnia, logarytmy... . Wszyst-ko tu jest. Dla platoników wyniki tego rodzaju to dowód, że mamy język pozwalający na odkrywaniezależności między „realnie istniejącymi obiektami matematycznymi” których w żaden sposób nie mogądostrzec zwykli śmiertelnicy... . Fascynacja takimi rezultatami wynika po części stąd, że operowanie pre-cyzyjnie definiowanymi wielkościami granicznymi to przywilej matematyków - poza matematyką „granicanieskończonego ciągu” to tylko mglista intuicja.

3.2.3 Od Kartezjusza do przestrzeni Hilberta

Liczby rzeczywiste - zbiór R - to geometryczna przestrzeń jednowymiarowa - prosta. Aby mode-lować matematycznie geometryczną płaszczyznę korzystamy z genialnego pomysłu Kartezjusza -utożsamiamy punkty płaszczyzny z parami liczb rzeczywistych - współrzędnymi punktów w pew-nym, ustalanym arbitralnie układzie współrzędnych46. Metafora geometryczno-liczbowa ujawnia siętu niezwykle efektywnie i efektownie: „wszystko” co ważne i interesujące w geometrii płaszczyznypotrafimy teraz obliczać:

się funkcje gładkie - takie, które mają pochodne wszystkich rzędów.43Wymiernym przybliżeniem e jest np. liczba 2, 7182818.44To, o czym tu teraz mówimy jest konsekwencją wzoru Taylora.45Inaczej: (ln)′(1) = 146Początek układu współrzędnych to punkt-para (0, 0) (który możemy utożsamiać z miejscem, w którym znaj-

duje się „obserwator”). W tym punkcie krzyżują się wzajemnie prostopadłe proste - osie układu współrzędnych.Współrzędne dowolnego punktu wyznaczamy tak, jak na poniższym rysunku:

-

6

•(a, b)b

a

Page 39: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 38

- odległość między punktami (a, b) i c, d) to liczba√

(c− a)2 + (d− b)2 ,- cosinus kąta między odcinkami łączącymi punkt (a, b) i (c1, d1) ora (a, b) i (c2, d2) obliczymy

dzieląc liczbę (c1 − a)(c2 − a) + (d1 − b)(d2 − b) przez iloczyn długości tych dwóch odcinków47

Możemy teraz analitycznie opisywać proste, odcinki, okręgi. Możemy zastąpić poszukiwanie punktuwspólnego prostych rozwiązaniem odpowiedniego układu równań liniowych. Krzywe stożkowe -okrąg, elipsę, hiperbolę, parabolę - greccy geometrzy definiowali korzystając z pojęcia odległości:„elipsa to zbiór punktów dla których suma odległości od dwóch ustalonych punktów jest stała”,„hiperbola to zbiór punktów, dla których wartość bezwzględna różnicy ich odległości tych dwóchpunktów jest stała”. Korzystając z kartezjańskiego modelu można te krzywe opisać analitycznie- jako zbiory rozwiązań równań algebraicznych drugiego stopnia z dwiema niewiadomymi. To byłnaprawdę spektakularny sukces geometrii analitycznej

Geometria budzi intuicję i wyobraźnię, liczby oferują mierzalność i precyzję. Niewiarygodne, ale twierdze-nie, że prosta może mieć jeden lub dwa punkt wspólne z okręgiem budziło wątpliwości jeszcze w czasachGalileusza. Dziś, dzięki Kartezjuszowi, wykaże to prawie każdy uczeń szkoły średniej... .

Punkty wraz z miarami odległości i kątów umożliwiają statyczny opis płaszczyzny. Najprostszadynamika (najprostsze ruchy) to przesunięcia prostoliniowe. Przesunięcie ma kierunek i długość.Można je składać („dodawać”) i przedłużać. Opis tej najprostszych ruchów wymaga rozszerzeniajęzyka przestrzeni kartezjańskiej o dodatkową strukturę, którą nazywano przestrzenią wektorową(liniową) - zbiór wektórów, które można dodawać i mnożyć przez liczby. W modelu kartezjańskimpłaszczyzny wektory reprezentowane są tak jak punkty - przez pary liczb. Aby uniknąć pomyłekwektor o składowych a, b ∈ R oznaczamy przez [a, b] . Dodawanie i mnożenie wektorów przez liczbęopisujemy tu „po składowych”:

α[a, b] = [αa, αb] , [a, b] + [c, d] = [a+ c, b+ d]

Tak kartezjański model płaszczyzny staje się prototypem przestrzeni liniowych i przestrzeni afinicz-nych.

Zaletą kartezjańskiego języka opisu płaszczyzny jest to, że pozwala „tak samo” opisać przestrzeńtrójwymiarową. Z tą oczywistą różnicą, że teraz układ współrzędnych to trzy (parami prostopadłe)osie a współrzędne punktu i składowe wektorów to trójki liczb. Co istotne, wzory opisujące odległośći miarę kątów, dodawanie i mnożenie wektórów przez liczbę pozostają „takie same”.48

Skoro przejście od kartezjańskiego modelu dwuwymiarowej płaszczyzny do modelu trójwymia-rowej przestrzeni nie sprawia trudności, to dlaczego nie pomyśleć o przestrzeni cztero- pięcio- czywręcz n-wymiarowej? To proste - wystarczy powiedzieć, że wektory to nie pary (trójki) ale n-elementowe ciągi liczb ... 49.Oczywiście, jest tu przeszkoda mentalna - no bo czy ktoś wyobraża sobie przestrzeń n-wymiarową?Wprawdzie co poniektórzy twierdzą, że wyobrażają sobie czterowymiarową czasoprzestrzeń. Ale conp. z przestrzenią 15-wymiarową? Co z przestrzenią nieskończonego wymiaru?

Słowo „wyobrazić” oznacza „zbudować obraz” i jest ściśle związane z postrzeganiem zmysłowym. Matema-tyczna przestrzeń to abstrakcja. Ale wciąż jest to realizacja idei Kanta - „przestrzeń to forma ujmowaniazjawisk” - choć wyobrażanie sobie takiej przestrzeni jest pozbawione sensu. Trzeba uznać, że pierwotnyjest twór matematyczny - przestrzeń kartezjańska - a obecna w naszej wyobraźni geometryczna płaszczy-zna czy przestrzeń trójwymiarowa to pojęcia wtórne.

47Np.cosinus kąt między odcinkami łączacymi początek układu wspołrzędnych z punktami (0, 3) i (3, 1) to 23·√10

.Docenisz tę analitycznę metodę gdy narysujesz oba odcinki na płaszczyźnie z wyróżnionym układem współrzednychi spróbujesz „obliczyć geometrycznie” - cokolwiek to oznacza - cosinus kąta między nimi.48Zbiory algebraiczne w przestrzeniRn to zbiory rozwiązań skończonych układów równań wielomianowych o współ-

czynnikach rzeczywistych i n-niewiadomych. Takie zbiory można wyróżnić też w przestrzeniach kn, gdzie k to dowolneciało (pierścień). Te zbiory są przedmiotem badań geometrii algebraicznej - młodszej i bardziej wyrafinowanej siostrygeometrii analitycznej.49Uzupełniająco przyjmijmy, że prosta rzeczywista to jednowymiarowa przestrzeń kartezjańska.

Page 40: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 39

Wyjście poza wyobrażalną przestrzeń trójwymiarową oznacza, że matematyka pozwala poznawać rzeczy-wistość niedostępną naszym zmysłom...50.Trudno przecenić dzieło Kartezjusza i wyobrazić sobie współczesną matematykę bez tego fundamentu.

Zwiększanie liczby wymiarów to nie jedyny kierunek uogólnień kartezjuszowskiej metody mo-delowania przestrzeni.

Jeśli skoncentrujemy uwagę na punktach i odległości między nimi i „zapomnimy” o innychskładowych modelu kartezjańskiego, to otrzymamy pierwowzór przestrzeni metrycznej. Tak ograni-czony język wystarcza jednak by mówić o zbieżności ciągów punktów i ich granicach w dowolnejprzestrzeni metrycznej. Można mówić o ciągłości funkcji między przestrzeniami metrycznymi.

Matematyczna przestrzeń metryczna może być baardzo odległa od kartezjańskiego pierwowzoru: rozważ-my zbiór wszystkich rzeczywistych funkcji ciągłych określonych na odcinku [a, b] i przyjmijmy, że odle-głością między takimi funkcjami jest maksimum wszystkich liczb postaci |f(x) − g(x)| gdzie x ∈ [a, b].To przestrzeń metrycznej w której „punktami” są funkcje. Funkcje wielomianowe o współczynnikach wy-miernych pełnią w tej przestrzeni taką samą rolę jak liczby wymierne na prostej rzeczywistej: każdy punkt(funkcja) jest tu granicą ciągu takich wielomianów51.

Daleko idącym uogólnieniem pojęcia przestrzeni metrycznej jest przestrzeń topologiczna. Polegaono na zastąpieniu mierzalnej i intuicyjnie akceptowalnej odległości przez nieuchwytną „bliskość”52.Sposób, w jaki temu enigmatycznemu pojęciu nadano sens matematyczny jest naprawdę fenome-nalny: „bliskość” w zbiorze X opisuje się wiążąc z każdym punktem x ∈ X pewną rodzinę otwar-tych otoczeń punktu x - podzbiorów wybranych spośród wszystkich podzbiorów zawierających tenpunkt53. Po takim przypisaniu zbiór X staje się przestrzenią topologiczną. Na przykład topologięna płaszczyźnie kartezjańskiej zdefiniujemy przyjmując, że otoczeniami punktu (a, b) są wszelkieotwarte koła ją zawierające - zbiory postaci K(a,b)

ε = (c, d) ∈ R2 : odległość((a, b), (c, d))) < ε.Powiemy, że:

- punkt y jest bliżej punktu x niż punkt z, jeżeli y należy do każdego otoczenia U punktu x wktórym jest z54,- punkt x jest blisko podzbioru A jeśli w każdym jego otoczeniu jest pewien punkt zbioru A. 55.

Mimo, że zniknęła odległość zastąpiona przez enigmatyczną bliskość, nadal możemy mówićzbieżności ciągów:

„Ciąg punktów (xn) jest zbieżny do punktu x jeżeli w dowolnie wybranym otwartym otoczeniux są prawie wszystkie punkty tego ciagu”i o ciągłości funkcji działających między przestrzeniami topologicznymi:

„funkcja f : X → Y jest ciągła (względem topologii zdefiniowanych na tych zbiorach) jeżeli

50Programowanie liniowe to narzędzie optymalizacji procesów ekonomicznych. Matematyczny opis „zadania opty-malizacyjnego” i służącego jego rozwiązaniu algorytmu sympleks sporządzamy korzystając z kartezjańskiej przestrzenin-wymiarowej, gdzie liczba n jest równa liczbie zmiennych decyzyjnych które mają wpływ na rozwiązanie zadania. Alewyjaśnianie działania algorytmu sympleks zaczynamy od przypadku dwuwymiarowego, gdyż dwuwymiarowe zadanie(i jego rozwiązanie) można przedstawić jako problem geometryczny (który łatwo „narysować”).Dodajmy, że „sympleks” to nic innego jak przeniesienie wyobrażalnego „trójkąta” w przestrzeń n-wymiarową.51To jest (nieco zmodyfikowane) twierdzenie Stone’a-Weierstrassa.52O bliskości wspomnieliśmy mówiąc o granicach ciągów. To nie przypadek, że używamy tego terminu ponownie.53Te rodziny otoczeń muszą spełniać pewne warunki ale, jak zwykle, darujemy sobie ich wypisywanie.54z ∈ U → y ∈ U dla dowolnego otoczenia U punktu x,55W każdej przestrzeni metrycznej można zdefiniować otwarte otoczenia punktów korzystając z odległości. Wtedy

mamy do czynienia z topologicną przestrzenią metryzowalną.Nasz opis przestrzeni topologicznej nawiązuje do definicji zaproponowanej przez Hausdorffa, jednego ze współtwórcówtopologii. Jednak obecnie w podręcznikach akademickich króluje inna, równoważna definicja: taka przestrzeń to zbiórX wraz z wyróżnioną rodziną TX podzbiorów otwartych taką, że:- dowolna suma i każdy skończony przekrój zbiorów otwartych są zbiorami otwartymi,- zbiór pusty i cały zbiór X są też zbiorami otwartymi.- otoczeniem punktu x jest teraz każdy podzbiór otwarty zawierający x.Konia z rzędem temu, kto dostrzeże tu „bliskość”... . Dlatego studenci wiedzą(?) co to jest przestrzeń topologicznaale w ogromnej większości nie rozumieją w czym rzecz. Szkoda.

Page 41: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 40

zachowuje bliskość punktów i zbiorów - jeśli x jest blisko A, to f(x) jest blisko f(A).Można też mówić o ciągłości... nie wspominając słowem o punktach(!): funkcja f : (X, TX) →(Y, TY ) jest ciągła, gdy przeciwobraz dowolnego zbioru otwartego w Y jest zbiorem otwartym w X:V ∈ TY f−1(V ) ∈ TX .

Pięknie. Ale nie wszyscy zachwycili się wprowadzeniem tego pojęcia do matematyki. „Point settopology is a disease (choroba, przypadłość) from which the human race will soon recover” - H.Poincare.

Konstrukcja liczb rzeczywistych za pomocą ciągów Cauchy’ego liczb wymiernych sprowokowała zapewnewyrożnienie topologicznych przestrzeni ośrodkowych - takich, w których każdy punkt jest granicą ciagupunktów należących do pewnego wskazanego a priori przeliczalnego podzbioru. A przestrzenie polskie -to takie przestrzenie ośrodkowe, których topologię można opisać a pomocą metryki tak, że każdy ciągCauchy’ego (względem tej metryki) ma granicę. Inaczej: przestrzenie polskie są „quasi konstruktywne”- ich punkty to wielkości graniczne wyznaczone przez ciągi Cauchy’ego budowane z elementów pewnegoprzeliczalnego (czyli małego...) zbioru.R i płaszczyzna kartezjańska to polskie przestrzenie... .

Inny kierunek uogólnień przestrzeni kartezjańskiej został zapoczątkowany przez G. Peano któ-ry (genialnie) zauważył, że kartezjańskie wzory opisujące długość odcinka i cosinus kąta męedzyodcinkami (lub, jak kto woli długość wektora i miarę kąta między wektorami) można eleganckosformułować wprowadzając pojęcie iloczynu skalarnego wektorów56. W naszym propotypie - karte-zjańskim modelu płaszczyzny - iloczyn skalarny wektorów [a, b], [c, d] to liczba

< [a, b], [c, d] >= ac+ bd

Norma (długość) wektora [a, b] to liczba ‖[a, b]‖ =√

(< [a, b], [a, b] > ,Miara kąta między wektorami [a, b], [c, d] to ułamek

<[a,b],[c,d]>‖[a,b]‖,‖[c,d]‖

Traktując iloczyn skalarny jako pojęcie podstawowe zdefiniujemy rzeczywistą przestrzeń Hilberta.Jest to para (V, f) gdzie V to rzeczywista przestrzeń liniowa a funkcja f : V × V → R to iloczynskalarny spełniający pewne warunki defincyjne. (Jak łatwo się domyślić, te warunki „w sposóboczywisty” spełnia opisany przed chwilą iloczyn skalarny w R2 )57

Możemy zrobić kolejny krok i zastąpić liczby rzeczywiste zespolonymi co prowadzi do zespolo-nych przestrzeni Hilberta.Taką przestrzenią jest „przestrzeń funkcji rzeczywistych całkowalnych z kwadratem”. Trochę sobiena koniec zażartowałem... .

Analityczny opis przestrzeni zaproponowany przez Kartezjusza stał się prototypem dla wielu wyspecjali-zowanych, abstrakcyjnych przestrzeni matematycznych bez których trudno wyobrazić sobie współczesnąmatematykę. Wszystkie te matematyczne struktury realizują kantowską ideę rozumienia przestrzeni jako„formy ujmowania zjawisk”. Ale zamiast pojedynczej, uniwersalnej formy współczesna matematyka mado dyspozycji wiele zróżnicowanych „form”, wiele wyspecjalizowanych przestrzeni.I, co zadziwia maluczkich (czyli nas wszystkich), te wysoce abstrakcyjne (po)twory matematyczne znajdu-ją zastosowanie. Na przykład język mechaniki kwantowej to nic innego jak język zespolonych przestrzeniHilberta... .

Pięknie się ten puzzel ułożył... Genialne osiagnięcia Kartezjusza, Dedekinda, Cantora, Cau-chy’ego, Weierstrassa i wielu innych stworzyły świetne podstawy rozwoju analizy matematycznej58.

56Każda para punktów płaszczyzny kartezjańskiej (a, b), (c, d) wyznacza wektor [c− a, d− b]. Stąd długość wektorato długość odcinka między jego końcami. Podobnie kąt między wektorami to ... .Giuseppe Peano zapisał się w historii matematyki przede wszystkim jako twórca aksjomatycznego opisu strukturyliczb naturalnych o czym jeszcze będziemy tu mówili.57Z powodów nie tylko patriotycznych dodajmy, że nieco ogólniejszym pojęciem jest przestrzeń Banacha.58Karl Weierstrass (1815-1897) - matematyk niemiecki, twórca obowiązującego do dzis tzw. formalizmu ε, δ..

Page 42: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 41

Stworzono język modelowania matematycznego, któremu w decydującej mierze zawdzięczamy osza-łamiające osiagnięcia nauki XX wieku, (prawie) we wszystkich jej dziedzinach.

To jednak nie znaczy, że matematyczny spór o kontinuum został ostatecznie rozstrzygnięty.J.L. Bell w artykule „Infinitesimals and the Continuum” zebrał wypowiedzi wielu matematycznychznakomitości dotyczących kontinuum. Warto je poznać. Choćby po to, by przestać wierzyć, żeteoriomnogościowe rozstrzygnięcie tej kwestii jest jedynie słuszne:

Ch.E.Peirce (1839-1914): „The very word continuity implies that the instants of time or the pointsof a line are everywhere welded together. The continuum does not consist of indivisibles, or points,or instants, and does not contain any except insofar as its continuity is ruptured.”H.Poincare (1854-1912): „Between the elements of a continuum there is a sort of intimate bondwhich makes a whole of them, in which the point is not prior to the line, but the line to the point”59

H.Weyl (1885-1955): „Exact time - or space - points are not the ultimate, underlying atomic ele-ments of the duration or extension given to us in experience. A true continuum is simply somethingconnected in itself and cannot be split into separate pieces: that contradicts its nature.”E.Brouwer (1881 - 1966)60: „The linear continuum is not exhaustible by the interposition of newunits and can therefore never be thought of as a mere collection of units”.R.Thom (1923-2002)61: „A true continuum has no points”.

Ponówmy pytanie: czy linia to zbiór punktów, czy też odrębny byt matematyczny? Pięknie -bo prosto - o tym fundamentalnym dylemacie napisał M. van Atten w artykule „Brouwer as neverread by Husserl” (Synthese 137, 3-19, 2003):

„Co bardziej przypomina linię: ziarna piasku ułożone jedno za drugim czy nić z topionego sera62?Klasyczna matematyka optuje za ziarnami piasku, linia prosta jest myślana jako nieskończony zbiórodrębnych punktów. Ale już Arystoteles zauważył, że to nie do końca jest słuszne: punkty się niełączą, więc gdzie tu jest ciągłość? Tymczasem ciągłość jest tym, co czyni linię linią. jak my tomodelujemy matematycznie? Leibniz zaintrygowany tym pytaniem doszedł tak daleko, że w1689 roku zadeklarował (cytat): „Są dwa labirynty ludzkiej myśli. Jeden to natura wolności a drugito budowa continuum”. (...) Oba mają to samo źródło - nieskończoność”63.

3.3 O continuum nieco inaczej

W matematyce teoriomnogościowej „istnieć” oznacza „być zbiorem”. Ockhamowski postulat wstrzemięź-liwości w kreowaniu bytów podstawowych zrealizowano tu w sposób skrajny.Uparte poszukiwanie jednego jedynego pierwotnego pojęcia jako podstawy całej matematyki może byćusprawiedliwione jedynie wiarą, że obcując z matematyką „dotykamy absolutu”... Obsesja? Religia?64.

59intimate bond = intymna więź. Dla porządku dodajmy inną, (późniejszą(?)) wypowiedź Poincare: „Aby do-wiedzieć się, co matematycy rozumieją przez continuum, nie należy zwracać się do geometrii (...). Analitycyuwolnili matematykę od wszelkich obcych pierwiastków, mogą zatem odpowiedzieć na pytanie, czym jest w istociecontinuum (...)? Continuum, tak rozumiane, jest zbiorem poszczególnych elementów, uszeregowanych w pewnym po-rządku; jest ich wprawdzie nieskończenie wiele, ale poszczególne elementy są całkowicie rozdzielone. Nie odpowiadato zwykłemu rozumieniu continuum, zgodnie z którym poszczególne elementy są połączone i tworzą całość, dziękiczemu nie punkt istnieje przed linią, lecz linia przed punktem.” [92].60Luitzen E.J. Brouwer, matematyk holenderski. O jego koncepcji matematyki rozwijanej w opozycji do idei Cantora

i Hilberta już za chwilę.61Rene Thom, francuski matematyk laureat nagrody Fieldsa (matematycznego Nobla) w 1958 roku.62W oryginale: „string of melted cheese”.63Dodajmy jeszcze jedną wypowiedź Leibniza: „a point may not be a constitutive part of a line.”64Tę skrajną oszczędność w wyborze pojęć podstawowych projektowanej uniwersalnej teorii G. Chaitin tłumaczy

tak: „Remember that Spinoza has a philosophical system in which the world is built up of only one substance, andthat substance is God, thats’s all there is. Zermelo-Fraenkel set theory is similar. Everything is set, and everythingis built up of the empty set. That’s all there is: the empty set, and sets built out of the emptyset” [19]

Benedykt Spinoza (1632 - 1677 ) - filozof niderlandzki, twórca systemu filozoficznego, który zakładał, że „istniejetylko jedna substancja stanowiącą podstawowy budulec wszechświata. Substancja ta musi istnieć sama przez się imusi być pierwotna w stosunku do wszelkich swoich atrybutów. Musi być nieskończona, istnieć samoistnie (nie być

Page 43: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 42

Dla oponentów Dirichleta i Cantora kontinuum to różny od zbioru byt matematyczny. To „ma-tryca” na której są posadowione wszystkie liczby rzeczywiste jakie potrafimy skonstruować. Brouwerpisał: „Having recognized that the intuition of continuity, of ‘fluidity’, is as primitive as that ofseveral things conceived as forming together a unit, the latter being at the basis of every mathema-tical construction, we are able to state properties of the continuum as a „matrix of points to bethought of as a whole” [3],[64]. W innym miejscu doprecyzowuje: „matryca nieskonstruowa-nych (dotąd nieistniejących) punktów”. Bez większego ryzyka można powiedzieć, że ta koncepcjajest bliska starogreckiej tezie, że „linia nie jest zbiorem punktów65.

Jak matematycznie opisać tę odmienną wizję continuum? Wyobraźmy sobie prostą rzeczywistąinaczej - jako wiązkę wszystkich otwartych odcinków o wymiernych końcach66. Ta wiązka jestsplątana - jeden odcinek może zazębiać się z drugim, być w nim zawarty bądź mogą być onerozłączne.Matematycy powiedzą, że te odcinki to baza zbiorów otwartych pewnej przestrzeni topologicznejposadowionej na zbiorze liczb rzeczywistych

Matematyczne kontinuum to właśnie ta przestrzeń topologiczna.

Uważny czytelnik tego tekstu ma prawo czuć się zawiedziony: ten opis kontinuum nie jest niczymnowym w stosunku do propozycji Dirichleta: przecież aby taki obiekt skonstruować, musimy miećdo dyspozycji cały zbiór liczb rzeczywistych! To jest co najwyżej uzupełnienie opisu kontinuumDirichleta a nie nowa propozycja.

Trudno zaprzeczyć. Chyba, że zaczniemy mówić o topologii... bezpunktowej: 67

Topologia bezpunktowa to kolejny stopień abstrakcji trudny (niemożliwy) do „pozamatematycz-nego” wyobrażenia i wyjaśnienia: „(...) the main idea (of pointless topology - GJ) is to reversethe traditional conceptual order of definitions and define points as particular filters ofneighborhoods rather then neighborhoods as particular set of points [103]”. Nie będę torturowaćmniej zaawansowanych matematycznie czytelników abstrakcyjnymi definicjami. Istota „odwróceniekierunku myślenia” polega na tym, że w klasycznej topologii pierwotne są punkty a (otwarte) oto-czenia to zbiory punktów. Natomiast w topologii bezpunktowej pierwotne są otoczenia (które niemuszą być zbiorami!) a punkty są wtórne, konstruowane z otoczeń za pomocą owych tajemniczychfiltrów. Taka bezpunktowa przestrzeń funkcjonuje w literaturze pod nazwą locale68.

„(...) we are going to regard the real numbers as locale rather then a space. The basic idea (...) is that,assuming the set of rationals as given, we wish to make the set of open intervals with rational endpointsinto a site for open-set locale of R” [52]

Aby zbudować „bezpunktowe continuum”, czyli „locale of real numbers” wystarczy uwolnićnasz opis „wiązki odcinków otwartych” od odwołań do dedekindowskich liczb rzeczywistych - zapo-mnieć, że odcinki to zbiory liczb rzeczywistych. Zrobimy to zastępując każdy odcinek (a, b) przezwyznaczającą jego końce parę liczb wymiernych (a, b). Elementy poszukiwanego locale to pewnepodzbiory takich par. Można je prosto opisać: są one wyznaczone przez otwarte podzbiory prostejrzeczywistej: U ⊆ R U∼ = (a, b) : (a, b) ∈ U 69. Ale musimy zdefiniować zbiory U∼ bez od-

stworzona) i być przyczyną istnienia wszystkich innych bytów – czyli musi być wszechmocna. Nie może to być zatemnic poza Bogiem.” (cytat z wikipedii).65Korzystając z kartezjańskiej fuzji geometrii i algebry możemy tę ideę próbować przybliżyć tak: traktujmy równanie

ax + by + c = 0 jako opis, specyfikację prostej. Każde (konstruktywne) rozwiązanie tego równania to punkt - paraliczb. Prosta (jej równanie) istnieje niezależnie od zbioru rozwiązań tego równania.66Odcinek otwarty, to odcinek bez końców, np. (0, 1) = x ∈ R : 0 < x < 1.67Bezpunktowa topologia powstała w latach osiemdziesiątych XX wieku, choć niektórzy upatrują jej początków

już 30 lat wcześniej, w pracach Ehresmanna [52]. Dyskusja o matematycznym continuum to nie jedyne miejsce gdziepojawia się to wysoce abstrakcyjne pojęcie. Odgrywa ono też istotną rolę w teorii toposów o której opowiemy wjednym z kolejnych rozdziałów.68Nazwa „locale” nie ma powszechnie akceptowanego polskiego odpowiednika. Ten sam obiekt może być też nazwany

„frame” albo „zupełna algebra Heytinga”. Więcej: str.20269W pierwszym przypadku (a, b) to para liczb a w drugim - odcinek otwarty!

Page 44: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 43

wołań do otwartych podzbiorów R (bo przecież dopiero konstruujemy liczby rzeczywiste)! To jestmożliwe. I to te podzbiory uporządkowane przez relację zawierania, to poszukiwane locale. Punktypojawią się taraz jako zupełne filtry pierwsze w tak skonstruowanym locale70.

Tak definiowane locale liczb rzeczywistych satysfakcjonuje konstruktywistów (oponentów Can-tora i Dirichleta) bo w tej strukturze nie ma punktów-liczb rzeczywistych. Liczby muszą byćskonstruowane i dopiero potem mogą być osadzone w tej struturze w miejscach (punktach) wska-zanych przez owe filtry otoczeń: „Weyl says that the point or real number in this sense is onlythough or conceived” [3]71. To bezpunktowe continuum to tylko „matryca możliwych miejsc liczbrzeczywistych”.

Liczby wymierne potrafimy konstruować, pary takich liczb też. Locale liczb rzeczywistych jest więc - dopewnego stopnia - (finitarnie) konstruowalne.

Jeśli pominąć kwestię, czy filtry to punkty-liczby czy też jedynie wskazują możliwe lokalizacjeliczb, to ostateczny efekt obu konstrukcji - Dedekinda i tej odwołującej się do topologii bezpunk-towej - jest taki sam. O co więc kruszyć kopie?Jako robotnicy matematyki nie musimy wybierać. Możemy korzystać z obu opisów. Jak pokazu-je współczesna fizyka, dwoistość w opisie nawet najbardziej fundamentalnych obiektów nie musiprowadzić do konfliktu72. Ale taki kompromis jest trudny (niemożliwy), gdy mowa o podstawachmatematyki. Te dwie propozycje obrazują różnicę między hilbertowską a brouwerowską wizją ma-tematyki. Będziemy o tym mówili już w kolejnym rozdziale73.

Dlaczego koncepcja kontinuum Dedekinda i Cantora dominuje we współczesnej matematyce?Po pierwsze, dzięki odwołaniu do metafory geometryczno-liczbowej jest przyjazna. Nie można tegolekceważyć. Nauka nie rozwija się w próżni. Wpływu tradycji (przyzwyczajeń) doświadczył jużKopernik przeciwstawiając się ponadtysiącletniej tradycji ptolemeuszowskiej74.Po drugie, jej podstawowa warstwa pojęciowa jest genialnie prosta. Leibniz mówił, że modele rze-czywistości powinny być od niej prostsze, bo tylko tak można dostrzec istotę rzeczy i zjawisk.Po trzecie wreszcie, ta koncepcja to fundament analizy matematycznej, niezwykle skutecznego na-rzędzia modelowania świata.

Bezpunktowa koncepcja kontinuum nie może - jak dotąd - przeciwstawić tym argumentom wła-snych, świadczących na jej korzyść. Jest trudna, wymaga już na starcie akceptacji wielu złożonychpojęć. Jej konstruktywny charakter (do pewnego stopnia) nie wszystkim - platonikom, ortodoksyj-nym wyznawcom teorii mnogości - wydaje się istotny.

Jednak bezsporne jest, że kontinuum winno być postrzegane jako przestrzeń topologiczna (punk-towa lub nie). Oto spektakularny argument: Cantor pokazał, że prosta rzeczywista R jest równo-liczna z płaszczyzną reprezentowaną przez iloczyn kartezjański R ×R. To oznacza, że z teoriom-nogościowego punktu widzenia te dwa zbiory są takie same - nie można w języku teorii mnogościsformułować własności, która rozróżnia prostą i płaszczyznę (choć „każdy widzi”, że są różne...).

70Brak tu wielu istotnych szczegółów konstrukcji bezpunktowego kontinuum. Zainteresowanych odsyłam do inter-netu http:/ncatlab.org/ nlab/show/locale+of+real+numbers i na stronę 241.71though or conceived = zamierzony lub pomyślany. H.Weyl (1885-1955) - niemiecki matematyk, fizyk i filozof.

Zwolennik konstruktywizmu matematycznego.72Nawiązuję tu do dualizmu korpuskularno-falowego, którego odkrycie i zaakceptowanie przez fizyków umożliwiło

powstanie fizyki kwantowej. Dodajmy, że dualność opisu kontinuum jest też akceptowana poza matematyką: w Słow-niku PWN znajdujemy takie oto objaśnienie, zręcznie godzące obie koncepcje: kontinuum - ciągły, uporządkowanyzbiór nieskończonej liczby elementów przechodzących płynnie jeden w drugi.73Warto też choćby wspomnieć o jeszcze jednym aspekcie tej dyskusji (sporu). Liczby rzeczywiste to matematyczny

model czasu, „continuum czasowe”. A logicy dyskutujący o modelowaniu czasu - logice temporalnej - rozróżniają dwasposoby modelowania: „instant-based model of time” oraz „interval-based model”.74A o zderzeniu Maxa Plancka z XIX-wieczną fizyką w [101] napisano tak: „jego wyjaśnienie wydawało się bardziej

zagmatwane niż problem, który miało wyjaśnić (chodzi o zjawisko promieniowania cieplnego, które M. Planck objaśniłwprowadzając „sztucznie” pewną stałą, zwaną dziś stałą Plancka - GJ). Teoria Plancka wydawała się śmieszna. Niktsię, co prawda, nie śmiał, bo Herr Professor był zbyt ważnym człowiekiem. Jego sugestie przeskoków kwantowychzostały po prostu zignorowane. (...)Sam Planck zgodził się z tymi obiekcjami i obiecał dalsze poszukiwania. Prawieniezauważona rewolucja kwantowa przeprosiła za swe nadejście.”

Page 45: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 44

Rzeczywistość teoriomnogościowa rozminęła się z rzeczywistością geometryczną. To zapewne za-skoczyło Cantora i sprowokowało go do słynnego stwierdzenia „widzę, ale nie wierzę”.

A Brouwer dowiódł, że prosta i płaszczyzna, postrzegane jako przestrzenie topologiczne, wcalenie są takie same (nie są „homeomorficzne”) - w języku topologii potrafimy te przestrzenie rozróżnić.

3.3.1 Liczby p-adyczne

Definiowanie liczb rzeczywistych za pomocą ciągów Cauchy’ego oparte jest na geometrycznymwyobrażeniu odległości między liczbami na prostej rzeczywistej. A gdyby tę odległość zdefiniowaćinaczej?75. To możliwe.

Z każdą liczbą wymierną a 6= 0 można jednoznacznie związać liczbę całkowitą c taką, że a = 2c · qrgdzie q i r to całkowite liczby nieparzyste. Wykorzystając ten fakt zdefiniujemy odległość międzyliczbami wymiernymi tak: d2(x, y) = 2−n, gdzie x − y = 2n · qr a q i r to nieparzyste liczbycałkowite76. Ta miara odległości jest istotnie różna od metryki euklidesowej. Wystarczy pomyślećo „otoczeniu zera o promieniu 1” w tej metryce - są w nim wszystkie liczby całkowite parzyste,wszystkie liczby całkowite nieparzyste są na jego brzegu a liczby wymierne postaci 1

2n są poza nim.To zdecydowanie mniej intuicyjne niż takie otoczenie zera w metryce euklidesowej - odcinek (−1, 1)na prostej rzeczywistej.

Możemy teraz powtórzyć konstrukcję Cauchy’ego wykorzystując tę nową metrykę: wyróżnimyciągi Cauchy’ego i uzupełnimy zbiór liczb wymiernych wielkościami granicznymi dokładnie tak,jak poprzednio. Tak zbudowany zbiór liczb 2-adycznych jest jednak istotnie różny od zbioru liczbrzeczywistych (choć jest z nim równoliczny)! Np. ciąg (2n : n ∈ N) jest teraz ciągiem Cauchy’ego.Ale nie wyznacza 2-adycznej liczby niewymiernej bo jest zbieżny do 077. Nie można też zdefiniować„2-adycznej liczby e” tak jak w zbiorze liczb rzeczywistych...

„Matematyk jest wynalazcą nie odkrywcą” - Wittgenstein. Wynalazł konstrukcję graniczną, która - jak-każde dobre narzędzie - może być stosowana na wiele różnych sposobów...78.

Aby skonstruować zbiór liczb p-adycznych wystarczy zastąpić 2 przez liczbę pierwszą p. „p-adicnumbers are “far removed from our everyday intuitions”, Scholze said. Over the years, though, theyhave come to feel natural to him. „Now I find real numbers much, much more confusingthan p-adic numbers. I’ve gotten so used to them that now real numbers feel very strange.”79.

Ale po co nam to? Nie czuję się zbyt pewnie w tych rejonach matematyki, wykpię się więccytatem z wikipedii: „liczby p-adyczne znajdują zastosowanie w teorii liczb, w tym w słynnymdowodzie Wielkiego Twierdzenia Fermata odkrytym przez Andrew Wilesa”.

Finał: Kant v. ... Einstein

„Przed 1915 rokiem przestrzeń i czas uważane były za niezmienną arenę wydarzeń, która w żadensposób od tych zdarzeń nie zależała. (...) Ciała poruszają się (...) ale czas i przestrzeń tylko nie-zmiennie trwają.Zupełnie inny pogląd na czas i przestrzeń zawiera ogólna teoria względności. Czas i przestrzeń sątu dynamicznymi wielkościami: poruszające się ciała i i oddziałujące siły wpływają na krzywiznęczasoprzestrzeni - a krzywizna czasoprzestrzeni wpływa na ruch i działanie sił. (...) Podobnie jak nie

75Liczba |x − y| to odległość między liczbami wymiernymi x i y wyobrażonymi jako punkty prostej rzeczywistej.Naukowo: metrykę euklidesową w zbiorze liczb wymiernych chcemy teraz zastąpić inną metryką.76Dodatkowo d2(0, 0) = 0.77Co więcej: nieskończona suma (suma szeregu) 1 + 2 + · · ·+ 2n + · · · jest tu równa... −1.!78Dla równowagi: „czy matematykę wymyślamy czy odkrywamy? Czy matematycy tylko tworzą skomplikowane

konstrukcje umysłowe, które (...) tak dalece ogłupiają nawet ich twórców, że wierzą w ich realność? Czy też matema-tycy odkrywają prawdy już istniejące? (...) Jak sądzę, jest jasne, że (...) jestem zwolennikiem tego właśnie poglądu”- R.Penrose [87], str. 11879Quanta Magazine,The Oracle of Arithmetic. Peter Scholze and the Future of Arithmetic Geometry3, 2016. Peter

Scholze (1987- ). Za przełomowe wyniki w dziedzinie arytmetycznej geometrii algebraicznej, teorii liczb, oraz topologiialgebraicznej został nagrodzony medalem Fieldsa w 2018 roku.

Page 46: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 45

można mówić o wydarzeniach we Wszechświecie pomijając czas i przestrzeń, tak też bezsensownejest rozważanie czasu i przestrzeni poza Wszechświatem.”

Stephen W. Hawking, Krótka historia czasu.

3.4 Zadziwiająca kariera dodawania i mnożenia

Naszkicowany tu obraz ewolucji „matematycznych form ujmowania zjawisk” - od liczb naturalnychpoprzez coraz to większe zbiory liczbowe aż do wyrafinowanych przestrzeni matematycznych -będzie niepełny, jeżeli nie powiemy czegoś o algebrze tych struktur80.Dodawanie i mnożenie liczb naturalnych jest znane „od zarania dziejów”81 Zdumiewajace jest to,że również i pod tym względem liczby naturalne wraz z tymi pierwotnymi działaniami są rdzeniemwszystkich (lub przynajmniej większości) ważnych struktur algebraicznych. Rozwój matematykiprzejawiał się - między innymi - w dostosowywaniu tych operacji do coraz bardziej złożonych„form ujmowania zjawisk”. Był to proces ewolucyjny w tym sensie, że w żadnym momencie nieodrzucono wcześniejszego dorobku i nie rewidowano praw rządzących tymi działaniami we wcześniejukształtowanych i prostszych formach. Jedynie rozszerzano zakres tych działań co jednak w wieluwypadkach oznaczało zmianę jakościową.

Za symboliczny początek tego procesu można uznać wspomniany wcześniej „wynalezek zera”(str. 10). Docenimy jego znaczenie przyglądając się pierwszej strukturze stworzonej przez mate-matyków od podstaw - konstrukcji liczb całkowitych. Ta struktura jest - w odróżnieniu od liczbnaturalnych - symetryczna: z każdą liczbą całkowitą a skojarzona jest - wyznaczona jednoznacznie!- liczba przeciwna −a - taka, że a+−a = 0. Oczywiście −0 = 0 i jest to jedyna liczba całkowita otej własności. Zero to centrum tej struktury82.

Pojęcie symetrii funkcjonowało w starożytnej Grecji jako nieostre określenie zespołu cech gwa-rantujących szczególny ład, harmonię czy wręcz piękno. Pitagorejczycy spojrzeli na symetrię ma-tematycznie zapoczątkowując badanie symetrii figur (trójkąta, kwadratu itp.) - przekształceńpłaszczyzny zachowujących odległości między punktami które przeprowadzają taką figurę „w sa-mą siebie”. Np. trójkąt równoboczny ma sześć symetrii - trzy obroty i trzy symetrie osiowe.Przekształcenia-symetrie można składać - wykonywać jedną po drugiej. Każdej symetrii towa-rzyszy symetria odwrotna - taka, że składając symetrię z symetrią do niej odwrotną otrzymamysymetrią identycznościową83. Myślący abstrakcyjnie matematyk zauważy, że mimo wielu odmien-ności te struktury - liczby całkowite z dodawaniem i symetrie ze składaniem - są, z algebraicznegopunktu widzenia, podobne. Te zaobserwowane i wyróżnione („wyabstrahowane”) wspólne cechytych i innych podobnych struktur funkcjonujących w matematyce (np. zbioru premutacji) stały sięaksjomatami teorii grup84.

Grupa jest matematyczną formą ujmowania (badania) symetrii85.

80Przez „algebrę struktury” (lub: „strukturę algebraiczn rozumiemy w tym podrozdziale zespół wyróżnionychdziałań (operacji) wraz z regułami opisującymi ich cechy. Taką regułą jest np. rozdzielniość mnożenia względemdodawania liczb naturalnych wyrażana przez równość z(x+ y) = zy + zx.81Archeolodzy odnaleźli dowody, że dodawanie znane były ludom neolitycznym już ok. 10 tys. lat temu.82Liczby a i −a leżą na osi liczbowej po przeciwnych stronach zera w tej samej od niego odległości - stąd też−(−a) = a. Odejmowanie liczb jest tu wtórne: to dodawanie liczby przeciwnej.83Która przekształca wszystkie punkty płaszczyzny „w siebie same”. Być może najtrudniej było uznać, że to

„przekształcenie, które niczego nie zmiena” jest przekształceniem...84Np. przekształcenie identycznościowe i liczba zero to elementy neutralne względem wyróżnionych działań (skła-

dania symetrii w pierwszym przypadku i dodawania liczb w drugim). Przedstawienie współczesnej, formalnej definicjitej teorii odkładamy do czasu, gdy będziemy w stanie ją odczytać (str. 82). Proszę się nie niecierpliwić: starożytnewyobrażenie symetrii i współczesną definicję grupy dzieli więcej niż ... 2000 lat.Można też przeczytać artykuł J.M.Chrzanowskiej „Krótka historia symetrii” dostępny w internecie.85W 1872 roku F.Klein, w odpowiedzi na pojawiające się w tym czasie „nieeuklidesowe” geometrie, zaproponował

metodę ich klasyfikacji opartą na pojęciu grupy przekształceń („program erlangeński”): przedmiotem każdej geome-trii są te własności obiektów (układów punktów), które są niezmiennikami wskazanej a priori grupy przekształceń

Page 47: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 46

Liczby całkowite umiemy też mnożyć. Jednak to działanie nie jest już tak intuicyjnie oczywiste:dlaczego (−1)(−1) = 1? Nie można już odwołać się do pierwotnej intuicji, która mówi, że „mnożenieprzez n to n-krotne dodawanie” bo „(−1)-krotne” dodawanie nie ma sensu? Trzeba myśleć inaczej.Otóż mnożenie i dodawanie liczb naturalnych związane są warunkiem n(m + k) = nm + nk. Stądm · 0 = 0. Skoro algebra liczb naturalnych ma być wiernie odwzorowana w większej strukturzeliczb całkowitych , to te warunki powinny nadal obowiązywać. Dlatego iloczyn (−1) · (−1) musibyć równy 1...86 .

Liczby całkowite z dodawaniem i mnożeniem to struktura zwana pierścieniem (przemiennym z1).

Struktura algebraiczna liczb wymiernych jest bogatsza. To jest ciało, co oznacza, że jest topierścień przemienny z jedynką w którym każdy element różny od zera a ma element odwrotny a−1

- taki, że a · a−1 = 187.Kolejne rozszerzenia świata liczb - zdefiniowanie liczb rzeczywistych - nie wnosi nic nowego dodyskusji o algebrach zbiorów liczbowych: to też jest „tylko” ciało.Algebra liczb rzeczywistych ma pewną wadę: nie potrafimy - w R - rozwiązać równania x2 = a gdya < 0 88. Ten problem rozwiązano zadziwiająco prosto, wręcz brutalnie: wystarczyło „uznać istnie-nie” rozwiązania równania x2 + 1 = 0 , oznaczyć tę „liczbę” przez „i” i nazwać ją - chroniąc resztkizdrowego rozsądku - liczbą urojoną89. Dopiero trzy wieki później irlandzki matematyk Hamilton,zainspirowany zapewne osiągnięciami Kartezjusza, definiował liczby zespolone mniej mistycznie:to pary liczb rzeczywistych a „i” to para (0, 1). Istnienie miejsc zerowych dowolnych wielomianówzapewniają odpowiednio zdefiniowane operacje na tych parach: (a, b) + (c, d) = (a + c, b + d) i(a, b) · (c, d) = (ac− bd, ad+ bc)

Stąd (a, b) = (a, 0) + (b, 0)i i inna, klasyczna konwencja notacyjna: zamiast (a, b) piszemy a+ bi.Czy wybór konwencji notacyjnej to tylko „kwestia smaku”? Jeśli jesteśmy przekonani, że byty matema-tyczne „istnieją transcedentnie”, będziemy skłaniać się do posługiwania się tajemniczą „liczbą i”. Jeśliuważamy, że to my kreujemy język, to wybierzemy opis Hamiltona.

Liczby rzeczywiste są reprezentowane przez pary postaci (a, 0) a zdefiniowane działania są roz-szerzeniami dodawania i mnożenia liczb rzeczywistych.Liczby zespolone są „nierzeczywiste”. Dla pozamatematycznego pospólstwa - tajemnicze. Tę ta-jemniczość pięknie wyraża przesławna tożsamości Eulera:

eπi = −1w której jest wszystko: geometryczne π, algebraiczne i i graniczne e.

Jednak ta magiczna równość to w istocie prosta konsekwencja przyjętej definicji funkcji wy-kładniczej:

ea+bi = ea · (cos b+ i sin b) 90

przestrzeni. Np. przedmiot badań geometrii euklidesowej płaszczyny wyznacza grupa izometrii - przekształceń zacho-wujących odległość.W przywoławanym już artykule J.M.Chrzanowskiej znalazło się „urzekające prostotą” zdanie: „Obecnie symetriajest traktowana jako fundamentalna cecha naszego wszechświata. Dzięki narzędziu jakim jest teoria grup możemyopisywać symetrie w świecie, mimo że czasami nie możemy ich zaobserwować.”86Sprawdź.87Równoważnie: liczby wymierne różne od zera wraz z operacją mnożenia tworzą grupę w której elementem neu-

tralnym jest 1.88Mając do dyspozycji działania dodawania i mnożenia można zdefinować wielomian o współczynnikach w ciele

(pierścieniu) k jako napis postaci anxn + · · · a1x + a0 gdzie a0, a1, . . . , an ∈ k. Miejsce zerowe wielomianu to liczbac ∈ K taka, że ancn + · · · a1c + a0 = 0. Ciało algebraicznie domknięte to takie, w którym każdy wielomian „nad k”ma miejsce zerowe.89Tak tę liczbę nazwał Girolamo Cardano, który w połowie XVI wieku wprowadził to pojęcie do algebry. Nie tyle

„wprowadził” co natknął (potknął) się na nie poszukując wzorów opisujących rozwiązania równania sześciennegox3 +mx = n gdzie m,n ∈ N. [36]90W istocie jest to wtórna postać tej definicji. Definicja pierwotna jest „prostym” przeniesieniem znanaj nam już

równości ex =∑∞

n=0xn

n! (str. 37) do świata liczb zespolonych.

Page 48: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 47

Tożsamość Eulera otrzymamy przyjmując a = 0, b = πi... .Ta równość ma też intrygujacą interpretację geometryczną: - dla (dowolnie) ustalonej liczby a ∈ R,liczby zespolone postaci ea+bi to punkty okrągu o promieniu ea i środku w punkcie (0, 0).91

Dodajmy jeszcze dwie równości które mogą wywołać przyprawić o zawrót głowy: ponieważebi = cos b+ i sin b oraz - co łatwo pokazać - e−bi = ·(cos b− i sin b) , to:

cos b = ebi+e−bi2 , sin b = ebi−e−bi

2i

- funkcje trygonometryczne można opisać odwołując się do zespolonej funkcji wykładniczej.Konsekwencją przyjęcia takiej definicji zespolonej funkcji wykładniczej jest - też nieco „dziwna”

- definicja potęgowania liczb zespolonych: gdy c jest dodatnią liczbą rzeczywistą to cz = ez ln c .Ten sam wzór opisuje też potęgę cz gdy c to liczba zespolona - jeśli tylko wiemy, czym jest liczbaln c - logarytm naturalny z liczby zespolonej c92

Daleko odeszliśmy od intuicji towarzyszącej potęgowaniu liczb naturalnych: „potęgowanie to wielokrotnemnożenie liczby przez siebie”. A przecież doszliśmy do tej abstrakcji nie zaprzeczając tej pierwotnejintuicji, tylko rozszerzając zakres pojęcia „potęgowanie”... .A może jest odwrotnie, może potęgowanie liczb naturalnych (wymiernych, rzeczywistych) należy postrze-gać jako szczególny przypadek potęgowania liczb zespolonych?Czy odkryliśmy definicję potęgowania liczb zespolonych czy też ją tylko wymyśliliśmy?

Dodajemy i mnożymy też w przestrzeniach matematycznych, dla których pierwowzorem jestprzestrzeń kartezjańska. Oczywiście te działania są tu odpowiednio zmodyfikowane, dostosowanedo bardziej skomplikowanej struktury tych matematycznych form ujmowania zjawisk. I tak prze-strzeń liniowa to struktura złożona z dwóch podstruktur: ciała skalarów i grupy wektorów które sąpowiązane działaniem mnożenia wektorów przez skalary. Algebra nad ciałem to przestrzeń linio-wa wyposażona dodatkowo w działanie mnożenia wektorów. Algebra łączna z jedynką to algebraw której podstruktura wektorów jest pierścieniem z jedynką. A gdy nieco poluzujemy i zastąpimyciało skalarów pierścieniem z jedynką, to otrzymamy ogólniejsze pojęcie (lewostronnego) modułu93.

Dodawanie i mnożenie, połączone zależnościami, są wszechobecne.Postawmy pytanie z serii tych, których nie należy zadawać robotnikom matematyki: czy można sobiewyobrazić matematykę „opartą” na innych działaniach94?

,

91Liczby zespolone leżące na okręgu o promieniu 1 i środku w (0, 0) to najprostsza grupa Liego (taki żart).92„Kłopot” w tym, że nie jest ona wyznaczona jednoznacznie: ln c = ln

(|c| · ei·φ

)= ln |c|+ iφ = ln |c|+ i(φ+ 2kπ)

, gdzie |c| to moduł, φ to argument główny liczby c a k to dowolna liczba całkowita.93Najprostszy przykład algbry (łącznej z jedynką) to zbiór macierzy kwadratowych ustalonego wymiaru o współ-

czynnikach rzeczywistych.Oczywiście dodawanie i mnożenie w tych przestrzennych strukturach muszą spełniać pewne wiążące je warunki. Niebędziemy ich tu opisywać bo to nie podręcznik.94W internecie można znaleźć informację, że pewne plemię aborygeńskie posługuje się jeęykiem pozbawionym okre-

sleń „lewy”, „prawy”, „przód”, „tył”. Przywołując ten fakt w jednym ze swoich felietonów Z.Hołdys (bez wątpienienie-matematyk) napisał: „To tak, jakby obok znanej nam matematyki istniała jakaś inna – bez liczb i dodawania.”(Newsweek, 23.09.2018)). A może my wszyscy jesteśmy potomkami plemion, które właśnie dzięki wynalazieniu do-dawania a potem mnożenia zapanowały nad tym światem? I jeszcze jedno zdanie z tego felietonu: „Nie jest to tylkociekawostka – to inna filozofia życia.”

Page 49: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 4

Spór o istotę matematycznego bytu

Zobacz! Oto ludzie są niby w podziemnym pomieszczeniu na kształt jaskini. Dogroty prowadzi wejście zwrócone ku światłu (...). W niej oni siedzą (...) przykutemają nogi i szyje tak, że trwają na miejscu i patrzą tylko przed siebie. (...) Z górypada na nich światło ognia, który się pali za ich plecami (...) czy myślisz, że tacyludzie mogli by z siebie samych i z siebie nawzajem widzieć coś innego opróczcieni, które ogień rzuca na ścianę jaskini? Platon, Państwo

Pytania: „czy istnieje nieskończony zbiór liczb naturalnych?” „czy istnieje liczba rzeczywista(która jest luką w zbiorze liczb wymiernych)?” prowokują do postawienia kolejnego: „co to znaczy„istnieć”? Bez obaw: podobnie jak w przypadku równości, nie zamierzam dyskutować tego problemuin extenso. Interesuje nas pytanie: „czym jest istnienie matematyczne”?

O dziele Cantora i Hilberta mówi się często jako o uporządkowaniu podstaw matematyki. Jestwięc oczywiste, że musieli oni odnieść się do problemu matematycznego istnienia. Szukając określeńopisujących zwięźle ideową podstawę tego porządkowania, można bez większego ryzyka stwierdzić,że był to platonizm wsparty przez rygorystyczny formalizm.

Platon1 stworzył system filozoficzny2, oparty na założeniu, że prawdziwe byty to idee. Wiecz-notrwałe i niezmienne. Rzeczywistość materialna jest tylko ich odbiciem. Nie odnajdziemy w niejidealnego kwadratu, więc

√2 jest bytem idealnym, posiadającym niedoskonałe realne odbicia. Ma-

tematyka miała odnosić się do bytów idealnych wprost, pomijając rzeczywistość. Pojęcia geometriieuklidesowej - punkt, prosta - należą do tego idealnego świata. „Poznanie geometryczne dotyczytego, co istnieje wiecznie”3. Platon widział w matematyce sposób poznania świata idei niepozna-walnych inaczej niż za pomocą rozumu. Używając dzisiejszego języka powiemy: jeśli chcemy wyjśćpoza zmysłowe poznanie rzeczywistości, musimy stworzyć jej abstrakcyjny, „idealny” model.

Uznanie transcedentnego istnienia świata idei zdawało się starożytnym warunkiem koniecznym, by ma-tematyka stała się nauką normatywną, której zadaniem jest ustalanie tego, co winno być (czylinorm) a nie tego, co jest (i co jest domeną nauk deskryptywnych).Dziś, zamiast o ideach, mówimy raczej o pojęciach abstrakcyjnych4. Nie potrzebujemy ich niezależnegotranscedentnego istnienia. Przyjmujemy, że mamy prawo do ich tworzenia - w sferze języka. Kreujemy jena podstawie obserwacji „podobnych” obiektów, abstrahowania od tego, co je różni i eksponownia tego,co dla nich wspólne.

1Platon (427 p.n.e. - 347 p.n.e.) był twórcą pierwszej naukowej instytucji - akademii platońskiej, która przetrwałaaż do 529 roku, kiedy została zamknięta przez cesarza Justyniana I. Tenże cesarz wydał kodeks praw zawierającyparagraf „O złoczyńcach, matematykach i tym podobnych osobnikach”, głoszący m.in., że „potępienia godna sztukamatematyczna jest zakazana przede wszystkim”. Cesarz Justynian zyskał przydomek „Wielki”... .Jednym z „absolwentów” akademii platońskiej był (najprawdopodobniej) Euklides.2Zwany dziś idealizmem platońskim. Uwaga: przywołując w tym tekście poglądy filozofów (Platona, Kanta i

innych) mówię o moim subiektywnym odbiorze ich idei i koncepcji. Nie przypisuję sobie prawa do obiektywnego ipełnego przedstawiania ich poglądów. I nie trzeba się ze mną zgadzać.3Platon, Państwo.

48

Page 50: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 49

Tak postrzegany świat idei - pojęć abstrakcyjnych - to model rzeczywistości, który - jak powiedział dwatysiące lat później Leibniz - jeśli ma być doskonalszy od rzeczywistości, musi być od niej prostszy.

Wiemy, że nieskończoność aktualna nie mieści się w świecie platońskich idei5. Jak to się stało, żeporzucono to samoograniczenie? Aby to zrozumieć, trzeba sięgnąć do Kanta i jego teorii poznania:

(...) „rozum nie jest w stanie ograniczyć swojego poznania do obszaru możliwego doświadczenia.Dąży do poznania rzeczy samych w sobie, dokonuje operacji abstrahujących i systematyzujących,czego rezultatem są idee (czystego rozumu)”6.

Wyjaśnijmy, barbarzyńsko upraszczając, naturę owych idei. Opisując rzeczywistość formułujemysądy, które Kant dzielił na:- syntetyczne, a posteriori czyli te, które są skutkami doświadczeń,- analityczne, a priori, które są niezależne od doświadczenia.

Rzeczy obserwujemy, nazywamy i opisujemy a potem badamy, dociekając logicznych związków międzyopisami7.Euklides dokonał syntezy doświadczeń swoich poprzedników (i własnych), które doprowadziły go dosformułowania aksjomatów geometrii (zwanej dziś euklidesową). To są sądy syntetyczne.Sądy analityczne to - w tym przypadku - twierdzenia dotyczące obiektów geometrycznych, które potrafimylogicznie uzasadnić odwołując się do sformułowanych wcześniej aksjomatów8.

Kant wyróżnił kategorię sądów syntetycznych a priori - niezależnych od doświadczenia, ro-zumianego jako obserwacja realnego świata. Od sądów analitycznych - logicznie uzasadnionychkonsekwencji aktualnej wiedzy - różnią się tym, że formułują nowe idee - idee czystego rozumu.Zdolność do formułowania sądów syntetycznych a priori to istota naukowego procesu poznania.

Wolno (należy) tworzyć abstrakcyjne pojęcia, gdy przybliżają poznanie istoty rzeczy. Na różnychpoziomach. Nie tylko na podstawowym, pozostającym w ścisłym związku z oglądem rzeczywistości.Na wyższych poziomach kreujemy nowe pojęcia („jedności”) próbując uchwycić zależności międzypojęciami niższego poziomu.

Akceptacja idei czystego rozumu stworzyła nową perspektywę dla dyskusji o nieskończoności. Wolną odposzukiwania uzasadnień w rzeczywistym świecie i pytań w stylu: „czy ktoś widział nieskończoność?”Koncepcja Kanta to kulminacja nurtu w nauce zapoczątkowanego przez Platona9. Nurtu, który za celnauki uznawał poznanie rzeczywistości nie wprost, przez doznania zmysłowe, ale przez budowanie modeliwykraczających poza dosłowne odwzorowanie rzeczywistości. To woda na młyn matematyków. Oni „odzawsze” (od Pitagorasa) szukając prawdy wychodzili poza obszar fizycznego doświadczenia.

Kant utwierdza ich w słuszności takiego postępowania mówiąc, że to konieczne, jeśli chcemy przybliżyćpoznanie „rzeczy samej w sobie”10.

4To tylko sugestia, zdradzająca mój pogląd na matematykę. Matematyczni realiści (platonicy) wciąż podpisują siępod deklaracją Platona: „nazwy (...) stanowią jedynie obraz rzeczywistości, nigdy nie mogą jej zastąpić. Język jestjedynie narzędziem obrazowania świata.” [25].5Przypomijmy wspominany wcześniej „horror infiniti”.6C S. Sztajer -http://mumelab01.amu.edu.pl/SKH/S.Sztajer.html8Russell pisał: „(...) bezpośrednio znamy to, co uświadamiamy sobie wprost, bez pośrednictwa wnioskowań czy

pewnej znajomości prawd. Tak więc, bezpośrednio znam dane zmysłowe” (cytuję za artykułem M. Łełyka „Episte-mologia i logika jako dwa źródła krytyki języka. Filozofia B. Russella w okresie atomizmu logicznego”(internet)).9Stawianie tak blisko siebie Platona i Kanta może dziwić a nawet gorszyć. Wszak Platon myślał o odkrywaniu

transcedentnego świata idei a Kant o kreowaniu języka modelującego rzeczywistość. Różne motywacje, ale rezultatynie tak znów odległe.10G.W.Hegel (1770-1831): „Rzecz sama w sobie (...) oznacza przedmiot, o ile abstrahuje się od wszystkiego, czym

on jest dla świadomości, od wszystkich jego określeń czuciowych, jak też od wszystkich dotyczących go określonychmyśli.” W skrajnej wersji poznanie rzeczy samej w sobie ma być wolne od ograniczeń jakie niesie język.Skoro zabrnęliśmy tak daleko, to dodajmy jeszcze cytat z pracy doktorskiej A. Pietras „Postneokantowskie projektyfilozofii Nicolai Hartmann i Martina Heideggera” (internet): „(...) Kant sprzeciwia się przenoszeniu metod właściwychdla poznania matematycznego na grunt metafizyki. Wskazuje on na specyfikę poznania metafizycznego, któremu

Page 51: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 50

Wyjście poza bezpośredni ogląd rzeczywistości to cecha nie tylko matematyki. Widzimy tochyba najlepiej we współczesnej fizyce. Przywołajmy tylko jeden przykład: transformacja Galile-usza pozwalająca przeliczać współrzędne czasoprzestrzenne między dwoma układami odniesienia(upraszczam) jest zrozumiała niemal dla każdego kto zechce ją poznać, bo jest zgodna z codziennymdoświadczeniem. Ale dziś wiemy, że jest ona jedynie przybliżeniem transformacji Lorentza dopusz-czalnym w „postrzeganych zmysłami” sytuacjach. Ta druga transformacja korzysta z wymykającejsię wyobraźni czasoprzestrzeni Minkowskiego i dopuszcza różne wyniki pomiaru długości i czasu wróżnych układach odniesienia, co godzi w nasz zdrowy rozsądek. Wszystko to za sprawą Einsteinai odkrycia, że prędkość światła jest stała, niezależna od układu odniesienia.Tenże Einstain mówił, że „zdrowy rozsądek to zbiór przesądów nabytych przed upływem osiemna-stego roku życia”... .

4.1 Koncepcja Hilberta

Największym odkryciem XIX wieku było wynalezienie metody odkrywania.A. N. Whitehead, Science and Modern World

From the range of the basic questions of metaphysics we shall here ask thisone question: “What is a thing?” The question is quite old. What remains evernew about it is merely that it must be asked again and again.

Martin Heidegger, What is a thing?

Ponad sto lat później, genialną - i jak się mogło zdawać, ostateczną - odpowiedź na rozważanetu pytanie zaproponował Hilbert. Sformułował on fenomenalnie proste kryterium istnienia „bytumatematycznego” [109]:

„if the arbitrarily given axioms do not contradicts each other (...) then the object defined throughthe axioms exists. That, for me, is the criterion of true and existence”11

To jest istota, manifest tzw. realizmu pojęciowego12. Pogląd Hilberta w części podzielał Poincare:„Twór matematyczny istnieje zawsze, jeśli tylko jego definicja jest wolna od sprzeczności wewnętrz-nych i nie prowadzi do sprzeczności z przyjętymi twierdzeniami”[92] 13.

Przeanalizujmy dokładnie, jak czekiści14, ten manifest. Aksjomatem może być każde zdanie ję-zyka w którym opisujemy przedmiot badań i któremu możemy przypisać wartość logiczną - prawdęlub fałsz. Teoria to zbiór takich zdań.Stwierdzenie: „(...) dowolnie wybrane aksjomaty” nie oznacza przyzwolenia na ich absolutnie arbi-tralny wybór ale jest potwierdzeniem prawa do swobody twórczej. „Hilbert nigdy nie twierdził, żematematyka jest systemem sformalizowanym15 - dla niego była to tylko rekonstrukcja istnie-jącej matematyki dokonywana w pewnym określonym celu” [77]. Hilbert przyjął jako oczywistezałożenie, iż tworzenie bytów matematycznych będzie rezultatem odpowiedzialnych działań.

Czytajmy dalej: „jeśli dowolnie wybrane aksjomaty nie są wewnętrznie sprzeczne (...) to istniejeobiekt przez nie definiowany”. Uprawomocnieniem istnienia jest wyłącznie niesprzeczny opis.Hilbert odrzucił wszelkie inne kryteria sensowności teorii. Zapewne nie chciał mieszać do budowy

przypisuje zadanie analizy, a nie (jak w matematyce) konstrukcji, pojęć. „Zadaniem filozofii jest rozbiór, precyzowanie,i określanie pojęć, które są dane jako niejasne. Zadaniem matematyki jest łączenie i porównywanie pojęć dotyczącychwielkości, które są jasne i pewne, aby zobaczyć, co z tego może być wywnioskowane.” (...) O ile więc w matematycechodzi o to, by przedstawić najpierw jasne definicje podstawowych pojęć, by w oparciu o nie rozwijać nasze poznanie(...) o tyle w filozofii nie należy zaczynać od definicji.11Pogląd Hilberta nie był aż tak rewolucyjny. Np. w [81] znajdziemy artykuł P.Vopenki „Zbiory aktualnie nie-

skończone”, w którym przywołano taką oto wypowiedź Bolzano: „Niemożliwym trzeba nazwać to, co przeczy jakiejśprawdzie czysto pojęciowej: możliwym przeto to, co nie jest w sprzeczności z żadną prawdą czysto pojęciową”.12Dziś hilbertowską koncepcję nazywa się koherencyjną teorią prawdy (koherencja (łac.) = spójność, spoistość).13W części, gdyż w odróżnieniu od Hilberta, Poincare postulował by w matematyce rozpatrywać tylko te obiekty,

które mogą być zdefiniowane za pomocą skończonej liczby słów.14CzeKa - Wszechrosyjska Komisja Nadzwyczajna do Walki z Kontrrewolucją, Spekulacją i Nadużyciami Władzy.15Skąd już blisko do prześmiewczego twierdzenia, że matematyka to „kolekcja rebusów”...

Page 52: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 51

podstaw matematyki kryteriów „miękkich”, niosących ryzyko niejednoznacznych interpretacji. Takaformuła czyniła z matematyki naukę otwartą, zdolną do ekspansji.

Hilbertowski formalizm odebrał matematyce wiele z jej mistycyzmu. Uznanie istnienia świataplatońskich idei przestało być warunkiem koniecznym uprawiania matematyki. Zamiast odkrywać,zaczęliśmy tworzyć. Relacja między matematyką a światem wiecznotrwałych idei przestała byćkryterium poprawności działań matematyków. W tej roli zastąpił go formalizm - wiara, że potrafimykontrolować własne dzieło i unikać sprzeczności.

Nie do końca... „Hilbert was at heart a Platonist.(...) His formalism was primarily a tactic in his battleagainst Brouwer’s intuitionism” [83]. Jego wizja matematyki to realizacja koncepcji, którą w filozofiimatematyki określa się jako matematyczny realizm16.„Trudno nie wierzyć w nic”. Trudno nie wierzyć w obiektywne istnienie czegoś, czego badaniu poświęciłosię całe... . Matematyka domaga się choć odrobiny (subiektywnego) realizmu17. Większość matematykównie roztrząsa dylematu „formalizm czy platonizm” godząc jedno z drugim. Matematycy są pragmatyczni.

Być może to ta dwoistość, ten platońsko-formalistyczny charakter koncepcji Hilberta zadecydował, że odponad stu lat zajmuje ona centralne miejsce w matematyce...18.

Czym jest hilbertowska „niesprzeczność teorii”? Zgodnością z rzeczywistością? Nic z tych rzeczy:

Sprzeczność teorii to możliwość jednoczesnego uzasadnienia (udowodnienia) na jej podstawiepewnego zdania φ i jego zaprzeczenia - zdania ¬φ. A niesprzeczność to zaprzeczenie sprzeczności.Niesprzeczność matematycznej teorii jest zawsze tylko niesprzecznością wewnętrzną.

o niesprzeczności rozstrzyga się w sferze logiki.Hilbert wyznaczył logice rolę gwaranta obiektywnego charakteru procesu poznania matematycznego.Sformalizowane dowodzenie miało stać się synonimem prawdziwości. Hilbert był przekonany, że będziemypotrafili w sposób sformalizowany (czyli obiektywny i pewny) dowodzić niesprzeczności budowanych teorii- „(...) consistency of the comprehensive formalized system is to be proved by using only restricted,uncontroversial and contentual finitistic mathematics” [98].

Rozstrzyganie o niesprzeczności teorii to nie jedyna rola przypisana logice w koncepcji Hilberta.Skoro byty matematyczne nie są materialne, to musimy się zgodzić, że:

Byt matematyczny jest tym, co można o nim powiedzieć19

Jeśli żadne z pary przeciwstawnych zdań (φ,¬φ)nie jest konsekwencją niesprzecznej teorii T , tomożna rozpatrywać dwie bogatsze i niesprzeczne teorie T ∪φ oraz T ∪¬φ. Tę procedurę możnapowtarzać i budować drzewo rozszerzeń teorii T :

17„Mathematical realism, (...) holds that mathematical entities exist independently of the human mind. Thus hu-mans do not invent mathematics, but rather discover it (...) there is really one sort of mathematics that canbe discovered; triangles, for example, are real entities, not the creations of the human mind.” - wikipedia.„W filozofii matematyki (...) realiści twierdzą, że obiekty matematyczne to realnie istniejące lub skonstruowanepoznawczo przedmioty abstrakcyjne. Realizm skrajny, zwany też platonizmem mówi, że obiekty matematyczne sąpozaczasowymi, rzeczywistymi i obiektywnymi bytami, w przeciwieństwie do czasowych, przemijalnych i nie posia-dających pełni istnienia przedmiotów zmysłowych i zjawisk.(...)” - wikipedia, wersja polska.„Realizm subiektywny”? Ci, którzy czytali „Sto lat samotności” G. Marqueza wiedzą w czym rzecz.18Równie istotnym żfódłem sukcesu hilbertowskiej koncepcji jest ockhamowska prostota języka i aksjomatów (widzę

miny tych, dla których matematyka jest koszmarem...). Oto jak - sarkastycznie - pisał o tym L. Susanka: „Axioms aresupposed to be so pellucidly, limpidly clear („przejrzyste i klarownie czyste”) that any fool, after understanding ourinterpretation of their meaning in ordinary mathematical usage, would acclaim their necessity and validity” [115].19Hilbert mówił „twór” a nie „byt”. Można też mówić „obiekt”.

Page 53: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 52

T

&&xxT ∪ φ1

vv

T ∪ ¬φ1

((T ∪ φ1, φ2

yy

T ∪ φ1,¬φ2

''

T ∪ ¬φ1, φ2 T ∪ ¬φ1,¬φ2

Każdą gałąź tego drzewa można przedłużać do czasu, gdy na jej końcu pojawi się pełna nie-sprzeczna teoria - taka, której dowodliwą konsekwencją jest dokładnie jedno z każdej pary przeciw-stawnych zdań - (ψ,¬ψ).

Obiekt matematyczny opisany przez pełną teorię jest kompletny - dowolne zdanie języka, wktórym sformułowaliśmy tę teorię, jest albo prawdziwe (dowodliwe) albo falsyfikowalne (dowodliwajest jego negacja). To cecha opisów obiektów fizycznych - konfrontując nasze sądy z takim obiektemzawsze możemy ocenić, czy są prawdziwe czy fałszywe20. To rodzi pokusę, by te w pełni określonebyty uznać za matematyczne byty jednostkowe („jedności”). Inne, opisywane przez niepełne teoriepostrzegać jako kolekcje, klasy owych jedności.

Jednak Hilbertowi chodziło o coś więcej: o sprawowanie kontroli nad matematyką. Problemw tym, że teorie mogą być nieskończonymi zbiorami zdań. Jak nad tym panować, jak kontrolo-wać? Hilbert skorzystał z genialnego pomysłu Euklidesa - przedstawiania teorii w postaci systemuaksjomatycznego21. System aksjomatów teorii T to jej wyróżniony podzbiór AxT , który jest:

- rozstrzygalny - potrafimy orzec, czy dane zdanie należy do zbioru AxT czy też nie22,- wszystko, co można dowieść zakładając prawdziwość zdań ze zbioru T powinno pozostać

dowodliwe, jeśli założymy tylko prawdziwość zdań zbioru AxT .

Teorię, dla której potrafimy wskazać zbiór aksjomatów nazywamy teorią aksjomatyczną (aksjoma-tyzowalną)23.

Wiedza o matematycznym bycie to potencjalnie nieskończony zbiór zdań. Aksjomaty teorii to jego fini-tarny opis i zalążek procesu poznania - poszukiwania dowodliwych konsekwencji aksjomatów.Inicjacja procesu poznania nowego matematycznego bytu należy do (genialnych) matematyków. To onikreują „byt” proponując jego aksjomatyczny opis. A logika wspomaga i kontroluje proces rozszerzaniawiedzy o tym obiekcie. To zadanie robotników matematyki.W języku teorii informacji można to ująć tak: przekaz informacji to zbiór stwierdzeń-aksjomatów. Wartośćinformacyjna tego przekazu to - dzięki logice - zbiór dowodliwych konsekwencji tych aksjomatów.

Przekonanie, że tak można zapanować nad światem matematycznych bytów to jeden z paradyg-matów koncepcji Hilberta. Wyraża wiarę, że można sprawować pełną kontrolę nad przedmiotem20Przynajmniej tak nam się zdaje...21Dzieło Euklidesa - „Stoicheia geometrias” - opisuje geometrię jako teorię aksjomatyczną. W antycznej Grecji

utożsamiano poznanie z dążeniem do wskazania istoty (essence”) badanych zjawisk.To tłumaczy zamysł Euklidesaby zacząć od wskazania minimalnego zbioru zdań ujmujących istotę geometrii [68]. Przywrócenie tego paradygmatupo wiekach zapomnienia (u schyłku XIX wieku) zawdzięczamy niemieckiemu matematykowi M. Paschowi [63].22Wymóg rozstrzygalności stanie się zrozumiały po lekturze rozdziału „Obliczalność”. Teraz powiedzmy tylko, że

przekonanie, iż zawsze umiemy rozstrzygać, „czy element należy, czy nie należy do danego zbioru” jest ułudą.23Taką organizację wiedzy nazywa się naukowo metodą aksjomatyczno-dedukcyjną. „The concept of an ”axiom” is

closely related to the idea of logical irreducibility. Axioms are mathematical facts that we take as self-evident (...).That is how Euclid did things in Alexandria two millennia ago, and his treatise on geometry is the classical modelfor mathematical exposition. - G.Chaitin, „The limits of reason” (internet).A.Tarski pisał: „Każda teoria naukowa jest układem zdań przyjętych za prawdziwe, które można nazwać prawamilub twierdzeniami uznanymi” [120]. Gwoli ścisłości: to Arystoteles pierwszy postulował, by wszelkie badania naukowerozpoczynać od podania definicji i aksjomatów.

Page 54: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 53

swoich badań, że „to co prawdziwe, jest dowodliwe”24.Postawmy kropkę nad i: w koncepcji Hilberta cała matematyka miała być jednością, bytem

matematycznym opisanym przez pełną aksjomatyzowalną teorię25.

Marzenie o teoriach finalnych ostatecznie rozstrzygających dylematy danej dziedziny poznania jest takstare jak nasza cywilizacja. Człowiek „od zawsze” oczekiwał i poszukiwał ostatecznych odpowiedzi obja-śniających otaczający go świat (lub jego fragmenty). Może je dawać religia, może znajdować je nauka.Leibniz pisał: „Największą pomocą dla rozumu byłoby odkrycie niewielu myśli, z których wynikałyby wporządku inne nieskończone myśli w ten sam sposób, w jaki z niewielu liczb (...) można wyprowadzić wporządku inne liczby”[29] 26.Do takiej finalnej teorii dążył Hilbert - “dispose of the foundational questions in mathematics (...) onceand for all”.

Ale to nie tak, że Hilbert miał podaną na tacy całą logikę w dzisiejszym znaczeniu tego słowa.Dość powiedzieć, że G. Boole wydał swoje dzieło „An Investiagtion into The Laws of Thought” opi-sujące algebraicznie najprostszą logikę zdaniową dopiero w 1854 roku27. Budowa języka pierwszegorzędu i związanej z nim logiki została zaledwie zapoczątkowane w pracach G. Frege. Hilbertow-skie odwołanie do logiki było raczej wskazaniem konieczności jej równoległego (do matematyki)rozwijania, a nie wykorzystaniem gotowego i sprawdzonego narzędzia28.

Stwierdzenia rzeczywiste i idealne

Jedynym ograniczeniem matematyki Hilberta jest wymóg jej wewnętrznej niesprzeczności. Świa-dom niebezpieczeństw stąd wynikających29 Hilbert sugerował, by w matematyce widzieć dwa świa-ty: świat „real statements” i „ideal statements”. Real statements to jądro matematyki, stwierdzeniaodnoszące się wprost do przedmiotu badań. Ideal statements to wszelkie stwierdzenia formułowa-ne w języku, w którym te badania prowadzimy. To nie jest jasno zdefiniowany podział: „Hilbertintended to isolate what he viewed as an unproblematic and necessary part of mathematics, anelementary part of arithmetic he called „finitistic mathematics” [97]. „Hilbert’s characterization ofboth finitistic mathematics and real statements are somewhat unclear (...). Nevertheless, it is inany case clear that the real statements include numerical equations and their negations, boundedexistential and universal quantifications of these, and at least some universal generalizations. Theyare thus included in (...) the sentences that logicians nowadays call by Π0

1-sentences” [109]30. Do„bezproblemowego” jądra matematyki Hilbert włączał też logikę klasyczną.

Świat idealny jest po to, by łatwiej, jaśniej i głębiej dowodzić stwierdzeń dotyczących świata

24Zapewne dlatego Hilbert popularną w tym czasie tezę niemieckiego zoologa E. du Bois-Reymonda: „Ignoramuset ignorabimus” (nie znamy i nie poznamy) nazywał „idiotyczną” i przeciwstawił jej swoją -„Wir mussen wissen. Wirwerden wissen.” (Musimy wiedzieć. Będziemy wiedzieć.). Ale historia zakpiła sobie z Hilberta równie ostro, jak on zeswego adwersarza. Więcej o tym w rozdziale poświęconym twierdzeniom Godla.25We wczesnym okresie pracy naukowej, w 1899 roku, Hilbert „poprawił” Euklidesa, przedstawiając pełny system

aksjomatów dla (klasycznej, euklidesowej) geometrii. To zapewne było dla niego istotną przesłanką przy planowanejaksjomatyzacji całej matematyki.Jednym z postulatów Hilberta była aksjomatyzacja... fizyki. Mimo jego odrzucenia, niektórzy i dziś są przekonani, żewłaściwie każda dziedzina nauki powinna być organizowana zgodnie z euklidesowym paradygmatem: „When we areinvestigating the foundations of a science, we must set up a system of axioms which contains an exact and completedescription of the (...) ideas of that science (...). No statement within the realm of the science (...) is held to be trueunless it can be deduced from the axioms by means of a finite number of logical steps...”[106] str. 9.26Leibniz pisał też tak: „Należy znaleźć znaki lub symbole dla wyrażenia w sposób jasny i ścisły wszystkich myśli,

jak w arytmetyce wyrażone są liczby lub w geometrii linie, aby można było z nimi czynić to samo, co czyni się warytmetyce i geometrii, gdy ma się je jako przedmiot rozumowania. Z tego powodu wszystkie dociekania, które opartesą na rozumowaniu, dokonywane będą przez przemieszczanie tych znaków, przez pewien rodzaj rachunku”.27George Boole ( 1815 - 1864), angielski matematyk, filozof i logik.28Hilbert przyczynił się znacząco do powstania współczesnej logiki przez prace nad aksjomatycznym jej ujęciem

(prowadzone razem z uczniem, P.Bernaysem).29Opowieści o smerfach i Gargamelu są też wewnętrznie niesprzeczne...30Czym są owe „Π01-sentences” powiemy w przyszłości.

Page 55: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 54

realnego. I nic ponad to - wzbogacenienie języka nie miało prowadzić do wyników, których niemożna by interpretować w realnej matematyce. To rozszerzenie miało być konserwatywne (zacho-wawcze).31.

Spróbujmy podsumować: oto

Paradygmaty matematyki hilbertowskiej:- jesteśmy w stanie wskazać uniwersalny system aksjomatów,- potrafimy kontrolować niesprzeczność wybranego zbioru aksjomatów32,- to, co niesprzeczne ze wskazanym systemem aksjomatów istnieje, jest prawdziwe,- to, co prawdziwe, jest dowodliwe.- zbiór aksjomatów uniwersalnej teorii - „prawd podstawowych” - to punkt odniesienia do

rozstrzygania o niesprzeczności i prawdziwości innych stwierdzeń- język matematyki dopuszcza kwantyfikacje, pozwala formułować twierdzenia „o istnieniu”.

W ramach takiej uniwersalnej teorii możemy arbitralnie zadekretować - za pomocą aksjomatów- istnienie pewnych obiektów matematycznych. To istnienie się uprawomocni, jeżeli udowodnimyniesprzeczność teorii33.

Hilbert i jego współwyznawcy wierzyli, że realizacja takiej wizji matematyki jest możliwa.

„Wir mussen wissen — wir werden wissen! - Musimy wiedzieć, będziemy wiedzieć!”jest manifestem tej wiary34.

Koncepcja Hilberta była w chwili jej powstania niezwykle atrakcyjna. Kreowała naukę uniwersalną. Uosa-biała wiarę, że to jest możliwe. Była obietnicą znalezienia globalnego ładu, ostatecznego rozwiązanianaszych dylematów.Działo się to na przełomie XIX i XX wieku, w jednej z tych nielicznych chwil w historii, kiedy człowiekwierzył w swe nieograniczone możliwości. Oszołomieni sukcesami ludzie nauki byli przekonani, że mogąwszystko. „Co jest rozumne, jest rzeczywiste, a co jest rzeczywiste, jest rozumne” - pisał Hegel. Tylkopozazdrościć...Hekatomba wojen światowych, holocaust, gułag, Hiroszima i inne dzieła ludzkiej pomysłowości (nie mylićz umysłowością) - wszystko to było wtedy niewyobrażalne. Niemożliwe35.

4.2 Rola teoria mnogości w koncepcji Hilberta

W ostatnim stuleciu cantorowska teoria mnogości zajęła w ma-tematyce na tyle ważne miejsce, że (...) prawo do istnienia

31Korzystając z pewnej niejednoznaczności hilbertowskiego podziału, przytoczę tu przykład trójek pitagorejskich- trójek liczb naturalnych a, b, c takich, że a2 + b2 + c2 (np. (3, 4, 5). Można tych trójek poszukiwać nie wychylającnosa poza liczby naturalne. Ale można też zaangażować w tym celu liczby zespolone czy - jak napisano w wikipedii- „elementarne narzędzia geometrii algebraicznej”. Zachęcam do odwiedzenia odpowiedniej strony wikipedii.W opisie filozofii transcendentalnej Kanta w internecie znalazło się zgrabne zdanie: „idealizm transcedentalny (...)polega na myślowym wykroczeniu poza sferę przedstawień, aby odkryć to, co je konstytuuje”. Nieco bardziej wduchu formalizmu relację między realnym a idealnym składnikiem matematyki opisano w [109]: „The real statementsare finitistically meaningful, or contentual, but the ideal statements are strictly speaking just meaningless strings ofsymbols that complete and simplify the formalism, and make the application of classical logic possible”.32„(...) the consistency of the comprehensive formalized system is to be proved by using only restricted, uncontro-

versial and contentual finitistic mathematics” [97].33Można spotkać pogląd, że to właśnie aksjomaty i twierdzenia orzekające o istnieniu odróżniają matematykę od

logiki, bo kreują jej świat.34Pyszna anegdota mówi, że to stwierdzenie padło w czasie wywiadu radiowego, którego Hilbert udzielił 8.09.1930

po przedwczesnym opuszczeniu konferencji w Królewcu. Tymczasem ostatniego dnia konferencji wystąpił Kurt Godel,który przedstawił wyniki wykluczające realizację wizji Hilberta. Jego wystąpienie nie spotkało się z większym zrozu-mieniem. Wzmianki o nim trudno ponoć szukać w materiałach pokonferencyjnych. A jedynym(?) który go zrozumiałi docenił był ... John von Neumann.Sentencja „Musimy wiedzieć. Będziemy wiedzieć” umieszczona jest na nagrobku Hilberta w Getyndze.35O szczególnej arogancji nauki u schyłku XIX wieku świadczy taka wypowiedź fizyka Kelvina w 1894 roku: „Nic

nowego nie ma już w fizyce do odkrycia. Pozostały tylko coraz bardziej precyzyjne pomiary.” Metematycy też grzeszą:„There is almost nothing left to discover in geometry”- Kartezjusz, rok 1619.

Page 56: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 55

zyskuje sobie tylko to, co (...) dopuszcza zbudowanie modeluw teorii Cantora. W ten sposób cantorowska teoria stała sięuniwersalnym światem matematyki. - P. Vopenka [77]

Na przełomie XIX i XX wieku matematycy mieli aż nadto dowodów na istnienie różnorakichpowiązań między różnymi dziedzinami matematyki. Zauważyli, że pojęcia i teorie formułowane wjednym języku można próbować tłumaczyć na pojęcia i teorie formułowane w innym. Pozwalało toujrzeć je w nowym kontekście, co nierzadko przyczyniało się do ich głębszego zrozumienia. Stałosię też jasne, że te związki zostaną lepiej rozpoznane, gdy będziemy dysponować uniwersalnymmetajęzykiem - takim, w którym można interpretować różne języki poszczególnych dziedzin mate-matyki. Uniwersalna teoria postulowana przez Hilberta, winna być sformułowana w tym języku36.

Hilbert sam wskazał teorię odpowiadającą jego wizji: miała to być aksjomatyczna teoria zbiorów(teoria mnogości)37.

W [130] teorię mnogości nazwano „urlogiką” i charakteryzowano tak38: to (...) najbardziej prymitywny-formalny język, którego potrzebujemy, gdy chcemy mówić o procesie uprawiania matematyki. Urlogika toten aspekt matematycznej aktywności, która polega na zapisywaniu zdań, zgodnie pewnymi ustalonymiregułami. (...) Tym zdaniom przypisujemy intuicyjnie znaczenia w uniwersum (uniwersach)matematycznych. Niektóre zdania są prawdziwe z uwagi na to, że wyrażają sądy prawdziwe w tymuniwersum. (...)Jeżeli zapytamy matematyka, dlaczego twierdzi, że pewne zdanie φ zapisane na tablicy jest prawdzi-we, to nie odpowie on, że jest prawdziwe, ponieważ jego znaczenie jest prawdziwym stwierdzeniem wmatematycznym uniwersum. Odpowie, że φ jest prawdziwe ponieważ może być udowodnionez „podstawowych zasad” („first principles”). Te podstawowe zasady są nazywane „podstawowymi”ponieważ są postrzegane jako oczywiste (...) .Czy trudno powiedzieć, która zasada jest podstawową zasadą? Jeśli chcemy pozostać na możliwie naj-niższym poziomie to nie powinno to być rozstrzygane jako pytanie matematyczne. Nie wykluczamy, iżkształt listy zasad podstawowych może być przedmiotem sporu. Tak więc (arbitralnie) ustalamy zdania,które nazwiemy aksjomatami urlogiki i uznajemy ich prawdziwość.Jeżeli za urlogikę przyjmiemy pierwszorzędową teorię zbiorów, to zdaniami urlogiki są zdania pierwszegorzędu z jedynym symbolem relacyjnym „∈”. Aksjomatami są aksjomaty ZFC”.

Teoria mnogości i jej język pośredniczą między wyspecjalizowanymi teoriami matematycznymia językiem naturalnym, w którym opisujemy rzeczywistość39.

36Ks. J. Dadaczyński opisał istotę tego programu w trzech, lapidarnie sformułowanych, punktach:- aksjomatyzacja zastanych dyscyplin matematycznych,- budowanie modelu jednej teorii w dziedzinie innej teorii; wówczas można było drugą teorię traktować jako bardziejpodstawową, taką, z której wyprowadzalna jest pierwsza teoria,- wskazanie teorii najbardziej podstawowej, z której wyprowadzalne są pozostałe. [33]37Budowę teorii mnogości zainicjował G. Cantor w latach 70-tych XIX wieku. Historycy matematyki twierdzą,

że hilbertowskie porządkowanie matematyki wynikało po części z chęci obrony cantorowskiej teorii mnogości przedatakami jego przeciwników: „To co robią Weyl i Brouwer to nic innego jak pójście w ślady Kroneckera! Próbują oniuratować matematykę wyrzucając z niej wszystko to, co sprawia kłopot (...) Jeśli zgodzimy się na takie propozycje,to ryzykujemy utratę wielu największych naszych skarbów. (...) Z raju, który stworzył Cantor, nikt nie powinien mócnas wypędzić” - „Uber das Unendliche”, Math. Annalen 95 (1926). Dodajmy, że H. Weil był studentem Hilberta. Ajak pisze P. Raatikainen, Hilbert zapewne nie studiował prac Brouwera... .38Przedrostek „ur” pochodzi z języka niemieckiego i oznacza mniej więcej to samo co „pierwotny”, „początkowy”.39S.Hawkins i L. Mlodinow w ksiażce „The Grand Design” wprowadzili pojęcie „model-dependend realism” o

którym w wikipedii napisano tak: „Model-dependent realism is a view of scientific inquiry that focuses on the role ofscientific models of phenomena. It claims reality should be interpreted based upon these models, and where severalmodels overlap in describing a particular subject, multiple, equally valid, realities exist. It claims that it is meaninglessto talk about the ”true reality” of a model as we can never be absolutely certain of anything. The only meaningfulthing is the usefulness of the model”. Rzecz dotyczy wprawdzie modeli kosmologicznych ale bez ryzyka nadużyciamożna te uwagi odnieść również do matematyki a w szczególności do teorii mnogości.

Page 57: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 56

........

ZFC

Tn

T2

T1

-

PPPq-

1

„real world”

'

&

$

%Teoria mnogości to półprzeźroczysta szyba między śwatem matematyki a rzeczywistością. Z jednej stronysą matematycy, którzy obserwują i opisują świat zza szyby teorii mnogości.Z drugiej strony są adepci matematyki - uczniowie i studenci - którym każemy przejść przez czyściecteorii mnogości zanim dostaną prawo wstępu do matematycznego raju...

Relacja między teorią podstawową a rzeczywistym światem nie interesuje matematyków. Todomena filozofii nauki40. Jednak zapytajmy: czy teoria mnogości wiernie opisuje rzeczywistość?

Nasze rozumienie świata przejawia się nie w zdolności do opisu rzeczywistości ale w zdolnoścido przewidywania przebiegu zjawisk i prognozowania ich rezultatów. Zjawisk, których nie kontro-lujemy i tych, które sami wywołujemy. Język matematki umożliwiający modelowanie rzeczywistościma temu służyć. „A mathematical world is constituted from the perceptual world by intentionalaction; the former represents the latter by replacing it as the object of science”.Bez matematyki niema astromnomii i kosmologii41. Bez matematyki nie istnieje mechanika kwantowa. Dziś ten językwykorzystujemy z powodzeniem już nie tylko w naukach ścisłych ale coraz częściej w naukach spo-łecznych i np. w medycynie. W ten sposób matematyka wyznacza normy racjonalnego działaniaw ciągle powiększanym obszarze naszej aktywności.

Rozwój cywilizacyjny w XX wieku dowiódł, że matematyka teoriomnogościwa nieźle spełnia teoczekiwania.

Pięknie, ale... czy ten świat, który zbudowaliśmy, jest rzeczywiście najlepszy z możliwych? Czy matematy-ka nie ponosi części odpowiedzialności za to, że jest on taki, jaki jest? Skąd pewność, że inna matematykanie zafundowałaby nam lepszego świata?

Ale właściwie dlaczego to teoria zbiorów ma być teorią uniwersalną?Kognitywiści kojarzą zbiór ze „schematem wyobrażeniowym pojemnika” [68]42. To wyjątkowo uni-wersalny schemat. Kolekcja, mnogość, zestaw, komplet to - w języku potocznym - synonimy słowazbiór. A inne - jak np. ciąg, układ - to zbiory wzbogacone o pewną strukturę.

Hilbert chciał finalnej teorii matematycznej. Doskonałej, czyli ockhamowsko oszczędnej. Dlate-go ów uniwersalny schemat wyobrażeniowy musiał znaleźć swój odpowiednik w języku tej teorii.Jednak to, że stał się on jedynym pojęciem podstawowym (pierwotnym) języka teorii mnogościbyło arbitralnym wyborem jej twórców. Dla jednych genialnym, dla innych mniej.

Wszystko co niezmienne, może być łatwo postrzegane jako zbiór. Ale twórcy teorii mnogości chcieli objąćtym pojęciem również „byty”, których istotą jest zmienność. I tak funkcja, zwykle kojarzona z procesem,zmianą, w teorii mnogości jest tylko (specjalnym) zbiorem.

Jeżeli tak, jeżeli zbiór to tylko schemat wyobrażeniowy, to dlaczego mamy ograniczać się dozbiorów skończonych? Hilbert mógłby powiedzieć: „jeśli uznanie istnienia - wprowadzenie do języka40D.C. Dennet w „Od bakterii do Bacha - o ewolucji umysłów” rozróżnia obraz manifestujący się świata (wyrażany

w języku naturalnym) i jego obraz naukowy. A Wittgenstain pisał: „W życiu samo twierdzenie matematyczne niejest nam przecież nigdy potrzebne; używamy go tylko po to, by ze zdań, które nie należą do matematyki, wnosić oinnych, które też do niej nie należą” Tractatus 6.2111.41Jednym z pierwszych osiągnieć matematyków była umiejętność obliczenia daty i godziny zaćmienia Słońca co

niecnie wykorzystywała podła władza (B. Prus, Faraon).42Kognistywistyczny termin „schemat wyobrażeniowy” w [13] objaśnia się tak: „(...) umysł wykorzystuje (...)

wiele schematów wyobrażeniowych takich jak schemat część-całość (...) schemat centrum-peryferie, schemat planpierwszy-tło, schemat pojemnika.”

Page 58: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 57

- zbiorów nieskończonych nie prowadzi do sprzeczności, to dlaczego mamy je odrzucać?Wyobrażenie wszystkich liczb naturalnych jako nowej „jedności” - zbioru - nie budzi większegosprzeciwu. Co więcej, skoro dzielimy świat stwierdzeń matematyki na „real -” i „ideal statments”,to lokując zbiory nieskończone w sferze matematyki idealnej, unikamy oskarżeń o ingerencję w świat„prawdziwej” matematyki.

Można też uczynić nieskończoność centralnym pojęciem matematyki43.Uznanie nieskończoności aktualnej zadecydowało o kształcie matematyki XX wieku. A przecież

wystarczyło tylko nieco inaczej interpretować równanie „niesprzeczność = istnienie” by zanegowaćistnienie zbiorów nieskończonych jako sprzeczne z prawem obowiązującym w realnym świecie, wktórym „zbiór nie może być równoliczny ze swym właściwym podzbiorem”44. Hilbert i Cantorignorowali ten argument gdyż, jak ustaliliśmy, w ich koncepcji „niesprzeczność” była wewnętrznympojęciem matematycznym a nie zgodnością z doświadczeniem świata obiektów skończonych.

Kłopoty z nieskończonością

Stanowcze poglądy Hilberta przyjęto zapewne z ulgą, ochoczo akceptując pogląd, że zbiorowyrozsądek pozwoli uniknąć sprzeczności i tworzenia fałszywych bytów45. Koncepcja Hilberta to „ładi porządek”.Jednak rozwój teorii mnogości przyniósł zaskakujące wyniki które pokazały, że projektuHilberta nie da się w pełni zrealizować.

Oto jeden z nich. Cantor mówił: „zbiorem jest spojenie w całość określonych rozróżnialnychpodmiotów naszej poglądowości czy myśli”. Jednak szybko okazało się, że interpretacja pojęcia„zbiór” w duchu teorii mnogości, zmusza do zapomnienia tej cantorowskiej deklaracji46. I to zasprawą ... Cantora, bo to on udowodnił fundamentalny dla teorii mnogości fakt:

„nieskończony zbiór liczb naturalnych ma nieprzeliczalnie wiele podzbiorów”

Nieprzeliczalność rodziny podzbiorów liczb naturalnych oznacza, że nie można tych podzbiorówponumerować („nazwać”) liczbami naturalnymi. Jest ich więcej niż liczb naturalnych. To innyrodzaj nieskończoności.Dlaczego to jest kłopot? Otóż wszystkie opisy, które można sporządzić np. w języku polskim, możnaponumerować. Wyobraźmy to sobie: opis to książka. Może długa, ale zawsze zawierająca tylkoskończenie wiele znaków (liter, znaków interpunkcyjnych, spacji). Możemy te książki-opisy ustawićw kolejkę. Najpierw segregujemy je według długości (liczby znaków) zaczynając od najkrótszych.Potem każdy ze skończonych zbiorów opisów o tej samej długości porządkujemy alfabetycznie.W ten sposób każdemu opisowi można przypisać jego numer - liczbę naturalną47.

Wszystkie opisy można ponumerować, a rodzinę wszystkich podzbiorów liczb naturalnych nie.To musi oznaczać, że nie każdy taki podzbiór ma identyfikujący go jednoznacznie opis!

Jak „spoić w całość” coś, czego nie potrafimy nazwać, opisać?Teoria mnogości każe akceptować istnienie zbiorów, które nie mają unikatowych opisów w jakimkolwiekjęzyku... I nakazuje uznać różne rodzaje nieskończoności...Teoria mnogości wymaga głębokiej wiary...

Gdyby szło tylko o to, że zbiorów złożonych z liczb naturalnych jest nieprzeliczalnie wiele, tomożna by na ten wynik machnąć ręką - kogo interesuje „zbiór wszystkich podzbiorów N” - obiektleżący, być może, gdzieś na peryferiach matematyki. Ale okazało się - a pokazał to również Cantor- że nieskończoność zbioru liczb rzeczywistych jest tego samego rodzaju co nieskończoność zbioru

43Nieskończoność w teorii mnogości definiujemy pozytywnie - „zbiór jest nieskończony, gdy jest równoliczny zeswym właściwym podzbiorem”. A skończoność negatywnie - zbiór jest skończony, gdy nie jest nieskończony. Tostawianie wozu przed koniem początkowo szokuje studentów ale ostatecznie sprzyja akceptacji nieskończoności.44To pogląd Galileusza. Również Leibniz uważał to za argument przeciw uznaniu „nieskończonych jedności”.45„Ze wszystkich dóbr rzadkich rozum jest dobrem najsprawiedliwiej podzielonym, bowiem nikt nigdy nie uskarża

się na brak rozumu” - M. Montaigne (wg innych źródeł autorem tego stwierdzenia jest Kartezjusz).46Wbrew naiwnym wyobrażeniom, aksjomatyka teorii zbiorów nie formułuje warunków niezbędnych do tego, by

„coś” nazwać zbiorem. Czym jest zbiór musimy powiedzieć dopiero wtedy, gdy wskazujemy model teorii zbiorów.47Powtarzam tu to, co mówiłem o efektywnej numeracji elementów generowanych przez strukturę rekurencyjną.

Page 59: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 58

podzbiorów N - zbiór R jest nieprzeliczalny. Tego matematyka nie mogła zlekceważyć.Liczby rzeczywiste tworzą zbiór nieprzeliczalny, nie mogą mieć indywiduowych nazw. Nie mogą

być nazwami. Czym więc są? Liczba rzeczywista to pojęcie sformułowane w języku teorii mno-gości, które ma nieprzeliczalnie wiele desygnatów. Stwierdzenie, że te desygnaty tworzą aktualnieistniejący nieprzeliczalny zbiór to tylko konsekwencja uznania teoriomnogościowych paradygmatów.

Cantor uznał, że ujawnienie jakościowej różnicy między nieskończonością zbiorów N i R to niekłopot, ale odwrotnie: to drzwi do nowych, wspaniałych światów. Bo stąd wynika, że w matematyceteorimnogościowej mamy nie jedną, ale nieskończenie wiele różnych rodzajów nieskończoności...48.Cantor odkrył dla nas niepostrzegalny zmysłowo „matematyczny kosmos”, transcedentny światmatematyki. Raj.

Ale ten wynik stał się też źródłem poważnych kłopotów. Hilbert chciał, by uniwersalny systemaksjomatów był teorią pełną: sądy prawdziwe winny być dowodliwe, a dla sądu nieprawdziwegodowodliwe winno być jego zaprzeczenie. Jeśli tak, to w szczególności powinniśmy umieć rozstrzygnąćsłynny dylemat - hipotezę continuum:

„czy między przeliczalną nieskończonością liczb naturalnych a nieprzeliczalną nieskończonościązbioru podzbiorów liczb naturalnych jest jakaś istotnie różna od nich nieskończoność?”

To pytanie stało się przekleństwem Cantora i dramatycznie zaważyło na jego życiu. Jego (Can-tora) próby rozwiązania tego problemu okazały się bezowocne. Dopiero kilkadziesiąt lat poźniejGodel a później Paul Cohen udzielili niemiłej (wyznawcom teorii mnogości) odpowiedzi: możnaprzyjąć zarówno odpowiedź pozytywną jak i negatywną. „Można przyjąć” w sensie Hilberta: żadnez tych rozwiązań nie jest sprzeczne z aksjomatami teorii zbiorów...

Skoro tak, skoro teoria mnogości nie jest pełna, to można ją rozszerzyć na dwa różne sposoby:przyjmując jako dodatkowy aksjomat stwierdzenie o istnieniu tego szczególnego rodzaju nieskoń-czoności, bądź aksjomat temu zaprzeczający. Którą i na jakiej podstawie mielibyśmy uznać zauniwersalną teorię matematyki?

Żadną, bo dzięki wynikom Godla wiemy, że ani pierwsza ani druga nie może być pełna!

Nierozstrzygalność hipotezy kontinuum oznacza, że równość „dowodliwość (w ZFC) = prawdziwość” jestniemożliwa, jeśli tylko akceptujemy prawo wyłączonego środka które mówi, że albo zdanie φ albo jegozaprzeczenie jest prawdziwe.Matematyki nie da się sformalizować tak, jak chciał Hilbert49..

Teoria mnogości nie jest dekalogiem matematyki. Więcej - takiego dekalogu nie ma. Uniwer-sum matematyczne jest ponad to, co potrafimy opisać i objąć finitarną kontrolą. Wszelkie teoriematematyczne obejmują tylko ten fragment świata, który wyznacza ich język.

Dodatek: o wspomnianym wcześniej odkryciu Cantora

Cantora „zmagania z nieskonczonością” rozpoczęły się od badania podzbiorów liczb rzeczywistych.Jedno z jego odkryć dotyczyło zależności między przeliczalnością podzbioru P ⊆ R a przeliczalno-ścią zbioru P ′ którego elementami są liczby graniczne zbioru P - liczby a ∈ R takie, że w każdymotwartym odcinku (a− 1

n , a+ 1n) znajduje się liczba b ∈ P różna od a 50.

Nietrudno(?) zauważyć, że jeśli zbiór P ′ jest przeliczalny, to P też jest przeliczalny51 . Niecotrudniej pokazać, że jeśli n-ta iteracja operacji P P ′ (oznaczana przez P (n)) jest zbiorem pustymto P jest przeliczalny52.

48Wynika to raczej z dowodu tego twierdzenia (który przedstawię później).49Dla ścisłości: przypisywanie Hilbertowi poglądu, że oczekiwał pełności systemu aksjomatów ZFC w dzisiej-

szym znaczeniu tego słowa jest drobnym nadużyciem. „...The rather imprecise notion of the ‘completeness’ ofthe axiomatisation, which involves, loosely, showing that the axioms can prove all that they „ought” to prove”.(http://plato.stanford.edu/entries/zermelo-set-theory).50Ważna uwaga: te badania poprzedziły udowodnienie nieprzeliczalności zbioru R.51P = (P ∩ P ′) ∪ (P \ P ′) a ten drugi zbiór jest zawsze przeliczalny.52P (1) = P ′, P (n+1) = (P (n))′. Zauważ, że P (n) ⊇ P (n+1) i P ′ = P ′ \P (2) ∪ (P (2) \P (3) ∪ · · · ∪P (n) jeśli P (n+1) = ∅

. Zatem P ′ jest skończona sumą zbiorow przeliczalnych czyli jest przeliczalny.

Page 60: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 59

To nie koniec. To, co naprawdę fascynujące, dopiero się zaczyna. Cantor „przedłużył” konstrukcjęiteracyjnego ciągu zbiorów (P (n) : n ∈ N) dodając do niego zbiór P (ω) =

⋃(P (n) : n ∈ N) a

następnie zbiory P (ω+1) = (P (ω))′, . . . , P (ω+n) = . . . , P (ω+ω) = . . . ,. Teraz nietrudno zauważyć, żejeśli jakikolwiek ze zbiorów Pα jest pusty, to P jest przeliczalny53.Pięknie, ale ... czym są kolejne indeksy oznaczane symbolami ω, ω + 1, . . .?. Odpowiedź Cantorabyła równie genialna co odważna: to są liczby podobne do liczb naturalnych w tym sensie, że teżsłużą do kolejkowania, porządkowania - ale nie zbiorów skończonych lecz nieskończonych.To są liczby porządkowe.

Cantor zapewne uważał, że „odkrył” istnienie liczb porządkowe.Pozwolę sobie być innego zdania: te liczbyto jego genialna kreacja.

Tak narodziła się teoria mnogości54.

4.3 Opozycja

Dla wielu nieskończenie wiele nieskończoności to raj. Ale nie dla wszystkich...

”I don’t know what predominates in Cantor’s theory — philosophy or theology, but I am sure that thereis no mathematics there.” - Leopold Kronecker55.„I protest against the use of infinite magnitude as something completed, which is never permissible inmathematics” [83] - Carl F. Gauss.„Teoria mnogości Cantora to obłęd, perwersja, z której matematyka się kiedyś wyleczy” - H. Poincare.„Czytanie prac Cantora wydaje mi się prawdziwą torturą ... nikt z nas nie ma ochoty iść jego śladem” -Ch. Hermite.„With the work of Dedekind, Peano and Cantor above all, complete infinity was accepted into mainstreammathematics. Mathematics became a faith-based initiative” - E. Nelson [83]..

Cantor wierzył w nieskończoność. Rozróżniał jej trzy rodzaje: absolut - realizowany tylko wBogu, nieskończoność w świecie stworzonym i nieskończoność in abstracto będąca wielkością mate-matyczną. Pisał: „W każdym z tych przypadków na pytanie o możliwość istnienia nieskończonościaktualnej można odpowiedzieć „tak” lub „nie”; w ten sposób otrzymujemy osiem różnych punktówwidzenia, (...) spośród nich reprezentuję osobiście ten, który we wszystkich trzech przypadkachudziela odpowiedzi bezwzględnie pozytywnej”56.Niemal sto lat później Chaitin pisał: Teoria zbiorów nieskończonych jest w rzeczywistości teologią.(...) Celem Cantora było zrozumienie Boga. Bóg jest transcedentny. Teoria nieskończonych zbiorówma swą hierarchię coraz to większych nieskończoności.(...) Bóg jest daleko, ponieważ jest nieskoń-czony i transcedentny. Możemy próbować iść w Jego kierunku. Ale nigdy nie dojdziemy, bo pokażdej nieskończoności jest od niej większa... [19]..

Zapewne to właśnie cantorowską wizję matematyki mieli na uwadze kognitywiści Lakoff i Nunezpisząc o „matematycznym romantyźmie”57 i wskazując - między innymi - na takie cechy roman-tycznego postrzegania matematyki:

53To jedynie łatwiejsza część twierdzenia Cantora. Odsyłam do wikipedii na stronę „ordinal numbers - history”.54Ten wynik został opublikowany we wrześniu 1872 roku. Jednak np. A. Kanamori w opracowaniu Set theory from

Cantor to Cohen (internet) nie negując znaczenia tego rezultatu pisze, że datą narodzin teorii mnogości jest grudzień1873 „when Cantor established that the real numbers are uncountable”.55Opis konfliktu Kroneckera z Cantorem można znaleźć w książce H. Helmanna „Great feuds in mathematics: ten

of the liveliest disputes ever”56Cytuję za artykułem M. Ruckiej „Dotknąć i zobaczyć nieskończoność” dostępnym w internecie. Cantorowska

hierarchia nieskończoności sformalizowana jest jako „skala alefów”. Cohen wskazywał na symboliczny charakter tejnazwy - ℵ to pierwsza litera alfabetu hebrajskiego. Dla oznaczenia uniwersum Cantor używał ostatniej litery tegoalfabetu - taw [22]. A Kant pisał: Wieczność nie wystarczy do objęcia przejawów Istoty Najwyższej, jeśli nie towarzyszyjej nieskończoność przestrzeni.”57W [68] - romance of mathematics. J. Pogonowski tłumaczy ten termin jako „matematyczną mitologię”.

Page 61: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 60

- mathematics is transcendent, namely it exists independently of human beings, and structu-res our actual physical universe (...). Mathematics is the language of nature, and is the primaryconceptual structure we would have in common with extraterrestrial aliens, if any such there be,

- mathematical proof is the gateway to a realm of transcendent truth58.

Docenienie osiągnięć matematyki teoriomnogościowej nie musi oznaczać uznania, że to ostateczna ijedynie słuszna wizja matematyki. Powtarzając jak mantrę hilbertowskie zrównanie cantorowskiejteorii z matematycznym rajem, akceptujemy granice matematyki tak kategorycznie wytyczone przeztę teorię. To wątpliwe, jak każde apriorycznie przyjęte samoograniczenie59.

Matematyka XX wieku oparta na teorii mnogości to matematyka modelowań. To była po części koniecz-ność spowodowana lichotą narzędzi obliczeniowych, jakimi wtedy dysponowaliśmy.Szaleńczy rozwój technologii komputerowych w ostatnim półwieczu przełamał te bariery. Funkcja po-nownie stała się bardziej procesem niż teoriomnogościową relacją „wejście-wyjście” między argumentema wynikiem. Zaczęliśmy troszczyć się o efektywność tego procesu.Dlatego musimy zajrzeć do „czarnejskrzynki” w której realizowana jest funkcja-proces.Czy matematyka stanie się ponownie nauką o procesach obliczeniowych60?

4.4 Czy jest coś oprócz języka?

„Jeśli ktoś widzi to (teorię mnogości - GJ) jako raj, to dlaczego ktoś inny nie może uznać tego zażart?”.To słowa Wittgensteina, autora „Traktatu logiczno-filozoficznego”, który - jak pisze wikipedia -„jest ambitnym projektem ostatecznego ustalenia niepodważalnych relacji między językiem i rze-czywistością (...) a także ustaleniem granic możliwości poznawczych filozofii wyrażanej w perfek-cyjnie logicznym języku”61.

Skąd tak ostra, wręcz brutalna, jak na standardy świata nauki, wypowiedź? Wśród tez jegotraktatu, znalazła się, opatrzona numerem 5.6, następująca:

„Granice mojego języka wyznaczają granice mojego świata”62.

Hilbert chciał poprzez rygorystyczny formalizm i pojedynczą fundamentalną teorię wiernie od-wzorować matematyczne uniwersum. „Wiernie”, czyli tak, by pojęcia definiowane w języku uniwer-salnej teorii miały jedną jedyną interpretację. Wtedy opis formalny jest jednocześnie kreacją. Tojest sens hilbertowskiej równości „niesprzeczność = istnienie”. Tymczasem zdaniem Wittgensteina:

Język nie kreuje matematycznego uniwersum. Może je tylko opisywać. Zawsze w części, a nie w całości.

Nie oczekujmy od filozofa Wittgensteina matematycznych dowodów jego tez. Paradoksalnie,takich dowodów dostarczyli sami matematycy. Pojawiły się tzw. twierdzenia limitacyjne wskazujące58Więcej o poglądach G.Lakoffa i R.E.Nuneza w [68]. Warto też przeczytać artykuł J.Pogonowskiego [95] polemi-

zujący z poglądami tych kognitywistów.59„Mantra (...). Jej powtarzanie ma pomóc w opanowaniu umysłu, zaktywizowaniu określonej energii, uspokojeniu,

oczyszczeniu go ze splamień. Szczególnie istotną sprawą jest bezpośredni przekaz z ust wykwalifikowanego nauczyciela(guru), gdyż tylko wtedy mantra uzyskuje właściwą moc. (wikipedia)60Ponownie, gdyż „przedgrecka” matematyka Egiptu i Babilonu była matematyką obliczeń. O współistnieniu dwóch

matematycznych strumieni w [36],cytując P.Henriciego i nazywając te strumienie, nie wiedzieć czemu, algorytmicz-nym i dialektycznym, napisano: „Matematyka dialektyczna jest nauka ściśle logiczną, gdzie zdania są prawdziwe lubfałszywe a obiekty o zadanych własnościach istnieją albo nie. Matematyka algorytmiczna jest narzędziem rozwiązy-wania zagadnień (...). Matematyka dialektyczna skłania do kontemplacji, algorytmiczna do działania. Ta pierwszarodzi zrozumienie, ta druga - wyniki.61„Traktat” ukazał się w 1921 roku. Było to jedyne dzieło Wittgensteina opublikowane za jego życia. Wittgnstein

nadał swojemu dziełu wyjątkową formę: jego treść to zaledwie siedem lapidarnie sformułowanych tez, wspomaganychprzez kilkanaście tez dopełniających. Gdyby mierzyć znaczenie dzieła proporcją między głębokością myśli a zwięzłościąsformułowań, to, jak sądzę, nie ma ono sobie równych.62„Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt”. H. M. McLuhan (1911 – 1980), twórca teorii

komunikacji, powiedział coś zbliżonego: The medium is the message” - środek przekazu jest przekazem.

Page 62: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 61

nieprzekraczalne granice języka matematyki. Jest ich sporo. Zalicza się do nich wyniki Godla,twierdzenia Lowenheima-Skolema, prace Turinga, twierdzenie Łosia czy też wynik Cohena - żepoprzestaniemy na niektórych63.

Tak oto zbliżyliśmy się do zrozumienia poglądów matematycznych nominalistów. Nominalizmpozostaje w opozycji do matematycznego realizmu. Według nominalistów pojęcia matematyczne tonazwy - „flatus vocis”64. Odrzucają założenie realistów (platoników), że tym pojęciom towarzysząbyty. Źródłem matematyki jest refleksja nad językiem rozumianym jako narzędzie poznania. Takichpojęć jak trójkąt, okrąg czy kwadrat starożytni Grecy używali długo przed Euklidesem, mierzącco trzeba było zmierzyć i wznosząc wspaniałe budowle. Dodajemy i mnożymy też od niepamięt-nych czasów. Język rachmistrzów i mierniczych został przejęty, uporządkowany i wzbogacony przezmatematyków. Tak powstała geometria i arytmetyka. I inne teorie65.

Ale matematyka, zgodnie ze wskazaniem Kanta, „nie ogranicza swojego poznania do obszarumożliwego doświadczenia. Dąży do poznania rzeczy samych w sobie, dokonuje operacji abstra-hujących i systematyzujących, czego rezultatem są idee”. W ujęciu nominalistycznym oznacza toprzyzwolenie na tworzenie języków, pojęć i teorii wysoce abstrakcyjnych.

Nominalista prowokowany do dyskusji o istnieniu zbiorów nieskończonych odpowie zapewne jakGauss: „Infinity is nothing more than a figure of speech which helps us talk about limits. Thenotion of a completed infinity doesn’t belong in mathematics. In other words, the only access wehave to the infinite is through the notion of limits and hence, we must not treat infinite sets as ifthey have an existence exactly comparable to the existence of finite sets” 66.

Przykład: prędkość to stosunek długości drogi do czasu podróży. Tak wyliczymy średnią pręd-kość podróży z miasta A do B. Ale wszyscy „rozumiemy” czym jest prędkość chwilowa i wierzymy,że licznik samochodu nam ją pokazuje. Czy rzeczywiście? Prędkość chwilowa to wielkość graniczna wstosunku do prędkości średniej. Jej zdefiniowanie wymaga nieskończonego skracania odcinka czasu,w którym dokonujemy pomiaru średniej prędkości. A to, jak wiemy, w rzeczywistości fizycznej jestniemożliwe. Prędkość chwilowa to abstrakcja, należąca do języka modelowania matematycznego67

Nominalistę nie interesuje pytanie o istnienie zbioru i innych obiektów matematycznych. Oneistnieją jako pojęcia językowe. To, co należy robić, to poszukiwać związków między nimi.

Nie trzeba pytać, co opisuje tak rozumiana matematyka. Ona opisuje to samo, co języki naturalne. Alerobi to bardziej dogłębnie, próbując dociec „istoty rzeczy”. I to w sposób, który zapewnia kontrolę nadprocesem poznania i obiektywny charakter uzyskanej tak wiedzy.

Patrząc na dzieło Cantora i Hilberta z tej perspektywy można uznać, że chodziło właśnie o językumożliwiający budowę jednorodnej i uniwersalnej siatki pojęć zdolnej pokryć całą matematykę. Inikt przy zdrowych zmysłach nie powie, że taka interpretacja ich dzieła umniejsza jego znaczenie.Matematyka potrzebowała takiego spoiwa by ułatwić transfer idei między jej różnymi obszarami. Ztego punktu widzenia teoria mnogości to genialne osiągnięcie. Bo, jak mówił Poincare: „Matematykajest sztuką nadawania tej samej nazwy różnym rzeczom”68.Fiasko pełnego programu Hilberta niczego tu nie zmienia.J. H. Friedman na swojej stronie internetowej napisał o teorii zbiorów tak: „This (...) serves as ourbest scientific model of mathematical practice” i dalej: „The fact that ZFC is incomplete is totallyirrelevant to whether it is a model of mathematical practice”.63O tych twierdzeniach będzie mowa w dalszej części skryptu.64„Flatus vocis” - wyrażenie słowne. Termin wprowadzony przez średniowiecznych nominalistów.65Kognitywiści twierdzą, że pojęcia matematyczne odwzorowują pojęcia języka potocznego [68]. Np. matematyczne

pojęcie zbioru odpowiada pojęciu „zespołu przedmiotów zgromadzonych w ograniczonym fragmencie przestrzeni” [13].66http://en.wikipedia.org/wiki/Controversy over Cantor’s theory67Jeśli długość drogi przebytej w czasie t opisuje funkcja f(t), to średnią prędkość między chwilami t0 i t1 opi-

suje iloraz f(t1)−f(t0)t1−t0

. Prędkość chwilowa w chwili t0 to wielkość graniczna, do jakiej zmierza ten ułamek przy t1zbiegającym do t0 czyli... pochodna funkcji f w punkcie t0.68W przeciwieństwie do poezji, która jest sztuką nadawania różnych nazw tej samej rzeczy” - jak dodają niektórzy.

Page 63: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 62

Zdetronizowana przez Godla i Cohena teoria mnogości pozostaje organizatorem matematyki69.B. Russell w „Principia Mathematica” napisał: „Matematyka jest zupełnie obojętna wobec

zagadnienia, czy jej przedmioty istnieją”. To nie rozstrzyga sporu, ale lokuje go tam, gdzie jegomiejsce - poza matematyką70. Nie jest ważne, skąd płynie motywacja. Ważne są rezultaty.

„Sztuka to kłamstwo, które pozwala zbliżyć się do prawdy” - Pablo Picasso.

Czy powiedzenie tego samego o matematyce jest niewybaczalnym świętokradztwem?

4.4.1 O konstruktywiźmie Brouwera (subiektywnie)

To exist in mathematics means to have been constructed by intuitionL. Brouwer

Przyjęliśmy, upraszczając, że wyróżnikiem matematyki Cantora i Hilberta jest uznanie nieskoń-czoności aktualnej. Czy można myśleć o matematyce bez tego założenia?

Matematyka ograniczająca nieskończność do struktur rekurencyjnych jest bliska postulatommatematycznego finityzmu. Finityści uznają istnienie obiektów matematycznych gdy dane są „bez-pośrednio” lub dają się skonstruować w skończonej liczbie kroków71. To, zdaniem wielu, zbyt ra-dykalne, bo nadmiernie zubaża matematykę.

Matematyczny konstruktywizm niejedno ma imię72. Spośród różnych jego odmian najbardziejintrygujaca i inspirująca jest koncepcja matematyki L. Brouwera73.

Matematyk ze szkoły hilbertowskiej ma spory kłopot ze zrozumieniem idei Brouwera. Rzecznie w tym, że neguje on ten czy inny aksjomat teorii mnogości. On neguje wszystko: platońskietwierdzenie, że obiektami matematyki są byty idealne i wiecznotrwałe, euklidesowe założenie o moż-liwości aksjomatycznego opisu matematyki (lub jej fragmentu) i hilbertowskie równości: założoną„niesprzeczność = istnienie” i oczekiwaną „prawdziwość = dowodliwość”.Szukając sposobu ukazania tej fundamentalnej różnicy posłużymy się - jakby inaczej - metaforą.

Malarstwo (...) posługuje się środkami plastycznego wyrazu, np. barwną plamą i linią (...).Poszukiwanie odmiennych form wyrazu przyczynia się do kształtowania nowych oryginalnych kie-runków i niezwykłej różnorodności dzieł malarskich. - to jest twórczość.

Krytyka sztuki (...) zajmuje się budowaniem kontekstu myślowego nowych zjawisk artystycz-nych, wspomaganiem teoretyczną refleksją oraz interpretacją działań artystycznych; (...) towarzyszyzjawiskom sztuki na zasadzie współuczestnictwa - to jest wiedza o malarstwie.

Według Brouwera twórczość matematyczna jest bardziej sztuką niż „aktywnością społeczną”. To sumaindywidualnych dokonań nielicznych geniuszy a nie rezultat codziennej dłubaniny rzeszy rzemieślników

69G. Kreisler, wybitny logik austriacki, sugeruje by rozróżniać podstawy matematyki od jej organizacji.70Russell to - obok G. Frege i A.N. Whiteheada - jeden z twórców logicyzmu, który widzi istotę matematyki w

badaniu związków przyczynowo-skutkowych między zdaniami (stwierdzeniami) a nie w dyskusjach o zasadności przy-jęcia takich czy innych aksjomatów egzystencjalnych. Stąd niechęć Russella do dyskusji o aksjomatach dekretującychistnienie nieskończonych obiektów. Krakowskim targiem godził się, by ceną za niewłączenie „aksjomatu o istnieniunieskończoności” - nazwijmy go ∃N - do zbioru aksjomatów, była zgoda na rozpatrywanie tez w postaci implikacji∃N → φ - „jeśli założymy istnienie ... , to ...”71Finitism may be characterised as based on the concept of natural number (or finite, concretely representable

structures) which is taken to entail the acceptance of proof by induction and definition by recursion [124]72Obszerną informację o różnych odmianach konstruktywizmu można znaleźć w [124] i [123]. Upraszczając, wszyst-

kich konstruktywistów łączy odrzucenie „zbioru” jako pojęcia pierwotnego matematyki. Np. Bishop uważał, że: ” (...)the notion of set is specified by stating that a set has to be given by a description of how to build its elements andby giving a binary relation of equality, which has to be an equivalence relation”..73Brouwer rozpoczął karierę matematyka serią znakomitych rezultatów uzyskanych w ramach matematyki hilber-

towskiej. Ale to właśnie te wyniki stały się punktem wyjścia do jego własnej koncepcji matematyki. Hilbert niezbytprzychylnie patrzył na te pomysły. Do tego stopnia, że w 1928 roku doprowadził do wykluczenia Brouwera z redakcji(editorial board) najbardziej prestiżowego czasopisma tamtych czasów„Mathematische Annalen” [88].

Page 64: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 63

- robotników matematyki.Matematyki - twórczości matematycznej - nie można się nauczyć. Możemy nauczyć się jej języka, poznaćpojęcia i metody badawcze związane z tą czy inną jej dziedziną. Ale stąd daleko do twórczości74.

Brouwer dystansował się od matematycznego formalizmu. „Mathematics (...) is in principleindependent of language. Communication by language may serve to suggest similar thought con-structions to others, but there is no guarantee that these other constructions are the same”75.Każdy matematyk potwierdzi, że formalne zapisanie wyniku matematycznego to tylko ostatni inajłatwiejszy etap pracy. Nikt też nie zaprzeczy, że w twórczej grupie matematyków może wytworzyćsię swoisty „team spirit” a jej członkowie mogą przekazywać sobie nie do końca zwerbalizowane idee.Tak jak muzycy w czasie jam session, o piątej nad ranem76.

Nie tylko Brouwer odnosił się nieufnie do roli języka w nauce. Wątpili już starożytni Grecy77. WXVIII wieku von Humboldt78 pisał: „Człowiek postrzega głównie przedmioty wśród których żyje,a ponieważ jego odczucia i działania zależą od jego precepcji, rzec można że odbiera je wyłącznietak, jak przedstawia je język. (...) każdy społeczny język rysuje magiczny krąg wokół ludzi, doktórych należy, krąg, z którego nie ma ucieczki oprócz przejścia do innego kręgu”79. Jednak o iledla Humbolta (i Wittgensteina) ograniczenia wyznaczane przez język są obiektywną i nieusuwalnąkoniecznością, to Brouwer chciał uwolnienia twórczości matematycznej od tych ograniczeń.

„Brouwer (...) stara się przejść między Scyllą platonizmu a Charybdą formalizmu” (StanfordzkaEncyklopedia Filozofii). Jego stosunek do formalizmu już poznaliśmy. A o platoniźmie - matema-tycznej transcedencji - jego uczeń i kontynuator, duński logik A.Heyting pisał: „We do not attributean existence independent of our thought; i.e., a transcendental existence to the integers or to anyother mathematical object”80. Pozbawiony tych fundamentów matematyk bezradnie pyta - jeśli nieto (jest matematyką), to co?

„Mathematical objects, except some initial mental intuitions, are constructions of thehuman mind, based on these initial intuitions” [88].

Matematyka Hilberta to matematyka pojęć. Matematyka Brouwera to matematyka konstrukcji.Brouwer uważał, że mamy wrodzoną zdolność do tworzenia takich konstrukcji i ich mentalnejakceptacji. Ta zdolność - jak wszystko na tym świecie - nie jest dana wszystkim „po równo”. Cowięcej: możemy błądzić. Dlatego nieco poźniej Brouwer wprowadził korektę81 - zaczął mówić o

74„Nie jestem językoznawcą. Jestem znawcą języka” - J.Tuwim. Analitycy twórczości Brouwera dostrzegają w jegokoncepcji wpływy E. Husserla (1859-1938), twórcy fenomenologii, który uważał intuicję za źródło poznania i z rezerwąodnosił się do roli języka w poznaniu. To zdanie może sugerować, że wiem co to fenomenologia. Niestety.Sugestia, że dla Brouwera matematyka jest bardziej sztuką niż nauką jest „autorska” i stworzona wyłącznie na użytektego tekstu. Uwaga ogólna: ten podrozdział nie jest obiektywnym opisem intuicjonizmu Brouwera - nie stać mnie nato. To tylko zapis tego, co zdołałem „poukładać” próbując rozpoznać, czym jest intuicjonizm.75To nie wypowiedź Brouwera ale cytat z [124] gdzie znajdujemy opis podstawowych założeń koncepcji Brouwera.

Sam Brouwer pisał: „Język formalny towarzyszy matematyce tak jak mapy pogody towarzyszą zjawiskom atmosfe-rycznym”. „Logika daje pewność, ale niczego nie kreuje. Intuicja jest kreatywna, ale zawodna.” - to z kolei stwierdzeniePoincare, uznawanego przez Brouwera za pre-intuicjonistę.76To kolejna użyteczna metafora: nikt przecież nie będzie twierdził, że tworzenie muzyki to umieszczanie kropek

na pięciolinii... Nikt więc nie powinien twierdzić, że twórczość matematyczna to „pisanie dowodów”.77Sokrates: jasne jest, że należałoby szukać jakichś innych rzeczy oprócz nazw (...), które ukazywały by nam bez

nazw, które z nich są prawdziwe.Kratylos: Tak mi się zdaje.S.: Jeśli tak, to wydaje się możliwe poznanie bytów bez nazw.K.: Widocznie. (...)S.: Jeśli więc możliwie najlepiej można poznać rzeczy poprzez nazwy i można je również poznać przez nie same, toktóra z tych form poznania będzie piękniejsza i bardziej prawidłowa? (Platon, Kratylos)78Wilhelm von Humboldt (1767 - 1835), niemiecki filozof i językoznawca79Cytuję za M. McLuhanem („Galaktyka Gutenberga”), który z kolei cytuje za E.Cassierem („Language and

Myth”).80The intuitonist foundations of mathematics, in Philosophy of mathematics: selected readings, P. Benacerraf and

H. Putnam, Editors. 1983, Cambridge University Press).81Koncepcja Brouwera nie powstała w wyniku jednorazowego „aktu stworzenia”. Powstawała przez lata i była

modyfikowana. Nie ułatwia to jej prezentacji...

Page 65: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 64

konstrukcjach kreowanych przez idealnego matematyka: the objects of mathematics are mentalconstructions in the mind of the (ideal) mathematician. Only the thought constructions ofthe (idealized) mathematician are exact.” [124]82. Nie jest to jednak w żadnym razie wprowadzaniewątków transcedentnych, a jedynie próba obiektywizacji pojęcia matematycznej konstrukcji.

Osnową tych konstrukcji są pewne podstawowe, pierwotne pre-intuicje - „primordial intuitionof mathematics” [3]”. A wśród nich ta najważniejsza - związana z liczbami naturalnymi83:

„One, two, three,..., we know by heart the sequence of these sounds (spoken ordinal numbers)as an endless row, that is to say, continuing for ever according to a law, known as being fixed. (...)These things are intuitively clear”84.

Konstrukcja, jakby na nią nie patrzeć, musi być opisana. Czym różni się opis konstrukcji od opisu własno-ści? Własność jest „wewnętrzna” a konstrukcja jest„zewnętrzna” w stosunku do zastanego języka, do za-akceptowanej wcześniej teorii. Dedekindowskie liczby rzeczywiste są opisane „wewnątrz” teorii mnogości.Brouwerowskie liczby rzeczywiste (o których za chwilę) wychodzą poza świat konstruowanych wcześniejliczb naturalnych, całkowitych, wymiernych85.

Brouwer nie dążył do apriorycznego określenia uniwersalnych kryteriów poprawności konstruk-cji matematycznych. Zdaje się mówić, że tę kwestię rozstrzygać należy dla każdego obiektu ma-tematycznego z osobna. Stwórzmy taki obiekt a dopiero potem dyskutujmy o poprawności jegokonstrukcji (i jego matematycznym sensie). Czyż nie tak mówi o swoim dziele artysta?

Brouwerowskie Principle of Constructive Existence sformułowano w [88] tak: a mathematicalobject exists if it has been constructed with an accepted constructed method” opatrującdodatkowym komentarzem: „It is non-trivial to say which constructive method is the right one”86.

Pewne wyobrażenie, czym dla Brouwera jest konstrukcja matematyczna, da odpowiedź na py-tanie, co - jego zdaniem - w matematyce Hilberta jest niekonstruktywne?Konsekwencją platońskiego paradygmatu o transcedentnym istnieniu obiektów matematycznychjest to, że każde zdanie matematyczne jest prawdziwe lub fałszywe. Dlatgo akceptacjemy logiczneprawa wyłączonego środka - albo zdanie „A” jest prawdziwe albo jego zaprzeczenie - „nieprawda,że A” - jest prawdziwe. Równoważnie:

Alternatywa „A lub nieprawda, że A” jest prawdziwa, bez względu na kształt zdania A.

W szczególności alternatywa „istnieje obiekt O lub nieprawda, że istnieje obiekt O” jest zawszeprawdziwa. Dlatego akceptujemy taki oto „dowód istnienia”:

„gdy założenie, że nie istnieje obiekt O prowadzi do absurdu, to ten obiekt istnieje”.

Prawo wyłączonego środka jest źródłem niekonstruktywizmu w matematyce Hilberta.Oto przykład: rozważmy ciąg (an) taki, że an = 1

2n dla „prawie każdej” liczby n. Wyjątek robimydla liczby m takiej, że 2m+ 1 jest najmniejszą nieparzystą liczbą doskonałą87. Wówczas am = 1.

Dla matematyka mainstreamowego (an) jest ciągiem Cauchy’ego. Dowodzi tego tak: niechND ozna-cza zdanie „istnieje nieparzysta liczba doskonała”. Implikacje: „ND → (an) jest ciągiem Cauchy’ego”oraz „¬ND → (an) jest ciągiem Cauchy’ego” są oczywiste (łatwe do udowodnienia).Stąd implikacja „(ND ∨ ¬ND)→ (an) jest ciągiem Cauchy’ego” jest prawdziwa.

82„Ideal mathematician”, „idealized human mind” lub „creating subject, creative subject”.83Początkowo Brouwer traktował również continuum jako pierwotną intuicję. Jednak później w jego matematyce

pojawiła się konstrukcja tego obiektu.84To zdanie - nie przypadkiem! - znalazło się na jednej z pierwszych stron rozprawy doktorskiej Brouwera. Kilka-

dziesiąt lat później kognitywiści mówią tak: „Niezależnie od kultury oraz wykształcenia, wszyscy ludzie dysponujązdolnością bezrefleksyjnego, natychmiastowego ustalenia, z jaką niewielką liczbą obiektów mają do czynienia (...) Przywiększej liczbie obiektów wymagana jest już pewna refleksja, działania polegające na porządkowaniu i liczeniu” [95].Taki jest też sens stwierdzenia Kroneckera „Liczby naturalne pochodzą od Boga”.85Świat, w którym skonstruowaliśmy te liczby a nie zbiory tych liczb!86On an intuitionistic view (...), the only thing that can make a mathematical statement true is a proof of the kind

we can give: not, indeed, a proof in a formal system, but an intuitively acceptable proof, that is, a certain kindof mental construction” - M. Dummet, Elements of Intuitionism, The Clarendon Press, Oxford, 1977.87Liczba doskonała to liczba naturalna równa sumie swoich dzielników. Np. 6 = 1 + 2 + 3.

Page 66: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 65

Ponieważ - prawo wyłączonego środka! - (ND∨¬ND) jest zdaniem prawdziwym, to i zdanie „ciąg(an) jest ciągiem Cauchy’ego” jest prawdziwe - istnieje liczba rzeczywista-granica tego ciągu.

Konstruktywista tego nie akceptuje. Dla niego alternatywa (ND ∨ ¬ND) jest prawdziwa, gdypotrafimy (konstruktywnie) dowieść prawdziwości jednego z tych dwóch zdań: albo wskażemy (skon-struujemy) najmniejszą doskonałą liczbę nieparzystą albo udowodnimy, że jej istnienie prowadzido sprzeczności. A my, jak dotąd, nie potrafimy ani jednego, ani drugiego 88.

Stwierdzenie (paradygmat), że każde zdanie matematyczne jest prawdziwe lub fałszywe jest konsekwencjąakceptacji istnienia transcedentnego i niezmiennego w czasie matematycznego uniwersum.Matematyka Brouwera nie potrzebuje tego założenia. Ta matematyka koncentruje swoją uwagę na ma-tematycznej kreacji i poznaniu. Respektuje fakt, że czegoś dziś nie wiemy. Nie wyklucza, że będziemy towiedzieć jutro89.

Konstrukcja jest realizowana w czasie. Czas w konstrukcjach brouwerowskich to „internal, in-tuitive time” [125], „kantowska forma ujmowania zjawisk”. Miarą tak rozumianego czasu są liczbynaturalne.Siłą rzeczy, matematyka niezmiennych bytów lekceważy proces konstrukcji matematycznego obiek-tu. Konstrukcja jest tylko (niewymaganym) potwierdzeniem jego istnienia. Pierwotne jest „istnienielogiczne” ([?]). To zdaje się być głównym zarzutem stawianym przez konstruktywistów matematy-ce hilbertowskiej. „Brouwer’s criticisms of classical mathematics were concerned with what I shallrefer to as „the debasement of meaning” - E. Bishop90.

Rekurencyjnie definiowane liczby naturalne są konstruktywne. To fundament, osnowa wszelkichbrouwerowskich konstrukcji. Konstruktywne są też liczby całkowite i wymierne. Jednak fundamen-talnym wyzwaniem dla matematycznego konstruktywizmu było rozwiązanie problemu „konstruk-tywnego continuum”.

Do opisu liczb rzeczywistych Brouwer posłużył się pojęciem spreadu91. Upraszczając (ponadmiarę): spread to specyfikacja reguł procesu konstrukcji obiektów matematycznych „określonegotypu”. „A spread is not the sum of its elements (...). Rather, a spread is identifed with its defningrules” [88]92. Stanowi, co może być początkiem tego procesu, a co jego kontynuacją. „A spreadM is determined through the spread-law ΛM (...). ΛM decides which finite sequences of naturalnumbers are accepted or not. Namely ΛM :

(i) decides which naturals are admitted as sequences of length 1,(ii) accepts (a1a2, . . . , an), if it accepts (a1, a2, . . . , an, an+1),(iii) decides, for any natural k, whether it accepts (a1, a2, . . . , an, k) or not, if it accepts (a1, a2, . . . , an),(iv) accepts (a1, a2, . . . , an, k), for some k, if it accepts (a1, a2, . . . , an)”93.

Spready to nie zbiory. To reguły (prawa) konstrukcji. The notion of spread is one of Brouwer’s most im-portant conceptual innovations, since it holds together all constructed sequances, without containingthem as a set. The spread concept derives from Brouwer’s need to avoid the concept of absolutely infniteset.94.

Nie należy jednak ułatwiać sobie myślenia o matematyce Brouwera zastępując potencjalnie nie-

88Ten przykład przedstawił Dummett [88].89To tłumaczy termin „weak counterexamples” - słabe kontrprzykłady, którym określa się przykłady niekonstruk-

tywnych twierdzeń matematyki teoriomnogościowej wskazywane przez Brouwera.90deprecjacja znaczenia.91Nie znam polskiego matematycznego odpowiednika tego terminu.... Ew. rozpiętość(?). Tak rozumieją ten termin

wszyscy, którzy spłacają kredyty „w walutach obcych”.92Spread jest pojęciem metamatematycznym. Brouwer, inaczej niż Hilbert, wyraźnie oddzielał matematykę od

metamatematyki.93[88]. To tylko podstawowy fragment pełnej definicji spreadu. Słowo komentarza: pamiętamy, że liczby całkowite,

wymierne, słowa i wszystko to, co można skonstruować w ramach danej struktury rekurencyjnej, można ponumerować.Dlatego liczby naturalne w tych ciągach można zastąpić „skończenie konstruowalnymi obiektami”94Można sobie wyobrazić „uniwersalny spread” - „zacznij od dowolnej liczby naturalnej i dopisuj dowolną liczbę”.

Page 67: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 66

skończone ciągi „zwykłymi”, czyli aktualnie nieskończonymi ciągami! Ciąg potencjalnie nieskoń-czony to (nieosiągalny) rezultat konstrukcji a ciąg aktualnie nieskończony to byt transcedentny: „aspread choice sequence is completely different from a classical sequence, which is a complete objectunder the umbrella of classically accepted absolute infinity” [88]95.Znamy (możemy skonstruować) tylko skończone, początkowe fragmenty potencjalnie nieskończo-nych ciągów. Nasza wiedza o takim ciągu jest zawsze „częściowa”:

- partial knowledge of an on-going object intuitionistically means knowledge of an initial partof it96.

- knowledge of an on-going object intuitionistically means the gradual and evergrowing partialknowledge of it.

Dlatego o tym, czy taki ciąg ma interesującą nas własność musimy decydować na podstawieznajomości jego pewnego skończonego, początkowego podciągu97. Ta zasada znana jest pod nazwą„continuity principle”. Czasem zapisuje się ją tak:

A(α)→ ∃n ∀β (∀i¬nα(i) = β(i)))→ A(β))

(jeżeli ciąg α ma własność A, to każdy ciąg β, którego odpowiednio długi odcinek początkowy jesttaki sam jak w ciągu α, ma również własność A.98)

Skomplikowane i niejasne? A może dlatego, że myślimy „teoriomnogosciowo”?Przyjrzymy się spreadowi - specyfikacji konstrukcji brouwerowskich liczb rzeczywistych:

- budowę takiej liczby możemy zacząć od dowolnej liczby wymiernej,- liczba wymierna a może być dopisana jako następna do ciągu a1, . . . , an , o ile |a− an| < 2−n.

Dwa takie potencjalnie nieskończone ciągi (an) i (bn) są zgodne - wyznaczają tę samą liczbę rze-czywistą - jeżeli znamy procedurę, która dla dowolnej liczby naturalnej k pozwala skonstruowaćliczbę m ∈ N taką, że |am+s − bm+s| < 2−k dla dowolnej liczby naturalnej s99.

Intuicjonistyczne kontinuum różni się sporo od prostej rzeczywistej. Oto przykład100: potrafimy- korzystając np. ze wzoru Leibniza - obliczyć kolejne liczby dziesiętnego rozwinięcia liczby π,π = 3, 14p1 . . . pm . . .. Dlatego dla dowolnej liczby m ∈ N umiemy rozstrzygać, czy zdanie C90(m)- „w ciągu p1 . . . pm występuje dziewięćdziesiąt kolejnych dziewiątek” - jest prawdziwe czy też nie.Popatrzmy teraz na ciąg br = (brk : k ∈ N) taki, że

brk =

(−1)m

2m istnieje m ¬ k takie, że zdanie C90(m) jest prawdziwe(−1)k

2k w przeciwnym przypadku

Jeśli postrzegamy ten ciąg jako aktualnie nieskończony, to - w matematyce mainstreamowej - łatwopokażemy, że jest on zbieżny i wyznacza liczbę rzeczywistą br taką, że:

br =

0 - gdy zdanie C90(m) nie jest prawdziwe dla żadnej liczby m,

12m > 0 - gdy najmniejsza liczba, dla której zdanie C90(m) jest prawdziwe jest parzysta,−12m < 0 - w pozostałych przypadkach

I nie przejmujemy się tym, że nie wiemy, którą z tych trzech liczb wyznacza nasz ciąg...95„Ciąg losowy” to - jak sądzę - potencjalnie nieskończony ciąg o którym nie wiemy nic ponad to, co wynika z

„prawa spreadu”. Można - dla danego spreadu - mówić też o tzw. law-like sequences które zbudowane są zgodnie zprawem spreadu i pewną dodatkową regułą. Taką regułą może być np. stwierdzenie „ciąg się stabilizuje od setnegomiejsca”. Akceptacja (potencjalnych) ciągów losowych jako pełnoprawnych rezultatów konstrukcji i ich rola to jedenz bardziej dyskutowanych punktów matematyki Brouwera.96on-going = trwający.97I znajomości spreadu, w ramach którego został on utworzony.98Więcej o continuity principle można dowiedzieć się z [4]99Warto w tym miejscu przypomnieć sobie jak „zbiór” definiował Martin-Lof.100„Intuitionistic Logic” D. Van Dalen, (The Blackwell Guide to Philosophica Logic. Ed. L.Gobble. Blackwell,

Oxford, 2001).

Page 68: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 67

Konstrukcja ciągu (brk) jest zgodna ze spreadem-specyfikacją liczb rzeczywistych. Reprezentujewięc „konstruktywną” liczbę rzeczywistą. Ale nie potrafimy pokazać, że ten ciąg jest zgodny zciągiem stałym (0, 0, . . . , 0, . . .) bo to wymaga rozstrzygnięcia, czy zdanie ∃k C90(k) jest prawdziwe!A tego nie wiemy. Z tego samego powodu nie potrafimy uzasadnić, że ciąg (brk) wyznacza liczbę

12m (lub −1

2m ) dla pewnej liczby m101.Ciąg (brk) wyznacza więc liczbę rzeczywistą różną od tych trzech liczb w tym sensie, że nie mamy

konstruktywnego dowodu żadnej z trzech oczekiwanych równości. To oznacza, że w brouwerowskimcontinuum nie obowiązuje prawo trychotomii: nie da się konstruktywnie uzasadnić że dla każdejliczby rzeczywistej a, a = 0 lub a > 0 lub a < 0 . 102

Konstruktywizm nie tylko neguje prawo trychotomii ale, konsekwentnie, odrzuca wszystkie udowodnionew oparciu o nie twierdzenia103.Metafora geometryczno-liczbowa nie funkcjonuje w matematyce Brouwera... Jak żyć, (panie premierze)?

Idźmy dalej: chcąc budować konstruktywną analizę matematyczną musimy dysponować poję-ciem (ciągłej) funkcji rzeczywistej. Konstruktywna funkcja nie jest zbiorem. Czym więc jest?

Brouwer pisał: „...by a function...we understand a law...” (pozwalające na przyporządkowaniuargumentowi wartości). Brower nie doprecyzował czym jest to „prawo”. Ale np. dodawanie liczbrzeczywistych - czyli prawo nakazujące z dwóch ciągów-liczb (αn) i (βn) zbudować ciąg (αn + βn)- z pewnością mieści się w brouwerowskim rozumieniu tego terminu.Skoro liczby rzeczywiste są ciągami potencjalnie nieskończonymi, to, konsekwentnie, wartość funkcjif na takiej liczbie-ciągu α winna być określona na podstawie wiedzy o jego pewnym skończonymodcinku początkowym. To prowadzi do doprecyzowania pojęcia brouwerowskiej funkcji rzeczywistej:

funkcja rzeczywista to reguła przyporządkowująca każdej liczbie rzeczywistej α liczbę rzeczy-wistą Φ(α) w taki sposób, że jeśli α i β są zgodne, to również Φ(α) i Φ(β) są zgodne [88].

Należy to zapewne rozumieć jako zdolność do przekształcenia każdej procedury orzekającej ozgodności ciągów α i β w procedurę orzekającą o zgodności ciągów Φ(α) i Φ(β). Ale to i takjest odległe od tego, czego oczekuje matematyk przyzwyczajony do precyzji języka matematykiHilberta...

A „na końcu” rozważań o konstruktywnym kontinuum czeka nas takie zaskakujące normalnego

101Do czasu, gdy ktoś nie wskaże liczby m takiej, że zdanie C90(m) jest prawdziwe lub wykaże, że jej nie ma.102Liczba π i jej rozwinięcie - nieskończony ciąg cyfr, którego każdy skończony początkowy odcinek potrafimy

obliczyć ale, całości nie poznamy nigdy - była chętnie wykorzystywana przez Brouwera do konstrukcji jego „słabychkontrprzykładów”.

Podziwu godna liczba Pitrzy koma jeden cztery jeden.Wszystkie jej dalsze cyfry też są początkowepięć dziewięć dwa, ponieważ nigdy się nie kończy.Nie pozwala się objąć sześć pięć trzy pięć spojrzeniem,osiem dziewięć obliczeniem,siedem dziewięć wyobraźnią,a nawet trzy dwa trzy osiem żartem, czyli porównaniemcztery sześć do czegokolwiekdwa sześć cztery trzy na świecie.

Najdłuższy ziemski wąż po kilkunastu metrach się ury-wa.Podobnie, choć trochę później, czynią węże bajeczne.Korowód cyfr składających się na liczbę Pinie zatrzymuje się na brzegu kartki,potrafi ciągnąć się po stole, przez powietrze,przez mur, liść, gniazdo ptasie, chmury, prosto w niebo,przez całą nieba wzdętość i bezdenność.O, jak krótki, wprost mysi, jest warkocz komety!Jak wątły promień gwiazdy, że zakrzywia się w lada prze-strzeni!

A tu dwa trzy piętnaście trzysta dziewiętnaściemój numer telefonu twój numer koszulirok tysiąc dziewięćset siedemdziesiąty trzeci szóste piętroilość mieszkańców sześćdziesiąt pięć groszyobwód w biodrach dwa palce szarada i szyfr,w którym słowiczku mój a leć, a piejoraz uprasza się zachować spokój,a także ziemia i niebo przeminą,

ale nie liczba Pi, co to to nie,ona wciąż swoje niezłe jeszcze pięć,nie byle jakie osiem,nie ostatnie siedem,przynaglając, ach przynaglając gnuśną wiecznośćdo trwania.

Wisława Szymborska, Liczba Pi

.

103Takim twierdzeniem jest np. wspominany wcześniej wynik Darboux. Konstruktywnie można dowieść coś takiego:„jeśli f : [a, b]→R jest ciągła i f(a) · f(b) < 0, to dla dowolnej liczby n istnieje c(n) ∈ [a, b] taka, że |f(c(n))| < 1

2n ”(http://plato.stanford.edu/entries /intuitionism/)

Page 69: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 68

matematyka twierdzenie:

Każda funkcja rzeczywista jest ciągła...104

Ale już wiemy, że użyte tu pojęcia mogą być rozumiane zupełnie inaczej niż w matematyceteoriomnogościowej...

Pora na podsumowanie: Hilbert czy Brouwer? G. Sambin w artykule Step towards dynamic con-strutivism pisał tak: (...) „brouwerowska filozofia matematyki (...) jest odrzucana przez większośćz uwagi na jej „związki z mistycyzmem”.Ale czy matematyka Hilberta jest w pełni racjonalna? Czytajmy dalej - już w oryginale: But (...)the real problem is that, if by religion we mean any form of unprovable belief in something beyondour perceptions, then apparently also all other existing philosophies of mathematics are based noless on religion.(...) In my view the problem with religionis that it has often been accepted quiteuncritically, in the form of ”blind faith”, and this can lead to the making of very bad (...) mistakes.(...) the supposition, dogma even, that an absolute truth must exist and that classical axiomaticset theories such as ZF must form a part of this truth, has resulted in a number of cultural errors -intelectual atrocities even - of which the Banach-Tarski paradox is just another very bad - or excel-lent - example. More then just being philosophically shaky ZF has severely impaired our intuitionby splitting it from what ZF would have us to belive”105.Mistycyzm jest też obecny w matematyce Hilberta. Ale sprowadza się do jednorazowego „aktuzawierzenia” - uznania zasadności i uniwersalności praw klasycznej logiki i aksjomatów teorii mno-gości. Potem wszystko jest poukładane. To stwarza pozór racjonalności. Nikt przecież nie żąda odrozpoczynających karierę młodych matematyków świadomej akceptacji aksjomatów teorii mnogo-ści. Wchodzimy w ten świat nieświadomi problemów jakie leżą u podstaw. I, co zdumiewające,większość robotników matematyki wcale nie chce zmieniać tego stanu rzeczy... . A przecież „(...) itis not a sound practice to base scientific knowledge of any form of religious belief... . [103]”

W matematyce Brouwera ta niepewność jest bardziej widoczna. Ta matematyka jest jest su-biektywna i „mistyczna” - nie tylko w warstwie podstawowych ustaleń ale właściwie w każdymakcie twórczym.

W chwili powstania teoria mnogości była jednocześnie zachowawcza i rewolucyjna. Zachowaw-cza, bo wierna euklidesowemu paradygmatowi postrzegania matematyki jako teorii aksjomatycznej.Rewolucyjna, bo nie tylko porządkowała zastaną matematykę, ale poprzez wskazanie zbioru jakopojęcia pierwotnego, otworzyła nowe obszary eksploracji. Proponując „niekontrowersyjne” (w więk-szości i dla większości) aksjomaty i oferując uniwersalny język stworzyła wrażenie, że to, co zastała,spojone z tym, co oferuje, to wymarzone matematyczne uniwersum. Akceptacja hilbertowskiej kohe-rencyjnej teorii istnienia to też radykalne odejście od dominującego wcześniej konstruktywizmu106.Konstruktywizm Brouwera nie może w pełni konkurować z teorią mnogości. H. Weyl, jeden z twór-ców intuicjonizmu, pisał: „Mathematics with Brouwer gains its highest intuitive clarity. He succeedsin developing the beginnings of analysis in a natural manner, all the time preserving the contactwith intuition (...) . It cannot be denied, however, that in advancing to higher and more generaltheories the inapplicability of the simple laws of classical logic eventually results in an almost . Andthe mathematician watches with pain the greater part of his towering which he believed to be built104https://plato.stanford.edu/entries/intuitionism105http://www.math.unipd.it/ sambin/txt/StepsL.pdf. Przetłumaczymy ostatnie zdanie, bo jest ważne „Bardziej

znaczące niż to, że teoria Zermelo Freankla jest filozoficznie chwiejna (niepewna) jest to, że okrutnie osłabia onanaszą intuicję oddzielając ją do tego, w co każe nam wierzyć”.Twierdzenie Tarskiego-Banacha, mówi, że „kulę można pociąć na skończenie wiele kawałków, z których można złożyćdwie kule równe kuli wyjściowej.” atrocity = bezeceństwo, okropność, ohyda106(...) with the notable exception of geometry, where proof by contradiction was commonly accepted and widely

employed” [124].Nie należy jednak arogancko twierdzić, że przed teorią mnogości ciemni ludzie nie znali matematyki. W BorachTucholskich funkcjonuje do dziś Wielki Kanał Brdy zbudowany w latach 1842-1848. Przepływ wody przez kanałwymusza różnica poziomów między jego końcami. Kanał ma ok. 20 km długości, a ta różnica to... 140 cm. Siedemcentymetrów spadku na każdy kilometr kanału... Kto i jak to wyliczył? Bez teorii mnogości, continuum Dirichleta ianalizy matematycznej Weierstrassa?

Page 70: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 69

of concrete blocks dissolve into mist before his eyes.”107.To prawda. Ale tylko dlatego, że chcemy, by brouwerowski konstruktywizm sprawdził się na boiskurywala, w świecie matematyki teoriomnogościowej. Może właściwym miejscem porównań obu wizjimatematyki stanie się rzeczywistość świata ery postindustrialnej, w którym najważniejsza staje sięjakość procesów pozyskiwania i przetwarzania informacji. To wyzwanie, na które musi odpowiedziećmatematyka XXI wieku. I nie można wykluczyć, że matematyka konstruktywna okaże się na tympolu bardziej skuteczna niż teoriomnogościowa108.

Rygorystyczny formalizm matematyki Hilberta sprawia, że jest ona czytelna nie tylko dla nie-licznych geniuszy, ale dla szerokiego kręgu robotników matematyki. To ma dobre ale i złe strony.W 1975 roku Bishop pisał: „There is a crisis in contemporary mathematics, and anybody who hasnot noticed it is being willfully blind. The crisis is due to our neglect of philosophical issues. Thecourses in the foundations of mathematics as taught in our universities emphasize the mathematicalanalysis of formal systems, at the expense of philosophical substance. Thus it is the mathemati-cal profession that tends to equate philosophy with the study of formal systems, which requireknowledge of technical theorems for comprehension. They do not want to learn yet another branchof mathematics and therefore leave the philosophy to the experts. As a consequence, we provethese theorems and we do not know what they mean”.Trudno się nie zgodzić. Jest pewne, że większość publikowanych prac matematycznych skazana jestna szybkie zapomnienie. Choć formalnie poprawne, nie wnoszą nic do dorobku matematyki. Tocena demokratyzacji matematyki, która jest ubocznym skutkiem dominacji koncepcji Hilberta.

Można mieć nadzieję, że matematyki Hilberta można się nauczyć. Matematyki Brouwera - nie. Można sięnauczyć rzemiosła, ale nie twórczości.

„The intuitionist mathematician proposes to do mathematics function of his intellect, as a free, vitalactivity of thought. For him, mathematics is a production of the human mind. He uses language, bothnatural and formalized, only for communicating thoughts (...) Such a linguistic accompaniment is not arepresentation of mathematics; still less is it mathematics itself.” - A.Heyting, The intuitionist foundationsof mathematics, (Philosophy of mathematics, selected readings, ed. P.Benacerraf, H.Putnam).

Wystarczy. I tak napisałem za dużo. „O czym nie można mówić, trzeba milczeć”109.

107http://plato.stanford.edu/entries/weyl/# DasKon. unbearable awkwardness = nieznośne niedołęstwo, edifice =gmach.108Warto zajrzeć np. na stronę http://www.charlespetzold.com/blog/2008/05/Turing-and-Brouwer.html, gdzie moż-

na odnaleźć ciekawe dywagacje na temat wpływu Brouwera na Turinga.109L.Wittgenstein.

Page 71: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 5

Język matematyki

Każdy potrafi wysłowić w ojczystym języku różne własności i wskazywać ich desygnaty - obiekty,którym one przysługują. Wykształcenie matematyczne polega m.in. na przyswojeniu specyficzne-go języka umożliwiającego precyzyjny opis zawiłych własności obiektów świata matematycznego.Uczymy się tego słuchając wykładów. Ale wykładowca to - w większości przypadków - pracującymatematyk i ma do języka matematyki stosunek pragmatyczny. Użyje bez wahania symbolu „∀”zawsze, gdy zechce zapisać sąd ogólny (rozpoczynający się od słów „dla każdego”) i uzna, że jestto przydatne. Nie zastanawia się, czy napis na tablicy to formalnie poprawna formuła pierwszegoczy np. drugiego rzędu. Powiedzmy prawdę - czasem nawet tego nie wie.

Trochę żal... Język matematyki ma umożliwić precyzję i jednoznaczność sądów wtedy, gdy zawodzi języknaturalny. W praktyce matematycznej posługujemy się czymś w rodzaju slangu - mieszaniną językanaturalnego i formalnego. Pracując w grupie specjalistów przyjmujemy umowny poziom oczywistości -prawo do pomijania pewnych szczegółów wywodu. To konieczne. Ale niezbywalnym elementem kulturymatematycznej jest, by na każde żądanie słuchaczy wypełnić luki, rozwinąć skróty itp., które znalazły sięw naszej argumentacji. Spory i wątpliwości rozstrzygamy na poziomie formalnego zapisu.

5.1 Języki naturalne i formalne: dwa mity.

„Wiele nowych idei można wyrazić w języku niematematycznym, alewcale nie są przez to łatwiejsze”.

B.Russell, „ABC of Relativity”

Mit pierwszy: „język współczesnej matematyki to w istocie taki sam język jak np. język polski,tylko stosuje się w nim specjalną notację po to, by zapisy były krótsze”.Nieprawda. Języki naturalne są narzędziem komunikacji. Rozumianej nie tylko jako przekaz infor-macji, ale również emocji i wartości, cokolwiek to oznacza. Bez języka nie jest możliwe kształtowaniewartości kulturowych i etycznych oraz wzorców zachowań. Miarą rozwoju społeczności jest jakośćjęzyka, którym się ono posługuje1.

Języki naturalne nie powstały w wyniku jednorazowego aktu twórczego (pomijając legendę wie-ży Babel). Są rezultatem długotrwałego, niekończącego się procesu. Zmieniają się w odpowiedzi nanowe potrzeby. Powstają nowe słowa a stare nabierają nowych znaczeń. Struktura języka się nawar-stwia. Staje się wieloznaczna a nawet wewnętrznie sprzeczna. Sens wypowiedzi jest uwarunkowanysytuacyjnie („kontekstowo”), może też być kształtowany subiektywnie przez nadawcę i odbiorcę. Ito jest piękne2.

Język formalny nie ma spełniać tych samych funkcji co język naturalny. Jest podporządkowanywybranym działaniom. Dlatego może być prostszy niż naturalny. Języki naturalne zastajemy, języki

1I odwrotnie: zubożenie języka jest objawem jej degradacji.2„Like a bird on a wire, Like a drunk in a midnight choir. I have tried in my way to be free...”

(L. Cohen, Bird on the wire).

70

Page 72: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 71

formalne tworzymy. Tworząc, możemy zapewnić sobie pełną kontrolę nad ich składnią.Mit drugi: „język matematyki to taki sam język „branżowy” jakimi dysponują inne dziedziny

nauki czy zawody.”Nieprawda. To fakt: języki branżowe są w pewnym stopniu przeciwieństwem języków naturalnych,gdyż są tworzone na potrzeby określonej grupy społecznej (zawodu, dziedziny nauki). Mają uspraw-nić komunikację w grupie połączonej wspólnym działaniem. Oferują specjalistyczną i - co ważne -jednoznacznie interpretowaną terminologię3. Ale zapewnienie komunikacji ludziom branży to tyl-ko jedno z zadań języka matematyki. To jest język kreacji. To jest też język argumentacji,uzasadniania sądów. Matematyka jest nauką, której hipotezy rzadko weryfikuje się doświadczalnie.Dlatego integralną częścią każdego języka matematyki jest jego wewnętrzna logika pozwalająca naobiektywną ocenę zasadności stwierdzeń i poprawności argumentacji.

5.1.1 Logika językaOdkrywanie prawd jest zadaniemwszelkiej nauki; zadaniem logiki jestodkrywanie praw prawdziwości.

G. Frege

Mathematics and Logic, historically speaking, ha-ve been entirely different studies. Mathematicshas been connected in Science, Logic withGreek. B. Russell4

Wypowiedzi G. Frege5 i B. Russella odpowiadają dwóm różnym spojrzeniom na relację międzyjęzykiem a logiką6.

Dla G. Frege prawa logiki są uniwersalne, obiektywne i wspólne dla wszystkich języków. One siętylko w tych językach ujawniają7. „Prawa prawdziwości” to zdania, których prawdziwość wynikawyłącznie z ich kształtu, a nie ich znaczeń. Zadaniem logiki jest ujawnianie takich zdań. Praca nacałą wieczność, bo takich zdań jest nieskończenie wiele. Ale Frege zaproponował genialne rozwią-zanie problemu adaptując na potrzeby logiki metodę powszechną w matematyce: zbudował systemaksjomatyczny pozwalający na dowodzenie „praw prawdziwości”8.

Russell mówi coś zgoła odmiennego: „Logic (has been connected) with Greek” - logika to częśćjęzyka.

Komunikacja między ludźmi, to - w dużej części - przedstawianie sądów (stwierdzeń, ocen) wymagają-cych uzasadnienia. Dla Arystotelesa logika zdaniowa to narzędzie wspomagające dyskurs, pozwalające naobiektywną ocenę uzasadnień. Ta obiektywizacja polega na ustaleniu, a potem odwoływaniu się do reguł,opisujących relację logicznej konsekwencji.Logika języka to opis zasad argumentacji - reguł dowodzenia. Te zasady odkrywamy, gdy analizujemyjęzyk naturalny. Te reguły kreujemy, gdy tworzymy języki formalne.

3Gdy dyplomata mówi „tak” to znaczy „być może”. Gdy mówi „być może” to znaczy „nie”. A gdy mówi „nie” to... nie jest dyplomatą” (Wolter).4Cytuję za Practical Foundations of Mathematics, P. Taylora.5Gottlob Frege (1848-1952) - jeden z twórców logicyzmu matematycznego. Podstawą matematyki miała być stwo-

rzona przez niego logika predykatów. Tego określenia używa się dziś jako synonimu terminu logika pierwszego rzędu.6„W XIX wieku popularne było łączenie logiki z teorią poznania (...). Rozumowano tak: logika i teoria poznania

stanowią rodzaje nauki o poznaniu. Można zatem mówić o logice w znaczeniu szerszym (logika formalna plus episte-mologia) i logice w sensie węższym (tylko logika formalna). Ta druga dotyczy formy poznania, natomiast druga jegotreści”. (J. Woleński - „Czym jest logika? - część 1 - Internetowy Serwis Filozoficzny. Nie poprawiłem redakcyjnegobłędu w tym tekście, pozostawiając tę radość czytelnikom.). My mówimy o logice raczej w tym szerszym znaczeniu.7Nazwa „Logika” pochodzi od greckiego słowa „logos” (świat).8W klasycznej logice zdaniowej mamu cztery spójniki zdaniowe: koniunkcję - „∧”, alternatywę - „∨”, negację

- „¬” i implikację - „→”. Analiza składniowa zdania polega na ujawnieniu występujących w nim spójników i ichhierarchii. Strukturę zdania opisujemy za pomocą formuł zdaniowych. Np. formuła - schemat zdania „Jeśli padadeszcz, to nie pójdziemy na plażę i kupimy lody” to p → (¬q ∧ r) gdzie p, q, r to zmienne zdaniowe reprezentującezdania proste - takie, w których nie ma spójników. System dowodzenia dla logiki zdaniowej zaproponowany przezFregego składa się z pięciu (schematów) aksjomatów: A → (B → A), (A → (B → C)) → (A → B) → (A → C),(A → (B → C)) → (B → (A → C)), ((A → B) → (¬B → ¬A), A ↔ ¬¬A (litery A,B,C reprezentują tudowolne zdania). Oprócz wymienionych, są tu aksjomaty „niejawne” - równoważności, pozwalające wyrazić koniunkcjęi alternatywę za pomocą implikacji i negacji. Jedyną regułą dowodzenia w tym systemie jest reguła „modus ponens”:jeżeli zdania A i A→ B są prawdziwe, to i zdanie B jest prawdziwe.

Page 73: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 72

W logice klasycznej, której celem jest ujawnianie praw prawdziwości, konsekwencja jest nadrugim planie: aby pokazać, że „zdanie B jest konsekwencją zdania A”, konstruujemy (np. wsystemie Fregego) dowód stwierdzenia „implikacja A→ B jest zdaniem prawdziwym”.

Czy można uprawiać logikę traktując priorytetowo konsekwencję a nie prawdziwość? W latach20-tych XX wieku zapoczątkowano logikę założeniową - sposób uprawiania logiki koncentrującyuwagę na badaniu konsekwencji. Wśród jej prekursorów byli dwaj Polacy: Jan Łukasiewicz i Stani-sław Jaśkowski9. Niestety, ich wkład w rozwój logiki założeniowej jest często niezauważany. Więcejszczęścia(?) miał niemiecki logik G. Gentzen (1909-1945), twórca systemu dedukcji naturalnej.Gentzen pisał: „Moim głównym celem było stworzenie formalizmu maksymalnie bliskiego rzeczy-wistemu dowodzeniu”.Paradygmat logiki założeniowej stanowi, że wiedza o logice języka wyraża się przez stwierdzeniapostaci: „zdanie Z jest konsekwencją koniunkcji skończonego zbioru zdań-założeń Γ”.

Symbolicznie: Γ ` Z.Zadaniem logiki jest dostarczanie reguł wnioskowania postaci:„zdanie T jest konsekwencją Γ, o ileT1 jest konsekwencją Γ1, T2 jest konsekwencją Γ2, ... , Tn jest konsekwencją Γn”:

Γ1 ` T1, . . . ,Γn ` TnΓ ` T

I tak np. w gentzenowskim systemie dedukcji naturalnej dla klasycznej logiki zdaniowej mamy dwiereguły, związane z implikacją:

Γ ∧A ` BΓ ` (A→ B)

Γ ` (A→ B) Γ ` AΓ ` B

Pierwsza z nich mówi: „implikację A → B można uznać za konsekwencję zbioru zdań-założeń Γ,jeśli tylko wiemy (potrafimy pokazać), że zdanie B jest konsekwencją zbioru Γ ∪ A”. Podobnieodczytujemy drugą regułę.

Analizę pozostałych reguł tego systemu pozostawiam jako przyjemne ćwiczenie. Przyjemne, bo po chwilizastanowienia zauważymy naturalny charakter (większości) tych reguł:

Γ ` A,Γ ` BΓ ` A ∧B

Γ ` A ∧BΓ ` A

Γ ` A ∧BΓ ` B

Γ ` AΓ ` A ∨B

Γ ` BΓ ` A ∨B

Γ ` A ∨B Γ ∧A ` C Γ ∧B ` CΓ ` C

Γ ∧A ` 0Γ ` ¬A

Γ ` ¬A Γ ` AΓ ` 0

Γ ∧ ¬A ` 0Γ ` A

(0 oznacza zdanie zawsze fałszywe).

System dedukcji naturalnej dla klasycznej logiki zdaniowej ma jeden aksjomat (schemat aksjo-matu):

Γ ∧ Z ` Z„zdanie-konkluzja jest konsekwencją zbioru założeń, jeśli tylko wśród nich jest ono samo.”

Trudno nie zauważyć, że to prawda podstawowa innego rodzaju niż aksjomaty systemu Fregego.

9In his 1926 seminars, Jan Łukasiewicz raised the issue that mathematicians do not construct their proof bymeans of an axiomatic theory (...) but rather made use of other reasoning methods; especially they allow themselvesto make an „arbitrary assumptions” and see when they lead. Łukasiewicz issued the challange for logicians to developa logical theory that embodied this insight but which yielded the same set of theorems as the axiomatic system thenin existence. This challange was taken up by Stanisław Jaśkowski culminating in his (1934) paper.” - F.J. Pelletier,„A Brief History of Natural Deduction (History of Philosophy of Logic, 20(1999),1-31). Dodajmy, że od 1945 rokuprof. Jaśkowski pracował na Uniwersytecie M. Kopernika w Toruniu a w latach 1959-1962 był jego rektorem.

Page 74: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 73

Systemy Fregego i Gentzena są równoważne: zdanie A ma dowód w systemie Fregego dokładniewtedy, gdy stwierdzenie 1 ` A jest dowodliwe w systemie Gentzena”10. Skoro tak, to o co kruszyćkopie?

Matematyzacja wielowiekowego dorobku logików i filozofów dokonana przez G. Frege to za-mknięcie epoki, w której logika traktowana była jako składowa filozofii, działanie prowadzące dopoznania prawd uniwersalnych, transcedentnych. Dzieło Fregego było konieczne i przydatne, aleraczej porządkujące niż inspirujące11.

Logika założeniowa otworzyła logikę formułując dla niej nowe cele. W centrum uwagi znalazł sięproces uzasadniania zdań a nie ich prawdziwość. Stworzyła podstawy rozwoju logiki konstruktywneji intuicjonistycznej, o których w Stanfordzkiej Encyklopedii Filozofii napisano tak: „Intuitionisticand constructive logic began when people saw the possibility of reading A → B, as ‘if you giveme an A, I will give you a B’, which is a significant departure from the classical reading ‘B is truewhenever A is”12. Dzięki Gentzenowi, Łukasiewiczowi i Jaśkowskiemu prawie pół wieku poźniej Y.Girard mógł tak określić cele logiki: „Logic is the study of patterns found in reasoning. The task ofthe logician is to set down rules for distinguishing between valid and fallacious inference, betweenrational and flawed arguments”.

Angielskie słowo reason ma wiele polskich odpowiedników, np. powód, przekonać, przyczyna. rozsądek,rozum, uzasadnienie, wnioskować, argument a nawet filozofować, logika(?), sąd - jak podają przyzwoitesłowniki. Anglikom łatwiej przyjąć do wiadomości, że „pattern of reasoning” ma wiele znaczeń... .Logika założeniowa określa reguły budowy poprawnych uzasadnień zdań złożonych na podstawie uzasad-nień zdań prostych nie wikłając się w jałowe dyskusje, czym jest uzasadnienie (zdań prostych).Pojęcie konsekwencji zyskało nowy, szerszy sens.

Takie rozumienie zadań logiki pozwala na akceptację współistnienia różnych logik.Ale po co nam one?Zdania „Jeśli mam 7 zł, to stać mnie na jasne piwo” oraz„Jeśli mam 7 zł, to stać mnie na ciemnepiwo” można uznać za prawdziwe13. Ale nikt przytomny nie powie, że „jeśli mam 7 zł, to stać mniena jasne i ciemne piwo” - klasyczna reguła Γ`p,Γ`q

Γ`p∧q nie ma tu zastosowania. Tu potrzeba logiki, wktórej „realizacja konkluzji powoduje wyczerpywanie przesłanek”. A to jest paradygmat rozwijanejna potrzeby informatyki teoretycznej logiki liniowej, o której w Stanfordzkiej Encyklopedii Filozofiinapisano tak: „Linear logic is a refinement of classical and intuitionistic logic. Instead of emphasizingtruth, as in classical logic, or proof, as in intuitionistic logic, linear logic emphasizes the role offormulas as resources. (...) Linear logic begins with a further twist in the reading of ‘A→ B’: readnow ‘give me as many A as I might need and I will give you one B’14.

Inny przykład. Któż zabroni z przesłanki „Jasiu znów zapłacił mandat” wywnioskować, że Jasiujuż kiedyś zapłacił mandat”? Jednak klasyczna logika zdaniowa nas do tego nie upoważnia. Onaformalizuje tylko fragment logiki języka naturalnego15. Logika klasyczna traktuje oba przytoczone

101 to zdanie zawsze prawdziwe. Dowodliwość 1 ` A oznacza bezwarunkowe uzasadnienie A.11Większość pracujących matematyków zadowala informacja, że stosowane przez nich (niesformalizowane) proce-

dury dowodowe nie są sprzeczne z tym, co opisują formalne systemy. Studenci matematyki zachowują się podobnie ioceniają zajęcia z logiki jako jedne z najnudniejszych. Powód - oprócz powszechnego wśród studentów przekonania oich nadprzeciętnych zdolnościach - jest prosty: ich kontakt z logiką formalną ogranicza się najczęściej do klasycznegorachunku zdań. Ale to tylko algebraizacja i algorytmizacja logiki zdaniowej. Kogo pasjonuje zerojedynkowe testo-wanie formuł zdaniowych za pomocą niemiłosiernie nudnego algorytmu? Kto ze studentów kiedykolwiek wykorzystaodkrycie, że formuła zdaniowa (p∧ (r → (p→ q))∨p)→ ¬p jest prawem rachunku zdań? „A w filmie polskim, proszępana, to jest tak: nuda... Nic się nie dzieje, proszę pana. Nic. (...) Dialogi niedobre... Bardzo niedobre dialogi są. Wogóle brak akcji jest. Nic się nie dzieje...” („Rejs” M. Piwowskiego).12http://plato.stanford.edu/entries/logic-linear/. Dosłownie to samo zdanie można znaleźć w artykule

M.Gaboardiego, A.Momigliano i C.Schurmann dostępnym w internecie (http://momigliano.di.unimi.it/teaching/Corsi di Dottorato/Linear Logic/outline.pdf). Autorzy jednak nie wskazują SEF jako źródła... Śmieszne? Mało.13W realiach Torunia początku XXI wieku.14http://plato.stanford.edu/entries/logic-linear/. Jednym z twórców logiki liniowej jest Y. Girard.15Która, in extenso, najprawdopodobniej jest wewnętrznie sprzeczna.

Page 75: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 74

zdania jako zdania proste. A żadne zdanie proste nie jest konsekwencją innego zdania prostego16.Gdyby stworzyć logikę, która frazy „znów” i „kiedyś” traktuje jako spójniki tworzące zdania złożonei gdyby dodać aksjomat znów A`kiedyś A , to dwa zdania o przypadkach Jasia byłyby związane

(dowodliwą formalnie) relacją konsekwencji17.

Możemy tworzyć różne logiki dla realizacji różnych celów. To różni jej współczesne i klasyczne rozumienie- logika nie jest odkrywaniem prawd uniwersalnych ale kreacją. Nie ma jednej logiki świata. Są tylkologiki naszego poznawania (opisu) świata.

„Logiczny ład świata to nasza modlitwa do piramidy chaosu”18.

Logika jest częścią języka. Jest naszą świadomością jego możliwości poznawczych.

Dodatek: o (drobnym) nieporozumieniu wokół kreski Sheffera

Kreska Sheffera jest bliska tym, którzy znają sieci boolowskie (logiczne). Jest to dwuargumentowyspójnik zdaniowy wprowadzony jako „skrót”:

p|q ≡ ¬(p ∧ q)Zdanie p|q jest prawdziwe gdy zdania p i q wzajemnie się wykluczają - nie są jednocześnie prawdzi-we. Za pomocą tego spójnika można odtworzyć (zdefiniować) wszystkie klasyczne spójniki zdaniowe:

¬p ≡ p|p, p ∧ q ≡ (p|p)|(q|q), p ∨ q ≡ (p|q)|(p|q).To prowokuje do pytania: jaki kształt przyjęła by logika, gdyby kreska Sheffera była podstawowymi jedynym spójnikiem służącym do konstrukcji zdań złożonych?Pytanie ciekawe, ale ... bezprzedmiotowe. Nie ma takiego języka naturalnego, w którym funkcjo-nuje kreska Sheffera. Nie ma języka, w którym fraza „p kreska p” zastępuje frazę „nieprawda, żep”. „Odkrycie” kreski Shaffera i jej zastosowanie w projektowaniu sieci boolowskich to rezultatformalizacji i algebraizacji logiki zdaniowej19. A logika jest logiką języka. Koniec bajki.

5.2 Język matematyki

Granice mojego języka wyznaczają granice mojego świataL. Wittgenstein

Matematyka Hilberta kontynuuje tradycję platońską: przedmiotem jej zainteresowania są wła-sności wiecznotrwałych i niezmiennych obiektów i (skończonych) układów takich obiektów.

Skoro tak, to dyskusję o języku matematyki trzeba zacząć od próby odpowiedzi na pytanie:

5.2.1 Co to jest „własność”?

„Koń jaki jest, każdy widzi” - czyż ta defincja Benedykta Chmielowskiego20 nie jest najlepszą od-powiedzią, jakiej powinniśmy udzielić pytani o rzeczy oczywiste? Jednak matematyka nie tolerujezbyt wielu oczywistości. Dlatego potraktujemy to pytanie poważnie.

16Reguły wnioskowania logiki zdaniowej formułowane są w oparciu o analizę struktury syntaktycznej (budowy)zdań-przesłanek i zdania-konkluzji. A struktura zdań prostych jest „atomem”, jest niewidoczna.17Jeśli ktoś zamiast tworzonego ad hoc przykładu rozszerzenia logiki zdaniowej chciałby czegoś, co rzeczywiście

zajmuje logików to polecam modalną logikę zdaniową w której wyróżnia się frazy „jest konieczne” i „jest możliwe”jako konstruktory zdań złożonych.18S.Lem, Śledztwo. W oryginale: „matematyczny” a nie „logiczny”. Pisarz następnego pokolenia S.Twardoch mówi

jeszcze smutniej: „Rzeczywistość jest chaosem, który łatwo nie poddaje się procesom nadawania sensów”. Nieco mniejpatetycznie: „(...) język nigdy nie jest neutralny. Ludzie lubią myśleć, że odzwierciedla świat. To nieprawda. Słowaodzwierciedlają jedynie nasze rozumienie świata, nie rzeczywistość” - G. Lakoff.19Algebraizacja logiki zdaniowej polega na algorytmicznym obliczaniu wartości formuł zdaniowych w dwuelemento-

wej algebrze wartości logicznych (algebrze Boole’a) - (0, 1,∧,∨,¬). Ta algebra jest zupełna co oznacza, że wszystkiefunkcje typu 0, 1n → 0, 1 można opisać za pomocą formuł zdaniowych. To zapoczątkowało badanie sieci boolow-skich. Kreska Sheffera pozwala realizować te sieci jako „struktury jednorodne”, utworzone z bramek „nand”.20Nowe Ateny - pierwsza polska encyklopedia (1754-56).

Page 76: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 75

Zacznijmy naiwnie: „własność jest po to, by dzielić obiekty na te, które ją mają (czyli desygnatytej własności) i te, które jej nie mają”. Nic dziwnego, że teoria mnogości oparta na paradygmacie„wszystko jest zbiorem” uległa początkowo pokusie utożsamiania własności ze zbiorem jej desygna-tów21. Ta propozycja jest atrakcyjna z kilku powodów:

- nie mnożymy pojęć podstawowych ponad miarę (brzytwa Ockhama),- jest zgodna z naszym doświadczeniem świata zbiorów skończonych,- jest zgodna z podstawową zasadą Hilberta - skoro to utożsamienie nie prowadzi do sprzeczności,

to dlaczego jego nie przyjąć?

A jednak... Z całą jaskrawością ujawnia się tu groza niefrasobliwego przenoszenia doświadczeń zeświata skończonego w kosmos zbiorów nieskończonych... Jeśli zgodzimy się, że „być zbiorem” jestwłasnością (a dlaczego nie?), a „własność = zbiór”, to musimy uznać istnienie „zbioru wszystkichzbiorów”. A to doprowadziło Russella do odkrycia paradoksu, znanego dziś jako - jakby inaczej -paradoks Russella.

Zbiór wszystkich zbiorów U ma tę własność, że jest własnym elementem, U ∈ U . A np. N /∈ N- zbiór liczb naturalnych nie ma tej własności. Konsekwentnie, możemy mówić o zbiorze K tychzbiorów, które nie są swoimi elementami:

K = A : A jest zbiorem i A /∈ AProsta analiza pokazuje, że:

K ∈ K wtw K /∈ K

To był szok. A nawet dramat22. I koniec tzw. naiwnej teorii zbiorów. Naiwnością było aprioryczne założe-nie, że język opisu uniwersum można stworzyć odwołując się - również w sferze metajezyka - do jedynegopojęcia pierwotnego - zbioru - i jednej zależności między zbiorami - relacji przynależności.

Ten paradoks uświadomił twórcom teorii mnogości konieczność opisania jej podstaw w sposóbnie budzący wątpliwości, czyli jako teorii aksjomatycznej. W szczególności należało doprecyzowaćcantorowski aksjomat wyróżniania - „a set is a collection into a whole of definite, distinct objectsof our intuition or of our thought. The objects are called the elements (members) of the set23.W poprawionej wersji ten aksjomat mówi, że „własność, którą potrafimy opisać w języku teoriizbiorów wyznacza podzbiór dowolnego zbioru A złożony z elementów zbioru A - desygnatów tejwłasności. To pozwala uniknąć paradoksu Russella: własność (x = x) -„jestem zbiorem równymsamemu sobie” - która wcześniej wyznaczała zbiór wszystkich zbiorów - teraz wyznacza podzbiórdowolnego zbioru A (równy całemu zbiorowi A).

Równość „własność = zbiór” zamieniono na „własność = podzbiór”. Związek między zbioramii własnościami okazał się bardziej subtelny niż wcześniej sądzono24.

To wszystko prowadzi do odmiennego, intensjonalnego rozumienia własności: jej niezbywalnymatrybutem jest to, że jest opisana w pewnym języku25

Jednak pełna swoboda języka opisu własności też jest niebezpieczna:Paradoks Richarda [124]: liczb rzeczywistych, które potrafimy opisać za pomocą skończonejliczby słów języka polskiego jest przeliczalnie wiele. Można je więc ponumerować, ustawić w ciąg21To jest tzw. ekstensjonalne rozumienie własności.22G. Frege tuż przed ukończeniem dzieła, które w jego mniemaniu miało stworzyć podstawy matematyki, otrzymał

od Russella list opisujący ten paradoks. Wtedy dopisał do swego dzieła postscriptum: „Uczonego może rzadko spotkaćcoś bardziej niepożądanego niż utrata podstaw akurat w momencie ukończenia pracy...[36].23Cytuję za ”Haskell road to Logic, Math and Programming” - K.Doets, J. van Eijek24Warto tu wspomnieć o teorii zbiorów von Neumanna–Bernaysa–Godla („NBG set theory”), w której pojęciem

pierwotnym jest klasa. Własność wyznacza klasę a nie zbiór. Zbiór to element pewnej klasy.25Konstruktywiści odnosili wymóg „intensjonalności” również do zbiorów: E. Bishop pisał: „a set is not an entity

which has an ideal existence. A set exists only when it has been defined.”.IntenCjonalny czy intenSjonalny? Filozofowie nie są zgodni w opisie relacji między tymi pojęciami („Umysł wobecświata” , K.Gajewski (internet)). Przyjmuję, że - w odnesieniu do matematyki - są to pojęcia bliskie a ich sens wyrażastwierdzenie: itencjonalność to aktywny stosunek umysłu do przedmiotu poznania.

Page 77: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 76

a0, a1, . . . , an, . . . korzystając np. z leksykograficznego uporządkowania ich skończonych opisów.Oznaczmy zbiór tych liczb przez E . Niech ai0, a

i1ai2 . . . będzie rozwinięciem dziesiętnym liczby

ai26. Rozważmy teraz liczbę b - której rozwinięcie dziesiętne b0, b1b2 . . . wygląda tak: przyjmujemyb0 = a0

0 + 1 . Dla n ­ 1 przyjmujemy bn = ann + 1 jeżeli ann 6= 9 i bn = 0 - w przeciwnym przypadku.Każdy zgodzi się, że tak opisana liczba b należy do zbioru E (bo właśnie przedstawiliśmy jejskończony opis). Ale przecież b nie może należeć do zbioru E, bo bn 6= ann dla dowolnego n ∈ N !

Kto winien, co zawiodło?27 Przeciwnicy nieskończoności aktualnej wskażą właśnie ją jako źródłozła - wszak E to aktualnie nieskończony zbiór. Konstruktywiści powiedzą, że numeracja zbioru E niejest efektywna: wprawdzie każda skończenie opisywalna liczba ma numer, ale nie potrafimy wskazaćskończenie opisywalnej liczby o danym numerze. Taka numeracja nie może być podstawą konstrukcjiliczby b - przedstawiony opis liczby b nie pozwala na wypisanie jej rozwinięcia dziesiętnego28.

Konstrukcja ciągu (bn) to przykład definicji impredykatywnej. Russell, twórca tego terminu,ilustrował go takim przykładem: „a typical Englishman is one who possesses all the propertiespossessed by a majority of Englishmen”. W dużym uproszczeniu: predykatywizm (czyli przeci-wieństwo impredykatywizmu) zakazuje formułowania własności, których desygnaty - obiekty o tejwłasności - można określić jedynie odwołując się do całego zbioru desygnatów. Tak jak nasz ciąg(bn), którego opis odwołuje się do zbioru E wszystkich ciągów o skończonym opisie29.

Podobny kłopot miał G. Frege gdy zdefiniował własność N(x) „być liczbą naturalną” tak: zbiórA spełnia formułę N(x) (czyli zbiór A jest liczbą naturalną) jeżeli A spełnia każdą „własnośćhierarchiczną”, która jest spełniona przez zbiór pusty ∅. Własność jest hierarchiczna gdy z tego, żeprzysługuje zbiorowi B wynika, że przysługuje też zbiorowi B ∪ B.Ta definicja jest impredykatywna - definiujemy pojedynczą hierarchiczną własność „bycia liczbanaturalną”, odwołując się do wszystkich własności hierarchicznych30. Użycie definicji impredy-katywnych może prowadzić do tzw. błędnego koła (spróbuj, korzystając z definicji G.Frege pokazać,że 2 = ∅, ∅ jest liczbą naturalną). - Viciuos Circle Principle (VCP) sformułowane przez Russellai Poincarego zakazywało rozpatrywania obiektów definiowanych impredykatywnie. Zbiór opisany wparadoksie Richarda jak i „zbiór liczb naturalnych Fregego” są więc zakazane31.

Teoria mnogości niczego a priori nie zakazuje - definicja zbioru sformułowana w jej języku zostaje odrzuco-na dopiero wtedy, gdy jej przyjęcie prowadzi do sprzeczności. Czy definicja zbioru opisanego w paradoksieRicharda jest poprawna? Pytanie bezprzedmiotowe, bo ten opis tego nie jest sporządzony w języku teoriimnogości.

Jeśli to mało (by zrozmieć, że wybór języka decyduje o tym, jak rozumiemy własność), to proponujęanalizę paradoksu Berry’ego: „n jest najmniejszą liczbą naturalną, której nie można opisać (wjęzyku polskim) za pomocą mniej niż stu słów” . Tu przyczyną kłopotu jest bezkrytyczne uznanie,że rozumiemy, czym jest „opis”32.

Wystarczy. Teraz lepiej rozumiemy Wittgensteina: badanie własności obiektów (matematycz-

26To rozwinięcie może być nieskończone, np. 13 = 0, 33333 . . .. Gdy jest skończone, to „uzupełniamy” je do nieskoń-czonego dopisując zera, np. 12 = 0, 500000 . . .27Powołajmy komisję śledczą...28Borel - konstruktywista - uważał, że porządek na zbiorze E nie jest „właściwie (unambiguously) zdefiniowany”.

O efektywnej numeracji będzie mowa w rozdziale „Obliczalność”.29Co z tym „typowym Anglikiem”? Jest jasne, że większość Anglików nie ma wszystkich cech które ma większość

Anglików. Zatem, zgodnie z definicją, typowy Anglik musi być jednocześnie... nietypowy.Przykładem ilustrującym niebezpieczeństwa impredykatywizmu jest definicja równości Leibniza: obiekty A i B sąrówne, jeżeli każda własność przysługująca A przysługuje B. I odwrotnie”. Czy „być równym A” jest własnością?30Niech nas nie dziwi, że Frege mówi o „własności bycia liczbą naturalną” (a nie zbiorze tych liczb). Frege, jako

zwolennik logicyzmu (traktujacego matematykę jako część logiki), uznawał prymat własności (definiowanej w logice)nad zbiorem jej desygnatów. Więcej na ten temat można przeczytać w artykule R. Carnapa „Logicystyczne podstawymatematyki” w [77] i w [38].31Teorią, która pozwala zrealizować ten postulat jest (prosta) teorię typów Russella.32Dodajmy mały smaczek: Berry nie był matematykiem ale bibliotekarzem, który podzielił się swoimi przemyśle-

niami z ... Russellem.

Page 78: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 77

nych) zależy od wyboru języka opisu tych własności.

Możemy zmieniać język dostosowując go do aktualnych celów badawczych - to oczywiste. Ale mniej oczy-wiste jest, że można wskazać jeden uniwersalny język pozbawiony ograniczeń jakie mają języki „lokalne”tworzone z myślą o konkretnych zadaniach badawczych.I to, jak się zdaje, jest istotą „sporu” między Wittgensteinem a Hilbertem.

5.2.2 Genialny wynalazek: formuła„Symbol góruje nad wyrazem nie tylko krótkością i jasnością,lecz ma inną jeszcze zaletę pierwszorzędną dla matematyka:sam przez się nie oznacza nic a nic”

H. Steinhaus33

Aby uniknąć kłopotów z rozumieniem opisu własności bytów matematycznych, lepiej zapomniećo wieloznacznych językach naturalnych. Matematyka potrzebuje własnego języka, który będzie wol-ny od tych wad - to jedno z założeń „programu naprawczego” przyjętego i realizowanego przezHilberta i innych matematyków na przełomie XIX i XX wieku.

Formalne języki matematyczne zaczynają się wtedy, gdy pojawia się pojęcie zmiennej (przed-miotowej).

Nie ma tekstu matematycznego bez „x-sów”, „y-greków” i im podobnych symboli, które śnią się po nocachmaturzyst(k)om. Mentalna akceptacja pojęcia zmiennej to dowód pewnej dojrzałości matematycznej.

Wprowadzenie zmiennych umożliwia opis własności obiektów matematycznych za pomocą for-muł. Włączenie formuł do języka matematyki jest genialnym w swojej prostocie wynalazkiem,porównywalnym z wynalezieniem druku34. Aby wyjaśnić skąd ten entuzjazm, popełnimy małe nad-użycie i opowiemy o - w rzeczywistości nieistniejących - „formułach języka polskiego”.

Stwierdzenie „być miastem nadwiślańskim” to niezgrabny, ale zrozumiały opis własności przy-sługującej pewnym polskim miastom. Toruń ma tę własność a Poznań jej nie ma.

Sformalizujmy to: formuły zdaniowe tworzymy korzystając z tych samych reguł gramatycznych,które obowiązują przy budowie zdań orzekających. Różnica w tym, że budując formuł używamy,obok słów języka polskiego, specjalnych symboli - zmiennych.

Zapis „x jest miastem nadwiślańskim” jest formułą. Jeśli zmienną x zastąpimy nazwą „Toruń",to otrzymamy prawdziwe zdanie „Toruń jest miastem nadwiślańskim". I powiemy, że

formuła ,,x jest miastem nadwiślańskim" jest spełniona przy wartościowaniu x := Toruńalbo:

obiekt o nazwie Toruń ma własność opisaną przez naszą formułę.

A gdy za zmienną x wstawimy nazwę „Poznań", to otrzymamy sąd fałszywy - nasza formuła niejest spełniona przy wartościowaniu x := Poznań.

Formuła to schemat reprezentujący zdania które z niej uzyskamy zastępując zmienne przedmiotowenazwami obiektów. Takie zdania to jej instancje.Formuła jest opisem własności. Jeśli formuła φ(x) opisuje własność W a zdanie-instancja otrzymana przezzastąpienie zmiennej x nazwą obiektu O jest prawdziwe, to obiekt O ma własność W .

Dodajmy kolejny element do tej układanki. Własność „bycia miastem nadwiślańskim” badaliśmyw odniesieniu do zbioru polskich miast. Ale można też pytać, które z miast europejskich ma tę wła-sność. Tę samą własność można badać w różnych kontekstach wyznaczanych przez zakres zmien-34By to docenić, wystarczy spróbować przeczytać jakąkolwiek pracę matematyczną z okresu przed upowszechnie-

niem tego wynalazku. (...) wynalezienie zmiennych stanowi punkt zwrotny w dziejach matematyki; dzięki symbolomtym człowiek zdobył narzędzie, które utorowało drogę rozwojowi wiedzy matematycznej [120]

Page 79: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 78

ności zmiennych występujących w formule. Matematyk powie - w różnych modelach języka35 .Własność może być atrybutem pojedynczego obiektu, ale też wyróżnikiem pary, trójki czy

skończonego ciągu obiektów. Np. własność „x jest miastem mniejszym niż y" przysługuje parze(Toruń, Poznań), bo ta formuła jest spełniona przy wartościowaniu [x := Toruń, y := Poznań] .A nie jest spełniona przy wartościowaniu [x := Warszawa, y := Toruń].Nie ma istotnej różnicy między opisem jedno- i wieloargumentowych własności za pomocą formuł.Poza tą, że opisując własności par używamy formuł z dwiema zmiennymi. Opisując własności trójekobiektów użyjemy trzech zmiennych. I tak dalej.Skoro formuły to schematy zdań, to nie dziwi, że do budowy formuł złożonych umożliwiającychopis złożonych własności używamy spójników znanych z logiki zdaniowej. W ten sposób zbudujemynp. formułę „(x jest miastem nadwiślańskim) ∧ (x jest siedzibą uniwersytetu)”. Ocena,czy taka formuła jest spełniona np. przy wartościowaniu [x := Toruń] (czy Toruń ma tak opisanąwłasność) wymaga tylko elementarnej umiejętności obliczania wartości logicznej zdania złożonego(i pewnej wiedzy o Toruniu).

Nasze intuicje związane z przypisywaniem obiektom własności zostały w ten sposób - poprzezwprowadzenie pojęcia formuły i jej spełniania - sformalizowane. Mamy język opisu własności.

Kolejny krok, zbliżający nas do formalnego języka matematycznego, to wprowadzenie do opisuwłasności specjalnych symboli. I tak jeśli umówimy się, że symbol „>” zastępuje frazę ,,jestwiększy od", to przydługi zapis ,,x jest większy od y" zastąpimy zgrabnym x > y.

Ot, cała tajemnica...

5.2.3 Równie genialny pomysł - termy

Są dwa sposoby identyfikowania obiektu. Pierwszy - przez opis jego własności. Drugi - poprzez nazwę.

Są dwie kategorie nazw. Najprostsze to identyfikatory nadawane obiektom bez szczególnegouzasadnienia. Nazwa-identyfikator Toruń jednoznacznie wskazuje pewne polskie miasto36. Nazwyzłożone - pojawiają się wtedy, gdy zauważymy (udowodnimy), iż pewna własność pary (trójki,etc.) elementów ma charakter funkcyjny. Np. własność opisana np. formułą ,,x jest ojcem y"- ma charakter funkcyjny, bo każdy człowiek ma jednego ojca. Dlatego można wprowadzić dojęzyka złożoną nazwę ojciec(Bolesława Chrobrego) wskazującą osobnika, któremu przypisaliśmywcześniej identyfikator - Mieszko I37.

Podobnie funkcjonują nazwy w matematyce. Prześledźmy jak to działa w arytmetyce.Liczby naturalne - numerały - to identyfikatory. Własności „z jest sumą liczb x i y" i „z

jest iloczynem liczb x i y" mają charakter funkcyjny - suma i iloczyn dwóch liczb są wyzna-czone jednoznacznie. Zastępując zwroty „jest sumą" i „jest iloczynem” symbolami „+” i „·”możemy do języka arytmetyki wprowadzić złożone nazwy takie jak np. 2+2 czy też 3·11 identyfiku-jące jednoznacznie pewne liczby. Nic też nie stoi na przeszkodzie by - korzystajac z konstruktorównazw - „+” i ·” - budować dowolnie skomplikowane nazwy - np. 2 · (3 + 8), (7 + 3) · (2 + 1).

Stąd tylko krok by pojąć, czym w językach formalnych matematyki są schematy nazw zwanetermami. To wyrażenia budowane tak jak nazwy złożone, z tą różnicą, że do ich budowy używamy- obok nazw-identyfikatorów - tych samych zmiennych przedmiotowych, które odegrały tak istotnąrolę w budowie formuł. Np. napis (x + 3) · y jest termem arytmetycznym - schematem nazwy wjęzyku arytmetyki. Nazwa złożona to teraz term w którym nie ma zmiennych - term domknięty.

35Definicję modelu języka poznamy później. Teraz wystarczy nam kojarzenie „modelu” z apriorycznym wyznacze-niem zakresu zmienności zmiennych przedmiotowych.36Znawcy przedmiotu powiedzą, że mówimy tu o nazwach własnych: „Karol to po prostu ten, kto został nazwany

Karolem, i nie można na podstawie takiej definicji stwierdzić, komu jeszcze mogłaby taka nazwa przysługiwać”(wikipedia)..37Zauważmy, że ojciec(Mieszka I) (który niewątpliwie istniał) jest identyfikowany tylko przez taką złożoną nazwę,

a nie przez przypisaną mu nazwę własną.

Page 80: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 79

Podobnie jak formuła, term to schemat reprezentujący klasę złożonych nazw, które uzyskamy zastę-pując zmienne w nim występujące termie przez identyfikatory38.

Nazwy wskazują obiekty. Można je wstawiać - w procesie wartościowania formuł - w miejscezmiennych. Np. możemy pytać, czy formuła x ¬ y jest spełniona przy wartościowaniu [x := 2 +2, y := 3] (nie jest). To oczywiste. Natomiast podstawiając w formule za zmienne przedmiotowetermy zawierające zmienne tworzymy nowe formuły. Np. x ¬ y x+z ¬ y ·(x+1). (podstawiliśmytu term x+ z w miejsce z a term y · (x+ 1) w miejsce y).

Wprowadzenie termów do języka matematyki stwarza też możliwość budowania specyficznychformuł zwanych równościami. To napisy kształtu t = p gdzie t i p są termami. Np. x+y = y+2 ·x .Dzięki temu można mówić o własnościach „opisywanych równościowo”.

Wprowadzenie termów wzbogaciło składnię formalnych języków matematyki.Co to daje? Nic, gdy mamy na uwadze li tylko siłę języka - wszystko, co powiemy w języku pierwszegorzędu z termami da się wyrazić w języku, w którym ich nie ma.Ale język jest nie po to, by był, ale po to, by się nim posługiwać. Z tego punktu widzenia wzbogaceniejęzyk o termy jest bardzo istotne.Oto przykład: dwie formuły arytmetyczne - suma(x, y, z) ∧ suma(x, y, t) → (z = t) oraz x + y = y + xopisują przemieność dodawania. W drugiej formule użyliśmy termów, w pierwszej nie.Który opis jest bardziej przyjazny?

5.3 Diabelska sztuczka - kwantyfikatory

Kwantyfikatory niewątpliwie służą do pogarszania samopoczucia studentów...

Wprowadzenie zmiennych prowadzi do wzbogacenia składni języka formuł - obok koniunkcji,alternatywy, negacji i implikacji pojawia się nowy rodzaj konstruktorów - kwantyfikatory.Zacznijmy tak: gdy obu zmiennym występującym w formule:

„x jest miastem większym od każdego miasta y"przypiszemy wartości - np. [x := Warszawa, y := Gdynia] - to otrzymamy stwierdzenie:

„Warszawa jest miastem większym od każdego miasta Gdynia"pozbawione nie tylko wartości logicznej, ale i sensu.

Fraza „dla każdego” poprzedzająca zmienną y zasadniczo zmieniła jej rolę. Logicy powiedzą, że zostałaona związana przez kwantyfikację. Zmienna x pozostała wolna. Nowa formuła nie opisuje już własnościpary obiektów (co sugeruje liczba zmiennych), ale własność pojedynczego obiektu (bo tylko jedna zmiennajest wolna, niezwiązana).

Zapiszmy naszą formułę tak, by wyraźnie wskazać zmienną związaną:

„dla każdego y: x jest miastem większym od miasta y"a frazę „dla każdego y” zastąpmy specjalnym symbolem - kwantyfikatorem uniwersalnym39:

∀y (x jest miastem większym od miasta y)Ta formuła (z jedną zmienną wolną x!) jest spełniona przy wartościowaniu [x := Warszawa] wmodelu „polskie miasta” wtedy, gdy formuła o dwóch zmiennych wolnych powstała przez pominięciekwantyfikacji:

„x jest miastem większym od miasta y"

38W lingwistyce (niematematycznej) zamiast o termach mówi się o formułach nazwowych. My ten drugi terminbędziemy używać w nieco innej, niż rozpatrywana teraz, sytuacji.A. Tarski w [120] używa terminów funkcja zdaniowa i funkcja nazwowa.39Gdzieś(?) wyczytałem, że ten symbol wprowadził G. Gentzen. Nie tak dawno, bo w 1935 roku.

Page 81: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 80

jest spełniona dla każdego wartościowania postaci [x := Warszawa, y := M ] gdzie za M możemywstawić dowolne polskie miasto40 .To jest nie tylko zgodne ze zdrowym rozsądkiem. To jest też opis procedury orzekania o spełnianiuformuł tego kształtu:

aby sprawdzić, czy formuła ∀y φ(x, y) jest spełniona dla wartościowania zmiennej wolnej [x :=A] uwalniamy ją od kwantyfikatora uniwersalnego i testujemy spełnianie formuły φ(x, y) dlawszystkich wartościowań postaci [x := A, y := M ] , gdzie za M przyjmujemy kolejno wszystkieobiekty rozważanego modelu. Jeśli przy wszystkich takich wartościowaniach formuła φ(x, y) jestspełniona, to pierwotna formuła ∀y φ(x, y) jest spełniona przy wartościowaniu [x := A].

Jest jeszcze drugi kwantyfikator - egzystencjalny (oznaczany symbolem ∃): formułę

„x jest większe od pewnego miasta y”zapiszemy - porządkując składnię i wprowadzając symbol „­” - tak:

„∃y:(x jest większe od y") lub „∃y(x ­ y)”

Procedurę sprawdzania spełnialności formuły tego kształtu opiszemy tak:

aby sprawdzić, czy formuła ∃yφ(x, y) jest - w badanym modelu! - spełniona dla wartościowaniazmiennej wolnej [x := A] , realizujemy następującą procedurę:

- uwalniamy od kwantyfikatora egzystencjalnego zmienną y,- oceniamy spełnialność formuły φ(x, y) dla wartościowań postaci [x := A, y := M ] wstawiajac

za M kolejno wszystkie obiekty rozważanego modelu. Jeśli choćby przy jednym z tych war-tościowań formuła φ(x, y) jest spełniona, to uznajemy, że formuła ∃y φ(x, y) jest spełniona przywartościowaniu [x := A].

Kwantyfikacja umożliwia opis własności nowego typu: takich, których spełnianie przez wskazany obiekt(obiekty) zależy od „kontekstu” - od tego, jaki ogół obiektów aktualnie rozważamy. Od modelu.

To różni logikę zdaniową i logikę pierwszego rzędu. Prawdziwość zdania „Warszawa jest miastemnadwiślańskim” nie zależy od tego, czy jako model wskazaliśmy zbiór wszystkich miast polskich czyeuropejskich. Ale to jest istotne dla oceny prawdziwości zdania ,,∀y( Warszawa ­ y)"Ocena spełnialności formuły w której występują kwantyfikatory wymaga oglądu całego modelu.

Język formalny, w którym funkcjonują zmienne przedmiotowe i ich kwantyfikacja to tzw. językpierwszego rzędu uznawany powszechnie za podstawowy język matematyki41:

5.3.1 Nowy rodzaj zdań

W formule ∀x ∃y (x < y) nie ma zmiennych wolnych - obie zmienne x, y są tu związane przezkwantyfikatory. Takie formuły to zdania. Ale nieco inne niż te, które otrzymamy z formuł bez-kwantyfikatorowych przez zastępienie wolnych zmiennych nazwami obiektów. Takie zdania to sądyjednostkowe. Opisują fakty - Jan jest podróżnikiem" , 1 + 1 = 342.

Natomiast zdania „∀x (x jest młody → x lubi podróżować)” czy też ∀x∃y x ¬ y mówią„coś innego”. Ale co?Najpierw odpowiemy jak formaliści. Skoro zdania to formuły to można pytać, czy zdanie jest speł-nione przy wartościowaniu zmiennych wolnych w nim występujących. Tyle, że w zdaniu wszystkiezmienne są związane! To musi (powinno) budzić niepokój: jak wartościować zmienne, których niema? Formaliści - czerpiąc pełnymi garściami z teorii mnogości - odpowiadają: wartościowanie tofunkcja określona na zbiorze Free(φ) wszystkich zmiennych wolnych danej formuły φ o wartościachw rozważanym modelu:

wartościowanie : Free(φ) −→ model

40Spełnianie tej formuły istotnie zależy od wyboru modelu! W modelu „polskie miasta” formuła jest spełnionaprzy wartościowaniu a w modelu „miasta europejskie” już nie!41Precyzyjną definicję języka pierwszego rzędu podamy w rozdziale „Wokół koncepcji prawdy Tarskiego”.42W literaturze takie zdania języka pierwszego rzędu nazywa się czasem zdaniami bazowymi - ground sentences.

Page 82: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 81

Gdy φ jest zdaniem, to zbiór Free(φ) jest ... pusty! To nie boli formalistów: wiemy (wiedzą ci,którzy znają podstawy teorii mnogości), że funkcja ∅ → model istnieje i - dla ustalonego modelu -jest jedna jedyna!Tyle formaliści. Ale racja bytu formuł polega na tym, że opisują własności. Formuła o n zmien-nych wolnych opisuje własność n-elementowych ciągów. Zdanie opisuje własności... 0-elementowych(pustych) ciągów? Próba tłumaczenia, co to jest „własność pustego ciągu elementów”, skazana jestna porażkę. Znaczenie zdań trzeba tłumaczyć inaczej:

Zdania opisują cechy własności43

Oto przykład. Własność par ludzi opisana przez formułę „y jest matką x” ma oczywistą cechę -każdy człowiek ma matkę44. Tę cechę własności „y jest matką x” opiszemy za pomocą sekwencjidwóch kwantyfikatorów - „∀x ∃y y jest matką x”.

Przykład bardziej naukowy: studenci wiedzą (bo muszą), że aby własność par elementów mogłabyć nazwana równoważnością, musi być zwrotna, symetryczna i przechodnia. Jeżeli tę własnośćopisuje formułę r(x, y) to - korzystając z kwantyfikacji - te cechy opiszemy tak: ∀x,y r(x, y) (zwrot-ność), ∀x,y r(x, y)→ r(y, x) (symetryczność) i ∀x,y,z r(x, y) ∧ r(y, z)→ r(x, z) (przechodniość).

Jednak kwantyfikatory mogą pojawić się nie tylko na początku, ale też wewnątrz formuły, jak np.w zdaniu ∀x p(x) → ∃x r(x) . Trochę trudniej uwierzyć, że takie zdanie opisuje „cechy własności”.A jednak. Wynika to z twierdzenia o preneksowej postaci normalnej:

„dowolne zdanie języka pierwszego rzędu φ jest równoważne zdaniu w preneksowej postacinormalnej tzn. zdaniu, w którym wszystkie kwantyfikatory zgrupowane są na początku:

φ ≡ Q1x1 . . . Q

nxnψ

gdzie każde Qi to kwantyfikator uniwersalny bądź egzystencjalny a formuła ψ jest bezkwantyfika-torowa”

Kwantyfikacja umożliwia konstrukcję nowego rodzaju zdań - zdań opisujących cechy własności45.

Za pomocą sądów jednostkowych jednoznacznie opiszemy każdy skończony obiekt matema-tyczny. Wystarczy zadbać o to, by każdy element takiego obiektu miał swą indywiduową nazwę. Np.trójelementowy zbiór liniowo uporządkowany opiszemy wykorzystując pojedynczy binarny symbolrelacyjny „¬” i trzy stałe a, b, c . Jego „teoria” - opisujący go zbiór zdań LO3 - wygląda tak:

LO3 = a ¬ b, a ¬ c, b ¬ c,¬(b ¬ a),¬(c ¬ a).... - darujmy sobie wypisywanie tego, co oczywiste.

Ale to ubogie: kolekcja sądów jednostkowych, nawet kompletna, to nie wiedza matematyczna!To tylko mało efektywny opis. I co najistotniejsze dla matematyki swobodnie operującej nieskończo-nością: z oczywistych powodów nie można tej „faktograficznej” metody opisu stosować do obiektównieskończonych.

Badanie modeli nieskończonych umożliwia język pierwszego rzędu. Zamiast nadawać indywi-duowe nazwy elementom takiego obiektu (co np. w przypadku liczb rzeczywistych i tak jest nie-możliwe) wyróżniamy i nazywamy pewne interesujące nas własności - relacje między elementamibadanego obiektu. Poznanie obiektu to odnajdywanie cech tych własności opisywanych jako zdaniajęzyka pierwszego rzędu.

Matematycy nie badają przedmiotów, lecz stosunki między przedmiotami - H. Poincare [92].Aby badać matematykę, badamy jej przybliżenia wyrażone w językach pierwszego rzędu. - R. Drake46

43Mówię o „cechach własności” by uniknąć niezręcznego zwrotu „własność własności”. Może lepiej byłoby mówić o„cechach (skończonej) rodziny własności” , bo przecież w zdaniu można użyć jednocześnie kilku symboli relacji, np.∀x (r(x)→ p(x)) -„ każdy obiekt posiadający własność r(x) ma również własność p(x)”. Ale to nie jest istotne.44Zapomnijmy na chwilę o Adamie...45Tak można opisać rolę kwantyfikatórw w logice klasycznej w której obowiązuje m.in. prawo wyłączonego środka.

Twierdzenia o preneksowej postaci normalnej nie da się udowodnić bez wykorzystania tego prawa.46On the Foundations of Mathematics in 1987, Logic Colloquium’87, 1987.

Page 83: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 82

Logika zdaniowa to logika sądów jednostkowych. W tej logice relacja konsekwencji jest bardzosłaba. Wnioski jakie można w tej logice wyprowadzić z danego zbioru aksjomatów - sądów jednost-kowych - nie są od nich zbyt odległe. To każe wątpić w sens organizowania wiedzy matematycznejw postaci teorii aksjomatycznych pisanych w „logice rzędu zero”.

Relacja konsekwencji w logice języka pierwszego rzędu jest zdecydowanie silniejsza. Oto spektaku-larny przykład. Trzy zdania:∀x,y,z x(yz) = (xy)z,∀x xe = x ∧ ex = x,∀x∃y xy = yx = e

to znana wszystkim matematykom teoria grup. Jeśli tę teorię postrzegać jako teorię rzędu zero, tojej konsekwencje są żadne, gdyż te trzy zdania są - w logice zdaniowej - zdaniami prostymi. Nie sąproste, gdy postrzegamy tę teorię jako teorię pierwszego rzędu. Wówczas jej zbiór konsekwencji tobogata (pierwszorzędowa) teoria grup - całkiem spora książka.

Kwantyfikacja nie jest prosta

Nasz język i jego logikę ukształtowało doświadczenie świata skończonego. W tym świecie możemymówić, że „kwantyfikacja uniwersalna to uogólniona koniunkcja, a egzystencjalna to uogólnionaalternatywa”. Kwantyfikacja jest tu tylko usprawnieniem, optymalizacją języka47.

Wchodząc z tym wyobrażeniem w świat matematyki obiektów nieskończonych nagle odkrywamy,że jesteśmy bezradni jeśli za sens działania matematycznego uznajemy orzekanie o spełnialnościformuł. Bo przecież „aby orzec, czy formuła ∀y φ(x, y) jest spełniona dla wartościowania [x := A]testujemy spełnianie formuły φ(x, y) dla wszystkich wartościowań postaci [x := A, y := M ] , gdzieza M przyjmujemy kolejno wszystkie elementy rozważanego modelu(...)”.To wykonalne gdy mamy na uwadze model skończony. Ale gdy model jest nieskończony, to takaweryfikacja spełnialności formuły ∀y φ(x, y) będzie trwała wiecznie. Bez sensu48.

W świecie skończonych modeli definicje spełniania formuł postaci ∀y φ(x, y) i ∃y φ(x, y) są jednocześnieopisem intuicyjnie prostych procedur weryfikacji spełniania.W świecie modeli nieskończonych - w matematyce - te definicje są już tylko opisem zadania do wyko-nania. Jego rozwiązaniem musi być czymś innym niż cierpliwą weryfikacją spełnialności formuły przykolejnychwartościowaniach zmiennych.

Odpowiedzią na to wyzwanie są formalne systemy dowodzenia dla logiki pierwszego rzędu - ta-kie, w których „dowodliwość formuły” oznacza jej spełnianie w dowolnym modelu przy dowolnymwartościowaniu. Ale wystarczy spojrzeć na jakikolwiek taki system formalny by się zniechęcić: regu-ły dowodzenia związane z kwantyfikatorami są zazwyczaj odległe od naszych intuicji. Na przykładrozszerzając opisany wcześniej system dedukcji naturalnej dla logiki zdaniowej o reguły:

Γ ` φΓ ` ∀xφ

Γ ` ∀xφΓ ` φ[x := t]

Γ ` φ[x := t]Γ ` ∃x φ

Γ ` ∃xφ Γ ∪ φ ` ψΓ ` ψ

otrzymamy system dedukcji naturalnej dla logiki pierwszego rzędu 49.A może wiązanie kwantyfikacji z „nieskończoną koniunkcją i alternatywą” nie jest zasadne? Może

trzeba rozumieć rolę kwantyfikatorów zupełnie inaczej? Takie nowe spojrzenie na rolę kwantyfikacjiproponuje logika założeniowa: kwantyfikacja jest tu wprost powiązana z fundamentalnym (w tejlogice) pojęcięm konsekwencji.47To nie do końca prawda: nawet w świecie obiektów skończonych, formułując sądy rozpoczynane od frazy „dla

każdego” oczekujemy ich uzasadnienia bardziej zwięzłego niż kolejne uzasadnianie poszczególnych przypadków. Czyzaakceptujemy uzasadnienie sądu „każdy współcześnie żyjący człowiek ma swojego tatusia” przez osobne rozpatry-wanie kilku miliardów przypadków?48Równie pozbawione sensu jest mówienie o „kolejnym” wybieraniu elementów modelu, gdy jest nim np. nieprze-

liczalny zbiór liczb rzeczywistych.49w pierwszej i ostatniej regule zmienna x nie może być wolna w formułach ze zbioru Γ i w formule ψ. W drugiej i

trzeciej - t reprezentuje dowolny term.

Page 84: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 83

Konsekwencja w założeniowej logice zdaniowej to relacja między zdaniami50. A jak rozumiećrelację konsekwencji między formułami? Skoro formuły opisują własności, to odpowiedź nasuwasię sama: ψ ` φ oznacza, że każdy skończony ciąg elementów posiadający własność opisaną przezformułę ψ, ma też własność opisaną przez formułę φ.Jednak ta odpowiedź ma sens (i jest zgodna z naszą intuicją51) tylko wtedy, gdy formuły ψ i φopisują własności skończonych ciągów tej samej długości tzn. gdy w formułach ψ i φ mamy te samezmienne wolne. A jeśli ten warunek nie jest spełniony? Wtedy do akcji wkraczają... kwantyfikatory.

Oto inspirujące przykłady: „jeśli x jest żoną y, to - w konsekwencji - x jest kobietą”. To samo,ale nieco inaczej: „jeśli istnieje y taki, że x jest żoną y, to x jest kobietą”. Zapiszmy to formalnie:

żona(x, y) ` kobieta(x) ⇔ ∃y żona(x,y) ` kobieta(x)

Po prawej stronie równoważności mamy formuły mające te same zmienne wolne (jedną zmienną x).A po lewej już nie.Podobnie konsekwencją stwierdzenia (formuły) „x jest mistrzem” (świata w boksie) jest stwierdze-nie „x jest lepszy od y” - dla jakiegokolwiek y. Zastępując słowo „jakikolwiek” słowem „każdy”otrzymamy drugą równoważność, angażującą tym razem kwantyfikator uniwersalny:

mistrz(x) ` lepszy(x, y) ⇔ mistrz(x) ` ∀y lepszy(x, y)

I tutaj formuły po prawej stronie mają wspólną jedną zmienną wolną, a w formułach po lewejstronie liczby zmiennych wolnych są różne.

Te przykłady ilustrują kluczowe dla logiki założeniowej równoważności wyznaczające rolę kwan-tyfikatorów w tej logice:„dla dowolnych formuł φ(x) i ψ(x, y) (odpowiednio z jedną i dwoma zmiennymi wolnymi52):

(∗∃) ψ(x, y) `x,y φ(x) ⇔ ∃y ψ(x, y) `x φ(x)

(∗∀) φ(x) `x,y ψ(x, y) ⇔ φ(x) `x ∀y ψ(x, y)

Dodanie wskaźników do symbolu „`” ma uzmysłowić, że relacja konsekwencji ` jest w istocie ro-dziną relacji `x1,...xn - po jednej dla każdego skończonego zbioru zmiennych wolnych. Kwantyfikacjajest tym, co łączy te relacje.

Kwantyfikacja pozwala mówić o relacji konsekwencji między formułami o różnej liczbie zmiennych wolnychpoprzez redukcję do - intuicyjnie prostej - relacji konsekwencji między formułami o tej samej liczbiezmiennych wolnych.

I to jest to. Skąd pewność? Wystarczy spojrzeć na kwantyfikację od strony semantycznej. Dladowolnych zbiorów A,B mamy dwie (sugestywnie oznaczane) funkcje ∀B,∃B : 2A×B → 2B defi-niowane tak: dla dowolnego podzbioru C ⊆ A×B

∀B (C) = b ∈ B : (a, b) ∈ C dla dowolnego a ∈ A,∃B (C) = b ∈ B : (a, b) ∈ C dla pewnego a ∈ A

Pomóżmy sobie rysunkiem:53

????

∀B(C)∃B(C)

C

B ×A

50Tę realcję oznaczaliśmy symbolem Γ ` A - str. 7251„Logika jest pewna, ale nie tworzy niczego. Intuicja jest zawodna, ale twórcza” - H. Poincare52Ograniczenie do formuł z jedną i dwiema zmiennymi wolnymi podyktowane jest li tylko chęcią uproszczenia opisu.

Ważne jest to, że druga formuła ma o jedną zmienną wolną więcej niż pierwsza.

Page 85: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 84

Zbiory ∀B(C) i ∀B(C)×A można opisać unikając fraz „dla każdego” i „istnieje”:

∀B(C) to największy podzbiór B taki, że zbiór ∀B(C)×A - jest zawarty w C,∃B(C) to najmniejszy podzbiór B taki, że C ⊆ ∃B(C)×A.

co oznacza, że można te zbiory charakteryzować (jednoznacznie wyznaczyć) poprzez takie otorównoważności: dla dowolnych zbiorów C ⊆ A×B i D ⊆ B:

C ⊆ A×D wtw ∃B(C) ⊆ DA×D ⊆ C wtw D ⊆ ∀B(C)

Kwantyfikacja uniwersalna i egzystencjalna to - od strony semantycznej - operacje na podzbiorachproduktów. To spostrzeżenie jest decydujące dla zrozumienia istoty kwantyfikacji54.

Gdy zakresem zmienności zmiennych wolnych w formułach ψ(x, y) i φ(x) jest pewien zbiór A -czyli zbiór desygnatów formuły ψ(x, y) to podzbiór [[ψ(x, y)]] ⊆ A2 - a zbiór desygnatów φ(x) topodzbiór [[φ(x)]] ⊆ A , to te równoważności przybiorą taki kształt:

[[ψ(x, y)]] ⊆ [[φ(x)]]×A ⇔ ∃y[[ψ(x, y)]] ⊆ [[φ(x)]]

[[φ(x)]]×A ⊆ [[ψ(x, y)]] ⇔ [[φ(x)]] ⊆ ∀y[[ψ(x, y)]]

Podobieństwo do równoważności (∗∃) i (∗∀) nie wymaga komentarza... .

Dlaczego studenci nie kochają kwantyfikatorów?

Studenci wskażą zapewne inne powody braku sympatii do kwantyfikatorów: to trudności z budowa-niem wyobrażenia o cechach własności opisywanych przez formuły z kwantyfikatorami. To proste,gdy w formule jest pojedynczy kwantyfikator. Nie jest to też specjalnie trudne, gdy kwantyfikatorysą dwa: ∀x∃yφ(x, y) - „dla każdego elementu a (rozważanego modelu) można wskazać element btaki, że para (a, b) ma własność, opisaną przez formułę φ(x, y)”. Równie łatwo uchwycimy sensformuły ∃x∀yφ(x, y).

Schody się zaczynają55, gdy w formule buszuje całe stado kwantyfikatorów i to w sposób za-gnieżdżony. Co to znaczy? Np. w zdaniu ∃y(∀z(∃s(x+ s)w = y + z))) w zasięgu kwantyfikatora ∃yjest „zagnieżdżona” formuła z kwantyfikatorem ∀z(. . .) a wewnątrz niej - w zasięgu kwantyfikatora∀z - jest zagnieżdżona formuła z kwantyfikatorem ∃s . Stopień kwantyfikatorowy tego zdania toliczba 3. A stopień kwantyfikatorowy zdania ∀x∃y∀z∃t (xz = yt) to 4 .

Im większa głębokość zagnieżdżenia kwantyfikatorów, tym trudniej o intuicyjne wyobrażeniewłasności opisywanej przez formułę. Wielu studentów ma już kłopot ze zbudowaniem intuicji zwią-zanej z pojęciem granicy funkcji opisywanej formalnie za pomocą „koszmarnej” formuły:

∀x (x > 0→ (∃y ∀z (z > y → |f(z)− g| < x))

A to dlatego, że stopień kwantyfikatorowy tej formuły jest równy 3 56.Liczba schodów generała Wieniawy odpowiada głębokości zagnieżdżenia kwantyfikatorów...

A teraz wyobraźmy sobie formułę, której stopień kwantyfikatorowy to np. 17... Czy potrzebnajest nam niczym nieograniczona możliwość budowania skomplikowanych formuł, których sens namumyka? Czy sądy matematyczne formułowane za pomocą zdań, w których głębokość zagnieżdżeniakwantyfikatorów jest równa, powiedzmy, tysiąc, są istotne, ważne?To problem pozorny. Język to narzędzie, z którego korzystamy stosownie do potrzeb. Niesposób

53Nie ma to jak metafory geometryczne... .54Wrócimy do tego intrygującego tematu w rozdziale poświęconym teorii toposów.55„Skończyły się żarty, zaczęły się schody” - to słynne powiedzenie generała Wieniawy-Długoszewskiego. Jedna z

wersji tej anegdoty mówi, że powiedział to, gdy założył się, iż wjedzie konno po schodach na piętro hotelu Bristol.Inna, że wtedy, gdy - lekko zużyty - miał zejść z tychże schodów... .56Ta formuła definiuje „granicę funkcji f : R → R w +∞”. Liczba rzeczywista a jest taką granicą, jeżeli ta formuła

jest spełniona przy wartościowaniu [g := a] .

Page 86: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 85

przewidzieć, jak bardzo złożone formuły będą kiedyś komuś potrzebne. Język polski też nie ogra-nicza a priori długości wyrazów czy zdań co jednak nie oznacza, że będziemy kiedykolwiek tworzyćwyrazy złożone z tysiąca liter i skladać zdania z tysiąca słów57.Sensowne jest pytanie odwrotne: „jakie będą skutki ograniczenia złożoności formuł?” Dlatego lo-gicy rozważają słabsze logiki, w których użycie kwantyfikatorów jest ograniczone. Dotyczy to np.jednej z podstawowych teorii - arytmetyki58.

Dotatek: czy można pozbyć się kwantyfikatorów?

Bez wątpienia kwantyfikatory odpowiadają za to, że logika pierwszego rzędu (i, pośrednio, ma-tematyka) zniechęca zwykłych śmiertelników. Dostrzegano to już w starożytności. Kwadrat lo-giczny zdefiniowany i rozważany przez Arystotelesa to opis zależności między czterema zdaniami:∀x (φ(x)→ ψ(x)), ∃x (φ(x)∧ψ(x)), i ich negacjami - ¬∀x (φ(x)→ ψ(x)), ¬∃x (φ(x)∧ψ(x)) . Kwa-drat logiczny wskazuje, które pary utworzone z tych zdań są wzajemnie sprzeczne, wykluczającesię czy też dopełniające. Opanowanie tego fragmentu logiki pierwszego rzędu jest dla większościstudentów prawa koszmarem w czystej postaci ... 59.

Skoro kwantyfikatory są tak mało przyjaznym narzędziem opisu cech własności, to czy niemożna zastąpić ich czymś lepszym (zyskując dozgonną wdzięczność studentów)?Zacznijmy od przykładu: cechy definiujące relację równoważności - zwrotność, symetryczność iprzechodniość - opisaliśmy korzystając z kwantyfikacji60. Alternatywny opis tych cech jest możliwygdy przejdziemy piętro wyżej i wykorzystamy pewne operatory działające na relacjach. Np. złożenierelacji binarnych R,S ⊆ A2 to relacja R S taka, że a (R S) b gdy aR c i c S b dla pewnego c ∈ A.Łatwo stwierdzić, że relacja R jest przechodnia gdy R R = R . Gdy zechcemy podobnie opisaćsymetrię relacji, należy skorzystać z operatora odwracania relacji61. Relacja R jest symetryczna,gdy R−1 = R . R jest zwrotna gdy Id = (a, a) : a ∈ A ⊆ R.

Ten przykład pokazuje, o co chodzi w tzw. algebrach relacyjnych. „Relation algebra algebraizesthe fragment of first-order logic consisting of formulas having no atomic formula lying in the scope ofmore than three quantifiers. That fragment suffices (...) for Peano arithmetic and the axiomatic settheory ZFC” (wikipedia). „Algebraizacja” oznacza mniej więcej tyle, że wprowadzając do językaformuł operatory odpowiadające pewnym operacjom na relacjach, można za pomocą równości inierówności opisać te cechy własności, których pierwszorzędowym opisem są formuły o stopniukwantyfikatorowym ¬ 3. Tyle, że... w praktyce mało kto z tej możliwości korzysta. Może jednakkwantyfikatory mają swoje zalety?

W dyskusji o kwantyfikatorach i wywoływanych przez nie kłopotach trzeba też choćby wspo-mnieć o słynnym twierdzeniu Tarskiego o eliminacji kwantyfikatorów.Zacznijmy tak: w szkole nas uczono, że „równanie ax2 + bx + c = 0 ma rzeczywiste rozwiązaniedokładnie wtedy, gdy b2 − 4ac ­ 0”.

Logik powie, że to twierdzenie mówi o równoważności formuł ∃x (x1x2 + x2x+ x3 = 0) oraz

x22− 4x1x3 ­ 0 , w modelu (R,+, ·, 0, 1,¬)62. Dzięki tej równoważności trudne zadanie - stwierdze-

nie, czy istnieje pierwiastek rzeczywisty trójmianu - sprowadzamy do sprawdzenia prostej nierów-ności. Sens uproszczenia w tym, że „trudną” formułę z kwantyfikatorem zastąpiliśmy równoważną- w tym szczególnym modelu! - „łatwą” formułą bezkwantyfikatorową... .Skłonni jesteśmy przypuszczać, że przytoczony przykład to sytuacja szczególna. To nie do końcaprawda - Tarski udowodnił takie oto zdumiewajace twierdzenie:

57Co prawda Hilbert był Niemcem, a w języku niemieckim zdarzają się niemiłosiernie długie wyrazy... .58O czym powiemy (krótko) w rozdziale „Arytmetyka”.59Nie tylko dla prawników. Również dla studentów matematyki lektura wykładu „Logika dla prawników” jest

sporym wyzwaniem.60str. 8161aR−1b dokładnie wtedy, gdy bRa.62Tzn. formuła (∃x x1x2+x2x+x3 = 0) jest spełniona przy wartościowaniu x1 := a, x2 := b, x3 := c] (czyli trójmian

ax2 + bx+ c ma pierwiastek rzeczywisty) dokładnie wtedy, gdy druga formuła jest spełniona - gdy b2 − 4ac ­ 0.

Page 87: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 86

Dla dowolnej formuły φ języka pierwszego rzędu ze słownikiem zawierającym jeden symbolrelacyjny dwuargumentowy „¬”, dwuargumentowe symbole operacyjne +, ·,− i stałe 0, 1 istniejeformuła bezkwantyfikatorowa ψ, która jest jej równoważna w modelu (R,+, ·, 0, 1,¬)”

Opisując pierwszorzędowe własności tego podstawowego obiektu matematyki, możemy się obyćbez kwantyfikatorów! Życie (matematyka zajmującego się liczbami rzeczywistymi) jest piękne!

Ostudźmy entuzjazm. Dowód twierdzenie Tarskiego to opis procedury zastępowania danej for-muły przez formułę bezkwantyfikatorową, równoważną w modelu (R,+, ·, 0, 1,¬). Tyle tylko, że taprocedura jest niesłychanie złożona, co czyni ją praktycznie bezużyteczną. Jak bardzo? Procedurazerojedynkowej weryfikcji tautologii w klasycznej logice zdaniowej ma złożoność wykładniczą: gdyw formule mamy n zmiennych zdaniowych to sprawdzenie, czy jest ona tautologią, wymaga 2n

testów. A to np. dla n = 20 oznacza nieskromną wielkość 220.Złożoność procedury Tarskiego jest nieporównywalnie większa: nie można jej ograniczyć żadną

liczbą postaci 2222...

.... 63.

Kwantyfikatory to nie jest diabelski wynalazek - wprowadził je do logiki Gottlob Frege.Kwantyfikatory nie są źródłem trudności. One tylko ujawniły naturalne trudności tkwiące w języku wktórym używamy fraz „dla każdego” i „istnieje”.

5.3.2 Dodatek: zmienne w informatyce

Czy zmienna w informatyce jest tym samym, co w matematyce? To zależy. Jeżeli myślimy o pro-gramowaniu deklaratywnym, to tak. Ale jeśli mamy na uwadze najpopularniejsze programowaniuimperatywne (np. w Javie) to nie. Nawet zdecydowanie nie.Język matematyki to język zdań orzekających, których semantyką jest wartość logiczna. Formułyto schematy zdań. Język programowania imperatywnego to język poleceń, zdań rozkazujących. Se-mantyką polecenia jest zmiana stanu (komputera). Taki stan to wektor złożony z zawartości wielumiejsc w jego pamięci -„kontenerów”. W zapisie imperatywnego programu „zmienna” pojawia sięjako identyfikator ( adres) takiego kontenera a podstawowym poleceniem programowania impera-tywnego jest instrukcja przypisania - włożenie do kontenera o danej nazwie konkretnej wielkości.Zawartość kontenera wskazywanego przez daną zmienną może być wielokrotnie zmieniana w czasierealizacji programu - możemy np. umieścić w programie polecenie „x := x + 1”. A to, jak widać,ma się nijak do roli jaką przypisujemy zmiennym w logice i matematyce64.

5.4 Skąd się biorą teorie?

Matematyk jest wynalazcą, nie odkrywcą.L. Wittgenstein65

Euklides aksjomatyzując geometrię był przekonany, że to teoria opisująca byty idealne (pla-tońskie). Używając sformułowania R. Penrose, geometria Euklidesa była dla antycznych Grekówlogiczną koniecznością - rezultatem poszukiwań adekwatnego opisu fragmentu (idealnej) rzeczy-wistości [87] . Podobnie rachunek różniczkowy był budowany przez Newtona jako matematycznateoria wspomagająca klasyczną fizykę w jej próbach opisu rzeczywistości. Tak rozumiana twórczość

63Pięknie to brzmi po angielsku: „its time complexity is greater than all finite towers of powers of 2.” Idea dowodutwierdzenia o eliminacji kwantyfikatorów jest zwodniczo prosta: pokazuje się, że w każdej sytuacji można zastąpićformułę kształtu ∃xφ - gdzie φ jest koniunkcją formuł atomowych i ich zaprzeczeń - przez pewną formułę bezkwan-tyfikatorową.64Użycie wspólnego terminu dla tak odmiennych funkcjonalnie pojęć jest przyczyną dramatycznego zamieszania

w głowach studentów informatyki, Nie tylko nie rozróżniają ról zmiennych w matematyce i informatyce, ale - wogromnej większości przypadków żadnej z nich nie rozumieją. Probabliści też nieźle zamieszali: u nich „zmiennalosowa” to nazwa... pewnej funkcji.65„Uwagi o podstawach matematyki”. W 1939 roku Wittgenstein prowadził wykład poświęcony podstawom mate-

matyki, którego słuchaczem był A.Turing, jedna z głównych postaci tego tekstu.

Page 88: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 87

matematyczna jest odkrywaniem, poszukiwaniem odpowiedzi na pytanie „czym jest rzeczywistość(fragment rzeczywistosci) która postrzegamy”? Sposobem matematyków na udzielenie prawidłowejodpowiedzi jest stworzenie języka pozwalającego wiernie modelować rzeczywistość.

Postrzeganie teorii matematycznych jako logicznych konieczności dominowało aż do XX wieku.Ale „For many philosophers, including Kant, would assert that the correct question is not “Whatis a thing?” but rather „What is a thing as it appears to us?” [27]. Historia matematyki (nauki)potwierdza, że tworząc teorie i modele matematyczne nie opisujemy rzeczywistości ale nasze jejpostrzeganie.

Matematyk przestał być odkrywcą (rzeczywistości). Stał się wynalazcą (sposobu jej postrzegania).

Teorie matematyczne można dzielić (choćby na użytek tego tekstu) na te o charakterze rewo-lucyjnym i pozostałe, wpisujące się w ewolucyjny rozwój matematyki. Tych pierwszych nie jest ażtak wiele - teorie Euklidesa i Newtona (pamiętając wszak o Leibnizu), dzieło Kartezjusza, arytme-tyka Peano i oczywiście teoria mnogości66. Te rewolucyjne teorie są przejawem ludzkiego geniuszuujawniającego się - w matematyce - poprzez stworzenie nowego języka opisu rzeczywistości.Teorie „nierewolucyjne” tworzone są w ramach zastanego języka. Z formalnego punktu widzeniastworzenie podstaw nowej teorii matematycznej tego typu to rozszerzenie logiki języka przez przy-jęcie aksjomatów specyficznych - zdań, których prawdziwość nie wynika z ich struktury a jestapriorycznie przyjętym założeniem. Ale tak naprawdę punktem wyjścia do budowy takich teorii sązazwyczaj nieźle rozpoznane pojedyncze obiekty lub klasy obiektów. Na którymś tam etapie badańtakiego obiektu (lub ich klasy K ) ktoś - twórczy matematyk lub ich grupa - nabiera przekonania,że warto wyróżnić i przyjrzeć się bliżej pewnemu zespołowi własności i wybranym cechom jakie tewłasności mają we wszystkich obiektach rozważanej klasy. Pierwszorzędowy opis tych wspólnychcech to zbiór aksjomatów specyficznych Ax(K) - zaczątek teorii, którą możemy nazwać „pierwszo-rzędową teorią klasy K”.

Tak było zapewne w przypadku opisanej wcześniej teorii grup dla której modelami zamierzonymibyły geometryczne grupy symetrii i struktura liczb całkowitych (str. 45 i 82). 67. Dziś wiemy, żegrup - modeli teorii grup - jest „nieskończenie wiele” i wielokrotnie są one bardzo odległe od intuicjizwiązanych z pierwowzorem.

W swych wyborach matematycy kierują się doświadczeniem i intuicją. Ale intuicja bywa zawodna ( Poin-care). Na każdą teorię, która znajduje trwałe miejsce w matematyce, przypada kilkanaście (kilkadziesiąt?)odrzuconych i zapomnianych... . O tym, które teorie „przeżyją” decyduje ich celowość.

Celowość jest niezbywalnym warunkiem uprawiania nauki68.

5.4.1 Rozwój teorii matematycznej

Przypuśćmy, że przedmiotem naszego zainteresowania jest pewna klasa obiektów K opisanych wjęzyku pierwszego rzędu. Celem matematyków jest poznanie teorii tej klasy - zbioru Th(K) wszyst-kich zdań które można sformułować w tym języku i które są prawdziwe we wszystkich obiektach

66Ta lista jest - w sposób zamierzony - niekompletna, subiektywna i dyskusyjna. Chętnie bym np. dołączył do tejniej teorię toposów o której tu będzie mowa, ale na to chyba za wcześnie.67Kant o aksjomatach: ,These are synthetic a priori principles, insofar as they are immediately certain”. Ważną - z

psychologicznego punktu widzenia - cechą teorii aksjomatycznej jest też (względna) prostota wybranych aksjomatów.Matematycy, podobnie jak wielu filozofów, są głęboko przekonani, że to, co ważne, może (musi) być wyrażone prosto.Trafnie (choć z dużą dozą sarkazmu) pisał o tym L. Susanka w [115]: „Axioms are supposed to be so pellucidly,limpidly (przejrzyście i klarownie) clear that any fool(...) would acclaim their necessity and validity”.68Młodym adeptom nauki uprzejmie donoszę, że celem nie jest „zrobienie” doktoratu czy habilitacji... .

Konieczność celowości działania w matematyce jest negowana przez konwencjonalistów. Najbardziej radykalny spo-śród nich, Edouard Le Roy (1870-1954), uważał, że nauka jest subiektywnym tworem naukowca. Umiarkowanymzwolennikiem konwencjonalizmu był Poincare, który (upraszczam!), uznawał swobodę wyboru systemów aksjoma-tycznych. Konwencjonalistą był też polski filozof, Kazimierz Ajdukiewicz.

Page 89: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 88

tej klasy. Podstawą hilbertowskiej wizji uprawiania matematyki było przekonanie, że dla dowolnejklasy K można wskazać rozstrzygalny zbiór Ax(K) tak, by każde zdanie języka opisu, które jestprawdziwe w klasie K było dowodliwą konsekwencją tych aksjomatów:69

Th(K) = Con(Ax(K))

Sądzono, że dla każdego pojedynczego obiektuA - takiego jak np. liczby naturalne z dodawaniemi mnożeniem - możliwa jest równość Th(A) = Con(Ax(A)) dla odpowiednio dobranegoi rozstrzygalnego zbioru aksjomatów Ax(A). To miała być realizacja paradygmatu „istnienie(matematycznego) bytu = niesprzeczny i pełny opis”.

Te marzenia zniweczył Godel - opowiemy o tym nieco później. Dziś wiemy, że - poza wyjątko-wymi sytuacjami - zamiast oczekiwanej równości mamy tylko zawieranie - Con(Ax(K)) ( Th(K) .

Nie wszystko, co prawdziwe, jest dowodliwe... . Finitarna kontrola nad matematyką jest niemożliwa.

Zbiór dowodliwych konsekwencji aksjomatów jest potencjalnie nieskończony70. Może się więczdawać, że rozwój każdej teorii aksjomatycznej to proces nieskończony. Ale teorie powstają, żyją i ...umierają. Niesposób twierdzić, że udowodnienie jakiegokolwiek twierdzenia oznacza rozwój teorii.Ważne są tylko te twierdzenia, które są ważne. Teorie wyczerpują się gdy społeczność matematykówuzna, że wszystko co ciekawe zostało już - w ramach danej teorii - udowodnione. I nie próbujmynawet ustanowić kryterium ważności71. Międzynarodowa społeczność matematyków potrafi ocenićwagę danego wyniku. Wprawdzie współistnienie obu czynników - swobody twórczej jednostek i spo-łecznej akceptacji ich pracy - czasem zgrzyta (pewne ważne wyniki nie od razu zostają dostrzeżonei docenione, obiektywny osąd społeczny zamienia się w ład korporacyjny), ale przecież to jakośdziała. Od tysięcleci....

To, że formalna logika jest mało przydatna w ocenie celowości teorii czy wagi matematycznegowyniku specjalnie nie dziwi. Dziwić może kolejne stwierdzenie, że logika ma niewiele wspólnegoz procesem dowodzenia twierdzeń. Weyl jako podstawowy element procesu poznania wskazy-wał intuicję, pozostawiając dowodzeniu jedynie rolę weryfikatora poprawności. Stefan Banach72

pisał: „Dobry matematyk potrafi dostrzegać fakty, matematyk wybitny – analogie między fakta-mi, zaś matematyk genialny – analogie między analogiami.” Dowodzenie angażuje naszą wiedzę,doświadczenie, inteligencję i intuicję. W procesie przeszukiwania wielowymiarowej przestrzeni ma-tematycznej wiedzy ujawnia się ludzki intelekt. A czasem geniusz. Formalny zapis dowodu to tylkodokumentacja, opis rezultatu działania, nie informujący w żaden sposób o jego przebiegu. Sporzą-dzany zazwyczaj post factum, gdy redagujemy artykułu przeznaczony do publikacji.

“No, no, you’re not thinking; you’re just being logical.” - N. Bohr. „Dowód formalny ma dla nas senstylko dlatego, że u jego źródeł jest dowód nieformalny” 73.„Gauss opowiadając o twierdzeniu, które usiłował bezskutecznie dowieść przez szereg lat, pisał: „w końcu(...) udało mi się osiągnąć rezultat i to nie dzięki moim bolesnym wysiłkom, ale za sprawą łaski Boga... -J.Hadamard, Psychologia odkryć matematycznych..

Studenci zakuwający formalne zapisy dowodów nie mają szans na zrozumienie matematyki. Niewidzą najważniejszego - jak dowód powstawał. „To really understand something, I believe that onemust discover it oneself, not learn it from anyone else” - G. Chaitin.

Być może to o tych nierozpoznanych procesach myślał Wittgenstein sprzeciwiając się progra-

69Bez warunku rozstrzygalności zbioru aksjomatów zadanie jest trywialne: wystarczy za aksjomaty przyjąć wszyst-kie zdania prawdziwe w klasie K.70Udowodnione dotąd twierdzenia są - coraz większą - częścią zbioru „potencjalnie dowodliwych” twierdzeń.71Dowodzenie twierdzeń niczego nie wnoszących do rozwoju teorii to tzw. przyczynkarstwo. To pokłosie obowiązu-

jącej od kilkudziesięciu lat w świecie nauki zasady „publikuj albo giń”. A próby polegające na mierzeniu wagi wynikuliczbą cytowań są tylko dowodem postępującej żałosnej biurokratyzacji nauki.72Stefan Banach (1892-1945) najwybitniejszy polski matematyk, jeden z twórców lwowskiej szkoły matematycznej.73- S.Krajewski,Czy matematyka jest nauką humanistyczną

Page 90: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 89

mowi logicyzacji matematyki i Lakatos nazywający matematykę nauką quasi-empiryczną [78].

Istota twórczości matematycznej wymyka się formalizacji.Czy intuicja i nieokreślone zdolności matematyczne są dziś, w epoce nowoczesnych technologii,

niezbędne? Może wystarczy dla danej teorii zbudować program, który będzie generował coraz todłuższe dowody a rolę człowieka ograniczyć do wyboru tych twierdzeń, które uzna za interesujace?

To niedorzeczność. Lepiej: to kwestia skali. Istotne twierdzenia to znikomy, niewyobrażalniemały ułamek tego, co formalnie dowodliwe. Równie dobrze można nauczyć komputer składanialiterek i oczekiwać, że kiedyś przedstawi nam taki tekst, a my go odnajdziemy w morzu bełkotu:

And sometimes when the night is slow,The wretched and the meek,We gather up our hearts and go,A Thousand Kisses Deep.74

W tym porównaniu nie ma żadnej przesady... Matematyka jest nauką. Nauka jest sztuką wyboru idoboru. Wyboru celu i doboru środków. Tego komputer nie potrafi.

Uniwersum matematyczne to domena intuicji i twórczości.Język matematyki i jego logika to tylko pewność i kontrola

5.4.2 Trzeci wymiar języka

Powszechnie przyjętym obyczajem matematyków jest operowanie nic nie mówiącymi, „neutralnymi”symbolami. Skutkiem tego jest odarcie zapisów sporządzanych w języku formalnym z kontekstu(emocjonalnego, kulturowego). Dlatego matematyczna formalizacja to dla wielu przeszkoda wysokajak K275. Porównajmy: zapis

∀x (s(x) −→ (∀y p(y)→ ∃z (d(z) ∧m(z, y) ∧ k(z, x))))

nie wywołuje żadnych skojarzeń. Jest, mówiąc wprost, okropny... A przecież przy odrobinie dobrejwoli można uznać, że jest to zapis zdania:

„Każdy żeglarz ma w każdym porcie dziewczynę, która go kocha”tyle, że pozbawiony pozamatematycznego kontekstu...76

Porzućmy dyskusję o urokach (trudach) życia żeglarzy. Oto formalna teoria, w której jezykumamy dwa symbole relacji jednoargumentowych - „p, l” - i jeden symbol relacji dwuargumentowej- „∈”:

∀x(p(x) ∨ l(x) ∧ ¬(p(x) ∧ l(x))∀x,y (x ∈ y)→ (p(x) ∧ l(y)),

∀x,y (p(x) ∧ p(y) ∧ (x 6= y))→ ∃z (x ∈ z) ∧ (y ∈ z)∀x,y (p(x) ∧ l(y) ∧ ¬(x ∈ y))→ ∃z (z||y) ∧ (x ∈ z)

(z||y jest tu skrótem formuły (l(y) ∧ l(z) ∧ ¬(∃w (w ∈ x) ∧ (w ∈ y))

∃x,y,z (x 6= y) ∧ (x 6= z) ∧ (y 6= z) ∧ ∀w (l(w)→ (x /∈ w) ∨ (y /∈ w) ∨ (z /∈ w))

Oczy bolą a rozum śpi... Można „to” przeczytać, ale tej lekturze nie towarzyszy żadna intuicja.Teraz powiedzmy to samo inaczej: geometria afiniczna to teoria operująca dwoma pojęciami pier-wotnymi - „punkt” i „prosta”77 - i opisująca cechy własności „punkt leży na prostej” (lub: „prostaprzechodzi przez punkt”) reprezentowanej przez formułę x ∈ y . A formułę-skrót z||y czytamy:„proste z i y są równoległe”.

Aksjomaty geometrii afinicznej sformułujemy teraz - w języku polskim - tak:

Ax I. Dla dowolnej pary różnych punktów istnieje dokładnie jedna prosta przez nie przechodząca.74A czasem, gdy wlecze się noc, nieszczęśni i wyciszeni, zabieramy nasze serca i wędrujemy, w głębię tysiąca

pocałunków. - L. Cohen, A thousand kisses deep75K2 (8611m) - drugi najwyższy szczyt na świecie.76s(x) ≡ ,,x jest żeglarzem", p(y) ≡ ,,y jest portem". Itd...77Formuła p(x) jest spełniona przy wartościowaniu [x := a] gdy a jest punktem, a formuła l(x) - gdy a jest linią.

Page 91: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 90

Ax II. Dla dowolnej prostej P i punktu a poza tą prostą istnieje dokładnie jedna prosta przecho-dząca przez a i równoległa do P .Ax III. Istnieją trzy punkty nie leżące na jednej prostej.

Wyobraźnia została pobudzona - „widzimy” punkty i linie. Odtąd nie uwolnimy się od tej geo-metrycznej interpretacji. To dobrze i źle. Dobrze, bo bez wyobraźni nie ma twórczości. Źle, bodominacja jednej interpretacji przeszkadza. Np. wtedy, gdy napotkamy twierdzenie o istnieniu mo-delu tej teorii, który ma cztery punkty i sześć linii (spróbuj go skonstruować...). Ale wystarczytylko trochę ostrożności, by nie dać się zaprowadzić zbyt daleko w stronę specyficznych cech takwyróżnionego modelu.

Rozwój teorii matematycznej to nie tylko poszukiwanie konsekwencji jej aksjomatów ale teżrozbudowa języka. Każda teoria ma swój podstawowy słownik: pojęcia-nazwy pewnych operacji iwłasności niezbędnych do sformułowania jej aksjomatów. Np. w arytmetyce są to „dodawanie”,„mnożenie”, „następnik” i „zero” 78. Ale przecież mówimy też o np. o liczbach pierwszych, owłasności „być liczbą pierwszą”. Formułę reprezentujacą tę własność wprowdzic do języka jakoskrót złożonej formuły „czystego” języka arytmetyki:

prime(x)↔ ((x > succ(0)) ∧ ∀y ((∃z x = y · z)→ (y = succ(0) ∨ y = x)))

„prime(x)” jest formułą należącą do rozszerzonego języka arytmetyki 79. Wprowadzenie tego skrótupozwala zapisać zdanie:

∀z ∃x ((z < x) ∧ (x > succ(0)) ∧ ∀y (∃z x = y · z → (y = succ(0) ∨ y = x))które mówi, że „dla dowolnej liczby (naturalnej) istnieje liczba pierwsza od niej większa”, w zde-cydowanie bardziej przyjazny sposób:

∀z∃x (z < x) ∧ prime(x)W ten sam sposób wprowdzimy do języka pojęcia liczba parzysta, doskonała i inne używane warytmetyce a nie należące do jądra tego języka..

Wprowadzanie nazw-skrótów nakrywających złożoną treść jest koniecznością. Tylko tak można poko-nać trudności związane z interpretacją formuł, których stopień zagnieżdżenia kwantyfikatorów jest zbytwysoki, by były one czytelne.

Trafnie wybrana nazwa uruchamia skojarzenia - jeden z podstawowych elementów procesu twór-czego myślenia. Twórcze zdolności mózgu (sieci neuronowej) zależą nie tyle od liczby neuronów,ale od powiązań między nimi. Używany nie tylko w matematyce zwrot „kluczowe pojęcie” możnarozumieć dosłownie, jako klucz do nowych obszarów badań. Jeden z moich mistrzów mawiał:

„w matematyce definicje są równie ważne jak twierdzenia. A nawet ważniejsze.”

„Trzeci wymiar” języka teorii matematycznych to próba odzyskania zagubionego kontekstu, wzbogaceniaformalnego zapisu o warstwę wyobrażeniową.Twórczość matematyczna dzieje się w trzecim wymiarze języka. Ockhamowska oszczędność jest pożądanatylko przy formułowaniu podstaw teorii. Język badań może i powinien być „nadmiarowy”.Kant uważał zdolność tworzenia pojęć (rozszerzania języka poprzez nazwy) za istotę naszego intelektu80.

Język matematyki nie ogranicza się do stwierdzeń a zależności między nimi do konsekwencji lo-gicznej. Jego struktura jest bardziej złożona, nieuchwytna. „To tworzywo czasami jasne... a czasemniewyraźne... które jest matematyką...” - pisał pięknie Lakatos81.W odróżnieniu od beznamiętnego języka formalnego, w trzecim wymiarze komunikacji matema-tycznej jest miejsce na subiektywizm. Matematyka nie jest izolowana, jest uprawiana w pewnymkontekście kulturowym. „Możliwość uchwycenia tego samego sensu dokonuje się prawie automa-tycznie (...) pomiędzy ludźmi z tego samego kręgu kulturowego” - napisał Z. Król w eseju Rozwój

78Patrz str. 98.79Zamiast o „czystym” i rozszerzonym” języku teorii mówi się też o jego „jądrze” i „powłoce”.80A zdolność wyciągania wniosków wybiegających poza materiał doświadczenia za istotę rozumu.81Imre Lakatos (1922 - 1974) – węgierski filozof matematyki.

Page 92: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 5. JĘZYK MATEMATYKI 91

pojęcia zbioru” (internet). Wyobraźnia matematyków poszukujących nazw wywołujących pożądaneskojarzenia jest nieograniczona. Mamy „wiązki”„,snopy”, „źdźbła”, „kiełki” , „orbity”, „kołczany”„semirury”, „atlasy” „łańcuchy”, „przestrzenie nakrywające” itp. Poza gronem wtajemniczonychte nazwy budzą uśmiech, respekt i ... skutecznie budują legendę matematyki82.

Trzeci wymiar języka jest też... nadużywany. Nazwanie elementów najmniejszego zbioru induktywnegoliczbami naturalnymi to świadomy zabieg, który ma budować przeświadczenie, że w języku teorii mnogościnie opisujemy, ale kreujemy liczby naturalne.

Tę nieusuwalną różnicę między subiektywnym językiem twórczości a obiektywnym językiemdokumentowania i rozpowszechniania jej rezultatów dostrzegał już Platon. Pisał: „...ten wynala-zek niepamięć w ludzkich duszach posieje, bo człowiek, który się tego wyuczy, przestanie ćwiczyćpamięć; zaufa pismu i będzie sobie przypominał wszystko z zewnątrz, ze znaków obcych jego isto-cie. (...) Uczniom swoim dasz tylko pozór mądrości, a nie mądrość prawdziwą. (...) będzie im sięzdawało, że wiele umieją (...); to będą mędrcy z pozoru a nie ludzie mądrzy naprawdę83.

Żaden zapis formalny nie odda subtelnej wiedzy o strukturze matematyki w stopniu choćbyzbliżonym do tego, jak potrafi to robić mistrz w czasie wykładu. Wie to każdy, kto miał szczęścieuczestniczyć w dobrym wykładzie czy twórczym seminarium84. Jego uczestnicy biorą udział wpełnym emocji i wahań procesie dochodzenia do rezultatu, do wyniku matematycznego. Pozostaliskazani są na nużącą lekturę drukowanych sprawozdań, czyli prac naukowych85

Umiejętne wykorzystanie trzeciego wymiaru języka matematycznego ma ogromne znaczenie w nauczaniumatematyki. Nie wolno uczyć matematyki w sposób przesadnie sformalizowany - to pewna klęska.„Środek przekazu jest przekazem”. Również w matematyce86.

Opowieść o trzecim wymiarze języka będzie bardziej naukowa gdy odwołamy się do semiotyki(„ogólnej teorii znaków”). Jej twórca - Ch.W.Morris - wyróżniał trzy składowe semiotyki - syntak-tykę, semantykę i pragmatykę. O syntaktyce i semantyce mówimy tu dużo, o pragmatyce - pozatym skromnym rozdziałem - nic. „Pragmatyka bada relacje zachodzące między znakiem a jegoużytkownikami” (wikipedia). Nie da się ukryć - formalistycznie postrzegana matematyka tę relacjęlekceważy. Trzeci wymiar języka to próba wypełnienia tej luki.W informatyce jest już inaczej - nie wystarczy zaprojektować kolejny język programowania - trze-ba go jeszcze sprzedać. A to oznacza, że trzeba się starać by był on user friendly - przyjaznyużytkownikowi...87

Ale nie twórzmy złudzeń: „To mathematize is to place physical reality beyond the possibilityof perception, to make it perceptually inaccessible.” - jak napisano w pewnym dziele poświęconymzwiązkom fenomenologii i matematyki.

82Czasem jest dziwnie: dlaczego po angielsku mówimy „field” a po polsku „ciało”? Trudno zrozumieć Anglików...83Platon, Fajdros. Cytuję za [74]. Tamże można odnaleźć też takie zastanawiające zdanie: „język jest metaforą w

tym sensie, że nie tylko przechowuje lecz przenosi doświadczenia z jednej formy w drugą”.84„Uczestniczyć”, a nie „być obecnym”. Wykład to interakcja między wykładowcą a słuchaczami.85Kilkanaście wieków po Platonie Goethe napisał: „Słowo umiera pod piórem...” (Faust).86Zachęcam do lektury jeszcze jednego tekstu McLuhana: „Joyce, Mallarme i prasa” [74] w którym można znaleźć

taki fragment: „Druk zwielekrotnił liczbę uczonych ale pomniejszył ich społeczną i polityczną rolę. (...) Jeśli tradycjarękopisu zachęcała do encyklopedyzmu, to kultura książkowa w sposób naturalny skłaniała do specjalizacji. Istniałodostatecznie dużo książek, by czytanie stało się pełnoetetowym zajęciem oraz zapewniało całej klasie uczonych zupełnezamknięcie się w sobie i życie w izolacji. W końcu liczba książek była na tyle wystarczająca, żeby rozdzielić czytającąspołeczność na wiele nie komunikujących się ze sobą grup. (...). Naszą kulturę cechuje duży stopień nieznajomościznaczenia i kierunków jej rozwoju”..87Być może to właśnie informatyka uświadomiła naukowcom, iż kończy się w nauce era „splendid isolation” w której

bariera językowa oddzielająca ich od reszty śmiertelników była uważana za coś oczywistego i niemal niezbędnego...

Page 93: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 6

Arytmetyka

(...) in the study of the foundation of mathematics, arithmetic and settheory are two of the most important first-order theories; indeed, theusual foundational development of mathematical structures begins withthe integers as fundamental and from these constructs mathematical con-structions such as the rationals and the reals. S. Buss [16]

Popatrzymy, jakie cechy struktury liczb naturalnych Russell uznał za kluczowe [99]:

- „zero nie jest następnikiem żadnej liczby”,- „każda liczba różna od zera jest następnikiem dokładnie jednej liczby”,- „wszelka własność, która przynależy zeru oraz następnikowi każdej liczby, która posiada tę

własność, przynależy wszystkim liczbom”,

Dwa pierwsze stwierdzenia to opis struktury rekurencyjnej odpowiedzialnej za generowanie liczbnaturalnych - zero to wielkość początkowa, a następnik to konstruktor1.

Trzecie zdanie to zasada indukcji2. Jej sens można ująć tak: uznanie struktur rekurencyjnychoznacza zgodę na konstruowanie potencjalnie nieskończonych zbiorów. Kto tej maszynerii będzieużywał, chciałby też dysponować narzędziem umożliwiającym orzekanie o wspólnych własnościachwszystkich obiektów, jakie w ten sposób zbuduje.

W języku struktur rekurencyjnych zasadę indukcji formułujemy tak:

„jeśli wielkości początkowe mają pewną własność W i zastosowanie konstruktora do obiektówposiadających własność W tworzy obiekt posiadający tę własność, to mamy prawo twierdzić, że

każdy obiekt utworzony za pomocą tej struktury rekurencyjnej ma własność W 3 .

Czym jest zasada indukcji? Odpowiedź nie jest jednoznaczna. Russell traktował indukcję jakoniezbywalny składnik definicji liczb naturalnych. Podobnie Poincare - on uznawał tę zasadę jakoistotę intuicyjnego wyobrażenia tych liczb.Odpowiadając na to pytanie „wewnątrz” teorii mnogości nie mamy wątpliwości: to łatwe do udo-wodnienia twierdzenie, które mówi o szczególnej własności najmniejszego zbioru induktywnegoN4: jeżeli A ⊆ N jest podzbiorem takim, że:

- ∅ ∈ A,- dla dowolnego zbioru B: jeśli B ∈ A to również B ∪ B ∈ A,

to A = N.

Dla zwolenników teorii mnogości ten wynik jest potwierdzeniem, że najmniejszy zbiór induktywny jest

1W [99] rozdział poświęcony liczbom naturalnym w [99] zatytułowano „Ciąg liczb naturalnych”, a nie „Zbiór liczbnaturalnych”...2Zasada indukcji to nie wynalazek XIX wieku. Ślady jej użycia odnaleziono już w pracach arabskiego matematyka

Al-Karaji’ego (tego, od którego pochodzi nazwa „algebra”) żyjacego w X wieku.3Zasadę indukcji odniesioną do dowolnych struktur rekurencyjnych nazywamy „indukcją strukturalną”.4Przypomnijmy, że najmniejszy zbiór induktywny to - dla teoriomnogościowców - zbiór liczb naturalnych.

92

Page 94: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 93

zbiorem liczb naturalnych.Dla sceptyków ten wynik jest jedynie konieczny - bez niego niesposób twierdzić, że teoriomnogościowadefinicja opisuje liczby naturalne.

W tym teoriomnogościowym twierdzeniu termin „własność” został zastąpiony przez „podzbiór”.To jest zgodne z ekstensjonalnym rozumieniem własności. Intensjonalne rozumienie tego terminumusi być poprzedzone zdefiniowaniem języka w którym chcemy opisywać własności liczb natural-nych. Takim językiem jest „od zawsze” język arytmetyki.

6.1 Język arytmetyki

Język arytmetyki to znane ze szkoły wyrażenia (czyli termy) i formuły arytmetyczne. Teraz opi-szemy go w sposób uporządkowany, jako przykład języka pierwszego rzędu.

Rekurencyjny język termów (wyrażeń) arytmetycznych - WA - opisujemy tak:

x ∈WAx ∈ Zm,

0 ∈WA

t ∈WA

succ(t) ∈WA

t1, t2 ∈WA

(t1 + t2) ∈WA

t1, t2 ∈WA

(t1 · t2) ∈WA

gdzie Zm to ustalony zbiór zmiennych przedmiotowych5.

Będziemy pisać n zamiast succ(succ(. . . (succ(0) . . .))︸ ︷︷ ︸n

. Np. 2 zamiast succ(succ(0)) .

Najprostsze, („atomowe”) formuły arytmetyczne to równości i nierówności - napisy postaci(t = p) lub (t ¬ p), gdzie t i p to termy.

Formuły arytmetyczne budujemy rekurencyjnie z formuł atomowych: jeżeli napisy φ i ψ są formu-łami, to formułami są też napisy:

(φ ∧ ψ) , (φ ∨ ψ) , (φ→ ψ) ,¬φ , ∀xφ , ∃xφ

W formułach ∀xφ , ∃xφ zmienna x jest związana.Zdanie arytmetyczne to formuła, w której wszystkie zmienne są związane.

Formuły arytmetyczne opisują, a jakże, własności arytmetyczne: „własność opisana przez formułęφ(x1, . . . , xn) przysługuje liczbom naturalnym m1, . . . ,mn wtedy i tylko wtedy, gdy formułaφ(x1, . . . , xn) jest spełniona dla wartościowania [x1 := m1, . . . xn := mn]”6

Np. formuła even(x) ≡ ∃y (x = y + y) opisuje „własność parzystości” - jest spełniona przy warto-ściowaniu [x := m] wtedy, gdy liczba m jest parzysta. Jej zaprzeczenie - formuła ¬(∃y x = y + y))- opisuje nieparzystość. A formuła prime(x) ≡ (x > 1)∧ (∀y (∃z x = yz)→ (y = 1∨ y = x)) opisujewłasność „jestem liczbą pierwszą”.

I to o własnościach arytmetycznych należy myśleć czytając russellowską definicję indukcji matematycznej.

Zdania arytmetyczne opisują cechy własności arytmetycznych. I tak zdanie ∀x(prime(x) ∧even(x))→ (x = 2) orzeka, że jedyną parzystą liczbą pierwszą jest 2.

Arytmetyczny podzbiór A ⊆ Nk to zbiór desygnatów jakiejkolwiek formuły arytmetycznejφ(x1, . . . , xk) - zbiór ciągów liczb posiadających własność opisaną przez tę formułę7.

5Przyjmujemy, że będą to końcowe litery alfabetu x, y, z, . . . używane w razie potrzeby wraz z indeksami, np.x1, x2, y2, z4 . . ..6Tu i dalej napis φ(x1, . . . , xn) oznacza, że mamy do czynienia z formułą, której zmienne wolne są w zbiorze

x1, . . . , xn.7Oczywiście nie każdy podzbiór N jest arytmetyczny: zbiorów arytmetycznych jest nie więcej niż napisów-formuł,

czyli „tylko” przeliczalnie wiele.

Page 95: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 94

Język arytmetyki ma swój model zamierzony (standardowy): jest to najmniejszy zbiór induk-tywny N8.

Zbiór zdań arytmetycznych prawdziwych w standardowym modelu liczb naturalnychto arytmetyka zupełna.

Arytmetyka zupełna - Th(N) - jest pełna - dla dowolnego zdania arytmetycznego φ albo ono albojego zaprzeczenie należy do Th(N) - jest prawdziwe bądź fałszywe w modelu standardowym.

To stwierdzenie wydaje się oczywiste. Ale tylko wtedy, gdy akceptujemy aprioryczne stwierdzenie, że każdezdanie opisujące własności pojedynczego obiektu matematycznego musi być prawdziwe lub fałszywe.A dlaczego nie? Zamiast odpowiedzieć, zapytam: a dlaczego tak?9

6.2 Ważne pytanie

Czy potrafimy orzekać, że własność opisana przez formułę arytmetyczną φ(x1, . . . , xk) przysługujewybranemu ciągowi liczb naturalnych (m1, . . . ,mk)?

czy potrafimy poznać całą arytmetykę zupełną?

- orzekać, czy dane zdanie arytmetyczne jest prawdziwe w modelu standardowym?Użyłem terminu „orzekanie” bo jest on intuicyjnie jasny i jednocześnie - jak się zdaje - nie ma wżadnym matematycznym języku swego formalnego odpowiednika. A jeśli tak, to możemy podrążyć:

Jak należy rozumieć słowo „orzekać”?

Już wspominałem, że Zermelo za niezbywalny atrybut „własności” uważał naszą zdolność do orze-kania, czy przysługuje ona badanemu obiektowi matematycznemu10. Wierzono, że prawda (mate-matyczna) jest poznawalna a kłopoty z orzekaniem o niej wynikają li tylko z naszej niedoskonałościi słabości metod badawczych.

Tak było ponad sto lat temu. A dziś?

6.2.1 Orzekać = rozstrzygać?

W odróżnieniu od orzekania, termin rozstrzyganie ma ściśle określony sens matematyczny. To klu-czowe pojęcie matematycznej teorii obliczalności.

Problem spełniania dla formuły arytmetycznej φ(x) jest rozstrzygalny11, jeżeli istnieje proce-dura, która dla dowolnej liczby naturalnej n, da - po skończonej liczbie kroków - odpowiedź „tak”,jeżeli formuła φ(x) jest spełniona przy wartościowaniu [x := n] i „nie” - w przeciwnym wypadku.Taką procedurę nazywamy rozstrzygajacą.Mówimy wtedy, że formuła φ(x) (i własność przez nią opisana) jest rozstrzygalna12.

Co to jest „procedura”? Matematyczną definicję poznamy później. Teraz poprzestanę na nieco mniejprecyzyjnym wyjaśnieniu.Procedura to proces realizowany w czasie dyskretnym, krok po kroku i odbywający się według ściśle okre-ślonych i posiadających skończony opis reguł. Taki proces może się zakończyć po wykonaniu skończonejliczby kroków, ale nie musi. Może trwać wiecznie13.

8To oczywiście żart. Modelem zamierzonym jest zbiór liczb naturalnych rozumianych niezależnie od teoriomnogo-ściowego opisu - obiekt, dla którego tworzono teorię (arytmetykę). A wspomniany wyżej to „tylko” teoriomnogościowymodel zamierzony.9Wrócimy do tego pytania, gdy będziemy lepiej przygotowani.10Pisze o tym J. Pogonowski w artykule „Projekt Logiki Infinitarnej Ernsta Zermela” zamieszczonym w internecie.11lub: rekurencyjny12Ograniczamy się tu do formuł o jednej zmiennej wolnej. Ale to nie jest istotne ograniczenie.13Realizacja procedury rozstrzygającej musi być zawsze skończona, bo zawsze ma dać odpowiedź - „tak” lub „nie”!

Page 96: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 95

Czy każda własność arytmetyczna jest rozstrzygalna?Opanowanie procedur rozstrzygających o własnościach opisanych przez formuły atomowe - równościi nierówności - to zmartwienie uczniów najmłodszych klas: „czy para liczb (3, 5) ma własnośćopisaną przez formułę-nierówność x ·y ¬ succ(x+y)?” Oczywiście nie; wystarczy policzyć wartościobu termów dla wartościowania [x := 3, y := 5] by otrzymać fałszywe zdanie 15 ¬ 9.Komplikowanie formuł przez użycie koniunkcji, alternatywy i negacji nic nie zmienia: własnościopisane przez formuły bezkwantyfikatorowe są rozstrzygalne. To jest łatwy świat.

Co się dzieje, gdy pojawiają się kwantyfikatory? Czy istnienie procedury rozstrzygającej o spełnia-niu formuły ψ(x, y) gwarantuje istnienie takiej procedury dla formuły φ(x) ≡ ∃yψ(x, y)?Najpierw odpowiemy brutalnie: nie gwarantuje. Potem trochę bardziej optymistycznie: gwarantujeistnienie nieco słabszej procedury, tzw. procedury sprawdzającej. Co to znaczy?

Szukając odpowiedzi na pytanie: „czy liczba naturalna n która ma własność opisaną formułą∃yψ(x, y)?” możemy kolejno pytać i rozstrzygać: „czy para (n, 0) ma własność opisaną przez for-mułę ψ(x, y)?”, „czy para (n, 1) ma tę własność?” itd. Jeśli istnieje liczba m taka, że para (n,m)spełnia formułę ψ(x, y), to ją kiedyś znajdziemy. I zakończymy pracę dając pozytywną odpowiedźna postawione pytanie.Ale odpowiedź negatywną można dać jedynie po zakończeniu nieskończonej weryfikacji wszyst-kich takich par. To oznacza, że negatywnej odpowiedzi nie mamy prawa udzielić. Nigdy.

Ta procedura już nie rozstrzyga - ona tylko sprawdza:

Spełnialność formuły φ(x) jest częściowo rozstrzygalna14, gdy istnieje procedura, która dladowolnej liczby naturalnej n da - po skończonej liczbie kroków - odpowiedź „tak”, jeżeli jestona spełniona przy wartościowaniu [x := n] i nigdy nie skończy pracy („nie zatrzyma się”) wprzeciwnym wypadku. Taką procedurę nazywam sprawdzajacą.Mówimy wtedy, że formuła φ(x) (i własność nią opisana) jest sprawdzalna15.

Procedura rozstrzygająca informuje zarówno o sukcesie jak i o porażce. Procedura sprawdzająca - tylkoo sukcesie.Rozróżnienie między rozstrzyganiem a sprawdzaniem napotyka na psychologiczny opór. Z prostego po-wodu - nie możemy odwołać się tu do doświadczeń z realnego świata obiektów skończonych.W tym świecie każda własność jest rozstrzygalna16. Własności które nie są rozstrzygalne a jedynie spraw-dzalne ujawiają się wtedy, gdy zaakceptujemy istnienie zbiorów nieskończonych. W świecie matematyki.

Wyróżnienie sprawdzalnych własności dziwi, bo przeczy to prawu wyłączonego środka. A nas wychowanotak, że jesteśmy skłonni świat widzieć tak, jak porucznik Zubek ... 17.

Proszę na czas dalszej lektury tego rozdziału, uwierzyć:istnieją sprawdzalne własności arytmetyczne, które nie są rozstrzygalne18

Na pozór nie zagraża to naszemu myśleniu o podstawach matematyki. Ale to tylko pozór.Przypuśćmy, że formuła φ(x) jest sprawdzalna, ale nie rozstrzygalna. Rozważmy jej zaprzeczenie

- formułę ¬φ(x). Okazuje się, że dla tej formuły nie ma nawet procedury sprawdzającej!Dlaczego? Niech P1 będzie procedurą sprawdzającą dla formuły φ(x). Załóżmy chwilowo, że mamyteż procedurę sprawdzającą P2 dla formuły ¬φ(x). Wtedy wystarczy - dla danej liczby naturalnej

14Lub: częściowo rekurencyjna.15Nasz przykład nie jest przypadkowy. Dowiedziono, że „formuła φ(x) jest sprawdzalna dokładnie wtedy, gdy

jest ona równoważna formule postaci ∃y ψ(x, y), gdzie ψ(x, y) jest formułą rozstrzygalną.”. Formuły nazwane tusprawdzalnymi w literaturze przedmiotu funkcjonują jako formuły pozytywnie obliczalne.Jeśli kwantyfikator egzystencjalny zastąpimy uniwersalnym, to na pytanie :„czy liczba n ma własność opisaną przezformułę ∀y ψ(x, y)?” możemy - stosując opisaną procedurę - uzyskać jedynie odpowiedź negatywną (gdy znajdę liczbęm, taką, że para (n,m) nie ma własności opisanej przez ψ(x, y)). Formuła ∀y ψ(x, y) jest „negatywnie obliczalna” Totrudno zaakceptować: wszak chcemy, by nasze poznanie miało charakter pozytywny...16Pomijam tu niefrasobliwie wątpliwości zgłaszane przez fizyków kwantowych.17Porucznik Zubek - bohater „kultowego” serialu „07 zgłoś się” - miał zwyczaj twierdzić, że na każde pytanie

można odpowiedzieć: „tak” lub „nie”. Do czasu, gdy ktoś go spytał: „Czy przestał Pan bić żonę?”18Przykłady podamy poźniej, gdy będziemy w stanie takie stwierdzenie uzasadnić.

Page 97: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 96

n - uruchomić obie procedury jednocześnie. Uruchamiamy i ... spokojnie czekamy. Spokojnie, bojedna z tych procedur musi się zatrzymać! Nie wiemy która, nie wiemy kiedy, ale jedna z nich musisię zatrzymać. Jeśli będzie to P1, to formuła φ(x) jest spełniona dla wartościowania [x := n] .Jeśli P2, to spełniona jest jej negacja. A to oznacza, że formuła φ(x) nie jest spełniona dla tegowartościowania.Mamy, czego nie chcieliśmy - procedurę rozstrzygającą dla formuły φ(x). Wbrew założeniu. Todowodzi, że własność opisana przez formułę ¬φ(x) nie jest sprawdzalna!19

Są własności, które potrafimy opisać w języku arytmetyki, a nie potrafimy procedu-ralnie weryfikować. Nawet połowicznie, czyli tylko sprawdzać! Nie dlatego, że brak nam wiedzy czyumiejętności: takiej procedury sprawdzającej po prostu nie ma! Niewiarygodne, ale prawdziwe.Postulat Zermelo jest niemożliwy do spełnienia. Nawet w odniesieniu do własności arytmetycznych...

Dodajmy kilka uwag, by uniknąć nieporozumień.1. Procedura weryfikacji polegająca na kolejnym sprawdzaniu: „czy 0, 1, . . . ma własność opisanąprzez formułę ∃yψ(x, y)?” nie wyczerpuje możliwości sprawdzania spełnialności formuł tego kształ-tu. Ale nie zmienia to faktu, że są formuły, które nie są sprawdzalne.2. Brak procedury rozstrzygającej (sprawdzającej) dla danej formuły nie oznacza, że jesteśmy bez-radni, gdy dla konkretnej liczby chcemy sprawdzić, czy ona ma własność opisywaną przez tęformułę. Potrafimy rozstrzygnąć, czy dla liczby 100 istnieje para większych od niej liczb pierw-szych bliźniaczych. Podobnie uporamy się z tym problemem dla n = 10000. Ale prawdopodobnieużyjemy w obu przypadkach innych argumentów, innych środków - nie korzystaliśmy uniwersalnejprocedury, skutecznej dla dowolnej liczby naturalnej. Dlatego do dziś nie potrafimy rozstrzygnąć,czy „dla każdej liczby naturalnej istnieje para liczb pierwszych bliźniaczych od niej większych”.

3. A może problem w tym, że zajęliśmy się spełnianiem formuł a nie prawdziwością zdań? Niestety...:

Twierdzenie [Prawda arytmetyczna jest niesprawdzalna]Nie istnieje procedura sprawdzająca, czy dane zdanie jest twierdzeniem arytmetyki zupełnej Th(N)- zbiór zdań arytmetycznych prawdziwych w N jest nierozstrzygalny.

Gdyby taka procedura AR istniała, to dla dowolnej formuły arytmetycznej φ(x1, . . . , xn) możnaby utworzyć procedurę sprawdzająca jej spełnialność20.Pokażemy jak można by to zrobić: dla dowolnie wybranych liczb naturalnych n1, . . . , nk tworzy-my zdanie φ(n1, ..., nk) (zastępując wolne zmienne numerałami ni) i korzystając z procedury ARsprawdzamy, czy jest prawdziwe.Ale prawdziwość tego zdania w standardowym modelu matematyki oznacza spełnianie formułyφ(x1, . . . , xk) przy wartościowaniu [x1 := n1, . . . xk := nk] !!! .Opisane postępowanie „zbuduj zdanie φ(n1, . . . , nk) i uruchom procedurę AR” jest procedurąsprawdzającą dla dowolnej formuły φ... Sprzeczność!

6.2.2 Orzekać = dowodzić?

Sprowadzenie procesu poznania do procedur rozstrzygających i sprawdzających może się wydać bar-barzyńskim uproszczeniem. Oponenci powiedzą, że matematyczna weryfikacja prawdziwości zdańodbywa się przez dowodzenie a nie przez jakieś tam procedury. Mogą mieć nadzieję, że dowódkonkretnego zdania, który zawdzięczamy czyjemuś geniuszowi, to coś istotnie odmiennego od bez-dusznych procedur.

Czy rzeczywiście? Przyjrzyjmy się problemowi bliżej. Zacznijmy od tego, że terminy ,rozstrzy-galność” i „sprawdzalność” możemy odnieść nie tylko do własności arytmetycznych ale i do języków:

- język J jest rozstrzygalny, gdy istnieje procedura, która dla dowolnego słowa v da - po skoń-czonej liczbie kroków - odpowiedź „tak”, jeżeli v ∈ J i „nie” - w przeciwnym wypadku,19Na marginesie: jesli zrozumiałeś, to łatwo udowodnisz, że każda pełna aksjomatyczna teoria jest rozstrzygalna.20A to, jak ustaliliśmy, jest niemożliwe.

Page 98: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 97

- język J jest sprawdzalny („częściowo rozstrzygalny”), gdy istnieje procedura, która dla dowol-nego słowa v da - po skończonej liczbie kroków - odpowiedź „tak”, jeżeli v ∈ J i nigdy nie skończypracy („nie zatrzyma się”) w przeciwnym wypadku21

Aby mówić o dowodzie, musimy mieć język (stwierdzeń) i system formalny. Zbiór aksjomatów ireguły dowodzenia takiego systemu muszą być „pod kontrolą” - język stwierdzeń, zbiór aksjomatówi reguły muszą być rozstrzygalne22. To zapewnia, że

Zbiór dowodów w danej teorii aksjomatycznej jest rozstrzygalny23

Umiemy - jak chciał Hilbert - kontrolować (czyli rozstrzygać), czy dany zapis jest poprawnymdowodem. To jest podstawa matematycznego działania.

W konsekwencji otrzymujemy jeszcze ciekawsze, wręcz fundamentalne stwierdzenie:

Dla dowolnej teorii aksjomatycznej (z rozstrzygalnym zbiorem aksjomatów ) zbiór zadańdowodliwych jest zbiorem sprawdzalnym.

Zdanie φ jest dowodliwe, gdy istnieje jego dowód. Procedura poszukiwania dowodu twierdzeniaφ może wyglądać tak: tworzymy - w określonej kolejności - coraz to dłuższe dowody. Po wygenero-waniu każdego dowodu sprawdzamy, czy jego ostatnim stwierdzeniem jest φ. Jeśli tak, to kończymy(z sukcesem) procedurę sprawdzającą. Jeśli nie, to generujemy kolejny dowód. I tak dalej. Gdyzdanie φ nie ma dowodu, to takie postępowanie nigdy się nie skończy...24.

Nie udało się ... . Przyjęcie równości „orzekanie = dowodzenie” nie oddaliło nas od procedural-nego charakteru orzekania o spełnialności formuł i prawdziwości zdań25.Jeśli ktoś będzie się nadal upierał, że ta równość nie jest obowiązkowa, to odpowiem krótko: innerozumienie orzekania wyprowadza nas poza matematykę.

Sprawdzalność zbioru dowodliwych twierdzeń jest szczęśliwym (dla matematyki) kompromisem między„trywialną” rozstrzygalnością a bezradnością wobec dowolnych zbiorów. W 1927 roku von Neumann pisał:„(. . . ) it appears that there is no way of finding the general criterion for deciding whether or not a well-formed formula is provable. (We cannot at the moment establish this. Indeed, we have no clue as to howsuch a proof of undecidability would go.) (...) The undecidability is even a conditio sine qua non for thecontemporary practice of mathematics,(...) The very day on which the undecidability does not obtain anymore, mathematics as we now understand it would cease to exist; it would be replaced by an absolutelymechanical prescription (...) by means of which anyone could decide the provability or unprovability ofany given sentence.” [107]W 1927 roku... Dziś już wiemy, że taki dzień nigdy nie nadejdzie...

6.3 Twierdzenie Godla - po raz pierwszy

Hilbert chciał pełnej kontroli nad matematyką. Uważał, że każdą teorię T można zaksjomatyzować- wskazać rozstrzygalny podzbiór AxT ⊂ T taki, że Con(T ) = Con(AxT ) - zbiory dowodliwychkonsekwencji teorii T i zbioru AxT są takie same26.

Czy arytmetyka zupełna Th(N) ma aksjomatyczne przedstawienie? Czy potrafimy wskazaćrozstrzygalny zbiór zdań AxN prawdziwych w N i taki, że Con(AxN) = Th(N)?

Odpowiedź właściwie już znamy27 ale... jeszcze chwila.21Ponieważ nasza definicja „procedury” jest nieformalna, to i wszystkie powyższe definicje są obarczone tym samym

grzechem. Formalnie poprawne definicje wszystkich tych pojęć pojawią się w rozdziale „Obliczalność”.22Na marginesie: czy można złagodzić wymagania i żądać jedynie, by zbiór aksjomatów teorii był tylko sprawdzalny?

To problem pozorny: W. Craig udowodnił, że każdy sprawdzalny zbiór aksjomatów teorii pierwszego rzędu można zzastąpić zbiorem rozstrzygalnym w taki sposób, że zbiór dowodliwych zdań pozostanie niezmieniony.23Wynika to wprost z definicji dowodu - ciągu stwierdzeń budowanego z aksjomatów za pomocą reguł dowodzenia.24Sporo tu uproszczeń, ale nie gubimy istoty tego uzasadnienia.25Powtórzę: to jednak nie oznacza, że proces dowodzenia ma coś wspólnego z automatycznym generowaniem coraz

to dłuższych dowodów.26O koncepcji Hilberta pisałem w rozdziale „Spór o istotę matematycznego bytu”.27Czy potrafisz ją sformułować?

Page 99: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 98

Najbardziej znaną propozycją aksjomatyzacji teorii Th(N) jest aksjomatyka sformułowana przezG. Peano28:

Aksjomaty:

1. ∀x,y (succ(x) = y) → ¬(y = 0)

2. ∀x,y (succ(x) = succ(y)) → (x = y)

3. (schemat indukcji); dla dowolnej formuły arytmetycznej φ(x) aksjomatem jest zdanie:(φ(0) ∧ (∀x φ(x)→ φ(succ(x))⇒ ∀x φ(x)

4. ∀x x+ 0 = x,

5. ∀x,y x+ succ(y) = succ(x+ y)

6. ∀x x · 0 = 0,

7. ∀x,y x · succ(y) = x · y + x

8. ∀x,y x ¬ y ↔ ∃z x+ z = y

Ten zbiór zdań-aksjomatów oznaczamy symbolem PA. Piszemy PA ` φ jeżeli formuła φ posiadadowód w tym systemie, φ ∈ Con(PA).

Wystarczy conieco wiedzieć o matematyce by się przekonać, że w standardowym modelu aryt-metyki wszystkie aksjomaty Peano są prawdziwe - N jest modelem tej teorii. Również każde zdaniewywodliwe z tych aksjomatów należy do arytmetyki zupełnej29:

PA ` φ =⇒ φ ∈ Th(N)

Czy odwrotna implikacja jest też prawdziwa, czy każde zdanie arytmetyczne prawdziwe w modelustandardowym jest dowodliwą konsekwencją aksjomatów Peano?

φ ∈ Th(N) ?=⇒ PA ` φTo nie jest prawda. A to dlatego, że w dyskusji o interpretacji terminu „orzekanie” przedstawi-liśmy dwa twierdzenia:

I. nie istnieje procedura sprawdzająca przynależność zdania arytmetycznego do zbioru Th(N),

II. istnieje procedura sprawdzająca, czy zdanie posiada dowód w systemie PA.

Wniosek może być tylko jeden: Th(N) 6= Con(PA) !

istnieją zdania prawdziwe w modelu standardowym N, które nie mają dowodu wsystemie aksjomatycznym PA

A może trzeba spróbować wskazać system aksjomatów dla teorii Th(N) różny od PA ? Nic ztego - jakkolwiek nie wybierzemy rozstrzygalny zbiór aksjomatów Ax to zbiór jego konsekwencjipozostanie sprawdzalny. To oznacza, że równość Con(Ax) = Th(N) jest niemożliwa, bo zbiórTh(N) jest niesprawdzalny!I to jest głęboki sens twierdzenia Godla:

arytmetyka zupełna nie jest aksjomatyzowalna

Limitacyjny charakter twierdzenia Godla

Twierdzenie Godla nie jest twierdzeniem o słabościach języka arytmetyki. Ono wskazuje nieprze-kraczalne ograniczenia języków pierwszego rzędu.Wytłumaczmy w czym rzecz. Argumenty użyte w dowodzie twierdzenie Godla są tego rodzaju, żejakolwiek nie wzbogacimy język arytmetyki (dodając nowe stałe, symbole operacyjne i relacyjne

28G. Peano, matematyk włoski (1858-1932) zaproponował ten aksjomatyczny opis arytmetyki w 1889 roku. Dlazaspokojenia historycznej ciekawości; w ujęciu Peano wszystko „zaczyna się” nie od zera, ale od jedności.29Gwoli ścisłości, uzasadnienie tego stwierdzenia wymagało by podania reguł dowodzenia. Pozwalam sobie na tę

małą nieścisłość zapewniając jednocześnie, że nie kłamię.

Page 100: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 99

które będziemy dowolnie interpretować w N), to każda próba aksjomatyzacji zbioru zdań sfor-mułowanych w tym języku i prawdziwych w N skazana jest porażkę - zawsze znajdą się zdaniaprawdziwe w N, a nie dowodliwe. Nic się też nie zmieni, gdy zechcemy np. opisać własności zbio-ru liczb całkowitych ze standardowo definiowanym dodawaniem i mnożeniem w języku bogatszymod języka arytmetyki i pozwalającym wyróżnić liczby naturalne - zbioru zdań prawdziwych w tejstrukturze na da się w pełni opisać za pomocą teorii aksjomatycznej30 .

Jeśli to rozumiemy, to jesteśmy bliżej zrozumienia zdania, które pojawia się często w omówieniach twier-dzenia Godla: „jeśli uprawiamy matematykę w której wykorzystujemy liczby naturalne, to tej matematykinie można zaksjomatyzować w języku pierwszego rzędu - zastąpić „prawdziwości” zdań tej matematykiprzez ich „dowodliwość”.

Co więcej, twierdzenie Godla mówi, że w języku arytmetyki (ani w żadnym bogatszym językupierwszego rzędu) nie można za pomocą teorii aksjomatycznej zapisać informacji jednoznacznieidentyfikującej standardowy model liczb naturalnych.Wyjaśnijmy i to31. Jeśli φ jest arytmetycznym zdaniem prawdziwym w N i nie ma dowodu w PA,to jego zaprzeczenie - zdanie ¬φ - też nie ma takiego dowodu32. Zatem teoria PA ∪ ¬φ jestniesprzeczna, czyli - na mocy twierdzenia Godla-Henkina - ma model, który jest też modelem teoriiPA33. Ten nowy model jest różny od modelu standardowego i arytmetycznie rozróżnialny (przezzdanie φ). To dowodzi, że teoria PA nie identyfikuje jednoznacznie modelu standardowego.Zastąpienie aksjomatów Peano jakimkolwiek mocniejszym systemem aksjomatów nic tu nie zmieni...

Marzenie Hilberta o sprawowaniu pełnej kontroli nad matematyczną prawdą legło w gruzach...Oczekiwanie, że każdy obiekt matematyczny ma swój unikatowy opis w języku pierwszego rzędu, którybędziemy kontrolować dzięki równości „prawdziwość = dowodliwość”, musi pozostać niespełnione.

Dodatek 1: niestandardowy model arytmetyki

„Naturalne wyobrażenie liczb naturalnych” to nasza preintuicja. Tak zakorzeniona, że trudno wy-obrazić sobie inne, niestandardowe modele arytmetyki Peano. Ale spróbujmy.

Dołóżmy do języka arytmetyki nową stałą „c”. Rozszerzmy też aksjomatykę Peano dodając prze-liczalny zbiór zdań S = (succn(0) ¬ c) : n ∈ N. Standardowy model PA nie jest modelem takrozszerzonej teorii - to jasne34.Dla dowolnego skończonego podzbioru S0 ⊂ S łatwo wskazać model teorii PA ∪ S0 - wystarczyw N interpretować stałą c jako odpowiednio dużą liczbę. Skoro tak, to każda skończona podteoriateorii PA ∪ S jest niesprzeczna. Zatem i cała teoria jest niesprzeczna35. To oznacza, że - na mocywykorzystanego już raz twierdzenia Godla-Henkina - ta teoria ma model - oznaczmy go przez N1 -który musi być różny od modelu standardowego bo zawiera element c1 większy od wszystkich liczbpostaci (succn(0) : n ∈ N) .Idźmy dalej: c1 musi mieć następnik - c1 + 1 - i poprzednik (bo nie jest zerem) c1 − 1. Mówiącobrazowo, istnieje obustronnie nieskończony łańcuch - „świta” liczby c1:

. . . c1 − n, . . . , c1 − 2, c1 − 1, c1, c1 + 1, c1 + 2, . . . , c1 + n, . . .

30Jeśli zrozumiałeś, co jest istotą dowodu twierdzenia Godla to zgodzisz się z tym stwierdzeniem. Jeśli tego niewidzisz, to powinieneś jeszcze raz przeczytać przedstawiony tu szkic dowodu tego twierdzenia...31Wyjaśnienie jest nieco powierzchowne. Na dodatek odwołujemy się do twierdzeń, których jeszcze nie rozważaliśmy.

Trudno, taki jest charakter tego tekstu.32Bo zdania dowodliwe w PA są prawdziwe w N.33Model teorii to model języka arytmetyki, w którym wszystkie zdania tej teorii są prawdziwe. Model teorii wiekszej

od PA jest oczywiście modelem PA. Twierdzenia Godla-Henkina, które mówi, że każda niesprzeczna teoria posiadamodel jeszcze nie znamy. Ale poznamy.34W N nie ma liczby większej od każdej liczby postaci succn(0).35W dowodzie dowolnego twierdzenia korzystamy tylko ze skończonego podzbioru PA ∪ S. Stąd jeśli zdanie ewi-

dentnie fałszywe ma tu dowód (czyli teoria PA ∪ S jest sprzeczna), to i skończona podteoria złożona z aksjomatówwykorzystanych w takim dowodzie też jest sprzeczna. Ale przecież każda skończona podteoria PA∪S jest niesprzeczna.

Page 101: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 100

a wszystkie liczby z tej świty są większe od standardowych. Muszą też istnieć iloczyny: 2c1 = c1+c1

, 3c1 = 2c1 + c1 itd. Każdy element postaci nc1 otoczony jest własną świtą.To nie wszystko: ponieważ zdanie „każda liczba naturalna jest parzysta lub nieparzysta” jest zda-niem arytmetycznym dowodliwym w PA, to w N1 musi istnieć liczba niestandardowa c2 < c1 taka,że c2 + c2 = c1 gdy c2 jest parzysta lub ... (dokończ). c2 też ma swoją świtę Oczywiście c1 + c2

jest gdzieś pomiędzy c1 i 2 · c1 . I tak dalej...Zakończmy ten wywód baaardzo naukowo: model N1 ma typ porządkowy ω + (ω∗ + ω)η ...36

Ten powszechnie przywoływany przykład niestandarowego, teoriomnogościowego medelu arytmetyki Pe-ano ma pewną wadę, której jakoś nikt nie chce zauważyć. Jaka to wada, dowiesz się w rozdziale „Pewnaszczególna teoria - ZFC”

Twierdzenie Parisa-Harringtona

Czy znamy zdania arytmetyczne, prawdziwych w N a niedowodliwe w PA? Pierwszy przykładwskazał Godel i o nim będziemy wkrótce mówili. Ale jego złożony charakter37 sprawił, że niewszyscy byli nim zachwyceni. Oczekiwano bardziej „konkretnego” przykładu.Dostarcza go (zmodyfikowane) twierdzenia Ramsey’a.

W wersji „fabularnej” twierdzenie Ramsey’a brzmi tak: „na to, by wśród uczestników przyjęciamożna było z absolutną pewnością wskazać m-osobową grupę taką, że wszyscy jej członkowie sięwzajemnie znają lub nikt nie zna nikogo z pozostałych członków grupy, nie trzeba dokonywaćjakiejkolwiek „analizy jakościowej” listy gości: wystarczy zaprosić odpowiednio dużą grupę osób”.A jego modyfikacja (wzmocnienie) to dodanie warunku: „tę grupę można wybrać tak, że conajmniejjeden z jej członków pojawi się na przyjęciu wśród pierwszych m gości”.

Powiedzmy to samo w języku grafów. Dwukolorowy graf pełny o zbiorze wierzchołków V tograf, w którym każda para wierzchołków jest połączona pojedynczą niezorientowaną krawędzią -powiedzmy, białą lub czerwoną. Pełny podgraf takiego grafu uzyskamy wskazując dowolny pod-zbiór V0 ⊆ V wraz ze wszystkimi krawędziami łączącymi wierzchołki tego podzbioru. Podgraf jestjednokolorowy (monochromatyczny), gdy wszystkie jego krawędzie mają ten sam kolor.

„Grafowa” wersja twierdzenie Ramsey’a wygląda tak: dla dowolnej liczby naturalnej m możnawskazać taką liczbę R(m) że każdy dwukolorowy graf pełny o R(m) wierzchołkach zawiera pełnyjednokolorowy podgraf o m wierzchołkach.

A zmodyfikowane twierdzenie Ramsey’a dodaje, że: numer najmniejszego wierzchołka tego jedno-kolorowy podgrafu jest nie większy niż m - niezależnie od (wcześniejszej) numeracji wierzchołków.

Twierdzenie Parisa-Harringtona mówi, że:zmodyfikowane twierdzenia Ramsey’a jest prawdziwe, ale nie da się go dowieść

w ramach arytmetyki Peano

To zdanie można znaleźć w popularnych opracowaniach opowiadających o wyniku Godla. Czy-telnik, który dotarł do tego miejsca artykułu jest już wystarczajaco skołowany i zmęczony byprzyjąć to zdanie „do wiadomości” uznając, że są w matematyce rzeczy niedostępne zwykłymśmiertelnikom38... To błąd. Powinien zadać przynajmniej dwa pytania:

- co wspólnego ma twierdzenie o grafach z arytmetyką?- jeśli tego twierdzenia nie umiemy dowieść, to skąd wiemy, że jest prawdziwe?

Spróbujmy odpowiedzieć. Zmodyfikowane twierdzenie Ramsey’a sformułowane tu w języku grafówmożna też zapisać jako zdanie sformułowane w języku teorii mnogości. Uznajemy je za prawdziwe,

36Zaintrygowanym i nieco skołowanym podpowiem: uporządkowanie niestandardowych liczby naturalnych w tymmodelu jest takie samo, jak uporządkowanie iloczynu kartezjańskiego Q×Z przez relację zdefiniowaną tak: (q1, z1) (Q2, z2) gdy q1 < q2 lub q1 = q2 oraz z1 ¬ z2. W szczególności: ten zbiór nie ma elementu najmniejszego - nie manajmniejszej niestandardowej liczby naturalnej.37Oczywiście charakter zdania a nie Godla.38To, niestety, cecha wielu artykułów popularyzujących matematykę. Nie tyle ją objaśniają, co budują jej mit.

Page 102: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 6. ARYTMETYKA 101

bo jest teoriomnogościowym twierdzeniem - dowodliwą konsekwencją aksjomatów ZFC. To jestodpowiedź na drugie pytanie.Odpowiedź na pierwsze wymaga odwołania do twierdzenia, które szczegółowo omówimy później.Otóż istnieje pewna szczególna „translacja” języka teorii mnogości na język arytmetyki39.W szcze-gólności formalne teoriomnogościowe zdanie - zapis zmodyfikowanego twierdzenia Ramsey’a możnaprzetłumaczyć na zdanie arytmetyczne.I to zdanie-tłumaczenie nie ma dowodu w arytmetyce Peano. To wszystko40.

Teoriomnogościowy dowód twierdzenia Parisa-Harringtona jest zbyt złożony byśmy mogli o nimrozmawiać w sposób tu przyjęty. W zamian opowiemy o dowodzie twierdzenia Ramsey’a.Podzielimy go na dwie części: teraz przedstawimy dowód nieskończonego twierdzenia Ramsey’a:

„każdy pełny dwukolorowy grafK∞ którego wierzchołkami są wszystkie liczby naturalne zawierajednokolorowy podgraf o nieskończonej liczbie wierzchołków”.

a dowód „wersji skończonej” przedstawimy później, gdy będziemy lepiej przygotowani41.Zaczynamy: najpierw zauważmy, że dla dowolnej liczby m conajmniej jeden ze zbiorów

Bm = l > m : krawędź łącząca m i l w K∞ jest białaCm = l > m : krawędź łącząca m i l w K∞ jest czerwona

jest nieskończony.Zdefiniujemy rekurencyjnie ciąg liczb naturalnych a0, a1, . . . , an, . . . wraz z ciągiem nieskonczo-

nych zbiorów A0, A1, . . . , An, . . . tak:przyjmujemy a0 = 0 i

A0 =

B0 B0 jest nieskończony

C0 w przeciwnym przypadku

Gdy mamy już określoną parę (an, An) to przyjmujemy:- an+1 = minAn

An+1 =

Ban+1 ∩An Ban+1 ∩An jest nieskończony

Can+1 ∩An w przeciwnym przypadku

Elementy ciągu a0, a1, . . . , an, . . . można podzielić na dwa podzbiory: B i C:

an ∈ C gdy Aan = Can i an ∈ B gdy Aan = Ban .

Teraz wystarczy zauważyć, że ten spośród zbiorów B,C który jest nieskończony, jest poszukiwanymnieskończonym zbiorem wierzchołków jednokolorowego podgrafu K∞ .I to kończy dowód nieskończonego twierdzenia Ramsey’a.

39O szczegółach powiemy rozdziale Pewna szczególna teoria - ZFC”40Zainteresowanych odsyłam do pracy J.Parisa i L.Harringtona A mathematical incompleteness in Peano Arith-

metics dostępnej w interncie. Mniej zaawansowanym nie polecam.41W rozdziale „Pewna szczególna teoria - ZFC”.

Page 103: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 7

Obliczalność

Without a deeper understanding of the nature of calculation and under-lying processes, neither the scope of undecidability and incompletenessresults nor the significance of computational models in cognitive sciencecan be explored in their proper generality. [107]Calculemus! (Obliczmy to!) - G. Leibniz.

Dotąd, mówiąc o procedurach rozstrzygających i sprawdzających, polegaliśmy na naszej intu-icji. Pogłębiona dyskusja o wynikach Godla wymaga większej precyzji. Stąd pomysł, by najpierwprzybliżyć pojęcie obliczalności, gdyż rozstrzygalność i częściowa rozstrzygalność to pojęcia wtórnew stosunku do obliczalności.

Są (conajmniej) trzy sposoby definiowania obliczalności. Jeśli uważamy teorię obliczalności zaintegralną część matematyki teoriomnogościowej, to zazwyczaj zaczynamy od przedstawienia defi-nicji obliczalności w sensie Kleene’ego. Ponieważ się z tym nie zgadzam, zacznę inaczej: od definicjiobliczalności Alana Turinga1.

7.1 Maszyna Turinga

These machines are humans who calculate.L. Wittgenstein2

Jak opisać interakcję między aktywnym sprawcą a biernym otoczeniem? Sprawca obserwuje pewien frag-ment otoczenia i na podstawie uzyskanej informacji może zmienić to miejsce i swój stan a potem przenieśćuwagę na inny punkt otoczenia. I tak dalej... . Czyż nie tak działamy?

Maszyna Turinga to genialny w swej prostocie opis takiej interakcji. Turing założył - trochęw opozycji do matematycznego mainstreamu - że interakcja to proces dyskretny (a nie ciągły),deterministyczny i odbywa się wśród „bytów skończonych”.Język opisu wybrany przez Turinga jest skrajnie ockhamowski. W jego modelu otoczenie repre-zentowane jest przez słowo nad binarnym alfabetem 0, 1 zapisane na potencjalnie nieskończonejtaśmie podzielonej na odrębne pola, zgodnie z zasadą „w jednym polu jeden znak”. Sprawca -maszyna - ma w każdej chwili określony stan wybrany spośród skończonego i ustalonego a priorizbioru. Maszyna obserwuje w każdej chwili pracy jedno pole taśmy. Pojedynczy krok pracy maszy-ny to - określona a priori - deterministyczna reakcja na to, jaki znak jest w obserwowanym polu i wjakim jest ona stanie. Skutkiem pojedynczego kroku jest zmiana stanu maszyny, zmiana zapisu wobserwowanym polu i ruch - o jedno pole w prawo lub w lewo w stosunku do dotąd obserwowanego3.

Zachowanie maszyny Turinga opisuje skończony zbiór instrukcji - zapisów postaci:

1Alan Mathison Turing (1912 - 1954) – angielski matematyk, jeden z twórców podstaw informatyki.2Philosophy and Psychology.3Może się zdarzyć, że maszyna nie zmieni zapisu i tylko przesunie się w prawo lub w lewo. Może też się nie ruszyć.

102

Page 104: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 103

(qi, α)→ (qj , β,move)

gdzie qi, qj to stany - elementy skończonego i ustalonego dla danej maszyny zbioru Q = q1, . . . , qn,α, β ∈ 0, 1,⊥4 a move ∈ Left, Right, NoMove.Instrukcję czytamy tak: „jeśli maszyna w stanie qi obserwuje pole w którym jest α, to przejdziew stan qj , zapisze β, i zacznie obserwować pole znajdujące się po lewej lub prawej stronie dotądobserwowanego - zależnie od wartości parametru move”5.Założenie, że działanie maszyny jest deterministyczne oznacza, że każda para (q, α) ∈ Q×0, 1,⊥pojawia się po lewej stronie w co najwyżej jednej instrukcji.

Maszyn Turinga jest wiele: tyle, ile jest możliwych skończonych zbiorów instrukcji. Ten zbiórmożemy postrzegać jako program sterujący pracą maszyny.

Maszyna Turinga T rozpoczyna pracę obserwując pierwszą literę pojedynczego słowa binarnegov zapisanego na taśmie. Jej praca to sekwencyjne wykonywanie instrukcji. Jeśli w pewnym momen-cie maszyna znajdzie się w stanie q i obserwować będzie pole ze znakiem α a w zbiorze jej instrukcjinie ma takowej o poprzedniku (q, α), to praca się kończy - maszyna T zaakceptowała słowo v. Słowow zapisane w tym momencie na taśmie to rezultat działania (lub: wynik obliczenia) maszyny T nasłowie v , co zapisujemy T (v) = w.

Oznaczmy przez L(T ) język złożony ze słów, które akceptuje maszyna T - język akceptowanyprzez T . Jeśli słowo v /∈ L(T ) , to proces poszukiwania rezultatu obliczenia jest nieskończony -maszyna T nie zatrzymuje się, pracuje wiecznie6.

W opisie maszyny Turinga nie padło słowo „funkcja”. Pojawi się teraz, ale jako pojęcie pomocnicze:„funkcja częściowa7 realizowana przez maszynę T to funkcja fT działającą na słowach binarnych taka,że dla danego słowa v:

fT (v) =

T (v) v ∈ L(T )−maszyna T się zatrzymujejest nieokreślona v /∈ L(T )−maszyna T pracuje wiecznie,

„nie zatrzymuje się”.

W definicji Turinga istotą jest proces obliczenia. Funkcja fT to tylko opis rezultatu tego procesu.

Możemy teraz sformułować podstawową definicję:

Funkcja częściowa f : 0, 1∗ → 0, 1∗ jest obliczalna jeżeli potrafimy skonstruować maszynęTuringa która ją realizuje.”

Proponowany przez Turinga opis relacji między „sprawcą” a „otoczeniem” jest ascetyczny dobólu. Jak bardzo, przekonamy się próbując zbudować maszynę realizującą prostą akcję np. po-dwajanie słowa zapisanego na taśmie. Nieco poluzujmy. Przede wszystkim alfabet binarny „nadktórym” pracuje taka maszyna, można zastąpić dowolnym skończonym alfabetem. To oznacza, żepojęcie obliczalności można odnieść do funkcji typu f : A∗ → A∗ , gdzie A to dowolny skończony al-fabet. Ostatecznie powiemy, że funkcja częściowa φ : A∗ → B∗ jest obliczalna, jeśli istnieje maszynaTuringa T działająca „nad alfabetem A ∪B” taka, że φ = fT .

Maszyny Turinga „działają na tekstach i zwracają teksty”8. Opisane uogólnienia nie zmienająistoty obliczalności: działanie maszyny T korzystającej z alfabetu A można zawsze zrealizować za

4Znak „⊥” służy do oznaczenia tych pól taśmy, w których nic nie zapisano - nie ma w nich ani 0 ani 1.5Gdy wartość tego parametru to NoMove, to nadal będzie obserwować to samo pole.6Przykład. Jednostanowa maszyna z trzema instrukcjami (q, α) → (q, α,NoMove) gdzie α ∈ 0, 1,⊥ nigdy się

nie zatrzyma - nie akceptuje żadnego słowa. A jednostanowa maszyna z jedną instrukcją (q, 0) → (q, 0, NoMove)zaakceptuje słowo „11” a nie zatrzyma się na słowie „00”.7Funkcja częściowa ze zbioru A do zbioru B nie dla każdego argumentu - elementu zbioru A - zwraca wartość

(element zbioru B). Odejmowanie liczb naturalnych jest funkcją częściową (z N×N do N).8Piszac ten tekst mam na ekranie komputera okno edycyjne i podgląd wydruku. Stukając w odpowiedni klawisz

uruchamiam maszynę Turinga (program), który zamienia tekst z okna edycyjnego na tekst-wydruk. By utożsamićpojęcia „słowo” i „tekst” wystarczy do alfabetu języka polskiego - dołożyć wszelkie znaki interpunkcyjne i spację .Wówczas dowolny tekst - np. „Pan Tadeusz” - stanie się pojedynczym słowem nad tak rozszerzonym alfabetem.

Page 105: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 104

pomocą innej maszyny T2 operującej nad alfabetem binarnym. Dokładniej: dla każdego skończonegoalfabetu A istnieją funkcje obliczalne kodA : A∗ → 0, 1∗ i dkodA : 0, 1∗ → A∗ takie, że

fT = dekodA · fT2 · kodT- „aby obliczyć wartość fT na słowie v najpierw je kodujemy, potem uruchamiamy maszynę T2 natym kodzie, a na koniec dekodujemy słowo binarne T2(kod(v))9.

Teraz jesteśmy gotowi na przyjęcie formalnych definicji języka rozstrzygalnego i rozpoznawal-nego: język L ⊆ A∗ jest rozstrzygany (rekurencyjny) jeżeli funkcja λL : → 0, 1∗ taka, że dladowolnego słowa v ∈ L:

λL(v) =

1 w ∈ L0 w przeciwnym wypadku

jest obliczalna.Język L ⊆ A∗ jest rozpoznawalny (sprawdzalny, rekurencyjnie przeliczalny) jeżeli funkcja częściowaλcL : A∗ → 0, 1∗ taka, że dla dowolnego v ∈ A∗:

λcA(v) =

1 v ∈ Lnieokreślona v /∈ L

jest obliczalna10.Można komplikować pojęcie maszyny Turinga, przyjmując, że ma ona nie jedną, ale np. dwie

taśmy - „wewnętrzną” i „zewnętrzną” - i w każdej chwili obserwuje po jednym polu na każdej znich. Reaguje na zawartość obu pól przchodząc do nowego stanu, zmieniając zapisy w obu polach iwykonując niezależne ruchy na obu taśmach - zgodnie z określonymi a priori instrukcjami. Taśmazewnętrzna - tak jak w maszynie jednotaśmowej - reprezentuje otoczenie: z niej odczytujemy danei na niej umieszczamy wynik obliczenia. Taśmę wewnętrzną można traktować jako - potencjalnienieskończoną! - pamięć, służącą do przechowywania informacji przydatnych w procesie obliczenia11.Wydaje się, że dwutaśmowe maszyny mogą więcej. Ale nie: każdą funkcję, która można zrealizowaćza pomocą maszyny dwutaśmowej, można zrealizować korzystając z maszyny jednotaśmowej 12 .

Te uwagi są potrzebne tylko po to, by łatwiej było nam przyjąć do wiadomości, że maszyna Turinga (nadalfabetem binarnym) to genialnie prosta propozycja formalizacji pojęcia procedury.Model Turinga nie jest modelem technicznym „urządzenia służącego do obliczeń”13. To model ideowy,czyli koncentrujący naszą uwagę na tym, co jest istotą procesu obliczenia.

Odtąd będziemy wymiennie posługiwali się pojęciami „procedura”, „program” i „maszyna Tu-ringa”.

Nierozstrzygalność problemu stopu

Wiemy już dość, by zająć się fascynującym fenomenem - „nierozstrzygalnością problemu stopu”.Każdy z nas słyszał o „zapętleniu programu” - nasz komputer zwariował i bez końca realizuje

9Procedurę kodowania można opisać tak: ustalmy najpierw binarne kodowanie liter alfabetu A dbając o to, bydla każdej pary różnych liter a, b ∈ A słowo kodA(a) nie było podsłowem początkowym słowa kodA(b) (i vice versa).To jest możliwe. Wówczas dla dowolnego słowa v = a1 . . . an ∈ A∗ , kodA(v) = kodA(a1) . . . kodA(an).10Kłopot z wyborem adekwatnej i wywołującej oczekiwane skojarzenia nazwy dla takich zbiorów bierze się stąd, że

jest to sytuacja obca naszemu doświadczeniu ukształowanemu w świecie obiektów skończonych (czyli rozstrzygalnych).Na marginesie: konia z rzędem temu kto wyjaśni, dlaczego angielski termin „recursively enumerable” przetłumaczy-lismy jako rekurencyjnie przeliczalny a nie rekurencyjnie policzalny... .11Np. funkcję podwajania słowa można za pomocą dwutaśmowej maszyny zrealizować tak: 1. przepisz słowo v z

taśmy zewnętrznej na wewnętrzną. 2. Przejdź na koniec słowa v na taśmie zewnętrzenej. 3. Przepisz kopię słowa v ztaśmy wewnętrznej na zewnętrzną. Bardzo proste.A teraz spróbuj zrealizować podwajanie słów korzystając z maszyny jednotaśmowej.12To nie jest aż tak strasznie dziwne: informacje (słowa) zapisane na dwóch taśmach można łatwo zapisać na jednej

taśmie rezerwując np. dla pierwszego słowa miejsca parzyste, a dla drugiego - nieparzyste.13Bardziej na takie miano zasługuje model von Neumanna opisujący architekturę komputera.

Page 106: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 105

pewien program14. Czyż nie byłoby pięknie (wygodnie), gdyby komputer był wyposażony fabryczniew program PS, który - uruchomiony przed właściwym programem T - odpowiadałby na pytanie,czy po uruchomieniu T na wskazanym zestawie danych v ten program się zatrzyma, czy też sięzapętli? Dlaczego żaden geniusz z Doliny Krzemowej o tym nie pomyślał?

Do formalnego opisu problemu stopu wykorzystamy pojęcie kodu maszyny. Kod maszyny T tosłowo binarne kod(T ), które otrzymamy w wyniku translacji tekstu - opisu zbioru instrukcji T - nasłowo binarne15.

Nasz problem sformułujemy teraz tak:

- „czy istnieje maszyna Turinga PS taka, że dla dowolnej maszyny T i słowa binarnego v:

PS(< kod(T ), v >) = 1 gdy maszyna T zatrzyma się rozpoczynając pracę ze słowem v zapisa-nym na taśmie i PS(< kod(T ), v >) = 0 - w przeciwnym przypadku?”16

Odpowiedź brzmi „nie”. To jest sens słynnego „twierdzenia o nierozstrzygalności problemu stopu”.

Niech nas nie zwiedzie prostota sformułowania problemu. Jego rozwiązanie przez Turinga to jedno naj-piękniejszych i najważniejszych osiągnieć ludzkiego intelektu w XX wieku (a może nie tylko...). Wyznacza,podobnie jak wyniki Godla, granice naszego panowania nad tym, co tworzymy.Możemy projektować procesy obliczeniowe i realizować je za pomocą komputerów. Ale nie mamy żadnejszansy na pełną nad nimi kontrolę. Nie możemy rozstrzygać o wszystkim.

Dowód tego twierdzenia jest piękny, bo prosty. Przypuśćmy, że taka maszyna PS istnieje. Wy-korzystamy ją do zbudowania nowej maszyny PS∞ działającej tak:

PS∞(v) =

1 PS(< v, v >) = 0

nie kończy pracy PS(< v, v >) = 1

Jak zachowa się maszyna PS∞ pracując na swym kodzie? Łatwo sprawdzić, że obliczenie PS∞(kod(PS∞))jest procesem skończonym dokładnie wtedy, gdy jest procesem ... nieskończonym!17

Nie ma procedury rozstrzygającej dla problemu stopu. Ale mamy banalnie prostą proceduręsprawdzającą - wystarczy uruchomić maszynę T ze słowem v zapisanym na taśmie i czekać...

W ten sposób spełniłem złożoną wcześniej obietnicę:

Język złożony ze słów postaci < kod(T ), v > i takich, że maszyna T zatrzyma się rozpoczynając pracęze słowem v to przykład języka rozpoznawalnego (sprawdzalnego), który nie jest rozstrzygalny.

Przyjrzyjmy się ważnej konsekwencji tego rozróżnienia. W matematyce teoriomnogościowej mo-zna - jeśli tylko zechcemy - zastąpić daną funkcję częściową φ : A → B przez funkcję wszędzieokreśloną φt : A → B ∪ ∞ zwracającą „komunikat o błędzie” w sytuacji, gdy wartość φ(a) jestnieokreślona:

φt(a) =

φ(a) wartość φ(a) jest określona

∞ w przeciwnym przypadku

Tak nie można postępować w świecie funkcji obliczalnych. Dlaczego? Przypuśćmy, że język L ⊂ A∗jest rozpoznawalny, ale nie rozstrzygalny. Gdyby opisaną wcześniej obliczalną funkcję częściowąλcL : A∗ → 0, 1∗ można było zastąpić wszędzie określoną funkcją obliczalną (dodając komunikato błędzie) λL : A∗ → 0, 1∗ ∪ ∞, to otrzymalibyśmy funkcję działającą tak:

14Najczęściej jest to jednak rezultat błędu popełnionego przy budowie programu a nie złośliwość komputera.15Np. za pomocą opisanej wyżej funkcji kod0,1. Nie muszę dodawać, że takie kodowanie zawsze istnieje.16Symbol < kod(T ), v > oznacza tu słowo binarne - kod pary słów binarnych (kod(T ), v). Możemy np. przyjąć

< v, kod(T ) >= 00 . . . 0︸ ︷︷ ︸|kod(T )|

1kod(T )v

gdzie symbol |kod(T )| oznacza długość słowa kod(T ).17W tym dowodzie jest drobna luka. Ale wszystko jest OK. Jeśli ktoś zauważył tę lukę, to dobrze (o nim świadczy).

A jeśli wie, jak ją wypełnić, to jeszcze lepiej.

Page 107: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 106

λL(v) =

1 v ∈ L∞ v /∈ L

A to - na mocy definicji - oznacza, że język L jest... rozstrzygalny. Sprzeczność (założyliśmy, że Ljest tylko rozpoznawalny)!

W świecie funkcji obliczalnych mamy dwa rodzaje nieokreśloności.Funkcja fT : A∗ → B∗ ma nieokreśloność „jawną” gdy język L(T ) (złożony ze słów akceptowanychprzez T ) jest rozstrzygalny. Wtedy przed rozpoczęciem obliczenia można rozstrzygać, czy będzie onoskończone czy też będzie trwało wiecznie. I wtedy możemy uzupełnić funkcję fT do totalnej funkcjiobliczalnej dodając „komunikat o błędzie”18.Jeśli język L(T ) jest tylko rozpoznawalny, to nieokreśloność funkcji obliczalnej fT jest „niejawna”.Ale nierozstrzygalnść problemu stopu oznacza, że nie istnieje uniwersalna procedura rozstrzygająca, czyjęzyk L(T ) jest rozstrzygalny czy tylko rozpoznawalny... .

7.1.1 Klasyfikacja języków Chomsky’ego revisited

Klasyfikacja języków Chomsky’ego (str. 23) odwoływała się do kształtu opisujących je gramatyk.Teraz ją powtórzymy, ale odwołujac się do akceptorów - mechanicznych urządzeń orzekających oprzynależności słowa do języka. W roli akceptorów wystąpią... maszyny Turinga.

Podstawowe twierdzenie wiążące maszyny Turinga z gramatykami wygląda tak:

Język L jest akceptowalny przez pewną maszynę Turinga T 19 dokładnie wtedy, gdy można goopisać za pomocą pewnej gramatyki kombinatorycznej.

Procedurę sprawdzająca czy słowo w należy do języka L(G) generowanego przez gramatykę G, jestprosta: produkujemy kolejno wszystkie możliwe wyprowadzenia, zaczynając od tych długości jeden,potem długości dwa, itd.. Jeśli w ∈ L(G), to w pewnym momencie znajdziemy wyprowadzenie tegosłowa i skończymy pracę. A jeśli w /∈ L(G), to poszukiwanie wyprowadzenia będzie trwało wiecznie.

Skoro znamy procedurę, a procedury to maszyny Turinga, to ... 20

Języki akceptowalne przez maszyny Turinga to języki rozpoznawalne (sprawdzalne). Jeżeli za paradygmatmatematycznego konstruktywizmu uznamy sprawdzalność kreowanych kolekcji które czynimy przedmio-tem naszych badań to musimy przyjąć, że uniwersalnym narzędziem ich tworzenia są specyficzne strukturyrekurencyjne - gramatyki kombinatoryczne.

Zawężanie klasy języków zgodnie z hierarchią Chomsky’ego (języki kontekstowe, bezkonteksto-we, regularne) musi oznaczać, że akceptujące je urządzenia są coraz prostsze. Skoro jednak maszynaTuringa jest prosta jak czajnik, to na czym polega jej upraszczanie?

Mówiąc najprościej - na ograniczeniu możliwości jej działania. I tak liniowo ograniczona ma-szyna Turinga rozpoczynając pracę ze słowem w modyfikuje w czasie pracy tylko te pola, któresą zajęte przez słowo w21. Liniowo ograniczone maszyny Turinga są powiązane z gramatykamikontekstowymi:

język L jest akceptowany przez liniowo ograniczoną maszynę Turinga dokładnie wtedy gdy jestgenerowany gramatykę kontekstową.

Gramatyki kontekstowe wyróżnia to, że w dowolnym wyprowadzeniu S v1 v2 · · · vndługość słowa vi jest mniejsza-równa długości słowa vi+1

22. Stąd liczba wyprowadzeń, w których18Z „jawną” nieokreślonością mamy do czynienia np. w przypadku ograniczonego odejmowania liczb naturalnych:

odejmowanie n−m jest nieokreślone (niewykonalne) gdy n < m.19Tzn. L = L(T ).20Dowód odwrotnej implikacji - wskazanie gramatyki opisującej język akceptowalny przez maszynę T - polega na

przekształceniu zbioru instrukcji maszyny T w odpowiedni zbiór produkcji gramatyki. Darujmy sobie szczegóły.21Nieograniczona maszyna Turinga może swobodnie korzystać z dowolnie dużego fragmentu potencjalnie nieskoń-

czonej taśmy.22To jest konsekwencja kształu produkcji w takiej gramatyce.

Page 108: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 107

ostatnie słowo ma długość n jest skończona, niezależnie od wyboru liczby n. To oznacza, że językL(G) generowany przez gramatykę kontekstową jest rozstrzygalny, gdyż poszukiwanie wyprowadze-nia słowa w można zakończyć po skończonej liczbie kroków, po wygenerowaniu skończonego zbioruwszystkich wyprowadzeń w których ostatnie słowo ma długość równą długości w 23.Ta obserwacja to pierwszy krok do udowodnienia twierdzenia, uzasadniającego wyróżnienie tejpodklasy gramatyk (maszyn Turinga):

Języki rozstrzygalne to te, które są akceptowane przez liniowo ograniczone maszyny Turinga(równoważnie: generowane przez gramatyki kontekstowe).

Zawężenie rozważań do klasy języków kontekstowych wprowadza nas do raju w którym językomtowarzyszą procedury rozstrzygające o przynależności słowa do języka. Czego chcieć więcej? Po cokomu gramatyki bezkontekstowe i regularne?Nasz raj jest pozorny: procedury rozstrzygające o przynaleznosci słowa dla języków kontekstowychmogą być bardzo złożone, przez co bezużyteczne w praktyce. Gdy ograniczymy się do gramatykbezkontekstowych, to złożoność tych procedur znacząco maleje - staje się wielomianowa24 I dopierote języki znajdują praktyczne zastosowanie w informatyce25.

Języki bezkontekstowe są akceptowane przez automaty ze stosem. Maszyny Turinga akceptującejęzyki regularne to tzw. automaty skończone. Prostota weryfikacji przynależności słowa do językaregularnego polega na tym, że słowo jest przeglądane tylko jednokrotnie, z lewa na prawo. Liczbakroków procesu weryfikacji jest równa długości sprawdzanego słowa - złożoność tej procedury jestliniowa.

Klasyfikacja Chomsky’ego to nie tylko wewnętrzna sprawa lingwistyki matematycznej. To wistocie klasyfikacja problemów, które możemy rozsądzać proceduralnie. Oto przykład: graf skoń-czony można zakodować jako słowo np. numerując jego wierzchołki a krawędzie przedstawiając jakopary liczb (numery początku i końca krawędzi). Np. słowo (nad alfabetem złożonym z cyfr, prze-cinka i dwóch rodzajów nawiasów) < 1, 2, 3, 4, (1, 2), (3, 4) > to kod grafu o czterech wierzchołkach idwóch krawędziach. Co istotne, pewne własności grafu G można teraz przetłumaczyć na własnościsyntaktyczne jego kodu. Np. istnienie pętli przy każdym wierzchołku oznacza - w naszym systemiekodowania - że kod grafu G wraz z podsłowem „n” musi zawierać podsłowo „(n, n)”. Każda takawłasność grafu wyróżnia pewien podzbiór kodów, pewien język. Tym samym rozstrzygnięcie „czygraf ma daną własność” sprowadzamy do sprawdzenia, czy jego kod należy do języka wyznaczone-go przez tę własność. Możliwość zaangażowania w to sprawdzanie komputera (maszyny Turinga)zależy od tego, czy język odpowiadający tej własności potrafimy opisać za pomocą gramatyki. Azłożoność problemu zależy od tego, jaka to gramatyka...

Wystarczy rzeczy ponazywać, by zakwalifikować rozważany problem do pewnej „klasy trudności”...26.

Na koniec mały test: czy wyobrażamy sobie, ile jest binarnych maszyn Turinga o danej liczbiestanów? To można oszacować:

liczba maszyn Turinga o n stanach = (9n+ 1)3n

23Jeśli zrozumiałeś tę argumentację, to powinieneś zgodzić się też z takim stwierdzeniem: „gdyby możliwe byłookreślenie stałej proporcji między długością twierdzenia a maksymalną długością jego dowodu, to teorie matematycznebyłyby rozstrzygalne”. (na „twierdzenie” i „dowód” patrzymy tu jak na słowa i tak rozumiemy ich długość)24O złożoności procedur piszę więcej pod koniec tego (długiego) rozdziału (str. 132). Teraz krótko: zgodzimy się,

że długość procesu weryfikującego przynależność słowa do języka zależy od długości słowa. Złożoność procedury jestwielomianowa jeśli tę zależność można opisać za pomocą funkcję wielomianowej.25Niektórym to wciąż mało: wyróżnia się podklasy języków bezkontekstowych LL(k) i LR(k): dopiero dla takich

języków mamy procedury o satysfakcjonującej efektywności.26Ponad wszystkie wasze uroki –Ty! poezjo, i ty, wymowo –Jeden wiecznie będzie wysoki:

* * * * * * * * * * * * * * * *Odpowiednie dać rzeczy słowo!

C.K.Norwid, Za wstęp(ogólniki)

Page 109: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 108

Np. mamy „tylko” 196 maszyn dwustanowych... A to ponad... 47 milionów. Maszyn o 10 stanachjest 9130. Kosmos...27. Warto sobie to uświadomić zanim się powie, że to, co skończone, jest wgruncie rzeczy trywialne...

7.1.2 Maszyna uniwersalna

Opisując działanie maszyny Turinga przedstawiłem procedurę - „instrukcję użycia” dowolnej maszy-ny Turinga. Skoro maszyna Turinga to sformalizowany odpowiednik procedury, to musimy zapytać- czy i tej szczególnej procedurze odpowiada jakaś maszyna?Tak. I to bardzo ważna: jest to uniwersalna maszyna Turinga U . Jej uniwersalność polega na tym,że jest zdolna symulować pracę dowolnej maszyny Turinga.Trochę szczegółów. Każda maszyna T ma swój binarny kod - słowo kod(T ) a każdą parę słów(kod(T ), v) można zakodować jako pojedyncze słowo binarne - np. tak:

< v, kod(T ) >= 00 . . . 0︸ ︷︷ ︸|kod(T )|

1kod(T )v

gdzie liczba |kod(T )| to długość słowa kod(T ). To pozwala użyć słowa < kod(T ), v > jako danychdo pracy innej maszyny.

Maszyna uniwersalna U symuluje pracę maszyny T na danym słowie v: rozpoczynając pracęze słowem < kod(T ), v > daje ten sam rezultat, co maszyna T rozpoczynająca pracę ze słowem vzapisanym na taśmie 28:

U(< kod(T ), v >) = T (v)

Częścią naszej codziennej aktywności jest realizacja pewnych procedur, „postępowanie zgodne z instruk-cją”. Każdy z nas jest po części uniwersalną maszyną Turinga. Trzeba mieć nadzieję, że jesteśmy czymświęcej, niż taką maszyną.„Jeśli oczekujemy od maszyny bezbłędnego działania, nie możemy żądać, by jednocześnie była inteligent-na” - A. Turing, odczyt w dniu 20.02.1947 [61]

Paradoks Berry’ego revisited

Powiedzmy słowo o fascynującym wyniku, związanym ze wspomnianym już paradoksem Berry’ego:„n to najmniejsza liczba naturalna, której nie da się opisać za pomocą mniej niż czterdziestu

słów”.

Komentując ten paradoks pisałem, że jego matematyczna analiza wymaga wstępnego ustalenia„czym jest opis” (liczby naturalnej).Liczba naturalna jest nazwą - słowem. Możemy więc sprowadzić problem do pytania: czym jest opiszdania (słowa) za pomocą innego zdania (słowa)? Kołmogorov29 zaproponował taką oto, satysfak-cjonującą konstruktywistów, definicję:

„opis słowa w to para słów (kod(T ), v) gdzie v jest słowem a T - maszyną Turinga, taką, żeT (v) = w” 30.Korzystając z maszyny uniwersalnej U powiemy: opis słowa w to słowo < kod(T ), v > takie, że:

U(< kod(T ), v >) = w

Opis (kod) słowa w musi zawierać w sobie informację, jak je odczytać.Cóż po opisie, którego nikt nie rozumie? Wspomnij J. F. Champolliona31

Słowo „2+ 2” jest częścią opisu liczby 4. Drugą częścią jest opis procedury dodawania, która wszyscymamy w głowach...

27Wprawdzie niektóre spośród tych maszyn „liczą to samo”, ale nie o to chodzi.28Szczegółowy opis kodowania maszyn i budowy uniwersalnej maszyny można znaleźć np. w [87].29A. N. Kołmogorow, (1903 - 1987) – rosyjski matematyk, współtwórca teorii prawdopodobieństwa.30Zgodnie z oczekiwaniami (i zdrowym rozsądkiem) każde słowo w jest własnym opisem, gdyż istnieje „maszyna

kopiująca” COPY (czyli taka, że fCOPY (w) = w dla dowolnego słowa w).

Page 110: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 109

Przeformułujmy nieco zagadkę Berry’ego nie zmieniając jej sensu: „ berry(n) jest „najwcze-śniejszym” słowem binarnym, którego nie można opisać za pomocą słowa o długości mniejszej niżdana liczba n”32. Ta definicja słów berry(n) jest ich konstruktywnym opisem jeśli - zgodnie z nasządefinicją opisu - istnieje maszyna Turinga BERRY taka, że dla dowolnej liczby naturalnej n:

U(< kod(BERRY ), bin(n) >) = berry(n)

gdzie bin(n) to słowo - zapis binarny liczby n.

Problem w tym, że taka maszyna... nie istnieje! Aby to pokazać wystarczą dwie obserwacje:

1. Skoro przyjęliśmy, że < kod(T ), v) >= 00 . . . 0︸ ︷︷ ︸|kod(T )|

1kod(T )v , to

(∗) | < kod(BERRY ), v > | ¬ |v|+ cB

(tu i dalej przez |w| oznaczamy długość słowa w).

gdzie cB = 2 · |kod(BERRY )|+ 1 jest stałą zależną wyłącznie od maszyny BERRY .

2. Wprost z definicji słowa berry(n) wynika, że:

(∗∗) n < min(berry(n))

gdzie min(berry(n)) do długość najkrótszego opisu słowa berry(n).Łącząc obie nierówności otrzymamy nierówność:

n < min(berry(n)) ¬ | < kod(BERRY ), bin(n) > | ¬ |bin(n)|+ cBczyli

n− |bin(n)| ¬ cBktóra powinna być prawdziwa dla dowolnej liczby naturalnej n. Ale to niemożliwe, gdyż różnican− |bin(n)| rośnie nieograniczenie!33

Skoro nie ma procedury pozwalającej na konstrukcję słowa wskazanego przez Berry’ego, to nie ma iparadoksu Berry’ego...Tak konstruktywizm poradził sobie z paradoksem Berry’ego. Inni nie do końca uznają konieczność sko-jarzenia „opisów” z obliczalną procedurą ich odczytów. Nie muszą, ale...

Definicja Kołmogorova pozwala za miarę złożoności słowa w uznać długość jego najkrótszegokodu - słowa < kod(T ), v > . Ale można też rozumieć ją nieco inaczej - jako minimalną liczbęstanów maszyny Turinga T zdolnej wygenerować w, tzn. takiej, że U(< kod(T ), ε >) = w, gdzie εto słowo puste. W [20] G. Chaitin pokazał, że ta liczba - wraz ze wzrostem długości słowa v zbliżasię do wartości wyrażenia |v|

2log2|v| ...

7.2 Funkcje obliczalne

Turing widział obliczenie jako proces przetwarzania słów. Nie tylko on. W pracy „Relatives ofRobinson Arithmetic”34 traktującej o teorii składania(?) A. Grzegorczyka35 napisano tak: „Grze-gorczyk’s motivation to study the theory of concatenation is philosophical.When reasoning or31Jean F. Champollion przywrócił nam, po wiekach milczenia, informację zawartą w hieroglifach egipskich... .32Zbiór słów binarnych można liniowo uporządkować tak: pierwszym kryterium jest długość słowa a drugim - dla

słów jednakowej długości - porządek leksykograficzny: 0 ¬ 1 ¬ 00 ¬ 01 ¬ 10 ¬ 11 ¬ 000 ¬ .... „Najwcześniejsze”słowo w zbiorze, to pierwsze słowo w tym porządku.33Dla mniej zaawansowanych matematycznie: jeżeli liczbę 10 zwiększymy dziesięciokrotnie, to długość jej dziesięt-

nego zapisu wzrośnie tylko o jeden znak, gdy zwiększymy stukrotnie - zapis się wydłuży dwa znaki. Łatwo się zgodzić,że w żaden sposób nie można ograniczyć różnicy między wielkością liczby a długością jej dziesiętnej reprezentacji. Iwszystko to pozostaje prawdziwe, j gdy zapis dziesiętny zastapimy binarnym.Dodajmy dla porządku: przedstawiony dowód to modyfikacja dowodu twierdzenia Kołmogorova, które orzeka, żefunkcja min przyporządkowująca słowu długość jego najkrótszego kodu, nie jest obliczalna.34V. Svejdar, The Logica Yearbook 2008 , pp. 253-263, College Publications, London, 2009.35„theory of concatenations”

Page 111: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 110

when performing a computation, we deal with texts. Our human capacity to per-form these intellectual tasks depends on our ability to discern texts. Then it isnatural to define notions like undecidability directly in terms of texts, without reference to naturalnumbers.”.

Oczywiście można mówić o funkcjach obliczalnych działających na liczbach naturalnych. Choćbydlatego, że - jak już ustaliliśmy - liczby naturalne to słowa:

funkcja częściowa φ : Nk → N jest obliczalna gdy istnieje maszyna Turinga T nad alfabetembinarnym taka, że dla dowolnego k-elementowego ciągu liczb naturalnych (n1, . . . nk),

φ(n1, . . . nk) = m wtw fT (11 . . . 1︸ ︷︷ ︸n1

0 11 . . . 1︸ ︷︷ ︸n2

0 . . . 0 11 . . . 1︸ ︷︷ ︸nk

) = 11 . . . 1︸ ︷︷ ︸m

)

7.2.1 Funkcje obliczalne według Kleene’ego

Obliczaność funkcji działających na liczbach naturalnych można zdefiniować bez odwołań do ma-szyn Turinga. Taką niezależną definicję zaproponował S.C.Kleene36.

Funkcje, które a priori uznajemy za obliczalne, to:

- rzutowania; Πnk : Nn → N, (Πn

k(x1, . . . , xk, . . . , xn) = xk),- funkcja następnika; succ : N→ N,- funkcja stała; 0: N→ N , tzn. 0(n) = 0 , dla dowolnej liczby n.

Funkcje obliczalne to te, które można otrzymać z tych bazowych funkcji obliczalnych za pomocąwielokrotnego stosowania trzech konstruktorów:

1. składanie funkcji:

((gi : Nni −→ N; i = 1, . . . k), f : Nk −→ N) =⇒ f(g1, . . . , gk) : Nn1+···+nk −→ N

2. rekursji prostej37: korzystając z danej funkcji g : N ×N −→ N i liczby a ∈ N definiujemynową funkcję h taką, że:

- h(0) = a ,- h(succ(n)) = g(h(n), n)

W szczególności: dodawanie, mnożenie definiowane są w ten sposób, czyli są to funkcje obliczalne38.W konsekwencji każda funkcja wielomianowa jest obliczalna.

3. miminum efektywnego: dla danej funkcji obliczalnej f : N × N → N i dowolnie wybranejliczby naturalnej m możemy rozpatrywać równanie:

(∗) f(m, y) = 0

Nową funkcję g : N −→ N definiujemy przyjmując, że

g(m) = c

gdzie c to najmniejsze rozwiązanie równania (∗) i ponadto dowolnej liczby naturalnej a ¬ y wartośćf(m, a) jest określona. Stosujemy tu efektowny zapis:

g(x) = µy(f(x, y) = 0)

Funkcje obliczalne budowane bez użycia operatora minimum efektywnego to funkcje prymitywnierekurencyjne.36Stephen Cole Kleene (1909-1994) - matematyk amerykański. W 1934 roku Godel wygłosił w Princeton wykład,

którego słuchaczem był m.in. młody Kleene. Godel, szukając formalnej definicji obliczalności, zdefiniował klasę funkcjiznanych dziś jako funkcje prymitywnie rekurencyjne. W czasie tego wykładu Godel sformułował pewne propozycjerozszerzenia tej klasy. I, jak pisze R. Murawski w [81], tak rozszerzona klasa pokrywa się z klasą funkcji obliczalnychzdefiniowaną ostatecznie przez Kleene’ego.37Ograniczam się do przedstawienia bardzo uproszczonej definicji schematu rekursji.38Z zastrzeżeniem, które czasowo ukryjemy pod hasłem ”Twierdzenie Tennenbauma” a wyjaśnimy poźniej.

Page 112: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 111

Prostota środków użytych do konstrukcji funkcji obliczalnych jest zwodnicza - funkcje obliczalnebywają niebanalne. Pięknym przykładem jest słynna funkcja Ackermanna39:

A(0, x) = x+ 1;A(n+ 1, 0) = A(n, 1);A(n+ 1, x+ 1) = A(n,A(n+ 1, x))

Wygląda niewinnie, ale... spróbuj obliczyć wartość A(4, 2)40.

Definicję operatora minimum efektywnego można (należy) interpretować jako opis proceduryobliczania wartości funkcji µy(f(x, y) = 0) : „dla danego argumentu m ∈ N testujemy równośćf(m, y) = 0 kolejno dla y = 0, 1, 2, . . ., aż do chwili, gdy wynik testu będzie pozytywny. Znalezionatak liczba ymin jest wartością funkcji µy(f(x, y) = 0) dla argumentu m”.Nie można wykluczyć, że kolejne testy równości f(m, y) = 0 dadzą zawsze odpowiedź negatywną.Wartość funkcji µy(f(x, y) = 0) na argumencie m nie jest wtedy określona, bo proces jej poszu-kiwania jest nieskończony. To oznacza że wśród funkcji obliczalnych w sensie Kleene’ego są teżfunkcje częściowe41.

W języku Kleene’ego możemy też zdefiniować pojęcia rekurencyjnego i rekurencyjnie przeli-czalnego podzbioru liczb naturalnych (które, w sposób oczywisty, odpowiadają, w teorii maszynTuringa, rozstrzygalnym i rozpoznawalnym językom):

PodzbiórA ⊆ Nk jest rekurencyjny („rozstrzygalny”), jeżeli jego funkcja charakterystyczna λA : Nk →N taka, że dla dowolnego ciągu (n1, . . . , nk) ∈ Nk:

λA(n1, . . . , nk) =

1 (n1, . . . , nk) ∈ A0 w przeciwnym wypadku

jest obliczalna.Podzbiór A ⊂ Nk jest rekurencyjnie przeliczalny („sprawdzalny”, „rozpoznawalny”) jeżeli jego

częściowa funkcja charakterystyczna λcA : Nk → N definiowana tak:

λcA(n1, . . . , nk) =

1 (n1, . . . , nk) ∈ Anieokreślona w przeciwnym wypadku

jest obliczalna.W języku Kleene’ego twierdzenie o istnieniu uniwersalnej maszyny Turinga ma taką postać: „ist-nieje numeracja funkcji obliczalnych jednej zmiennej (φn : n ∈ N) oraz funkcja obliczalna dwóchzmiennych φU taka, że φU (n,m) = φn(m)”.

To wszystko.

Liczby czy słowa, Turing czy Kleene?

Definicja Kleene’ego nie wyjaśnia, dlaczego właśnie tak zdefiniowane funkcje uznajemy za obliczal-ne. Nie mówi, czym jest obliczenie. Wprawdzie definicje konstruktorów funkcji obliczalnych kojarzą39Ackermann był uczniem Hilberta. Dodajmy, że to nikt inny tylko Hilbert zainicjował poważne badania nad

obliczalnością: dziesiąty punkt jego słynnego programu to pytanie o istnienie „algorytmu” (procedury) rozwiązywaniadowolnego równania diofantycznego.40A(4, 2) = 265536−3. Ten niesamowicie szybki wzrost funkcji Ackermanna jest punktem wyjścia do udowodnienia,

że nie jest ona prymitywnie rekurencyjna (choć, na pozór, „podwójna rekurencja” użyta w jej opisie nie jest takodległa od zwykłej rekurencji)...41W języku Kleene’ego można też próbować mówić o „jawnej” i „niejawnej” nieokreśloności częściowej funkcji

obliczalnej. Jednak teraz to rozróżnienie nie jest tak widoczne jak w języku maszyn Turinga.Dziwny przykład: funkcję µy(succ(y) = 0) można interpretować jako ... „nieokreśloną liczbę naturalną” bo - proce-duralnie - jest ona związana z nieskończonym poszukiwaniem rozwiązania równania succ(y) = 0 w N.To nie jest aż tak dziwne jak się zdaje. Badanie semantyk operacyjnych języków programowania w których obecny jestoperator punktu stałego (odpowiedzialny za rekursję) zaczyna się od dodania do zbioru liczb naturalnych elementu ⊥reprezentującego „undefined element”. Zainteresowanych odsyłam np. do pracy G.D. Plotkin, LCF as a programminglanguage, Theoretical Comp. Sci. (1977), 223-255.

Page 113: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 112

się z pewnymi konstrukcjami programistycznymi ale to niewiele tłumaczy42.Obie definicje - Turinga i Kleene’ego - opisują tę samą klasę funkcji: zastępując liczby słowami

(numerałami) można dowolną funkcję obliczalną w sensie Kleene’ego zrealizować za pomocą pew-nej maszyny Turinga. Odwrotnie: numerując binarne słowa opiszemy działanie dowolnej maszynyTuringa za pomocą odpowiedniej funkcji obliczalnej43.

To nie oznacza, że można lekceważyć definicję Kleene’ego, uznać za wtórną. Ta definicja to precyzyjnyopis klasy funkcji obliczalnych w języku mainstreamowej matematyki.Dzięki Kleene’emu termin „obliczalność” mógł pojawić się w badaniach matematycznych głównego nurtu.A to okazało się ważne dla samej matematyki. Przekonamy się o tym gdy będziemy mówić o dowodzietwierdzenia Godla.

Może się zdawać, że rozważanie dylematu - liczby czy słowa, formalizm Kleene’ego czy maszynyTuringa - to dzielenie włosa na czworo. Ale to zbyt proste (prostackie), bo ignoruje fundamentalnąróżnicę między tymi dwoma językami opisu funkcji obliczalnych.

Maszyny Turinga opisują obliczenia jako dziejące się w czasie procesy realizowane przez fizyczne urzą-dzenia. Funkcje obliczalne to - w tej teorii - jedynie opis rezultatu tych procesów.Formalizm Kleene’ego jest opisem rekurencyjnej struktury klasy funkcji obliczalnych. Pojęcie „procesuobliczenia” jest tu nieobecne, przywoływane jedynie nieformalnie.Te teorie są komplementarne. Obie mówią o obliczalności, ale koncentrują uwagę na różnych wątkach.

Fundamantalna różnica między definicjami obu panów polega na tym, że mówiąc o maszynachTuringa (procesach obliczeniowych) operujemy pojęciem (dyskretnego) czasu jako pojęciem pier-wotnym, nie wymagającym zdefiniowania. Czas jest tu brouwerowską pierwotną pre-intuicją. Tobrzydzi mainstreamowych ortodoksów.

W teorii Kleene’ego tak rozumiany czas jest nieobecny. Odwołujemy się do niego tylko, wte-dy, gdy próbujemy zbudować intuicje związane z formalnymi pojęciami44. Dlatego np. w językuKleene’ego trudno sformułować i rozważać fundamentalny dla teorii obliczalności problem stopu45.

Jeszcze jeden przykład: dla dowolnej maszyny Turinga T można zbudować jej n-tą aproksymację- maszynę Turinga T (n), która działa tak jak T , lecz zatrzymuje się zawsze po n krokach obliczenia46.To banalna obserwacja. Ale niech nie umknie naszej uwadze, że definiując maszynę T (n) odwołujemysię do czasu - proces obliczenia realizowany przez T „ucinamy” po n-krokach!Istnienie ciągu maszyn aproksymujących (T (n) : n ∈ N) pozwala na łatwe udowodnienie dwóchważnych twierdzeń:

„każda częściowa funkcja obliczalna f jest aproksymowalna przez ciąg (fn) totalnych funkcjiobliczalnych”. „każdy język sprawdzalny jest sumą przeliczalnego łańcucha coraz to większychjęzyków rozstrzygalnych”.

Te twierdzenia mają oczywiście swoje odpowiedniki „w języku Kleene’ego”. Ale dowody tychtwierdzeń w teorii Kleene’ego nie są już tak banalnie proste47.

Te przykłady zdają się sugerować, że język Turinga jest „lepszy” od języka Kleene’go. No tospróbujcie wyróżnić klasę funkcji pierwotnie rekurencyjnych w języku maszyn Turinga...

42Składanie funkcji to sekwencyjne wykonywanie programów, operator minimum efektywnego odpowiada pętli typu„while”. Schemat rekursji odpowiada pętli typu „for” jeżeli funkcję h : N→ N wyznaczoną rekurencyjnie przez a ∈ Ni g : N2 → N obliczamy iteracyjnie, czyli budując ciąg par liczb naturalnych generowany przez funkcję φ : N2 → N2taką, że φ(n,m) = (g(n,m), succ(m)) i element (a, 0). wówczas h(n) to pierwsza współrzędna pary φn(a, 0). To nietylko intuicja, to - w przybliżeniu - sens twierdzenia Bhoma-Jacopiniego.([12])43W to nie trzeba wierzyć, to można dowieść. Ale taki dowód wymaga bardziej precyzyjnego języka niż ten, którym

się tu posługujemy. Zainteresowanych odsyłam do dowolnej monografii poświęconej teorii obliczalności.44Wyjaśniając sens operatora minimum efektywnego pisałem: „„dla danego argumentu m ∈ N testujemy równość

f(m, y) = 0 kolejno dla y = 0, 1, 2, . . ., aż do chwili...”.45Spróbuj...46Wystarczy dodać do maszyny-procedury T „licznik kroków” i wykorzystać go do zatrzymania maszyny.47Spróbuj...

Page 114: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 113

Nawet te skromne uwagi wystarczą by zrozumieć, co oznacza komplementarność obu teorii. A może nawetwięcej: czy zgodne współistnienie obu teorii nie daje powodu by wątpić w sens poszukiwania „uniwersalngojęzyka” matematyki?

7.2.2 Efektywna numeracja

Słowa nad dowolnym skończonym alfabetem A można efektywnie ponumerować. Wystarczy po-numerować (ustawić w ciąg) litery - A = (a0, a1, . . . , an) - a potem ustawić w kolejkę wszystkiesłowa, korzystając z dwóch kryteriów porównawczych: słowa krótsze są przez dłuższymi a słowajednakowej długości kolejkujemy korzystając z porządku leksykograficznego wyznaczonego przeznumerację alfabetu48.Ta numeracja jest efektywna gdyż przedstawiony opis numeracji słów jest w istocie opisem pro-cedury pozwalajacej wskazać słowo o dowolnie wybranym numerze. Uogólniając tę obserwację (izapisując ją formalnie), efektywną numeracją języka L ⊆ A∗ nazwiemy totalną funkcję obliczalnąf : N→ L taką, że dla dowolnego słowa w ∈ L , w = f(n) dla pewnej liczby naturalnej n.To, że każdy język L ⊆ A∗ posiadający efektywną numerację jest sprawdzalny, jest oczywiste.Dowodząc, że

„Każdy język sprawdzalny ma efektywną numerację”.sprytnie wykorzystamy opisaną przed chwilą aproksymacji działania maszyny Turunga T za

pomocą maszyn T (n).Skoro język L ⊆ A∗ jest sprawdzalny, to L = L(T ) dla pewnej maszyny Turinga. Proceduranumerowania słów języka L oparta jest na sprawdzaniu, czy słowo v o numerze n należy do językaL(T (m)) 49. zgodnie z pewną ustaloną kolejnością par liczb naturalnych:

(0, 0) < (0, 1) < (1, 0) < (0, 2) < (1, 1) < (2, 0) < (0, 3) < (1, 2) < (2, 1) < . . .50

Zaczynamy od testu dla pary (0, 0) - sprawdzamy, czy słowo puste jest w L(T (0)). Jeśli tak, tosłowu pustemu nadajemy numer 0 Zapamiętujemy, że odtąd pierwszym wolnym numerem jest licz-ba 1 i rozpoczynamy kolejny test (dla, pary (0, 1)). W przeciwnym przypadku - gdy ε /∈ L(T (0))-rozpoczynamy kolejny test pamiętając, że pierwszym wolnym numerem jest nadal zero.Załóżmy, że po wykonaniu testów dla wszystkich par, które w opisanej kolejce są przed parą(no,mo), ponumerowaliśmy k słów języka L, tzn. „pierwszym wolnym numerem” jest teraz k + 1.W kolejnym kroku sprawdzamy, czy słowo w o numerze no należy do języka L(T (mo)) . Gdy testjest pozytywny, to ... . Jeśli rozumiesz w czym rzecz, to łatwo dokończysz opis procedury. Jeśli nie- przeczytaj ponownie ten opis numeracj51.

Dobrym testem zrozumienia istoty efektywnej numeracji jest samodzielne uzasadnienie, że „je-śli język L ⊂ A∗ jest rekurencyjnie przeliczalny ale nie rekurencyjny, to żadna jego efektywnanumeracja nie może być zgodna z jakąkolwiek numeracją całego zbioru A∗”52. Spróbuj!

Pojęcie efektywej numeracji po taz kolejny pozwala porównać matematykę konstruktywną iteoriomnogościową. W teorii mnogości można mowić o numeracji języka rezygnując z warunkuobliczalności funkcji numerującej f : N → A∗ . Jednak takie teoriomnogościowe pojęcie nie masensu, gdyż każdy język (nad alfabetem skończonym) ma taką „teoriomnoościową” numerację.

Istnienie „teoriomnogościowej” numeracji języka oznacza, że każde jego słowo ma swój numer. Ale to nieznaczy, że zawsze - dla wskazanej dowolnie liczby n - potrafimy wskazać słowo o tym numerze. To

48Rezultat jest taki: ε(słowo puste), a0, a1, . . . , an, a0a0, a0a1, . . . , anan, a0a0a0, . . .). To tylko początek...49Rozstrzygalność języków L(T (m)) gwarantuje, że każde z tych sprawdzeń jest procesem skończonym.50Relację, „<” na parach liczb która jest regułą budującą tę kolejkę, definiujemy tak:

(n,m) < (n1,m1) ↔ ((n+m) < (n1 +m1)) ∨ (((n+m) = (n1 +m1)) ∧ (n < n1))).51Grozi zapętlenie!52Numeracja f : N → L ⊆ A∗ jest zgodna z numeracją g : N → A∗ jeżeli dla dowolnych liczb naturalnych n,m

g(n) ¬ g(m)→ f(n) ¬ f(m).

Page 115: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 114

możliwe tylko wtedy, gdy ta numeracja jest efektywna53.Czy „nieefektywna” numeracja jest rzeczywiście numeracją?

Różnicę między numeracją a efektywną numeracją dobrze ilustruje taki przykład. Wiemy dośćby się zgodzić, że jednoargumentowych totalnych funkcji obliczalnych, jest przeliczalnie wiele54.Można więc je ponumerować, „ustawić w ciag”: (f1, f2, . . . , fn, . . .). Ale żadna taka numeracja niemoże być efektywna! Gdyby tak było, to można by zdefiniować obliczalną funkcję φ : N → Ntaką, że dla dowolnej liczby n, φ(n) = fn(n) + 1. A to oznacza, że φ 6= fn dla każdej liczby n. Tasprzeczność jest dowodem naszego twierdzenia55.

Umiemy rozstrzygać, czy słowo binarne jest kodem maszyny Turinga56. Zatem istnieje efektywna nu-meracja tych maszyn (i częściowych funkcji obliczalnych). Dlatego liczby naturalne: można uważać za(ekstremalnie krótkie) ... „kody programów” - przynajmniej w informatyce teoretycznej.

7.3 Maszyny Turinga z wyrocznią

W antycznej Grecji wielką sławą cieszyła się wyrocznia w Delfach, która ogłaszała swe przepowiednieustami kapłanki Pytii. Pytania mogły dotyczyć wszystkiego. O co mógł pytać Pytię matematyk?

Wyobraźmy sobie, że wyrocznia w Delfach ma sekcję matematyczną dysponującą bankiem infor-macji o wszelkich funkcjach określonych na słowach binarnych. Przyjmijmy, że maszyna Turinga Tma stan „zapytaj wyrocznię” i gdy znajdzie się w tym stanie, pyta Pytię: „jaka jest wartość funkcjiD : 0, 1∗ → 0, 1 (którą Ty znasz a ja nie), na słowie, które w tej chwili jest na taśmie?” Od-powiedź Pytii umieszcza w obserwowanym polu taśmy i kontynuje automatyczną pracę. W trakciepojedynczego obliczenia, wyrocznia może być pytana o działanie funkcji D wielokrotnie57 .

Przypuśćmy, że Pytia potrafi rozstrzygać problem stopu: Wówczas każda (częściowa) funkcjaobliczalna jest obcięciem pewnej totalnej funkcji, obliczalnej z pomocą tej wyroczni58.

Czasem słyszymy, że maszyny z wyrocznią to model interaktywnego procesu, w którym operator co pewienczas podejmuje decyzje wyznaczające kierunek dalszych (wykonywanych automatycznie) obliczeń.Wątpię. Tak by było, gdyby przy każdym powtórzeniu obliczenia operator podejmował identyczne decyzje.Ale czy to nie przeczy istocie interaktywności?„Jeśli oczekujemy od maszyny bezbłędnego działania, nie możemy żądać, by jednocześnie była inteligent-na” - A. Turing.

W języku Kleene’ego definicja funkcjiD-obliczalnych, czyli odwołujących się do funkcji-wyroczniD : 0, 1n → 0, 1, jest banalnie prosta: wystarczy ową funkcję D dodać do zbioru bazowychfunkcji obliczalnych... Zero mitologii.

Różne wybory funkcji-wyroczniD dają różne klasy funkcjiD-obliczalnych. Nieobliczalność funk-cji D1 jest istotnie głębsza od nieobliczalności funkcji D, gdy każda funkcja D-obliczalna jest teżD1-obliczalna ale nie odwrotnie. Są różne stopnie nieobliczalności. Te stopnie tworzą uporządko-waną strukturę, tzw. poset Turinga. Ten poset jest nie tylko nieskończony, ale i nieprzeliczalny.

Tę „hierarchię nieobliczalności” można zdumiewająco elegancko związać z pewną klasyfikacją

53Potrafimy też podać numer słowa w o ile wiemy, że w ∈ L.54Każda taka funkcja jest realizowana przez pewną maszynę Turinga. A maszyn Turinga jest przeliczalnie wiele.55φ jako funkcja obliczalna powinna wystąpić w ciągu (f1, f2, . . . , fn, . . .), czyli φ = fm dla pewnej liczby m. Ale

wówczas fm(m) = φ(m) = fm(m) + 1... . Powróć na chwilę do paradoksu Richarda.56Dlatego można budowć kompilatory weryfikujące syntaktyczną poprawnośś programu przed jego uruchomieniem..57Jeżeli komuś przychodzi do głowy chytry plan, by zadając Pytii kolejne pytania uzyskać pełną informację o

funkcji D, to błądzi. Argumentów funkcji D - słów binarnych - jest nieskończenie wiele. Zadając dowolnie dużo, alezawsze tylko skończenie wiele pytań, zawsze będziemy w sytuacji, w której nieskończona część opisu tej funkcji będzienieznana. Każdy skończony fragment nieskończoności jest wobec niej niczym...58Czy to jasne?

Page 116: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 115

formuł arytmetycznych. Najprostsze formuły arytmetyczne to formuły bezkwantyfikatorowe i te, wktórych mamy jedynie ograniczoną kwantyfikację59. Tę klasę oznaczamy przez ∆0

0 (lub Σ00 lub Π0

0).Kolejne klasy Σ0

n i Π0n definiujemy rekurencyjnie:

- jeśli φ ≡ ∃∃ . . . ∃ψ i ψ ∈ Π0n , to φ ∈ Σ0

n+1,- jeśli φ ≡ ∀∀ . . . ∀ψ i ψ ∈ Σ0

n , to φ ∈ Π0n+1.

(Ponieważ każda formuła jest równoważna pewnej formule w preneksowej postaci normalnej (str.81) to każda formuła arytmetyczna należy do jednej z opisanych tu klas)

Związek tej klasyfikacji formuł z maszynami Turinga z wyrocznią opisują dwa twierdzenia:1. formuły arytmetyczne z klasy ∆0

0 opisują podzbiory rekurencyjne,2. Niech, jak poprzednio, λcφ : Nk → N oznacza (częściową) funkcje charakterystyczną zbioru

desygnatów formuły φ(x1, . . . , xk).Formuła φ ∈ Σ0

n+1 dokładnie wtedy, gdy istnieje formuła ψ ∈ Π0n taka, że funkcja λcφ jest obliczalna

przez maszynę Turinga korzystającą z funkcji charakterystycznej λψ jako wyroczni.Podobnie można charakteryzować formuły z klasy Π0

n+1 . W szczególności:

- formuły arytmetyczne z klasy Σ01 opisują podzbiory rekurencyjnie przeliczalne60,

- formuły z klasy Π01 opisują własności z częściowo rozstrzygalną negatywną weryfikacją61.

W ten sposób sformalizowaliśmy - w odniesieniu do formuł arytmetycznych - nasze wcześniejszestwierdzenie „kwantyfikatory to diabelski wynalazek”. Irracjonalna niechęć studentów do kwanty-fikatorów znalazła racjonalne usprawiedliwienie... .

Nasza dyskusja o twierdzeniu Cantora (o nieprzeliczalności rodziny podzbiorów liczb naturalnych) suge-rowała, że to nazbyt liberalna teoriomnogościowa definicja podzbioru pozbawia nas możliwości ich opisu.Mogło się zdawać, że ograniczenie tego pojęcia do zbiorów opisywalnych w języku arytmetyki to rozsądnyi bezpieczny pomysł.A jednak ... . Język arytmetyki okazał się zbyt bogaty: własności opisywalne w języku arytmetyki są nietylko nierozstrzygalne ale wypełniają nieskończoną skalę różnych rodzajów nierozstrzygalności.

Przekonanie E. Zermelo, że można pogodzić postulat rozstrzygalności własności formułowanychw języku matematyki z koncepcją Cantora i logiką Fregego okazało się naiwnością.

7.3.1 Arytmetyki słabsze niż PA

Czy to znaczy, że język arytmetyki jest jednak zbyt obszerny? Czy nie należy rozważyć słabszycharytmetyk - teorii, w których można dowieść mniej, niż w arytmetyce Peano? Takie próby czynio-no ograniczając siłę najbardziej kontrowersyjnego aksjomatu - schematu indukcji. Jeśli całkowicieodrzucić ten aksjomat a w zamian dodać taki:

∀x ¬(x = 0)→ (∃y x = succ(y))

to otrzymamy arytmetykę Robinsona. Ona formalizuje to, co wypracowano przez wieki używającliczb naturalnych do kolejkowania i zliczania, zanim zaczęto myśleć o uniwersalnych własnościachstruktury liczb naturalnych.Ta arytmetyka jest słaba62. Np. nie można w niej dowieść przemienności dodawania, chociaż -uwaga! - można w niej dowieść, że 2 + 3 = 3 + 2 63

Skoro artytmetyka Robinsona jest słabsza od PA to nie jest pełna. Co ciekawsze, nawet ona nie da

59To formuły postaci ∀y¬t φ lub ∃y¬t φ , gdzie φ to formuła bezkwantyfikatorowa a w termie t to term nie mazmiennej y. Te napisy to skróty: ∀y¬t φ ≡ ∀y ((y ¬ t) → φ) , ∃y¬t φ ≡ ∃y ((y ¬ t) ∧ φ). Np. formuła ∃y<x 2y ≡∃y], (y < x ∧ 2y = x to formuła opisująca liczby parzyste.60To samo inaczej: „zbiór A ⊆ Nn jest rozpoznawalny dokładnie wtedy, gdy istnieje zbiór rozstrzygalny B ⊆ Nn+k

i (a1, . . . , an) ∈ A dokładnie wtedy, gdy (a1, . . . , an, b1, . . . , bk) ∈ B dla pewnych liczb (b1, . . . , bk) ”.61Domyśl się, co to znaczy.62Ale jednak silniejsza do arytmetyki równościowej którą opisaliśmy wcześniej.63Gdy do N dodamy dwa elementy a, b i przyjmiemy, że succ(a) = a, succ(b) = b oraz zdefiniujemy dodawanie i

mnożenie tak:

Page 117: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 116

się rozszerzyć do pełnej aksjomatycznej teorii64.

Inne arytmetyki słabsze od PA pozwalają na ograniczone korzystanie z indukcji. Definiujemyje odwołując się do przedstawionej wyżej klasyfikacji formuł arytmetycznych:

arytmetyka IΣ0n (IΠ0

n) to arytmetyka Robinsona + aksjomat indukcji ograniczony do formuł zklasy IΣ0

n (IΠ0n).

Np. w arytmetyce I∆00 można korzystać ze schematu indukcji jedynie dla formuł bezkwantyfikato-

rowych lub z kwantyfikatorami ograniczonymi.

Ta hierarchia koresponduje z dwoma innymi, też opartymi na ograniczoniu stosowania innych sche-matów dowodzenia (które są też dopuszczalne w PA). Pierwszy to zasada minimum:„wśród liczb posiadających własność opisaną przez formułę φ(x) istnieje liczba najmniejsza (jeślitylko choćby jedna liczba ma tę własność)”.

∃x φ(x) → ∃y (φ(y) ∧ ¬(∃z z < y ∧ φ(z))

Drugi to „schemat podstawiania” który jest też oczywisty, ale nie potrafię go zręcznie wysłowić:

∀x<t ∃y φ(x, y)→ ∃z ∀x<t∃y<z φ(x, y)

Dla dowolnej klasy formuł K ∈ Σ0n,Π

0n : n ∈ N oznaczmy przez LK i BK rozszerzenia

teorii I∆0 odpowiednio o zasadę minimum lub schemat podstawiania, ograniczone do formuł zklasy K. W [16] można znaleźć diagram opisujący zależności między tak definiowanymi słabymiarytmetykami:

IΣ0n+1

BΣ0

n+1

oo // BΠ0n

IΣ0noo // IΠ0

noo // LΣ0

noo // LΠ0

n

(T → S) oznacza, że aksjomaty S są dowodliwe w T - teoria S jest słabsza niż T 65.

Powtórzmy pytanie: czy należy korzystać z kwantyfikacji bez żadnych ograniczeń? Zwolennicyhilbertowskiej wizji matematyki chcą pełnej arytmetyki, a wszelkie kłopoty stąd wynikające sądla nich „obiektywne”. Drugą skrajność reprezentują finityści, którzy (nieco upraszczając) chcąsamoograniczenia do klasy Π0

1.W kontekście tej dyskusji warto też przytoczyć hipotezę Friedmanna (cytuję za wikipedią):

„Every theorem published in the Annals of Mathematics whose statement involves only finitarymathematical objects (i.e., what logicians call an arithmetical statement) can be proved in EFA66

+ n a b

m m+ n b aa a b ab b b a

· 0 n(> 0) a b

0 0 a bm(> 0) 0 m · n a b

a 0 b b bb 0 a a a

to otrzymamy model arytmetyki Robinsona, w którym zdania ∀x ¬(x = succ(x)), ∀x,y x+ y = y + x, ∀x 0 + x =0, ∀x 0 · x = 0 są fałszywe. To znaczy, że prawdziwości tych zdań nie można dowieść bez aksjomatu indukcji.64Z uwagi na swą prostotę arytmetyka Robinsona traktowana jest jako „wzorzec” teorii, której nie można rozszerzyć

do aksjomatycznej pełnej teorii.65Zależności te zostały pokazane przez Parsonsa, Parisa i Kirby’ego [16]. Wydały mi się na tyle ciekawe, że posta-

nowiłem je tu przedstawić.66Harvey Friedmann (1948 - ), logik amerykański, zapoczątkował tzw. matematykę odwrotną (matematykę na

opak). Sens „odwrócenia” polega na tym, że zamiast pytać o konsekwencje ustalenego zbioru założeń (aksjoma-tów) pytamy, co jest niezbędne do udowodnienia takiego czy innego twierdzenia. Annals of Mathematics to jedno znajbardziej prestiżowych czasopism matematycznych.

Page 118: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 117

EFA - „Exponential (or elementary) Function Arithmetic” - to arytmetyka Robinsona wzboga-cona o rekurencyjną definicję potęgowania:

x0 = 1 ,xsucc(n) = xn · x

oraz o aksjomat indukcji ograniczony do formuł z klasy ∆00.

Jest jeszcze teoria PRA - Primitive Recursive Arithmetic?67. Jest to teoria bezkwantyfikatoro-wa co oznacza, że aksjomaty PA piszemy bez kwantyfikatora uniwersalnego, a schemat indukcjizapisujemy tak: dla dowolnej formuły bezkwantyfikatorowej φ(x):

(φ(x)[x := 0] ∧ (φ(x)→ φ(x)[x := succ(x)]))→ φ(y)68

Ponadto dla każdej funkcji prymitywnie rekurencyjnej dodajemy - jako aksjomaty PRA - defi-niującą ją parę równań rekurencyjnych.

Teoria PRA jest uznawana przez wielu (konstruktywistów) za formalny odpowiednik hilbertowskiej ma-tematyki „real statements”.

Czy zatem nie powinniśmy uznać postulaty konstruktywistów i ograniczyć matematykę doPRA? Nie sądzę. Brak procedury rozstrzygającej (sprawdzającej) o spełnianiu danej formuły nieoznacza, że poszukujac odpowiedzi na pytanie „czy dana liczba (układ liczb) ma daną własnośćarytmetyczną?” zawsze skazani jesteśmy na porażkę. Być może niektórzy właśnie w rozwiązywaniutakich „punktowych” (lokalnych) problemów upatrywać będą sensu matematyki.

Co robić?69 Nic. Wystarczy być świadomym różnorodności matematyki.

7.3.2 Krok w bok: rekurencja, iteracja i fraktale

Rekurencja czy iteracja? Ciąg iteracyjny elementów zbioru A wyznaczony przez element a ∈ A ifunkcję-generator h : A → A to funkcja φ(a,h) : N → A taka, że φ(a,h)(m) = hm(a). Komentującdefinicję Kleene’ego pokazaliśmy, jak funkcję definiowaną rekurencyjnie obliczać iteracyjnie. Jestteż jasne, że każdy ciąg iteracyjny można opisać rekurencyjnie70.

Iteracja(„iteratio”) to powtarzanie - wielokrotne użycie funkcji-generatora. Matematyków odczasów Zenona z Elei interesowało, co się stanie, gdy dany „krok iteracyjny” powtarzać będziemy„nieskończenie wiele razy”71. I choć współczesna analiza matematyczna dostarcza wielu narzędzibadania zbieżności ciągów i szeregów, to jednak wciąż jest to pole na którym możemy wykazać sięmatematyczną wyobraźnią72.

Na przykład zbiór Cantora powstaje tak: domknięty odcinek [0, 1] dzielimy na trzy części -[0, 1

3 ], (13 ,

23), [1

3 , 1] - i wyrzucamy środkowy, otwarty odcinek. Powtarzamy tę procedurę w stosunkudo dwóch pozostałych odcinków (wyrzucamy ich środkowe części). I tak dalej... .Czy potrafimy wyobrazić sobie ostateczny efekt nieskończonej realizacji tej procedury? 73

67Inaczej: arytmetyka Skolema.68Więcej informacji o PRA można znaleźć w [97]69W.I.Lenin.70Jeśli tylko użyjemy schematu rekursji do opisu funkcji typu Nk → A a nie, jak u Kleene’ego, tylko do funkcji

typu Nk → N . Spróbuj.71Nie tylko matematyków: Hasło „zbieżność” w polskiej wikipedii zaczyna się od zdania: „Zbieżność, przez wiele

iteracji, oznacza proces zmierzania do określonej wartości, w czasie; lub zmierzania do określonego punktu, lubwspólnego punktu widzenia, opinii lub sytuacji.”72Jeden z najstarszych wyników dotyczących zbieżności szeregów to osiągnięcie Nicole Oresme który pokazał, że

sumując odpowiednio wiele początkowych wyrazów ciągu ( 1n

: n ∈ N) możemy otrzymać dowolnie wielką liczbę(naukowo: szereg harmoniczny 1 + 1

2 + 13 + 1

4 + · · · jest rozbieżny). Jego pomysł był genialnie prosty - Oresmepogrupował wyrazy tego ciągu tak:

1 +12

+(1

3+

14

)+(1

5+

16

+17

+18

)+ · · · > 1 +

12

+(1

4+

14

)+(1

8+

18

+18

+18

)+ . . .

Działo się to chwilę po bitwie pod Płowcami... .73Czyli wielkość graniczną, do której przybliżają nas kolejne kroki iteracyjnej konstrukcji. Pomóc można sobie na

Page 119: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 118

Konstrukcje iteracyjne ilustruje się zazwyczaj przedstawiając jej kilka (kilkanaście) pierwszychkroków. Resztę, chcąc nie chcąc, pozostawia się owej matematycznej wyobraźni Ten szczególnyrodzaj wyobraźni to dumny (i trochę arogancki) wyróżnik klanu matematyków74. Najpierw rzecz(obiekt matematyczny) sobie wyobrażamy, a dopiero potem formalnie opisujemy. Niejawnie za-kładamy, że iteracyjna powtarzalność kroków konstrukcyjnych objawia się jako pewna regularnośćbudowanego w ten sposób obiektu. Wierzymy, że analiza kilku, kilkudziesięciu - „wystarczająco wie-lu” - pierwszych kroków ujawni wszelkie subtelności i pozwoli wyobrazić sobie graniczny rezultattego procesu. Jeśli nie, to jest to nasza wina, bo zabrakło nam wyobraźni.

Czyżby? Pojawienie się komputerów kazało zwątpić i w ten „psychologiczny” paradygmat mate-matycznego poznania.

W latach siedemdziesiątych XX wieku za sprawą Beniot Maldenbrota w matematyce pojawiłysię fraktale75. Najprościej: są to podzbiory płaszczyzny otrzymywane jako graniczne rezultaty nie-skończonych procesów iteracyjnych.Fraktal zwany dziś zbiorem Maldenbrota - opisujemy tak: dla dowolnej liczby zespolonej z tworzy-my iteracyjny ciąg M(z) = (z0 = z, z1 = z2

0 + z, . . . , zn+1 = z2n + z, . . .)76 Taki ciąg może zbiegać

do pewnego punktu płaszczyzny lub uciekać w nieskończoność - może być rozbieżny. To zależy odwyboru początkowej liczby (punktu) z. Zbiór Maldenbrota tworzą te liczby, dla których opisanyciąg jest zbieżny.

Udowodniono, że ciąg M(z) jest rozbieżny, gdy jakikolwiek punkt tego ciągu znajdzie się pozakołem o środku w początku układu współrzędnych i promieniu 2.Jakikolwiek... tylko który? Wiemy już tyle, by zgodzić się, że to kryterium jest podstawą dla stwo-rzenia procedury sprawdzającej czy liczba-punkt nie należy do zbioru Maldenbrota.W tamtym czasie komputery były już na tyle sprawne, by można było zrealizować taki oto eks-peryment. Dla wybieranych kolejno (losowo) liczb-punktów77 z generujemy podciągi początkoweciągów M(z) określonej długości. Jeżeli taki podciąg M(z) wykroczy poza koło o promieniu 2, tooznacza, że punkt z nie jest w zbiorze Maldenbrota. Zaznaczając te punkty-liczby czarnym pikselemna białej płaszczyźnie uzyskujemy przybliżony obraz zbioru Maldenbrota. Sam zbiór Maldenbrotajest wielkością graniczną dla tak konstruowanych zbiorów78.Sens takiej aproksymacji ujawni się dopiero wtedy, gdy testowi zbieżności ciągów M(z) poddamywystarczająco liczny zbiór punktów, a testowane podciągi będą odpowiednio długie. Ręczne prze-prowadzenie testów dla np. losowo wybranych 50 punktów i podciągów długości 50 (co za robota...)powie nam niewiele (nic) o wyglądzie zbioru Maldenbrota. Na ich podstawie nie zbudujemy wy-obrażenia tego zbioru.Ale od czego są komputery? One mogą cierpliwie i szybko realizować tę procedurę dla tysięcy punk-tów i podciągów niewspółmiernie dłuższych. W internecie można znaleźć liczne galerie fraktali (ich

dwa sposoby: punkty tego zbioru to liczby, które w rozwinięciu trójkowym nie mają jedynek. Inny sposób to odwołaniesię do charakteryzacji topologicznej: ten zbiór to jedyna przestrzeń topologiczna, która jest zwarta, metryzowalna,zerowymiarowa i doskonała... Żartuję? Trochę.Podobną konstrukcją jest dywan Sierpińskiego. Z tą różnicą, że rzecz dzieje się nie na prostej, ale na płaszczyźnie.Punktem wyjścia jest kwadrat [0, 1] × [0, 1] który dzielmy na dziewięć (3x3) mniejszych i równych kwadratów iusuwamy (otwarty) środkowy. A potem stosujemy tę samą procedurę do każdego z ośmiu mniejszych kwadratów(http://pl.wikipedia.org/wiki/Dywan Sierpińskiego).74„Zdaje mi się, że widzę... gdzie? Przed oczyma duszy mojej” - W. Szekspir, Hamlet. Hilbert poinformowany, że

jeden z jego studentów porzucił matematykę na rzecz poezji powiedział: „To dobrze. Miał zbyt mało wyobraźni jakna matematyka.”.75B. Mandelbrot (1924 -2010) urodzony w Warszawie w rodzinie litewskich Żydów francuski i amerykański mate-

matyk.76Mówimy tu o liczbach zespolonych ale w gruncie rzeczy chodzi tu o punkty płaszczyzny. Użycie liczb zespolonych

daje jedynie możliwość prostszego opisu tej konstrukcji.77Z okręgu o środku w (0, 0) i promieniu 2.78Tak powie konstruktywista dla którego zbiór Maldenbrota to tylko idea, gaussowska wielkość graniczna. Ale już

np. Penrose w [87] nie ma żadnych wątpliwości i pisze: zbiór Mandelbrota nie został wymyślony, lecz odkryty. Takjak Mount Everest, zbiór Maldenbrota po prostu istnieje!” Oj, chyba jednak nie tak „po prostu”... .

Page 120: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 119

przybliżeń). Są to grafiki o niepokojącej urodzie79. To rodzaj twórczości plastycznej, którą w pełniodczyta jedynie matematyk. Bo tylko matematyk skojarzy te grafiki z procesami rekurencyjnymi izaduma się nad fenomenem tej „granicznej” konstrukcji...

Inne, związane z rekurencją i iteracją eksperymenty S. Wolframa, znajdziemy w książce „NewKind of Science” - [137]. Najprostsze z nich dotyczą automatów komórkowych. Taki automat to -w najprostszej wersji- urządzenie, zdolne w rekurencyjny sposób przekształcać informację zapisanąw postaci binarnego słowa na nieskończonej w obu kierunkach taśmie. W każdym kroku rekuren-cyjnym zmianie ulegają wszystkie pola taśmy. Reguły opisujące zmianę wartości dowolnego polataśmy są lokalne; nowa wartość pola o adresie a80 zależy od aktualnej zawartości pól o adresach(a − 1, a, a + 1). Taką regułę można więc opisać jako funkcję f : 0, 13 → 0, 1. Dlatego mamytylko 28 = 256 różnych automatów komórkowych. Zabawka... Ale Wolfram - być może inspirowanyfraktalami - sprawdził - za pomocą komputera! - co otrzymamy, gdy rezultat pracy automatu ko-mórkowego przedstawimy graficznie na płaszczyźnie w ten sposób, że linie (wiersze) tej płaszczyznyto biało-czarne ciągi odpowiadające kolejnym stanom taśmy, na której pracuje taki automat81.Łatwo się domyślić, że ciekawy obraz otrzymamy dopiero wtedy, gdy narysujemy nie 5 czy 10 liniia np. 1000 czy 10000. Komputer to potrafi. Tak powstało 256 obrazów. Część z nich jest banalna,ale część naprawdę fascynująca. Np. obraz generowany przez automat komórkowy o numerze 30to trójkąt (wypełniony czarnymi i białymi punktami) którego lewa strona jest w pewnym sensieregularna a prawa wydaje się być absolutnym chaosem... Dlaczego?

Jednak wartość prac Wolframa nie tylko w prezentacji tych komputerowych eksperymentów. Wrozdziale „The need for a New Intuition” Wolfram napisał: „ The pictures (...) show that it takesonly simple rules to produce highly complex behaviour. Yet at first this mayseem almost impossibleto belive. For it goes against some of our most basic intuition about the way things normally work.”A tam, gdzie zawodzi intuicja potrzebny jest ... eksperyment. 82

Dark side of the moon(...) żaden algorytm nie może być zły czy dobry samw sobie - o tym decyduje sposób jego wykorzystania- H.Fay („Hello world”)

Fraktale to tylko wierzchołek góry lodowej jaką jest świat komputerów, algorytmów i sztucznejinteligencji. Ukazuje - na niewinnym przykładzie - przewagę komputera nad człowiekiem. Ale wpodwodnej części tej lodowej góry kryją się demony.Gdzieś w drugiej dekadzie XXI wieku technologia komputerowa osiągnęła poziom, który zapocząt-kował zmianę relacji między człowiekiem a komputerem. Pojawiły się samodoskonalące aplikacje(programy, maszyny). „Machine learning” (termin nienajszczęśliwiej tłumaczony jako „uczenie ma-szynowe”) to działanie polegające na tworzeniu aplikacji, które samodzielnie się doskonalą. Rolaczłowieka-programisty (realizowana poprzez dostarczenie maszynie programu) ogranicza się do ini-cjacji procesu samokształcenia. Możemy np. podać reguły gry w kółko i krzyżyk i wydać polecenie„naucz się grać” - czyli napisać program poszukujący strategii wygrywającej83 . Podobnie możnazlecić komputerowi nauczenie się gry w szachy czy też w grę go84.Rezygnując z kontroli nad przebiegiem samokształcenia aplikacji automatycznie tracimy kontrolę

79Dodajmy, że łatwo wprowadzić do reprezentacji graficznej kolor.80Można przyjąć, że pola tej taśmy mają przyporządkowane adresy - liczby całkowite81http://mathworld.wolfram.com/CellularAutomaton.html82Opisane tu automaty komórkowe to najprostsza wersja modelowania „scenariuszy rozwoju”. Jeśli komórkę bę-

dziemy reprezentować jako kwadracik na płaszczyźnie, to ma ona już nie dwóch ale ośmiu sąsiadów, którzy mogęwpływać na jej stan. Można też przyjąć że możliwych stanów komórki jest więcej niż dwa. Gra się komplikuje....Zainteresowanym proponuję przeszukanie internetu pod hasłem ”Conway’s game of life”.83W 1983 roku powstał film „Gry wojenne” (WarGames) w którego fabule kluczową rolę odgrywało to, że w grze

kółko i krzyżyk nie ma strategii wygrywającej: można wygrać tylko wtedy, gdy przeciwnik popełni błąd. A to się niezdarzy, gdy przeciwko sobie grają komputery w USA i ZSRR odpowiedzialne za użycie broni jadrowej... .84W 1997 roku komputer Deep Blue pokonał szachowego mistrza Garry’ego Kasparova. W 2016 roku komputer

wygrał z arcymistrzem gry go.

Page 121: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 120

nad jej rezultatami. Możemy podziwiać tak stworzoną aplikację wygrywającą w grę go z arcymi-strzem, ale nie wiemy, dlaczego komputer wykonywał takie a nie inne ruchy. To sytuacja, którąwszyscy przeżyliśmy (lub przeżyjemy) ucząc dziecko jazdy na rowerze: w istocie nie wiemy, dla-czego w końcu udało się maluchowi zapanować nad rowerem. A nawet jeśli wiemy (bo jesteśmy np.fizykiem) to nie zaczniemy przecież nauki od opanowania teorii... .Do kategorii aplikacji samouczących się należą też np. programy rozpoznwania obrazów: inicjujemyje dostarczając aplikacji testowych danych i współuczestnicząc do pewnego momentu w procesie ichanalizy. Ufamy, że ten trening wystarcza, by aplikacja nauczyła się samodzielnie analizować nowedostarczane jej dane-obrazy. Ale czy mamy pewność?

„Na początku” komputer był niewolnikiem - jego rola ograniczała się do wykonywania prostych pole-ceń zlecanych przez człowieka. Programy samodoskonalące się sprawiają, że komputer staje się naszympartnerem - chcąc nie chcąc musimy mu zaufać.

Komputery wyposażone w tego typu aplikacje mają nad nami fundamentalna przewagę: sąniezmordowane. Mogą się uczyć gry w szachy 24 godziny na dobę przez 7 dni w tygodniu. Mają dodyspozycji praktycznie nieograniczone możliwości obliczeniowe i zasoby pamięci. Czy czas się bać?

Bez wątpienia, komputery będą coraz więcej umiały i będą nas wyręczały w wykonywaniu corazbardziej skomplikowanych zadań. Będą je wykonywały lepiej niż człowiek. To rewolucja porówny-walna (nieporównywalna) do rewolucji przemysłowej, gdy maszyny zastąpiły ludzi wykonującychprace fizyczne. Czy staniemy się zbędni? Niewesoła perspektywa... . Nie chcę rozwijać tego tematu,ale ... czy można sobie wyobrazić, że „świetnie wykształcony” komputer obserwujący za pomo-cą tysięcy kamer i czujników spadające jabłko znajdzie w tym impuls do sformułowania prawapowszechnego ciążenia?85

Komputery są zdolne nauczyć się wielu umiejętności w stopniu przekraczającym możliwości człowieka.Ale to nie znaczy, że stają się inteligentne.

7.4 Obliczanie to przepisywanie86

Preludium: redukcyjne obliczenia arytmetyczne

„Liczby naturalne służą do zliczania i kolejkowania”. Do stworzenia tego uniwersalnego systemu nazw-wystarcza zero i operacja następnika. Jednak człowiek chciał zliczać sprawniej i szybciej - zaczął dodawaći mnożyć. To oznaczało konieczność zapisywania sum i iloczynów liczb. Tak pojawiły się nowe nazwy -wyrażenia (termy) arytmetyczne.Język został rozszerzony. Jego jądro - liczby naturalne reprezentowane przez numerały - zostały oto-czone przez wyrażenia arytmetyczne. Tej rozbudowie języka nie towarzyszyło jednak rozszerzenie zbioruznaczeń. Siłą rzeczy pewne nazwy muszą znaczyć „to samo”. Dwa wyrażenia arytmetyczne zaczęliśmynazywać równoważnymi gdy mają tę samą wartość, „znaczą to samo”. Np. wyrażenia 4+12 oraz 2 ·(3+5)są równoważne. A oba są synonimami nazwy-numerału 16.To wszystko już powiedzieliśmy87. Ale czy powiedzieliśmy wszystko?

Wyjaśnienie terminu „synonim” w polskiej wikipedii zaczyna się tak: jest to „wyraz lub dłuższeokreślenie równoważne znaczeniowo innemu, lub na tyle zbliżone, że można nim zastąpić to drugie”.Na przykład w języku polskim frazy-wyrażenia „siedziba UMK”, „miejsce urodzin Kopernika”,„Toruń” uznamy za równoważne, gdyż identyfikują to samo miasto.

Matematyk czytający to wyjaśnienie poprzestanie na pierwszym zdaniu i uzna, że matema-tycznym odpowiednikiem synonimu jest dobrze mu znane pojęcie równoważności wyrażeń. A może

85„Każdy obiekt we wszechświecie przyciąga każdy inny obiekt z siłą wprost proporcjonalną do iloczynu ich mas iodwrotnie proporcjonalną do kwadratu odległości między nimi” - I.Newton.86Ten podrozdział ma charakter pomocniczy: ma nam pomóc zrozumieć następny - o λ-rachunku.87W rozdziale Nieskończoność kontrolowana. Przypomnijmy, że n = succn(0) = succ(succ(. . . (succc︸ ︷︷ ︸

n

(0).

Page 122: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 121

nawet wspomni o logice równościowej bo przecież istnieją formalne systemy pozwalające dowodzićrównoważności wyrażeń arytmetycznych. 2 + 2 = 4 88.

Ale to samozadowolenie skutecznie zepsuł Stanisław Lem pisząc: „Czy pan zna dowód Peanai Russella na to, że dwa a dwa jest cztery? Zajmuje bitą stronę znaków algebraicznych. Wszyscybawią się, i ja się bawię...”89

Można oczywiście arbitralnie (i nieco arogancko) odmówić nie-matematykowi Lemowi prawawypowiadania się o matematyce. Ale rzecz w tym, że Lem ... ma rację. Spróbujemy to pokazać.

Jeśli przeczytamy do końca objaśnienie terminu „synonim” w wikipedii, to napotkamy takiezdanie: „Synonim nie jest inną nazwą desygnatu, jest wyrazem bliskoznacznym”.Otóż to. Wśród trzech synonimicznych wyrażeń - „siedziba UMK”, „miejsce urodzin Kopernika”,„Toruń” - to ostatnie jest wyróżnione. Dwa pozostałe są równoważne, bo można je zredukować dowspólnej dla nich podstawowej (kanonicznej) nazwy90.Podobnie wyrażenia 2 · (3 + 1) i 2 · 2 + 4 są równoważne, bo ich wspólną wartością jest numerał 8.

Równoważność wyrażeń arytmetycznych jest wtórna w stosunku do ich sprowadzalności(redukcji) do wspólnego podstawowego wyrażenia.„Rzeczy, które są równe tej samej rzeczy, są wzajemnie równe” - Euklides

Tak przygotowaliśmy się do lektury fragmentu wstępu do książki „Proof and Types” Y. Girarda[41]. Przeczytajmy uważnie:

„There is a standard procedure for multiplication, which yields for the inputs 27 and 37 theresult 999. What can we say about that? A first attempt is to say that we have an equality

27× 37 = 999This equality makes sense in the mainstream of mathematics by saying that the two sides denotethe same integer (...). This is the denotational aspect, which is undoubtedly correct, but it missesthe essential point:

There is a finite computation process which shows that the denotations are equal. It is anabuse91 (and this is not cheap philosophy - it is a concrete question) to say that 27×37 equals 999,since if the two things we have were the same then we would never feel the need to state theirequality. Concretely we ask a question, 27 × 37, and get an answer, 999. The two expressionshave different senses and we must do something (...) to show that these two senses have the samedenotation.

„Sensem” wyrażenia 27 × 37 jest to, że wskazuje ono na konieczność dokonania obliczenia -znalezienia jego wartości. Możemy nadal pisać 27 × 37 = 999 pamiętając jednak, że nie jest tozapis symetryczny. To może lepiej pisać 27× 37→ 999 92 ?

W Prologu - języku programowania logicznego - zadając pytanie „4 is 2+2” otrzymamy odpowiedź truea na pytanie „2+2 is 4” - false...

Redukcję wyrażeń arytmetycznych można opisać formalnie nadspodziewanie prosto: wystar-czy potraktować równania rekurencyjne - równości opisujące dodawanie i mnożenie93 jako regułyobliczeniowe (reguły redukcji). Zapiszemy je dostosowując oznaczenia do ich nowej roli:

88O równoważności w strukturach rekurencyjnych mówiliśmy w rozdziale „Nieskończoność kontrolowana”.89S. Lem (1921-2006) pisarz-futurolog a także filozof. Cytat pochodzi z jego książki „Śledztwo”.90Zróbmy test: poprośmy pewną grupę ludzi o wskazanie synonimu wyrażenia „siedziba UMK” a drugą, równo-

liczną, o wskazanie zamiennika wyrażenia ”Toruń”. Założę się, że liczba osób w pierwszej grupie, które wybiorą„Toruń” będzie nieporównywalnie większa od liczby osób z drugiej grupy, które wybiorą odpowiedź „siedziba UMK”.Tak będzie, bo „Toruń” jest podstawowym („normalnym”, „kanonicznym”) wyrażeniem w klasie równoważnych muwyrażeń. Asymetryczny termin „redukcja” lepiej opisuje tę sytuację niż symetryczna „równoważność”.91nadużycie92Odeszliśmy tu od kowencji nakazującej odróżniać liczby naturalne od numerałów.93Patrz: opis systemu dowodzenia równoważności wyrażeń arytmetycznych (str. 200).

Page 123: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 122

x+ 0 x x 0 0x+ succ(y) succ(x+ y) x succ(y) (x y) + x

Reguły tworzą system redukcji (przepisywania) termów (wyrażeń) arytmetycznych 94.Jak je czytać? Np. regułę „x + succ(y) succ(x + y) ” odczytujemy tak: „wyrażenie kształtux + succ(y) można zredukować do wyrażenia succ(x + y)” - bez względu na to, jakie wyrażeniaarytmetyczne wstawimy za zmienne x i y. Np. 3 + succ(succ(2)) succ(3 + succ(2)) .Podobnie interpretujemy pozostałe reguły.

Te reguły wolno użyć w dowolnym kontekście, stosując mechanizm dopasowywania95 Stąd np.succ(3 + succ(2)) succ(succ(3 + 2)), gdyż

- wyróżnione podkreśleniem podwyrażenie można „dopasować” do poprzednika reguły x+succ(y) succ(x+ y) przez podstawienie [x := 3, y := 2],- zastępując to podwyrażenie na zmodyfikowany przez to samo podstawienie następnik tej reguły- wyrażenie succ(x+ y)[x := 2, y := 3] - otrzymamy wyrażenie succ(succ(2 + 3)).

I jest tak, jak chciał Lem:

2 + 2 = 2 + succ(1) succ(2 + 1) = succ(2 + succ(0)) succ(succ(2 + 0)) succ(succ(2)) = 4

Nie trzeba „całej bitej strony”, wystarczą dwie linijki...

7.4.1 Systemy redukcji wyrażeń

Trzeba przyznać Lemowi rację: dowodzenie równoważności wyrażeń arytmetycznych jest wtórne wstosunku do obliczalnia ich wartości. Zapominanie o tym komplikuje życie.

Czy tak jest zawsze, czy równoważność wyrażeń dowolnego języka jest wtórna w stosunku doich (odpowiednio definiowanej) wartości?Pytanie warte uwagi. Ale jak rozumieć „wartość wyrażenia” gdy język wyrażeń artymetycznych za-stąpimy wyrażeniami (slowami) dowolnego języka? W zgodzie z poczynionymi sugestiami możemyzaproponować taką quasi definicję: „wartość wyrażenia w to wyrażenie v do którego można zredu-kować (sprowadzić) w i które nie jest dalej redukowalne”. Ale jak rozumieć „redukcję wyrażeń”?

Wprowadźmy formalizm pozwalający na jednoczesne rozpatrywanie równoważności i redukcjiwyrażeń. Każdy rozstrzygalny zbiór par słów ρ ⊂ A∗ × A∗ można traktować jako „bazę” relacjirównoważności słów rρ - najmniejszej zwrotnej, symetrycznej i przechodniej relacji zawierającejρ spełniającej warunek kongruentności: „dla dowolnych słów w, v, z ∈ A∗: jeżeli w rρ v to równieżwz rρ vz”.

Zbiór ρ można też potraktować jako zbiór reguł redukcji pewnego systemu redukcji słów. Po-wiemy, że:

- słowo v redukuje się jednokrokowo do słowa w - v → w - gdy dla pewnych słów z1, z2 ,v = z1az2, w = z1bz2 oraz (a, b) ∈ ρ,

- słowo v redukuje się do w - v →∗ w - gdy v = v1 → v2 . . .→ . . .→ vk = w ,- słowo v jest nieredukowalne (lub: jest w postaci normalnej), jeżeli nie można wskazać słowa

w ∈ A∗ takiego, że v → w.- słowo w jest wartością słowa v” - w = valρ(v) - jeżeli v →∗ w i w jest w postaci normalnej96.

Nasze pytanie - „czy równoważność słów jest wtórna w stosunku do równości ich wartości”można teraz sformułować tak: czy dla dowolnych słów v, w ∈ A∗

v rρ w wtw valρ(v) = valρ(w) ???

Odpowiedź jest ... negatywna. Choćby dlatego, że nie w każdym systemie redukcji wszystkiesłowa mają jednoznacznie wyznaczoną wartość97.94ang. term rewriting system. W Warszawie mówią system przepisujący termy95ang. pattern matching.96Lub: w jest postacią normalną v. Wprowadzane tu pojęcia to słownik teorii systemów przepisywania termów [6]97Wymyśl systemy redukcji, w których pewne słowa nie mają wartości lub mają ich wiele. To proste.

Page 124: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 123

Aby można było odpowiedzieć pozytywnie, wystarczy, by rozważany system miał dwie własności:

I. Własność diamentu: dla każdej trójki elementów a, b, d takiej, żea →∗ b , a→∗ d istnieje c ∈ A taki, że b →∗ c , d→∗ c:

a∗

b

d∗

c

Własność diamentu gwarantuje, że dowolne słowo ma co najwyżej jedną postać normalną 98.

II. Silna normalizowalność: nie można w takim systemie realizować nieskończonych obliczeń - niemożna budować nieskończonych ścieżek redukcji v1 → v2 → · · · → vn → · · · .Ta własność gwarantuje, że każde słowo ma conajmniej jedną postać normalną.

Jeśli nasz system redukcji ma obie te własności, to każde słowo ma wyznaczoną jednoznaczniewartość. I jest tak, jak oczekujemy: „dwa słowa są równoważne dokladnie wtedy gdy mają tę samąwartość (postać normalną)”.

Dowód tego twierdzenia jest prosty jeśli tylko przytomnie zauważymy, że v rρw dokładnie wtedy,gdy istnieje łączący te słowa skończony „zygzak”:

v

v2

(· · · )∗

##∗

w

∗v1 v3 (· · · )

( liczba załamań zygzaka jest dowolna) Gdy nasz system ma własność diamentu, to każdy zygzakłączący dwa dowolne słowa można (prawie) rozprostować:

v∗

v2∗

~~

vi∗

~~

w∗

!!

!!

Czyli v rρw gdy te słowa mają wspólny redukt. Dalej już z górki... .

Twierdzenie piękne, ale wniosek jeszcze piękniejszy:„jeżeli system redukcji (ze zbiorem reguł redukcji ρ ma obie opisane wyżej własności, to problem

równoważności dla relacji rρ jest rozstrzygalny”!

- wystarczy uruchomić procedurę równoległej redukcji obu słów, która - wobec przyjętych założeń- musi zakończyć się wskazaniem ich postaci normalnych. Gdy są one równe, to wyrażenia sąrównoważne. Jeśli nie, to nie... .

Opisany wcześniej system redukcji wyrażeń arytmetycznych ma własność diamentu i jest sil-nie normalizowalny. Wyrażenie arytmetyczne jest w postaci normalnej dokładnie wtedy, gdy jestpostaci succn(0). A to oznacza, że:

problem równoważności wyrażeń arytmetycznych jest rozstrzygalny98Angielska nazwa - „diamond property” - wywołuje karciane skojarzenia - „diamond” to „karo”. A dlaczego tak

- wystarczy spojrzeć na rysunek ilustrujący tę definicję. O takich systemach mówi się też, że spełniają warunekChurcha-Rossera.

Page 125: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 124

Tymczasem opisana wcześniej procedura dowodzenia równoważności jest tylko procedurą sprawdzającą...Zastępując proste obliczanie wartości wyrażenia 2 + 2 skomplikowanym dowodzeniem równoważności2 + 2 = 4 „strzelamy z armaty do wróbla - „take a sledgehammer to crack a nut”Czy kpiąc z „dowodu Peana i Russella, że dwa a dwa jest cztery” Lem to wiedział, czy tylko przeczuwał?99

Bonus: nierozstrzygalność problemu równoważności słów

Własność diamentu i silna normalizowalność gwarantują rozstrzygalność problemu równoważnościsłów.Ale czy to jest potrzebne? Może istnieje uniwersalna procedura rozstrzygająca problem równoważ-ności słów bez względu na to, jaki system redukcji rozważamy?Takiej procedury nie ma. A to dlatego, że sprytnie modyfikując instrukcje definiujące maszynąTuringa T można zbudować system redukcji słów ρT nad alfabetem 0, 1,⊥, [, ] ∪Q (gdzie Q tozbiór stanów maszyny T ) „symulujący” obliczenie realizowane przez T :

„maszyna T zatrzyma się rozpoczynając pracę ze słowem v dokładnie wtedy, gdy w systemieρT [q0v] →∗ qk ” (gdzie q0 to stan początkowy a qk - stan końcowy)”.

Co więcej, słowa [q0v] i qk są równoważne (tzn. para ([q0v], qk] należy do najmniejszej równoważ-ności zawierającej ρT ) dokładnie wtedy, gdy [q0v]→∗ qk .

Pomińmy szczegóły100. Wniosek z tego twierdzenia jest oczywisty: gdyby istniała uniwersalna pro-cedura rozstrzygająca o równoważności słów, to problem stopu byłby też rozstrzygalny”.A to, jak wiemy, jest niemożliwe... .

7.5 λ-rachunekThe λ-calculus is a type free theory about func-tions as rules, rather then as graphs [6]

λ-rachunek to uniwersalny system redukcji wypracowany przez A. Churcha101.Tak jak maszyna Turinga jest ockhamowskim opisem dyskretnej interakcji z otoczeniem, tak λ-rachunek jest równie genialnym opisem obliczeniowej aktywności człowieka. Obserwowalnym efek-tem liczenia (obliczania pisemnego) jest przekształcanie napisów zgodnie z przyjętymi a prioriregułami przepisywania. Wydaje się, że takich reguł jest ogromnie wiele i że zależą one od rodzajuobliczenia (czy mnożymy, dodajemy ...). Geniusz Churcha w tym, że skonstruował język i wskazał... pojedynczą(!) regułę redukcji pozwalającą na na realizację dowolnych obliczeń102.

Prezentację λ-rachunku poprzedzimy przypomnieniem trochę zapomnianej konwencji notacyj-nej zwanej λ-notacją103. Przypuśćmy, że interesuje nas funkcja przyporządkowująca każdej liczbierzeczywistej jej kwadrat. Pracujący matematycy postąpią wtedy tak:

- najpierw wiążą z badaną funkcją nazwę = f : R −→ R ,- następnie z tą nazwą wiążą opis rozważanej funkcji - f(x) = x2.

99Krytyczna uwaga Lema jest trochę chybiona. Arytmetyka nie jest zbiorem procedur rachunkowych (obliczenio-wych). Arytmetyka to nauką o rachunkach. Spektakularnym przykładem ukazującym korzyści jakie daje aryt-metyka jest anegdota o młodym Gaussie, któremu nauczyciel (zapewne o skrywanych skłonnościach sadystycznych)kazał obliczyć sumę stu pierwszych liczb naturalnych. Zamiast liczyć, Gauss pomyślał, czy wyrażenie 1 + 2 + . . .+ nnie można zastąpić wyrażeniem równoważnym i prostszym. Odkrył, że jest to wyrażenie n(n+1)

2 i zamiast tracić czasna ogłupiające rachunki mógł pograć w piłkę...

Nauczyciel Gaussa uczył rachunków. Miał pecha (szczęście), że na jego lekcji pojawił się genialny matematyk.Obliczanie wartości wyrażeń to rachunki. Wiedza o tym, które wyrażenia są równoważne to arytmetyka.100Można je znaleźć np. w skrypcie P.Urzyczyna Wstęp do teorii obliczeń (str.41) - https://www.mimuw.edu.pl

/ urzy/To/pto.pdf101Alonzo Church (1903 - 1995) amerykański logik i matematyk. Wymieniając tylko Churcha krzywdzę wielu jego po-

przedników i współpracowników (Frege, Russell, Curry, Schonfinkel, Kleene, Rosser). O historii powstania λ-rachunkumożna przeczytać w artykule J.P.Seldina [104], który jest (był) dostępny w internecie a także w [18].102Szczegółową prezentację λ-rachunku można znaleźć np. w [6].103W istocie λ-notacja ma swoje źródło właśnie w pracach Churcha.

Page 126: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 125

λ-notacja to konwencja, pozwalająca łączyć wprowdzenie nazwy funkcji z jej opisem. I tak np.rozważaną funkcję oznaczamy w tej konwencji jako λx x2.

Opis działania funkcji zawarty w takiej nazwie wykorzystujemy do obliczania jej wartości nazadanym argumencie w najprostszy sposób - poprzez odwołanie do prostego przepisywania:

(λx x2)(3) x2[x := 3] 32 → 9

Przejdźmy do λ-rachunku. Church przyjął, że do budowy uniwersalnego języka obliczeń redukcyj-nych wystarczą dwa konstruktory wyrażeń: aplikacja i właśnie λ-abstrakcja.

Język λ-termów ze zbiorem zmiennych X definiujemy (rekurencyjnie) tak:

x ∈ λ-termsx ∈ X M,N ∈ λ-terms

MN ∈ λ-terms(aplikacja)

x ∈ X,M ∈ λ-termsλx.M ∈ λ-terms

(abstrakcja)

Operator abstrakcji wiąże zmienne - zmienna x jest związana w termie λx.M .

W składni λ-rachunku nie ma żadnych mechanizmów kontroli stosowania konstruktora aplikacji. W szcze-gólności - λ-term może być aplikowany sam do siebie.Przypomnij sobie dyskusję o konsekwencjach samostosowalności maszyn Turinga... .

Jedyną regułą opisywanego systemu redukcji jest tzw. β-redukcja:

(λx.M)N →β M [x := N ] (β − rule)104

Pojedynczy krok obliczenia redukcyjnego λ-termu to wykorzystanie tej reguły „w dowolnym kon-tekście”, np:

x(λx.(λy.yx)(λz.zz))→β x(λy.(yλz.zz))

(podkreślony podterm to redex - podterm, do którego zastosowaliśmy β-redukcję). Obliczenie

redukcyjne to ciąg - skończony lub nie - takich kroków105. Na przykład:

(λx.(λy.(λz. (λw.xz))y))ab→β (λy.(λz (λw.az))y)b→β (λz (λw.az))b→β λw.ab

Pięknie... Ale ktoś zniecierpliwiony tymi formalnymi sztuczkami zada proste pytanie: jakie jestznaczenie λ-termów? Co wyraża β-redukcja?

Odpowiedź jest brutalna: nic nie wyraża.

λ-rachunek - w odróżnieniu od hilbertowskich teorii aksjomatycznych - nie był budowany jako opis pewnejklasy teoriomnogościowych „modeli zamierzonych”.(...) „Curry’s use of combinators was connected very closely to his philosophy of mathematics: for him aformal system was not a description of some pre-existing objects(...)” [18]106.Świadomość tej fundamentalnej odmienności jest niezbędna, jeżeli chcemy rozumieć tę matematykę...

λ-rachunek to uniwersalne środowisko, w którym można realizować dowolne procesy obliczenio-we. Tylko tyle i aż tyle.By to pojąć, popatrzmy jak w tym środowisku odtworzyć działania w dwuelementowej algebrzeBoole’a wartości logicznych. Dwie wartości logiczne - prawdę i fałsz reprezentujemy w λ-rachunkujako pewne (nieredukowalne) λ-termy:

true ≡ λx.(λy.x) false ≡ λx.(λy.y)

104Napis M [x := N ] to λ-term powstały z M przez zastąpienie każdego wolnego wystąpienia zmiennej x termem N105W opisie obliczenia redukcyjnego pominęliśmy α-konwersję - operacje przemianowywania zmiennych związanych

pozwalającą unikać tzw. „konfliktu zmiennych” [6].106Haskell Curry (1900-1982) amerykański matematyk, współtwórca λ-rachunku.

Page 127: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 126

Dlaczego tak? Jest to związane z rolą, jaką wartości logiczne odgrywają w procesie deklarowania funkcji.Wartości logiczne są wykorzystywane przy „deklarowaniu warunkowym” czyli w deklaracjach o schemacieif ... then ... else....Jeśli ten schemat „zrealizujemy” jako λ-term WMN :

if W then M else N ≡ WMN

to λ-termy przypisane napisom true i false wypełnią swoją rolę:

if true thenM elseN ≡ λx.(λy.)xMN →∗β Mif false thenM elseN ≡ λx.(λy.)yMN →∗β N

„Nie pytaj o znaczenie. Pytaj o użycie” - L. Wittgenstein107.

Operację negacji zaprogramujemy (zaimplementujemy) tak:

not ≡ λt.(t false true)Sens negacji w tym, że zmienia ona wartości logiczne - true na false i odwrotnie, I tak jest:łatwo pokazać, że β-redukcja λ-termu ukrytego pod skrótem not true prowadzi do jego postacinormalnej, którą okazuje się λ-term ... false!

not true →∗β falsePodobnie not false →∗β true108

Można też utworzyć λ-termy reprezentujące operacje and, or, implies - tak, że np. andtrue true −→∗β true oraz or true false −→∗β true. W ten sposób zaimplemantujemy - w ję-zyku λ-termów i za pomocą β-redukcji - dwuelementową algebrę Boole’a wartości logicznych [6].Czego chcieć więcej?

Podobnie wykorzystamy λ-rachunek do implementacji działań na liczbach naturalnych które sątu reprezentowane przez numerały Churcha: liczbie n przyporządkowujemy λ-term:

n ≡ λx.λy. x(. . . x(x︸ ︷︷ ︸n

(y) . . .))

Gdy teraz z operacją następnika succ zwiążemy λ-term λnfx.nf(fx) to - jak się domyślamy -proces β-redukcji termu-aplikacji succ 0 doprowadzi do numerału 1.A gdy przyjmiemy + ≡ λmnfx.mf(nfx) to - co stwierdzamy zapewne z ulgą - term + 2 2jest redukowalny do numerału 4 ... .Za mnożenie „odpowiada” λ-term λmnfx.m(fn)x109 .

Powtórzmy: nie ma sensu pytanie o „znaczenie” λ-termów. Liczy się to, że potrafimy za ich pomocąliczyć110.Przejdźmy do puenty. Najpierw definicja:

funkcja (częściowa) f : Nk → N jest λ-definiowalna jeżeli można skonstruować (domknięty)λ-term F taki, że dla dowolnych liczb naturalnych n1, . . . , nk:

Fn1 . . . nk −→∗β f(n1, . . . , nk)

o ile wartość f(n1, . . . , nk) jest określona. W przeciwnym wypadku proces redukcji λ-termu Fn1 . . . nkjest nieskończony111.

Fundamentalne twierdzenie, które pozwala traktować λ-definiowalność jako kolejny, równoważnyopis obliczalności mówi, że:107Pomyśl o ... fortepianie. Czy sens ma pytanie o jego znaczenie, czy o użycie?108Zgodnie z obietnicą, pomijam szczegółowe opisy tych rachunków.109Inne przykłady: succ ≡ λnfx.f(nfx), potęgowanie exp ≡ λmnfx.mnfx, funkcja k-argumentowa stale równa

zeru Zk ≡ λm1 . . .mk.0110Zabawny szczegół: true = λx.(λy.x) = 1... . Czyżbyśmy mieli tu do czynienia z fundamentalnym odkryciem

matematycznym?111Nieco dokładniej: λ-term Fn1 . . . nk nie posiada tzw. czołowej postaci normalnej - head normal form[6] .

Page 128: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 127

Klasa funkcji λ-definiowalnych to dokładnie klasa wszystkich funkcji obliczalnych.

λ-term F odpowiadający funkcji obliczalnej f to jej „program” w języku λ-rachunku. Term Fn1 . . . nkjest wszystkim, czego potrzebujemy by obliczyć wartość f(n1, . . . , nk) korzystając z β-redukcji.λ-rachunek jest językiem programowania112..β-redukcja ma własność diamentu ale nie jest silnie normalizująca - mogą się tu zdarzać

nieskończone obliczenia. Tak, jak w przypadku maszyn Turinga. I chyba nikogo już nie dziwi, żeproblem - „czy λ-term ma postać normalną” - jest nierozstrzygalny.

7.5.1 Maszyny Turinga a λ-rachunekRzecz jest tylko stanem procesu. Niczym więcej.Widząc rzeczy z osobna nie widzimy niczego.

Obliczenie - zarówno w ujęciu Turinga jak i Churcha - to proces przetwarzania informacji. Cote dwie teorie mają ze sobą wspólnego a czym się różnią?

Maszyny Turinga to realizacja inżynieryjnego podejścia do obliczenia: dla konkretnego zadaniabudujemy od podstaw odpowiednią maszynę tzn. definiujemy zbiór instrukcji - „program”. Żadenkrok obliczenia - zmiana konfiguracji - nie zostanie wykonany, jeśli w programie nie ma odpowiedniejinstrukcji. „For normally, we start from whatever behaviour we want to get then try to design asystem will produce it”. [137]

λ-rachunek to uniwersalny język z uniwersalną regułą redukcji, środowisko, w którym mogądziać się wszelkie procesy obliczeniowe. Realizując obliczenie w λ-rachunku nie troszczymy się oustanowienie reguł redukcji. Tu jest jedna jedyna i dana a priori reguła - β-redukcja. Nasza rolaogranicza się do zadeklarowania λ-termu - programu.

Realizując obliczenie „w stylu Turinga” (budując maszynę) musimy zaprojektować każdy pojedynczy krokobliczenia i sterowanie sekwencją kolejnych kroków. To paradygmat programowania imperatywnego.Realizując obliczenie w λ-rachunku nie mamy wpływu na przebieg procesu obliczenia113. My go tyl-ko inicjujemy wskazując λ-term, którego redukcja będzie realizacją interesującego nas obliczenia. - Toparadygmat programowania deklaratywnego .

W praktyce nikt - poza działającymi pod przymusem studentami- nie rozwiązuje zadań oblicze-niowych korzystając z maszyn Turinga czy λ-rachunku. Wystarczy spojrzeć na odrażający kształtλ-termów lub spróbować skonstruować maszynę Turinga realizującą mnożenie liczb naturalnych bywybić sobie z głowy takie pomysły. To nie są języki programowania.

Język maszyn Turinga i język λ-termów to języki bazowe („ideowe”) dla dwóch grup językówprogramowania - języków imperatywnych i funkcyjnych. Język bazowy to, w terminologii angiel-skiej, core language. Core to jądro, rdzeń a nawet... dusza.

Ockhamowska zwięzłość opisu składni języka jest pożądana, gdy prowadzimy badania nad „siłąjęzyka”. Przestaje być cnotą, gdy chcemy tego języka używać. Dlatego języka bazowy, ta osnowa,musi być otoczony przez shall language - powłokę, ułatwiającą korzystanie z tego, co oferuje językbazowy. Język powłoki ma być przyjazny, user friendly114.W przypadku języków imperatywnych nowe wyrażenia to najczęściej nazwy makrooperacji: podjednym poleceniem ukrywamy pewną sekwencję instrukcji realizowanych przez maszynę TuringaW językach programowania funkcyjnego nieczytelne λ-termy zastępujemy przyjaznymi (czytelnymi)deklaracjami. Najprostsze deklaracje to nazwy-skróty jak np. słowa true, false, not napisy n czyteż fraza „if... then... else... ” które wcześniej opisywalismy. Te nazwy należą do powłoki

112Dokładniej: to core language większości (jeśli nie wszystkich) języków programowania funkcyjnego m.in. Haskella.113Dokładniej: nie mamy możliwości ustalania strategii redukcji dla każdego obliczenia osobno. W praktyce o wyborze

strategii decydujemy na etapie budowy kompilatora dla języka programowania opartego na λ-rachunku.114Po angielsku mówimy piknie o dosypywaniu„cukru syntaktycznego”- syntactic sugar. To przypomina sytuację,

którą wcześniej nazwaliśmy budowaniem „trzeciego wymiaru” języka matematyki.

Page 129: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 128

λ-rachunku. Ale w składni języka powłoki może być coś więcej: można np. umożliwić deklaracjefunkcji, których „tłumaczenie” na λ-termy jest czymś więcej niż prostym rozwinięciem skrótów.Np. w Haskellu można deklarować funkcje odwołujac się wprost do schematu rekursji. Deklaracjamnożenia - funkcji mult wygląda tak:

mult (x,0) = 0mult (x,succ(y)) = mult(x,y) + x

Ta deklaracja jest tłumaczona na takie oto wyrażenie:

mult Y (λmxy. if (y = 0) then 0 else (mx (y − 1)) + x)

gdzie Y to operator punktu stałego - specjalny λ-term, taki, że Y F →∗β F (Y F ) dla dowolnegoλ-termu F 115.

Dodawanie do jądra języka jego powłoki nie zmienia ich siły ale jest niezwykle ważne z pragmatycznegopunktu widzenia116

7.5.2 Glossa: skąd się wziął λ-rachunek?„The lambda calculus is a type free theory about functions as rules, rather thenas graphs. ”Function as rules”reffers to the process of going from argumentsto value (...). The idea usually attributed to Dirichlet, that functions could also beconsidered as graphs (...) was an important mathematica contribution. Neverthelessthe λ-calculus regards functions again as a rules in order to stress theircomputational aspects.” [6]

Dominująca od początku XX wieku teoria mnogości jest nieco... schizofreniczna117. Wyróżniapojedyncze pojęcie pierwotne - zbiór i jedną podstawową relację - przynależność (zbioru do zbioru).A przecież każdy matematyk powie, że głównie interesują go funkcje. Np. cała analiza matematycz-na to badanie własności funkcji rzeczywistych. Godzimy się z faktem, że tych funkcji jest „więcej”niż nieprzeliczanie wiele ale w istocie interesują nas tylko funkcje opisywalne a nawet więcej - sto-warzyszone z procedurą obliczania jej wartości.λ-rachunek został sformułowany prze Churcha ok. 1928 roku jako cżęść większej teorii która niedość, że traktuje funkcje priorytetowo lecz też zupełnie nie przejmuje się ich teoriomnogościowądefinicją. „The notion of function or operation at work in the λ-calculus is an intensional one.”118.To zdanie koresponduje z brouwerowskim „by a function (...) we understand a law” czy też przy-toczonym wyżej „function as rule”.Jądrem teorii Churcha jest rachunek kombinatorów czyli λ-rachunek ograniczony do operacji apli-kacji119. Rozszerzenie do λ-rachunku to (upraszczając) konsekwencja wymogu kombinatorycznej zu-pełności nałożonego przez Churcha na rachunek kwantyfikatorów: dla dowolnego termuM(x1, . . . , xm)

115Wyrażenie które przyporządkowaliśmy wyrażeniu mult nie jest ostatecznym rezultatem translacji haskellowejdeklaracji na „czysty” λ-term. Powinniśmy jeszcze zastąpić symbol Y λ-termem λf.(λx.f (x x)) (λx.f (x x)) iwyeliminować inne „nieczyste” części tego napisu. Powodzenia.116Według Encyklopedii PWN pragmatyka to dział językoznawstwa, którego przedmiotem są społeczne i sytuacyjne

warunki funkcjonowania języka oraz cele, jakie mówiący chce osiągnąć przez użycie określonych wyrazów i wyrażeń.117Schizofrenia - zaburzenie psychiczne charakteryzujące się (...) nieadekwatnym postrzeganiem (...) i oceną rzeczy-

wistości (wikipedia).118(http://plato.stanford.edu/ entries/lambda-calculus/)119W tym samym czasie rosyjski logik Moses Shonfinkel (1889-1942) budował system znany jako logika kom-

binatoryczna U Shonfinkela kombinatory to - w uproszczeniu- „operacje na działaniach” które pozwalają wyeli-minować kwantyfikatory z opisu własności tych działań. Na przykład: przemienność działania + opisujemy zda-niem ∀x∀y x + y = y + x. Wprowadzając „kombinator” P , taki, że dla dowolnej operacji dwuargumentowej q,P (q)(x, y) = q(y, x) możemy opisać tę przemienność równością P+ = + . Schonfinkel wskazał dwuelementowy zbiórK,S pozwalający wygenerować wszystkie „niezbędne” kombinatory: Schonfinkel proved that K and S (...) stateda form of combinatory completeness result : (...) that from K and S, together with a logical operator equivalent to auniversally quantified Sheffer stroke (...) , one can generate all formulas of predicate logic without the use of boundvariables [18].

Page 130: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 129

(zbudowanego ze stałych i zmiennych wyłącznie za pomoca aplikacji) istnieje term M w którym niema zmiennych wolnych taki, że M(x1, . . . , xm) = Mx1 . . . xm. Wprowadzenie λ-abstrakcji pozwalaprzyjąć M = λx1...xnM(x1, . . . , xk) .

System budowany przez Churcha, aspirujący do roli ur-teorii, miał być również zupełny w innymsensie. Język λ-rachunku rozszerzono o symbol jednoargumentowego predykatu „` i związano z nimsystemem dowodzenia wyrażeń postaci `M gdzie M to λ-term120.

Aksjomaty i reguły dowodzenia (wyprowadzania) wyrażeń postaci `M wybrano tak, by moznabyło „uwewnętrznić wszystko, co niezbędne”. Np. uwewnętrznienie równości termów M = N polegana dodaniu do składni termu-stałej Eq i awiązania z nią pewnych aksjomatów takich, że

M = N wtw ` EqMNco oznacza, że „zewnętrzne” uzasadnienie metawyrażenia M = N można zastąpić „wewnętrznym”wyprowadzeniem wyrażenia ` EqMN .Podobnie chcemy zastąpić „zewnętrzne” uzasadnienie stwierdzenia „term M jest numerałem Chur-cha” przez „wewnętrzne” wyprowadzenie wyrażenia ` NM gdzie N to kolejna stała dodana doskładni. Tak samo uwewnętrznimy stwierdzenie term „O aplikowany do numerału zwraca nume-rał” - wprowadzamy term-stałą F wraz z aksjomatami pozwalającymi zewnętrzne uzasadnienie tostwierdzenie zastąpić wyprowadzeniem wyrażenia ` FNNO.

Co zaskakujące, jeśli λ-rachunek rozszerzymy o term-stałą F (i związane z nim aksjomaty) totermy Eq iN można zdefiniować jako pojęcia wtórne. A jeszcze bardziej zadziwia, że gdy dołączymydo λ-rachunku term - stałą P ∗ który umożliwia uwewnętrznienie stwierdzenia „jeśli ` U to ` V ” idodamy ..wewnętrzną” regułę odpowiadającą regule modus ponens:

jeśli ` P ∗UV oraz ` U to ` Vto stałą F możemy zdefiniować jako pojęcie wtórne.Dołączenie do systemu stałej P ∗ jest relizacją wymogu dedukcyjnej zupełności. Pomińmy detale.Ważne jest to, że jednoczesny wymóg kombinatorycznej i dedukcyjnej zupełności prowadzi do ...wewnętrznej sprzeczności systemu: dowodliwe jest każde wyrażenie `M . W szczególności dowodliwesą wszytkie wyrażenia postaci ` EqMN wszytkie termy są „wewnętrznie” równe. To jest treśćparadoksu odkrytego przez Kleene’ego i Rossera121.

Z pierwotnego zamysłu Churcha ocalał tylko fragment - λ-rachunek.

Dodatek: nieco więcej o λ-rachunku

Powiedzieliśmy, że aby zaimplementować w λ-rachunku działanie funkcji obliczalnej f : Nk → Nnależy wskazać λ-term Ff taki, że dla dowolnych liczb naturalnych n1, . . . , nk:

Ffn1 . . . nk −→∗β f(n1, . . . , nk)

dokładnie wtedy, gdy wartość f(n1, . . . , nk) jest określona.

Jednak nic nie jest tu określone jednoznacznie:- β-redukcja nie jest procesem deterministycznym,- numerały - λ-termy reprezentujące liczby naturalne - można definiować na różne sposoby122

- λ-term Ff - „program dla funkcji f” - można skonstruować na wiele sposobów.

Jeśli można coś robić na wiele sposobów, to można to robić lepiej lub gorzej. Aby lepiej implemen-tować funkcje obliczalne trzeba poznać możliwości λ-rachunku.120W [23] sugeruje się by napis „` M” czytać „M is asserted” dodając takie wyjaśnienia: „` plays the same role

as Hilbert’s ”ist beweisbar’” or Church’s ”is provable” oraz „This usage of „`” differs somewhat from that of Frege(...). There the symbol is placed before expressions which are already thought of as sentences (...) to indicate thatthe proposition concerned is true. Here „`” is an intransitive verb; when placed before a noun the two together forma sentence; the proposition so denoted may or may not be taken as true according to the context. Nie myślmy zadużo: Church był formalistą co oznacza, że tworzonej przez niego teorii nie towarzyszył żaden model zamierzonynarzucający podstawową interpretację pojęć (i numenklaturę).121Zwanego też paradoksem Curry’ego. Informacje o systemie Churcha czerpię z pracy [23] napisanej w 1937 roku

w stylu, który wydaje się nieco archaiczny. Nie ukrywam, że nie jestem pewny iż właściwie zrozumiałem jej treść iczy mój (świadomie) uproszczony opis nie jest fałszywy. Zainteresowanym polecam samodzielną lekturę [23] (sic!)122Numerały Churcha to tylko jedna z tych możliwości.

Page 131: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 130

Proces β-redukcji jest niedeterministyczny bo może się zdarzyć (i zdarza się często), że w danymλ-termie można wskazać wiele redeksów - podtermów, do których można zastosować β-redukcję. Np.λ-term λx.((λy.xy)z)w można jednokrokowo zredukować zarówno do (λx. xz)w jak i do (λy.wy)zbo są w nim dwa różne redeksy (wskaż je).Przebieg obliczenia i jego rezultat zależy od strategii wyboru redeksów. Np. strategia lewostronnakaże w każdym kroku redukcji wybierać redeks położony najbardziej na lewo (liczy się położeniepierwszego znaku redeksu). Ta strategia jest normalizująca - zapewnia zakończenie procesu β-redukcji λ-termu odnalezieniem jego postaci normalnej - o ile taka postać istnieje. Dlatego naszepodstawowe twierdzenie o realizowalności obliczeń w λ-rachunku można uzupełnić zdaniem „(...)gdzie redukcja Ffn1 . . . nk −→∗β f(n1, . . . , nk) realizowana jest zgodnie ze strategią lewostronną”..

Aby przyspieszyć obliczenie można próbować zastosować redukcję równoległą. Np. w termie((λx.xt)N)(λx.xs)M) są dwa rozłączne ,redeksy - ((λx.xt)N) oraz (λx.xs)M) - i możemy je zre-dukować równocześnie (do termów Nt i Ms). To jest strategia parallel outermost.Można też próbować skracać drogę redukcji wyrażenia do jego wartości-postaci normalnej. Wiado-mo, że proces lewostronnej β-redukcji dowolnego λ-termu dzieli się na dwie fazy:

- najpierw, tak długo jak to możliwe, wykorzystujemy tzw. redeks czołowy (head redex),- jeśli ta faza procesu jest skończona - otrzymamy term bez redeksu czołowego123 to rozpoczyna

się drugi etap β-redukcji w którym wykorzystujemy inne redeksy.Redeks czołowy w λ-termie - o ile istnieje - łatwo odnaleźć. Dzięki temu ta pierwsza faza procesuβ-redukcji jest „szybka”. To stwarza pokusę, by inaczej zdefiniować wartość wyrażenia-λ-termu -uznać, że jest nią owa czołowa postać normalna124.Można też ograniczyć język modelowania redukcyjnych procesów obliczeniowych do tzw. λI-termów125.Mimo ograniczenia składni, podstawowe twierdzenie o λ-definiowalności wszystkich funkcji obli-czalnych pozostaje prawdziwe, choć oczywiście wymaga nowej definicji numerałów i odmienneejreprezentacji funkcji obliczalnych [7].

To z konieczności skrótowe (a z winy autora - chaotyczne) naszkicowanie problematyki ba-dawczej związanej z λ-rachunkiem ma jedynie uświadomić, że ... istnieje matematyka poza teoriąmnogości. I to nie jest matematyka peryferyjna. Wręcz przeciwnie, wraz z rozwojem technologiiinformatycznych taka matematyka nabiera coraz większego znaczenia126.

7.6 Hipoteza Churcha i twierdzenie Tennenbauma

Obliczalność można definiować jeszcze inaczej, np. za pomocą algrytmów Markowa127. Ale skądpewność, że tak różnie opisywana obliczalność wyróżnia funkcje, które „rzeczywiście są obliczalne”?

Nie można oczekiwać matematycznego rozstrzygnięcia tej kwestii. Wszak dopiero po przyjęciujednej z proponowanych definicji, obliczalność przestaje być pojęciem intuicyjnym, staje się ter-minem matematycznym. Można tylko pokusić się o dowód, że te różne definicje obliczalności sąrównoważne - wskazują tę samą klasę funkcji. I to zrobiono.Wielość i różnorodność tych równoważnych definicji obliczalności potwierdza, że nasze intuicje zwią-zane z obliczalnością ujmują istotę rzeczy. A skoro próby matematyzacji tego pojęcia dają zawszeten sam rezultat, to możemy zaakceptować słynną hipotezę Churcha:

każda definicja obliczalności respektująca podstawowe, „pozamatematyczne” ustalenia okaże sięrównoważna tym definicjom, które już znamy.123Tzw. czołową postać normalną - head normal form.124Nawiązuję tu do tzw. leniwej ewaluacji λ-termów [1].125λI-termy tworzą podzbiór zbioru λ-termów, co jest skutkiem ograniczenia stosowania operatora abstrakcji λx.

do termów zawierających wolną zmienną x.126Dodajmy, że tzw. λ-rachunek z typami - zawężenie λ-rachunku poprzez wprowadzenie mechanizmu ograniczają-

cego stosowanie aplikacji i abstrakcji - jest zalążkiem intensywnych badań nad nieklasycznymi logikami. Może jeszczeuda się o tym intrygującym fragmencie nowoczesnej matematyki (informatyki teoretycznej?) opowiedzieć.127https://www.encyclopediaofmath.org\index.php\ Normal algorithm

Page 132: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 131

To piękne stwierdzenie wymaga jednak uzupelnienia. Uważny czytelnik zauważył, że definicjaKleene’ego pozwala wyróżnić formalnie klasę funkcji obliczalnych w dowolnym modelu arytmetykiPeano. Wiemy, że takich, istotnie różnych, modeli jest wiele. Czy to oznacza, że jest też wieleróżnych „obliczalności”?Nic z tego. Mówi o tym niezwykłe twierdzenie Tennenbauma [56]:

„istnieje tylko jeden model arytmetyki Peano w którym dodawanie i mnożenie są obliczalne(w sensie Turinga)” .

Ten model to liczby naturalne rozumiane tak, jak chcą tego konstruktywiści - jako rekurencyjniedefiniowany uniwersalny zbiór nazw.

To bardzo ważne twierdzenie w kontekście dyskusji o podstawach matematyki. Mówi, że obliczalność niejest pojęciem, które można jednoznacznie opisać w języku arytmetyki czy też w języku teorii mnogości.

Obliczalność jest pojęciem absolutnym- w odróżnieniu od tych pojęć, które są definiowane w teorii mnogości i np. w geometrii.Matematyka tworzy różne języki opisujące nasze postrzeganie rzeczywistości. Czy to, że opisy stworzonew różnych językach są równoważne można uznac za dowód, że opisujemy rzeczywistość jaka ona jest?

7.6.1 Obliczalność funkcji rzeczywistych

Jeśli rozumiemy obliczalność tak jak Turing, Kleene i Church, to zgodzimy się, że można mówić oobliczalności funkcji działających na liczbach całkowitych i wymiernych. Ale mówienie o obliczal-ności funkcji rzeczywistych, czyli typu R → R, wydaje się pozbawione sensu - liczb rzeczywistychnie można ponumerować i kodować za pomocą słów128. A numeracja („nazwanie”) argumentów jestwarunkiem sine qua non obliczalności. Z drugiej strony nawet proste kalkulatory potrafią obliczaćsinusy, cosinusy czy pierwiastki kwadratowe. Jak rozumieć taką „obliczalność”?.

Funkcja ze zbioru A do B to - w teorii mnogości - podzbiór iloczynu kartezjańskiego A × Bspełniający pewne warunki. Taka definicja jest, w kontekście rozważań o obliczaności, w sposóboczywisty nadmiarowa129. Ale to nam nie przeszkadza - my i tak interesujemy się tylko tymi funk-cjami, którymi się interesujemy. Gdy mowa o funkcjach rzeczywistych, przedmiotem zainteresowaniasą głównie funkcje ciągłe.

Skorygujmy więc nieco nasze pytanie: jak rozumieć obliczalność funkcji ciągłych?Już ustaliliśmy130, że funkcja ciagła jest jednoznacznie wyznaczona przez swoje działanie na liczbachwymiernych. To podpowiada proste rozwiązanie:

„In mathematical analysis, given a continuous function f and a real number x, we cannotcompute f(x) directly. Instead, we can approximate f(x) by computing f(x0) for some ra-tional number f(x0) close enough to x. f(x) can be taken as a result of infinite computations(f(x1), f(x2), ..., f(xk), ...), where the distance between x and xk is less than 1

k .131

Jeśli tak, to możemy zaakceptować taką oto próbę definicji funkcji ciągłej obliczalnej:funkcja ciągła f : R → R jest obliczalna, jeżeli istnieje funkcja obliczalna φf określona na

liczbach wymiernych taka, że dla dowolnej liczby rzeczywistej a i dowolnego ciągu wymiernego (an)aproksymującego a, ciąg φf (an) jest ciągiem przybliżeń f(a).

Ale czy to zamyka problem?132

128Bo jest ich nieprzeliczalnie wiele.129Twórcy teorii mnogości dbali o to, by definicje podstawowych pojęć - relacji, funkcji itp. - formułowane w języku

tej teorii obejmowały wszystko, co w zastanej matematyce było postrzegane jako relacja czy funkcja: „Althuogh afunction is by definition a set of ordered pairs this is not usually a particular helpful way to think about functions.In set theory, it often is” [136].130rozdziale „Przestrzeń - matematycznie”.131„A Logical Framework for Convergent Infinite Computations” ( Wei Li, Shilong Ma, Yuefei Sui, and Ke Xu) -

http://arxiv.org/abs/cs/0105020132Nasza propozycja grzeszy naiwnością. Odwołujemy się w niej do dowolnego ciągu liczb wymiernych aproksymu-

jącego argument - daną liczbę rzeczywistą a. Taki ciąg - funkcja z N do Q - może być obliczalna lub nie. Jeśli liczbaa nie ma obliczalnej aproksymacji, to trudno mówić o obliczaniu wartości jakiejkolwiek funkcji w tym punkcie. Takie

Page 133: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 132

7.7 Złożoność obliczeniowa czyli o pragmatyce języka obliczeń

O złożoności obliczeń wspominaliśmy już wcześniej. Pora poukładać i ten temat.Teoria obliczalności oferuje różnorodne języki opisu procesów obliczeniowych. Ustanawia funda-mentalny podział zadań obliczeniowych na rozstrzygalne i nierozstrzygalne133. Ale informacja, żedany problem jest rozstrzygalny to - z praktycznego punktu widzenia - trochę mało. Cóż nam poprocedurze rozstrzygajacej, której realizacja jest niemiłosiernie długa?Logika zdaniowa jest rozstrzygalna. Jednak aby wykazać, że zdanie zbudowane z n prostych zdańjest prawem logiki zdaniowej - jest prawdziwe przy każdym wartościowaniu zdań prostych w nimwystępujących - należy wykonać 2n testów. Gdy w zdaniu są tylko trzy takie zdania wystarczyosiem testów, 8 = 23. Gdy tych zdań jest dwadzieścia, to liczba testów wzrasta do 220 czyli niecowięcej niż milion. A liczba niezbędnych testów przy zdaniu złożonym ze stu zdań prostych - 2100 -jest trudna do wyobrażenia...134.

Efektywnością procesów obliczeniowych to domena teorii złożoności135

Jak mierzyć efektywność maszyn Turinga - procesów obliczeniowych? Intuicja podpowiada, że czaspracy maszyny Turinga - liczba pojedynczych kroków - jest zależna od wielkości danych - długościsłowa zapisanego na taśmie w chwili rozpoczęcia pracy. Dlatego zgodzono się, by złożoność czasowąmaszyny T opisywać jako funkcję timeT : N→ N taką, że timeT (n) to maksymalna liczba krokówpracy jaką wykona maszyna T rozpoczynając pracę z zapisanym na taśmie jakimkolwiek słowemdługości ¬ n 136.

Jednak dla pragmatycznie usposobionych robotników informatyki pełna znajomość funkcji timeTwcale nie jest najważniejsza. Oni chcą używać tych funkcji do porównań efektywności różnychmaszyn Turinga, różnych algorytmów.Odpowiedzią na to zapotrzebowanie jest skala złożności obliczeń. Pomysł jest genialnie prosty:ustalmy pewien skończony zasób „wzorcowych” funkcji sm : N→ R : m = 1, 2, . . . , k. Powiemy, że

„maszyna T jest w klasie O(sm) gdy ciąg wartości (timeT (n) : n ∈ N) wraz ze wzrostem nstaje się coraz bliższy ciągowi liczb (c · sm(n) : n = 1, 2, . . .) gdzie c to pewna dodatnia stała”137

By taka skala złożoności była użyteczna, musi odwoływać się do powszechnie znanych i dobrzeprzebadanych funkcji. Dlatego osnową skali złożoności są nierówności które zna każdy absolwentszkoły podstawowej:

log2n < . . . < n < . . . < n2 < n3 < . . . < 2n < n! < nn

które są prawdziwe dla prawie wszystkich liczb naturalnych.

Złożoność (czasowa) maszyny Turinga T jest logarytmiczna (odpowiednio: liniowa, wielomia-nowa, wykładnicza, ...) gdy T należy do klasy O(log2n) ,(odpowiednio: O(n), O(nm) dla pewnegom ∈ N , O(2n), . . .).138

Są tu ważne subtelności. Łatwo np. zauważyć (sprawdzić), że nawet tysiąckrotne (milionowe)zwielokrotnienie szybkości działania - zastąpienie maszyny T przez realizującą tę samą funkcjęobliczalną maszynę T1 i taką, że timeT (n) = 1000 · timeT1(n) - nie jest istotne dla oceny złożoności- te maszyny są w tej samej klasie złożoności. Podobnie nie jest istotne, czy czas pracy mierzymy

wątpliwości prowadzą do innych, bardziej wyrafinowanych definicji obliczalności funkcji rzeczywistych. Np. takiej: Apartial function f : Q → R is upper semicomputable (...) if there exists a computable function φ : Q × N → Q (...)such that for all x ∈ Q: limk→∞ φ(x, k) = f(x) and ∀k ∈ N : φ(x, k + 1) ¬ φ(x, k) [17].133Opisuje też pewną hierarchię nierozstrzygalności o czym mówiliśmy przedstawiając maszyny Turinga z wyrocznią.134Gdyby w ciągu sekundy wykonywać milion testów, to realizacja tego algorytmu zajmie 40169423 miliardów

lat! Przyznam - nie sprawdzałem tych rachunków. Napisałem to na podstawie danych zawartych w anonimowymopracowaniu dostępnym w internecie. Jeśli nawet pomyliłem się o 10 miliardów lat - who care about?135Odtąd, aż do końca podrozdziału rozważamy wyłącznie zawsze zatrzymujące się maszyny Turinga.136Można też opisywać złożoność maszyny Turinga odwołując się do długości taśmy niezbędnej do wykonania

obliczenia. To jest tzw. złożoność pamięciowa. Ale tu mówimy wyłącznie o złożoności czasowej.137Inaczej mówiąc: maszyna T jest w klasie O(sm) gdy ciąg ułamków ( timeT (n)

sm(n): n = 1, 2, . . .) ma skończoną i

dodatnią granicę. Tak opisywaną złożoność nazywa się złożonością asymptotyczną.138Wszystkie te definicje nie grzeszą precyzją, ale taką konwencję przyjęlismy w tym tekście... .

Page 134: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 133

liczbą pojdynczych kroków pracy maszyny czy w tysiącach takich kroków139. Dlatego tę definicjęzłożoności można stosować „w skali makro” - do dowolnych procedur: wystarczy zgodzić się, jakieoperacje wykonywane w trakcie ich realizacji uznamy za elementarne i mierzyć czas ich liczbą. Np.w algorytmach sortowania list można przyjąć, że operacją elementarną jest porównanie sąsiednichelementów listy140. Dlatego definicja złożoności procedur jest wolna od niepożądanych uwarunkowańzwiązanych z ich implementacją - od tego, czy do rzeczywistego obliczenia realizowanego użyjemyszybszego (droższego) czy też wolniejszego komputera.

Zastąpienie procedury inną, „liczącą to samo”, lecz o mniejszej złożoności (w opisanej tu skali) jestzmianą jakościową - istotnie różną od zmiany wynikającej z zastąpienia komputera przez nowy, nawettysiąckrotnie szybszy komputer. To jest istota zaproponowanej skali złożoności obliczeniowej.

Najmniej złożone - najbardziej efektywne - są maszyny Turinga (procedury) o złożoności lo-garytmicznej czyli należące do klasy O(log2n)141. Procedury, których złożoność jest liniowa czyteż wielomianowa są „użyteczne w praktyce”142. Ale gdy złożoność maszyny jest wykładnicza toefektywność takiej maszyny (procedury) staje się mocno wątpliwa... .

Aby tę wątpliwość uzasadnić potrzebujemy dobrego przykładu.

„W świątyni Benares w Hanoi (...) jest płytka z brązu, na której umocowane są trzy diamentoweigły (...) . Na pierwszą z nich, w chwili stworzenia świata, Bóg nadział - 64 złote krążki z otworami(...), jeden na drugim, malejąco, od największego do najmniejszego. Odtąd bez przerwy, we dnie iw nocy, kapłani przenoszą krążki z pierwszej igły na trzecią przestrzegając niewzruszonych prawBrahma. Te prawa są proste: krążki przenosimy pojedynczo nigdy nie pozostawiając ich w innychmiejscach niż nadziane na jedna z trzech igieł i nigdy, na żadnej z igieł, nie wolno położyć większegokrążka na mniejszy. Kapłani skończą pracę, gdy przeniosą wszystkie krążki na trzecią igłę 143.

Przeniesienie n+1 krążków wymaga dwukrotnie więcej ruchów niż przeniesienie n krążków orazjednego dodatkowego ruchu144. Stąd łatwo wyliczyć, że przeniesienie n krążków wymaga... 2n − 1ruchów - złożoność tej procedury jest wykładnicza.Kapłani mają przenieść 64 krążki, czyli muszą wykonać 264 − 1 pojedynczych przeniesień... - „ro-ughly 585 billion years to finish, which is about 42 times the current age of the Universe”. .

Umiemy też coś więcej niż tylko oceniać złożoność znanych algorytmów. Potrafimy oszacowaćzłożoność pewnych rozstrzygalnych problemów czyli wskazywać nieprzekraczalne „dolne ogranicze-nie” złożoności algorytmów je rozwiązujących145 . Ciekawie robi sie wtedy, gdy pojawia się tzw.luka algorytmiczna - gdy wyznaczone dolne ograniczenie złożoności problemu jest istotnie mniej-sza od złożoności najlepszego, aktualnie znanego algorytmu który go rozwiązuje. Tak jest np. wprzypadku problemu minimalnego drzewa rozpinającego w grafie spójnym146. Znamy tu algoryt-my o złożoności wielomianowej i jednocześnie wiemy, że ograniczenie dolne jest liniowe. Jak dotąd

139Matematycznie: twierdzenie o liniowym przyspieszaniu mówi, że „jeśli język L jest rozpoznawany przez maszynęT o złożoności czasowej timeT to może być rozpoznany przez maszynę Tc o złożoności czasowej opisanej wzoremtimeTc(n) = c · timeT (n) + (1 + c)n, gdzie c > 0”.140Sortowanie listy polega na ustawieniu jej elementów zgodnie z określonym a priori porządkiem liniowym, np.

[1, 3, 7, 2, 4] [1, 2, 3, 4.7].141Pomijając rzadko spotykane procedury, które bez względu na rozmiar danych wykonują tę samą liczbę operacji.

Np. procedura rozstrzygająca czy pierwszy element danej listy to 1 w żaden sposób nie zależy od długości listy.142Problem przynależności słowa do języka regularnego ma złożoność liniową gdyż urządzeniem akceptującym jest

automat skończony przeglądający słowo na taśmie tylko raz, od lewej do prawej. A algorytm Erley’a dla językówbezkontekstowych ma złożoność wielomianową.143http://www.math.edu.pl/wieza-hanoi. To legenda. Tak naprawdę tę opowiastkę wymyślił francuski matematyk

F.Lucas (1883)144Procedurę przenoszenia można opisać rekurencyjnie tak: aby przenieść n + 1 krążków z I do III należy: 1.

przenieść n krążków (leżących na największym, (n + 1)-szym) z igły I do II korzystając z igły III, 2. przenieśćnajwiększy krążek z I na III,3. przenieść n krążków z igły II do III korzystając z igły I .145Algorytmy rozwiązujace dany problm mogą być różne - lepsze lub gorsze, czyli o różnej złożoności.146Drzewo rozpinające grafu G, to podgraf spójny bez cykli, w którym są wszystkie wierzchołki grafu G. Gdy

krawędziom grafu przypisano długości, to minimalne drzewo rozpinające to te, w którym suma długości krawędzi jestminimalna.

Page 135: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 134

nikt nie znalazł algorytmu o takiej złożoności. To jest wyzwanie: albo zrewidujemy znane dolneograniczenie albo znajdziemy lepszy algorytm.

Innym wyzwaniem w teorii złożoności jest równość P = NP .Czy w danym skończonym zbiorze liczb całkowitych a1, . . . , an można wskazać taki podzbiór,że suma jego elementów jest równa zero? Ten problem jest oczywiście rozstrzygalny. Jednak „pe-symistyczna złożoność” oczywistego algorytmu rozwiązującego ten problem - „sprawdź wszystkiemożliwe podzbiory” ma złożoność wykładniczą (względem liczby elementów rozważanego zbioru).Czy istnieje algorytm rozwiązujący ten problem w czasie wielomianowym? Tego nie wiadomo.

Znalezienie rozwiązania wymaga zastosowania - zgodnie z dzisiejszą wiedzą - algorytmu wykład-niczego. Natomiast sprawdzenie, czy rozwiązanie pozytywne dostarczone przez taki algorytm jestpoprawne jest prostsze, bo wymaga zastosowania algorytmu o złożoności wielomianowej (a nawetliniowej). To oznacza, że nasz problem należy do klasy NP . Ale, jak powiedzieliśmy, nie wiemy, czynależy też do węższej klasy P problemów rozstrzygalnych w czasie wielomianowym.Więcej: choć brzmi to nieprawdopodobnie, nie wiadomo czy istnieje jakikolwiek problem należącydo klasy NP , który nie należy do klasy P - nie wiadomo czy prawdziwa jest równość P = NP !

Wskazanie problemu który pozwoli zanegować tę równość (lub udowodnienie, że takowego brak)to jeden z tzw. problemów milenijnych za którego rozwiązanie którego można otrzymać okrągłymilion dolarów. Do pracy, junacy!

Czy „digitalizacja” pozwalająca już dziś liczbowo kodować niemal wszystko i stworzać wirtualny świat torenesans pitagoreizmu?147Tak można myśleć, gdy pomija się problem złożoności obliczeń. Albo gdy sięuzna, że „boskość” polega na przekraczaniu ograniczeń stąd wynikających.

7.7.1 Algorytmy kwantowe - krótko

Czy hipotezę Churcha można podważać? Czy udowodniona złożoność pewnych problemów to rze-czywiście nieprzekraczalne ograniczenie poszukiwań efektywnych procedur? Uzasadnieniem tychwątpliwości jest, dla wielu, pojawienie się algorytmów i komputerów kwantowych.W 1985 roku David Deutsch rozważał teoretyczny model komputera kwantowego i sugerował, żemoże on efektywnie obliczać problemy, które nie są obliczalne przez tradycyjny komputer. Poję-ciowo możliwe jest, że przynajmniej dla pewnych problemów, komputer kwantowy wykracza pozamaszyny Turinga. Idea ta spotkała się z szerszym zainteresowaniem, gdy w 1994 r. P. Shor odkryłnowy kwantowy algorytm faktoryzacji dużych liczb, działający w czasie wielomianowym [126].

Przyjrzyjmy się troszkę bliżej temu algorytmowi. Jego działanie prowadzi do wskazania nietry-wialnego dzielnika dowolnie wybranej liczby naturalnej n148. Opiszemy go tak:

1. Wybierz dowolną liczbę a ¬ n i znajdź nwd(a, n) - największy wspólny dzielnik liczb n i a149,- jeśli nwd(a, n) 6= 1 to ta liczba jest szukanym nietrywialnym dzielnikiem n - algorytm kończy

pracę,- jeśli nwd(a, n) = 1 to przejdź do

2. Znajdź najmniejszą liczbę r taką, że ar − 1 dzieli się przez n (taka liczba zawsze istnieje),- jeśli liczba r jest parzysta - r = 2k i n nie dzieli ak + 1 to nietrywialnym dzielnikiem n jest

nwd(n, ak − 1),- w przeciwnym wypadku - gdy r jest liczba nieparzystą lub n dzieli ak + 1 - zastąp a inną

liczbą a1 ¬ n i ponów poszukiwania - wróć do 1.147„Przypatrz się pięknu kształtnego ciała - widzisz liczby w przestrzeni” - św. Augustyn (o którym na jednej ze

stron internetowych napisano, że „(w młodości) lubił zabawę, przepadał za rozrywkami, gustował także w kobietachpięknych”..., ( https://zyciorysy.info/sw-augustyn/)148o ile istnieje. Procedura znajdowania tekiego dzielnika to „bottleneck” (wąskie gardło) algorytmów rozkładu liczb

naturalnej na iloczyn liczb pierwszych. Znane algorytmy faktoryzacji mają (czasową) złożoność wykładniczą i dlatego„rozkład na liczby pierwsze” jest powszechnie stosowanym zabezpieczeniem kryptograficznym (np. w systemie RSA).149Można tu skorzystać z prostego algorytmu Euklidesa.

Page 136: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 135

Wygląda to zachęcająco150, ale tak naprawdę to pasuje tu powiedzenie o zamianie siekierkina kijek: znalezienie liczby r wykorzystywanej w tym algorytmie jest równie skomplikowane jakzadanie pierwotne - znalezienie dzielnika liczby n.Istotą pomysłu Shora jest wykorzystanie do poszukiwania tej liczby komputera kwantowego. Spró-bujmy to wyjaśnić. Najmniejsza „porcja informacji” w klasycznej teorii obliczalności pojedynczalitera - 0 lub 1 - bit151. Litery 0 i 1 - (rozróżnialnymi) stanami bitu. Realizacja algorytmu na „naj-niższym możliwym poziomie” to sekwencja operacji boolowskich - funkcji postaci 0, 1n → 0, 1152.

Jeśli zechcemy zmaterializować zamysł Turinga - zbudować komputer - musimy zadbać o to,by miał on w sobie medium zdolne reprezentować bit informacji - „coś”, co może znajdowac sięw dwóch rozrożnialnych stanach. Tym „czymś” może być np. tranzystor a jego stanami dwa jego(rozróżnialne technicznie), poziomy napięcia elektrycznego. Problem w tym, że każdy proces ob-liczeniowy angażuje ogromnie wiele bitów. Dlatego miniaturyzacja mediów reprezentujących bityjest jednym z najistotniejszych mierników postępu technologicznego.

W obliczeniach kwantowych odpowiednikiem bitu jest kubit - wektor jednostkowy w dwuwymia-rowej zespolonej przestrzeni Hilberta. Realizacja algorytmu to sekwencja przekształceń unitarnychtej przestrzeni. Tyle matematyka153. Ale zaryzykuję i spróbuję powiedzieć coś o „fizycznej” reali-zacji komputera kwantowego.Kubit w takim komputerze jest reprezentowany przez pewien obiekt świata kwantowego. Trudnow tym świecie znaleźć medium - cząstkę elementarną - które przyjmuje wyłącznie jeden z dwóchmożliwych stanów. Medium reprezentującym kubit może być np. stan spinowy elektronu. Takichstanów jest nieskończenie wiele ale tylko dwa spośród nich są tzw. stanami własnymi: inne stany sąsuperpozycjami tych dwóch stanów własnych. Ta wielość stanów sprawia, że kubit może przechowaćznacznie większą ilość informacji niż bit.

Kwantowa implementacja algorytmu to manipulacja stanami wielu kubitów w „zaplanowany”sposób. Taka manipulacja kwantowa jest czymś więcej niż pojedyncze działanie funkcji boolowskiejna bitach154. Te odmienności pozwalają uwierzyć, że komputer kwantowy może „liczyć szybciej” akorzystajac z matematyki możemy tę wiarę zastąpić dowodem. Problem w tym, że rezultat pojedyn-czego obliczenia nie jest pewny. Po pierwsze, nie możemy zaobserwować stanu kubitu w momenciezakończenia obliczenia a jedynie jeden z jego dwóch stanów własnych. Obserwowalny wynik ob-liczenia („umieszczony” w wielu kubitach) jest ciągiem stanów własnych. Co gorsza, powtarzającobliczenie możemy w ten sposób „zobaczyć” zupełnie inny wynik. To są nieubłagane konsekwencjepraw mechaniki kwantowej. Ale można przecież wielokrotnie powtórzyć obliczenie. Przy odpowied-niej liczbie powtórzeń, średnia wartość tych obliczeń jest - z dużą dokładnością - prawidłowymwynikiem. Obliczenia kwantowe są niewspółmiernie szybsze od klasycznych więc powtarzanie obli-czeń nie jest tu istotną przeszkodą155.

Istotą pomysłu Shora jest to, że - w odróżnieniu od procedury poszukiwania dzielnika liczbyn - procedurę znajdowania liczby r można - w teorii! - „implementować kwantowo”.Tak imple-mentowany algorytm Shora (podobnie jak inne algorytmy kwantowe) jest więc probabilistyczny:nie możemy być pewni, że wynik obliczenia jest prawidłowy. Twierdzenie, że jakoby następuje tuzanegowanie hipotezy Churcha jest bezpodstawne. Ale - być może - jest to przyczynek do rewizjinaszych wyobrażeń o obliczalności. Może trzeba uznać, że normą są algorytmy probablistyczne a

150Zainteresowani szczegółami znajdą opis algorytmu Shora w wikipedii.151bit = BInary digiT (cyfra systemu dwójkowego).152Termin „komputer” w tym kontekście to nie maszyna Turinga ale model von Neumanna (poszukaj w internecie

hasła „architektura von Neumanna”).153Przestrzenie Hilberta, przekształcenia unitarne i hermitowskie to podstawowe pojęcia matematyki mechaniki

kwantowej.154Przykładem przekształcenia unitarnego które wykorzystuje się w tych manipulacjach jest przekształcenie Hada-

marda reprezentowane przez macierz

[1 11 −1

].

155Proszę tego barbarzyńsko krótkigo opisu nie traktować jako wyjaśnienia istoty obliczeń kwantowych. To zaledwiezarys problemu, wskazówka, czego trzeba się nauczyć, by podjąć próbę zrozumienia obliczeń kwantowych.

Page 137: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 136

algorytmy deterministyczne są jedynie szczególnym (szczęśliwym) wyjątkiem? To, że nie otrzymu-jemy pewnej odpowiedzi na oznacza, że taki algorytm jest bezużyteczny: można przecież sprawdzić,czy rozwiązanie wskazane przez komputer jest prawidłowe (co jest łatwiejsze niż znalezienie roz-wiązania).

Dlaczego powszechnie nie używamy komputerów kwantowych? Dlatego, że zbudowanie „du-żego” komputera kwantowego - z duża ilością kubitów - napotyka na wiele naprawdę poważnychtrudności technicznych. Taka odpowiedź daje jednak nadzieję, że jeśli nie dziś, to jutro będzie tomożliwe. Ale jest jeszcze inna fundamentalna trudność. Można zapytać: dlaczego w algorytmie Shora„kwantujemy” jedynie procedurę poszukiwania liczby r a nie cały algorytm? Odpowiedź jest prosta- bo nie umiemy. Tak naprawdę to nie wiemy156 jakie zadanie obliczeniowe można „skwantować”zmniejszając przy tym złożoność obliczeń (co usprawiedliwi trud i koszt budowy odpowiedniegokomputera kwantowego).

7.8 Liczba Ω Chaitina

Liczba Ω Chaitina to jedno z niewielu pojęć współczesnej matematyki, które może pochwalić sięzainteresowaniem mediów jako „coś” niesłychanie tajemniczego i ważnego, bo wskazującego granicenaszego poznania157.Spróbujmy opowiedzieć o liczbie Ω we właściwej kolejności. Czyli najpierw o faktach.Język J ⊆ 0, 1∗ jest bezprefiksowy jeżeli żadne właściwe podsłowo początkowe słowa w ∈ J nienależy do J158.

Języki bezprefiksowe wyróżnia twierdzenie, które na pierwszy rzut oka zdaje się jedynie cieka-wostką: „dla dowolnego języka bezprefiksowego L:

(∗)∑w∈L

2−|w| ¬ 1

(gdzie |w| to długość słowa w). Dowód tej nierówności jest zaskakująco prosty. Rozważmy, napoczątek, skończony bezprefiksowy język L0 = w1, . . . , wn . Niech n = max|wi| : wi ∈ L.Zbudujmy pełne drzewo binarne wysokości n. Gałąź tego drzewa reprezentuje słowo wi, jeżeli wijest podsłowem początkowym słowa utworzonego z etykiet wierzchołków tej gałęzi. Każda gałąźreprezentuje co najwyżej jedno słowo języka L0 (bo jest on bezprefiksowy) a każde słowo wi madokładnie 2n−|wi| reprezentujących je gałęzi 159. Stąd:

n∑i=1

2(n−|wi|) ¬ 2n

Dzieląc obie strony nierówności przez 2n, otrzymamy nierówność Krafta: dla dowolnego skończonegozbioru słów w1 . . . , wn języka bezprefiksowego L:156Dokładniej: ja nie wiem.157Patrz np. http://www.wykop.pl/ramka/489991/liczba-omega-metafizyka-matematyki-gregory-chaitina158Podsłowo słowa w jest właściwe, gdy jest istotnie krótsze od w.159Pełne drzewo binarne wysokości n to drzewo, w którym każdy wierzchołek, który nie jest liściem, ma dokładnie

dwa potomki (etykietowane przez 0 i 1) i które ma 2n liści. Etykietą korzenia jest słowo puste. Gałąź to ścieżkaprowadząca od korzenia do pewnego liścia. Np. pełne drzewo binarne wysokości 2 wygląda tak:

ε

ww0

1

0 1 0 1

.Pierwsza z lewej gałąź reprezentuje zarówno słowo 0 jak i 00 (ale język bezprefiksowy zawiera tylko jedno z nich).

Słowo 0 ma dwie (pierwsze z lewej) reprezentujące je gałęzie.

Page 138: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 137

n∑i=1

12|wi|

¬ 1

Nierówność (∗) to konsekwencja tej obserwacji - wszak nieskończony język jest wielkością granicznądla swoich coraz to większych, skończonych fragmentów.

Dla skończonego języka L0 liczba∑ni=1

12|wi|

opisuje stosunek liczby gałęzi reprezentujących słowa tegojęzyka do liczby wszystkich gałęzi w pełnym binarnym drzewie o wysokości n (równej 2n). Inaczej: taliczba to prawdopodobieństwo tego, że podsłowo początkowe losowo wybranej gałęzi pełnego drzewabinarnego należy do języka L.To pozwala uwierzyć, że dla nieskończonego języka L liczba

∑w∈L 2−|w| to prawdopodobieństwo tego, że

wybierając losowo nieskończoną gałąź nieskończonego i pełnego drzewa binarnego trafimy na taką, którejsłowo początkowe należy do (bezprefiksowego) języka L160.

Rozważmy teraz szczególny język bezprefiksowy:

P = 0|w|1w : w ∈ 0, 1∗i maszynę Turinga Tp, taką, że Tp(0j1w) = w gdy 0j1w ∈ P i która nie kończy pracy, w przeciw-nym przypadku.Niech U · Tp będzie sekwencyjnym złożeniem maszyny Tp i uniwersalnej maszyny Turinga U161.Maszyna U · Tp symuluje pracę maszyny uniwersalnej U w tym sensie, że dla dowolnego słowa wproces przkształcania w przez maszynę U jest skończony dokładnie wtedy, gdy proces przekształ-cania słowa 0|w|1w przez U · Tp jest skończony (i wtedy wyniki tych procesów są jednakowe).Różnica między maszyną uniwersalną U i maszyną U · Tp polega na tym, że język P1 akceptowanyprzez maszynę U · Pp jest bezprefiksowy.

Liczba Chaitina jest związana z tym językiem:

Ω =∑w∈Lp

2−|w|

Liczba Ω opisuje prawdopodobieństwo tego, że pewne podsłowo początkowe losowo wybranegociągu binarnym należy do języka akceptowanego przez U ·Tp. Ponieważ ta maszyna symuluje pracemaszyny uniwersalnej to można powiedzieć, że„liczba Ω to prawdopodobieństwo zatrzymania się maszyny uniwersalnej U dla losowo wybranegonieskończonego słowa binarnego”.

To, co w liczbie Ω jest najbardziej fascynujące to fakt udowodniony przez Chaitina:

„liczba Ω jest nieobliczalna (nie jest obliczalna”).

Liczba Π jest rzeczywistą liczbą niewymierną, ale jest obliczalna: można wyznaczyć dowolnie długi odcinekpoczątkowy jej rozwinięcia dziesiętnego (binarnego) korzystając choćby ze wzoru Leibniza:

∞∑n=0

(−1)n

2n+ 1=

11− 1

3+

15− 1

7+

19− · · · = π

4

Nieobliczalność liczby Ω oznacza, że nie ma procedury pozwalającej wyliczyć dowolnie długi odcinekpoczątkowy jej binarnego rozwinięcia162.

160Więcej nauki, mniej wiary: zbiór nieskończonych ciągów binarnych można uczynić przestrzenią mierzalną (pro-bablistyczną), czyli wyróżnić σ-algebrę zbiorów - zdarzeń losowych- wraz z miarą - funkcją przyporządkowującą tymzdarzeniom wartości z przedziału [0, 1] (ich prawdopodobieństwa). Ta miara musi spełnić pewne (oczywiste) warunki,(zwane aksjomatami Kołmogorova).... Każde skończone słowo binarne w wyznacza w tej przestrzeni zdarzenie losowe- zbiór złożony z nieskończonych ciągów, które rozpoczynają się od w . Temu zdarzeniu przypisujemy miarę 2−|w|.Zainteresowanych szczegółami odsyłam do [17].161U · Tp działa tak: dla danego słowa v najpierw oblicza Tp(v) a gdy to obliczenie jest skończone i daje jako wynik

słowo w, to rozpoczyna się obliczenie U(w).

Page 139: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 138

Skąd to wiemy? Jak zwykle w takich sytuacjach163 dowodzimy przez sprzeczność - pokażemy,że istnienie takiej procedury rozstrzygałoby problem stopu dla uniwersalnej maszyny Turinga (cojest oczywiście niemożliwe).

Przyjmijmy, że znamy taką procedurę Chat. Wykorzystamy ją do budowy procedury rozstrzy-gającej czy maszyna U · Tp akceptuje dowolne słowo v (co prowadzi wprost do procedury rozstrzy-gajacej problem stopu dla maszyny uniwersalnej U).Załóżmy, że |v| = n. Korzystając z procedury Chat generujemy odcinek początkowy binarnegorozwinięcia liczby Ω długości n : 0.ω1ω2, ω3 . . . ωn.Przygotujmy też licznik Li i nadajmy mu początkową wartość 0.Słowa binarne można ustawić w kolejkę: 0, 00, 01, 10, 11, 000, . . .. Korzystając z tego uporządkowa-nia ustawmy w kolejkę wszystkie pary (w,m) , gdzie w ∈ 0, 1∗,m ∈ N164 . Potem po kolei - dlakażdej pary (w,m) - rozstrzygamy, czy maszyna U · Tp przekształcając słowo w, zatrzyma się pom krokach („akceptuje w w m krokach”). Jeżeli „tak”, to do licznika dodajemy wartość 2−|w|, asłowo w dodajemy do specjalnego schowka. Jeśli „nie”, to testujemy kolejną parę.Pracujemy tak długo, aż wartość licznika stanie się większa od 0.ω1ω2, ω3 . . . ωn

165. Jeśli w tymmomencie w schowku jest słowo v to znaczy, że maszyna U ·Tp akceptuje v. Jeśli nie, to mamy pew-ność, że... nigdy go nie zaakceptuje! Dlaczego? Bo akceptacja słowa długości n musiałaby zmienićjedną z pierwszych n liczb binarnego rozwinięcia liczby Ω. Sprzeczność!Liczb nieobliczalnych jest nieprzeliczalnie wiele. Ale Ω jest jedną z nielicznych, które znamy166.

Jeśli Ω jest nieobliczalna, to czy jest sens pytać o obliczalność funkcji ciągłej f na takim argumencie?A może liczby rzeczywiste obliczalne to konstruktywna wersja ciała liczb rzeczywistych?167

Więcej o liczbie Ω

Skąd ta fascynacja liczbą Ω? Najprościej byłoby odesłać czytelnika do artykułu G. Chaitina „Thelimits of Reason”168 co zapewne odebranoby jako przyznanie się do porażki. To nie jest odległe odprawdy - nie wiem, czy stać mnie na coś więcej niż powtórzenie tez tego artykułu. Ale spróbuję.Chaitin włączył liczbę Ω do dyskusji o relacji między rzeczywistością (matematyczną) a jej możli-wym opisem. Pyta o relację między „faktem” a opisującym ten fakt „prawem naukowym” przywo-łując klasyczną tezę Leibniza: „a theory has to be simpler then the data it explains, otherwise itdoes not explain anything”.Dla Chaitina miarą prostoty jest złożoność Kołmogorova: „Alghoritmic information (...) is definedby asking what size of computer program is necessary to generate the data”... W [20] tłumaczy totak169: „obserwator co sekundę rejestruje jeden z dwóch faktów - np. „obiekt emituje światło” lub„obiekt nie emituje światła”. Efekt tej obserwacji można zapisać w postaci ciągu binarnego (który(...) jest potencjalnie nieskończony). Naukowiec analizuje ten ciąg doszukując się prawidłowości wjego budowie. Ale co to znaczy? Można się zgodzić, że ciąg jest chaotyczny170 jeżeli nie ma lepszegosposobu jego wyliczenia niż niż jego wypisanie. Ale to oczywiście nie jest satysfakcjonujące z „na-ukowego punktu widzenia”. Jeśli jednak naukowiec jest w stanie wskazać metodę pozwalającą użyć162Co jednak nie wyklucza możliwości obliczenia konkretnej ilości liczb początkowych tego rozwinięcia.

Oryginalna definicja liczby obliczalnej pochodzi od Turinga: „A real number is computable if its digit sequence canbe produced by some alghoritm or Turing machine. The alghoritm takes an integer n ­ 1 as input and produces then-th digit of the real number’s decimal expansion as output” (wikipedia).163Gdy teza jest „negtywna”.164Podobnie jak kolejkujemy pary liczb naturalnych - „przekątniowo”.165To się musi zdarzyć - wartość licznika rośnie w czasie testowania par (w,m) coraz lepiej aproksymując liczbę Ω.166Taką liczbę powiązaną wprost z nierozstrzygalnością problemu stopu wskazał też Turing. Ale Ω jest „ładniejsza”.167Zachęcające jest to, że obliczalne liczby rzeczywiste tworzą ciało, które ma takie same własności pierwszorzę-

dowe jak dedekindowskie ciało liczb rzeczywistych. Zainteresowanym podpowiem jedno hasło szczegółowe - Speckersequence i ogólne - constructive analysis - (https:// www.encyclopediaofmath.org/index.php/ Constructive analysis).168Scientific American 294, No. 3 (March 2006), pp. 74-81, (http://www.cs.auckland. ac.nz/ chaitin/sciamer3.html)169W moim swobodnym tłumaczeniu170W oryginale: „patternless”

Page 140: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 139

programu do wygenerowania tego ciągu i ten program jest relatywnie krótszy od niego, to jesteśmyzgodni uznać, że nie jest on „patternless”. Jest daleko idąca analogia między tym przykładem atym, jak naukowcy myślą naprawdę. Np. teoria oparta o skromną liczbę faktów (aksjomatów) jestlepsza (łatwiej akceptowalna jako prawdziwa) niż ta, która ma ich ogromnie wiele.

„Niekompresowalne” słowo - np. binarne rozwinięcie Ω - jest faktem, niczym więcej. Natomiastliczba Π generowana przez prosty program zawiera mało informacji, ale dlatego - paradoksalnie -jest „prawem naukowym”. Liczba Π jest obiektem matematyki dzięki temu, że jest nie tylko faktem,ale jest też opisana jako „prawo naukowe”.

„An infinite number of bits of Ω constitute mathematical facts (...) that cannot be derived fromany principles simpler than the string of bits itself”. Procedura rozstrzygania o zatrzymywaniudowolnej lecz skończonej liczby programów nigdy nie jest wystarczajacą podstawą do skonstru-owania procedury rozstrzygającej o zatrzymywaniu wszelkich programów. To, zdaniem Chaitina,upoważnia do stwierdzenia, że „Given any finite set of axioms, we have an infinite number of truthsthat are unprovable in that system. Mathematics therefore has infinite complexity, whereas anyindividual theory of everything would have only finite complexity and could not capture all therichness of the full world of mathematical truth”.Można też szukać pozytywów: znając n początkowych liczb rozwinięcia binarnego liczby Ω może-my rozstrzygać problem stopu dla programów długości n. Stąd „liczba Ω uosabia ogromną ilośćmądrości (...) ponieważ pierwsze kilka tysięcy cyfr (jej rozwinięcia) które można zapisać na małymkawałku papieru, zawiera odpowiedzi na więcej matematycznych pytań niż można zapisać w całymwszechświecie171

Ale bez złudzeń: po pierwsze, jak dotąd znamy tylko kilkadziesiąt pierwszych liczb tego rozwi-niecia. A po drugie (...) even if we get, by some kind of miracle, the first 10,000 digits of Ω, the taskof solving the problems whose answers are embodied in these bits is computable but unrealisticallydifficult: the time it takes to find all halting programs of length less than n from 0.ω1 . . . ωn growsfaster than any computable function of n”.

„Sam niewiele z tego rozumiem – ale czasem, w chwilach intelektualnego wyżu, wszystko wydaje sięjasne”. - przyznał Chaitin w jednym z wywiadów (dostępnym w internecie). Niech to szczere wyznaniebędzie uprawiedliwieniem wszelkich niejasności naszej opowieści o liczbie Ω... .

7.8.1 Wielki Wybuch i Collapsing

Nad zrębem planety, pośród gwiezdnej nocyszereg alefów w nieskończoność pełzniei nieskończoność unieskończonionazawiera sama w sobie przez siebie zdradzonakłęby, kłęby, kłęby tytanów

i rogate, i rogate widma (...)lecz myśl ta czyja? samo się nie myślitak jak grzmi samo i samo się błyskapunkt się sprężył w ”n” wymiarów przestrzeńi przestrzeń klapła jak przekłuty balon.

S.I. Witkiewicz (Witkacy)

Świat matematyki obliczeń można opisać tak172:

- jego obiektami są zbiory numerowane - pary (A, pA : N → A), gdzie pA jest częściową funkcją„na” - elementy obiektów są ponumerowane, mają swoje nazwy.

Morfizmy, czyli związki między takimi obiektami (A, pA) i (B, pB) to funkcje f : A → B, któremożna zrealizować - można wskazać funkcję obliczalną φ : N→ N taką, że pB · φ = f · pA 173.

171Cytuję za: C.S.Calude, M.J.Dinneen, Chi-Kou Shu, Computing a Glimpse of Randomness, Experimental Mathe-matics,Vol. 11 (2002), No. 3,(dostępny w internecie).172W przyszłości zamiast o „świecie” będziemy mówili o kategorii zbiorów numerowanych. Ale teraz jeszcze nie

wiemy, co to kategoria. Użyte poniżej terminy „obiekt”, „morfizm” należą o słownika tej teorii.173W literaturze „zbiory numerowane” znane są też pod nazwą modest ω-sets [50] ( „modest” = „skromny”. Piękna

nazwa...). Funkcjonuje również inna nazwa - PER - „Partial Equivalence Relations” (pozwalam sobie tu na drobnenieścisłości). Wszystko to są światy (kategorie) rozważane w teorii realizowalności o której coś tu jeszcze powiemy.

Page 141: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 140

Zbiory liczb całkowitych i wymiernych to zbiory numerowane. Za podstawowymi działaniamina tych liczbach stoją znane wszystkim procedury obliczeniowe. Ale zbiorem numerowanym jestteż np. ciało Q(

√2)174 choć zawiera ono - obok wszystkich liczb wymiernych - nieskończenie wiele

liczb niewymiernych. To pokazuje, że dla procesu obliczenia nie jest ważny „matematyczny sens”napisów które on przetwarza. Liczy się to, że liczby ze zbioru Q(

√2) mają reprezentację pozwalającą

je dodawać i mnożyć korzystając z procedur dodawania i mnożenia liczb wymiernych175.Funkcje obliczalne to silnik świata zbiorów numerowanych - każdemu morfizmowi musi towa-

rzyszyć procedura obliczeniowa. Zbiór liczb naturalnych i funkcje obliczalne to „jądro” tego świata.Kategoria zbiorów numerowanych to „powłoka”.

Dzieło Hilberta i Cantora to matematyczny „Wielki Wybuch” - wyjście poza kategorię zbiorów nu-merowanych. Mówiąc obrazowo, obiekt matematyczny „urwał się z uwięzi” - z pary (A, pA : N→ A)pozostał tylko zbiór A. Uwolnienie zbiorów od wymogu nazywania ich elementów i akceptacja „nie-konstruktywnych konstruktorów” nowych zbiorów wymusiło uznanie nieskończonej skali nieskoń-czoności176. Hilbertowska koncepcja istnienia zaludniła wszechświat matematyczny abstrakcyjnymiobiektami177. Matematycy kreowali coraz to nowe byty przekonani, że nowe teorie lepiej tłumacząproblemy, które ujawniały dawne178. Ta matematyka, ten „raj Cantora”, służy już nie tylko obli-czeniom, ale modelowaniu rzeczywistości.Różnicę między modelowaniem a obliczaniem widać wyraźnie, gdy popatrzymy jak traktuje się wobu matematykach funkcję.Teoria mnogości postrzega funkcję jako (specyficzną) relację między dwoma zbiorami. Proces przy-porządkowywania argumentom ich wartości jest - dla matematyka teoriomnogościowego - niewi-doczny, ukryty w czarnej skrzynce:

- -argumenty wartości„black

box”

Jego uwagę zajmuje badanie zależności - relacji - między argumentami i wartościami funkcji. Chce-my widzieć, czy funkcja rzeczywista jest rosnąca (malejąca), ciągła, różniczkowalna, czy ma miejscazerowe, czy jest bijekcją, itp., itd. Obliczenia które sa tu obecne, to obliczenia symboliczne - funk-cję różniczkujemy, całkujemy, wskazujemy jej ekstrama. Te „rachunki” słuzą poznaniu własnościfunkcji a nie wnikają w proces obliczania jej wartości.

To jest matematyka modelowania.

Tymczasem u Turinga i Churcha przedmiotem badań jest proces obliczenia. Funkcja rozumianatak, jak ją definiuje teoria mnogości, jest w obu teoriach pojęciem pomocniczym, wykorzystywanymdo opisu rezultatów procesu. Istotą opisu procesu jest opis zmienności rzeczy. „Stan rzeczy” jestjedynie obrazem chwilowym procesu. Ta sama rzecz może należeć do wielu procesów jednocześnie.To nie rzeczy, to procesy są wieczne. Wskazywanie początku czy końca procesu to zabieg sztuczny,związany li tylko z naszymi próbami ich badania.

Koncentracja uwagi XX-wiecznych matematyków na modelowaniu była po części koniecznością,skutkiem uświadomienia sobie ograniczonych możliwości obliczeniowych człowieka. Dopiero poja-wienie się komputerów i ich błyskawiczny rozwój179 pozwoliło, więcej, wymusiło rewizję poglądów.„Pozwoliło” bo matematycy dostali narzędzie do prowadzenia obliczeń o złożoności przekraczają-

174Najmniejsze podciało liczb rzeczywistych zawierające liczby wymierne i√

2. To jest algebraiczne rozszerzenieciała Q. Jego elementy to liczby rzeczywiste postaci a+ b

√2 gdzie a i b to liczby wymierne.

175Zadanie: opisz system redukcji pozwalający na proceduralne obliczanie sum i iloczynów w Q(√

2). Oczywiściejedną z reguł musi być redukcja

√2 ·√

2→ 2.176Mówimy tu np. o teoriomnogościowym aksjomacie istnienia zbioru wszystkich podzbiorów dowolnego zbioru177Ale napisałem... Witkacy zobowiązuje.178S.G.Simpson w [108] dzieli matematykę na „zwykłą” i tę, która swoje istnienie zawdzięcza wyłącznie teorii

mnogości.179Prawo Moore’a?

Page 142: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 7. OBLICZALNOŚĆ 141

cej najśmielsze wyobrażenia. W wielu, nawet bardzo abstrakcyjnych, badaniach matematycznychpojawił się wątek obliczeniowy. I „eksperymenty obliczeniowe”.„Wymusiło” , gdyż powszechne stało się oczekiwanie, że matematyka wesprze postęp technologicz-ny wiedzą teoretyczną dotyczacą obliczeń. Oczekiwano, że matematycy zajrzą do czarnej skrzynki.Zaryzykuję twierdzenie, że na przełomie XX i XXI wieku obserwujemy w matematyce narodzinytrendu, który można określić jako „matematyczny collapsing”180. Objawia się to ciągle zwiększa-jącym się zainteresowaniem międzynarodowej społeczności matematyków problemami związanymiz procesem obliczania181.

To nie znaczy, że jest jakakolwiek opozycja między liczeniem a modelowaniem. Liczenie musiczemuś służyć. Jest warte trudu gdy „ma sens”.

Człowiek potrzebuje komputera by sprawnie liczyć.Komputer potrzebuje kogoś, kto go sensownie użyje.

A to, że te czasem jedna z tych matematycznych aktywności czasem dominuje nad drugą niepowinno dziwić. Ten świat tak ma.

Zamiast puenty: nieco bardziej wyrafinowany Lem

Czy Pan wie, że matematycy do udowodnienia, iż każdy niepusty podzbiór liczb naturalnych maelement najmniejszy, potrzebują wyrafinowanej formy matematycznej indukcji? Pan się bawi i jasię bawię...”. Lem tego nie powiedział. A mógłby. Bo przecież normalny człowiek zaakceptuje (lubsam wymyśli) prościutką procedurę odnajdywania najmniejszego elementu w niepustym zbiorzeA ⊆ N. Tę procedurę można opisać w trzech krokach:1. Przyjmijmy k = 02. Rozstrzygnijmy, czy k ∈ A. Jeśli tak, to k jest poszukiwaną najmniejsza liczba w zbiorze A. Jeślinie przejdź do 3.3. Przyjmijmy k := k + 1 i wróćmy do 2.

Ale ta procedura ma sens tylko dla konstruktywnie rozumianych liczb naturalnych i przy zało-żeniu, że A to rozstrzygalny podzbiór N! Chcąc udowodnić to twierdzenie dla dowolnego podzbioruliczb naturalnych - definiowanych teoriomnogościowo - musimy sięgnąć po inne środki. Tylko ...czy to interesuje kogokolwiek poza matematykami? Cóż nam po informacji, że zbiór A ma elementnajmniejszy, skoro nie potrafimy rozstrzygać, czy dana liczba naturalna do niego należy?

180Słowo „collapsing” ma wiele znaczeń w większości o pejoratywnym zabarwieniu (krach, upadek, załamanie,OKLAPNIĘCIE). Używam tego terminu w znaczeniu jakie nadali mu autorzy hipotez dotyczących przyszłości -collapsing to odwrócenie procesu Wielkiego Wybuchu - wszechświat zapada się do stanu o skrajnie wysokiej gęstości.181Towarzyszy temu polityka wielu państw i międzynarodowych korporacji, polegająca na finansowym wspieraniu

takich badań.

Page 143: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 8

Twierdzenia Godla

Kurt Godel (1906-1978) – genialny austriacki logik i matematyk. W 1931 roku w artykule „Uber formalunentscheidbare Satze der Principia Mathematica und verwandter Systeme. I” sformułował twierdzenie„o niezupełności arytmetyki”.Godel konsekwentnie przyznawał się do realizmu matematycznego: „Obiekty i fakty matematyczne, lubprzynajmniej coś z nich, istnieją obiektywnie i niezależnie od naszych aktów mentalnych i decyzji (...)przedmioty i twierdzenia matematyki są tak samo obiektywne i niezależne od naszych wolnych wyborówi twórczych działań, jak to ma miejsce w świecie fizycznym.”1

Mniej znany jest fakt, że Godel zajmował się też teorią względności, a jego bliskim przyjacielem w Prin-ceton był Albert Einstein. Jak podaje Wikipedia, Godel po emigracji do USA starał się o obywatelstwoamerykańskie. A to zależało m.in. od wyniku egzaminu ze znajomości konstytucji. Godel, przygotowu-jąc się rzetelnie, odkrył, że jest ona wewnętrznie sprzeczna i miał zamiar to udowodnić przed komisjąegzaminacyjną. Na szczęście jego przyjaciele na to nie pozwolili..

8.0.1 Niezupełność PA - pierwsze twierdzenie Godla

Nasz wcześniejszy dowód twierdzenia Godla przeprowadziliśmy przy założeniu, że formuły aryt-metyczne mogą opisywać zbiory nierozstrzygalne. Teraz pokażemy, że to założenie było słuszne.Udowodnimy twierdzenie:

„Każda funkcja obliczalna f : Nk −→ N jest arytmetyczna”- można wskazać formułę arytmetyczną φf (x1, . . . , xk, xk+1) taką, że dla dowolnych liczb natural-nych m1, . . . ,mk, n:

formuła φf jest spełniona przy wartościowaniu [x1 := m1, . . . xk := mk, xk+1 := n] dokładniewtedy, gdy f(m1, . . . ,mk) = n.

Dla dowolnego procesu obliczeniowego związana z nim relacja „wejście-wyjście” wiążąca dane i wynik jestopisywalna w języku arytmetyki.

Ten wynik ma istotne znaczenie, bo z niego łatwo wynika to, co nas interesuje:

„każdy zbiór rekurencyjnie przeliczalny A ⊆ Nk jest arytmetyczny”

- można wskazać formułę arytmetyczną φA(x1, . . . , xk) taką, że (n1, . . . , nk) ∈ A wtedy, gdy formułaφA(x1, . . . , xk) jest spełniona przy wartościowaniu [x1 := n1, . . . , xk := nk].

Dowód tego twierdzenia jest żmudny i nudny. Ale pewien jego fragment naprawdę warto prze-analizować - zobaczmy, jak sobie poradzono ze schematem rekursji.Niech zatem h : N −→ N będzie funkcją taką, że:

- h(0) = a- h(succ(n)) = g(h(n), n)

1Cytuję za J. Golińską „Matematyka według Godla” - artykuł odnaleziony w internecie

142

Page 144: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 143

gdzie g jest funkcją arytmetyczną. A to oznacza mniej więcej tyle:

(*) h(s) = w wtw, gdy istnieją liczby naturalne k0, k1, . . . , kstakie, że k0 = a, ks = w oraz kj+1 = g(j, kj) dla dowolnego 0 ¬ j < s.

Aby uzyskać oczekiwany rezultat, wystarczy tę równoważność zapisać jako formułę arytmetyczną.Zacznijmy naiwnie:

(h(s) = w) ⇔ ∃k0∃k1 , . . .∃ks k0 = a ∧ (∀j<s kj+1 = g(kj , j)) ∧ ks = w)

Pozornie wszystko jest OK. Ale to nie jest formuła arytmetyczna - zmienna s nie może określaćliczby kwantyfikatorów egzystencjalnych (po prawej stronie równoważności).To można poprawić2. Z pomocą przychodzi nam tu słynna godlowska „beta-funkcja” (która jestarytmetyczna):

β(m,n, j) = (m mod (n(j + 1) + 1))

Ta funkcja koduje skończone ciągi dowolnej długości za pomocą par liczb, pozwalając jednocześnieodtworzyć pierwotny ciąg3. Równość h(s) = w można teraz opisać tak:

(h(s) = w) ⇔ ∃n,k (β(n, k, 0) = a ∧ (∀0¬j<s β(n, k, succ(j)) = g(β(n, k, j), j) ∧ β(n, k, s) = w))

Obecność zmiennej s „pod kwantyfikatorem” jest odtąd tylko skrótem redakcyjnym. Można gorozwinąć uzyskując formułę arytmetyczną w (prawie) krystalicznie czystej postaci... .

„Prawie”, bo w formule po prawej stronie równoważności mamy pozaarytmetyczne symbole funk-cyjne g i β. Ale można je zastąpić formułami arytmetycznymi - założyliśmy to o g i jest to oczywistedla β. Teraz wystarczy przywołać tradycje benedyktyńskie i cierpliwie przepisać powyższą charak-teryzację równości h(s) = w w „czystym” języku arytmetyki:

h(s) = w ⇔ ∃n,k (φβ(n, k, 0, a) ∧ φβ(n, k, s, w) ∧∧ ∀0¬j<s ∃u,v (φβ(n, k, succ(j), v) ∧ φβ(n, k, j, u) ∧ φg(u, j, v) )).

(gdzie formuły (φg(x, y, z) i φβ(x, y, z, t) opisują odpowiednio funkcję g i funkcję β.)

A to oznacza, że funkcja h jest arytmetyczna!

Tyle o rekursji. I to jest krytyczny punkt dowodu. Reszta jest rutyną.

Rzeczywiście, nudnawe... Dodajmy tylko pewną uwagę: definiując, w krytycznym momencie dowodu,funkcję β, korzystaliśmy z obu działań - dodawania i mnożenia. Gdyby rozpatrywać słabsze arytmetyki -np. arytmetykę Presburgera w której nie ma mnożenia, to otrzymamy teorię rozstrzygalną - każdy zbióropisywalny w tak zubożonej arytmetyce jest rozstrzygalny.A niektórzy mówią, że mnożenie to tylko „skrócony zapis dodawania”...4

A teraz najważniejsze: jeśli formuła φ opisuje zbiór rekurencyjnie przeliczalny który nie jestrekurencyjny, to jego dopełnienie jest zbiorem, który nie jest rekurencyjnie przeliczalny. Ale jestarytmetyczny, bo opisany przez formułę ¬φ ! To chcieliśmy wiedzieć: istnieją formuły arytmetyczne,opisujące zbiory, które nie są rekurencyjnie przeliczalne5. Konsekwentnie:

Są takie formuły arytmetyczne, dla których nie ma procedury sprawdzającej ichspełnialność

Ponieważ już wiemy, że:

2I to jest krytyczny punkt dowodu...3Dla każdego skończonego ciągu k0, . . . , ks można wskazać parę (n,m) taką, że β(n,m, j) = kj dla j = 0, 1, 2 . . . , s”

[111]. Np. dla ciągu (2, 0, 1, 2) wystarczy przyjąć m = 3 i n = 10. Wzorca dla tego kodowania można doszukać się wsłynnym „chińskim twierdzeniu o resztach”.4Formuły arytmetycznej mn = k nie można zastąpić równoważną, w której użyto tylko dodawania.5Zbiory arytmetyczne można scharakteryzować jako te, które da się zbudować ze zbiorów rozstrzygalnych za

pomocą operacji uzupełnienia zbioru i rzutowania.

Page 145: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 144

- formuła φ(x1, . . . , xm) jest spełniona w N przy wartościowaniu [x1 := n1, . . . , xm := nm]dokładnie wtedy, gdy zdanie φ(succn1(0), . . . , succnm(0)) jest prawdziwe w tym modelu,

- istnieje procedura sprawdzająca, czy zdanie posiada dowód w systemie PA,

to po raz drugi - ale już bardziej świadomie - każdy może poczuć się (na chwilę) jak Godel isformułować olśniewający wniosek:

Istnieją zdania arytmetyczne prawdziwe w modelu standardowym, które nieposiadają dowodu w systemie PA.

8.0.2 Powrót do źródeł(...) pomimo mojego wielkiego podziwu dla tego matematyka pierw-szej wielkości, jakim był Hilbert, nigdy nie mogłem zrozumieć w jakisposób uwierzył on, że maszyna mogłaby udzielić automatycznie od-powiedzi na wszystkie problemy diofantyny. Dlatego jestem bardzozadowolony, że Matijasiewicz wykazał, iż było to niemożliwe...

J. Dieudonne [26]

Jak wspominałem, to Hilbert zainicjował badania nad obliczalnością, umieszczając w swoimprogramie tak sformułowany dziesiąty postulat:

„Given a Diophantine equation with any number of unknown quantities and with rationalintegral numerical coefficients: To devise a process according to which it can be determined ina finite number of operations whether the equation is solvable in rational integers6. Jeśli się wto wczytać, to widać, że Hilbert pyta o rozstrzygalność problemu istnienia całkowitoliczbowychrozwiązań równań diofantycznych.

W 1972 roku (czterdzieści lat po wynikach Godla) J. Matijasiewicz przedstawił negatywnerozwiązanie tego problemu. Uczynił to tak, że otworzył drogę do nowych, zaskakujących wyników.

Zacznijmy prościutko: z wielomianem P (x, y) = 2x2 − 3xy − 2y2 możemy związać zbiór n ∈N : N |= ∃y 2n2 − 3ny − 2y2 = 0. Wiemy już dość, by się zgodzić, że jest to zbiór rekurencyjnieprzeliczalny.To z kolei pozwala wyobrazić sobie, jak można dowieść twierdzenia, że „każdy zbiór diofantyczny -zbiór rozwiązań równania diofantycznego - jest rekurencyjnie przeliczalny”.

Matyjasiewicz pokazał, że i odwrotna implikacja jest prawdziwa:

„każdy zbiór rekurencyjnie przeliczalny jest zbiorem diofantycznym”- dla dowolnego zbioru rekurencynie przeliczalnego S istnieje wielomian PS(x, y1, . . . , yk) taki, żeliczba naturalna n jest w zbiorze S dokładnie wtedy, gdy PS(n,m1, . . . ,mk) = 0 dla pewnych liczbcałkowitych m1, . . . ,mk .

Skoro są zbiory rekurencyjnie przeliczalne które nie są rekurencyjne, to oczekiwania Hilberta sąniemożliwe do spełnienia.

Jedną z najbardziej intrygujących konsekwencji wyniku Matijasiewicza można opisać tak: wie-dząc tyle, ile wiemy, łatwo się zgodzimy, że wszystkie zbiory rekurencyjnie przeliczalne możnaefektywnie ponumerować. Trochę trudniej - nie widząc dowodu - przyjąć do wiadomości, że możnatę numerację wybrać tak, że relacja „n należy do rekurencyjnie przeliczalnego zbioru o numerzem” jest rekurencyjnie przeliczalna. Ale tak jest.Stąd - dzięki twierdzeniu Matijasiewicza - wynika, że istnieje .... uniwersalne równanie diofantycz-ne U(x, y, z1, . . . , zk) = 0 - dowolną procedurę sprawdzającą można zastąpić pytaniem o istnienierozwiązanie tego równania! Dokładniej:

„liczba n należy do zbioru rekurncyjnie przeliczalnego o numerze m dokładnie wtedy, gdy ist-nieją liczby naturalne m1, . . . ,mk takie, że

U(n,m,m1, . . . ,mn) = 0

6Równanie postaci f(x1, x2, . . . , xn) = 0 gdzie f jest wielomianem ze współczynnikami całkowitymi nazywa się(algebraicznym) równaniem diofantycznym. Diofantos z Aleksandrii, żył w III wieku naszej ery.

Page 146: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 145

Czy to kamień filozoficzny matematyki?7Bez szaleństw - to tylko odpowiednik uniwersalnej maszynyTuringa w języku równań diofantycznych.Z drugiej strony, skoro zbiór konsekwencji dowolnej pierwszorzędowej teorii jest rekurencyjnie przeliczalny,to z każdą taką teorią można związać pewne równania diofantyczne a dowodzenie twierdzeń zastąpićrozwiązywaniem takich równań. Czy to np. oznacza, że „stopień komplikacji” teorii można mierzyć zapomocą stopnia (liczby zmiennych) stowarzyszonego równania?Te są ważne pytania. Uświadamiają, co się kryje pod tak łatwo definiowanymi terminami jak „uniwersalnerównanie diofantyczne” czy „uniwersalna maszyna Turinga”.

Jak wygląda to uniwersalne równanie? Ile ma zmiennych, jaki stopień? Odsyłam do [53].

8.1 Zdanie godlowskie G

Już dwukrotnie „udowodniliśmy” twierdzenie o istnieniu arytmetycznych zdań prawdziwych (w N)ale niedowodliwych (w PA). Ale, pomijając dość enigmatyczne twierdzenie Parisa-Harringtona, niewskazaliśmy żadnego takiego zdania. Spróbujmy wypełnić tę lukę.

Paradoks kłamcy przyprawiał o ból głowy już antycznych Greków. Modyfikując nieco oryginalną wersjęsformułujemy go tak: spróbujmy ocenić wartość logiczną zdania: ,,Zdanie, które teraz wypowiadam,jest fałszywe". Nie trzeba być przesadnie wnikliwym, by dostrzec, że jest ono prawdziwe dokładniewtedy, gdy ... jest fałszywe.Przyczyna kłopotu w tym, że to zdanie orzeka samo o sobie. A jak głosi mądrość ludowa - „nie możnabyć sędzią we własnej sprawie”8.

Paradoks kłamcy każe unikać zdań orzekających o sobie samych. Wydaje się, że to proste9.Jednak tego założenia nie można utrzymać już w wypadku arytmetyki! A to dlatego, że formułyarytmetyczne można efektywnie ponumerować10.Ustalmy taką numerację i popatrzmy na (straszne) tego skutki. Przyjmijmy oznaczenia:

- przez φn(x) oznaczamy formułę arytmetyczną (z jedną wolną zmienną) o numerze n,- symbolem num(ψ(x)) oznaczamy numer formuły ψ(x) 11

Dla dowolnej formuły φn(x) możemy rozważać szczególne zdanie - φn(n). I to jest właśnie „zastosowanieformuły do samej siebie” w sformalizowanej postaci.

Dla dowolnej formuły ψ(x) możemy teraz utworzyć nową formułę ψ(y) - taką, która jest spełnionaprzy wartościowaniu [y := n] wtedy, gdy liczba n jest numerem pewnej formuły z jedną zmiennąwolną, a zdanie ψ(num(φn(n)) jest prawdziwe w modelu standardowym12.

Formuła ψ(y) ma swój numer: możemy więc skonstruować zdanie

G(ψ) ≡ ψ(num(ψ(y))

i udowodnić kluczowy lemat o diagonalizacji:

„zdanie G(ψ) jest prawdziwe w modelu standardowym dokładnie wtedy, gdy jego numer mawłasność opisaną przez formułę ψ(x): :

(∗) N |= G(ψ) wtw N |= ψ(x)[[x := num(G(ψ))]

Uff... .7Kamień filozoficzny to substancja poszukiwana przez alchemików, pozwalająca na zamianę metali w złoto.8To nie tylko mądrość ludowa. Tak uważali m.in. Poincare i Russell.9L. Wittgenstein o paradoksie kłamcy pisał tak: „Jest to jałowa sztuka! - jest to gra językowa (...). Podobne

sprzeczności stają się interesujące tylko dlatego, że przysparzały ludziom udręki.” (Uwagi o podstawach matematyki).10Bo jest to język rekurencyjny.11Niestety, nie da się tu uniknąć zupełnie formalnych zapisów....Odtąd, w całym rozdziale, będę też pomijać „pod-

kreślenia”, pozostawiając domyślności czytelnika rozstrzygnięcie, czy n to liczba czy reprezentujący ją numerał.12ψ(y) ≡ ∃x (s(x, y)∧ψ(x)) gdzie z kolei s(x, y) to formułą arytmetyczna opisującą (częściowo rozstrzygalny) zbiór

par (n,m) takich, że n to numerem formuły arytmetycznej o jednej zmiennej wolnej, a m jest numerem zdania φn(n).

Page 147: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 146

Popatrzmy co wyniknie z tego dziwnego lematu, gdy umiejętnie dobierzemy formułę ψ(x):

Przykład I. Przypuśćmy, że „prawda jest definiowalna w arytmetyce” - istnieje formuła arytme-tyczna true(x) taka, że: zdanie φ jest prawdziwe (w modelu standardowym) dokładnie wtedy, gdyzdanie true(num(φ)) jest prawdziwe:

(∗∗) N |= φ wtw N |= true(num(φ))

Wstawmy zaprzeczenie - formułę ¬true(x) - do równoważności (∗) w miejsce formuły ψ:

N |= G(¬true(x)) wtw N |= ¬true(num(G(¬true(x))))

i wykorzystajmy równoważność (∗∗) dla zdania G(¬true(x)):

N |= G(¬true(x)) wtw N |= true(num(G(¬true(x)))

Lewe strony obu równoważności są równe, więc prawe są równoważne! A to znaczy, że:

zdanie G(¬true(x)) jest prawdziwe w modelu standardowymwtedy i tylko wtedy gdy

... zdanie G(¬true(x)) nie jest prawdziwe w tym modelu!

Sprzeczność! Skoro tak, to formuła true(x) nie istnieje. Zbiór Th(N) zdań prawdziwych w modelustandardowym nie jest arytmetyczny13. A to oznacza, że nie jest sprawdzalny!

To jest nowy dowód niezupełności arytmetyki Peano.Jeśli ktoś się łudził, że „dowodliwość w systemie aksjomatycznym” nie wyczerpuje możliwości poznaniaprawdy (ograniczonego choćby do sprawdzania) to właśnie się ich pozbył. Przynajmniej w przypadkuarytmetyki.

Przykład II. Zrealizujemy (wreszcie) obietnicę: wskażemy prawdziwe, ale niedowodliwe zdaniearytmetyczne.Zbiór (numerów) zdań dowodliwych PA jest rekurencyjnie przeliczalny, czyli arytmetyczny. Istniejeformuła arytmetyczna dow(x) opisująca ten zbiór. Przyjmijmy, że dla dowolnego zdania φ będziemypisać (φ) zamiast dow(num(φ)). Tak więc dla dowolnego zdania φ mamy równoważność:

(∗ ∗ ∗) N |= (φ) wtw PA ` φPopatrzmy, co wynika z równoważności (∗) i (∗∗∗) dla zdania G ≡ G(¬dow(x)). Z równoważności(∗ ∗ ∗) otrzymamy:

N |= (G) wtw PA ` G

Równoważne są też zaprzeczenia obu zdań:

N |= ¬(G) wtw nieprawda, że PA ` G

Korzystając z równoważności (∗) dla formuły ¬dow(x), otrzymamy

N |= G wtw N |= ¬(G)

Połączmy dwie ostatnie równoważności w jedną:

(∗ ∗ ∗∗) N |= G wtw nieprawda, że PA ` G

„zdanie G jest prawdziwe w modelu standardowym dokładnie wtedy, gdy nie ma dowodu w PA.”Ale zdanie G nie może mieć dowodu w PA! Gdyby miało, to zgodność systemu PA względem Ngwarantowała by, że N |= G czyli, na mocy (∗ ∗ ∗∗) .... G nie ma dowodu w PA14.

Zdanie G jest prawdziwe w N i nie ma dowodu w systmie PA.

13To twierdzenie w literaturze znane jest jako „twierdzenie Tarskiego”.14Nasza wniosek, że G nie ma dowodu jest słuszny pod warunkiem, że PA jest niesprzeczny. Możemy pomyśleć o

całej sytuacji nieco inaczej: albo PA jest systemem niezupełnym albo jest sprzeczny.

Page 148: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 147

Zdanie G przeszło do historii pod nazwą zdania godlowskiego. Obietnica została spełniona...Przy okazji, zdanie ¬G również nie ma dowodu w PA15.

Aby nam się nie wydawało, że wszystko jest tak banalnie proste, proponuję spojrzeć na stronę:

http : //tachyos.org/godel/Godel statement.html

by sprawdzić, jak wygląda zdanie G zapisane w czystej postaci. To pomoże zrozumieć, jak istotny jestprzywoływany tu wielokrotnie „trzeci wymiar” języka matematyki pozwalający na wprowadzanie skrótówi nazw wyróżniających to, co ważne...

Ważny wniosek

Twierdzenie Godla nie dotyczy tylko arytmetyki. Zbiór konsekwencji dowolnej teorii aksjomatycznejT jest zawsze sprawdzalny. Można ponumerować słowa języka, w którym napisano teorię T tak, żezbiór numerów słów dowodliwych jest rekurencyjnie przeliczalny, czyli arytmetyczny. To oznacza, żeistnieje formuła arytmetyczna dowT (x), która jest spełniona przy wartościowaniu [x := n] dokładniewtedy, gdy zdanie o numerze n jest dowodliwą konsekwencją teorii T .Tak więc zamiast pokazywać wprost że T ` φ, można próbować pokazać, że zdanie dowT (num(φ))jest prawdziwe w N. To można osiągnąć konstruując dowód arytmetyczny zdania dowT (num(φ))- pokazując, że PA ` dowT (num(φ))16

To jednak nie oznacza, że dla dowolnej teorii T ` φ dokładnie wtedy, gdy PA ` dowT (num(φ)).Np. dla T = ZFC wynika to z udowodnionego właśnie twierdzenia o niezupełności arytmetyki....17

8.1.1 O praprzyczynie pewnych niemożnościGolibroda z Sewilli goli wyłącznie tych mężczyzn,którzy nie golą się sami. Czy goli swą własną brodę?

Matematycy często-gęsto mówią o metodzie przekątniowej, której autorstwo przypisuje się Can-torowi. Jej zastosowanie prowadzi do zaskakujących, wręcz paradoksalnych rezultatów. Spróbujemyopisać istotę tej metody najprościej jak można.

Dla dowolnej relacji r ⊆ A×A podzbiór C ⊆ A nazwiemy r-definiowalnym, jeżeli można wskazaćelement c ∈ A taki, że

C = a ∈ A : (c, a) ∈ rOkazuje się, że bez względu na to, jak wybierzemy relację r ⊆ A2, można wskazać podzbiór P ⊆ A,który nie jest r-definiowalny. Jest to zbiór

P = a ∈ A : ¬((a, a) ∈ r)

Zbiór P można nazwać zbiorem paradoksalnym dla relacji r18.

Proste? Bardzo. Zaskakuje dopiero to, jak wiele słynnych dowodów to w istocie wykorzystanietego, że „zbiór paradoksalny nie jest r-definiowalny” dla odpowiednio dobranej relacji r.Przekonajmy się.

I. Paradoks Russella. Zakładając istnienie zbioru wszystkich zbiorów U , możemy potraktowaćrelację przynależności „∈” jako relację na tym zbiorze. Wówczas russellowskie stwierdzenie (któreprowadzi do sprzeczności): „kolekcja a ∈ U : a /∈ a jest zbiorem” to jedynie inaczej wysłowionestwierdzenie: „zbiór ∈-paradoksalny jest ∈-definiowalny”.

II. Twierdzenie Cantora o nieprzeliczalności zbioru wszystkich podzbiorów liczb naturalnych.Dla dowolnej funkcji f : N −→ 2N określmy relację rf ⊆ N×N tak:

15Wiesz dlaczego?16Można też do „arytmetyzacji” dowodzenia użyć innej teorii, np. teorii słabszej niż PA. To jest zapewne sens

stwierdzenia Friedmanna, które wcześniej cytowaliśmy.17Wiesz dlaczego?18To twierdzenie funkcjonuje w literaturze pod nazwą lemat przekątniowy.

Page 149: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 148

(n,m) ∈ rf wtw n ∈ f(m)

Zbiory rf -definiowalne to podzbiory N postaci f(m), gdzie m to dowolna liczba naturalna.

Gdyby funkcja f była „na” (co jest warunkiem przeliczalności zbioru 2N), to każdy podzbiór liczbnaturalnych byłby definiowalny. Zbiór rf -paradoksalny też. I to wykorzystał Cantor.

III. Twierdzenie Tarskiego (o niedefiniowalności prawdy arytmetycznej).Przyjmijmy, że ustalona jest pewna efektywna numeracja formuł arytmetycznych (jednej zmiennej)ψ num(ψ). Zdefiniujmy relację na zbiorze formuł jednej zmiennej:

φ r ψ dokładnie wtedy, gdy N |= φ(num(ψ))

Zbiór paradoksalny składa się teraz z takich formuł φ, że zdanie φ(num(φ)) jest fałszywe wN. Gdyby istniała formuła Tarskiego true(x) (i tym samym formuła false(x) ≡ ¬true(x)), toformuła false(x) (utworzona w sposób opisany na początku podrozdziału poświęconego zdaniomgodlowskim) opisywała by zbiór paradoksalny.

IV. Arytmetyka Peano nie jest rozstrzygalna - nie istnieje procedura rozstrzygająca, czy zdaniearytmetyczne ma dowód w PA. Gdyby tak było, to relacja

r = (n,m) ∈ N2 : n to numer formuły jednej zmiennej i zdanieφn(m) jest prawdziwebyłaby zbiorem rozstrzygalnym. Tym samym zbiór paradoksalny dla tej relacji jest też rozstrzygal-ny, czyli arytmetyczny, opisany przez formułę ψ(x). Potrafisz dokończyć? Powinieneś... .

V. Niemożliwości w teorii obliczalności. Tak jak zawsze, przez kod(T ) oznaczamy binarny kodmaszyny Turinga T . Rozważmy prostą relację między takimi maszynami:

T r T1 jeżeli maszyna T zatrzymuje się rozpoczynając pracę ze słowem kod(T1) zapisanym nataśmie (symbolicznie: T (kod(T1)) ↓).

Zbiór paradoksalny tworzą teraz te maszyny Turinga, które nie zatrzymują się pracując nawłasnym kodzie (symbolicznie: T (kod(T )) ↑). Skorzystajmy z tej relacji.

Va. Nierozstrzygalność problemu stopu: nie istnieje maszyna PS taka, że dla dowolnej maszynyT i słowa v:

PS(< kod(T ), v >) =

1 gdy T (v) ↓0 w przeciwnym wypadku

Gdyby taka maszyna istniała, to można by łatwo skonstruować maszynę PS∞, opisującą zbiórparadoksalny (tzn. PS∞(kod(T )) ↓ dokładnie wtedy, gdy T (kod(T )) ↑)19.

Vb. Twierdzenie Rice’a: żadna nietrywialna semantyczna własności maszyn Turinga20 nie jestrozstrzygalna.Przypuśćmy, że maszyna TP rozstrzyga o własności semantycznej P Korzystając z niej zbudujemymaszynę Turinga Tr opisującą zbiór r-paradoksalny w taki oto sposób:niechMP będzie pewną maszyną o własności P21. Dla dowolnej maszyny T budujemy nową maszynęT której działanie na słowie v to kolejne wykonanie dwóch podprocedur:1. uruchamiamy obliczenie T (kod(T )). Jeżeli ten proces się nie kończy, to i praca T na słowie v sięnie kończy. W przeciwnym wypadku:2. uruchamiamy maszynę MP na słowie v.

Jeśli T nie zatrzymuje się na własnym kodzie, to T nigdy się nie zatrzymuje. W przeciwnymwypadku T akceptuje ten sam język co MP czyli - w tym przypadku - ma własność P22 . Tymsamym rozstrzygnięcie, czy T zatrzymuje się na swoim kodzie jest równoważne rozstrzygnięciu, czyT ma własność P. A to potrafi maszyna TP .

19Powarzamy tu argumenty użyte w dowodzie nierozstrzygalności problemu stopu (w rozdziale „Obliczalność”).20Własność P maszyn Turinga jest semantyczna, gdy nie rozróżnia maszyn akceptujących ten sam język. A nie-

trywialna, gdy ma ją choćby jedna maszyna Turinga.21Jej istnienie zapewnia nietrywialność własności P22Tu wykorzystujemy to z pozoru dziwne założenie o semantycznym charkaterze własności P.

Page 150: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 149

W ten sposób skonstruowaliśmy maszynę opisującą zbiór r-paradoksalny23.

Wynik Rice’a jest smutny - pokazuje, że żadna nietrywialna własność zbiorów rekurencyjnie przeliczal-nych nie jest rozstrzygalna. W szczególności omawiana wcześniej hierarchia języków Chomsky’ego nie maalgorytmicznego wsparcia: nie sposób proceduralnie rozstrzygnąć, czy dowolny język rekurencyjnie prze-liczalny jest regularny (bezkontekstowy, pusty)... Nie potrafimy też rozstrzygać czy języki akceptowaneprzez maszyny T1 i T2 są równe24.

„Relacja”, „negacja”, „zbiór definiowalny i paradoksalny” - te nazwy sugerują wysoce wyrafino-wany logiczny kontekst twierdzenia o istnieniu zbioru paradoksalnego. Ale to jest w istocie banalnetwierdzenie, które można sformułować korzystając z najprostszej, naiwnej teorii mnogości:

„jeżeli zbiór B ma conajmniej dwa elementy, to żadna funkcja ze zbioru A do zbioru funkcji zA do zbioru B - Fun(A,B) - nie jest funkcją „na”.Rzeczywiście, gdy tylko f : B → B jest funkcją bez punktu stałego25, to dla dowolnej funkcjiφ : A→ Fun(A,B) odwzorowanie df (φ) : A→ B takie, że dla dowolnego a ∈ A:

df (φ)(a) = f(φ(a)(a))

nie jest w zbiorze φ(A) (gdyby df (φ) = φ(c) to, w szczególności, φ(c)(c) = df (φ)(c) = f(φ(c)(c)) 6=φ(c)(c)).

A nasza wyjściowa obserwacja dotyczyła sytuacji, gdy B = 0, 1 a f = ¬.I to wszystko. Zero metafizyki26.

„Cantor, Russell, Turing, Tarski a nawet Godel w jednym stali domu”... Zadziwiające, jak różnie inter-pretowano skutki tej prostej obserwacji.Paradoks Russella zmusił do rewizji poglądów na temat relacji między „własnością” a „zbiorem”.Ale gdy Cantor korzystając z metody przekątniowej odkrył konieczność uznania nieskończonej skali nie-skończoności, nie zmieniło to poglądów w kwestii akceptacji nieskończoności aktualnej. Przeciwnie - dlawielu wynik Cantora to esencja teorii mnogości.Wykorzystanie tej samej metody w teorii obliczalności nikogo nie zbulwersowało: przyjęto, że te wynikiwyznaczają „granice obliczalności”. I nikt nie wpadł w ekstazę i nikt nie histeryzował...Jakkolwiek to nie zabrzmi, śmiem twierdzić, że twierdzenia Turinga i Godla są z wyższej niż twierdzenieCantora, półki. Wynik Cantora jest wewnętrznym twierdzeniem teorii mnogości - wystarczy odrzucićaksjomat istnienia zbioru złożonego ze wszystkich podzbiorów dowolnego ustalonego zbioru, by pozbawićto twierdzenie znaczenia.Tymczasem wynik Turinga odnosi się do elementarnie opisywanego procesu dyskretnej interakcji. To,podobnie jak wynik Godla, twierdzenie limitacyjne, wskazujące nieprzekraczalne granice poznania.

23Dokładniej: opisaliśmy procedurę, którą trzeba przekształcić w maszynę Turinga... . Uważny czytelnik zauważył,że ta konstrukcja wymaga by maszyna nigdy nie zatrzymująca się nie miała własności P. Ale na szczęście to tylko„techniczny” problem, który łatwo rozwiązać.24Ciekawostka: w pracy The Ricean objection: An analogue of Rice’s theorem for first-order theories. Log.J. IGPL

16, No. 6, 585-590 (2008) I.Carboni Oliveira i W. Carnielli udowodnili twierdzenie wzorowane na twierdzeniu Rice’adla teorii arytmetycznych pierwszego rzędu: jeżeli P jest pewną własnością takich teorii i pewna skończenie aksjoma-tyzowalna teoria ma tę własność, to P jest nierozstrzygalna. Pięknie, ale ... w 2009 ukazała się praca obu Autorów,którzy przyznali się do błędu...(Erratum to „The Ricean objection: An analogue of Rice’s theorem for firstordertheories”. Log. J. IGPL 17, No. 6, 803-804 (2009).25Tzn. f(b) 6= b dla dowolnego b ∈ B.26Już po napisaniu tego fragmentu „odkryłem” że istnienie zbiorów paradoksalnych nie umknęło uwadze Russella

(http://plato.stanford.edu/entries/paradoxes-contemporary-logic). A w [67] tak sformułowane twierdzenie nazwanotwierdzeniem Cantora.Mały sprawdzian na koniec: korzystając z powyższego twierdzenia pokaż to, co już wiemy: „nie istnieje efektywnanumeracja totalnych funkcji obliczalnych (jednej zmiennej)” i „nie istnieje rozstrzygalny podzbiór A ⊆ N2 taki, żerodzina An = m : (n,m ∈ A obejmuje wszystkie rozstrzygalne podzbiory N”.

Page 151: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 150

8.2 Niesprzeczność arytmetyki Peano - drugie twierdzenie Godla

Wskazując zdanie arytmetyczne, które nie ma dowodu w arytmetyce Peano wykazaliśmy jej nie-sprzeczność27. Innym dowodem niesprzeczności PA jest istnienie jej teoriomnogościowego modelu.Jednak w obu dowodach korzystamy z teorii mnogości. Dlatego te dowody mówią tylko, że „aryt-metyka Peano jest niesprzeczna, o ile teoria mnogości jest niesprzeczna”.To są warunkowe dowody niesprzeczności PA.

Czy można udowodnić niesprzeczność arytmetyki Peano „wewnętrznie”, korzystając tylko z tej teorii?Gdyby tak było, to bylibyśmy „mniej relatywistyczni” w swoim myśleniu o istnieniu matematycznym.

Uściślijmy: z chwilą, gdy wprowadziliśmy do rozważań numerację formuł, formułę dow(x) ioperator :

(φ) ≡ dow(num(φ))

możemy dla dowolnego zdania arytmetycznego ψ stawiać dwa (różne) pytania:

- czy ¬(PA ` ψ) - „czy nie istnieje dowód zdania ψ?”- czy PA ` ¬(ψ) - „czy mamy dowód w PA, że zdanie ψ nie ma dowodu?”

To nie zabawa w słowa. W obu wypadkach oczekujemy odpowiedzi uzasadnionych przez dowody, ale wróżnych systemach dowodzenia:W pierwszym wypadku, dopuszczamy dowód w pewnym „zewnętrznym” systemie dowodzenia,W drugim przypadku chodzi o dowód „wewnętrzny”, korzystający tylko z tego, co oferuje PA.

Zdanie arytmetyczne ψ możemy wybrać dowolnie. Wybierzmy równość (0 = succ(0)).

Wewnątrzny dowód niesprzeczności teorii PA to odpowiedź na pytanie: czy PA ` ¬(0 = 1)?Godel pokazał, że odpowiedź na to pytanie jest negatywna.

Subtelność: istnienie „wewnętrznego” dowodu zdania ¬(0 = 1) nie gwarantuje niesprzecznościPA! To oczywiste: jeśli PA jest sprzeczna to można dowieść w niej wszystko.Co zatem udowodnił Godel? Pokazał, że niesprzeczność PA nie może być „wewnętrznie potwierdzona”.

Drugie twierdzenie Godla - szkic dowodu

Przedstawienie w sposób poglądowy drugiego twierdzenia Godla jest zdecydowanie trudniejsze (dlamnie) niż podobnie uproszczony opis pierwszego twierdzenia. Ale spróbuję28.Zastosujemy wybieg: zamiast atakować problem wprost pokażemy, że

PA ` (¬(0 = 1)→ G)

To wystarczy: gdyby PA ` ¬(0 = 1) to - korzystając z reguły odrywania - moglibyśmy twierdzić,że PA ` G . A to, jak wiemy, jest niemożliwe.

W dowodzie wykorzystamy własności operatora , znane pod angielską nazwą derivability con-ditions Hilberta-Bernaysa:

1. jeżeli PA ` φ , to PA ` (φ),2. PA ` ((φ)→ (φ)),3. PA ` ((φ) ∧(φ→ ψ)→ (ψ)) (równoważnie: PA ` (φ→ ψ)→ ((φ)→ (ψ)) )

Skorzystamy też ze szczególnej właściwości zdania godlowskiego G:

PA ` (¬G↔ (G)) (+)29

Zaczynamy: najpierw, z (+) - na mocy (1) - wnioskujemy, że:

27Teoria jest niesprzeczna, gdy nie można w niej udowodnić wszystkiego. Równoważnie: nie można w niej dowieśćjednocześnie pewnego zdania i jego zaprzeczenia (gdyż z fałszu - koniunkcji p ∧ ¬p - wynika wszystko).28Niestety, dowód jest bardzo sformalizowany. Mniej zaawansowani powinni go sobie darować.29Równoważnie: PA ` (G ↔ ¬(G)). Tego nie udowodniliśmy: w dowodzie pierwszego twierdzenia Godla była

mowa tylko o nieco słabszej równoważności. Ale, proszę uwierzyć (sprawdzić), że ta równoważność jest też dowodliwa.

Page 152: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 151

PA ` ((G)→ ¬G) (a)

a korzystając z warunku (2) dla zdania G otrzymamy

PA ` ((G)→ ((G)) (b)

korzystajac z prawa odrywaniai (3) z (a) otrzymamy

PA ` ((G))→ (¬G) (c)

Ostatecznie, łącząc (b) i (c) otrzymamy:

PA ` (G)→ (¬G) (d)

Ponieważ w sposób oczywisty PA ` G→ (¬G→ (0 = 1))30 to - na mocy (1)- otrzymamy

PA ` (G→ (¬G→ (0 = 1)))stąd, dzięki (3), otrzymujemy

PA ` (G)→ ((¬G)→ (0 = 1))lub, równoważnie

PA ` (¬G)→ ((G)→ (0 = 1)) (f)

Korzystając z tautologii (p→ (q → r)↔ ((q → p)→ (q → r) otrzymamy z (f):

PA ` ((G)→ (¬G)))→ ((G)→ (0 = 1)) (g)

i - już widać koniec ! - z (d), (g) korzystajac z reguły odrywania otrzymamy

PA ` (G)→ (0 = 1)czyli

PA ` ¬(0 = 1)→ ¬(G)teraz, korzystając z (+), otrzymamy

PA ` ¬(0 = 1)→ GUff, koniec!!!31

Dodajmy na koniec coś, co jeszcze bardziej podnosi znaczenie wyniku Godla: nie tylko arytmetyka Pe-ano nie jest w stanie potwierdzić własnej niesprzeczności. To cecha każdej teorii bogatszej od PA. Wszczególności, teoria mnogości - ZFC - nie jest w stanie potwierdzić swojej niesprzeczności.

Herakles walczący z Hydrą

„Drugie zadanie Heraklesa polegało na tym, by pokonać wielogłową Hydrę odcinając jej kolejnowszystkie głowy. Ale ucięcie jednej głowy powodowało prawie zawsze odrastanie kilku nowych głów- zgodnie z regułami, które zaraz opiszemy.Czy Herakles może pokonać Hydrę bez względu na to, ile ma ona głów na początku walki?”

Niech H(1), H(2), . . . ,H(n), . . . będzie ciągiem opisującym liczbę głów Hydry: H(n) = liczba głów„po n-tym cięciu Heraklesa”. Hydra zginie, gdy H(n0) = 0 dla pewnej liczby n0.

Łatwo się zgodzić, że konstrukcja ciągu liczb naturalnych W (n) takiego, że:

(*) dla dowolnego m ∈ N istnieje m1 > m takie, że W (m) > W (m1)

musi kończyć się osiągnięciem zera32. Stąd pomysł, by rozwiązać problem Heraklesa wskazując ciągW (n) który spełnia warunek (*) i majoryzuje ciąg H(n)33.Pomysł dobry, ale ... niewykonalny. Stanie się to jasne, gdy poznamy „reguły odrastania głów”.Te reguły opiszemy wyobrażając sobie Hydrę jako graf-drzewo. Głowy Hydry to liście drzewa (wierz-chołki bez potomków) wieńczące szyje - gałęzie drzewa. Nazwijmy ojcem wierzchołka w ten wierz-chołek, który go bezpośrednio poprzedza. A ojciec ojca w - o ile istnieje - to „dziadek w”.30p→ (¬p→ false) to tautologia.31To tylko szkic, zarys dowodu. To co najistotniejsze - warunki Hilberta-Bernaysa czy własność (+) - pozostały tu

bez dowodu.32To konsekwencja twierdzenia, iż każdy niepusty podzbiór liczb naturalnych ma element najmniejszy. A to stwier-

dzenie jest konsekwencją (drugorzędowej) zasady indukcji. Tego nie można dowieść korzystając z aksjomatyki Peano!33Tzn. H(n) ¬W (n) dla dowolnego n.

Page 153: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 152

Pomóżmy sobie przykładem - oto graf reprezentujący pewną trójgłową Hydrę.

a b c

d

e

k

Wierzchołek d jest ojcem a i b, a e ich dziadkiem. k to korzeń. Wierzchołek c nie ma dziadka.Reguły odrastania głów Hydry po n-tym cięciu Herkulesa opisujemy tak:

- jeżeli odcinana głowa-wierzchołek nie ma dziadka, to nic nie odrasta,- w przeciwnym wypadku do „dziadka” głowy odciętej przez n-te cięcie Heraklesa zostaje dołą-

czonych n kopii tego, co zostało dziadkowi po odcięciu jednej głowy-wnuka:

Kolejny rysunek ilustruje zmianę Hydry-drzewa po drugim cięciu Heraklesa, w którym odciął ongłowę „a”.

•a b c b1 b2 c

d d1 d2

e e

k k

Gdy w kolejnym ruchu Herakles odetnie głowę „c”, to nic nie odrośnie.Wbrew wcześniejszym zapowiedziom zbudujemy teraz ciąg majoryzujący ciąg H(n) i spełnia-

jący warunek (∗). Ale nie będzie to ciąg liczb naturalnych a ciąg liczb porządkowych:

Liczby porządkowe klasyfikują zbiory dobrze uporządkowane. Najprostsze liczby porządkowe to liczbynaturalne - liczba naturalna n to liczba porządkowa zbioru 0 ¬ 1 ¬ · · · ¬ n−1. ω to liczba porządkowa(naturalnie uporządkowanego) zbioru liczb naturalnych. ω+1 to liczba porządkowa zbioru N, do któregodołożono element - powiedzmy ? - jako element największy:

0 ¬ 1 ¬ 2 ¬ . . . n ¬ n+ 1 ¬ · · · · · · ¬ ?I tak dalej... . Liczby porządkowe umiemy nie tylko dodawać, ale też mnożyć i potęgować.Można je też porównywać:

0 < 1 < 2 < . . . < n < n+ 1 < · · · · · · < ω < ω+ 1 < . . . < ω+ n < . . . < ω+ ω < . . . < ωω < . . .

Liczb porządkowych jest nieskończenie wiele34. Dla nas ważna jest liczba ε0, o której wystarczy nam terazwiedzieć, że jest większa od wszystkich liczb porządkowych tu rozważanych.

Udekorujemy wierzchołki drzewa-Hydry zgodnie z taką regułą rekurencyjną:- wszystkie liście (czyli głowy Hydry) oznaczamy przez 0,- jeśli wszystkie wierzchołki dla których wierzchołek w jest ojcem oznaczone są przez liczby

porządkowe α1, . . . , αn i α1 ­ α2 ­ . . . ­ αn , to wierzchołkowi w przypisujemy liczbęωα1 + ωα2 · · ·+ ωαn 35

34Więcej i bardziej teoriomnogościowo o liczbach porządkowych na str. 176.35ω0 = 1

Page 154: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 153

Numerację wierzchołków wybrano tak, by liczba porządkowa etykietująca korzeń drzewa „pocięciu” była zawsze mniejsza od przypisanej mu przed cięciem. I większa od liczby głów Hydry.

•a0 b0 c0 b01 b02 c0

d2 d11 d1

2

eω2

e(ω+ω)

kωω2+1

kω(ω+ω+1)

Proszę uwierzyć (policzyć): tak jest zawsze, bez względu na to, który łeb Hydry utnie Herakles.Wniosek? Ciąg liczb porządkowych etykietujących kolejno korzeń drzewa-Hydry jest istotnie ma-lejący i majoryzuje nasz ciąg H(n).

I teraz najważniejsze. Przyjmijmy, że uznajemy za „prawo matematyki” indukcję pozaskończonądla liczby ε0, czyli uznamy za prawdziwe takie stwierdzenie36:

jeśli zbiór A liczb porządkowych ¬ ε0 zawiera 0 i dla dowolnej liczby porządkowej α < ε0

prawdziwa jest implikacja:jeśli β ∈ A dla dowolnej β < α, to α ∈ A

to zbiór A zawiera wszystkie liczby porządkowe < ε0.

Jeśli tak, to łatwo pokażemy - podobnie jak dla zwykłej indukcji drugorzędowej - że każdyniepusty zbiór liczb porządkowych mniejszych niż ε0 ma element najmniejszy. A stąd wynika, że:

każdy malejący ciąg liczb porządkowych < ε0 musi osiągnąć 0!

Herakles zawsze zabije Hydrę... Bez względu na to, ile i jak „rozłożonych” ma ona głów i jakąstrategię odcinania głów wybierze Herakles....

Mniejsza o Heraklesa - heros sobie poradzi. To tylko przykład problemu sformułowanego w języku aryt-metyki, którego rozwiązanie wymaga „czegoś więcej” - w tym przypadku liczb porządkowych i indukcjipozaskończonej.Ale dlaczego twierdzimy, że jest to „prawda”? To jest tylko „prawda teoriomnogościowa”...

Pora na konkluzje, czyli dwa ważne zdania:

1. Kirby i Paris pokazali, że niesposób dowieść w PA iż Herakles zwycięży Hydrę37

2. Korzystając z tych samych środków - liczb porządkowych i indukcji pozaskończonej dla liczbporządkowych < ε0 - Gentzen dowiódł niesprzeczności arytmetyki pierwszego rzędu.

8.3 Próba bilansuEither mathematics is too big for the human mindor the human mind is more then a machine

K. Godel38

Pozornie prosty język arytmetyki okazał się zbyt mocny: pozwala na formułowanie zdań, którychprawdziwości nie można potwierdzić dowodem. Prawda arytmetyczna wymknęła się spod kontroli.36Teoria zbiorów ZF (nawet bez aksjomatu wyboru!) pozwala traktować prawo indukcji pozaskończonej jako twier-

dzenie - potrafimy je dowieść w ramach tej teorii.37Podobnie rzecz się ma z ciągami Goodstaina: można je zdefiniować w języku arytmetyki, ale udowod-

nienie, że każdy taki ciąg musi zbiegać do zera wymaga wykorzystania idukcji pozaskonczońej - patrz np.http://en.wikipedia.org/wiki/Goodstein’s theorem.38http://math2033.uark.edu/wiki/index.php/Kurt Godel

Page 155: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 154

Z drugiej strony, arytmetyka Peano (i jakakolwiek teoria obszerniejsza od niej) okazała się zbytsłaba, by dowieść własnej niesprzeczności.

Jak wytłumaczyć nieco histeryczny ton, tak często obecny w dyskusjach o wynikach Godla?39

To zapewne skutek akceptowanego przez większość (świadomie lub podświadomie) realizmu mate-matycznego. Realiści przyjmują, że byty matematyczne dziedziczą po obiektach świata fizycznegopodstawową cechę: własność sformułowana w adekwatnym języku przysługuje, albo nie, danemuobiektowi40 - teoria pojedynczego obiektu matematycznego musi być pełna. Jeśli tak, to twierdze-nie Godla o niezupełności jest nielichym kłopotem, bo rozbja w proch i pył paradygmat matematykihilbertowskiej - przekonanie o możliwości pełnego i aksjomatycznego opisu każdego obiektumatematycznego.

I dlatego R. Penrose uznał twierdzenia Godla za „śmiertelny cios zadany formalizmowi”, zaporażkę programu Hilberta41.

Hilbert nie chciał rewolucji, chciał uporządkować zastaną matematykę. Temu miała służyć for-malizacja: „all the propositions that constitute mathematics are converted into formulas, so thatmathematics proper becomes an inventory of formulas (...). The axioms and provable propositions(...) are copies of the thoughts constituting customary mathematics as it has developed till now”[97]42. Centrum tej matematyki miały być liczby naturalne i arytmetyka: „I take this standpoint,the objects of number theory are (...) the signs themselves, whose shape can be generally and cer-tainly recognized by us—independently of space and time (...) I think is required for the groundingof pure mathematics (...) is this:

In the beginning was the sign” [?].Może niekoniecznie cała arytmetyka peanowska ale jej „bezproblemowa” część. Matematyka „rze-czywista”43. Katastrofa, jaką były wyniki Godla, zdarzyła się w „samym centrum miasta” a nie najego peryferiach.Matematyka zdań rzeczywistych miała być obudowana matematyką zdań idealnych. Gdyby przy-jąć, barbarzyńsko upraszczając, że zdania rzeczywiste to arytmetyka, a idealne to teoria mnogości,to rzecz jest jasna: w teorii mnogości potrafimy dowieść niesprzeczności PA (czego PA nie potrafi):rozszerzenie arytmetyki do teorii mnogości nie jest konserwatywne44.

Czy tego chcieli twórcy teorii mnogości? Nie wiemy (raczej nie). Ale musimy się z tym pogodzić.

Twierdzenie Godla o niesprzeczności PA skazuje nas na immanentny relatywizm w ustalaniu nie-sprzeczności teorii matematycznych. To musiało zaboleć - wszak niesprzeczność to hilbertowskieistnienie. Ale już np. R. Symullya’n pisał beztrosko: „Nie jest tak, że nie potrafimy dowieść nie-sprzeczności arytmetyki: to arytmetyka nie potrafi dowieść swej niesprzeczności”. [110]. Potrafimy,jeśli skorzystamy z teorii mnogości. Ale w ten sposób nie uzyskamy pewności niesprzeczności ma-tematyki a jedynie uświadamiamy sobie jej wewnętrzne zależności45.

39Twierdzenia Godla jest szeroko komentowane i interpretowane również poza matematyką. Nie podejmuję tegowątku z dwóch powodów. Po pierwsze, brak mi kompetencji. Po drugie, ręce opadają wobec ogromu niekompetencjii „swobody interpretacynej” prezentowanej przez wielu dyskutantów. Ale zainteresowanych odsyłam np. do [61].40Również w odniesieniu do obiektów świata rzeczywistego (np. kwantowego) to przekonanie jest dość naiwne...41Ponieważ nie z całą argumentacją Penrose’a się zgadzam nie będę jej tu przedstawiał. Odsyłam do [87].42Nie mylmy programu Hilberta z listą 23 problemów matematycznych przedstawionych przez niego na Międzynaro-

dowym Kongresie Matematyków w Paryżu w 1900 roku (choć drugi problem na tej liście - „udowodnić niesprzecznośćaksjomatów arytmetyki”) - jest jednym z elementów tego programu). Ten program powstawał przez lata, a dojrzałąformę osiągnął po roku 1920.43„Real statements” i „ideal statements” - patrz str. 53.44Zainteresowanych bardziej finezyjnymi rozważaniami o związkach twierdzenia Godla z podziałem matematyki na

„rzeczywistą” i idealną” odsyłam do [109]45Sparafrazujmy złośliwie wypowiedź R. Symullya’na: ,Nie jest tak, że nie potrafimy dowieść niesprzeczności ma-

tematyki: to matematyka nie potrafi dowieść swej niesprzeczności”.

Page 156: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 8. TWIERDZENIA GODLA 155

Relatywizm zamiast absolutnej prawdy? Dlaczego nie? Relatywizm pozbawia pewności, ale w zamiandaje gwarancję ciągłego rozwoju. Większą, niż poszukiwanie jednej, jedynie słusznej prawdy.

Co robić?46 Realiści nie znajdują dobrej odpowiedzi. Ale wyjdźmy poza matematyczny realizm ispójrzmy na wyniki Godla inaczej. Już w początku XVIII wieku George Berkeley (1685 - 1753)sformułował słynne równanie:

esse = percipito, co istnieje = to, co jest postrzegane

Postrzeganie matematyczne to dowodliwość... . W matematyce nie ma prawdy. Jest tylko do-wodliwość47. „Zgodność twierdzeń z rzeczywistością” to kwestia pozamatematyczna.

Obiekt matematyczny jest tym, co o nim wiemy - potrafimy dowieść. Nic dziwnego,że użycie różnych języków daje różne rezultaty48. „Mój język wyznacza granice mego poznania” -L. Wittgenstein49.

Jeśli tak, to twierdzenie o niezupełności arytmetyki traci swój dramatyczny charakter. Jestważne, ale nie rujnuje matematyki. Czy rozpoznawanie siły języka i porównywanie siły opisu różnychjęzyków, nie jest częścią procesu poznania?

Nie podzielam poglądu, że wyniki Godla to klęska formalizmu. To tylko koniec pewnych złudzeń. Pa-radoksalnie, forsowany przez Hilberta formalizm i związany z nim rygoryzm matematyczny zmusiłdo nadania precyzyjnego matematycznego znaczenia takim terminom jak „prawdziwość”, „dowo-dliwość”, „rozstrzygalność” i badanie zależności między nimi.

Te przyniosło znakomite rezultaty. Ale też ukazało nieprzekraczalne granice języka matematykii metody aksjomatycznej. Zmusiło do rewizji poglądów na temat tego, czym właściwie jest mate-matyka. I to jest wielka zasługa Hilberta choć te rezultaty okazały się odległe od jego wyobrażeń,jego wizji matematyki. Odtąd matematyka nie może już być tak arogancko pewna, że „musimywiedzieć i będziemy wiedzieć”50.

Na koniec: to, że arytmetyka Peano (i każda teoria aksjomatyczna ją zawierająca) okazała sięnierozstrzygalna, komentuje się czasem tak: „to i dobrze, bo cóż ciekawego w świecie, gdzie o wszyst-kim rozstrzyga komputer”. Nie tak prosto. Dla wspomnianej wcześniej rozstrzygalnej arytmetkiPresburgera51 udowodniono taki oto fakt (Fischer i Rabin (1974)):„Każdy algorytm rozstrzygają-cy, czy twierdzenie jest dowodliwe w arytmetyce Presburgera, musi wykonać w pesymistycznymprzypadku co najmniej 22cn kroków” (gdzie n jest długością twierdzenia a c > 0 jest pewną stałą.)Dla porównania: analogiczne oszacowanie dla rachunku zdań wynosi 2n...

46W.I. Lenin47Żaden matematyk nie ośmieli się powiedzieć, że twierdzenie jest prawdziwe, jeśli nie zna jego dowodu.48Co w języku suahili można powiedzieć o różnych rodzajach śniegu tak precyzyjnie rozróżnianych przez Eskimo-

sów?49W książce „Wielki projekt” S.Hawkinga i L.Mlodenowa znajdziemy nawet dalej idące stwierdzenie: „Nie istnieje

koncepcja rzeczywistości niezależna od teorii”.50Potwierdzeniem roli Hilberta jako inicjatora tych badań jest to, że na liście 23 najważniejszych problemów -

zadań matematyki w XX wieku - umieścił on m.in. rozstrzygnięcie hipotezy continnum (I problem), udowodnienieniesprzeczności arytmetyki (II problem) czy też wskazania procedury rozwiązywania dowolnych równań diofantycz-nych (X problem). Z drugiej strony, jak gdzieś wyczytałem, podobno Hilbert nigdy nie zacytował wyników Godla...51str.143.

Page 157: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 9

Wokół koncepcji prawdy Tarskiego

Powiedzieć, że istnieje, o czymś, czego nie ma, jestfałszem. Powiedzieć o tym, co jest, że jest, a o tym,czego nie ma, że go nie ma, jest prawdą.

„Metafizyka”, Arystoteles

„Wedle klasycznej definicji prawdy, prawdziwe lub fałszywe mogą być myśli. Niektórzy uważają,że myśl, jako przedmiot w umyśle, (...) niedostępny publicznie, nie może być nośnikiem prawdy.Publicznie dostępne mogą natomiast być przedmioty myśli. Według wielu filozofów są nimi:

- sądy (propositions), czyli przedmioty abstrakcyjne (...) . Sąd jest obiektywną treścią zdaniaoznajmującego, aczkolwiek między sądami a zdaniami nie zachodzi wzajemnie jednoznaczna odpo-wiedniość. Ten sam sąd można wyrazić za pomocą różnych zdań (np. w różnych językach), to samozdanie, przy różnych okazjach, może wyrażać różne sądy. (...) Można wątpić, (...) czy sądy spełnia-ją powszechnie akceptowane w ontologii Parmenidesa kryterium istnienia (istnieć = zachowywaćtożsamość, być identycznym z samym sobą). Takich wątpliwości nie budzą zdania, ponieważ sąprzedmiotami fizycznymi: napisami lub ciągami dźwięków. (...) Koncepcja, wedle której nośnikamiprawdy są zdania, znakomicie pasuje do języków rachunków logicznych i teorii matematycznych.Natomiast zdania języka potocznego mają tę niemiłą cechę, że zawierają wyrażenia okazjonalne, naprzykład „ja”, „dziś”, „tu”, „to”, które przy różnych okazjach mają różne znaczenia. Zdania takie,na przykład „Dzisiaj jest piątek”, jest czasem prawdziwe, zaś przez sześć dni w tygodniu fałszywe.Żeby uniknąć kłopotów z okazjonalnością, W.V.O. Quine (...) zaproponował, żeby zdania językapotocznego uznać za skróty zdań wiecznych.

Zdanie wieczne jest to takie zdanie, w którym nie występują wyrażenia okazjonalne i dlategoich prawdziwość nie zależy od tego, kto je wypowiada, kiedy, ani gdzie (...)1

Wystarczy. Widać, jak wielu ustaleń trzeba po to tylko, by zacząć dyskusję o „prawdziwości”.Nie jestem aż tak naiwny (zarozumiały) by podjąć próbę odpowiedzi na pytanie „czym jest prawdai jak ją poznać?”. Zainteresowanych odsyłam np. do (niematematycznego) dzieła J. Wolańskiego„Epistemologia. Poznanie, prawda, wiedza, realizm”. Moje ambicje ograniczam do naszkicowaniapodstawowych ustaleń i wskazania wątpliwości związanych z „prawdą matematyczną”. Dlatego zprzytoczonego fragmentu wybieram tylko jedno zdanie:

„Koncepcja, wedle której nośnikami prawdy są zdania, znakomicie pasuje do języków rachunkówlogicznych i teorii matematycznych.”2

9.1 Koncepcja Tarskiego

Zdanie prawdziwe to zdanie, które wyraża, że tak a tak rzeczysię mają, i rzeczy mają się tak właśnie. - A. Tarski3

1Fragmenty wykładu A. Groblera - (http:// adam-grobler.w.interia.pl/Epi4.html).2„W zdaniu myśl wyraża się w sposób zmysłowo postrzegalny” - L.Wittgenstein.3Alfred Tarski (1901-1983) polski matematyk i filozof pochodzenia żydowskiego, od 1939 roku w USA.

156

Page 158: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 157

Zadowalamy się szukaniem prawdy w odpowiedniościmiędzy zdaniami w umyśle a rzeczami, o które chodzi.

G.W. Leibniz (Nowe rozważania).

Dyskusja nad pojęciem prawdy w słynnej pracy Tarskiego „The semantical conception of true”[121] zaczyna się tak:(...). Consider the sentence ”snow is white.” We ask the question under what conditions this sentenceis true or false. It seems clear that if we base ourselves on the classical conception of truth, we shallsay that the sentence is true if snow is white, and that it is false if snow is not white. Thus, if thedefinition of truth is to conform to our conception, it must imply the following equivalence:

The sentence ”snow is white” is true if, and only if, snow is white.

Let me point out that the phrase ”snow is white” occurs on the left side of this equivalence inquotation marks, and on the right without quotation marks. On the right side we have the sentenceitself, and on the left the name of the sentence.

Employing the medieval logical terminology we could also say that on the right side the words”snow is white” occur in suppositio formalis4, and on the left in suppositio materialis5. It is hardlynecessary to explain why we must have the name of the sentence, and not the sentence itself, onthe left side of the equivalence. For, in the first place, from the point of view of the grammarof our language, an expression of the form ”X is true” will not become a meaningful sentenceif we replace in it ’X’ by a sentence or by anything other than a name – since the subject of asentence may be only a noun or an expression functioning like a noun. And, in the second place,the fundamental conventions regarding the use of any language require that in any utterance6 wemake about an object it is the name of the object which must be employed, and not the objectitself. In consequence, if we wish to say something about a sentence, for example, that it is true,we must use the name of this sentence, and not the sentence itself. The problem of the definitionof truth obtains a precise meaning and can be solved in a rigorous way only for those languageswhose structure has been exactly specified. For other languages – thus, for all natural, ”spoken”languages – the meaning of the problem is more or less vague7, and its solution can have onlyan approximate character. Roughly speaking, the approximation consists in replacing a naturallanguage (or a portion of it in which we are interested) by one whose structure is exactly specified,and which diverges from the given language ”as little as possible”.

Aby wyeliminować niejasności spowodowane zmaganiami z obcym językiem, dodajmy podobnyfragment z pracy A. Tarskiego „Truth and Proof” (z moimi skrótami):

Weźmy pod uwagę zdanie w języku polskim, którego sens nie budzi wątpliwości, np. zdanie”śnieg jest biały”. Umawiamy się, że zdanie to będziemy oznaczać przez „8”. Stawiamy pytanie: comamy na myśli mówiąc, że „8” jest zdaniem prawdziwym lub też jest zdaniem fałszywym? (...) ,mówiąc że „8” jest zdaniem prawdziwym, mamy na myśli, że śnieg jest biały, a mówiąc, że „8” jestzdaniem fałszywym, że śnieg nie jest biały. Eliminując „8” uzyskujemy następujące sformułowania:

(1) ”śnieg jest biały” jest zdaniem prawdziwym wtedy i tylko wtedy, gdy śnieg jest biały;(1’) ”śnieg jest biały” jest zdaniem fałszywym wtedy i tylko wtedy, gdy śnieg nie jest biały.(...) Możemy uważać (1) i (1’) za cząstkowe definicje terminów ”prawdziwy” i ”fałszywy” - za

definicje tych terminów w odniesieniu do pewnego konkretnego zdania. Zauważmy, że (1), podobniejak (1’), ma postać narzuconą definicjom przez reguły logiki (...) - postać równoważności logicznej.Lewa strona (równoważności) jest to definiendum, czyli zwrot, którego znaczenie jest wyjaśnioneprzez definicję; prawa strona jest to definiens, czyli zwrot, który wyjaśnia to znaczenie. W obecnymprzypadku definiendum jest następującym wyrażeniem:

”śnieg jest biały” jest zdaniem prawdziwym;definiens zaś ma postać: śnieg jest biały.4GJ: „Brane w znaczeniu formalnym”5GJ: „Brane w znaczeniu materialnym”6wypowiedź7niejasny

Page 159: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 158

Na pierwszy rzut oka może się wydać, że zdanie (1) traktowane jako definicja zawiera podstawowybłąd, znany jako błędne koło. Chodzi o to, że pewne słowa, np. ”śnieg”, występują („,) po obustronach równoważności. W rzeczywistości jednak występują one tam w zupełnie różnych rolach.

Prawa strona zawiera słowo „śnieg” jako syntaktyczną część: definiens jest zdaniem, a sło-wo „śnieg” jest jego podmiotem. Lewa strona jest również zdaniem. Głosi ono, że prawa stronajest zdaniem prawdziwym. Podmiotem tego zdania jest nazwa zdania stojącego po prawej stronieutworzona przez ujęcie go w cudzysłów. (...) Wyrażenie ujęte w cudzysłów powinno być traktowa-ne gramatycznie jako pojedyncze słowo nie mające części syntaktycznych. W szczególności słowo”śnieg”, nie jest jego częścią syntaktyczną (...) Logik średniowieczny powiedziałby, że w definiens„śnieg” występuje in suppositione formalis, w definiendum zaś in suppositione materialis. Słowa,które nie są syntaktycznymi częściami definiendum, nie mogą jednak być źródłem błędnego koła iniebezpieczeństwo błędnego koła znika.8

Uchwyćmy, co najistotniejsze:1. Tarski nie próbuje definiować prawdy. Jego celem jest określenie zasad, na których powinno sięopierać dociekanie o prawdziwości zdania9. Dodajmy: zdania języka formalnego (pierwszego rzędu)a nie naturalnego.2. Istotą koncepcji Tarskiego jest rozdział języka zdań, których prawdziwość nas interesuje odjęzyka, w którym tej prawdziwości chcemy dociekać10.

9.2 Syntaktyka - składnia języka pierwszego rzędu

Define a full logic to be a language, together with adeductive system and a semantics.

S. Shaprio [106]

Budowę języka pierwszego rzędu zaczynamy od arbitralnego ustalenia słownika (sygnatury) -zbioru symboli relacyjnych - R , symboli operacyjnych - Ω i stałych - C. Z każdym symbolemrelacyjnym i operacyjnym wiążemy liczbę naturalną zwaną jego argumentowością (arnością)11.

Przyjmijmy, że Σ = (R = (Rn : n ∈ N), C,Ω = (Ωn)) jest tak ustalonym słownikiem. Z symbolioperacyjnych, stałych i zmiennych przedmiotowych budujemy termy: 12

- zmienne i stałe są termami,- jeżeli t1 . . . , tk są termami i q ∈ Ωk, to napis q(t1, . . . , tk) jest termem.

Z symboli relacyjnych i termów budujemy formuły. Formuły atomowe to:

- równości (t1 = t2) ,- napisy postaci r(t1, . . . , tn), gdzie r ∈ Rn a t1, . . . tn są termami.

Formuły złożone tworzymy z formuł atomowych korzystając ze spójników zdaniowych i kwan-tyfikatorów:- jeżeli napisy φ i ψ są formułami, to są nimi też napisy ¬φ, (φ ∧ ψ), (φ ∨ ψ) oraz (φ→ ψ),- jeżeli napis φ jest formułą a x jest zmienną przedmiotową, to napisy ∀xφ, ∃x φ są formułami (wktórych zmienna x jest odtąd związana)

I tak, jeżeli np. p, q, r są symbolami relacyjnymi odpowiedniej arności a x, y, z - zmiennymiprzedmiotowymi, to napis

∀x(∃y(p(x) ∨ q(x, y))→ (∃z ¬r(z, z)))8„Scientific American”, t. 220, 1969, nr.6 w tłum. J. Zygmunta (tłumaczenie dostępne w internecie)9„What is for a proposition to be true”.10Koncepcja prawdy Tarskiego wpisuje się w ogólne pojęcie „korespondencyjnego pojęcia prawdy”. Autorstwo

tego terminu J. Wolański przypisuje Joachimowi, filozofowi brytyjskiemu z początku XX wieku. Żródeł tej koncepcjimożna doszukiwać się u Arystotelesa. Określenia „korespondencyjna”, „sematyczna”, „klasyczna” (teoria prawdy)Tarski uznawał za synonimy. Istotą tej koncepcji jest to, że „prawdziwość” jest łącznikiem między słowami a światem.11Słownik dobieramy stosownie do celu badań. Np. gdy chcemy mówić o porównywaniu elementów, to powinniśmy

dysponować dwuargumentowym symbolem relacyjnym (zazwyczaj sugestywnie oznaczanym przez „¬”).12Termy to schematy nazw - formuły nazwowe (str. 78).

Page 160: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 159

jest poprawnie zbudowaną formułą.

Zdanie pierwszego rzędu to formuła, w której wszystkie zmienne są związane.

Logika pierwszego rzędu to język formuł wraz z jego wewnętrzną logiką - systemem dowodzenia. Tę logikęoznaczamy symbolem FOL („First Order Logic”)13.

9.3 Modele logiki pierwszego rzędu

Zdanie może być prawdą lub fałszem tylkodzięki temu, że jest obrazem rzeczywistości

L. Wittgenstein

Prawdziwość zdania polega na jego zgodności( korespondencji) z rzeczywistością”

A. Tarski

9.3.1 Pierwotny model logiki

Trudno nie zgodzić się ze słowami Wittgensteina i Tarskiego. Ale tylko do chwili, gdy będziemystarali się uzgodnić, czym jest owa rzeczywistość. Czy to tylko rzeczywistość fizyczna gdzie praw-dziwość pewnych stwierdzeń można próbować weryfikować eksperymentalnie14, czy też uznamy,że istnieje również niematerialna „rzeczywistość cywilizacyjna”? Tę cywilizacyjną część kreujemy,również za pomocą języka. A jeśli tak, to język jest współodpowiedzialny za kształtowanie pojęciaprawdy i fałszu. Błędne koło...15.

Matematycy chcieli uciec i uciekli od tych pytań. Antyczni Grecy (Platon) uznali, że przedmio-tem matematyki jest wyłącznie niezmienny, transcedentny świat bytów idealnych w którym obo-wiązuje dychotomiczna (dwuwartościowa) skala wartości logicznych - jest tylko „prawda” i „fałsz”- „ta figura jest trójkątem albo nim nie jest - trzeciej możliwości nie ma”. Są też nam dane aprio-ryczne reguły - ustalenia, jak użycie spójników logicznych („i”, „lub”, „nieprawda, że”) wpływa nawartość logiczną zdania: „koniunkcja zdania prawdziwego i fałszywego jest fałszem a alternatywatych zdań jest prawdziwa”, itd. .Minęły wieki i nic się nie zmieniło. Formalizując logikę zdaniową i definiując pojęcie prawdy dlatej logiki sięgnięto do antycznych wzorców. Dwuelementowa algebra Boole’a to sformalizowanyopis działania spójników logicznych na dwuelementowym zbiorze wartości logicznych. Ta algebrato model logiki zdaniowej, dostarczyciel pojęć „prawdy” i „fałszu” dla tej logiki. Poszukiwanie„prawd prawdziwości” to wskazywanie zdań, których prawdziwość wynika wyłącznie z ich kształtu(struktury), a nie znaczeń.16

Z językiem pierwszego rzędu jest trudniej bo składnia tego języka jest bogatsza: zdania proste niesą już reprezentowane przez zmienne zdaniowe (jak w logice zdaniowej) ale są złożonymi napisamizbudowanymi z pewnych wyrażeń - termów i formuł (prostych). Wartość logiczna zdania zależy odznaczeń jakie nadamy tym wyrażeniom, od tego, jak je interpretujemy.

13„The notion of formal system is the central concept in any formalistic view of mathematics. Such a system ischaracterized by the fact that the process of proof is specified by explicitly stated rules. The initial conventionsspecifying such a formal system (...) will consist of three kinds of conventions (...):- First we shall have conventions stating what the objects of the theory, which I shall call its terms, shall be. Theseconventions will consist of a list of primitive terms, a list of operations for the formation of further terms and a setof rules of formation describing how new terms are to be formed from the primitive ones (...).”- Next we have conventions specifying a set of propositions, which I shall call elementary propositions, concerningthe terms. Ordinarily (...) an elementary proposition is formed by applying a predicate to the appropriate number ofterms as arguments.- Finally we have specifications determining which of the elementary propositions are true. A certain set of theseelementary propositions, called axioms, are stated to be true outright; and specific rules of procedure are given whichare to determine how the derivation of new elementary theorems is to proceed. This process amounts to a recursivedefinition of the elementary theorems” - H. Curry [23]. FOL nazywana jest też logiką (lub rachunkiem) predykatów.14Zdanie „śnieg jest biały” uznajemy za prawdziwe, bo można to potwierdzić eksperymantalnie. Gdyby Tarski nie

urodził się w Polsce a np. w Egipcie, to nie uczynił by swoim sztandarowym przykładem tego własnie zdania... .15Przekonujemy się o tym zczególnie boleśnie w dobie internetu i „fake newsów”... .16str. 71

Page 161: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 160

Szczęśliwie, rekurencyjny charakter definicji termów i formuł pozwala na prosty opis zasad tejinterpretacji, na opis modelu języka pierwszego rzędu:

Skończony model języka pierwszego rzędu sygnatury Σ to dowolny skończony i niepusty zbiórA, w którym zinterpretowano każdy n-argumentowy symbol relacyjny r jako pewien podzbiórrA ⊆ An = A× · · · ×A︸ ︷︷ ︸

n

, każdy n-argumentowy symbol operacyjny q jako funkcję q : An → A a

każdej stałej c ∈ C przyporządkowano element cA ∈ A:

A =(A, (rA : r ∈ R), (qA : q ∈ Ω), (cA : c ∈ C)

)Model języka to wyróżnienie pewnego zespołu ekstensjonalnie rozumianych własności czyli (pod)zbiorówskończonych układów elementów wskazanego a priori skończonego zbioru A. Definiując model „posado-wiony na zbiorze A” przypisujemy tym wyróżnionym własnościom nazwy - symbole relacyjne.Nazywanie jest początkiem poznania.

Podzbiór [[φ]] ⊆ An przyporządkowany formule φ(x1, . . . , xn) o n zmiennych wolnych w modeluA to zbiór desygnatów własności opisanej przez tę formułę.Opiszemy to przyporządkowanie w sposób nieco odmieny od powszechnie przyjętego17. Zaczniemytak: wskazanie (skończonego) zbioru A - to de facto wyróżnienie pewnej elementarnej struktury -rodziny zbiorów i funkcji, na którą składają się:

- wszelkie skończone potęgi kartezjańskie zbioru A - zbiory An,- rodziny zbiorów (Sub(An) : n ∈ N) złożone z podzbiorów tych kartezjańskich potęg wraz z

operacjami sumy, przekroju dopełnienia i implikacji18,- opisane wcześniej funkcje ∀n,∃n : An → A(n−1) 19,

Interpretację formuł w modelu A opiszemy rekurencyjnie, odwołując się do tej struktury:

- [[r(x1, . . . , xn)]] = rA , dla każdego symbolu relacyjnego r ∈ R,

- [[x = y]] = (a, a) : a ∈ A,dla dowolnych formuł φ(x1, . . . , xn), ψ(x1, . . . , xn):

- [[φ ∧ ψ]] = [[φ]] ∩ [[ψ]] , [[φ ∨ ψ]] = [[φ]] ∪ [[ψ]] , [[φ→ ψ]] = [[φ]]→ [[ψ]],

- [[¬φ]] = ¬[[φ]] (= An \ [[φ]]),

- [[∀xnφ(x1, . . . , xn−1, xn)]] = ∀n([[φ(x1, . . . , xn)]]) , [[∃xnφ(x1, . . . , xn−1, xn)]] = ∃n([[φ(x1, . . . , xn)]]).

Powiemy, że:- formuła φ(x1, . . . , xn) jest prawdziwa w modelu A gdy [[φ]] = An a jest spełniona gdy [[φ]] 6= ∅- ciąg elementów (a1, . . . , an) ∈ An ma własność opisaną przez formułę φ(x1, . . . , xn) gdy należy dopodzbioru [[φ]] 20.

Semantyka dowolnego zdania φ (formuły bez wolnych zmiennych) to podzbiór zerowej potęgikartezjańskiej A0 czyli - na mocy definicji - zbioru jednoelementowego21. A0 ma tylko dwa podzbiory- zbiór pusty i zbiór A0. Gdy [[φ]] = A0 to mówimy, że zdanie φ jest prawdziwe. W przeciwnymprzypadku jest fałszywe.

Ostatecznie możemy zaproponować taką semantyczną definicję prawdziwości:zdanie języka pierwszego rzędu jest prawdziwe, gdy jest prawdziwe w każdym (skończonym)

modelu tego języka.

Zero metafizyki...

17Aby nieco uprościć ten opis (nie gubiąc wszak istoty rzeczy...) zakładamy - na chwilę! - że w słowniku Σ rozwa-żanego języka nie ma symboli operacyjnych ani stałych.18B → C = ¬B ∪ C.19Patrz (str. 84). Wprawdzie nieco zmieniłem tu oznaczenia, ale nie zmieniłem sensu (wystarczy przyjąć B =

A(n−1)) .20Logicy mówią też, że wtedy formuła φ(x1, . . . , xn) jest spełniona przy wartościowaniu [x1 := a1, . . . xn := an], i

piszą A |= φ(x1, . . . , xn)[x1 := a1, . . . xn := an].21Zerową potęgą liczby jest 1. Zerową potęgą zbioru jest zbiór jednoelementowy.

Page 162: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 161

Kolejna definicja nie wymaga komentarza:

modelem teorii T nazywamy każdy model, w którym wszystkie zdania zbioru T są prawdziwe.

Spełnialność formuł i prawdziwość zdań w pojedynczym skończonym modelu są rozstrzygalne.Tych modeli jest przeliczalnie wiele22. Zatem zbiór zdań, które nie są prawdziwe jest rekurencyjnieprzeliczalny. Gdyby zbiór zdań prawdziwych był też rekurencyjnie przeliczalny, to moglibyśmyrozstrzygać o tak rozumianej matematycznej prawdzie. Niestety, B. Trakhtenbrot23 pokazał, że:

„jeżeli w rozważanym języku pierwszego rzędu mamy choćby jeden symbol relacyjny, którynie jest jednoargumentowy, to zbiór zdań prawdziwych we wszystkich skończonych modelach tegojęzyka nie jest rekurencyjnie przeliczalny”.

Prawdziwość zdań języka pierwszego rzędu definiowana poprzez odwołanie do skończonych modeli niejest dowodliwa. W żadnym hilbertowskim systemie dowodzenia!24

9.4 Teoriomnogościowe modele języka pierwszego rzędu

By powiedzieć, czym jest teoriomnogościowy model języka pierwszego rzędu, wystarczy powtórzyćdefinicję modelu skończonego, pomijając słowo „skończony”.

Niezbyt fascynujące. Wręcz nudne25. Ale ten prosty zabieg jest jednak mniej prosty, niż sięzdaje. A to dlatego, że w modelu nieskończonym - w odróżnieniu od modelu skończonego - zbiórdesygnatów dowolnej formuły nie musi być rozstrzygalny!

Wprowadzając do rozważań o „prawdziwości zdań” modele nieskończone przekraczamy cienką czerwonąlinię między matematyką obliczeń a teoriomnogościową matematyką Cantora i Hilberta. Model przestajebyć „konkretem” w którym o prawdziwości zdań możemy rozstrzygać za pomocą procedur obliczeniowych.Procedur obiektywnych w tym sensie, że niezależnych od języka opisu modelu26.Czy to nie podważa sensu rozważania fundamentalnego problemu prawdziwości zdań w dowolnymteoriomnogościowym modelu?

Więcej o tej zasadniczej różnicy między modelami skończonymi a nieskończonymi powiemy wpodrozdziale „Nominalim Tarskiego”. Ale najpierw przyjrzymy się modelom teoriomnogościowymnieco bliżej.

9.4.1 Jeszcze jedno twierdzenia Godla„Aby badać matematykę, badamy jej przybliżenia wy-rażone w językach pierwszego rzędu” - R. Drake.

Modele skończone to teraz istotnie mniejsza podklasa wszystkich modeli teoriomnogościowychdanego języka. Ponieważ ustaliliśmy, iż „zdanie jest prawdziwe, gdy jest prawdziwe w każdymmodelu”, to zdań prawdziwych jest teraz ... mniej.

Zmieniając definicję modelu zmieniamy pojęcie prawdy... „Zdanie może być prawdą lub fałszemtylko dzięki temu, że jest obrazem rzeczywistości” pisał Wittgenstein. Czy zmieniliśmy „rzeczywistość”?

Prawda definiowana przez odwołanie do modeli skończonych nie jest dowodliwa. Co się zmieni potej „ucieczce do przodu”? Czy teraz możliwa jest wymarzona przez Hilberta równość (semantyczna)prawdziwość = (syntaktyczna) dowodliwość?

22Można je ustawić w kolejkę, ponumerować.23Boris (Boaz) Avraamovich Trakhtenbrot (1920-2016) rosyjski logik pochodzenia żydowskiego.24Zdania dowodliwe tworzą zawsze zbiór rekurencyjnie przeliczalny.25Poloniusz: Cóż czytasz, mości książę? Hamlet: Słowa, słowa, słowa.26Model skończony możemy „włożyć do komputera” i rozstrzygać o prawdziwości zdań za pomocą odpowiednich

programów. Model nieskończony już nie.

Page 163: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 162

Uporządkujmy terminolgię. Przyjmijmy, że (Ax,RFOL) jest pewnym systemem dowodzenia dlalogiki pierwszego rzędu27. Sformułowanie jakiejkolwiek niesprzecznej aksjomatycznej teorii pierw-szego rzędu T to w istocie wskazanie nowego systemu dowodzenia o zbiorze aksjomatów Ax ∪ T .Zbiór T to aksjomaty specyficzne, a zbiór Ax to aksjomaty logiczne tej teorii28.

Dla każdej teorii T która ma teoriomnogościowe modele, można mówić o dwóch rodzajachkonsekwencji:

zdanie φ jest konsekwencją logiczną (syntaktyczną) T , gdy ma dowód w systemie formalnym(Ax ∪ T,RFOL). Piszemy wówczas T ` φ i mówimy, ze zdanie φ jest - w teorii T -dowodliwe.

zdanie φ jest konsekwencją semantyczną T , gdy jest prawdziwe w każdym teoriomnogościowymmodelu teorii T . Piszemy wówczas T |= φ i mówimy, że zdanie φ jest - w teorii T - prawdziwe.

Implikacja (T ` φ) =⇒ (T |= φ) - „to, co dowodliwe, jest prawdziwe” - funkcjonuje pod nazwą„twierdzenia o zgodności”. Zgodność jest niezbędna: jaki sens - poza polityką - ma dowodzeniegłupstw (zdań fałszywych)?29.Twierdzenie o zgodności „obowiązuje” dla dowolnej teorii pierwszego rzędu.

Spełnienie hilbertowskiego postulatu sprawowania finitarnej kontroli nad (teoriomnogościową)matematyką sprowadza się do pytania: czy odwrotna implikacja

T |= φ =⇒ T ` φjest prawdziwa? Jeśli tak jest, to teorię T nazywamy zupełną.

Czy logika pierwszego rzędu jest mocno zupełna tzn. czy dowolna teoria pierwszego rzędu jestzupełna? Odpowiedź jest pozytywna a zawdzięczamy ją ... Godelowi.

Między dwoma twierdzeniami Godla - o niezupełności arytmetyki i zupełności FOL nie ma sprzeczności.Upewnijmy się, że to rozumiemy:Pierwsze twierdzenie mówi, że zdania arytmetyczne prawdziwe w pojedynczym modelu - standardowymmodelu liczb naturalnych - nie muszą być dowodliwe.A twierdzenie o zupełności odniesione do arytmetyki Peano mówi tyle, że każde zdanie prawdziwe wewszystkich modelach tej teorii, ma dowód w PA.To tylko potwierdza, co już wiemy: PA nie jest teorią kategoryczną - ma wiele modeli30.

Oryginalny dowód twierdzenia o mocnej zupełności logiki pierwszego rzędu przedstawiony przezGodla był tak skomplikowany, że zrozumiało go niewielu. Wśród nich zapewne Henkin, który za-proponował własny, oryginalny dowód. W istocie Henkin udowodnił więcej - pokazał, że:

jeżeli teoria jest niesprzeczna, to posiada model teoriomnogościowy.

Czy teoria musi być niesprzeczna? Pytanie na pozór absurdalne: skoro w ramach sprzecznej teorii możnadowieść wszystkiego, to po co się nią zajmować? Jeśli wiemy, że teoria jest sprzeczna, to należy jąporzucić. A jeśli nie wiemy? Godel pokazał, że jesteśmy skazani na taką niewiedzę - niesprzeczność teo-rii (wystarczająco bogatej, czyli zawierającej arytmetykę) jest zawsze względna. Dowód niesprzecznościtakiej teorii musi odwoływać się do innej, której niesprzeczność jest równie wątpliwa31.Czy powinniśmy zajmować się teoriami, których niesprzeczność nie jest pewna? Pytanie pozbawionegłębszego sensu jeśli przypomnieć, że tysiące matematyków codziennie korzysta z teorii mnogości...

27Takich systemów jest wiele. Ich opisy można znaleźć w podręcznikach logiki. Wystarczy też przeszukać internetupod hasłem „first order logic”. Konkretny kształt wybranego systemu nie jest dla nas w tej chwili ważny. Powiedzmytylko, że wszelkie prawa klasycznego rachunku zdań obowiązują w FOL.28Dlaczego tworząc teorię nie dodajemy również „specyficznych” reguły dowodzenia? Nieco upraszczając: w zbio-

rze reguł każdego hilbertowskiego systemu dowodzenia dla FOL jest reguła odrywania A,A→BB

. Dzięki temu każdą„specyficzną” regułę dowodzenia p1...pk

kmożna zastąpić kolejnym aksjomatem specyficznym p1 ∧ . . . ∧ pk → k.

29Kant pisał: Prawda jest zgodnością poznania z jego przedmiotem.. Jeśli „poznaniem” jest dowodzenie w językuteorii a „przedmiotem” - teoriomnogościowe modele, to twierdzenie o zgodności jest realizacją postulatu Kanta.30Oba twierdzenia - o zupełności FOL i niezupełności PA - Godel przedstawił na konferencji we wrześniu 1930 roku

w Królewcu. Pierwsze twierdzenie przedstawił w obecności Hilberta, który - jak się można domyślać - przyjął tenwynik z ogromną satysfakcją. I wyjechał. Tymczasem tuż przed końcem konferencji Godel wystąpił ponownie, tymrazem z twierdzeniem o niezupełności arytmetyki. Może lepiej, że Hilbert wyjechał...

Page 164: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 163

Istotę dowodu Henkina można opisać tak: jeśli teoria T napisana w języku sygnatury Σ mamodel A, to można ją rozszerzyć do maksymalnej i niesprzecznej teorii TA - zbioru wszystkichzdań prawdziwych w A. Co więcej, dla dowolnego zdania postaci ∃x φ(x) ∈ TA istnieje elementaφ ∈ A taki, że formuła φ(x) jest spełniona przy wartościowaniu [x := aφ]. Tym samym A możebyć traktowany jako model języka sygnatury Σ wzbogaconej o nową stałą cφ

32 a zdanie φ(cφ)(otrzymane z φ(x) przez zastąpienie zmiennej x stałą cφ) jest prawdziwe w A.

Henkin odwrócił kierunek myślenia: pokazał, że każdą niesprzeczną teorię T można uzupełnić domaksymalnej niesprzecznej teorii Tm napisanej w języku rozszerzonym o nowe stałe i takiej, żekażde zdanie egzystencjalne ∃x φ(x) w Tm ma „świadka” - stałą cφ taką, że zdanie φ(cφ) ∈ Tm.I zrobił to bez założenia, że teoria T ma model33.Druga część dowodu jest już łatwiejsza(sic!) - Henkin pokazał, jak zbudować model teorii T korzy-stając ze stałych występujących w zdaniach teorii Tm

Jak z twierdzenia Henkina wydedukować zupełność dowolnej teorii pierwszego rzędu?Przyjmijmy, że pewne zdanie φ jest prawdziwe we wszystkich modelach teorii T a nie jest konse-kwencją logiczną tej teorii. Wówczas teoria T ∪ ¬φ jest niesprzeczna34 a więc - na mocy twier-dzenia Henkina - ma model A. Ale w tym modelu byłoby prawdziwe zdanie φ (gdyż A to też modelT ) i jego zaprzeczenie ¬φ. A to jest niemożliwe.

Twierdzenie o mocnej zupełności FOL i twierdzenie Godla-Henkina cieszy zwolenników hilbertowskiejkoncepcji matematyki, gdyż mogą je uznać za dowód dwóch fundamentalnych dla nich równości:

niesprzeczność (teorii) = istnienie (modelu) prawdziwość = dowodliwość

Dodatkową radość sprawia im fakt, że ten dowód wymaga uznania nieskończoności aktualnej.Wszystko się pięknie składa w całość... I tylko ta niezupełność arytmetyki...

Zbiór konsekwencji dowolnej teorii aksjomatycznej T jest częściowo rekurencyjny. To wiemy. Amoże jest on wręcz zbiorem rekurencyjnym? Nie ma tak dobrze. Mówi o tym twierdzenie Churcha:

Logika pierwszego rzędu jest nierozstrzygalna - nie istnieje procedura pozwalająca rozstrzygać,czy dowolne zdanie pierwszego rzędu jest konsekwencją danej teorii T .

Church skorzystał ze znanej nam już metody sprowadzania problemu (o którego nierozstrzygalnościchcemy orzec) do innego, o którym wiemy, że jest nierozstrzygalny. W roli tego drugiego wystąpinieco zmodyfikowany problem stopu: „czy maszyna T zatrzyma się, rozpoczynając pracę z pustątaśmą”35. Idea dowodu: z każdą maszyną Turinga T wiążemy zdanie ψT (w odpowiednio dobranejsygnaturze) które jest tautologią (czyli jest prawdziwa w każdym modelu, lub, równowaznie, po-siada dowód) dokładnie wtedy, gdy maszyna T zatrzyma się rozpoczynając pracę z pustą taśmą.Gdybyśmy potrafili rozstrzygać czy dowolne zdanie ma dowód, to potrafilibyśmy również rozstrzy-gać problem stopu... . Idea dowodu jest prosta, ale pełny dowód polegający na doborze sygnaturyi konstrukcji odpowiedniej formuły - niebanalny36

9.4.2 Ograniczenia języka pierwszego rzędu

Twierdzenia Godla wskazały nieprzekraczalne ograniczenia języka pierwszego rzędu jako narzędziaopisu (nietrywialnej, czyli zawierającej arytmetykę) matematyki.

31Wskazanie teoriomnogościowego modelu danej teorii pierwszego rzędu jest takim „zewnętrznym”, bo odwołują-cym się do teorii mnogości, dowodem jej niesprzeczności.32Wystarczy tę stałą interpretować jako element aφ.33Dowód istnienia rozszerzenia Tm nie ma nic wspólnego z konstrukcją takiego rozszerzenia. Henkin wykorzystał

tu jeden z aksjomatów teorii zbiorów - pewnik wyboru. Gdyby ten dowód był konstruktywny, to moglibyśmy np.wskazać przeliczalny modelu teorii zbiorów (chyba, że jest ona sprzeczna... ).34Gdyby była sprzeczna, to T ∪ ¬φ ` ⊥, czyli T ` ¬¬φ i tym samym T ` φ , wbrew założeniu.35Gdyby ten problem był rozstrzygalny to i problem stopu byłby rozstrzygalny.36Zainteresowanym szczegółami polecam przeszukanie internetu pod hasłem „nierozstrzygalność logiki pierwszego

rzędu” lub „undecidability of FOL”.

Page 165: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 164

Analiza koncepcji modelu teoriomnogościowego pozwala na ujawnienie dalszych. O pewnych jużwspomnieliśmy (twierdzenie Trakhtenbrota, twierdzenie Churcha o nierozstrzygalności FOL). Do-dajmy do tej listy ograniczeń jeszcze dwa.

RównośćGdyby tożsamość uznać za stosunek między tym, co „a” i „b” oznaczają, to(a = b) nie różniłoby się chyba od (a = a) jeżeli tylko (a = b) jest prawdą.Wyrażało by się w ten sposób pewien stosunek rzeczy do siebie samej, mia-nowicie taki, w jakim każda rzecz pozostaje sama do siebie (...)Przez (a = b)chce się pewnie powiedzieć, że „a” i „b” oznaczają to samo, ale wtedy mówisię właśnie o znakach stwierdzając między nimi pewien stosunek.

„Sens i znaczenie” - G. Frege

Zajmijmy się dotąd pomijanymi termami i formułami-równościami termów.W modelach teoriomnogościowych termy - schematy nazwowe - interpretujemy jako funkcje:

semantyką termu o n zmiennych wolnych t(x1, . . . , xn) w modelu posadowionym na zbiorze A jestpewna, definiowana rekurencyjnie, funkcja t : An → A 37.

Semantyką formuły atomowej - równości termów t1(x1, . . . , xn) = t2(x1, . . . , xn) - jest zbiórciągów (a1, . . . , an) ∈ An takich, że elementy t1(a1, . . . , an) i t2(a1, . . . , an) są równe.

[[t1 = t2]] = (a1, . . . , an) ∈ An : t1(a1, . . . , an) = t2(a1, . . . , an)

Niech to nam nie umknie: równość w matematyce teoriomnogościowej nie jest „absolutna” lecz jestpojęciem definiowanym wewnątrz teorii mnogości38.Utożsamianie tej równości z wyimaginowaną, transcedentną równością obowiązującą w matematycznymuniwersum to tylko kolejny przejaw wyobrażenia, że teoria mnogości opisuje owo uniwersum..

Równość to relacja o szczególnym statusie. Jest to uwidocznione w aksjomatyce FOL - są tamzdania-aksjomaty gwarantujące zwrotność, symetryczność, przechodniość i kongruentność równo-ści39 i aksjomat gwarantujący „wymienność” równych termów w formułach: (t1 = t2 → φ(. . . , t1, . . .)↔φ(. . . , t2, . . .) dla dowolnej formuły φ . Dlatego mówiąc o logice pierwszego rzędu używamy częstobardziej precyzyjnego określenia: logika pierwszego rzędu z równością.Czy to uprzywilejowanie równości jest konieczne? Dlaczego nie traktujemy równości jako jednegoz wielu równouprawnionych symboli relacyjnych a jej pożądaną interpretację nie wymusimy przezodpowiednie aksjomaty?Wypisane wyżej aksjomaty tego nie gwarantują40. Dodanie jakichkolwiek nowych aksjomatów pró-bujących wymusić taką interpretację równości też nic nie da. Np. w języku, którego słownik tojeden jedyny dwuargumentowy symbolem relacyjny r niesposób wskazać formułę bez równości,która jest spełniona w modelu jednoelementowym i nie jest spełniona w dwuelementowym modeluA = (a, b, rA), gdzie rA = a, b × a, b.Natomiast formuła ∀x,y x = y jest spełniona tylko w modelu jednoelementowym... .

„Zamierzonej interpretacji” równości nie da się zagwarantować „syntaktycznie”.

37Semantykę najprostszych termów - q(x1, . . . , xn) gdzie q to n-argumentowy symbol operacyjny - determinu-je definicja modelu. Krok rekurencyjny opiszemy tak: gdy t(x1, . . . xn) = q(t1, . . . , tm) , to dla dowolnych ele-mentów a1, . . . , an ∈ A, t(a1, . . . an) = qA(t1(a1, . . . an), . . . , tm(a1, . . . , an) gdzie qA : An → A jest semantyką m-argumentowego symbolu operacyjnego q w rozważanym modelu.38Więcej o tym już wkrótce. Teraz powiedzmy tylko, że teoriomnogościowa równość jest zadekretowana i opisana

w postaci aksjomatu ekstensjonalności..Skoro funkcje-semantyki termów nie muszą być obliczalne to zbiór - semantyka formuły atomowej t1 = t2 w danym

modelu-interpretacji - nie musi być rozstrzygalny ani nawet sprawdzalny. Takiej równości możemy tylko próbowaćdowodzić - w ZFC!.39Patrz podrozdział „Więcej niż przykład - równoważność kontrolowana” - str. 200 .40Gdyby równość w aksjomatyce Peano była tylko relacją spełniającą te aksjomaty, to modelem tej teorii byłby zbiórN z operacjami następnika, dodawania i mnożenia, w którym semantyką „równości” jest relacja mod2 - mmod2nwtw m− n jest liczbą parzystą.

Page 166: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 165

Skończoność modeli teoriomnogościowych

Twierdzenie o zupełności to nie jedyna ważna konsekwencja twierdzenia Henkina. Inna to twier-dzenie o zwartości41.Dowód to konstrukcja finitarna - w jakimkolwiek dowodzie T ` φ wykorzystujemy tylko skończeniewiele aksjomatów teorii T 42. Dlatego sprzeczna teoria T - taka, w której dowodliwe jest zdaniefałszywe - musi zawierać skończoną i sprzeczną podteorię. Odwróćmy to: teoria jest niesprzeczna,jeśli tylko każdy jej skończony fragment jest niesprzeczny. Teraz, dzięki henkinowskiej równości„niesprzeczność teorii = istnienie modelu”, możemy sformułować twierdzenie o zwartości:

Jeżeli każdy skończony fragment teorii T ma model, to i cała teoria T ma model43

Stąd wynika, że każda teoria T , która ma dowolnie duże modele skończone, musi mieć ... modelnieskończony! Wystarczy rozważyć teorię T∞ = T ∪ φn : n ∈ N , gdzie

φn ≡ ∃x1,...,xn ∀i,j¬n xi 6= xj

Zdanie φn jest prawdziwe w modelu A wtedy, gdy ma on więcej niż n elementów. Zatem każdyskończony fragment teorii T∞ ma model. Tym samym - właśnie na mocy twierdzenia o zwartości -cała teoria T∞ ma model. A ten model musi być nieskończony!Przyjmując T = ∅.

skończoność nie jest opisywalna w języku pierwszego rzędu 44

Co więcej, w języku pierwszego rzędu nie potrafimy rozróżniać różnych rodzajów nie-skończoności. Mówi o tym takie oto twierdzenie Lowenheima-Skolema45:

„Jeśli teoria pierwszego rzędu ma jakikolwiek model nieskończony, to ma modele nieskończonedowolnej mocy”.

Uświadomijmy sobie (najprostsze) konsekwencje:- istnieje ciało przeliczalne, które ma wszystkie pierwszorzędowe własności ciała liczb rzeczywi-

stych46,- istnieje obiekt mocy continuum (i każdej mocy większej), który jest modelem aksjomatyki

Peano - łącznie z aksjomatem indukcji!- jeśli teoria mnogości ma model, to ma również model przeliczalny. W tym modelu muszą być...

zbiory nieprzeliczalne. Sprzeczność?47

Twierdzenie Godla o niezupełności pokazało, że język pierwszego rzędu jest zbyt słaby by jed-noznacznie opisywać nieskończone obiekty matematyczne. Twierdzenia Lowenheima-Skolema idziedalej: mówi, że ten język jest „ślepy na kolory nieskończoności”: nie widzi cantorowskiej skali nie-skończoności48.41Wspomnieliśmy już o tym twierdzeniu opowiadając o niestandardowym modelu arytmetyki Peano.42Nie wyprowadzajmy stąd wniosku, że każda teoria może być zastąpiona przez skończoną teorię!43Analogiczne twierdzenie obowiązuje dla logiki zdaniowej - „zbiór formuł zdaniowych jest spełniony, jeśli tylko

każdy jego skończony podzbiór jest spełniony”. Dowód tego twierdzenia wymaga jedynie wykorzystania indukcji ipewnej pomysłowości. Zachęcam. Baaardziej zaawansowanym podpowiem, że ten wynik jest też konsekwencją zwar-tości przestrzeni topologicznej 0, 1ω (przestrzeni Cantora).Większość matematyków kojarzy „zwartość” z topologią: („topologia jest zwarta, jeżeli część wspólna dowolnej nie-skończonej rodziny zbiorów domkniętych jest pusta tylko wtedy, gdy pewna jej skończona podrodzina ma przekrójpusty”). Jeśli oznaczymy przez Mod(T ) klasę modeli teorii T , to twierdzenie o zwartości możemy zapisać tak:

Mod(T ) = ∅ ⇔ istnieje skończony podzbiór T0 ⊂ T taki, że Mod(T0) = ∅44Dokładniej: w języku pierwszorzędowej teorii T nie można sformułować warunku gwarantującego skończoność jej

teoriomnogościowych modeli (co jednak nie znaczy, że teorii mnogości nie można zdefiniować zbiorów skończonych).45Albert T. Skolem (1887 -1963) – matematyk norweski. Leopold Lowenheim (1878 - 1957) - matematyk niemiecki.46są to obliczalne liczby rzeczywiste, których jest przeliczalnie wiele... (patrz przypis na str. 138)47To paradoks Skolema. Wrócimy do niego później.48Logicy mówią, że teoria jest kategoryczna gdy ma jeden - z dokładnościa do izomorfizmu - model. Żadna teoria

pierwszego rzędu posiadająca nieskończony model nie jest kategoryczna. Dlatego mówi się też o teoriach kategorycz-nych w mocy α (gdzie α to liczba kardynalna) - takich, które mają dokładnie jeden model mocy α..

Page 167: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 166

9.5 Modele teoriomnogościowe i nominalizm

Jestem nominalistą (...). Jestem radykalnym anty-platonikiem.Reprezentuję surowy naiwny rodzaj anty-platonizmu (...) . Bar-dzo trudno żyć z tą postawą filozoficzną (...) zwłaszcza, gdy cośzwane teorią mnogości stanowi jego hobby. - A. Tarski49

Wróćmy do pytania: co się właściwie stało, gdy od modeli skończonych przeszliśmy do modeli teo-riomnogościowych?Nie umiemy rozstrzygać o spełnianiu formuł i prawdziwości zdań w nieskończonych modelach teo-riomnogościowych. To każe postawić fundamentalne pytanie: jak rozumieć stwierdzenie „zdanie φjest prawdziwe (w każdym teoriomnogościowym modelu teorii T”)? Odpowiedź wymaga zmianywyobrażenia o tym, czym są modele teoriomnogościowe.

Model teorimnogościowy języka pierwszego rzędu to jego interpretacja w języku teorii mno-gości. Definicja modelu to specyfikacja warunków które musi spełniać taka interpretacja by możnają było uznać za sensowną.

Sensowna interpretacja umożliwia przetłumaczenie aksjomatów teorii T napisanych w przed-miotowym języku, na zdania teoriomnogościowe. To pozwala (a właściwie zmusza) by „prawdziwośćzdania φ” rozumieć - definiować - tak:

„ zdanie φ jest prawdziwe (w każdym modelu teorii T ) gdy jego translacja - zdanie tr(φ) zapisanew języku teorii mnogości - jest dowodliwe w systemie formalnym, w którym obok aksjomatów ZFCjako aksjomaty specyficzne traktowane są translacje zdań-aksjomatów teorii T”.

Popatrzmy jak to działa. Teoria grup Gr to teoria pierwszego rzędu korzystająca ze słownika, któryzawiera dwa symbole: operacji binarnej - „+” i stałej - „0”. Ta teoria to trzy zdania:

- ∀x,y,z x+ (y + z) = (x+ y) + z,- ∀x x+ 0 = 0 ∧ 0 + x = x- ∀x∃y x+ y = 0 ∧ y + x = 0

Jednak większość pracujących matematyków używa takiej definicji: „grupa to dowolny zbiór G wrazz funkcją ⊕ : G×G→ G i wyróżnionym elementem 0 ∈ G takimi, że:

- ∀x,y,z∈G x⊕ (y ⊕ z) = (x⊕ y)⊕ z,- ∀x∈G x⊕ 0 = 0 ∧ 0⊕ x = x- ∀x∈G∃y∈G x⊕ y = 0 ∧ y ⊕ x = 0

Ta „nowa” definicja to zapisana w uproszczony sposób translacja aksjomatów teorii Gr na -nieco wzbogacony - język teorii mnogości50. To wzbogacenie polega na wprowadzeniu dodatkowychstałych G,⊕, 0. Trójka (G,⊕, 0) to interpretacja języka teorii grup - model teoriomnogościowy.

Oznaczmy tak ustalony zbiór zdań - teorię - przez GrSet. Teorie Gr i ZFC+GrSet napisane sąw różnych językach. Można tłumaczyć formuły języka teorii grup na formuły teoriomnogościowe.Można tłumaczyć dowody. I jest tak, że jeśli zdanie Z jest konsekwencją teorii Gr, to jego translacjajest konsekwencją teorii ZFC+GrSet. To, co nazywaliśmy twierdzeniem o zgodności jest w istocieoczywistym wymogiem poprawności translacji.

Twierdzenie o zupełności wysłowimy teraz tak:„jeśli translacja zdania Z ma dowód w ZFC +GrSet, to zdanie Z ma dowód w Gr”.

ZFC +GrSet to postrzeganie teorii grup w „teoriomnogościowym kontekście”. To otwiera możli-wość jej wzbogacania przez dodawanie do niej nowych teoriomnogościowych warunków. Mo-żemy np. zażądać, by stała G reprezentowała zbiór skończony i tym samym zainicjować teorięgrup skończonych - badanie konsekwencji teorii ZFC +GrSet wzbogaconej o ten warunek51. Tak

49Cytuję za J. Wolańskim ([137], str. 183).49Wróć na chwilkę do str. 55.50„Uproszczony”, bo np. wierne tłumaczenie drugiego aksjomatu teorii Gr powinno wyglądać tak:

∀x (x ∈ G)→ (x⊕ 0 = x) ∧ (0⊕ x) = x)51Warunek „skończoności modelu” można opisać w języku teorii mnogości ale nie w języku teorii Gr.

Page 168: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 167

rozszerzony „teoriomnogościowy kontekst” teorii grup powiększa możliwości badawcze, pozwala naudowodnienie „prawd” dotyczących wyłącznie grup skończonych52.O konkretnych teoriomnogościowych modelach teorii grup mówimy wtedy, gdy stałe G,⊕, 0 sądefiniowalne w ZFC. Np. gdy G to zbiór liczb całkowitych, ⊕ to zwykłe dodawanie a 0 to zero.

Podobnie standardowy model arytmetyki to tylko jedna z możliwych interpretacji arytmetykiPeano w ZFC. To model konkretny bo to najmniejszy zbiór induktywny jednoznacznie zdefiniowanyw ZFC53.

Model teoriomnogościowy to nie jest „coś” co jest podobne do modeli skończonych, tylko uwolnione odwymogu skończoności54.Prawdziwość w modelach skończonych oparta na rozstrzygalności jest w pewnym sensie uniwersalna boodwołuje się do (uniwersalnego) pojęcia obliczalności. W matematyce Cantora i Hilberta istnienie toniesprzeczność z aksjomatami ZFC a prawdziwość to dowodliwość w ZFC.

Henkinowski dowód istnienia teoriomnogościowych modeli niesprzecznych teorii pierwszego rzędu to tylkodowód istnienia hilbertowskiego. Argument na rzecz tezy, że teoria mnogości jest (może być) ur-teorią,teorią podstawową dla wszelkich teorii pierwszego rzędu55. Nic więcej.Rzeczywista relacja między prawdziwością i istnieniem a dowodliwością w ZFC jest kwestią pozamate-matyczną.

Postrzeganie modelu teoriomnogościowego jako interpretacji danego języka pierwszego rzędu wjęzyku teorii mnogości zbliża nas do poglądów nominalistów. Tarski pisał:

„(...) rozważając zagadnienie definicji prawdy (...) musimy używać dwóch różnych języków.Pierwszy z nich jest językiem „o którym mówimy” (...) : poszukiwana definicja prawdy stosujesię do zdań tego właśnie języka. Drugi z nich jest językiem w którym „mówimy o” pierwszymi w terminach którego pragniemy skonstruować definicję prawdy dla języka pierwszego.Pierwszy z nich to język przedmiotowy, drugi nazywać będziemy metajęzykiem.” [121]

W matematyce mainstreamowej metajęzykiem dla wszelkich jezyków pierwszego rzędu jest język teoriimnogości a ZFC jest „metateorią”.Nominalizm uwalnia nas od jałowych dyskusji o zależności między „dowodliwością” i „prawdziwością”.Nominalizm jest skromniejszy, mniej zarozumiały niż matematyka Cantora i Hilberta56.

Zdecydowana większość pracujących matematyków nie podziela poglądów nominalistów i po-zostaje przy wyobrażeniu, że modele nieskończone to takie same byty matematyczne jak (rzeczy-wiste) modele skończone. Niby wiemy, że niesprzeczność teorii mnogości (istnienie jej modeli) niejest pewne, ale matematyczną rzeczywistość utożsamiamy z jej modelami. Zbiorowa hipnioza?57 .To postawa większości, ale nie wszystkich. Skolem pisał: „(...) I believed that it was so clear thataxiomatization in terms of sets was not a satisfactory ultimate foundation of mathematics that ma-thematicians would, for the most part, not be very much concerned with it. But, in recent times, Ihave seen (...) that so many mathematicians think that these axioms of set theory provide the ideafoundation for mathematics; therefore, (...) the time has come to publish a critique”[22].

52Klasyfikacja prostych grup skończonych to jedno z największych osiagnięć algebry w XX wieku. Aby uświadomićsobie bogactwo i głębię tej teorii wystarczy wiedzieć, że pełna klasyfikacja tych grup to dzieło ponad stu autorówzawarte w ok. 500 pracach liczących w sumie kilkanaście tysięcy stron (C.Buciński, M.Łuba O klasyfikacji skończonychgrup prostych (http://main3.amu.edu.pl/wiadmat/037-052.cb.wm38.pdf)).53Twierdzenie Godla o niezupełności arytmetyki Peano nominalista odczyta tak: „są zdania arytmetyczne, które nie

mają dowodu w arytmetyce Peano, i takie, że ich interpretacje wyznaczone w modelu wyznaczonym przez najmniejszyzbiór induktywny N mają dowód w ZFC”. Przykładem takiego zdania jest twierdzenie Parisa-Harringtona.55Dodajmy zdanie, które stanie się jasne po lekturze całego tekstu: modele skończone i nieskończone to modele tej

samej teorii w różnych toposach.55Wróć na chwilę na str. 55.57Teoria mnogości to dla większości pracujących matematyków naturalne środowisko w którym żyją i pracują. To

ich „rzeczywistość” i nie bawi ich rozróżnianie, co jest dowodliwe w rozszerzeniu ZFC + GrSet a co w osobnej,niezależnej teorii Gr.

Page 169: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 168

Skolem był matematycznym konstruktywistą58. Czy konstruktywiści też zaproponowali swojądefinicję modelu?Takie próby podejmowano. Logika Herbranda różni się od logiki pierwszego rzędu wyłącznie defini-cją modelu. Modele są tu przeliczalne a każdy element takiego modelu ma swoją nazwę59. Zainte-resowanych odsyłam np. na stronę internetową http://www.cs.uic.edu/ hinrichs/herbrand/html/.Ale nie oczekujmy zbyt wiele, bo - jak piszą Autorzy strony - „(...) part of the motivation forbuilding the website was the frustration brought about by looking for and failing to find generalresults on this logic”.

Pora na pointę: „Prawdę jako relatywną własność zdań pozostających w określonym stosun-ku do rzeczywistości nazywamy prawdą materialną, w odróżnieniu od prawdy charakterystycznejdla języków sformalizowanych nauk dedukcyjnych, której istota wyraża się w spełnianiu funkcjizdaniowej” - wierzę że teraz to zdanie jest bardziej zrozumiałe niż przed lekturą tego rozdziału60.

9.5.1 Dodatek: intuicjonistyczna logika temporalna (tekst roboczy)

The importance of intuitionistic temporal logics inComputer Science and Artificial Intelligence has be-come increasingly clear in the last few years.61

Intuicjonistyczna logika temporalna to - zgodnie z nazwą - swego rodzaju fuzja logiki intuicjoni-stycznej i temporalnej. Tę pierwszą już poznaliśmy. A poznanie drugiej należy rozpocząć od choćbyskrótowego przedstawienia logiki modalnej.(Zdaniowa) logika modalna to rozszerzenie klasycznej logiki zdaniowej. Jej „minimalistyczna” wer-sja to logika K62. Składnia języka tej logiki to rozszerzenie języka klasycznej logiki o dwa nowe(unarne) konstruktory - i ♦ - których zamierzoną interpretacją są stwierdzenia „jest konieczne”() i „jest możliwe” (♦). Dodajemy też nowy aksjomat - (p→ q)→ (p→ q) oraz nową regułędowodzenia:

p

p63

Wskazanie zamierzonej interpretacji konstruktorów i ♦ trzeba traktować z pewną rezerwą. Nie jestprzecież pewne, że wszyscy interpretujemy „konieczność” i „możliwość” tak samo. Na przykład „myślącklasycznie” (dychotomicznie) gotowi jesteśmy uznać równoważność ¬¬p ≡ ♦p . Ale czy jesteśmy tegorównie pewni, gdy odrzucimy prawo wyłączonego środka?64

Jest odwrotnie: to właśnie formalizacja logiki i jej aksjomatyzacja ustala jednoznacznie zależności międzykonstruktorami logicznymi. A jeśli tak, to trudno oczekiwać jednomyślności.I tak powstała dżungla logik... .

Logiki temporalne to pewien rodzaj logik modalnych tworzone po to, by w ocenie wartoscilogicznej zdań uwzględnić czas. Pomińmy jednak (ciekawy) wątek filozoficzny i spróbujmy naszki-cować matematyczną, sformalizowaną wersję tej logiki.A.N.Prior – prekursor logiki temporalnej - zdefiniował tzw. tense logic65 rozszerzył język klasycznejlogiki zdaniowej dodając do jego składni cztery nowe konstruktory:

58Dokładniej: był jednym z pionierów matematycznego finityzmu.59Jeśli w sygnaturze języka znajdą się symbole operacyjne, to nośnikiem modelu Herbranda jest termów domknię-

tych. Na marginesie: zachęcam do zapoznania się z twierdzeniem Herbranda.60M.Wesoły, „Uwagi o arystotelesowskiej koncepcji prawdy”, Studia Filozoficzne 11, s. 117–125, 1977.61To zdanie z pracy Exploring the Jungle of Intuitionistic Temporal Logics, J. Boudou, M Diegue, D.Fernandez-

Duque, P.Kremer udostępnionej w internecie 30.12.2019 roku, na którą trafiłem poszukując wsparcia w próbachzorientowania się w dżungli nieklasycznych logik.62„K” jak Kripke.64W cytowanej na wstępie pracy konstruktor jest kojarzony ze słowem „henceforth” - odtąd natomiast konstruk-

tor ♦ - z „eventually” (ostatecznie).65W języku polskim - logika czasów gramatycznych (prawdopodobnie).

Page 170: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 169

Hp – „było (w przeszłości) zawsze tak, że p”66

Pp – „było kiedyś tak, że p”Gp – „będzie zawsze tak, że p”,Fp – „będzie kiedyś tak, że p”.67

Korzystając z tych konstruktorów łatwo opiszemy kolejne intencjonalnie związane z czasem: „za-wsze” - Ap ≡ Hp ∧ p ∧Gp oraz „kiedyś” - Pp ∧ p ∧ Fp.

Dodamy też nowe prawa - aksjomaty tej teorii:(G(p→ q)→ (Gp→ Gq), H(p→ q)→ (Hp→ Hq)p→ GPp, p→ HFp

i dwie nowe reguły dowodzenia:p

Gp,

p

Hp

(przyjmując tę interpretację zaakceptujemy równoważności Hp ≡ ¬P¬p, Gp ≡ ¬F¬p. Można więcograniczyć się do wprowadzenia dwóch funktorów czasowych - P i F .)

Kiedyś może dokończę.... Wtedy, gdy uda mi się napisać coś o „toposach temporalnych”.

66Tzn. zdanie Hp jest prawdziwe, gdy zdanie p było prawdziwe w każdej chwili w przeszłości. Podobnie należyrozumieć opisy pozostałych konstruktorów.67Również w tym przypadku - jeśli akceptujemy prawo wyłączonego środka! - możemy wyeliminowć dwa z tych

czterech konstruktórów, czyli uznac równnoważności Pp ≡ ¬H¬p , Gp ≡ ¬G¬p.

Page 171: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 10

Pewna szczególna teoria - ZFC

Matematyka jest logiką nieskończonego. Ernst Zermelo.„Set Theory is the mathematical science of the infinite. It studies propertiesof sets, abstract objects that pervade the whole of modern mathematics. Thelanguage of set theory, in its simplicity, is sufficiently universal to formalizeall mathematical concepts and thus set theory, along with Predicate Calculus,constitutes the true Foundations of Mathematics”.

Stanford Encyclopedia of Philosophy

Znamy już wyjątkową rolę przypisaną teorii mnogości (teorii zbiorów) w mainstreamowej ma-tematyce. Pora przyjrzeć się bliżej tej szczególnej pierwszorzędowej teorii.

Aksjomatyczna teoria mnogości nie jest dziełem Cantora1. Cantor operował zbiorami w sposób okreśanydziś jako teoria mnogości. Ujawnienie tych naiwności (np. omawianego wcześniej paradoksu Russella„odkrytego” w 1901 roku) uświadomiło potrzebę ścisłej aksjomatyzacji tej teorii.Pierwszą dojrzałą propozycję aksjomatyzacji przestawił E. Zermelo w 1908 roku.Aksjomaty, które ukształtowały się w wyniku tych prób i zyskały społeczną (matematyków) akceptację,noszą nazwę aksjomatów Zermelo-Fraenkela (ZF ). Miało to miejsce około 1930 roku. Jeśli dodatkowouwzględnimy słynny aksjomat wyboru, to otrzymamy tzw. aksjomatykę ZFC.

Struktura języka teorii mnogości

Słownik języka ZFC to jeden jedyny dwuargumentowy symbol relacyjny „∈”2. Stąd formuły ato-mowe w tym języku to albo x = y albo x ∈ y , gdzie x i y to zmienne przedmiotowe.Relację „∈” zwykliśmy nazywać relacją przynależności3. Jeśli x ∈ y to mówimy: „(zbiór) x jestelementem (zbioru) y” lub (zbiór) x należy do (zbioru) y”4. .

Termin „teoria zbiorów” jest wielce mylący. Ta teoria to pierwszorzędowy opis tych cech relacjiprzynależności które są niezbędne, by ogół obiektów powiązanych tą relacją nazwaćzbiorami.Matematycy nie badają przedmiotów, lecz stosunki między przedmiotami; z ich punktu widzenia daneprzedmioty można zastąpić innymi, jeśli tylko nie zmieni to stosunków między nimi. Nie interesuje ichtreść, a tylko forma - H. Poincare [92].Teorię, która ma być podstawą matematyki, sprowadzono do opisu cech jednej jedynej relacji... . Byćmoże zdecydowało o tym przekonanie o transcedentnym istnieniu idealnego świata matematyki.Idealnego, czyli - jak chcieli Spinoza i Leibniz - wywodzącego się z „jednej podstawowej zasady”.

1Pracę, którą uznaje się za początek jej tworzenia Cantor opublikował w 1874 roku.2Ten symbol po raz pierwszy pojawił się w 1889 w pracy G. Peano.3To jest niewymuszona, lecz zamierzona interpretacja symbolu „∈”. Czy tego chcemy czy nie, to arbitralne przy-

pisanie symbolowi wybranego znaczenia ukierunkowuje (zawęża) nasze myślenie o teorii mnogości i jej modelach.4Elementem zbioru może być tylko inny zbiór.

170

Page 172: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 171

Dominację relacji przynależności potwierdza jeden z aksjomatów ZFC - aksjomat ekstensjonal-ności: (a = b)↔ ∀c (c ∈ a↔ c ∈ b). Równość zbiorów jest wtórna w stosunku do przynależności5.

W słowniku języka ZFC brak stałych i symboli operacyjnych. Stąd w jego warstwie podstawowejnie ma żadnych termów, żadnych nazw. Ale język ZFC ma swą powłokę, która czyni go strawnym,bo zbliża do języka naturalnego6. W tej powłoce pojawiają się nazwy (pojęcia teoriomnogościowe)i formuły nazwowe. Popatrzmy, jak je tworzymy.

Aksjomat zbioru pustego to zdanie ∃x∀y¬(y ∈ x) - „istnieje zbiór, do którego nic nie należy”.Taki zbiór jest jedyny, co pozwala wprowadzić do języka nazwę - stałą „∅”7 . To cukier syntaktycznynp. można teraz niemiłą formułę ∃x(y ∈ x ∧ ∀z ¬(z ∈ x)) zastąpić prostszą - y ∈ ∅.8

Podobnie, korzystając z aksjomatu nieskończoności, uzasadnimy wprowadzenie do języka stałej„N” reprezentującej zbiór liczb naturalnych9.

Aksjomat pary10 umożliwia wprowadzenie dwuargumentowego konstruktora nazw - „ , ”.Napis x, y to formuła nazwowa. Pozwala to tworzyć złożone formuły nazwowe - np. x, x, y11. Stąd np. ∅, ∅ to teoriomnogościowa nazwa a jej skrótem jest napis „2”. Oczywiście 2 ∈ N.

Aksjomat sumy - ∀x∃y∀z (z ∈ y) ↔ ∃t ((t ∈ x) ∧ (z ∈ t)) - i aksjomat zbioru potęgowego -∀a∃s (x ∈ s) ⇔ (∃b (b ∈ a) ∧ (x ∈ b)) - pozwalają na wprowadzenie do języka formuł nazwowychpostaci

⋃(ti : i ∈ x) oraz 2x.

Niewyczerpywalnym źródłem formuł nazwowych jest aksjomat wyróżniania (komprehensji)12:dla dowolnej formuły teoriomnogościowej φ(x, y1, . . . , yk):

∀y1,...,yk∀a∃b∀x ((x ∈ b)↔ (x ∈ a) ∧ φ(x, y1, . . . , yk)).

Ten aksjomat pozwala związać z każdą formułą teoriomnogościową φ(x, y1, . . . , yk) formułę nazwowąx ∈ a : φ(x, y1, . . . , yk)

(zmienne wolne a, y1, . . . yk. to parametry tej formuły nazwowej). Np. napis a × b („iloczyn karte-zjański zbiorów a i b”) to skrót zastępujący złożoną formułę nazwową:

a× b = x ∈ 22a∪b : ∃c∃d c ∈ a ∧ d ∈ b ∧ x = (c, d)„Zbiory”13 z indywiduowymi nazwami są dostępne w tym sensie, że można dla nich formułować teo-riomnogościowe twierdzenia odnoszące się do pojedynczych „zbiorów”. Dlatego mamy twierdzeniao zbiorze liczb naturalnych (rzeczywistych itp.) czy o „zbiorze” wszystkich podzbiorów N. Możnateż formułować twierdzenia dla definiowalnych klas zbiorów - takich, które są identyfikowane przezpewną formułę nazwową. Dlatego w ZFC mamy twierdzenia o własnościach zbiorów przeliczalnych(wśród których jest nieprzeliczalnie wiele zbiorów bez indywiduowych nazw). Na przykład: „iloczyn

5ZFC można też rozpatrywać jako teorię bez równości traktując równość jako „skrót” formuły ∀c (c ∈ a ↔ c ∈b) ∧ ∀d (a ∈ d↔ b ∈ d). To jest zgodne z prawem Leibniza : „dwa obiekty są równe, gdy każdą własność przypisanąpierwszemu z nich można przypisać drugiemu i vice versa”.6O „jądrze” i „powłoce” języka pisaliśmy w rozdziale „Obliczalność” (str 127). „Keep in mind that most ordinary

mathematical proofs are not written in any formal system: they are just written in natural language using acceptedmethods of reasoning” - wpis w dyskusji o twierdzeniu Parisa-Harringtona na forum internetowym.7Tzn. ZFC ` (∀y¬(y ∈ x1) ∧ ∀y¬(y ∈ x2)) → x1 = x2. Podobnym dowodem jednoznaczności należy poprzedzić

wprowadzenie wszelkich indywiduowych nazw do (powłoki) języka ZFC.8Aby uczynić zadość wymogom naukowej powagi, zamiast o dosypywaniu cukru powinniśmy mówić o zachowaw-

czym (konserwatywnym) rozszerzaniu języka - takim, które nie wpływa na pojęcie modelu języka poddanego temuzabiegowi. To, co tu opisujemy to nieformalna prezentacja szczególnego przypadku tzw. rozszerzenia Skolema.9Aksjomat nieskończoności to zdanie ind(x) ≡ (∅ ∈ x)∧∀a (a ∈ x)→ (a∪a) ∈ x . Teoria mnogości definiuje

zbiór liczb naturalnych jako najmniejszy zbiór induktywny.nat(x) ≡ ind(x) ∧ ∀y (ind(y)→ y ⊆ x)

10∀x,y∃z(∀t(t ∈ z)⇔ ((t = x) ∨ (t = y))11Którą zastępujemy skrótem (x, y) i nazywamy parą uporządkowaną12Żadne ze znanych mi objaśnień znaczenia słowa komprehensja nie jest dla mnie przekonujące. Najbardziej podoba

mi się słownikowe objaśnienie angielskiego słowa comprehension: to zasięg a także... rozumienie(!) (dodajmy, że filozofD. Dummett każe rozróżniać „rozumienie” od zrozumienia (understanding)).13Będę przez jakiś czas pisał „zbiory” w cudzysłowie by zbyt szybko nie wrócić do wyobrażeń, że jest to coś innego

niż pojęcie językowe. Ale po pewnym czasie cudzysłowy znikną.

Page 173: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 172

kartezjański dwóch „zbiorów” przeliczalnych jest przeliczalny”.

Formuły nazwowe i nazwy indywiduowe pełnią rolę termów - można je użyć do konstrukcjiformuł. I tak np. w „języku powłoki” poprawny jest napis - równość nazw ∅ = x ∈ 0, 1 : (x =0) ∨ CH, gdzie CH to zdanie-hipoteza continuum14.

Zatrzymajmy się. „Zbiór” x ∈ 0, 1 : (x = 0)∨CH choć ewidentnie skończony, nie jest rozstrzygalny!No bo czy 1 to element tego „zbioru”?Sprzeczność? W żadnym razie. To nie zbiór, to nazwa. W ZFC nie można dowieść że ma on jeden (czy teżdwa) elementy. Nieporozumienie wynika stąd, że utożsamiamy nazwę (pojęcie językowe) z jej desygnatem(którego istnienie wymaga wskazania modelu ZFC).To wszystko.

Dlaczego tyle uwagi poświęcamy językowi teorii mnogości? Dlatego, że ... nie mamy nic innego.Matematycy teoriomnogościowi pracują tylko i wyłącznie w języku teorii mnogości. Wszel-kie dowody istnienia uprawniają jedynie do niesprzecznego rozszerzenia języka budowanego wokół„czystego” języka teorii mnogości. „Istnienie to niesprzeczność” - tak, jak chciał Hilbert15. Dziś,gdy wiemy nieco więcej możemy powiedzieć: istnienie matematyczne to udowodniona - w ZFC -niesprzeczność. Ale czy istnienie dowodu istnienia obiektu oznacza istnienie jego konstrukcji?

Źródła niekonstruktywizmu ZFC

Poprzez aksjomaty dekretujące istnienie pewnych zbiorów teoria ZFC kreuje własną ontologię.Przyjrzyjmy się dwóm z tych aksjomatów.Aksjomat wyróżniania wydaje się oczywisty (i konieczny, jeśli pamiętamy o paradoksie Russella).Ale jeśli φ(x) jest formułą dla której problem spełniania nie jest rozstrzygalny (sprawdzalny) too zbiorze Bφ = x ∈ A : φ(x) wiemy niewiele. Może się oczywiście zdarzyć, że w jednostko-wych przypadkach potrafimy rozstrzygnąć czy element zbioru A należy do Bφ ale nie dysponujemyuniwersalną procedurą pozwalającą rozstrzygająco odpowiadać na to pytanie. Dlatego „myśląc kon-struktywnie” można proponować różne modyfikacje aksjomatu wyróżniania. Np. uznać, że do Bφnależą te elementy A, dla których istnieje dowód przynależości do podzbioru Bφ. Więcej: możnauznać, że elementem jest para - ((a ∈ A) , dowód przynależności a do Bφ)16.

W odróżnieniu od aksjomatu wyróżniania, aksjomat wyboru budził „od zawsze” wątpliwości, choćjego sformułowanie jest proste: dla dowolnej rodziny niepustych i rozłącznych zbiorów (ai : i ∈ I)istnieje zbiór b ⊂

⋃i∈I ai który ma dokładnie jeden wspólny element z każdym ze zbiorów ai.

To jest oczywista oczywistość gdy myślimy o skończonych rodzinach skończonych zbiorów. Alenie w świecie zbiorów nieskończonych - szczególnie gdy patrzy się na jego konsekwencje wsródktórych są np. lemat Kuratowskiego-Zorna17 i twierdzenie o możliwości dobrego uporządkowaniadowolnego zbioru18 . Twierdzenia, które dowodzimy korzystając z tego aksjomatu są niekonstruk-tywne - orzekają o istnieniu pewnych obiektów (np. dobrego porządku w każdym zbiorze) ale niemówią, jak je skonstruować19.

Koronnym dowodem wskazującym na „odpowiedzialność” aksjomatu wyboru za matematycz-ny niekonstruktywizm jest wynik Diaconescu (z 1974 roku), który pokazał, że konsekwencją jegouznania jest... prawo wyłączonego środka: ZFC ` P ∨ ¬P ! 20

14Hipotezę-continuum można zapisać formalnie, jako zdanie pierwszego rzędu języka teorii mnogości. Spróbuj za-pisac tę równość w „czystym” języku ZFC by się przekonać, że tworzenie powłoki języka jest konieczne.15Dodatkowym powodem naszego zainteresowania językiem teorii mnogości jest to, że choć większość matematyków

używa tego go na co dzień, to rzadko kto zastanawia się nad jego strukturą. Nie pierwsi, nie ostatni...„U licha! jużprzeszło 40 lat mówię prozą, nic o tym nie wiedząc” - pan Jourdain w sztuce „Mieszczanin szlachcicem” Moliera.16Takie modyfikacje zbliżają nas do teorii typów (o której, niestety, nie będziemy tu mówić).17Niepusty poset w którym każdy łańcuch jest ograniczony z góry ma element maksymalny.18Tzn. tak, by każde dwa elementy były porównywalne a każdym niepusty podzbiór miał element najmniejszy.19Pomyśl o dobrym uporządkowaniu zbioru liczb rzeczywistych...20Dokładniej: można udowodnić to prawo korzystając z pewnika wyboru i intuicjonistycznej logiki zdaniowej którą

otrzymamy wyrzucajac ze zbioru aksjomatów właśnie prawo wyłączonego środka. wyboru. Docenimy ten wynik w

Page 174: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 173

Przyjrzyjmy się szkicowi dowodu. Dla dowolnego zdania P możemy utworzyć dwa proste zbiory:

A = x ∈ 0, 1 : (x = 0) ∨ P , B = x ∈ 0, 1 : (x = 1) ∨ PNa mocy aksjomatu wyboru istnieje funkcja f : A,B → A ∪ B = 0, 1 taka, że f(A) ∈ A if(B) ∈ B . Stąd wyprowadzimy sprytnie serię prawdziwych zdań:

((f(A) = 0) ∨ P ) ∧ ((f(B) = 1) ∨ P ) f(A) 6= f(B) ∨ P .P → (A = B) P → (f(A) = f(B)) f(A) 6= f(B)→ ¬P .

A z dwóch ostatnich zdań wynika, że P ∨ ¬P [40] 21.

Wyjątkowość wyniku Diaconescu polega na tym, że pokazuje iż aksjomat logiczny - prawo wyłączonegośrodka - jest konsekwencją pewnego aksjomatu specyficznego rozważanej teorii - pewnika wyboru.Logika jest częścią matematyki...22

Ten wynik zaskakuje, jak sądzę, również matematyków. Ale do wyobraźni „zwykłych ludzi”bardziej przemawia wspominane wcześniej twierdzenie Banacha-Tarskiego:„kulę można pociąć naskończenie wiele kawałków, z których można złożyć dwie kule identyczne z kulą wyjściową”. Tow sposób oczywisty niedorzeczne stwierdzenie staje się dowodliwe jeśli tylko uznamy istnienie nie-mierzalnych kawałków kuli... A istnienie zbiorów niemierzalnych to jeszcze jedna konsekwencjaaksjomatu wyboru.Szczęśliwie, nie trzeba znać teorii miary by to zrozumieć - przynajmniej w odniesieniu do pod-zbiorów liczb rzeczywistych. Wystarczy się zgodzić, że miarą zbioru A ⊂ R jest nieujemna liczbarzeczywista i spełnione winny być proste warunki:

- miarą odcinka jest jego długość,- jeśli A ⊆ B, to miara A jest mniejsza-równa mierze zbioru B,- miara sumy rozłącznych zbiorów jest sumą ich miar,- dla dowolnego zbioru A wszystkie zbiory Ar = a + r : a ∈ A, gdzie r to dowolna liczba

rzeczywista, mają tę samą miarę.

Okazuje się, że - jeśli uznajemy aksjomat wyboru! - nie można zdefinować miary zbiorów spełniającejte warunki tak, by każdy zbiór C ⊂ [0, 1] posiadał miarę.Pokażemy to. Podzielmy odcinek [0, 1] na rozłączne i niepuste podzbiory Ai tak, że dwie liczbyrzeczywiste znajdą się w tym samym zbiorze Aj , gdy różnią się o liczbę wymierną23. Korzystając zaksjomatu wyboru utworzymy zbiór C zawierający po jednym elemencie z każdego ze zbiorów Ai.Ten zbiór nie może mieć miary, jest niemierzalny! Wystarczy rozważyć rodzinę „przesunięć” C -zbiorów Cq = r = c+ q : c ∈ C, gdzie q ∈ Q ∩ [−1, 1]. Zbiory Cq są parami rozłączne oraz:

(∗) [0, 1] ⊆⋃q∈[−1,1]C

q ⊆ [−1, 2]

Miary wszystkich zbiorów Cq są równe mierze zbioru C. Gdyby C miał miarę, to z (∗) wynika,że musiała by to być taka liczba dodatnia, że dowolna jej krotność jest nie większa niż 3.A to jest niemożliwe24.

Wniosek: wprowadzając jakąkolwiek miarę (spełniającą opisane warunki) musimy się pogodzićz istnieniem zbiorów niemierzalnych. Teraz już bliżej do twierdzenia Banacha-Tarskiego gdyż „ka-wałki” na które należy pociąć kulę by otrzymać dwie z nią identyczne, są niemierzalne... .

Stąd sugestia, by ograniczyć aksjomat wyboru do przeliczalnych rodzin niepustych i rozłącznychzbiorów (tzw. przeliczalny aksjomat wyboru). J. Dieudonne: „(...) jeśli wyrzuci się pewnik wyborudla zbiorów nieprzeliczalnych, a zachowa się jego przeliczalny wariant, to można osiągnąć ważnecele przy pomocy innych aksjomatów (...). Przykładem jest aksjomat Solovaya (...) który mówi,że wszystkie podzbiory Rn są mierzalne w sensie w jakim rozumiał to Lebesgue. Dla wielu anali-

gdy poznamy teorię toposów.21Formuła ((r ∨ p) ∧ (r → ¬p))→ (p ∨ ¬p) jest prawem intuicjonistycznej logiki zdaniowej.22Twierdzenie Diaconescu wyjaśnia dlaczego nie stworzono - na wzór arytmetyki intuicjonistycznej - intuicjoni-

stycznej wersji ZFC... . Ale istnieje IZF - intuicjonistyczna wersja ZFC pozbawionej aksjomatu wyboru.23Zbiory Ai to klasy abstrakcji relacji równoważności ρ takiej, że aρb gdy różnica a− b jest liczbą wymierną.24Przy odrobinie dobrej woli można powyższe uznać za szkic konstrukcji zbioru Vitaliego.

Page 175: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 174

tyków byłoby to o wiele przyjemniejsze niż ogólny pewnik wyboru25. Przeliczalny pewnik wyboruakceptował też konstruktywista Bishop.

Można też pozostawić aksjomat wyboru w spokoju a miarę zbioru definiować tylko dla a prioriwyróżnionych borelowskich podzbiorów liczb rzeczywistych. Te zbiory „konstruujemy” rekurencyj-nie: punktem wyjścia tek konstrukcji są otwarte odcinki o końcach wymiernych. W każdym krokurekurencyjnym korzystamy z operacji tworzenia sum przeliczalnych rodzin zbiorów i operacji do-pełnienia zbioru26. Wszystkie podzbiory przeliczalne (i ich dopełnienia), wszystkie zbiory otwartei domknięte są borelowskie. Oczywiście są też „nieborelowskie” podzbiory jak np. rozważany przedchwilą zbiór Vitaliego ale, jak piszą w polskiej wikipedii, „intuicyjnie, wszystkie zbiory które moż-na opisać wzorem są borelowskie”27. Na zbiorze BS wszystkich podzbiorów borelowskich możnazdefiniować miarę - funkcję µ : BS → [0,∞] spełniającą wszystkie wymienione wyżej warunki 28.

10.1 Modele ZFCSet theory is a subject which inspires two conflicting emotions (...) On the one hand,everyone is familiar with the basic concepts, so that no technical preparation is necessary.Further, every one has his own personal view about the nature of sets (...), They may feelthat the “official” exposition of set theory, i.e., all of mathematics, using formal systemsand particular axiom systems, has little relevance to their work (...). On the other hand,the existence (...) of surprising results has to some extent shattered the complacency29ofmany mathematicians, and there is an unjustified aura of mystery and awe that tends tosurround the subject. In particular, the existence of many possible models of mathematicsis difficult to accept so that a possible reaction may very well be that somehow axiomaticset theory does not correspond to an intuitive picture of the mathematical universe, andthat these results are not really part of normal mathematics.

P.Cohen - The discovery of forcing30

Teoria zbiorów nie mówi, co jest zbiorem. To trzeba powiedzieć dopiero wtedy, gdy wskazujemy modeltej teorii. Zbiory to elementy takiego modelu31.

10.1.1 ZFC, ZFC− i arytmetyka Peano

Wskazanie modelu ZFC jest ... trudne. Aby zrozumieć, że źródłem trudności jest aksjomat nie-skończoności rozpatrzmy najpierw teorię ZFC− którą otrzymamy z ZFC zastępując ten aksjomatjego zaprzeczeniem. Ta teoria opisuje zbiory skończone32.

Rozpatrzmy nieco bardziej wnikliwie zależności między ZFC, ZFC− i arytmetyką Peano - PA.

25Milioner ma przeliczalnie wiele par butów i przeliczalnie wiele par skarpetek. Stąd wynika, że ma przeliczalniewiele butów i skarpetek. Ale dowód jednego z tych faktów wymaga wykorzystania pewnika wyboru. Którego? [40]26Ta rekurencja jest pozaskończona (po przeliczalnych liczbach porządkowych) więc zbiory borelowskie to twory

„quasikonstruktywne”.27Moc zbioru wszystkich podzbiorów borelowskiech to „zaledwie” continuum - c podczas gdy zbiór wszystkich

podzbiorów R ma moc istotnie większą - 2c. Zbiory borelowskie można analogicznie definować w dowolnej przestrzenitopologicznej. Te zbiory w polskich przestrzeniach topologicznych (str. 40) są przedmiotem badań w tzw. opisowejteorii mnogości która, jak sądzę, jest (była) próbą ograniczenia „skali nieskończoności” w matematyce.28Zainteresowanym polecam hasło: (zewnętrzna) miara Lebesgue’a.28shattered the complacency = rujnuje samozadowolenie30Rocky Mountain Journal of Math., vol.32 no 4., 200231„In Zermelo-Fraenkel set theory, the notion of what consitutes a set is not really defined, but rather is taken

as a basic concept. The Zermelo-Fraenkel axioms describe the properties of sets and the set-theoretic universe. Forinstance, if X is an infinite set, the Power Set Axiom tells us that there is a set, 2X (...). But the other axioms donot tell us very much about the members of 2X , or give any indication as to how big a set this is.” -K.J.Devlin -http://projecteuclid.org/euclid.pl/1235419480.32ZFC− jako niesprzeczna teoria pierwszego rzędu nie może mieć tylko jednego (nieskończonego) modelu - nie

opisuje jednoznacznie tego, co wydaje się wręcz „fizyczne” - uniwersum zbiorów skończonych.

Page 176: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 175

Najmniejszy zbiór induktywny to teoriomnogościowy model PA - odwołując się do tego zbioruumiemy przetłumaczyć formuły arytmetyczne na teoriomnogościowe tak, że tłumaczenia aksjoma-tów Peano są dowodliwe w ZFC. Ponieważ obie teorie są pierwszorzędowe33, to tłumaczenie zdaniaarytmetycznego dowodliwego w PA jest dowodliwe w ZFC:

PA ` φ −→ ZFC ` tr(φ)

Tak należy rozumieć stwierdzenie, że teoria mnogości jest rozszerzeniem arytmetyki.To wiemy. A jeśli nawet nie wiemy, to się specjalnie nie dziwimy. Ciekawsze jest to, że istnieje

„translacja odwrotna” - z języka teorii zbiorów do języka arytmetyki.Pomysł jest zaskakująco prosty: każda liczba naturalna ma rozwinięcie dwójkowe: n = a020+a121+a222 + . . . + ak2k. To pozwala określić taką relację na zbiorze liczb naturalnych: „m n wtedy,gdy na m-tym miejscu binarnego rozwinięcia liczby n jest jedynka” - np. 2 5, ale ¬(1 5) gdyż5 = 1 · 20 + 0 · 21 + 1 · 22.. Relacja „” jest rozstrzygalna, czyli można ją opisać za pomocą formułyarytmetycznej (o dwóch zmiennych wolnych). Przypisując atomowej formule teoriomnogościowej„x ∈ y” formułę arytmetyczną „x y” umożliwiamy tłumaczenie języka teorii mnogości na językarytmetyki.

Ta translacja byłaby tylko ciekawostką, gdyby nie to, że po tym tłumaczeniu aksjomaty teoriiZFC− są dowodliwe w PA [54]!

Każde teoriomnogościowe twierdzenie dotyczące zbiorów skończonych (niekorzystające z aksjomatu nie-skończoności) można sformułować w języku arytmetyki i dowieść korzystając z aksjomatyki Peano.Arytmetyka to matematyka zbiorów skończonych34..

Istnienie tej translacji oznacza, że w każdym modelu PA możemy zbudować model ZFC−.Matematyk konstruktywista powie tak: „teoria ZFC− posiada model budowany niezależnie odteorii mnogości. Jest nim konstruktywnie definiowany zbiór liczb naturalnych wraz z relacją ”.

10.1.2 Kłopoty (to moja specjalność)...

Wskazanie modelu ZFC jest trudne... .Już wiemy, że przyczyną kłopotów ze wskazaniem teoriom-nogościowego modelu ZFC jest akceptacja aktualnej nieskończoności.

Skoro tak, to może trzeba „zapomnnieć” o tym problemie? Nic z tych rzeczy. Jeśli wierzymy,że pierwszorzędowa teoria ZFC jest niesprzeczna, to - na mocy twierdzenia Godla-Henkina - musimieć teoriomnogościowy model: jego istnienie jest równoważne niesprzeczności ZFC. A to jużnie jest temat do żartów...Model teoriomnogościowy to para (A,∈A), gdzie A to zbiór, a „∈A” to relacja binarna na zbiorzeA wybrana tak, by spełnione były wszystkie aksjomaty ZFC. Wówczas elementy zbioru A możemynazwać zbiorami - w tym modelu.

Ale A ma też być zbiorem, czyli elementem innego modelu teorii ZFC!

„Innego”, bo zbiór A nie może być swoim własnym elementem. Wyklucza to jeden aksjomatów ZFC -aksjomat regularności: „każdy niepusty zbiór zawiera (jako element) zbiór, który jest z nim rozłączny”:

∀x(x 6= ∅ ⇒ ∃y(y ∈ x ∧ y ∩ x = ∅))Ten aksjomat nie jest intuicyjnie oczywisty. Ale to z niego wynika, iż żaden zbiór nie zawiera samegosiebie jako elementu35..33Czyli w obu przypadkach korzystamy z tych samych aksjomatów logicznych i reguł dowodzenia.34Tę translację wykorzystano by pokazać, że twierdzenie Parisa-Harringtona nie ma dowodu w PA. Relację między

PA i ZFC można postrzegać jako ilustrację hilbertowskiego podziału matematyki na „realną” i „idealną”: dowodyteoriomnogościowych twierdzeń nieodwołujących się do nieskończoności są możliwe w PA, ale w ZFC są „bardziejeleganckie”. Warto by to stwierdzenie poprzeć eleganckim przykładem elegancji. Ale nie potrafię.35Jedynym elementem zbioru a jest a. Gdyby a ∈ a, to jedyny element zbioru a nie jest z nim rozłączny. Ten

aksjomat pozwala też uniknąć paradoksu Russella.

Page 177: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 176

Aby wskazać jakikolwiek teoriomnogościowy model ZFC musimy dysponować innym modelemtej teorii ... . Uh Houston, we’ve had a problem...36 .

Universum von Neumanna

Całokształt naszej tzw. wiedzy (...) jest tworemczłowieka i styka się z doświadczeniem tylko wzdłużswoich krawędzi - W.V.Quine

Pracujący matematyk powie: przecież mamy uniwersum von Neumanna37.Przyjrzyjmy się sprawie bliżej. Osnową konstrukcji von Neumanna są liczby porządkowe. Jakwszystko w tym świecie, te liczby to „zbiory”38. Najprostsze spośród nich to liczby naturalne.Każda liczba porządkowa α ma swój następnik - liczbę α∪α. Liczby - następniki to liczby izolo-wane. Pozostałe to liczby porządkowe graniczne. Taką liczbą jest np. ω - „zbiór” wszystkich liczbnaturalnych. Istnieją liczby porządkowe ω + 1, ω + 2, . . . , ω + ω, ω · ω, . . . ωω, . . .39.

Ale liczby porządkowe nie tworzą „zbioru”. To paradoks Burali-Fortiego: gdyby przyjąć, że ist-nieje „zbiór” wszystkich liczb porządkowych Ord , to „zbiór” γ =

⋃Ord byłby liczbą porządkową.

Stąd γ ∈ γ , a to przeczy aksjomatowi regularności.

Uniwersum von Neumanna V to wielkość graniczna, aproksymowalna przez „zbiory” V0 ⊆ V1 ⊆· · ·Vα ⊆ · · · indeksowane liczbami porządkowymi. Zbiory Vα definiowane są „rekurencyjnie”:

V0 = ∅, Vα+1 = 2Vα , Vβ =⋃α∈β Vα (dla liczby granicznej β)

Kusi, by napisać(∗) V =

⋃α∈Ord

gdzie Ord to kolekcja wszystkich liczb porządkowych.Skoro jednak Ord nie jest „zbiorem”, to i V nie jest „zbiorem”40.

Dla tak opisanej klasy V dowodzi się twierdzenia, które ma potwierdzać, że zasługuje on na mianouniwersum matematyki teoriomnogościowej - każdy „zbiór” należy do V .

Jedyną wadą V jest to, że jest zbyt dużym obiektem, by być zbiorem...Wszystko się pięknie ułożyło.... Skąd więc wątpliwości?

Ta naracja prowadzona jest w duchu matematycznego realizmu (platonizmu). A przecież powie-dzieliśmy tylko tyle, że w ZFC można dowieść kilku twierdzeń:

ZFC ` dla każdego „zbioru”-liczby porządkowej α istnieje „zbiór” Vα o określonych własnościachZFC ` „każdy „zbiór” jest elementem pewnego „zbioru” Vα:ZFC ` -nie istnieje „zbiór” liczb porządkowych.

Użycie frazy „istnieje zbiór Vα” sugeruje, że udowodniliśmy istnienie pewnych zbiorów.Nic z tych rzeczy: pokazaliśmy tylko, że w każdym (teoriomnogościowym) modelu ZFC możnawyróżnić zbiory Vα o opisanych własnościach. Konstrukcja von Neumanna wzbogaca naszą wiedzę owszelkich potencjalnych teeoriomnogościowych modelach ZFC: każdy taki model ma strukturę od-wzorowującą hierarchię „zbiorów” VαAle w ten sposób nie udowodniliśmy istnienia jakiegokolwiek teoriomnogościowego modelu ZFC!

36„Huston, mamy problem” - to słowa astronauty J.Swigerta po tym, gdy na pokładzie Apollo 13 wybuchł pojemnikz tlenem...37Na marginesie: niektórzy - np. K. Wójtowicz w pracy O hipotezie continnum (Zagadnienia Filozoficzne w Nauce

XXII, 1998 (35-52) - przypisują tę konstrukcję E. Zermelo.38Liczba porządkowa to „zbiór” α, który jest tranzytywny - ∀y,z z ∈ y ∧ y ∈ α→ z ∈ α - liniowy - ∀x,y x, y ∈ α→

(x ∈ y)∨(y ∈ x) i dobrze ufundowany - ∀y y ⊆ α→ ∃z z ∈ y∧∀t t ∈ y → ¬(t ∈ z). Własność „być liczbą porządkową”jest definiowalna w języku teorii mnogości.39Dodajmy, że dowód istnienia np. liczby ω + ω wymaga użycia niewspominanego dotąd aksjomatu zastępowania.40ZFC gwarantuje jedynie istnienie sumy rodziny „,zbiorów” indeksowanej przez „zbiór”. Równość (∗) należy

czytać tak: zbiór należy do klasy V dokładnie wtedy, gdy należy do pewnego „,zbioru” Vα.

Page 178: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 177

Czy to oznacza, że użycie terminu „uniwersum” w odniesieniu do tej konstrukcji jest „mylnymbłędem”? Nie sądzę.

Wystarczy przyjąć punkt widzenia nominalistów by uznać, że klasa V jest modelem ZFC. Ale niejest to model teoriomnogościowy (w sensie Tarskiego). To model wewnętrzny (inner model) wykreowanywewnątrz języka ZFC41.Tak więc - w pewnym uproszczeniu - modelem ZFC jest ... ZFC (dla nominalistów).

Matematyczne uniwersum nie jest rzeczywistością - ani fizyczną, ani transcedentną. To część„świata intelektualnego”42. Wyznający ten pogląd nominaliści nie mają żadnego problemu z ak-ceptacją modelu wewnętrznego.

Wychowanym w duchu platońskiego realizmu teoriomnogościowcom konstrukcja von Neumannastwarza pewien „psychologiczny komfort”, ułatwia budowanie wyobrażenia uniwersum zbiorów.Z ulgą przyjmują do wiadomości, że jeśli do aksjomatów ZFC dodać jeszcze jeden dekretującyistnienie tzw. silnie nieosiągalnych liczb porządkowych większych niż ω, to dla każdej takiej liczbyα, Vα jest modelem ZFC - uniwersum Grothendiecka43.

Jedno jest pewne: konstrukcja von Neumanna nie wnosi nic - lub niewiele - do dyskusji oniesprzeczności ZFC. „The question of the formal consistency of ZFC must remain a matter offaith unless and until a formal inconsistency is demonstrated”.Z niesprzecznością ZFC mamy większy kłopot niż się zdaje na pierwszy rzut oka. To, co już wiemypozwala bowiem na przyjęcie do wiadomości takiego twierdzenie:

„jeśli teoria ZFC jest niesprzeczna, to ma model U , w którym można wskazać przeliczalnyzbiór M , który jest również modelem ZFC” [136]44.

Dowodząc tego twierdzenia pokazujemy też, że:

- każda liczba porządkowa w M jest liczbą porządkową w U , ale nie odwrotnie - liczb porząd-kowych w M jest istotnie mniej niż w U45,

- podzbiory zbioru A w M to zbiory postaci B∩M , gdzie B jest podzbiorem A w U - podzbiorówdowolnego zbioru A ∈M jest istotnie mniej, niż podzbiorów tego samego zbioru w U .

W konsekwencji, konstrukcja von Neumanna w małym modelu M jest „krótsza i chudsza” niż wdużym. „Krótsza”, bo liczb porządkowych wykorzystanych w konstrukcji VM =

⋃VMα jest mniej

niż w konstrukcji V U =⋃V Uα . „Chudsza”, gdyż VM

α+1 = 2VαM = 2VαU ∩M ⊂ · · · ⊂ Vα+1U

Wnioski? Zachęcam do prób formułowania własnych. Podsumowanie? Oto wypowiedź, która -moim zdaniem - genialnie ujmuje istotę problemu.

„Kiedy ktoś proponuje teorię dotyczącą jakiegoś typu przedmiotów, jesteśmy skłonni wyobrażaćsobie, że nasze zrozumienie jego słów będzie przebiegało w dwóch etapach: po pierwsze, musimyzrozumieć czym są te przedmioty; po drugie, musimy pojąć, co mówi o nich teoria. Tak jednak niejest, bowiem

„zrozumienie czym są przedmioty, jest w głównej mierze po prostu opanowaniemtego, co mówi o nich teoria” - W.V.Quine46

41„An inner model is a definable proper class that is a model of ZF (such that every subset of it is a subset ofa member of it).” [40]. Definiowalne klasy to te, które są wyznaczone przez teoriomnogościowe formuły. Formalnądefinicję wewnętrznego modelu można znaleźć np. w [70].42Tak ładnie napisał Yu.I. Manin w podręczniku A Course in Mathematical Logic.43To dodatkowe założenie jest niesprzeczne z ZFC w tym sensie, że jeżeli tylko ZFC jest niesprzeczna to i teoria

wzbogacona o ów dodatkowy aksjomat jest niesprzeczna. To jest wynik Godla. To jest ładna ilustracja wcześniejszegostwierdzenia: „w ZFC nie można dowieść niesprzeczności tej teorii ale można to zrobić w teorii bogatszej”.44To - po części - wynika z twierdzenia Lowenheima-Skolema. Zbiorami modelu M są te zbiory z modelu U , które

są elementami M . „Duży” model U , zawiera „mały”, przeliczalny model M . W [136], to twierdzenie jest punktemwyjścia do omówienia metody forcingu P. Cohena.45Definicja liczb porządkowych nie przesądza, że w każdym teoriomnogościowym modelu musi być ich „tyle samo”!46Willard Van Orman Quine (1908-2000) - amerykański filozof nauki. Zainteresowanym polecam obszerną informa-

cję na temat poglądów Quine’a w polskiej wikipedii.Cytat zaczerpnąłem z artykułu „Słowo i przedmiot”).

Page 179: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 178

Zamknięci w teoriomnogościowym raju zapominamy, że uprawianie matematyki jest jedną z wielu ak-tywności człowieka, jedną z wielu dziedzin nauki. Uczestniczymy w tej grze nie jako doskonały „podmiotpoznawczy” ale jako gracz, którego zalety, wady i ograniczenia wpływają na rezultat tego działania.

Na marginesie: o co chodzi w twierdzeniu Cantora?

Zbiór liczb naturalnych jest w obu opisanych modelach - „małym ” M i „dużym” U - ten sam. Alezbiory potęgowe - 2NM w M i 2NU w U są istotnie różne.Ten pierwszy - widziany w modelu U - jest przeliczalny. A postrzegany wewnątrzM - nieprzeliczalny.

A więc jak? Można „ponumerować” elementy zbioru 2NM czy nie?To pytanie nie ma matematycznego sensu. Twierdzenie Cantora nie mówi o absolutnym numerowaniuale o równoliczności zbiorów w danym modelu ZFC (czyli o istnieniu odpowiednich bijekcji). W M niemamy bijekcji między zbiorami N i 2NM a taka bijekcja jest w U ... .Nic więcej nie można powiedzieć. Nic więcej nie wolno powiedzieć.To jest ostrzeżenie, by wyników teoriomnogościowych nie interpretować „życzeniowo” (nadmiarowo)...

10.1.3 Twierdzenie Łosia

Dowód „istnienia” pary modeli U i M jest zbyt skomplikowany bym odważył się go tu przedsta-wiać. Szczęśliwie można wskazać twierdzenie, które równie efektownie ujawnia subtelności teoriimnogości. To twierdzenie Łosia.

W bibliotece Wydziału Matematyki i Informatyki Uniwersytetu M. Kopernika w Toruniu można obejrzećkarykaturę prof. Jerzego Łosia, na której został on przedstawiony jako człowiek z głową w chmurze znapisem „abstrakcja”.Czym sobie na to zasłużył? Prawdopodobnie jest to związane z jego słynną konstrukcją ultraproduktumodeli i twierdzeniem z nim związanym. Spróbujemy opowiedzieć o tym znakomitym wyniku i jego roliw rozważaniach dotyczących matematycznego uniwersum.

Preludium

Twierdzenie Łosia, na pozór, nie brzmi sensacyjnie: mówi o tym, że dowolny model języka pierw-szego rzędu A można rozszrzyć, zanurzyć w „dużo większy” model AU , który ma dokładnie te samepierwszorzędowe własności. Ale zmienimy zdanie, gdy poznamy konsekwencje tego twierdzania.

Zaczniemy od małej wprawki. Matematycy mówią, że dwa ciągi liczb naturalnych (ni : i ∈ N) oraz(mi) - są „równe prawie wszędzie” gdy ni = mi zawsze, poza skończoną liczbą przypadków:

(ni) =pw (mi) wtw gdy zbiór i ∈ N : ai 6= bi jest skończony.np. ciąg (1, 2, 3, 4, 4, 4, . . .) i ciąg (3, 5, 1, 4, 4, 4, 4, . . .) są równe prawie wszędzie.)

Z każdym ciągiem (ni) zwiążemy teraz nową „jedność” - zbiór oznaczany przez [(ni)] i złożony ztych ciągów, które są mu równe prawie wszędzie:

[(ni)] = (mi) : (ni) =pw (mi)oczywiście ciągi równe prawie wszędzie wyznaczają tę samą nową „jedność” - np. [(1, 2, 3, 4, 4, 4, . . .)] =[(3, 5, 1, 4, 4, 4, 4, . . .)] .Oznaczmy przez Nks zbiór tak zdefiniowanych „jedności”47.

Możemy teraz wykorzystać działania na zbiorze liczb naturalnych do określenia (nazywanychtak samo) działań na elementach zbioru Nks. Np. dodawanie zdefiniujemy tak:

[(ni)] + [(mi)] = [(ni +mi)]

np. [(1, 2, 3, 4, . . .)] + [(2, 4, 6, 8 . . .)] = [(3, 6, 9, 12 . . .) .

Możemy też „przenieść” na zbiór N sk relację „mniejsze-równe”:

[(ni)] ¬ [(mi)] wtw gdy zbiór N \ i ∈ N : ai ¬ bi jest skończony,

47Matematycznie: relacja ”=pw” to równoważność, a Nks to wyznaczony przez nią zbiór ilorazowy.

Page 180: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 179

W ten sposób rozszerzyliśmy standardowy model arytmetyki Peano - strukturę (N,+, ·,¬). Nowastruktura jest istotnie większa.

Jeśli zrozumieliśmy istotę tej konstrukcji to zgodzimy się, że można ją przeprowadzić dla do-wolnego modelu języka pierwszego rzędu A = (A, (qA), (rA), (cA)):

- na zbiorze ciągów elementów A określamy relację „równości prawie wszędzie”: (ai) =pw (b1) wtwgdy zbiór i ∈ N : ai = bi jest koskończony48 ,- tworzymy zbiór Aks którego elementami są zbiory [(ai)] = (bi) : ai =pw bi- przenosimy wszystkie operacje i relacje i stałe z modelu A na zbiór Aks w sposób uprzednioopisany49 .Tak zbudujemy nowy, większy model Aks.

Załóżmy, że A jest modelem pewnej teorii pierwszego rzędu. I zapytajmy: czy nowy model Aksjest też modelem tej teorii?Odpowiedź jest ... negatywna. Ale wystarczą niewielkie (sic!) zmiany, by opisana transformacjaA Aks nie wyprowadzała poza klasę modeli tej teorii - wystarczy zastąpić filtr zbiorów koskończonychprzez ultrafiltr.

Ultrafiltry i ultrapotęgi

Czym jest ultrafiltr? Przekrój (część wspólna) dwóch koskończonych zbiorów jest koskończo-ny. Dowolny zbiór zawierający w sobie zbiór koskończony jest koskończony. To znaczy, że rodzinawszystkich koskończonych podzbiorów liczb naturalnych jest filtrem50. Natomiast ultrafiltr, to każ-dy filtr U spełniający dodatkowy warunek: dla dowolnego zbioru A ⊆ N, albo A należy do U albojego dopełnienie - zbiór N \A należy do U .Filtr zbiorów koskończonych nie jest ultrafiltrem gdyż np. ani zbiór liczb parzystych ani zbiór liczbnieparzystych nie jest (ko)skończony. Ale ten filtr - jak każdy filtr - można powiększyć, zanurzyć wultrafiltr.

Przykrą okolicznością jest to, że nie potrafimy wskazać żadnego ultrafiltru!Skąd więc pewność, że istnieją? Mają ją ci, którzy akceptują aksjomatykę teorii zbiorów wraz z aksjoma-tem wyboru. To ten aksjomat gwarantuje, że dowolny filtr można rozszerzyć do ultrafiltru51.

Powtórzymy teraz opisaną transformację A Aks zastępując filtr zbiorów koskończonych za-wierającym go ultrafiltrem U . Otrzymany w ten sposób nowy model AU to ultrapotęga A. Możemyteraz sformułować

Twierdzenie Łosia: „model A i jego ultrapotęga AU są elementarnie równoważne”

co oznacza, że dowolne zdanie pierwszego rzędu jest prawdziwe w modelu A dokładnie wtedy, gdyjest prawdziwe w modelu AU - gdy A jest modelem teorii T , to i AU jest modelem T .

Model A i jego ultrapotęga - model AU - są nierozróżnialne w języku pierwszego rzędu. Różne są tylkoich nośniki - zbiory, na których są posadowione.Ktoś zirytowany nagromadzonymi tu zawiłościami i powierzchownością opisu może oczekiwać, że zarazzilustruję tę konstrukcję w prosty sposób, np. zakładając, że model A jest skończony. Płonne nadzieje: wtakim przypadku ta konstrukcja się trywializuje - AU = A.Konstrukcja Łosia to czysta abstrakcja - nie ma sensu bez akceptacji nieskończoności (i pewnika wyboru).

48To taka mała innowacja: zbiór A ⊂ N jest koskończony, gdy jego dopełnienie - zbiór N \ A - jest skończony. Zautrudnienia przepraszamy.49Np. gdy qA to operacja dwuargumentowa w A , to q([(ai)], [(bi)]) = [(qA(ai, bi)].50Nazywanym filterm Frecheta. O filtrach wspomnieliśmy wcześniej, dyskutując o kontinuum.51Ultrafiltry to maksymalne (względem relacji zawierana) filtry. W dowodzie istnienia makshymalnych filtórw -

ultrafiltrów - korzystamy z lematu Kuratowskiego-Zorna.

Page 181: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 180

10.2 Konsekwencje twierdzenia Łosia

Ten na pozór czysto techniczny wynik jest źródłem wielu odkrywczych zaskoczeń52. Zacznijmy odnajprostszego. Oznaczmy przez NU ultrapotęgę zbioru N względem pewnego właściwego ultrafiltruU53. NU jest modelem arytmetyki Peano.

Elementy NU są wyznaczone przez ciągi liczb naturalnych - (n0, n1, n2, . . .) Ciągi stałe -(n, n, n, . . .) - wyznaczają liczby standardowe. Ale oprócz nich w NU jest nieprzeliczalnie wiele liczbniestandardowych. Taką liczbą wyznacza np. ciąg (0, 1, 2, . . .) .Każda liczba niestandardowa jest większa od wszystkich liczb standardowych.

Zero jest liczbą standardową. Następnik liczby standardowej jest standardowy. To zdaje się przeczyćpeanowskiemu aksjomatowi indukcji, bo przecież podzbiór liczb naturalnych o tych własnościach powinienbyć zbiorem wszystkich takich liczb...Ale zasada indukcji opisana w aksjomatyce Peano dotyczy jedynie podzbiorów arytmetycznych!Nie ma tu żadnej sprzeczności. Jedyne, co możemy stĄD wywnioskować, to stwierdzenie, że pojęcie „liczbastandardowa” nie jest definiowalne języku arytmetyki... .I choć to przeczy naszej intucji, można pogodzić zasadę indukcji z nieprzeliczalnością zbioru NU ...

Obiekt NU istnieje tylko w „hilbertowskim sensie” - NU to pojęcie języka ZFC niesprzeczne z aksjoma-tami tej teorii. Pamiętajmy o tym kontynuując lekturę tego podrozdziału54.

Zastąpmy liczby naturalne rzeczywistymi i rozważmy ultrapotęgę RU . Tu też można wyróżnićstandardowe - klasy ciągów stałych [(a, a, a, . . . a)]. . Wśród niestandardowych liczb rzeczywistychmożna wyróżnić dwie podklasy :

- „nieskończenie duże” - większe od wszystkich liczb standardowych. Taką liczba jest np. [(1, 2, 3, . . .)],- „nieskończenie małe” - niestandardowe liczby dodatnie mniejsze od wszystkich standardowychliczb dodatnich. Taką liczbę wyznacza ciąg (1, 1

2 ,13 , . . .)

R można zanurzyć w RU : a a∗ = [(a, a, . . .)]. Liczb w RU jest „więcej”.Konstrukcja Dedekinda liczb rzeczywistych miała wypełnić wszelkie luki między liczbami wymiernymina prostej rzeczywistej. Zatem po dorzuceniu liczb niestandardowych też ich nie powinno być. A jednak:wystarczy pomyśleć o przekroju wyznaczonym przez parę zbiorów z których jeden składa się wszystkichliczb ujemnych i nieskończenie małych dodatnich a drugi to jego dopełnienie55.Metafora geometryczno-liczbowa - utożsamienie liczb z punktami prostej- jest tylko metaforą... .

Liczb w RU jest więcej. Ale (pierwszorzędowe) własności tych matematycznych obiektów - R iRU - są dokładnie takie same56. Czy struktura RU to tylko ciekawostka?W drugiej połowie XVII wieku Leibniz i Newton budowali podstawy analizy matematycznej ko-rzystając bez większych skrupułów z liczb nieskończenie małych: „liczba γ jest nieskończenie mała,jeżeli −a < γ < a dla dowolnej liczby rzeczywistej a > 0”. Leibniz zakładał, że wokół każdejliczby rzeczywistej rozciąga się monada - chmura złożona z liczb, które nie są rzeczywiste, ale sąnieskończenie bliskie a - „infinitely close to a”57.

52Lub zaskakujących odkryć.53Ultrafiltr jest właściwy gdy ma w nim żadnego zbioru skończonego.54Wystarczy wpisać w internecie hasło „ultraprodukt” by przekonać się, jak wiele uwagi matematycy - nie tylko

logicy i algebraicy - poświęcają temu „nieistniejącemu” obiektowi.55Przypomnijmy: przekrój - para odpowiednich zbiorów (A,B) wskazuje lukę, gdy zbiór A nie ma elementu naj-

większego a zbiór B - najmniejszego (str.31). Pojawienie się nowych luk w RU to jedynie dowód, że „ciągłość” - taka,jaką definiuje Dedekind - nie jest własnością, która można opisać w języku pierwszego rzędu.56Istnienie nieskończenie małych liczb w RU dowodzi, że nie da się sformułować prawa Archimedesa - ∀x∈R∃n∈N n ·

x > 1 w języku pierwszego rzędu... .57Termin „monada” nie jest wewnętrznym pojęciem matematyki. To centralne pojęcie filozoficznej koncepcji Leib-

niza: „Tam zaś, gdzie nie ma części, nie jest możliwa ani rozciągłość, ani kształt, ani podzielność. Monady te są tedywłaściwymi atomami natury i jednym słowem pierwiastkami rzeczy.” (G. W. Leibniz, Monadologia).. Leibniza mogłozainspirować wynalezienie pod koniec XVI wieku mikroskopu co odkryło niedostępny wcześniej świat „nieskończeniemałych” obiektów. Bezzasadna konfabulacja? H. Keisler wyjaśniając w [55] podstawowe pojęcia analizy niestandar-dowej używa terminu mikroskop gdy mówi o monadach i teleskop - gdy mówi o ... galaktykach (galaktyka liczby a to

Page 182: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 181

Porządkując matematykę twórcy teorii mnogości zarządzili jej arytmetyzację - budowę wszelkichzbiorów liczbowych „na bazie” liczb naturalnych i za pomocą konstruktorów wskazanych w aksjo-matach ZFC. Tak wprowadzono do matematyki teoriomnogościowej liczby całkowite, wymierne irzeczywiste. Wydawało się, że konstrukcja tych ostatnich zaspokaja wszelkie oczekiwania - za ichpomocą zdefiniowano matematyczne continuum i uprawomocniono geometryczno-liczbową meta-forę prostej rzeczywistej. A gdy Weierstrass zaproponował swój precyzyjny ε-δ formalizm z ulgąogłoszono, że „nieskończenie małe” (których Leibniz nigdy zadowalająco nie opisał formalnie) sązbędne. Cantor i twórcy nowoczesnej analizy matematycznej odrzucili te „bakcyle cholery”. Nie ba-cząc na to, że zastępując leibnizowskie intuicje definicjami zapisanymi w języku ε-δ (rojącymi się odkwantyfikatorów), odseparowali matematyków od „zdrowej reszty społeczeństwa”. Byli przekonani,że czynią dobro.

Wynik Łosia podważa tę pewność. Konstrukcja ultrapotęgi RU umożliwia precyzyjne zdefinio-wanie nieskończenie małych liczb rzeczywistych. To oznacza, że można wrócić do idei Leibniza iuprawiać analizę matematyczną w RU zamiast w R. Tak powstała analiza niestandardowa58.

Spróbujmy pokazać, co różni języki standardowej i niestandardowej analizy matematycznej.Każdą funkcję f : R → R można rozszerzyć do funkcji f∗ : RU → RU przyjmując f∗([(ri)]) =[(f(ri)]. Twierdzenie Łosia gwarantuje, że każda pierwszorzędowa własność funkcji f przysługujeteż funkcji f∗. I vice versa.

W analizie standardowej, aby zrozumieć ciągłość funkcji trzeba najpierw pojąć czym jest grani-ca funkcji w punkcie59 - bariera nie do przeskoczenia dla zdrowej części społeczeństwa. Tymczasemkorzystając z zanurzenia R RU można wrócić do intuicyjnie prostej, leibnizowskiej charaktery-zacji ciągłości: „funkcja f : R → R jest ciągła w punkcie a ∈ R, dokładnie wtedy, gdy nieskończeniemała zmiana argumentu powoduje nieskończenie małą zmianę wartości funkcji”:

∀y a∗ ≈ y ⇒ f∗(a∗) ≈ f∗(y)

(gdzie a∗ = [(a, a, . . .)] a zapis a∗ ≈ y oznacza, że różnica a∗ − y jest nieskończenie małą liczbą):Podobnie rzecz się ma z pochodną funkcji ciągłej f w punkcie a. W analizie standardowej to

granica ilorazu różnicowego. W niestandardowej to część standardowa liczby

f∗(a∗ + α)− f∗(a∗)α

gdzie α to dowolnie wybrana nieskończenie mała (różna od zera)60.Wystarczy zajrzeć do jakiejkolwiek monografii poświęconej analizie niestandardowej by się prze-

konać, że prowadzenie rachunków (dowodzenie) w języku Leibniza jest w wielu przypadkach łatwiej-sze niż w języku Weierstrassa61.

Renesans idei Leibniza pod postacią analizy niestandardowej jest tak udany, że niektórzy (np. K. Godel)mówili i mówią o niej jako o analizie matematycznej XXI wieku...

Zastosujmy teraz konstrukcję Łosia do (istniejącego hipotetycznie) modelu ZFC. Oznacznygo przez Set a przez SetU oznaczmy nowy model ZFC - jego ultrapotęgę względem właściwegoultafiltru U .Elementami - czyli zbiorami! - w tym modelu są klasy abstrakcji ciągów zbiorów z Set. Oczywiście:

zbiór b : |b− a| jest standardowa ).58Za twórcę analizy niestandardowej uważa się matematyka amerykańskiego, A. Robinsona. Trochę dziwi, że nie-

którzy autorzy zapominają o roli twierdzenia Łosia w budowie podstaw analizy niestandardowej.59Patrz str. 3560Część standardowa liczby [(ai)] to liczba [(a, a, . . .)] taka, że różnica tych liczb jest nieskończenie mała. Ponieważ

w definicji pochodnej nieskończenie mała α jest wybierana dowolnie, to może się zdarzyć, że tak definiowana pochodnaw punkcie nie istnieje. I bardzo dobrze, bo to samo mówi analiza standardowa. (patrz str. 36)61Można skorzystać z dostępnej w internecie książki Elementary Calculus, an infinitesimal approach H. J. Keislera.

„Łatwość” czy „trudność” to kategorie subiektywne. Sugerowałem, że miarą trudności pojęcia może być stopieńzagnieżdżenia kwantyfikatorów w zdaniu je opisującym („schody generała Wieniawy”). A po przetłumaczeniu definicjiformułowanych w języku Weierstrassa na język analizy niestandardowej kwantyfikatorów z reguły ubywa.

Page 183: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 182

[(A1, . . . , An, . . .)] = [(B1, . . . , Bn, . . .)] wtw i ∈ N : Ai = Bi ∈ U

[(A1, . . . , An, . . .)] ∈ [(B1, . . . , Bn, . . .)] wtw i ∈ N : Ai ∈ Bi ∈ UWiększość teoriomnogościowych konstrukcji w SetU realizowana jest „po współrzędnych”. Np.

para złożona ze zbiorów [(A1, . . . , An, . . .)] i [(B1, . . . , Bn, . . .)] to zbiór [((A1, B1), (A2, B2) . . .)].

Funkcja to klasa abstrakcji ciągu funkcji w Set62

W SetU istnieje - jak w każdym modelu ZFC - zbiór liczb naturalnych (najmniejszy zbiórinduktywny). To zbiór NU = [(N, . . . ,N, . . .)].

Czujny czytelnik zauważył, że zbiór liczb naturalnych w SetU oznaczyłem tak samo jak ultra-potęgę N względem U w Set. Rzeczywiście, te obiekty mają te same elementy. Tak samo - „powspółrzędnych”- definiujemy dodawanie i mnożenie. Zatem - czy te zbiory są tym samym?To pytanie nie ma sensu. Te obiekty należą do dwóch różnych modeli ZFC, dwóch odrębnych świa-tów. Łatwiej to pojąć gdy zauważymy, że te dwa zbiory mają istotnie różne rodziny podzbiorów!Liczby standardowe są podzbiorem ultrapotęgi NU w Set natomiast ... nie tworzą podzbioru zbioruliczb naturalnych w SetU ! Można bowiem pokazać, że każdy podzbiór NU zawierający wszystkieliczby standardowe musi zawierać pewną liczbę niestandardową.

Część zbioru, która nie jest jego podzbiorem? Kolejny paradoks?W żadnym razie. Aksjomaty ZFC nie dają żadnych podstaw do stwierdzenia, że podzbiorem zbioru jestkażda, wyróżniona w jakikolwiek sposób kolekcja jego elementów, jego część.

To zaskakujace stwierdzenie jest konsekwencją równie szokującego twierdzenia: „każda przeliczalnarodzina zbiorów ([Ai] : i ∈ N) w SetU taka, że każdy skończony przekrój [A0] ∩ · · · ∩ [Ak] jestniepusty, ma ... niepusty przekrój”.

Rzeczywiście? Przecież łatwo udowodnimy - w ZFC!- istnienie przeliczalnych rodzin zbiorów, które niemają tej własności - np. rodzina odcinków (0, 1n ). To jednak nie przeczy przywołanemu twierdzeniu, bo ...nie jest ono sformułowane w języku ZFC! „Przeliczalność” jest w nim rozumiana „zewnętrznie”: rodzina([Ai] : i ∈ N) nie jest indeksowana przez liczby naturalne w SetU ale przez elementy „zewnętrznego”(np. definiowanego konstruktywnie) zbioru liczb naturalnych na którym posadowiony jest ultrafiltr U .

Dowód tego twierdzenia jest zbyt skomplikowany, bym mógł choćby przedstawić jego szkic. Po-każę tylko jak z niego wynika, że liczby standardowe nie tworzą zbioru.Niech D będzie podzbiorem NU zawierającym wszystkie liczby standardowe. Dla dowolnej „ze-wnętrznej” liczby naturalnej n, podzbiórD­n ⊂ D złożony z liczb większych-równych standardowejliczbie [(n, n, . . . , )] jest niepusty. Takich zbiorów jest przeliczalnie wiele (w sensie zewnętrznym!) aprzekrój każdej skończonej podrodziny takich zbiorów jest niepusty. Zatem - na mocy przywołanegotwierdzenia - w zbiorze D musi być niestandardowa liczba naturalna! Koniec dowodu63.

W modelu zamierzonym standardowe liczby naturalne to te, które są elementami uniwersalnego systemunazw. Można je skonstruować w skończonym czasie (w skończonej liczbie kroków) rozpoczynającod zera i korzystając z operacji następnika - na pustej kartce kolejno stawiamy kreski, jedna po drugiej.Twierdzenie Łosia pokazuje, że tej charakteryzacji nie da się zapisać w języku pierwszego rzędu64. Jak-kolwiek to nie zabrzmi, trzeba powiedzieć, że ta pierwotna definicja liczb naturalnych nie należy doteoriomnogościowej matematyki...

62Nie wszystko jest tak proste. Np. sprawdzenie, czy SetU spełnia aksjomat ekstensjonalności - A =B wtw ∀C (C ∈ A)↔ C ∈ B) - wygląda tak (zarys dowodu):

gdy [(Ai)] = [(Bi)] to i ∈ N : Ai = Bi ∈ U a gdy [(Ci)] ∈ [(Ai)] to j : Cj ∈ Aj ∈ U . Stąd j : Cj ∈ Aj = Bj ∈U i, konsekwentnie, k : Ck ∈ Bk ∈ U , czyli [(Ci)] ∈ [(Bi)] .

Gdy [(Ai)] 6= [(Bi)], to i ∈ N : Ai 6= Bi ∈ U czyli jeden ze zbiorów i ∈ N : Ai ) Bi , i ∈ N : Ai ( Bi jest wU . A to pozwala na skonstruowanie zbioru [(Ci)] który należy tylko do jednego z tych dwóch zbiorów.63Dla niedowiarków, którym doskwiera brak pełnego dowodu: gdyby liczby standardowe tworzyły zbiór, to byłby

to zbiór induktywny istotnie mniejszy od NU . A to nie może się zdarzyć... .64Wynika to z aksjomatu wyróżniania.

Page 184: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 183

Zaskoczeń ciąg dalszy:I. Zbiór liczb naturalnych - taki, jakim go definiuje teoria mnogości - jest dobrze uporządkowa-ny przez relację „¬”: każdy jego niepusty podzbiór ma element najmniejszy. A przecież w NU

nie ma najmniejszej liczby niestandardowej! Sprzeczność? Nie: te liczby - jako dopełnienie liczbstandardowych w NU - nie tworzą podzbioru.

II. Definiowana teoriomnogościowo liczba naturalna jest skończonym zbiorem. Jej elementami sąwszystkie mniejsze od niej liczby naturalne - n = 0, 1, . . . , n−1 . Ale każda liczba niestandardowa,ma... nieskończenie wiele elementów! Np. wszystkie standardowe liczby są elementami zbioru - liczbyniestandardowej [(0, 1, 2, . . .)] . Sprzeczność? W żadnym razie. W teorii mnogości zbiór skończonyto taki, który nie jest równoliczny ze swym właściwym podzbiorem. Nic więcej.

Definiowana w ZFC skończoność jest pojęciem zależnym od modelu.W szczególności taka definicja skończoności nie gwarantuje, że każdy zbiór skończony można opróżnić wskończonym czasie wyjmując kolejno po jednym elemencie65.

III. Skoro liczby standardowe nie tworzą podzbioru, to przyporządkowanie f : NU → 0, 1 takie,że:

f(n) =

1 n− niestandardowa

0 n− standardowa

nie jest funkcją - w rozumieniu teoriomnogościowym - w SetU 66. Ale to przyporządkowanie jestfunkcją w Set.

IV. W SetU nie potrafimy rozstrzygać o równości liczb naturalnych. Np. nie wiemy, czy liczba[(0, 1, 0, 1, 0, 1, . . .)] to zero czy następnik zera - to zależy od tego, czy zbiór liczb parzystych należydo ultrafiltru U .

Skoro równość liczb naturalnych nie jest rozstrzygalna, to czy o jakichkolwiek funkcjach działających natym zbiorze, można mówić, że są obliczalne?

V. Liczby naturalne to skończone liczby porządkowe. Jeśli są one różne w Set i SetU , to i liczbyporządkowe w obu modelach są różne.

Obiekty SetU reprezentowane przez ciągi stałe - [(A,A, . . .)] - to zbiory standardowe. Możnawięc - w tym modelu - mówić o standardowych i niestandardowych elementach zbioru, standardo-wych funkcjach itp. i zauważyć - na przykład - takie ciekawostki:

- każdy nieskończony zbiór SetU ma niestandardowe elementy,- wszystkie elementy zbioru skończonego w SetU są standardowe dokładnie wtedy, gdy ten zbiór

jest standardowy.

Model Set można zanurzyć w SetU poprzez przyporządkowanie A [(A,A, . . .)]. Istnieje też za-nurzenie odwrotne - model SetU można zanurzyć w Set. Ale darujmy sobie te techniczne zawiłości.

10.3 Matematyczne uniwersum

Strasznie nam się skomplikowała ta opowieść o modelach ZFC ... . Jak w tym kontekście interpre-tować wynik Łosia?„Zbiór” jako pojęcie pierwotne ZFC nie jest definiowany w tej teorii. Ale próbujemy to zrobićw języku naturalnym. Próbował Cantor, próbowali kognitywiści. Mimo niejasności - wszak język

65Ilustrując działanie zasady indukcji, często używamy takiego przykładu: „w urnie jest skończenie wiele kul nume-rowanych liczbami naturalnymi. Na miejsce jednej wyjmowanej kuli wolno włożyć skończenie wiele kul o numerachniższych niż numer wyjętej kuli. Pokaż, że takie postępowanie musi - po skończonym czasie - doprowadzić do opróż-nienia urny”. Akurat... spróbuj tak opróżnić urnę, w której jest jedna kula o numerze [(0, 1, 2, . . .)]...660 to [(0, 0, . . .)] i 1 = [(1, 1, . . .)].

Page 185: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 184

naturalny nie ma precyzji języków formalnych - żywimy przekonanie, że to pojęcie ma swoją jedno-znacznie określony zakres. Twórcy teorii mnogości chcieli te niejasne wyobrażenia zastąpić opisemw formalnym języku pierwszego rzędu. Klasa desygnatów nieprecyzyjnego pojęcia „zbiór” miałaodtąd być opisana jako model ZFC. I - jak się zdawało (chciało) - jako model jedyny.Niesprzeczność ZFC - niedowodliwa w ZFC - wymusza istnienie jej „małych modeli”67. Twierdze-nia Lowenheima-Skolema i Łosia pokazały, że małych modeli jest wiele - jeśli tylko istnieje choćbyjeden. Można było się łudzić, że wszystkie małe modele są zawarte w jednym dużym „uniwersal-nym” modelu (choćby takiego, którego elementy tworzą klasę a nie zbiór). Ale twierdzenie Łosiatemu przeczy - niesposób zanurzyć modele Set i SetU w jeden większy model tak, że zbiory liczbnaturalnych z obu modeli pozostaną - po tym zanurzeniu - zbiorami liczb naturalych.

10.3.1 Model zamierzony ZFC„One common confusion about models of ZFC stems from the tac-tic expectation that (...) we are supposed to suspend all ourpreconceptions about sets when beginning to study of ZFC.68

Matematyka nie zaczęła się od Cantora i Hilberta. Twórcy ur-teorii - ZFC - jako cel stawialisobie uporządkowanie zastanej matematyki. To był ich model zamierzony. I jest nim nadal choćdziś - właśnie za sprawą ZFC - to matematyczne uniwersum jest nieporównywalnie większe odtego, które zastali twórcy teorii mnogości.

To, że ZFC przyczyniła się do rozbudowy uniwersum nie oznacza, że wchłonęła swój model zamierzony!W tym modelu wszystkie liczby naturalne są standardowe - konstruowane z zera za pomocą operacjinastępnika. Są emanacją (dyskretnego) czasu. Tego ZFC nie potrafi opisać.W tym modelu skończoność rozumiemy tak, jak w świecie rzeczywistym. W konsekwencji, budowanez liczb naturalnych liczb całkowite, wymierne a nawet rzeczywiste czy zespolone, interpretujemy w tymświecie jednoznacznie. A dzięki kartezjańskiemu utożsamieniu punktów z ciągami liczb również przestrzeńeuklidesowa „wymiaru n” jawi się nam jako pojęcie „jednoznacznie określone”.W tym świecie podstawowe obiekty są konstruowalne.

Takie wyobrażenie matematycznego uniwersum jest rozszerzeniem ZFC o „aksjomat istnieniamodelu zamierzonego”. Oczywiście, ten aksjomat ma charakter odmienny od pozostałych. Jestraczej aktem wiary - wyrazem przekonania, że uprawianie matematyki ma sens.

„The axiom of standard model, i.e., that there is a standard model, is slightly strongerthan the consistency of the system. Nevertheless, I feel that one must work with standard modelsif one is to have any kind of reasonable intuitive understanding” -P. Cohen [22].

Można też bardziej „psychologicznie”:„Jeżeli za urlogikę przyjmiemy pierwszorzędową teorięzbiorów, to zdaniami urlogiki są zdania pierwszego rzędu z jedynym symbolem relacyjnym „∈”.Aksjomatami są aksjomaty ZFC. Nieformalnie interpretujemy te aksjomaty jako stwierdzenia omatematycznych obiektach konstruowanych jako zbiory. A ponieważ matematyczne obiekty niesą a priori zbiorami, pewna reinterpretacja jest dokonywana w naszych umysłach.Jednakże jest to zgodne z ideologią matematyczną która przyjmuje, że nie jest ważne czym sąobiekty ale jakie są relacje między nimi” [130]

„Życie jest formą istnienia białka tylko w kominie coś czasem załka” - A. Osiecka... .

Twierdzenie Łosia nie jest odkryciem alternatywnych uniwersów. Ono tylko wskazuje ograniczenia ZFCi języka pierwszego rzędu jako języka opisu matematycznego uniwersum69.

67Małych w tym sensie, że „elementy tego modelu tworzą zbiór”.68T. Y. Chow, A beginner’s guide to forcing, Contemporary Mathematics, tekst dostępny również w internecie.69W artykule „Podstawy Matematyki w wieku XX” (dostępnym w internecie) znalazłem takie stwierdzenie jego

Autorów (W. Marek i J.Mycielski): „ G. Cantor (...) udowodnił, że wszystkie przedmioty, które rozważają matematycy,można rozumieć jako zbiory. (...) Na przykład, za pomocą pojęcia zbioru łatwo zdefiniować pojęcie liczby naturalnej”.Nie rozumiem. Naprawdę. Zgodzę się, że można je tak opisywać. Ale nie definiować.

Page 186: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 185

J. Pogonowski w artykule „Jak żyć z paradoksem Skolema” (dostępnym w internecie) pisał:„Trudno jest sensownie mówić o jedynym, zamierzonym modelu teorii mnogości. Problem ten niespędza jednak snu z powiek pracującym matematykom – posługują się oni swobodnie pojęciamimnogościowymi, pozostawiając filozoficzne rozterki związane z podstawami teorii mnogości logi-kom”. Ten trzeźwy pogląd i sugestia, że to właściwa postawa matematyka, ma swoje pragmatyczneuzasadnienie70. Jednak go nie podzielam: ZFC ma model zamierzony.

Jak on wygląda? Powtórzmy: jego centrum to rekurencyjna struktura liczb naturalnych N. Teliczby to tylko najprostsze (bo skończone) liczby porządkowe, ale ich „zamierzona” interpretacjawyznacza jednoznaczną interpretację wszelkich liczb porządkowych: liczba ω jest zdeternimowanaprzez dobrze uporządkowany zbiór N a jednoznaczność interpretacji innych liczb porządkowychwynika choćby z tego, że każda taka liczba może być zapisana w postaci normalnej Cantora71.Korzystając z tej interpretacji liczb porządkowych możemy zbudować ... „zamierzone” uniwersumvon Neumanna. I to jest nasz model zamierzony ZFC (nie przejmujemy się tym, że nie jest tozbiór).

Czy wskazanie modelu zamierzonego jest konieczne? Oto przykład wspierajacy tę tezę: opisującpo raz pierwszy niestandardowy model arytmetyki argumentowałem tak: „każdy skończony pod-zbiór teorii PA ∪ succn(0) < c : n ∈ N ma model - jest nim N z „odpowiednio dużą” liczbą ncwskazaną jako interpretacja stałej c. Zatem, na mocy twierdzenia o zwartości, cała ta teoria mamodel. Ale nie może nim być N, gdyż „nie istnieje liczba naturalna większa od każdej liczby postacisuccn(0)”72.Czyżby? Przecież w niestandardowy modelu ZFC - SetU - liczba id = [(0, 1, 2, . . . , n . . .)] jestwiększa od każdej standardowej liczby [(. . . , n, n, . . .)] = succn(0). Zatem to rozumowanie nie jestpoprawne. Bardziej precyzyjnie: nie można tego stwierdzenia udowodnić w ZFC !

To rozumowanie jest jednak w pełni poprawne gdy mamy na uwadze wskazany model zamie-rzony ZFC, w którym każda liczba naturalna jest konstruowalna z zera za pomocą następnika wskończonej liczbie kroków... .

Pomyślmy: co mamy na uwadze mówiąc „słowo to skończony ciąg liter”? Jak rozumiemy stwier-dzenie, że np. „fromuły (termy) tworzą zbiór”? Przecież nie jest tak, że najpierw wskazujemy pe-wien teoriomnogościowy model ZFC a dopiero potem interpretujemy te i inne metamatematycznestwierdzenia. Jedyną możliwą odpowiedzią jest odwołanie się do modelu zamierzonego w któryminterpetacja takich pojęć jak „skończoność” czy „liczba naturalna” i „obliczalność” jest uniwersalnaa nie teoriomonogościowa.

Użyjmy trafnego, choć nieco archaicznego określenia: słownik metamatematyki jest zrozumiałysam przez się - poprzez (podświadome) odwołanie do modelu zamierzonego73.

Uznajemy ZFC za ur-teorię ale matematykę uprawiamy w jej modelu zamierzonym.

Postulat niezależnego istnienia modelu zamierzonego jest zgodny z poglądem realistów (plato-ników) i wszystkich którzy uważają, że uniwersum matematyczne to coś więcej niż język. Skorosformalizowana teoria nie jest w stanie jednoznacznie go opisać, to opis uniwersum można (trzeba)uzupełnić dodając „nieformalne” aksjomaty... . Model zamierzony jest potrzebny realistom jak tlen,

70(...) a correct philosophical position of a true mathematician should be:- platonism – on weekdays – when I’m doing mathematics (otherwise, my „doing” will be inefficient),- formalism – on weekends – when I’m thinking „about” mathematics (otherwise, I will end up in mysticism). To -nieco zmanipulowany - cytat z R. Hersh, Some Proposals for Reviving the Philosophy of Mathematics, Advances inMathematics, 1979, vol. 31.71Każd ą liczbę naturalną można zapisać „odwołując się do potęg liczby 3”, np.100 = 33

1+1 · 1 + 32 · 1 + 30 · 1(oczywiście to, że wybraliśmy trójkę nie jest tu istotne). W ten sam sposób, ale zastępując „3” przez „ω” przedstawimydowolną liczbe porządkową.72str. 9973W artykule P. Gładkiego „Program Hilberta” (dostępny w internecie), przypisano Hilbertowi pogląd, że: „w

metamatematyce rozumowanie musi opierać się na intuicyjnym pojęciu liczby całkowitej a nie na arytmetyce sfor-malizowanej”. Jeśli tak, to mamy po swojej stronie ważnego sojusznika...

Page 187: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 186

bo nadaje sens ich matematycznym działaniom74.Konieczność odwołania do modelu zamierzonego staje się oczywista, gdy uświadomimy sobie,

że w wielu fundamentalnych twierdzeniach pojawiają się modele budowane z formuł, co oznacza- niczym nieuprawnione - utożsamienia zbioru formuł rozumianego jako realny zbiór napisów zezbiorem definiowanym teoriomnogościowo. Tak jest np. w opisanym wcześniej twierdzeniu Henkinao zupełności.

Dodajmy kolejny arcyważny przykład. Uniwersum Godla75 to odchudzona wersja uniwersumvon Neumanna - rekurencyjnie definiowana rodzina coraz to większych „zbiorów” (Lα : α ∈ Ord).Punkt wyjścia jest taki sam: L0 = V0 = ∅. Gdy „zbiór” Lα jest już zdefiniowany, to dla każdejformuły φ definiujemy „zbiór” Lφα złożony z tych „zbiorów”, które są opisane przez formułę φ iparametry ze zbioru Lα

76. Przyjmujemy

Lα+1 =⋃

φ∈FormLφα

gdzie Form to (zewnętrzny), przeliczalny zbiór formuł. Dla liczb porządkowych granicznych przyj-mujemy Lα =

⋃β<α Lα. Ostatecznie

L =⋃

α∈OrdLα

Mniejsza o szczególy77. Krytyczna dla tej konstrukcji jest definicja „zbioru” Lα+1 (jako podzbioru2Lα) gdyż do jego opisu wykorzystujemy zewnętrzny zbiór Form - tworzymy sumę indeksowanąprzez formuły. „Godel’s construction relies on the central concept of definability, that requires tomanipulate formulas within the set-theoretic universe, (...) For that, we need to inter-nalize the language of formulas of ZF in ZF, by constructing a particular denumerable setForm whose elements—called (...) codes of formulas—are intended to represent external formulas assets. [70] Przedstawione w tej pracy rozwiązanie problemu - uwewnętrznienie zbioru formuł poprzezzdefiniowanie „zbioru” Form - jest zbyt skomplikowane technicznie bym mógł je tu szczegółowoomawiać. Tym bardziej, że nie jestem do niego przekonany78.

Uh Houston, we’ve had a problem... A może rozwiązaniem jest - podobnie jak w przypadkuuniwersum von Neumanna - budowa uniwersum Godla w modelu zamierzonym? Nie musimy już„uwewnętrzniać” zbioru formuł... .

W konstrukcji von Neumanna korzystamy z aksjomatu zbioru potęgowego. Ale analiza konse-kwencji twierdzenia Łosia przekonuje, że znając zbiór A nie wiemy jak wygląda zbiór potęgowyzwiązany z A79 . Z tego powodu „konstrukcja” uniwersum von Neumanna w modelu zamierzonymto nadal tylko pewna konstrukcja językowa, opis uniwersum matematycznego w języku, w którymzakładamy, że „skończoność” (definiowana teoriomnogościowo) odpowiada intuicyjnemu pojmowa-niu skończoności a stwierdzenie „w skończonej liczbie kroków” jest tożsame ze stwierdzeniem „ wn-krokach, gdzie n to pewna liczba naturalna”.Konstruując uniwersum Godla w modelu zamierzonym nie korzystamy ze zbiorów potęgowych.

74„He’s a real nowhere man, sitting in his Nowhere Land, making all his nowhere plans for nobody. Doesn’t havea point of view, Knows not where he’s going to (...) - The Beatles.75Constructible Godel universe”. Nie należy mylić tego pojęcia z „kosmologicznym” uniwersum Godla.76Odwołujemy się tu do aksjomatu wyróżniania.77Patrz: https://en.wikipedia.org/wiki/Constructible universe.78Zapomnijmy na chwilę o tych wątpliwościach. Wówczas L ⊆ V . Ale czy uniwersum L jest istotnie mniejsze?

Równość V = L jest niesprzeczna z ZFC tzn. nie potrafimy - w ZFC - dowieść równości L = V ani jej zaprzeczyć.... „Godel briefly considered proposing that we add V = L to the accepted axioms (...) but he soon changed his mind.His later view was that V = L is really false, even though it is consistent with set theory, if set theory is itselfconsistent” [96]. Warto zajrzeć do tego artykułu H.Putnama dumając o relacji między ZFC a „rzeczywistością”.79Wiedzieć, czym są elementy zbioru 2A oznacza, że wiemy, czym są zbiory-podzbiory A - aby wiedzieć czym są

te elementy musimy wiedzieć czym są zbiory. Konstruując uniwersum von Neumanna postępujemy „odwrotnie” -zbiory to elementy zbiorów potęgowych postaci Vα. Błędne koło... . Nieprzekonanym przypomnę, że istnienie pew-nych podzbiorów R (również w opisywanym tu modelu zamierzonym!) zależy od akceptacji pewnika wyboru (zbioryniemierzalne -str.173 )

Page 188: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 187

Obiekty tego uniwersum są „opisywane rekurencyjnie”. To może ono jest owym modelem zamie-rzonym ZFC?

Teza, że liczby naturalne „istnieją poza teorią mnogości” nie budzi większych oporów. Takmyślał nie tylko Brouwer ale i jego antagonista Hilbert. Kilkadziesiąt lat poźniej E. Nelson pisał(elegancko): „There is obviously something inelegant about making arithmetic depend on set the-ory” [83]. A T. Forster poszedł dalej pisząc: „One should not allow the (fairly sensible) idea thatset theory can be a foundation for mathematics to bounce one into thinking that one has to startentirely inside Set Theory and pull oneself up into Mathematics by one’s bootstraps80. That isnot sensible. (...) On the contrary: it is perfectly reasonable—indeed essential — to approach theconstruction of the cumulative hierarchy armed with the primitive idea of ordinal” [40]. Dalej jestjeszcze mocniej: „Textbook after textbook will tell the reader that an ordinal is a transitive setwellordered by „∈”. Ordinals (...) are not sets at all.”Miło wiedzieć, że nie jestem odosobniony w swoich poglądach... .

10.3.2 Superstruktury i niestandardowe uniwersa

Skąd one? Teorię ZFC poprzedzała tzw. naiwna teoria zbiorów. Jej jądrem były zbiory liczbowe.Zbiory złożone ze zbiorów - używano „stosownie do potrzeb”, w ograniczonym zakresie. Wydawałosię, że teoria mnogości odebrała takiemu myśleniu o matematyce rację bytu. Ale zniszczenie marzeńdokonane przez Godla i Cohena sprawiło, że zaczął kiełkować pogląd, iż objęcie pojedynczą aksjo-matyczną teorią całego matematycznego uniwersum nie musi być priorytetem matematyki. Pewniedlatego na jednej ze stron wikipedii znalazło sie takie zdanie: „In mathematics (...) a universe is acollection that contains all the entities one wishes to consider in a given situation”..

Do tych bliżej niesprecyzowanych „lokalnych” uniwersów nawiązuje pojęcie superstruktury81. Tojakby „krótsza wersja” konstrukcji von Neumanna. Różnica w tym, że punktem wyjścia do jej budo-wy nie jest zbiór pusty tylko dowolnie ustalony bazowy zbiór indywiduuów (atomów, ur-elementów).My wybierzemy zbiór liczb rzeczywistych R (z modelu zamierzonego)82. Superstruktura o bazie Rto przeliczalna suma zbiorów V (R) =

⋃n∈N Vn(R), gdzie V0(R) = R, Vn+1(R) = Vn(R) ∪ 2Vn(R).

V (R) to model języka teorii zbiorów ale nie jest to model ZFC. Ale mamy tu wszelkie obiekty- liczby i zbiory - niezbędne do uprawiania analizy matematycznej Możemy mówić o iloczynachkartezjańskich, funkcjach, relacjach a więc i o modelach teorii pierwszego rzędu83

Uprawiając matematykę kreujemy własne uniwersum. J „Superstructures are universes for the practiceof mathematics”. Są tworzone „na bazie” teorii mnogości co należy rozumieć - mniej więcej - tak: wolnokorzystać ze wszelkich konstrukcji uprawnionych w ZFC jednak pod warunkem, że nie wyprowadzająone poza rodzinę zbiorów wskazaną w definicji superstruktury. I nie wszystko musi tu być zbiorem... .

Superstrukturę V (R) można rozszerzyć tworząc niestandardowe uniwersum. Dla dowolnie wy-branego ultrafiltru U (np. na zbiorze N). ograniczona ultrapotęga V (R)Ur to podzbiór „zwykłej”ultrapotęgi: ciąg (fn) wyznacza element [(fi)] ∈ V (R)Ur tylko wtedy, gdy wszystkie elementy tegociągu należą do jednego ze zbiorów Vm(R).Para (V (R), V (R)Ur ) wraz z zanurzeniem a ∈ V (R) a∗ = [(a, a, . . .)] ∈ V (R)Ur to właśnieniestandardowe uniwersum84.

Elementy V (R)Ur to zbiory niestandardowe. Zbiory postaci a∗ nazywamy zbiorami standardo-

80„pull oneself up by one’s bootstraps” to idiom, którego jedno z możliwych znaczeń jest bliskie opowieści o baronieMunchausenie, który wydostał się z bagna ciągnąc się za włosy... .81Tę nieprzyzwoicie krótką notkę o niestandardowych uniwersach sporządziłem głównie w oparciu o pracę [82]

pomijając szereg istotnych szczegółów, które jednak nie są istotne dla zrozumienia istoty rzeczy... .82„in analysis a real number is always handled as a primitive entity rather than as a set” - [82]83Wprawdzie teoriomnogościowa konstrukcja zbioru liczb naturalnych „nie mieści się w V (R)” ale te liczby (i

wszystkie liczby rzeczywiste) są tu obecne jako pojęcia prymitywne (elementy bazowego zbioru R).84Przypomnijmy, że inne niestandardowe uniwersa otrzymamy zastępując zbiór R dowolnym zbiorem X.

Page 189: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 188

wymi. Zbiory wewnętrzne to elementy zbiorów standardowych a pozostałe to zbiory zewnętrzne85.Superstruktura V (R) to świat „standardowej” analizy matematycznej, jej przedmiot badań. Jej

zanurzenie w uniwersum V (R)Ur nie zmienia przedmiotu badań a jedynie stwarza szerszy kontekspoznawczy: „The typical strategy in nonstandard analysis is as follows. Assume we want to provesome conjecture P about the real numbers (...). Formalize P as a first order formula φ. It canhappen that it is easier to decide P in some nonstandard model where additional tools may beavailable (for instance, infinitesimals), rather than in the standard model. Once the property P,as formally expressed by the formula φ, has been proved (or disproved) in nonstandard model, bytransfer it is true (or false) in the standard structure as well [82]

Dodatek: twierdzenie Ramsey’a revisited

Twierdzenia Łosia pozwala spełnić obietnicę i dokończyć dowód twierdzenia Ramsey’a: „dla do-wolnej liczby naturalnej n istnieje liczba R(n) taka, że każdy skończony, pełny dwukolorowy graf oR(n) wierzchołkach zawiera jednokolorowy podgraf o n wierzchołkach”86.

Wykorzystamy udowodnioną już „nieskończoną wersję” tego twierdzenia (str. 101) i twierdzenieŁosia w jego pełnej wersji. Ta pełna wersja mówi o własnościach ultraproduktu rodziny modeliΠU (An : n ∈ N) i pozwala na stwierdzenie, że zdanie φ prawdziwe we wszystkich modelach (An :n ∈ N) jest prawdziwe w ultraprodukcie Π(An : n ∈ N)87 .

Pełne grafy dwukolorowe to modele pewnej teorii pierwszego rzędu88 a własność „dwukolorowygraf nie zawiera jednokolorowego podgrafu o m wierzchołkach” jest opisywalna w języku tej teorii.To otwiera możliwość wykorzystania wyniku Łosia.

Dowodzimy przez sprzeczność: przyjmijmy, że dla pewnej liczby naturalnej m nie istnieje liczbaR(m) o żądanej własności, tzn. dla każdej liczby naturalnej n można wskazać pełny dwukolorowyi n-wierzchołkowy graf Kn w którym nie ma jednokolorowego podgrafu o m wierzchołkach.Zbudujmy ultraprodukt rodziny ΠU (Kn : n ∈ N) względem dowolnego właściwego ultrafilru U .Na mocy twierdzenia Łosia, ten obiekt dziedziczy wszystkie wspólne pierwszorzędowe własnościmodeli (Kn : n ∈ N). Jest więc pełnym dwukolorowym grafem bez jednokolorowego podgrafu o mwierzchołkach.Ten graf-ultraprodukt jest nieskończony i przeliczalny. Zatem - na mocy „nieskończonej wersji”twierdzenia Ramsey’a - jest w nim nieskończony jednokolorowy pełny podgraf. To oznacza, żezawiera taki podgraf o m wierzchołkach.Ta sprzeczność upoważnia do stwierdzenia, że udowodniliśmy twierdzenie Ramsey’a.

Dodajmy jeszcze jedną uwagę godną uwagi czytelnika. Oczywiście R(2) = 2. Łatwo wyliczyć, żeR(3) = 6. Ale na pytanie o liczbę R(5) potrafimy dziś odpowiedzieć tylko tyle, że 43 ¬ R(5) ¬ 49 . . ..

To zaskakuje. Jak to możliwe, że dysponując potężnymi komputerami i obliczeniami rozpro-szonymi nie umiemy spośród siedmiu liczb wybrać tej jednej właściwej? No to policzmy. Liczbaprzypadków, które trzeba przetestować dla np. n = 45 to - szacunkowo - liczba podzbiorów zbiorupar, jakie można utworzyć korzystając z 45 elementów. A to - „w przybliżeniu” - 2(452)...89 Moż-na podejrzewać, że ten niesłychanie szybki wzrost liczb Ramsey’a jest przyczyną niedowodliwościtwierdzenia Ramsey’a (w wersji Parisa-Harringtona) w arytmetyce Peano...90.

85Nazwy „wewnętrzny” i „zewnętrzny” nie mają wiele wspólnego ze znaczeniami, jakie im nadaliśmy poprzednio.86Przypomnijmy: to twierdzenie interesuje nas dlatego, że jego nieco wzbogacona wersja - twierdzenie Parisa-

Harringtona - to przykład zdania niedowodliwego w PA a dowodliwego w ZFC.Zapisany tu „dowód” jest, jak zawsze, tylko szkicem, zarysem dowodu.87Elementami ultraproduktu są klasy abstrakcji ciągów (an : an ∈ An) definiowane tak, jak w przypadku ultrapotę-

gi. Działania są określone „po współrzędnych”. Ultrapotęga modelu A to ultraprodukt rodziny Ai takiej, że An = Adla dowolnego n ∈ N .88Spróbuj samodzielnie sformułować tę teorię.89Szacując nieco dokładniej: 2990. Ale to niewiele zmienia...90„Wyobraźmy sobie, że wroga cywilizacja napada na Ziemię i żąda od nas wyznaczenia wartości liczby R(5),

grożąc zniszczeniem planety. By uniknąć zagłady powinniśmy zmobilizować wszystkich matematyków, informatyków

Page 190: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 189

10.3.3 Wilk w owczej skórze

Wyobraźmy sobie alternatywną historię matematyki. Przypuśćmy, że Cantor lub ktoś równie ge-nialny, zamiast budować teorię mnogości wpada na pomysł, by stworzyć ur-teorię rozszerzającnieco język arytmetyki Peano. I w tym nowym języku formułuje teorię, którą - dla odróżnienia odpierwszorzędowej arytmetyki Peano - nazywa arytmetyką drugiego rzędu91.

To skromne rozszerzenie: ogranicza się do wprowadzenia nowego rodzaju zmiennych reprezentu-jących podzbiory N 92. Dla odróżnienia od zmiennych przedmiotowych - x, y, z, . . . - nowe zmienneoznaczamy dużymi literami - X,Y, Z, . . .. W konsekwencji pojawiają się nowe formuły atomowe:dla dowolnego termu arytmetycznego t i zmiennej drugiego rzędu X, napis t ∈ X jest taką formułą.Formuły złożone budujemy z atomowych tak samo, jak w języku pierwszego rzędu.

Nowa teoria - SOA - to rozszerzenie arytmetyki Peano o trzy aksjomaty sformułowane w takrozszerzonym języku:- aksjomat indukcji:

∀X (0 ∈ X) ∧ (∀x (x ∈ X → succ(x) ∈ X)→ ∀x (x ∈ X)

- aksjomat wyróżniania: dla dowolnej „drugorzędowej” formuły φ(x, y1, . . . , yk, Y1, ...Ym) nie zawie-rającej wolnej zmiennej X93:

∃X∀x (x ∈ X)↔ φ(x, y1, . . . , yk, Y1, . . . , Ym))

- aksjomat ekstensjonalności:

∀X,Y X = Y ↔ ∀x (x ∈ X ↔ x ∈ Y )

Tak jak w ZFC, aksjomat wyróżniania pozwala na wprowadzenie do języka SOA formuł na-zwowych - napisów postaci

x : φ(x, y1, . . . , yk, Y1, . . . , Ym)

( gdzie y1, . . . , yk, Y1, . . . , Ym to zmienne wolne - parametry tej formuły nazwowej).

Co można w tej matematyce wyrazić? Co można badać? Popatrzmy na proste przykłady:

1. Formuła x = x wprowadza do języka SOA nazwę (= bezparametrową formułę nazwową) x :x = x. Zastąpimy ją symbolem N i będziemy nazywać „uniwersum” ponieważ

SOA ` ∀x x ∈ N oraz SOA ` ∀X X ⊆ N 94

2. Formuła nazwowa x : ¬(x ∈ Y ) (z parametrem Y ) sprawia, że w SOA można mówić odopełnieniu (definiowalnego) zbioru. Możemy do języka SOA wprowadzić skrót ¬Y dla tej formułynazwowej i np. pokazać, że

SOA ` ∀Y ∀x (x ∈ Y ) ∨ (x ∈ ¬Y )

Podobnie mozna wprowadzic nazwy (z parametrami X,Y ) X ∪ Y , X ∩ Y .

3. Oznaczmy term arytmetyczny (n+m)2 + n sugestywnym skrótem (n,m). To oznacza wprowa-dzenie do języka SOA pojęcia pary uporządkowanej - formuły nazwowej x : x = (n,m) 95

W konsekwencji możemy konstruować w SOA iloczyny kartezjańskie:

Y × Z = x : ∃y,z (y ∈ Y ) ∧ (z ∈ Z) ∧ (x = (y, z))a potem - korzystając z pojęcia podzbioru - wprowadzić do SOA pojęcia relacji i funkcji96.

i programistów, zaprogramować wszystkie komputery i spróbować znaleźć żądaną wartość. A jeśli kosmici zażądająwyznaczenia liczby R(6)? Wówczas powinniśmy raczej spróbować... zniszczyć najeźdźców.” (P.Erdos (1913-1996) -matematyk węgierski)91Second Order Arithmetics - SOA. Ta teoria została stworzona przez Hilberta i Bernaysa w latach 30-tych XX w.92Inaczej: zmienne drugiego rzędu.93To zastrzeżenie jest istotne: w przeciwnym wypadku dla φ(x) ≡ ¬(x ∈ X) otrzymamy sprzeczność.94A jak ktoś zechce, to może nazwać N zbiorem liczb naturalnych... .95SOA ` ∀m,n,k,l ((m + n)2 + n = (k + l)2 + l) → ((m = k) ∧ (n = l)). Para liczb naturalnych jest jednoznacznie

reprezentowana przez pojedynczą liczbę - kod pary.96fun(F,X, Y ) = F ⊆ X × Y ∧ ∀x∃!y (x, y) ∈ F .

Page 191: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 190

4. „Zbiór jest skończony, gdy na trasie każdej nieskończonej podróży po jego punktach musi znaleźćsię punkt odwiedzony conajmniej dwukrotnie”. Tę charakteryzację zbiorów skończonycyh zapiszemyw języku SOA w postaci niezbyt miłej formuły:

Finite(Y ) ≡ ∀X (Tr(X) ∧ Succ(X,Y )→ Fix(X,Y ) ∨ Y = ∅).gdzie Tr(X), Succ(X,Y ), F ix(X,Y ) to skróty:

Tr(X) ≡ ∀x,y,z (x, y) ∈ X ∧ (y, z) ∈ X → (x, z) ∈ X,Succ(X,Y ) ≡ ∀x∈Y ∃y∈Y (x, y) ∈ X,Fix(X,Y ) ≡ ∃x∈Y (x, x) ∈ XW SOA można mówić o zbiorach skończonych. Ale nie ma tu zbioru wszystkich podzbiorów N.

Pominiemy opowieść, jak w tej teorii definiujemy zbiory liczb całkowitych i wymiernych, jak zdefi-niujemy liczby rzeczywiste.Mając w głowie to, co powiedzieliśmy o funkcjach ciągłych, nie dziwimysię zbytnio, że w SOA można te funkcje definiować i badać 97. To wystarczy, by uprawiać sensownąmatematykę w obszarze wyznaczonym przez arytmetykę drugiego rzędu.SOA to teoria pośrednia między arytmetyką a teorią mnogości: PA jest podteorią SOA a SOAumiemy interpretować w ZFC 98. Jaka jest matematyka SOA? Jaka jest „siła” tej teorii?

Pięknie napisał o tym S.G. Simpson:„Szczególnie interesuje nas pytanie, które aksjomaty orze-kające o istnieniu są niezbędne do udowodnienia znanych twierdzeń matematycznych99. Zakrestego pytania (...) zawęzimy dzieląc matematykę na dwie części. Pierwsza to matematyka teoriom-nogościowa (set-theoretic mathematics) a drugą nazwiemy zwykłą (ordinary) matematyką. Przezmatematykę teoriomnogościową rozumiemy te jej dziedziny, które zbudowano po teoriomnogościo-wej rewolucji (...) takie jak topologia ogólna, analiza funkcjonalna, algebra nieskończonych struktur,i abstrakcyjna teoria zbiorów. Do zwykłej matematyki zaliczamy dziedziny wcześniejsze od teoriimnogości - geometrię, teorię liczb, logikę matematyczną i teorię obliczalności. Rozróżnienie mię-dzy matematyką teoriomnogościową i zwykłą jest, z grubsza, rozróżnieniem między „matematykąnieprzeliczalną” i „matematyką przeliczalną”. (...) Stąd, na przykład, badanie ciągłych funkcji rze-czywistych jest częścią zwykłej matematyki (...) [108]100.

SOA należy do zwykłej matematyki - to jej ur-teoria. SOA to matematyka liczb, ZFC to matematykazbiorów.

„W SOA można nie tylko bardzo dużo wyrazić, ale i dużo udowodnić. Praktyka pokazuje, żeniemal każde twierdzenie, z którym można się zetknąć w ciągu pierwszych lat studiów matematycz-nych, można udowodnić w SOA, jeśli tylko można je wysłowić w jej języku. O przykłady twierdzeńwyrażalnych, lecz niedowodliwych w SOA (a dowodliwych w ZFC) wcale nie tak łatwo”101.

Jeśli tak, jeśli język SOA wystarcza do opisu zwykłej matematyki, to dlaczego za podstawęmatematyki uznajemy obszerniejszą teorię ZFC z jej wysoce abstrakcyjnymi (i dyskusyjnymi)aksjomatami?

97„(...) for the behaviour of a continuous function is dictated by its values at rational points, so we can implementsuch functions as sets of pairs of rationals. But pairs of rationals can be implemented by natural number codes, socontinuous functions over the reals also again can be implemented at the level of sets of naturals. (...) In summary, theclassical analysis of ordinary functions can be reconstructed in SOA (...)which, of course, is why SOA is sometimesjust called „analysis”- P.Smith, Induction and Predicativity (http://philpapers.org/rec/SMIIAP-2). Dodajmy, że„zbiór liczb rzeczywistych” to nie jest pojęcie matematyki budowanej na bazie SOA!98Darujmy sobie szczegółowy opis tej interpretacji. Powiedzmy tylko, że tłumacząc formuły SOA na formuły

teoriomnogościowe wykorzystujemy definiowany w ZFC zbiór N (najmniejszy zbiór induktywny) a w trakcie tłuma-czenia formuł dodajemy informację o zakresie zmiennych występujących w formułe. Np. formułę x ∈ X tłumaczymytak: (x ∈ N) ∧ (X ∈ 2N) ∧ (x ∈ X). Termin „interpretacja” oznacza, że wszystkie aksjomaty SOA są przy takimtłumaczeniu stwierdzeniami dowodliwymi w ZFC.99„Matematyka odwrotna” -str. 119.100Przykładem drogi jaka przebywamy przechodząc od matematyki zwykłej do teoriomnogościowej jest opisana tu

wcześniej droga od przestrzeni kartezjańskich do topologicznych.101Cytat pochodzi z artykułu L. Kołodziejczyka o przydługim tytule „Jak pokazać, że coś ma elementarny dowód

nie pokazując tego dowodu” (internet).

Page 192: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 191

10.3.4 Dlaczego ZFC?

Nadmiarowość języka ZFC w stosunku do zadań „zwykłej matematyki” nie pozbawia snu pra-cujących matematyków. Kłopoty z tą teorią rozpatrywaną in extenso to zmartwienie stosunkowowąskiej grupy badaczy tzw. podstawowców matematyki. A jeśli oni znajdą sprzeczność w ZFC?No cóż, przyjdzie czas, będzie rada.

Używanie argumentów dotyczących funkcjonalności języka i wygody użytkownika wydaje się nieprzystawać do poważnej nauki. Czyżby? Przypomnijmy słowa L.Susanki: „Axioms are supposed tobe so pellucidly, limpidly clear („przejrzyste i klarownie czyste”) that any fool, after understandingour interpretation of their meaning in ordinary mathematical usage, would acclaim their necessityand validity”. A S.Hawkings i L. Mlodinow w książce „Grand Design” pisząc o swej koncepcji„model-dependent realism” podali następujące kryteria „dobrego modelu”:

„Dobry model:Jest elegancki,Zawiera niewiele elementów arbitralnych lub wymagajacych dopasowania,Zgadza się z wynikami wszelkich obserwacji i je wyjaśnia,Daje szczegółowe przewidywania wyników przyszłych obserwacji. które mogą go obalić czyli

sfalsyfikować, jesli nie zostaną potwierdzneIf the modifications needed to accommodate new observations become too baroque, it signals

the need for a new model.”102

ZFC operuje pojedynczym pierwotnym pojęciem - zbiorem103. Nie mamy żadnych trudności zewskazaniem desygnatów tego pojęcia w otaczajacej nas rzeczywistości (wprawdzie przykłady, którepoznajemy na wczesnym etapie edukacji to wyłącznie zbiory skończone, ale to nam nie przeszkadza).Przekonanie o słuszności aksjomatów ZFC czerpiemy stąd, że dla skończonych zbiorów są one„oczywiste”. Niewielu dostrzega groźne konsekwencje przejście od niewinnego stwierdzenia „liczbnaturalnych jest nieskończenie wiele” do „istnieje nieskończony zbiór liczb naturalnych”. Nikt nasnie uprzedza, że akceptacja tego zbioru nieskończonego i pozostałych „oczywistych” aksjomatówto mieszanka wybuchowa, która każe zaakceptować „nieskończoną skalę nieskończoności” i to, żerówność zbiorów staje się nierozstrzygalna a pewnik wyboru prowadzi do kuriozalnych wyników.

Dlatego ZFC od stu lat króluje w świecie matematyki. Pracujący matematycy są w ogromnejwiększości zadowoleni z takiego stanu rzeczy. Bardzo zadowoleni. J. Dieudonne, wybitny matema-tyk francuski, w 1982 roku pisał tak: „System, który przyjmowany jest obecnie przez co najmniej95% matematyków, to powszechnie znana teoria Zermelo–Fraenkla, (...) . System ten odpowiadadokładnie potrzebom wszystkich matematyków z wyjątkiem oczywiście logików oraz tych, którychpostawa filozoficzna uniemożliwia przyjęcie przesłanek wymaganego stylu, to znaczy tzw. mate-matyków intuicjonistów i konstruktywistów. (...) Filozofowie i logicy (...) wierzą, że matematycyinteresują się tym, co oni robią. Należałoby wyprowadzić ich z błędu, nie jest to bowiem prawdą i90% matematyków śmieje się z tego, co robią wszyscy logicy i filozofowie razem wzięci.” Nadziejaw tym, że jednak 5% matematyków dopuszcza myśl o istnieiu matematyki odmiennej od tej, którejpodstawą jest teorią mnogości... .

SOA jako teoria drugiego rzędu

Uznajmy prymat ZFC i popatrzmy z tej perspektywy na SOA.W języku pierwszego rzędu równość jest wyróżniona - ma ustaloną interpretację w każdym teoriom-nogościowym modelu104. W SOA mamy jeszcze drugą wyróżnioną relację - przynależność (elementudo zbioru). To cecha charakterystyczna nie tylko SOA ale wszelkich teorii odwołujących się do ję-

102Ostatnie zdanie pozostawiłem w jęz. angielskim bo nie znalazłem go w polskim tłumaczeniu tej książki... .Nie dajmy się nabrać: słowo „model” odnosi się tu do teorii matematycznych za pomocą których próbujemy modelowaćrzeczywistość. Nie ma nic wspólnego z teoriomnogościowym modelem teorii...103Autorstwo terminu „zbiór” przypisuje się Platonowi.104Lub: w języku teorii mnogości (aksjomat ekstensjonalności).

Page 193: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 192

zyka i logiki drugiego rzędu105.Czy to znaczy, że - wbrew wcześniejszym twierdzeniom - ZFC to teoria drugiego rzędu? W żadnymrazie. W teorii mnogości operujemy zmiennymi, termami i relacjami „na jednym poziomie”. Zapisx ∈ y ∧ y ∈ z jest poprawny. W języku drugiego rzędu mamy dwa rodzaje zmiennych - przedmio-towe i zbiorowe. Zapis x ∈ X jest poprawny tylko wtedy, gdy x to zmienna indywiduowa a X -zmienna drugiego rodzaju. Zapis x ∈ Y ∧ Y ∈ Z jest niepoprawny106. W SOA (i innych teoriachdrugiego rzędu) relacja przynależności „∈” jest spłaszczona - można mówić tylko o przynależnośćliczby naturalnej do podzbiorów uniwersum - zbioru liczb naturalnych. W teorii mnogości nie matego ograniczenia - każdy zbiór może być elementem innego zbioru.

Język drugiego rzędu jest w oczywisty sposób interpretowalny w języku ZFC. Dlatego bezwiększego oporu przyjmujemy, że takie teorie „mają sens” w matematyce teoriomnogościowej. SOLjest słabsza od ZFC, ale dzięki wyróżnionej roli symbolu „∈” bardzo jej bliska. I pewnie dlategoQuine nazwał SOL „teorią zbiorów w owczej skórze”107.

Jednak logika drugiego rzędu ma poważną wadę - nie jest zupełna. Czy jest więc logiką?Zupełność to dla wielu niezbywalny atrybut logiki. „(...) The motivation behind the demand for thecompleteness of a proper logic can be reconstructed as follows: Logical consequence is intuitivelytaken to be a semantic notion. (...) It is therefore the formal semantics, i.e. the model theory,that captures logical consequence. The deductive system merely gives us a bunch of inferencerules. If completeness fails this shows that the deductive system does not properly capture logicalconsequence” [97]108.

Odpowiedzią na postawione pytanie jest twierdzenie Lindstroma: „logika pierwszego rzędu jestnajsilniejszą logiką, która jest zupełna i dla której można udowodnić twierdzenie o zwartości”.

105SOL = Second Order Logic106Logikę drugiego rzędu można powiązać z (prostą) teorią typów Russella. Idea tej teorii to hierarchizacja wyrażeń

i wielkości matematycznych za pomocą typów. Najprostszy typ „wielkości indywiduowych” ma rząd 1, rząd typuzbiorów tych indywiduów to 2, rząd typu zbiorów wielkości rzędu 2 to 3... itd. Język n-tego rzędu dopuszcza, mówiącw uproszczeniu, użycie i kwantyfikację zmiennych, których zakresem zmienności są wielkości co najwyżej n-tego rzędu.„Dowolne wyrażenie zawierające zmienną związaną jest wyższego typu niż ta zmienna” - B.Russell.107„Second Order Logic is a set theory in sheep’s clothes” lub „SOL is Set Theory in disguise”.108Logical consequence to, w terminologii przyjętej w tym tekście, konsekwencja semantyczna. (str.162)

Page 194: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 11

Logika intuicjonistyczna

11.1 Konsekwencja i implikacja

Teoria modeli v. teoria dowoduTeoria modeli, której podstawą jest korespondencyjna teoria prawdy Tarskiego to, zdaniem

wielu, dominująca część współczesnej logiki matematycznej. Niektórzy skłonni są nawet uznawaćrówność logika = teoria modeli1.Nie wszyscy. Y. Girard o „tradycji Tarskiego” pisał tak: „This tradition is distinguished by anextreme platitude2: the connector „∨” is translated by „or”, and so on. This interpretation tells usnothing particularly remarkable about the logical connectors: its apparent lack of ambition is theunderlying reason for its operationality. We are only interested in the denotation, true or false, of asentence (...). Once again, this definition is ludicrous3 from the point of view of logic, but entirelyadequate for its purpose. The development of Model Theory shows this” [41].

To samo nieco inaczej: „teoria modeli jest, być może, ciekawa, ale przechodzi obok tego, cojest istotą logiki”. Dla Girarda logika to: „(...) study of patterns found in reasoning. The task ofthe logician is to set down rules for distinguishing between valid and fallacious inference, betweenrational and flawed arguments”4.

Girard w centrum logiki stawia teorię dowodu a dla teorii modeli rezerwuje miejsce (co najwyżej)na jej peryferiach. Ale chodzi o coś więcej - o uznanie, że podstawowym zadaniem logiki jest refleksjanad zasadami uzasadniania sądów5.

O tej różnicy w rozumieniu zadań logiki pisałem wcześniej wiążąc - symbolicznie - dwa różnestanowiska z nazwiskami Fregego i Russella6. Koncepcja Fregego traktująca priorytetowo „odkry-wanie praw prawdziwości” to - w odniesieniu do logiki zdaniowej - badanie danego a priori modeluzamierzonego, który z kolei jest emanacją wiary, że w świecie platońskich idei funkcjonuje ideal-na (jedynie słuszna) logika. Ten model - algebra Boole’a wartości logicznych - to dwuelementowyzbiór true, false na którym zdefiniowano operacje logiczne - koniunkcję, alternatywę i negację.Te operacje nie budzą kontrowersji, bo są zgodne z rolą spójników „i”, „lub”, „nieprawda, że...”w językach naturalnych. Platońska idealizacja wyraża się tu w założeniu, że zdaniom orzekającymjest zawsze przyporządkowana jedna z dwóch wartości logicznych - prawda lub fałsz.

Język formuł zdaniowych to - u Fregego - język opisu tego szczególnego obiektu. Formalne sys-tem dowodzenia to tylko narzędzie odnajdywania zdań prawdziwych. Do girardowskich „wzorców

1Tak to przynajmniej wygląda w programach studiow matematycznych.2ang. banał3groteskowy, niedorzeczny4Proszę nie przywiązywać wagi do sformułowań „banał”, „niedorzeczność” , „widoczny brak ambicji” które znala-

zły się w cytowanym tekście, a które należą raczej do języka polityki niż matematyki. Język Girarda różni się znacznieod beznamiętnego języka ogromniej większości prac matematycznych.5Termin „reasoning” ma wiele odpowiedników w języku polskim: rozumowanie, argumentacja, uzasadnienie, wy-

wód i parę innych.6W rozdziale „Język matematyki” str. 71

193

Page 195: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 194

argumentacji” - „patterns of reasoning” - sięgamy wtedy, gdy chcemy uzasadnić, że „prawdziwośćzdania A jest konsekwencją prawdziwości zdania B (zdań B1, . . . , Bk)”. W tej logice „wzorce argu-mentacji” można utożsamić z regułami dowodzenia.Jedna z nich zasługuje na szczególną uwagę. To reguła modus ponens7:

B,B → A

A

Mamy tu nowy konstruktor formuł zdaniowych - implikację. Napis B → A czytamy zazwyczajtak: „jeśli B (jest zdaniem prawdziwym) to A (jest zdaniem prawdziwym)” lub „A, o ile B”. Toutwierdza nas w przekonaniu, że implikacja jest opisem konsekwencji.

Implikacja jest „uwewnętrznieniem” konsekwencji: „aby A było konsekwencją B, wystarczy by zdanieB było prawdziwe i - niezależnie od B - zdanie B → A” też było prawdziwe”. W ten sposób konse-kwencja stała się wtórna w stosunku do prawdziwości a jej badanie częścią procesu „odkrywania prawprawdziwości”.

Zgodnie z zamysłem Fregego, implikację trzeba opisać jako kolejną operację w modelu zamie-rzonym. Zdefiniowano ją tak:

B A B → A

1 1 11 0 00 1 10 0 1

(0 to fałsz, 1 to prawda).To uwewnętrznienie konsekwencji jest ... nadmiarowe: jedna z dwu implikacji - B → A i A → B- jest zawsze - dla dowolnych zdań A, B - prawdziwa8. Tym samym jedno ze zdań: „jeśli Kasiaprzypaliła zupę, to w Krakowie pada deszcz” i „jeśli w Krakowie pada deszcz to Kasia przypaliłazupę” jest - w myśl tej logiki! - prawdziwe. Gdyby upierać się, że prawdziwość implikacji odpowia-da istocie relacji konsekwencji, to musielibyśmy uznać istnienie przyczynowo-skutkowego związkumiędzy kulinarnymi umiejętnościami Kasi a średnią opadów w Krakowie (lub odwrotnie)9.Jednak to nie oznacza zanegowania reguły modus ponens jako (zewnętrznego) opisu konsekwencji.Ta reguła korzysta z implikacji tylko w „pozytywnym” przypadku, odpowiadającym powszechnieakceptowanemu rozumieniu konsekwencji10

Dodanie implikacji jako kolejnej operacji w algebrze Boole’a jest w istocie bezproduktywne:implikacja B → A w logice klasycznej to synonim alternatywy ¬B ∨A. Można bez niej żyć. Możnazapisać regułę odrywania w postaci B,¬B∨A

A i czytać tak :„aby stwierdzić, że A jest prawdziwewystarczy pokazać, że B jest prawdziwe i jedno z dwóch zdań - ¬B i A - jest prawdziwe”. A to niejest szczególnie wnikliwa obserwacja... .

Po co nam uwewnętrznienie konsekwencji? Bez niego konsekwencja jest pojęciem metajęzykowym

7Reguła odrywania. O szczególnej roli tej reguły świadczy to, że można zbudować systemy dowodzenia dla kla-sycznej logiki zdaniowej, w której jest ona jedyną regułą dowodzenia.8Formuła (A→ B) ∨ (B → A) jest prawem klasycznej logiki zdaniowej - „prawem prawdziwości”.9W internecie można znaleźć cyfrową kopię książki T. Kotarbińskiego „Elementy teorii poznania, logi-

ki formalnej i metodologii nauk” (Lwów 1929) (http://www.ifispan.waw.pl/bibfis/news/zbiory/gallery/ margina-lia/KotEl/index.html ). Ten egzemplarz, zgodnie z ówczesnymi zwyczajami, jest upstrzony dopiskami czytelnikówdokumentującmi ich wątpliwości związane z definicją implikacji. Kotarbiński był świadom, że jest to odejście od in-tuicyjnego rozumienia frazy „jeżeli B, to A” jako orzeczenia o istnieniu pewnego związku przyczynowo-skutkowego,gdyż (pięknie) napisał: „W tym miejscu grożą poważne nieporozumienia między rachunkiem zdań a Czytelnikiem”.Pięknie by było, gdyby i dziś studenci ujawniali swoje wątpliwości, nawet zapisując je na marginesach studiowa-nych (?) dzieł. Ale oni nie mają na to czasu, bo się uczą (zaliczają). Jednak można ich usprawiedliwić: to postawapragmatyczna, bo „uczenie się” to wszystko, czego od nich się wymaga.10Tzn. aby skorzystać z tej reguły w dowodzie prawdziwości zdania A trzeba dowieść prawdziwości dwóch zdań:

pewnego zdania B i implikacji B → A. Implikacja o fałszywym poprzedniku nas tu nie interesuje.

Page 196: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 195

(zewnętrznym) a reguła modus ponens „prawem transcedentnym” nie podlegającym badaniu wewnątrzrozważanej logiki.Kłopoty z implikacją to skutek apriorycznego założenia istnienia dwuelementowej algebry wartości lo-gicznych i budowa logiki zdaniowej - języka, systemów dowodzenia - wokół tego obiektu.

Jeśli przyjmiemy pogląd Russella (Łukasiewicza, Jaśkowskiego, Gentzena i Girarda) unikniemyzamieszania. W tej koncepcji przedmiotem badań jest proces dowodzenia (uzasadniania), więc niemusimy opisywać konsekwencji odwołując się do prawdziwości zdań.W systemie dedukcji naturalnej konsekwencja jest reprezentowana przez sekwenty B1, . . . , Bk ` Aa reguły dowodzenia związane z implikacją wyglądają naturalnie:

Γ ∧A ` BΓ ` (A→ B)

Γ ` (A→ B) Γ ` AΓ ` B

i „same z siebie” nie upoważniają do wniosków jakie przed chwilą wyprowadzaliśmy.

Coś tu nie gra - wszak w systemie dedukcji naturalnej dowodliwe są wszystkie prawa logiki zdaniowej awśród nich kontrowersyjna alternatywa (A→ B) ∨ (B → A) i równoważność (B → A)↔ (¬B ∨A).To prawda. Ale dowodliwość tych formuł to rezultat wykorzystania reguł tego systemu związanych zinnymi spójnikami logicznymi (a nie reguł bezpośrednio odnoszących się do implikacji). I to tam kryjesię założenie, że interesuje nas tylko jeden jedyny model zamierzony języka formuł zdaniowych.

11.2 Źródła logiki intuicjonistycznej

W matematyce Cantora i Hilberta continuum R to zbiór punktów-liczb rzeczywistych. Każdypodzbiór A ⊆ R ma swoje dopełnienie - zbiór ¬A = a ∈ R : ¬(a ∈ A) . To konsekwencjaaksjomatu wyróżniania. Ponieważ ZFC korzysta z klasycznej logiki w której obowiązuje prawowyłączonego środka, to formuła (a ∈ A) ∨ (a ∈ ¬A) jest zawsze prawdziwa. Tertium non datur11.

Czy rzeczywiście? Przypomnijmy koncepcję kontinuum opisującą ten obiekt jako splątaną ro-dzinę wszystkich par liczb wymiernych (d, e) takich, że d < e12. Konsekwentnie, przez podstrukturętak definiowanego continuum powinniśmy rozumieć „podobną do całości” rodzinę takich par, czyli„coś”, co opisaliśmy jako zbiór U∼ . A przynależność liczby rzeczywistej (punktu) do takiej pod-struktury winniśmy definiować tak:

- punkt a należy do podstruktury U∼ = (dn, en) : n ∈ N gdy potrafimy wskazać parę liczbwymiernych (d, e) ∈ A taką, że d < a < e (czyli (d, e) aproksymuje a),

- a /∈ U∼ gdy potrafimy wskazać parę (b, c) która aproksymuje a i jednocześnie jest „rozłączna”z każdą parą z U∼13.

Nietrudno spostrzec, że przy tych ustaleniach klasyczna dychotomia logiczna „A lub nieprawda,że A” - przestaje obowiązywać: nie można pokazać, że 0 ∈ (0, 1) ani że 0 /∈ (0, 1)...

To my stanowimy co jest uzasadnieniem prostych zdań - „0 ∈ (0, 1)”, „¬(3 ∈ (1, 2))”. Czy mamy do tegoprawo? „Mathematics does not depend on logic; on the contrary, logic is part of mathematics” (Brouwer).To my skonstruowaliśmy ten szczególny obiekt matematyczny i tym samym mamy prawo określić logikęjęzyka jego opisu.Odrzucenie prawa wyłączonego środka jest trudne, bo jest ono wpisane w powszechnie akceptowanysposób oglądu świata. To uwarunkowanie kulturowe14. Wprawdzie w naszym pięknym świecie ta zasadanie zawsze się sprawdza, ale tym chętniej wierzymy, że obowiązuje w idealnym platońskim świecie. I niedziwi, że to prawo jest obecne w matematyce Hilberta, która miała ten idealny świat opisywać.

11Trzeciej możliwości nie ma: albo zdanie jest prawdziwe albo fałszywe (a wtedy jego zaprzeczenie jest prawdziwe).Dlatego alternatywa A ∨ ¬A jest prawdziwa bez względu na wartość logiczną zdania A. To kolejna konsekwencjazałożenia, że klasyczna logika jest dwuwartościowa. Autorstwo tego prawa przypisuje się Arystotelesowi.12Str. 42.13Tzn. nie może się zdarzyć, że (b < dn < c < en) lub dn < Ben < c dla jakiejkolwiek pary (dn, en) ∈ Usim.

Page 197: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 196

Brouwer odżegnywał się od matematycznej transcedencji. W jego matematyce istnieje tylko to,co konstruowalne, a prawdziwe jest to, co konstruktywnie uzasadnione. Prawdziwość zdania nie jestjego atrybutem niezależnym od naszej aktywności - wymaga uzasadnienia. I może się zdarzyć, żenie umiemy uzasadnić ani zdania A ani jego zaprzeczenia ¬A.Oto przykład: określmy ciąg liczb wymiernych (gn : n ∈ N) :

gn =

1 hipoteza Goldbacha jest prawdziwa,15

0 przeciwnym wypadku.

Ten ciąg Cauchy’ego wyznacza pewną liczbę rzeczywistą. Ta liczba „istnieje”. Posiłkując się kla-syczną logiką udowodnimy to istnienie tak: oznaczmy zdanie „hipoteza Goldbacha jest prawdziwa”skrótem HG. Wówczas:

HG→ (1 = lim gn)→ ∃x(x = lim gn),¬HG→ (0 = lim gn)→ ∃x(x = lim gn).

Zatem (HG ∨ ¬HG) → ∃x(x = lim gn). Ponieważ - na mocy prawa wyłączonego środka! - po-przednik tej implikacji jest prawdziwy, to i następnik jest prawdziwy: istnieje liczba rzeczywistawyznaczona przez ciąg (gn).

Ale ta liczba nie jest konstruktywną liczbą rzeczywistą. Wiemy o niej niewiele - czy potrafimynp. orzec, czy jest ona mniejsza od 1

2?

Można rozumieć nadzieje Hilberta że te dylematy znikną, gdy stworzymy matematyczny raj -zupełną teorię pozwalającą dowieść prawdziwości dowolnego zdania lub jego zaprzeczenia. Teorię,w której dowodliwość będzie tożsama z transcedentną prawdziwością. Ale dziś, gdy znamy wynikiTuringa, Godla i Cohena wiemy, że to niemożliwe.

Dlatego, mówią konstruktywiści, powinniśmy odrzucić prawo wyłączonego środka. W ten sposóbzaistniała logika intuicjonistyczna, powszechnie kojarzona z brouwerowską wizją matematyki16.

11.2.1 Formalizacja zdaniowej logiki intuicjonistycznej„Constructivism is the point of view that mathematical objectsexist only in so far they have been constructed and that proofsderive their validity from constructions” [11]

W matematyce Hilberta wszystkie teorie mają część wspólną - klasyczne aksjomaty logiczne.Logika poprzedza matematykę, jest od niej niezależna. Wierzymy, że ta logika jest trafnie wybraną pod-stawą opisu platońskiej rzeczywistości matematycznej. Ale właściwie dlaczego?

Brouwer nie utożsamiał konstruktywnego uzasadnienia z formalnym dowodzeniem. Konstruk-tywne uzasadnienie to, jak twierdzą niektórzy, pojęcie pierwotne jego matematyki [113]. Dlategonie dziwi, że wyodrębnienie z tej matematyki jej logicznego fragmentu i jego formalizacja na wzóri podobieństwo logiki klasycznej, nie jest jego dziełem. To dzieło jego ucznia, A. Heytinga - twórcylogiki intuicjonistycznej17.

14Świadczy o tym nasz język. Alternatywę (a = b) ∨ (a 6= b) (czyli (a = b) ∨ ¬(a = b)) zwykliśmy czytać: a i bsą równe lub nierówne”. To oznacza prymat terminu „równe”, bo przedrostek „nie” traktowany jest dopełniająco.Przywrócimy symetrię, czytając tę formułę tak: „a i b są równe lub są rozróżnialne”. Teraz oba człony alternatywyjednakowo domagają się uzasadnienia. I jest mniej pewne, że te stwierdzenia wzajemnie się dopełniają („rozróżnial-ność” - apartness - jest badana w ramach logiki intuicjonistycznej [35]). Dodajmy, że Leibniz rozumiał „równość”jako „nierozróżnialność”. Russel to doprecyzował uznając, że dwa obiekty są równe, gdy nie są rózróżnialne w danymjęzyku opisu.15„Każda liczba naturalna parzysta większa od 2 jest sumą dwóch liczb pierwszych”. Ta hipoteza, jak dotąd, nie

doczekała się dowodu.16Brouwer pisał: „The belief in the universal validity of the principle of excluded third in mathematics is considered

by the intuitionist as a phenomenon of the history of civilization of the same kind as the former belief in the rationalityof π or in the rotation of the firoment about the earth”.17Arend Heyting (1898-1980) holenderski matematyk i logik. Brouwer nie cenił zbytnio pomysłu Heytinga nazy-

wając (podobno) jego prace „bezpłodnymi ćwiczeniami”. Ale stało się... .

Page 198: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 197

Obie logiki - klasyczna i intuicjonistyczna - to logiki tego samego języka. Pierwsza opisuje jakwartość logiczna zdania zależy od jego struktury i wartości logicznych jego składowych. Druga mainny cel: mówi jak - w zależności od struktury zdania - winno wyglądać jego uzasadnienie.

Te oczekiwania wobec kształtu konstruktywnych uzasadnień funkcjonują w literaturze jako BHK- postulaty18. W odniesieniu do logiki zdaniowej sformułowane są tak:

implikacja. „uzasadnienie formuły B → A to procedura, która zastosowana do jakiegokolwiekuzasadnienia B buduje uzasadnienie zdania A”koniunkcja. „uzasadnienie formuły A∧B to para uzasadnienień (dA, dB) - odpowiednio dla formułA i B”,alternatywa. „uzasadnienie alternatywy A∨B to albo uzasadnienie zdania A albo uzasadnieniezdania B”

Negacja została zdegradowana - to tylko implikacja A → ⊥ , gdzie ⊥ symbolizuje zdanie bezuzasadnienia:

¬A ≡ A→ ⊥Uzasadnieniem negacji ¬A jest procedura, która falsyfikuje każdą próbę (konstruktywnego) uza-sadnienia A.

Te postulaty sformułowano w duchu logiki założeniowej - nie mówią, czym jest uzasadnienie zdań prostych.One mówią, jak konstruować uzasadnienie zdania złożonego odwołując się do uzasadnień zdań prostych,z których jest ono zbudowane.

Postulat dotyczący alternatywy nie dopuszcza wyjątków: uzasadnienie formuły A∨¬A wymagaalbo uzasadnienia A, albo wskazania procedury falsyfikującej każdą próbę takiego uzasadnienia.Prawo wyłączonego środka tu nie obowiązuje.

BHK-postulaty przywracają impikacji podmiotowość: B → A nie jest już synonimem alternatywy ¬B∨A.

Niech B = „w rozwinięciu dziesiętnym liczby π jest 20 kolejnych siódemek” a A = „w rozwinięciu dziesięt-nym π jest 19 kolejnych siódemek”. Implikacja B → A jest w sposób oczywisty konstruktywnie zasadna.A co z uzasadnienem alternatywy ¬B ∨A zgodnym z BHK-postulatami?19.

Uzupełnijmy tę prezentację BHK-postulatów ważnym zdaniem: „A proof of an atomic propositionA is given by presenting a mathematical construction in Brouwer’s sense that makes A true”.

Formalizacja logiki to związanie z nią systemu dowodzenia. Potrzeba tylko skromnej modyfikacjiklasycznego systemu dedukcji naturalnej, by otrzymać taki system dla zdaniowej logiki intuicjoni-stycznej - wystarczy odrzucić jedną jedyną regułę odpowiedzialną za budowanie dowodów poprzez„doprowadzanie do sprzeczności”:

Γ,¬A ` ⊥Γ ` A

Formuła A jest prawem zdaniowej logiki intuicjonistycznej o ile sekwent ` A (o pustym poprzed-niku) ma dowód w tak zmodyfikowanym systemie dedukcji naturalnej.18Lub BHK - interpretacji. B- Brouwer, H- Heyting, K- Kołmogorow. Logika intuicjonistyczna zaliczana jest do

klasy logik ... dewiacyjnych(!) ponieważ nie zmieniając składni języka odrzuca pewne klasyczne prawa logiczne.19Ten przykład podał A. Heyting [35]. Dla dopełnienia obrazu dodajmy ładne porównanie obu logik, przedstawione

przez P. Urzyczyna w wykładzie „From Tarski to Girard” (dostępnym w internecie):Tarski: The logical value paradigm.

Formula = a declarative assertion about some „reality”.Correctness criterion = truth (logical value).Semantics has priority over proof. Proof = just a tool; its shape is not essential, we only ask if one exists.Logic = determining if a sentence is true.The role of a logical connective = define the truth of a compound sentence in terms of the values of its components.

Brouwer: The construction paradigmReasoning is primary, semantics is just a tool.Correctness criterion = construction.The role of a logical connective = express a construction of a compound sentence in terms of constructions of itscomponents..

Page 199: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 198

Pięknie ... . Długą opowieść o nowej logice sprowadziliśmy do odrzucenia jednej jedynej reguły dowodzeniai arbitralnego stwierdzenia, że po tym zabiegu zamiast o dowodzeniu można mówić o „konstruktywnychuzasadnieniach”. Ale właściwie dlaczego?20

Różnica jest głębsza: w logice klasycznej sekwent B1, . . . , Bk ` A interpretujemy tak: zdanie A jestprawdziwe jeśli tylko zdania B1, . . . , Bk są prawdziwe” a w logice intuicjonistycznej tak: - „potrafimyzbudować hipotetyczny dowód A w oparciu o hipotetyczne dowody B1, . . . , Bk”. To, że w obu sytuacjachkorzystamy z tego samego formalnego zapisu to tylko przypadek.Jeśli szukasz argumentu, że matematyka to coś więcej niż manipulacja napisami, to właśnie go znalazłeś...

Ważkim argumentem na rzecz pomysłu Heytinga jest to, że rozbudowując nieco składnię (me-ta)języka sekwentów stworzymy system, w którym równolegle do budowy dowodu formuły genero-wany jest opis jego uzasadnienia. Te opisy to - poznane przy okazji omawiania teorii obliczalności- λ-termy(!). Wystarczy sekwenty zastąpić napisami postaci k1 : B1, . . . , kn : Bn ` a : A , któreczytamy tak: „a jest uzasadnieniem formuły A zbudowanym w oparciu o uzasadnienia k1, . . . , knformuł B1, . . . , Bn”21. Trzeba też trochę zmodyfikować aksjomaty i reguły takiego systemu: jedynyschemat aksjomatu wygląda teraz tak:

Γ ` x : A(x : A) ∈ Γ

i stwierdza oczywistość: „jeśli zakładamy, że formuła A ma uzasadnienie x , to możemy uznać, żex jest uzasadnieniem formuły A” 22

Reguły związane z implikacją mają teraz taką postać:

Γ ` m : B → A, Γ ` b : B

Γ ` mb : A(app)

Γ ∪ x : B ` t : A

Γ ` λx:B t : B → A(abs)

Reguła (app) mówi: „jeśli m jest uzsadnieniem implikacji B → A a b - uzasadnieniem B, to napis mbuznajemy za opis uzasadnienia formuły A”Reguła (abs) : „jeśli potrafimy - korzystając z hipotetycznego uzasadnienia x : B - skonstruować uza-sadnienie t formuły A, to takie postępowanie uznajemy za uzasadnienie implikacji B → A i oznaczamysymbolem λx:B t”„Operator λ wiąże zmienne” - w wyrażeniu λx:B t zmienna x jest związana co oznacza, że uzasadnienieopisane przez to wyrażenie nie jest już hipotetyczne (o ile w t nie ma innych niezwiązanych zmiennych).

Wykorzystanie aplikacji i abstrakcji do budowy wyrażeń opisujących uzasadnienia implikatyw-nego fragmentu zdaniowej logiki intuicjoninstycznej to sens tzw. izomorfizmu Curry’ego-Howarda23.

I tak np. korzystając z aksjomatu x : A ` x : A i reguły (abs) wyprowadzimy sekwent ` λx:Bx :A → A . λ-term λx:A x to opis najprostszego uzasadnienia implikacji A → A - procedury „nie róbnic” (z uzasadnieniem A by otrzymać uzasadnienie A)24.A biorąc za punkt wyjścia aksjomat x : A, y : B ` x : A zbudujemy λ-term λx:A(λy:Bx) opisującyuzasadnienie formuły A→ (B → A). I tak dalej...

Rozbudowując język λ-rachunku można rozszerzyć izomorfizm Curry-Howarda i budować opisyuzasadnień wszelkich formuł zdaniowych. Np. reguły dotyczące koniunkcji wyglądają wówczas tak:20Przypomnijmy: dla Brouwera „konstruktywne uzasadnienie” było pojęciem pierwotnym, czyli w pewnym sensie

nieopisywalnym. Zapewne to był powód rezerwy Brouwera wobec poczynań Heytinga... .21„Let us write “a : A” for „a is a construction that establishes A” [111]. Jedno z możliwych znaczeń słowa

„establish” to „ustanawiać”. My używamy terminu „uzasadnienie” czy też „konstruktywne uzasadnienie” traktującje jako odpowiednik „ustanowienia”.22Symbol x jest tu zmienną języka opisu uzasadnień. Zapis „x : A” reprezentuje hipotetyczne uzasadnienie A.23Implikatywny fragment intuicjonistycznej logiki zdaniowej obejmuje formuły budowane ze zmiennych zdaniowych

tylko za pomocą spójnika implikacji (a nie koniunkcji, alternatywy czy negacji).Uwaga: λ-termy tu użyte różnią się nieco od wcześniej poznanych. Ale to nie jest teraz istotne (korzystamy tu zpewnej odmiany λ-rachunku - tzw. λ-rachunku z typami a la Church).24„β-redukcja’ λ-termów może być w tej nowej sytuacji interpretowana jako upraszczanie („normalizacja”) opisów

uzasadnień. Nasze stwierdzenie „nie rób nic” usprawiedliwione jest przez β-redukcję (λx:A x)a→β a .

Page 200: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 199

Γ ` a : A Γ ` b : BΓ `< a, b >: A ∧B

Γ ` t : A ∧BΓ ` Π1t : A

Γ ` t : A ∧BΓ ` Π2t : B

co - jak widać - wymaga rozszerzenia składni λ-rachunku o konstruktor pary i dwa „rzutowania”.Nie opiszemy tu kolejnych wersji-rozszerzeń izomorfizmu Curry-Howarda25. A to dlatego, że

wcale nie jest pewne, czy w trakcie kolejnych rozszerzeń nie gubimy tego, co chcemy rozumiećprzez konstruktywne uzasadnienie: „Until around 1990 there was a widespread consensus to theeffect that „there is no Curry-Howard isomorphism for classical logic.” However, at that time T.Griffin made a pathbreaking discovery which have convinced most critics that classical logics havesomething to offer the Curry-Howard isomorphism” [111]...

Nowa rola negacji

Negacja ¬A to tylko skrót implikacji A→ ⊥. Ale warto się jej bliżej przyjrzeć, bo to ujawni nietylko różnice ale i subtelne związki między logiką klasyczną i intuicjonistyczną.

Klasyczne prawo podwójnej negacji - równoważność A ↔ ¬¬A - nie obowiązuje w logice in-tuicjonistycznej - to wiemy26. Ale jest nim implikacja A → ¬¬A. Uzasadnimy to nieformalnie,odwołując się do BHK-interpretacji.

Uzasadnienie formuły ¬¬A to procedura, umożliwiająca falsyfikację wszelkich procedur spro-wadzających do absurdu uzasadnienia A (uff...). Dlatego każde uzasadnienie A wyznacza taką otoprocedurę uzasadnienia ¬¬A: „każdemu kto twierdzi, że ma procedurę sprowadzania dowolnegouzasadnienia A do absurdu, pokaż to uzasadnienie A”. To, bezdyskusyjnie, jest uzasadnieniemimplikacji A→ ¬¬A .

Jeszcze ciekawsza jest implikacja ¬¬¬A→ ¬A. Uzasadnieniem ¬¬¬A jest procedura - nazwijmyją Pr - falsyfikująca każde uzasadnienie ¬¬A. Ale, jak pokazaliśmy, każde uzasadnienie A dajesię łatwo przekształcić w uzasadnienie ¬¬A. Zatem procedura Pr musi też falsyfikować dowolneuzasadnienie formuły A czyli jest uzasadnieniem formuły ¬A ... . Dlatego równoważność ¬¬¬A↔¬A jest prawem logiki intuicjonistycznej27.

Ale najciekawsze jest to, co o podwójnej negacji mówi twierdzenie Glivenki:28

„formuła A jest prawem klasycznej logiki zdaniowej dokładnie wtedy, gdy jej podwójna negacja- ¬¬A - jest prawem logiki intuicjonistycznej.”

Klasyczna równoważność A↔ ¬¬A zostaje zastąpiona przez „równoważność dowodliwości” tych formułw obu rozważanych logikach.

Stąd jeśli tylko formuła zdaniowa A jest stabilna (czyli - w logice intuicjonistycznej - A↔ ¬Bdla pewnej formuły B) to jest ono prawem intuicjonistycznej logiki zdaniowej dokładnie wtedy, gdyjest prawem klasycznej logiki zdaniowej29.

Logikę klasyczną od intuicjonistycznej różni arbitralne założenie, że każda formuła zdaniowa jest stabilna(bo zawsze B ↔ ¬¬B). Wyłącznie.Wychowani w tradycji klasycznej skłonni jesteśmy traktować logikę intuicjonistyczną jako ciekawostkę,niegroźną dewiację pozbawioną większego (matematycznego) znaczenia. Wynik Glivenki pozwala mówić,że jest odwrotnie: logika klasyczna jest tylko „wersją” logiki intuicjonistycznej, znajdująca zastosowaniewtedy, gdy ograniczamy się do zdań stabilnych30.

25Zainteresowanych odsyłam do [111] (Rozdział IV).26To takie małe kłamstwo - udowodnimy to dopiero za chwilę, gdy będziemy mówić o modelach Kripkego.27W logice intuicjonistycznej „przez sprzeczność” dowodzimy tylko stwierdzeń negatywnych... .28Valery Glivenko (1896-1940), matematyk ukraiński29Jeśli ¬B ma intuicjonistyczny dowód, to ma go też równoważna formuła ¬¬¬B . A to - na mocy twierdzenia

Glivenki - oznacza, że ¬B ma klasyczny dowód.30Warta uwagi ciekawostka: formuła zdaniowa A jest rozstrzygalna gdy (A ∨ ¬A) jest prawem logiki intuicjoni-

stycznej a stabilna gdy ¬¬A → A jest takim prawem. „Rozstrzygalność” i „stabilność” nie są - wbraw pozorom -równoważne, bo implikacja (¬¬A→ A)→ (A ∨ ¬A) nie jest prawem logiki intuicjonistycznej!

Page 201: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 200

11.3 Semantyka Kripkego

„Kripke theory is a theory of „possible worlds”(internet)

Przeciwstawiając logikę klasyczną logice intuicjonistycznej sugerowałem, że w tej drugiej niema czegoś takiego jak model zamierzony. To prawda. Ale to nie wykłucza istnienia modeli.

Model Kripkego to dowolny zbiór częściowo uporządkowany (poset) (V,¬)31. Wartościowaniezmiennych w modelu (V,¬) to przyporządkowanie każdej zmiennej zdaniowej p (należącej do usta-lonego a priori zbioru zmiennych zdaniowych) domkniętego w górę podzbioru Vp ⊆ V 32

Model Kripkego wraz z wartościowaniem p Vp to jeden możliwych scenariuszy rozwoju „świata wie-dzy”. Stany wiedzy są reprezentowane przez elementy V a zapis v ¬ w oznacza, że wiedza w stanie vjest mniejsza niż w stanie w.Domknięty w górę podzbiór V1 ⊂ V reprezentuje zasób wiedzy dostępnej we wszystkich stanach tegopodzbioru. Zbiór V reprezentuje „wiedzę powszechną”, dostępną we wszystkich stanach. Zbiór pusty topoziom wiedzy nieosiągalny w żadnym stanie.Zbiór Vp to zasób wiedzy wystarczający (niezbędny) do uzasadnienia zdania reprezentowanego przezzmienną p w tym scenariuszu. Napis „v ∈ Vp” czytamy: „stan wiedzy v pozwala na uzasadnienie p” lubkrótko: „ v uzasadnia p”33.

Wartościowanie zmiennych p Vp rozszerzamy wiążąc z każdą formułą zdaniową A domknięty wgórę zbiór VA ⊆ V (reprezentujący minimalny zasób wiedzy wystarczający do uzasadnienia zdaniareprezentowanego przez formułę A przy tym wartościowaniu zmiennych). Te zbiory definiujemyrekurencyjnie:

V⊥ = ∅ V> = V ,v ∈ VA∧B ↔ v ∈ VA oraz v ∈ VB,v ∈ VA∨B ↔ v ∈ VA lub v ∈ VB,v ∈ VA→B ↔ dla dowolnego w ­ v , jeżeli w ∈ VA, to również w ∈ VB .W szczególności V¬A to największy podzbiór domknięty w górę rozłączny z VA.

Na szczególną uwagę zasługuje interpretacja zbioru VA→B:

v ∈ VA→B jeżeli w tym stanie wiemy dość, by każde hipotetyczne uzasadnienie A przekształcić w hi-potetyczne uzasadnienie B co rozumiemy tak: jeśli tylko w przyszłym stanie w ­ v uzasadnimy A, tobędziemy zdolni przekształcić to uzasadnienie A w uzasadnienie B .Stąd VA ⊆ VB dokładnie wtedy, gdy VA→B = V .V⊥ = ∅ - w każdym modelu34..

Formuła A jest uzasadniona w stanie v przy wartościowaniu p Vp gdy v ∈ VA . Jest uzasad-niona w modelu (V,¬) gdy jest uzasadniona w każdym jego stanie przy każdym wartościowaniu.

Fundamentalne twierdzenie o zupełności mówi, że:„formuła zdaniowa A jest prawem logiki intuicjonistycznej dokładnie wtedy, gdy jest uzasad-

niona w każdym modelu Kripkego.”

Zdanie Z jest prawem logiki intuicjonistycznej gdy jego uzasadnienie w dowolnym modelu nie wymagażadnej wiedzy - bez względu na to, jak określimy minimum wiedzy niezbędne do uzasadnienia zdańprostych występujących w Z zdanie to ma uzasadnienie”.

Spójrzmy na prosty model Kripkego:31Saul A. Kripke (1940- ) - amerykański logik i filozof. Relacja „¬” jest zwrotna, przechodnia, i antysymetryczna

- ∀v,w(v ¬ w) ∧ (w ¬ v)→ v = w. „Poset” to zgrabny skór angielskiej nazwy partially ordered set.32Vp jest domknięty w górę, gdy (v ∈ Vp) ∧ (v ¬ w)⇒ (w ∈ Vp).33Logicy piszą v p zamiast v ∈ Vp i nazywaja tę relację forsingiem co odpowiada angielskiemu terminowi

„forcing”. Forsing to „wymuszanie”. Wolę mówić o „umożliwianiu”.34Nigdy nie osiągniemy stanu wiedzy, pozwalającego uzasadnić fałsz. Chyba, że jesteśmy szaleńcami (politykami)...

Page 202: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 201

2 p, q 3 r

1 p

OO

0

cc

FF

i wartościowanie zmiennych p, q, r takie, że Vp = 1, 2, Vq = 2, Vr = 3. To oznacza np. że wstanie 2 „wiemy” (potrafimy uzasadnić) p i „wiemy” q , a w stanie 0 „nie wiemy nic”.W tym modelu:

1. V¬¬q = 1, 2 czyli V¬¬q 6= Vq. To potwierdza, że „prawo podwójnej negacji” - formuła¬¬p↔ p - nie jest prawem logiki intuicjonistycznej.

2. Nierówność Vp∨V¬p 6= V pokazuje, że prawo wyłączonego środka nie obowiązuje w tej logice.3. Vq→p = V natomiast V¬q∨p = 2, 3 - równoważność (A→ B)↔ (¬A∨B) nie jest prawem

logiki intuicjonistycznej35 .4. 0 /∈ V(p→r)∨(r→p) - formuła (p→ r) ∨ (r → p) nie jest prawem logiki intuicjonistycznej 36.

Każdy model Kripkego (V,¬) wyznacza lokalną logikę L(V,¬). Jej prawami są formuły uzasad-nione w tym modelu. Ta logika ma miłą sercu mainstreamowców cechę - posiada własną matrycęwartości logicznych którą jest zbiór wszystkich domkniętych w górę podzbiorów V .

Przykład. Dwuelementowy poset (0, 1, 0 ¬ 1) ma trzy domknięte w górę podzbiory -∅ ⊂ 1 ⊂ 0, 1 czyli wyznacza logikę z trójelementową matrycą wartości logicznych. Oznaczającte wartości odpowiednio przez 0 ¬ 1

2 ¬ 1, „rachunek wartości” tej logiki opiszemy tak:v ∧ w = min(v, w), v ∨ w = max(v, w) , a implikację B → A tak:

B \A 0 12 1

0 1 1 112 0 1 11 0 1

2 1

Nietrudno teraz wyobrazić sobie logikę, którą otrzymamy zastępując dwuelementowy łańcuch 0 ¬ 1łańcuchem n-elementowym... .

Jednoelementowy model Kripkego wyznacza klasyczną logikę zdaniową37.

W jednoelementowym modelu Kripkego wiedza jest niezmienna (transcedentna?). To świat platoński. Tukażde zdanie, któremu można przypisać wartość logiczną, jest prawdziwe lub fałszywe bez względu nato, czy umiemy to uzasadnić.

W odróżnieniu od logiki klasycznej, zdaniowa logika intuicjonistyczna nie ma uniwersalnego,skończonego modelu Kripkego (V,¬) - takiego, że prawa logiki L(V,¬) są dokładnie takie same,jak prawa logiki intuicjonistycznej38. Mamy tu tylko nieco słabsze twierdzenie:

„formuła zdaniowa A jest prawem logiki intuicjonistycznej dokładnie wtedy, gdy jest uzasad-niona w każdym skończonym modelu Kripkego”.35To zwalnia nas z obowiązku ekwilibrystycznego tłumaczenia, że jedno ze zdań „Jeśli Kasia przypaliła zupę to w

Krakowie pada deszcz” i „jeśli w Kakowie pada deszcz, to Kasia...” jest prawdziwe.36Korzystając z modeli Kripkego można pokazać, że: „jeśli alternatywa A∨B jest prawem logiki intuicjonistycznej,

to jest nim również formuła A lub formuła B”.Szkic dowodu: gdy żadna z formuł A, B nie jest takim, to - na mocytwierdzenia o zupełności - istnieją modele Kripkego (V A,¬A) i (V B ,¬B) falsyfikujące te formuły. Model falsyfikującyalternatywę A∨B zbudujemy dodając do rozłącznej sumy V A ∪V B nowy, „najmniejszy” element „0” (zachowujemyporządki w zbiorach V A i V B . Przyjmujemy, że elementy z V A nie są porównywalne z elementami z V B i vice versa.0 jest mniejsze wszystkich pozostałych elementów.)37Ten poset ma dwa podzbiory domknięte w górę.38Można wskazać pojedynczy nieskończony uniwersalny model Kripkego (V,¬). Ale ten model nie jest ani przy-

datny ani specjalnie interesujący.

Page 203: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 202

To wystarczy by pokazać, że intuicjonistyczna logika zdaniowa jest rozstrzygalna39.

Logika intuicjonistyczna szuka odpowiedzi na pytanie, jak uzasadnienie zdania złożonego zależy od uza-sadnień zdań prostych korzystając przy tym z „uzasadnień hipotetycznych”. Pytanie o wartość logicznązdania jest tu na drugim planie.Heytingowska logika intuicjonistyczna to wspólny rdzeń logik wyznaczonych przez modele Kripkego. Lo-gika klasyczna jest tylko jedną z nich.

„Logika mówi o każdej możliwości i wszystkie możliwości są jej faktami (...). Jeżeli mogę pomyśleć przed-miot w kontekście stanu rzeczy, to nie mogę go pomyśleć poza możliwością tego kontekstu.” - L. Witt-genstein.

11.3.1 Semantyka algebraiczna i topologiczna

Dzięki opowieści o „stanach wiedzy”, modele Kripkego trafiają do naszej wyobraźni. To ważne- z psychologicznego punktu widzenia („trzeci wymiar języka”...). Ale do formalnego określeniasemantyki formuł w modelu (V,¬), wystarczy znajomość struktury jego „zasobów wiedzy” repre-zentowanych przez domknięte w górę podzbiory V .Tę strukturę rozpoznano i nazwano: domknięte w górę podzbiory modelu Kripkego to algebraHeytinga (zwana też „kratą brouwerowską” lub algebrą pseudoboolowską):

Algebra Heytinga to poset (H,¬) z elementem największym - > - i najmniejszym - ⊥ - wktórym każda para elementów (a, b) ma kres górny - a ∨ b , dolny - a ∧ b i tzw. pseudodopełnienie- a→ b - największy element taki, że a ∧ (a→ b) ¬ b co zapiszemy tak:

c ∧ a ¬ b wtw c ¬ a→ b.dla dowolnych elementów a, b, c ∈ H.40

To prowokuje do zdefiniowania semantyki intuicjonistycznej logiki zdaniowej w dowolnej al-gebrze Heytinga, bez odwołań do „posetu stanów wiedzy”. I tak zrobiono: to tzw. semantykaalgebraiczna. A to, co najważniejsze pozostało niezmienione:

„formuła A jest prawem logiki intuicjonistycznej dokładnie wtedy, gdy jest prawdziwa w dowol-nej algebrze Heytinga - przy każdym wartościowaniu przyporządkowana jej jest wartość >”.

Algebry Heytinga są ściśle związane z ... przestrzeniami topologicznymi:„rodzina zbiorów otwartych T dowolnej przestrzeni topologicznej (X, T ) jest algebrą Heytinga”41.Nasze najważniejsze twierdzenie może przyjąć teraz taką postać:

formuła A jest prawem intuicjonistycznej logiki zdaniowej jeżeli jest prawdziwa w algebrzeHeytinga zbiorów otwartych dowolnej przestrzeni topologicznej.a nawet taką skrajną postać:

„formuła A jest prawem intuicjonistycznej logiki zdaniowej dokładnie wtedy, gdy jest prawdziwaw pojedynczym modelu - algebrze Heytinga otwartych podzbiorów prostej rzeczywistej” [111].

Początkujący studenci poznają prawa klasycznej logiki zdaniowej i uczą się jak je interpretować w algebrzeBoole’a podzbiorów dowolnego zbioru.Gdyby edukację matematyczną rozpoczynać od intuicjonistycznej logiki zdaniowej należało by algebręBoole’a zastąpić „algebrą Heytinga otwartych podzbiorów dowolnej przestrzeni topologicznej”42.

39Wystarczy równolegle realizować dwie procedury sprawdzające: pierwszą, polegajacą na poszukiwaniu skończo-nego modelu Kripkego falsyfikującego badaną formułę. Drugą, próbującą skonstruować jej dowód. Jedno (dokładniejedno) z tych postępowań musi zakończyć się sukcesem... .40Ponieważ te algebry będą tu wykorzystywane w głównie „kontekście logicznym”, element a∧b nazywać będziemy

koniunkcją , element a ∨ b - alternatywą a element a→ b - implikacją elementów a i b. Dodatkowo implikację a→ ⊥nazwiemy negacją elementu a. Wróć na chwilę na str. ??.41> = X, ⊥ = ∅ . „∧” to teoriomnogościowy przekrój, „∨” to suma, V → U to wnętrze zbioru U ∪ (X \ V ). W

szczególności ¬V to wnętrze zbioru X \ V . O przestrzeniach topologicznych mówiliśmy wcześniej (str. 40).42Algebra Boole’a to algebra Heytinga w której prawdziwa jest dodatkowa równość: a→ b = ¬a ∨ b.

Page 204: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 203

11.4 Logika intuicjonistyczna pierwszego rzędu

H: I have just proved ∃xA(x),B: Congratulations! What is it?H: I don’t know. I assumed ∀x ¬A(x) and derived a contradiction.B: Oh. You proved ¬∀x ¬A(x) . That’s what I said.”

„H” chwali się dowodem istnienia obiektu o własności opisanej formułą A(x) - pokazał, że braktakiego obiektu prowadzi do sprzeczności. Jego oponent - „B” - twierdzi, że w ten sposób wykazałon jedynie, że nie jest możliwe, by żaden obiekt nie miał tej własności... . Skąd ten spór43?

W obu logikach - klasycznej i intuicjonistycznej - uznajemy równoważność ∀x¬A(x)↔ ¬∃xA(x).- „to, że żaden element nie ma własności A(x) jest równoważne stwierdzeniu, że nie istnieje ele-ment, który ma tę własność”. Negując obie strony otrzymamy nową równoważność - ¬∀x ¬A(x)↔¬¬∃xA(x). Do tego momentu panowie się zgadzają.Wierny klasycznej logice matematyk hilbertowski - „H” - wykorzysta teraz prawo podwójnej ne-gacji - ¬¬A→ A - i uzna kolejną równoważność: ∃xA(x)↔ ¬∀x ¬A(x) - „obiekt o własności A(x)istnieje, gdy nie jest prawdą, że żaden obiekt nie ma własności A(x)”.A pan „B” - matematyk brouwerowski - nie uznaje tego prawa. W jego logice „statement ∃xA(x)is regarded as a partial communication, to be supplemented by providing an element a whichsatisfies A(x)” [124] . Stąd ten spór44.

W klasycznej logice sąd pozytywny, przesądzający o istnieniu, jest równoważny sądowi negatywnemu.Zważywaszy rolę, jaką w matematyce Hilberta przypisano formalnym dowodom istnienia, to dość ryzy-kowne... .A wszystko to za sprawą „tertium non datur”.Czy musimy bezkrytycznie akceptować takie prawa? Hilbert też miał wątpliwości. Pisał: (...) „law ofthe excluded middle” should not be uncritically adopted as logically unproblematic” . Ale ostateczniestwierdził: „the application of tertium non datur can never lead to danger”. [97]

BHK-postulaty dotyczące kwantyfikacji sformułowano tak:

„konstruktywnym uzasadnieniem formuły ∀x φ(x) jest procedura, która pozwala na przekształ-cenie konstrukcji dowolnego elementu a w konstruktywne uzasadnienie zdania φ(x)[x := a].

„uzasadnienie ∃x φ(x) to procedura, która konstruuje element a i przekształca jego konstrukcjęw uzasadnienie formuły φ(x)[x := a]”.

Czym jest ów „element a” przywoływany w sformułowaniach obu BHK-postulatów? „a ∈ D whereD is the domain of discourse (over which the variable range)” [113]. Termin „domain of discourse”można tłumaczyć jako „dziedzina, przedmiot rozważań”. To konstruowalny obiekt matematyczny,w którym umiemy interpretować język rozważanych formuł. Jego elementy muszą mieć swoje nazwy,opisy. To niezbędne by można było mówić o czymś takim jak φ(x)[x := a].

„Uzasadnienie” jest zależne od rozważanej dziedziny.„(...) “proof” should not be understood in the senseof a formal proof in some logical calculus (...) rather as an informal basic notion (like truth in case ofclassical logic)” - napisano w [113] opisując to, co nazwaliśmy tu uzasadnieniem.Wbrew mylącemu skojarzeniu - uzasadnienie to „proof” a proof to dowód - to zdanie lokuje pojęcieuzasadnienia po tej samej stronie, po której jest „prawdziwość” - po stronie semantycznej.

BHK-postulaty to nie aksjomaty45. To drogowskaz którym mamy się kierować konstruując kolej-ne „domains of discourse” i związane z nimi pojęcie uzasadnienia. Przykładem takiego rozumieniaBHK-postulatów jest realizowalność Kleene’ego o której opowiemy za chwilę.Jednak matematyce trudno poprzestać na enigmatycznych postulatach: oczekujemy formalizacji in-

43Przytoczony tu dialog otwiera artykuł E. Nelsona „Understanding intuitionism”.44Dlatego pan „B” nie akceptuje też dowodu twierdzenia Henkina (str. 163). Konsekwencją odrzucenia implikacji¬∀x ¬A(x) → ∃xA(x) jest też to, że konstruktywiści rozróżniają pojęcia: zbioru niepustego - ¬∀y ¬(y ∈ x) i zbioruzamieszkałego - ∃y y ∈ x.45W [112] te postulaty określono jako „informal semantics”.

Page 205: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 204

tuicjonistycznej logiki pierwszego rzędu - stworzenia systemów dowodzenia, takich, że dowodliwośćformuły gwarantuje istnienie jej uzasadnienia w każdej „dziedzinie rozważań”, w której to pojęciejest zgodne z BHK-postulatami46.

Poprzestaniemy na zapewnieniu, że takie systemy stworzono. To skłania do stwierdzenia, żedowody budowane w tych systemach są konstruktywne. Świadczy o tym taki oto wynik:

„zdanie ∃x ψ(x) jest dowodliwe w systemie dedukcji naturalnej pozbawionym reguły dowodzeniaprzez sprzeczność dokładnie wtedy, gdy istnieje term t taki, że formuła ψ(x)[x := t] jest dowodliwa”.Ów term wskazuje (nazywa) elementy, które realizują BHK-postulat dla zdań postaci ∃xψ(x)47

Pomoże nam analiza paradoksu pijaka, który rozpowszechnił R. Symullyan. Zdanie: ”there issomeone in the pub such that, if he is drinking, then everyone in the pub is drinking” jest ab-surdalne. Ale - paradoksalnie - prawdziwe w klasycznej logice. Zapisane formalnie wygląda tak:∃x (p(x) → ∀y p(y)). Jest tu tylko pojedynczy jednoargumentowy symbol relacyjny p co oznacza,że teoriomnogościowym modelem tego języka jest każda para zbiorów (A,Ap ⊆ A)48.To zdanie jest prawdziwe w każdym teoriomnogościowym modelu. Wystarczy osobno rozpatrzyćdwie rozłączne i dopełniające się klasy modeli: pierwsza to modele, w których Ap = A („wszy-scy piją”). Druga to modele w których Ap 6= A („jest ktoś niepijący”). W modelach z pierwszejklasy następnik implikacji jest prawdziwy. W drugim przypadku wyskazując niepijącego osobnikaa0 ∈ A \ Ap sprawiamy, że poprzednik rozważanej implikacji jest fałszywy przy wartościowaniu[x := a0]. A to wystarczy do uzasadnienia prawdziwości rozważanego zdania.Na mocy twierdzenia o zupełności logiki klasycznej, zdanie prawdziwe w każdym teoriomngościo-wym modelu ma dowód49. Jednak to zdanie nie ma dowodu „intuicjonistycznego”. Gdyby miało,to - na mocy przywołanego wyżej twierdzenia - dowodliwa byłaby też formuła p(z)→ ∀xp(x) którączytamy „jeśli ktokolwiek w pubie pije, to wszyscy piją”50. A w to trudno uwierzyć... .

KONIG

11.4.1 Arytmetyka intuicjonistyczna

Z każdą klasyczną teorią T można skojarzyć jej intuicjonistyczną wersję - teorię T i51. Formalizacjaintuicjonistycznej logiki - stworzenie adekwatnych systemów dowodzenia - rodzi pokusę powtórzeniaklasycznej gry między syntaktyką i semantyką, między dowodliwością a prawdziwością zdań.

Czym jest model teorii intuicjonistycznej? To może być każdy teoriomnogościowy model T . Aleto zgrzyta: posługiwanie się różnymi logikami: intuicjonistyczną - gdy mówimy o syntaktyce - iklasyczną - gdy mowa o modelu i spełnianiu - to nie najlepszy pomysł. To niespójne.

Można też definiować pojęcie modelu intuicjonistycznej teorii T i „na nowo”. Takie próby po-dejmowano. I osiągano zamierzone cele52.

Ostatecznie można zechcieć zastąpić klasyczną teorię mnogości przez „intuicjonistyczną teorięzbiorów”. Jednak nie może to być teoria ZFCi bo, jak wiemy, konsekwencją aksjomatu wyboru jestprawo wyłączonego środka. Intuicjonistyczną teorię zbiorów trzeba zbudować inaczej. I to zrobiono.Ale i to nie wydaje się przesadnie interesujące i zgodne z brouwerowską wizją matematyki53. Trzebabardziej radykalnych propozycji - takich jak teoria toposów.

46Pewnie dlatego, że wszyscyśmy wychowali się w tradycji Tarskiego...47To twierdzenie sprawia, że BHK-postulat dla zdań egzystencjalnych formułuje się czasem tak: „whenever ∃xφ(x)

is provable, then φ(t) is provable for some term t”..48W szczególności, modelem jest pub rozumiany jako zbiór ludzi z wyróżnionym podzbiorem pijących.49Dowodzimy osobno zdań ∀y p(y) → (∃x (p(x) → ∀y p(y))) oraz ¬∀y p(y) → (∃x (p(x) → ∀y p(y))). A potem

wystarczy scalić oba dowody korzystając z prawa wyłączonego środka.50Jedyne termy w rozważanym języku to zmienne.51Częścią każdej klasycznej teorii pierwszego rzędu T jest klasyczna logika pierwszego rzędu - FOL. Teorię T i

otrzymamy zastępując FOL logiką intuicjonistyczną pierwszego rzędu.52Modeli powinno być „więcej” by umożliwić udowodnienie twierdzenia o zupełności dla intuicjonistycznych teorii

pierwszego rzędu - to, co prawdziwe w każdym modelu jest dowodliwą konsekwencją T i. Można zajrzeć np. do [111].53Przekonywałem, że relacja „syntaktyka - semantyka” to - w ujęciu Tarskiego - swoista gra językowa. A takie gry

nie były w kręgu zainteresowań Brouwera. Ale może nie mam racji... .

Page 206: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 205

Zanim poznamy toposy (wkrótce) zajmijmy się tym co bezsporne: rozważanie intuicjonistycz-nych wersji klasycznej teorii ma niewątpliwie sens wtedy, gdy ta teoria jest wtórnym opisem pew-nego konstruowalnego obiektu matematycznego.Sztandarowym przykładem takiej teorii jest arytmetyka.

Arytmetyka Peano korzysta ze wsparcia klasycznej logiki pierwszego rzędu. O arytmetyce in-tuicjonistycznej (arytmetyce Heytinga - HA) mówimy wtedy, gdy tę klasyczną logikę zastąpimyjej intuicjonistycznym odpowiednikiem54. Te dwie arytmetyki są „równoważnie niesprzeczne”55 -jedna jest niesprzeczna dokładnie wtedy, gdy druga jest niesprzeczna. Jest to konsekwencja twier-dzenia udowodnionego przez Gentzena i Godla (które można traktować jako uogólnienie twierdzenieGlivenki): dla dowolnej formuły arytmetycznej φ istnieje formuła arytmetyczna φN taka, że

„formuła φ ma dowód w klasycznej arytmetyce Peano dokładnie wtedy, gdy formuła φN madowód w arytmetyce intuicjonistycznej” 56. To oznacza, że i ta arytmetyka nie może dostarczyćdowodu własnej niesprzeczności...

Różnica między arytmetyką klasyczną i intuicjonistyczną jest bardziej subtelna niż się wydaje. Np. teteorie są równoważne gdy ograniczymy się do zdań postaci ∀x∃y α(x, y), gdzie α(x, y) jest formułą bez-kwantyfikatorową57.

Podsumujmy ten podrozdział przywołaniem znakomitego (choć mało eksponowanego) twier-dzenia, które usprawiedliwia ograniczenie omawiania logiki intuicjonistycznej pierwszego rzędu doarytmetyki intuicjonistycznej.

Arytmetyczną instancją formuły pierwszego rzędu sygnatury Σ nazwiemy każdą formułę arty-metyczną otrzymaną przez zastąpienie symboli operacyjnych termami arytmetycznymi a relacyj-nych - formułami arytmetycznymi. Twierdzenie o którym mowa orzeka, że:

formuła φ jest prawem intuicjonistycznej logiki pierwszego rzędu dokładnie wtedy, gdy w HAdowodliwa jest jej każda arytmetyczna instancja.

Powrót do źródeł?58

54HA = PAi. Zazwyczaj ułatwiamy sobie życie dodając - jako nowe aksjomaty - pary równości definiujące wszelkiefunkcje prymitywnie rekurencyjne. „In principle one could base an axiomatisation of constructive arithmetic onthe basic operations 0, succ , addition and multiplication and equality as the only predicate. However, this has thedisadvantage that developing elementary number theory (...) would involve a lot of coding. Therefore, we prefer totake all primitive recursive algorithms as basic constants and postulate their defining equations as axioms” [113].Takie rozszerzenie teorii jest konserwatywne - dodanienowych aksjomatów nie zwiększa zbioru dowodliwych zdań.55„Classical and intuitionistic arithmetic are equiconsistent.”56Godel-Gentzen translation -przyporządkowanie φ φN - nie jest, jak w twierdzeniu Glivenki, „podwójną

negacją”. Jest bardziej skomplikowane [35]. Dodajmy ciekawostkę: gdyby implikacja - „double negation shift” -∀x ¬¬φ(x)↔ ¬¬∀x φ(x) była prawem logiki intuicjonistycznej, to można by przyjąć φN = ¬¬φ. Ale tak nie jest.57PA ` ∀x∃y α(x, y) dokładnie wtedy gdy HA ` ∀x∃y α(x, y) - to twierdzenie udowodnione przez Kreislera [35]58W [86] J. van Oosten pisze, że wprawdzie ten dowód przedstawił D.H.J de Jong w nieopublikowanym artykule

(w 1969r.) ale odniósł tylko „częściowy sukces”. Autorstwo pełnego dowodu van Oosten przypisuje sobie. O tejzawiłej historii można przeczytać w artykule Intermediate logics and the de Jongh property (współautor: De Jongh)dostępnym w internecie.

Page 207: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 12

Kategorie, funktory i toposy

Zwycięstwem będzie przede wszystkimDobrze widzieć z dalekaWszystko widzieć z bliskaI żeby wszystko miało nowe imię.

G. Apollinaire

„Categories, initially a convenient way of formulating exact sequences, diagram chasing andaxiomatic homology for topology, aquired independent life in the work of Ehresmann (...) in France,and in United States in the work of Kan and McLane, and in a group around Eilenberg (...) .Then in 1963 Lawvere embarked on the daring project of a purely categorical foundations of allmathematics” [69].

12.1 Język kategorii

„Mathematics is the art of giving the same nameto different things”

H. PoincareTeoria kategorii oferuje schemat poznawczy pozwalający opisywać różne fragmenty matema-

tycznego uniwersum. Dostarcza też narzędzi do badania związków między tak opisanymi „mate-matycznymi światami”.

Te światy to kategorie. A związki między nimi opisują funktory.Kategoria to obiekty i morfizmy. Z każdym morfizmem związana jest para obiektów - jego dziedzinai kodziedzina. Piszemy „f : A → B” i mówimy, że „f jest morfizmem z obiektu A do obiektu B”.Morfizmy składamy - jeżeli f : A → B i g : B → C , to ich złożeniem jest morfizm gf : A → C.Składanie jest łączne1. Z każdym obiektem A związany jest morfizm identycznościowy idA : A→ Ataki, że fidA = f = idBf dla dowolnego morfizmu f : A→ B.

Aksjomatyka ZFC to zbiór stwierdzeń arbitralnie dekretujących istnienie pewnych obiektów matema-tycznych: „istnieje zbiór pusty”, „istnieje zbiór induktywny” itd. Ona kreuje rzeczywistość.Aksjomaty teorii kategorii to tylko wskazanie warunków, jakie muszą być spełnione, by dany fragmentrzeczywistości postrzegać i badać jako „kategorię”.Teoria kategorii organizuje poznanie matematyczne. Epistemologia v. ontologia?

Kategorię tworzą zbiory i funkcje. Kategorią są przestrzenie topologiczne z funkcjami ciągłymijako morfizmami. Algebraik będzie zainteresowany kategoriami grup, pierścieni, modułów. Logik -kategorią algebr Boole’a czy też algebr Heytinga.Ale to nie znaczy, że obiektami kategorii muszą być zbiory wyposażone w struktury „tego samego

1f(gh) = (fg)h dla dowolnej trójki składalnych morfizmów.

206

Page 208: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 207

rodzaju”2. Np. każdy graf skierowany może być traktowany jako kategoria: obiektami są tu wierz-chołki grafu, a morfizmy to ścieżki - skończone sekwencje zgodnie skierowanych krawędzi. Kategoriąjest też dowolny poset (P,¬) - obiektami są tu elementy P a (jedyny) morfizm z a do b istniejewtedy, gdy a ¬ b. Strukturę liczb naturalnych można postrzegać jako jednoobiektową kategorię,w której są one morfizmami, a składanie jest realizowane jako dodawanie. Kategorią może byćniemalże wszystko...3.

Budując uniwersalną - w zamierzeniu - teorię mnogości, jej twórcy musieli rozstrzygnąć pewnedylematy, nadając tym rozstrzygnięciom status aksjomatów. Teoria kategorii jest wolna od obo-wiązku rozstrzygania wszelkich dylematów ontologicznych. Dopuszcza współistnienie światów ma-tematycznych - kategorii - w których te kwestie rozstrzygane są odmiennie. Można - obok kategoriiwszystkich zbiorów Set4 w której akceptujemy nieskończoną skalę nieskończoności - rozpatrywaćkategorię zbiorów skończonych Setf w której nieskończoność jest nieobecna. Można wyróżnić ka-tegorię zbiorów przeliczalnych - matematykę z jednym rodzajem nieskończoności. Nie trzeba jużupychać całej matematyki w jednym uniwersalnym modelu.

Wyróżnienie fragmentu matematycznego uniwersum jako kategorii nie oznacza jego odsepero-wania od reszty matematyki. Przeciwnie: to, że różne fragmenty matematyki opisujemy korzystającz tego samego schematu, ułatwia poszukiwanie i opis związków między nimi.

Te związki opisujemy i badamy za pomocą funktorów.

Funktor F : C→ D to odwzorowanie między kategoriami respektujące ich podstawową strukturę: obiektyprzeprowadza na obiekty a morfizmy na morfizmy, zachowując ich składanie oraz identyczności5.

Jeżeli kategorie są lokalnymi światami matematycznymi, to funktory pozwalają na interpretację jednegoświata w drugim. Funktory są różne: mogą „zanurzać” (jedną kategorię w drugą), potrafią „zapomi-nać” (strukturę obiektów), ustalać równoważność między kategoriami. Funktory potrafią „zachowywać”i „kreować” własności obiektów. Są mądrzejsze niż funkcje...6.

Najciekawsze są funktory, które działają między mocno różniącymi się światami-kategoriami.Takie konfrontowanie różnych dziedzin matematyki prowadzi często do niebanalych, a nawet zaska-kujących, odkryć. Np. wyróżnienie („odkrycie”) pewnych funktorów między kategorią przestrzenitopologicznych i kategorią grup pozwoliło na badaniu struktur topologicznych za pomocą narzędzialgebraicznych7.

Przedstawiając teorię ZFC opisałem (starałem się ...) mechanizm poszerzania języka teoriimnogości. Te rozszerzenia były konserwatywne - wprowadzeniu nowego pojęcia zawsze towarzyszyłotwierdzenie o istnieniu jego desygnatu8. Wszelkie tak wprowadzane pojęcia są interpretowalne wkażdym modelu ZFC. To zrozumiałe - wszak ta teoria miała mieć jeden model zamierzony -uniwersum.

Struktura języka kategorii jest inna. W jego warstwie podstawowej pojęć jest mało - „obiekt”,„morfizm” , „złożenie morfizmów” i „morfizm identycznościowy”. I tylko one muszą być interpreto-walne w każdej kategorii. Drugą warstwę tworzą pojęcia interpretowalne tylko w pewnych modelach

2Takie kategorie nazywamy konkretnymi.3W pewnej monografii (prawdopodobnie w książce „Algebraic theories” E. Manesa, ale nie jestem pewny) jako

przykład wskazano kategorię, której jedynym obiektem jest R. Nixon a morfizmem ... banan. (Nixon to przydentUSA o wątpliwej sławie.). Uniwersalny charakter języka kategorii jednych cieszy bardziej, innych mniej. W monografiipoświęconej topologii algebraicznej N.E.Steenrod nazwał teorię kategorii „abstrakcyjnym nonsensem”... .4Bardziej precyzyjnie: kategoria zbiorów to dowolnie wybrany model ZFC. W tej kategorii morfizmy to funkcje.5Jeśli g : A→ B w C, to F (g) : F (A)→ F (B). F (idA) = idF (A) oraz F (gf) = F (g)F (f).6Dla Eilenberga i Mc Lane’a, twórców teorii kategorii, funktor był pojęciem podstawowym:„It should be observed

that the whole concept of a category is essentially an auxiliary one. Our basic concepts are essentially those of afunctor and of a natural transformation... .The idea of a category is required only by the precept that every functorshould have a definite class as domain and a definite class as range, for the categories are provided as the domainsand ranges of functors.” - General Theory of Natural Equivalences’, Transactions of the AMS, 58, pp. 239—94.7Te badania to domena topologii algebraicznej. Można też wygłosić „stwierdzenie odwrotnie”: badania w zakresie

topologii algebraicznej i osągnięte wyniki były istotnym impulsem rozwoju teorii kategorii.8Hipoteza continuum jest tu wyjątkiem. Są i inne, ale ważne jedynie dla „podstawowców”.

Page 209: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 208

tej teorii. To sprawia, że język kategorii umożliwia klasyfikację lokalnych matematycznych światów:pewne kategorie są ubogie, bo interpretujemy w nich tylko podstawowe pojęcia. Inne są bogatsze,bo pozwalają na interpretację pojęć „drugiej (i wyższych) warstw” języka.

Granice

Ważnym pojęciem tej „drugiej warstwy” języka jest granica diagramu.Diagram to graf, którego wierzchołki są etykietowane przez obiekty rozważanej kategorii a krawędzie- przez działające między mimi morfizmy. Diagram może wyglądać np. tak9:

A0φ // A1

A2

ψ

OO

(ten diagram jest posadowiony na grafie z trzema wierzchołkami i dwiema krawędziami). Stożeknad tym diagramem rysujemy tak:

A0φ // A1

A2

ψ

OO

D

f1

::

f2

44f0

GG

Formalnie: stożek nad tym diagramem to obiekt D wraz z morfizmami fi : D → Ai takimi, że„wszystkie trójkąty są przemienne” - φf0 = f1, ψf2 = f1.Granica tego diagramu to stożek uniwersalny (C, (Πi : C → Ai : i = 1, 2, 3)) - taki, że dla każdegoinnego stożka (D, (fi : D → Ai)) istnieje dokładnie jeden morfizm f : D → C dla którego wszystkienowopowstałe trójkąty są przemienne (tzn. Πi · f = fi dla i = 1, 2, 3):

A0φ // A1

C

Π0

OO

Π2 // A2

ψ

OO

Df

>>

f2

44f0

GG

Opisana tu granica to pullback (pary morfizmów (φ, ψ) )10.Aby mówić o dowolnych diagramach i ich granicach wystarczy nasz przykładowy graf zastąpić

jakimkolwiek - skończonym lub nieskończonym - multigrafem skierowanym11. Dalej bez zmian -granica to stożek uniwersalny nad danym diagramem.

Mówiąc o granicach nie tylko rysujemy diagramy, ale też ochoczo korzystamy z języka geometrii - mówimyo „przemiennych trójkątach”, „stożkach”, „prostokątach” itp., itd. To nie jest konieczne.Ale czy bez tych geometrycznych metafor łatwiej zrozumieć, czym jest granica?

9Kategoryści uwielbiają rysować, przepraszam, ilustrować swoje konstrukcje rysunkami-diagramami. Jedną z tech-nik dowodzenia nazwali nawet „diagram chasing” - „bieganie po diagramie”.10Na ostatnim rysunku brak dwóch morfizmów - f1 : D → A1 i Π1 : C → A1. To zgodne z ockhamowska zasadą:

skoro Π1 = φΠ0 = ψΠ2 (i podobnie f1 = ... ), to po co komplikować rysunek dodając coś, co już na nim jest?Kategorysta powie krótko: „ten prostokąt jest pullbackiem”. Niestety, mimo starań nie wymyślono satysfakcjonującegopolskiego odpowiednika tej nazwy... .11„Multi” gdyż dopuszczamy istnienie krawędzi równoległych (czyli o tym samym początku i końcu).

Page 210: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 209

Grafy - bazy diagramów - można wybierać dowolnie. Mamy nieograniczenie, wręcz niewyobra-żalnie wiele rodzajów granic. Ale teoria kategorii oferuje twierdzenie, które wprowadza w tymkosmicznym chaosie „platoński ład”:

„jeżeli w rozważanej kategorii istnieją wszelkie ekwalizatory i (skończone) produkty, to istniejąw niej też wszelkie (skończone) granice”.

- Produkty to granice diagramów dyskretnych, czyli posadowionych na grafach bez krawędzi12.

- Ekwalizator pary „równoległych morfizmów” f, g : A→ B to granica diagramu Af//

g // B .

Trudno o coś prostszego. A jednak to wystarcza do konstrukcji granic nawet najbardziej skom-plikowanych diagramów. Czy to nie jest zaskakujące?

Pojęcie, które obejmuje wiele pozornie różnych konstrukcji, jest wartością samą w sobie: pojedynczetwierdzenie o własnościach granic (ustalonego typu) może być interpretowane w różnych kategoriach i w(pozornie) różnych sytuacjach.„Matematyka jest sztuką nadawania różnym rzeczom tych samych nazw” - pisał H. Poincare.

Granica diagramu może, ale nie musi istnieć - to zależy od tego, z jaką kategorią mamy doczynienia. Dlatego to pojęcie można wykorzystać do klasyfikacji kategorii. Np. mówimy, że kategoriajest (skończenie) zupełna, gdy istnieją w niej granice wszelkich (skończonych) diagramów.

Zasada dualności

Trud włożony w zrozumienie czym jest granica diagramu opłaca się w dwójnasób. A to dlatego, żeteoria kategorii „odkryła” nową prawdę o strukturze matematyki - zasadę dualności.Jej źródłem jest banalna obserwacja: jeśli w dowolnej kategorii C „zmienimy kierunek morfizmów” -tzn. o morfizmie f : A→ B powiemy, że działa on w odwrotnym kierunku, z B do A - to otrzymamynową, poprawnie zdefiniowaną kategorię - kategorię dualną Cop 13.

Dzięki temu w języku kategorii karierę zrobił tajemniczy przedrostek „ko” używany do wskazy-wania pojęć i twierdzeń dualnych. Jak to działa? Na przykład tak:

„Kogranica diagramu D w kategorii C to granica tego diagramu w kategorii dualnej Cop”14

Dlatego w języku kategorii obok produktów mamy koprodukty - kogranice diagramow dyskretnych.Skoro są ekwalizatory, to są też koekwalizatory (par równoleglych morfizmów). I tak dalej15.

To nie zabawa w słowa. Dzięki zasadzie dualności każde twierdzeniem sformułowane w językukategorii ma swą „wersję dualną”. I tak np. dualną wersją przytoczonego wcześniej twierdzenia:

„jeśli w kategorii C istnieją wszelkie (skończone) produkty i ekwalizatory, to istnieją w niejgranice wszelkich (skończonych) diagramów”jest twierdzenie:

„jeśli w kategorii C istnieją wszelkie (skończone) koprodukty i koekwalizatory, to istnieją w niejkogranice wszelkich (skończonych) diagramów”.I co ważne (nie tylko dla leni): twierdzenia dualnego nie trzeba dowodzić! Jego dowód otrzymamy„dualizując” dowód pierwotnego twierdzenia.

Zasada dualności ujawnia szczególną symetrię matematycznego uniwersum. Dostrzegalną wtedy, gdy dojego opisu użyjemy języka teorii kategorii.Matematycy uwielbiają symetrię uznając ją za dowód istnienia w matematycznym świecie oczekiwanegoładu czy wręcz doskonałości (charakterystycznej dla bytów transcedentnych). Ale fizycy też16.

12W szczególności, granica pustego diagramu to obiekt konńcowy - taki, że z każdego obiektu istnieje do niegodokładnie jeden morfizm. W Set obiekt końcowy to zbiór jednoelementowy.13Obiekty Cop są takie same jak obiekty kategorii C.14Zachęcam do samodzielnego sformułowanie definicji kogranicy diagramu. Proszę nie bać się użyć takich pojęć jak

„kostożek” czy nawet „kostożek kouniwersalny”... .15Szczęśliwie, to szaleństwo ma swoje granice: np. nie mówimy o „ko-pullback”-ach tylko o pushoutach (par morfi-

zmów o wspólnej dziedzinie) . Dualność określeń „pull(back)” i „push(out)” jest oczywista dla bywalców trzy i więcejgwiazdkowych hoteli i restauracji. I jeszcze jedno: „kokogranica” to oczywiście granica... .

Page 211: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 210

12.1.1 Teoria mnogości v. teoria kategorii - okiem pragmatyka

Dla teoriomnogościowego ortodoksy teoria kategorii to tylko kolejna teoria pierwszego rzędu. Nicsię nie zmieniło - teoria mnogości jest nadal matematyczną ur-teorią.Co na to kategoryści? „In general, we shall not be very explicit about set-theoretic foun-dations, and we shall tactically assume we are working in some fixed universe U of sets.Members of U will be called „small sets” whereas a collection of members of U which does notitself belongs to U will be reffered to as a „large sets”17. Given such an ambient universe (...)”pisali S. Mc Lane i I. Moerdijk w [73].„Założenie taktyczne”, czyli przyjęte po to, by uniknąć jałowych dyskusji o wyższości WielkiejNocy nad Świętami Bożego Narodzenia (i odwrotnie)18.

F.W. Lawvere i R. Rosenburgh definiując „kategorię abstrakcyjnych zbiorów” pisali: ,An abs-tract set is supposed to have elements, each of which has no structure, except that the elementscan be distinguished as equal or unequal and to have no external structure except for thenumber of elements. [67]. To wyklucza utożsamienie kategorii zbiorów np. z opisanym wcześniejmodelem ZFC skonstruowanym na podstawie twierdzenia Łosia. Sugeruje, by kategorię zbiorówtraktować jako pojęcie niezależne od ZFC. 19

Dla części robotników matematyki spór, czy lepszym językiem opisu matematycznego uniwersum jestjęzyk teorii mnogości czy język kategorii, jest drugorzędny. Dla nich te języki są raczej dopełniające niżkonkurencyjne. Pozwalają spojrzeć na matematyczne obiekty i konstrukcje z różnych punktów widzenia.

Na czym polega odmienność tych punktów widzenia? Teoriomnogościowy obiekt - zbiór - to, jakmówił Cantor, „spojenie w całość” jego elementów. Wiedza o zbiorze to wiedza o jego elementach.Tymczasem kategoryjny obiekt nie ma wewnętrznej struktury, jest „atomem”. Kategoryjna wiedzao obiekcie to poznanie jego relacjach z innymi obiektami wyrażonych w języku morfizmów.

Teza o komplementarności obu języków bierze się stąd, że wiele kategorii to matematyczneświaty pierwotnie opisane w języku teorii mnogości: kategorie zbiorów, grup, pierścieni, przestrzenitopologicznych, itd. W tych kategoriach możemy równolegle (równocześnie) używać obu językówuzyskując lepszy obraz tych matematycznych światów.Np. w kategorii zbiorów możemy tak postrzegać teorimogościowy iloczyn kartezjański i kategoryjnyproduktu rodziny obiektów. Definicja iloczynu kartezjańskiego eksponuje wewnętrzną strukturętego zbioru - „elementy iloczynu A × B to pary uporządkowane (a, b) takie, że a ∈ A, b ∈ B”.Kategoryjna definicja produktu koncentruje uwagę na jego relacji z innymi zbiorami: „produktzbiorów A,B to zbiór C wraz z funkcjami ΠA : C → A, ΠB : C → B takimi, że dla dowolnychfunkcji f : D → A, g : D → B istnieje dokładnie jedna funkcja < f, g > : D → C taka, że ΠA· <f, g >= f,ΠB < f, g >= g ”. Obie definicje wskazują ten sam zbiór20.

Inny przykład: funkcja różnowartościowa f : A → B przyporządkowuje różnym argumentoma, b ∈ A różne wartości. Funkcja g : A→ B jest „na” gdy dla każdego elementu b ∈ B można wskazaćelement a ∈ A taki, że g(a) = b. To proste definicje. Ale konia z rzędem temu teoriomnogoścowcowi,który dostrzega jakieś ich „powinowactwo”. A w języku kategorii funkcja różnowartościowa tomonomorfizm: f : A → B jest monomorfizmem gdy dla dowolnych morfizmów k, h : C → A, k =

16O roli symetrii w rozumieniu piękna w sztuce i fizyce pięknie (choć krótko) pisał M.Heller w eseju „Czy fizykato nauka humanistyczna?”. Fundamentalną rolę symetrii w fizyce opisuje twierdzenie Noether którego tu jednak niebędziemy dyskutować.17„Small sets” to w naszej terminologii „zbiory a „large sets” - klasy.18J.T. Stanisławski.19Dodajmy, że definiując w [67] pojęcie kategorii autorzy unikają - jak najbardziej świadomie! - terminu zbiór.

Piszą tak: „A category C has the following data: Objects: (...), Arrows:(...)”. „Data” to (w tym przypadku) „dane”- termin, który nie ma określonej matematycznej treści.20Troszkę kłamię: definicja kategoryjna identyfikuje iloczyn kartezjański „z dokładnością do izomorfizmu” - patrz

następny podrozdział. Podobnie rzeczy się mają, gdy porównamy pojęcia sumy rozłącznej i koproduktu zbiorów.

Page 212: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 211

h jeśli tylko fk = fh. A funkcja „na” to epimorfizm: g : A → B jest epimorfizmem gdy dladowolnych morfizmów k, h : B → C, k = h jeśli tylko kg = hg. Trzeba być ślepym, by nie widzieć, żemono- i epimorfizm to pojęcia dualne... . I dlatego każde twierdzenie o funkcjach różowartościowych(wyrażone w języku kategorii) ma swój dualny odpowiednik mówiący coś o funkcjach „na”. Np.:„jeśli złożenie funkcji fg jest różnowartościowe, to g jest różnowartościowe” „jeśli złożenie gfjest „na”, to g jest „na”21

12.1.2 Izomorfizm

W wikipedii napisano: In certain areas of mathematics (...) it is valuable to distinguish betweenequality on the one hand and isomorphism on the other. Equality is when two objects are exac-tly the same, and everything that’s true about one object is true about the other, while anisomorphism implies everything that’s true about a designated part of one object’s structureis true about the other’s. Dwa zbiory - obiekty Set - są równe, gdy mają te same elementy. A sąizomorficzne, gdy można ustalić wzajemnie jednoznaczną odpowiedniość między ich elementami,gdy są równoliczne.

Myśląc kategoryjne uznajemy obiekty A i B dowolnej kategorii C za „takie same”, gdy ichrelacje z wszelkimi obiektami są identyczne. Np. gdy istnieje (mono-) epimorfizm z obiektu D doA, to powinien istnieć (mono-) epimorfizm z D do B. Jeśli A jest granicą (kogranicą) pewnegodiagramu, to jest nią również obiekt B.Doprecyzowanie tego zamysłu to taka definicja: obiekty A i B są izomorficzne, gdy istnieje parawzajemnie odwrotnych morfizmów f : A→ B i g : B → A - tzn. takich, że fg = idB , gf = idA.

Aby uniknąć dalszych jałowych rozważań o „istocie izomorfizmu” uznajmy tę kategoryjną definicję zapodstawową, a inne za mniej lub bardziej udane próby opisu tego pojęcia w różnych matematycznychświatach, w różnych językach.

Izomorfizm jest jednocześnie epi- i monomorfizmem. Ale implikacja odwrotna nie zawsze musibyć prawdziwa (choć np. jest prawdziwa w Set).

W języku kategorii często pojawia się zwrot „z dokładnością do izomorfizmu”. Z dokładnością do izomorfi-zmu definiujemy potrzebne nam obiekty, np. granice i kogranice. To potwierdza, że formalnie definiowanyizomorfizm realizuje pierwotny zamysł - wskazuje „kategoryjnie takie same” obiekty22.

12.2 Toposy

(...) when does the category look and behave like Set?A vague answer is - when it is (at least) a topos23.

R. Goldblatt, Topoi

Kategoria to - jak ustaliliśmy - uniwersalny schemat opisu fragmentów matematycznego uniwer-sum. Może też być traktowana jako język komplementarny w stosunku do ZFC. Jednak ambicje,przynajmniej części twórców teorii kategorii, sięgały dalej. Oni chcieli w niej widzieć nowy podsta-wowy język matematyki, nową ur-teorię. „With the creation and refinement of set theory in the21.„Mój język wyznacza granice mojego poznania” - L. Wittgenstein. Po raz kolejny.22Kategoryści czasem zamiast danej pierwotnie kategorii C badają jej szkielet - kategorię, której obiektami są

reprezentanty klas obiektów izomorficznych w C a morfizmami wszelkie morfizmy między tak wybranymi obiektami.Taki szkielet ma te same (kategoryjne) własności co C. Ale, jak widać, ta konstrukcja odwołuje się do aksjomatuwyboru który przecież chcemy traktować jako specyficzną (i nieoczywistą) cechę kategorii Set. Dlatego z kategoriiszkieletowych korzystamy raczej wtedy, gdy możliwy jest „kanoniczny” (konstruktywny) wybór reprezentantów.23Topos, to pojęcie funkcjonujące też poza matematyką. Zainteresowanych odsyłam do polskiej wikipedii, gdzie

znaleźć można obszerną informację na ten temat, ktora zaczyna się od słów „Topos lub miejsce wspólne.... Cociekawe, wśród dziedzin nauki, w których pojawia się ten termin Autor notki nie wymienia matematyki. A przecieżjest topologia... .

Page 213: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 212

hands of Cantor, Zermelo, von Neumann and others, the problem of providing an infrastructurefor the elaborate developments in areas of mathematics such as abstract algebra, analysis and topo-logy appeared to be solved. The domain of sets (...) came to be regarded by most mathematicians(those of a constructive tendency such as the intuitionists being the most notable exceptions) as thesource of ’raw material’ for building the structures required in mathematics. Thus, (...) althoughthe notions of structure and operation on structures had come to play a fundamental role in mostmathematical disciplines, these notions were not taken as primitive.

In what sense could category theory serve as a foundation for mathematics? There seem to be(at least) two possible senses: first, a strong sense, in which all mathematical concepts, includingthose of the current logico-metatheoretical framework for mathematics, are explicable in categorytheoretic terms. And secondly, a weaker sense in which one only requires category theory to serveas a (possibly superior) substitute for axiomatic set theory in its present foundational role.24 .

W 1964 roku W. Lawvere sformułował własności, które charakteryzują kategorię zbiorów „zdokładnością do równoważności” [66]25. Chciał uchwycić i wyrazić w języku kategorii te cechykategorii zbiorów które zdecydowały, że została ona uznana za podstawę współczesnej matematyki.To, co ostatecznie stało się definicją toposu, to część wyróżnionych przez Lawvere’a własności:26

topos to kartezjańsko domknięta kategoria, w której istnieją wszelkie skończone granice i spe-cjalny obiekt - klasyfikator podobiektów Ω .

Teorię mnogości to ur-teoria klasycznej matematyki, pośrednicząca między matematyczną rzeczywistościąa wszelkimi innymi teoriami. Dostarcza ona semantyk dla wszelkich teorii pierwszego rzędu.Aby kategoria C mogła zastąpić kategorię zbiorów w tej roli musi mieć wystarczająco bogatą strukturę,by można było mówić o modelach dowolnej teorii pierwszego i wyższych rzędów w tej kategorii.I to ma zapewnić definicja toposu.

Definicja modelu języka pierwszego rzędu w toposie C powinna być taka, by „po powrocie doźródeł” - czyli dla C = Set - była ona tożsama z klasyczną definicją Tarskiego, czyli:

1. model A w C jest posadowiony na pewnym obiekcie tej kategorii - nośniku modelu,2. semantyką n-argumentowej relacji (i formuły o n-zmiennych wolnych) jest „coś”, co odpowiadateoriomnogościowemu pojęciu „podzbiór n-tej potęgi kartezjańskiej nośnika modelu”.3. Struktura toposu powinna umożliwiać interpretację spójników logicznych i kwantyfikatorów atakże operacji podstawiania (termów w miejsce zmiennych). Inaczej mówiąc, podobnie jak w Set,każdy obiekt powinien generować pewną otaczającą go „elementarną strukturę” (patrz str. ??)

Z odpowiednikiem „n-tej potęgi kartezjańskiej zbioru” nie ma kłopotu: skoro w toposie sąwszelkie skończone granice, to są też produkty dowolnej liczby kopii każdego obiektu27.

Wskazanie kategoryjnego odpowiednika „podzbioru” jest bardziej kłopotliwe. W języku toposównie znajdziemy odpowiednika „zanurzenia identycznościowego” wykorzystywanego w Set do zdefi-niowania podzbioru zbioru A28. Możemy wprawdzie zdefiniować podobiekt obiektu A jako „klasęrównoważności monomorfizmów o kodziedzinie A” ale to nie jest satysfakcjonujące rozwiązanie.

„Klasa równoważności” to pojęcie teoriomnogościowe. Potrzebujemy „wewnętrznej”, kategoryjnej definicjipodobiektu jeśli chcemy, by teoria toposów była nową ur-teorią.29

24J.L. Bell, „Category Theory and the Foundations of Mathematics” (Brit. J. Phil. Set. 32 (1981), 349-358)25Dokładniej: chodziło o tzw. Set-like categories” - kategorie „zbioropodobne”, równoważne z Set. Równoważność

kategorii to pojęcie nieco słabsze od izomorfizmu kategorii, ale satysfakcjonujące kategorystów.William Lawvere (1937 - ) - matematyk amerykański, jeden z współtwórców teorii kategorii.26W teorii literatury: topos - stały motyw, wątek, stereotyp wyobrażeniowy (...) Toposy są przedstawieniami

uogólnionymi, wyrażającymi pewną wizję i ocenę świata (...) (tendencyjnie wybrane fragmenty internetowej definicji).27Na marginesie: w definicji toposu wymaga się tylko istnienia skończonych produktów. A co z koproduktami?

Czyżby te światy były „asymetryczne”? Wcale nie: piękne twierdzenie Mikkelsena mówi, że w każdym toposie sąwszelkie skończne koprodukty...28„Zbiór B jest podzbiorem A gdy istnieje zanurzenie identycznościowe - funkcja iB : B → A taka, że dla dowolnego

b ∈ B, iB(b) = b”

Page 214: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 213

Kluczem do rozwiązania problemu jest prosta obserwacja:

- podzbiór B ⊆ A jest jednoznacznie wyznaczony przez funkcję λB : A → 0, 1 taką, że dladowolnego elementy a ∈ A:

a ∈ B gdy λB(a) = 130

Taki opis podzbioru można odtworzyć w języku kategorii korzystając z granicy-pullbacku:

AλB // 0, 1

B

iB

OO

!B // 1

true

OO

(gdzie !B : B → 1 to jedyna funkcja z B do zbioru jednoelementowego 1 a true(1) = 1).

To powinno wystarczyć do zrozumienia definicji - i roli! - klasyfikatora podobiektów w toposie:klasyfikator podobiektów w toposie C to obiekt Ω wraz z morfizmem true : 1 → Ω (gdzie 1

to obiekt końcowy) taki, że dla dowolnego monomorfizmu m : B → A istnieje dokładnie jedenmorfizm λB : A→ Ω taki, że prostokąt

AλB // Ω

B

m

OO

!B // 1

true

OO

jest pullbackiem31.

Choć zabrzmi to dziwnie, podobiektami obiektu A nazywać będziemy morfizmy z A do Ω.32

W każdej interpretacji języka pierwszego rzędu w toposie semantyką formuły φ(x1, . . . , xn) w modeluposadowionym na obiekcie A jest pewien podobiekt An czyli ... morfizm [[φ(x1, . . . , xn)]] : An → Ω

Nie trzeba zgadzać się z zaprezentowanym tu postrzeganiem toposa jako alternatywnego - wstosunku do kategorii zbiorów - matematycznego uniwersum. Cudnie ujął to P.Johnstone tłumaczącłamiący standardy tytuł swojej monografii „Sketches of an Elephant: A Topos Theory Compen-dium”: ,The six blind men had never met an elephant before, so when one was brought to them,they each felt part of it to determine what it was like. One felt the legs and said „an elephant islike a tree,” one felt the ears and said „an elephant is like a banana leaf,” one felt the trunk andsaid „an elephant is like a snake”, and so on. But of course, an elephant is all of these things andnone of them33.

12.3 Przykłady toposów

Przyjrzyjmy się prostym przykładom pozwalającym zrozumieć, że operowanie nieklasycznymi logi-kami w toposach jest naturalne. A nawet kuszące.

Zbiory zmienne w czasieZacznijmy od toposa zbiorów zmiennych w czasie - Set→.

29Do kwestii „uwewnętrzniania” wrócimy, gdy będziemy wiedzieli więcej o toposach.30λB to tzw. funkcja charakterystyczna podzbioru B.31!B : B → 1. to jedyny morfizm z obiektu B do obiektu końcowego 1.32Zdarza się, że w danym toposie podobiekty mają kanoniczną czyli wyróżnioną reprezentację. W Set są to zanu-

rzenia identycznościowe. Ktoś powie, że kanoniczną reprezentację można wyróżnić zawsze - wystarczy skorzystać zpewnika wyboru. Ale przecież nie tego chcemy... .33Polecam wizytę na stronie https://ncatlab.org/nlab/show/topos.

Page 215: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 214

Przyjmijmy, że obserwujemy obiekt - zbiór i zachodzące w nim zmiany - w dwóch momentachczasowych: „0” i „1”. Taki obiekt opiszemy jako parę zbiorów (A0, A1) wraz z funkcją tA : A0 → A1.Zbiór A0 to stan obiektu „w chwili 0”, A1 - stan „w chwili 1” a funkcja tA opisuje „zmiany w czasie”- a ∈ A0 tA(a) ∈ A1.

Morfizm z obiektu (B0tB→ B1) do (A0

tA→ A1) to para funkcji (f0 : A0 → B0, f1 : B1 → A1)„respektująca zmiany w czasie” tzn. taka, że f1 · tB = tA · f0:

B1f1 // A1

B0

tB

OO

f0 // A0

tA

OO

Łatwo zdefiniujemy składanie takich morfizmów-par funkcji i pokażemy, że Set→ jest kategorią.Ale ta kategoria jest też toposem. Na czym polega jego odmienność?

Pomyślmy o elementach obiektu (A0tA→ A1). Elementem - zmiennym w czasie - jest niewątpliwie

każda para (a0, tA(a0)) : a0 ∈ A0 to stan elementu w „chwili 0” a tA(a0) - stan tego samego elementuw „chwili 1”. Ale są tu też elementy, których nie ma w „chwili 0” a pojawiają się w „chwili 1” - toelementy zbioru A1 \ tA(A0). Czy ich „istnienie” jest takie samo jak istnienie elementów obecnychw obu chwilach?

Podobne dylematy pojawią się gdy zapytamy o równość elementów. Czy elementy (a0, tA(a0))i (c0, tA(c0)) takie, że tA(a0) = tA(c0), - różne w „chwili 0” a równe w „chwili 1” - są równe czyróżne? Czy równość elementów pojawiających się w „chwili 1” jest „taka sama” jak elementówobecnych w obu momentach?

A co z przynależnością elementu do podobiektu? Czy element (0, 1) obiektu (0, 0 id→ 0, 1)należy do podobiektu (1 → 0, 1) czy też nie? A może „częściowo należy”? I jak odpowiedzieć

na pytanie, czy istnieje w (A0tA→ A1) element, który należy do podobiektu (∅ → A1)?

To nie są marginalne czy też niedorzeczne pytania! Wręcz przeciwnie: uznanie „częściowości” istnienia,równości czy przynależności za problemy godne matematycznego rozważenia, to pierwszy krok do zrozu-mienia teorii toposów.

Spójrzmy jeszcze na topos Set⇒ którego obiektami są dwa zbiory połączone parą funkcji -s, t : A0 ⇒ A1 a morfizmami - odpowiednie pary funkcji. Mając w głowie poprzedni przykładgotowi jesteśmy uznać, że to też „zmienne zbiory” z tą różnicą, że teraz zmienność jest opisywanaprzez dwie funkcje. Ale te obiekty można interpretować jako ... multigrafy34: A0 to zbiór krawędzi,A1 - zbiór wierzchołków a funkcje s, t przyporządkowują krawędziom ich początki i końce.Intuicja bywa zwodnicza... .35

Toposy presnopów i toposy snopów

Presnop na przestrzeni topologicznej (A, T ) można sobie wyobrażać jako rodzinę zbiorów indek-sowaną otwartymi podzbiorami - F (U) : U ∈ T - rozpatrywaną wraz z funkcjami - „obcięciami”:a ∈ F (U) a|V ∈ F (V ) jeśli V ⊆ U .

34Między dwoma wierzchołkami może być więcej niż jedna krawędź.35Więcej informacji o tym toposie można znależć w artykule „A Guided Tour in the Topos of Graphs (aut. S.Vigna)

dostępnym w internecie. Teraz powiedzmy tylko, że klasyfikator podobiektów w tym toposie to dwuwierzchołkowygraf z pięcioma krawędziami:

a

e

s

%%

t

99 bu

f

QQ

Spróbuj to sprawdzić... .

Page 216: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 215

„Presnopy na dowolnie wybranej przestrzenią topologiczną - wraz z odpowiednio zdefiniowanymimorfizmami - tworzą topos”36.

Skoro są presnopy, to pewnie są i snopy. Cóż to takiego? Zacznijmy od przykładu.Presnop funkcji ciągłych to rodzina (C(U) : U ∈ T ) , gdzie C(U) to zbiór funkcji ciągłych z U doR. Te funkcje umiemy w sposób oczywisty „obcinać” 37. Ale potrafimy je też „sklejać”:

każda zgodna rodzina funkcji ciągłych (fi : Ui → R : i ∈ I) - czyli taka, że dla dowolnychi, j ∈ I, fi|Ui∩Uj = fj|Ui∩Uj - wyznacza funkcję ciągłą f :

⋃(Ui : i ∈ I) → R taką, że f|Ui = fi dla

każdego i ∈ I .

„Sklejanie elementów” to cecha, która wyróżnia snopy spośród presnopów:

snop na przestrzeni (A, T ) to presnop F (U) : U ∈ T spełniający „warunek zgodności”:dla każdej rodziny (ai ∈ F (Ui) : i ∈ I) zgodnych elementów - takich, że dla dowolnych i, j ∈ X,ai|Ui∩Uj = aj|Ui∩Uj - istnieje dokładnie jeden element a ∈ F (

⋃(Ui : i ∈ I) taki, że a|Ui = ai.

Kategoria snopów dowolnie wybranej przestrzeni topologicznej jest toposem [69].

Rozważając istnienie i równość elementów snopa (presnopa) F napotkamy na te same pytaniaco w toposie Set→: czy „miara istnienia” elementu a ∈ F (U) jest równa mierze jego obcięcia -elementu a|V ∈ F (V ) ? Czy różne elementy a, b ∈ F (U) których obcięcia a|V , b|V ∈ F (V ) są takiesame uznamy za różne czy może częściowo równe? A jeśli tak, to jak zdefiniować „logikę częściowegoistnienia i równości” w toposie snopów?

Dodatek: skąd te snopy (w matematyce)?

,(...) a sheaf is a tool for systematically trackinglocally defined data attached to the opensets of a topological space. (wikipedia)

Sklejenie zgodnej rodziny ciągłych funkcji rzeczywistych w jedną jest możliwe, bo definicjaciągłości jest „lokalna”. Do zrozumienia, na czym polega lokalny charakter definicji wystarczyprzykład: jeśli w sposób analogiczny do presnopa funkcji ciągłych zdefiniujemy presnop funkcjirzeczywistych ograniczonych z góry, to utracimy możliwość sklejania zgodnych rodzin - sklejeniefunkcji ograniczonych z góry nie musi być funkcją ograniczoną z góry. Ten presnop nie jest snopem,bo definicja „funkcji ograniczonej z góry” nie jest lokalna.

Ale dlaczego lokalna definiowalność jest tak ważna, że aż warta uwagi matematyków? Rozpa-trzmy tylko jeden, ale przekonujący przykład.

Badając różne zjawiska na powierzchni całego ziemskiego globu - rozkład temperatury, wilgot-ności, ciśnienia atmosferycznego, zanieczyszczeń powietrza itd. - zakładamy, jak chciał Leibniz, żezmienność tych zjawisk ma charakter ciągły - opisujemy je jako rzeczywiste funkcje ciągłe38.Powierzchnia globu to trójwymiarowa sfera39 czyli pewna przestrzeń topologiczna (którą oznacza-my tu przez M - „Monde”). Ale sfera to „trudna przestrzeń” - nie da się opisać globalnych(czyli działających na całej przestrzeni M) rzeczywistych funkcji ciągłych w sposób pozwalającyna efektywne badanie ich własności.Rozwiązanie, które znaleźli przodkowie (żeglarze, podróżnicy i władcy marzący o podbojach) pole-ga na wykorzystaniu lokalnego charakteru ciagłości: zamiast trudzić się poszukiwaniem globalnegoopisu funkcji ciągłej f : M → R opisywali interesujące ich zjawiska „kawałkami”, czyli za pomocązgodnych rodzin funkcji ciagłych fi : Ui → R, takich, że rodzina zbiorów otwartych (Ui : i ∈ I)

36„Nasz” topos Set→ to topos presnopów dyskretnej przestrzeni topologicznej - takiej, w której są tylko dwa zbioryotwarte - zbiór pusty i cała przestrzeń.37f|V działa na elementach zbioru V tak samo jak f .38Mówimy tu o zmienności związanej z przemieszczaniem się po powierzchni globu a nie o zmienności w czasie.39W pewnym uproszczeniu.

Page 217: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 216

pokrywa całą przestrzeń M . To wystarczy, bo takie „lokalne” funkcje tworzą snop - lokalne zgodneopisy można skleić w opis globalny40.

To wiele zmienia, bo każdy otwarty podzbiór U ( M , można odwzorować na płaszczyźnie -stworzyć jego mapę. Matematyk powie, że mapa to homeomorficzne odwzorowanie tego podzbioruna pewien otwarty podzbiór W ⊂ R2 - h : U → W 41. Taka mapa pozwala zastąpić opis lokalnejfunkcji ciągłej f : U → R przez opis złożenia - funkcji fh−1 : W → U → R działającej na otwartympodzbiorze płaszczyzny42. A to o niebo łatwiejsze, bo do opisu i badania takich funkcji można użyćcałego arsenału narzędzi wypracowanych przez analizę matematyczną.Pierwotny pomysł - opis globalnych zjawisk za pomocą funkcji ciagłych f : M → R - został w tensposób przekształcony w niezwykle skuteczną metodę matematycznego modelowania i badania tychzjawisk. A wszystko dzięki temu, że „rzeczywiste funkcje ciągłe tworzą snop”43.

Ta (niezbyt klarowna) opowieść miała przekonać, że snopy były obecne w matematyce długoprzed powstaniem teorii toposów. Topos snopów to też pierwowzór toposów Grothendiecka - ważnejpodklasy toposów. Tę klasę opiszemy tak (trochę zaszalejemy...): pojęcie prosnopa można uogólnićzastępując poset zbiorów otwartych T jakąkolwiek małą kategorią D. Presnopy (na D) to wówczasfunktory z Dop do Set [69]. Takie presnopy tworzą topos. Co więcej w dowolnej małej kategorii Dmożna zdefiniować „coś”, co można nazwać topologią i co pozwala wyróżnić w toposie presnopówPSh(D) mniejszy topos snopów - Sh(D, J) (gdzie J to owa wyróżniona „topologia” w D). To sąwłaśnie toposy Grothendiecka. A potem zrobiono kolejny krok: pokazano, że w dowolnym toposieC można wyróżniać (na wiele sposobów) to „coś” - topologię i związać z każdą taką topologią Jtopos snopów CJ zawarty w C. Uff... 44.

12.4 Logika toposu

W teorii toposów fascynujące jest to, że ujawnia ona fundamentalną i jednocześnie subtelną zależnośćmiędzy logiką a matematyką.I na tym skupimy teraz uwagę.

Na dwuelementowym zbiorze - klasyfikatorze podobiektów w Set - zdefiniowane są operacje od-powiadające spójnikom logicznym. To algebra Boole’a wartości logicznych ustalająca interpretacjęlogiki zdaniowej w kategorii zbiorów. Podobnie jest w każdym toposie:

Logika zdaniowa toposu jest zakodowana w otoczeniu klasyfikatora podobiektów. Jest wewnętrzna, bojest zależna od struktury rozważanego toposu - jest wtórna w stosunku do matematyki tego toposu.

Matryca (zbiór) wartości logiki toposu to zbiór podobiektów obiektu końcowego, czyli morfi-zmów postaci w : 1→ Ω . Jedną z nich jest morfizm true : 1→ Ω wyróżniony w definicji klasyfika-

40To nie znaczy, że nasi przodkowie wiedzieli co to przestrzeń topologiczna. Snop kojarzyli raczej ze żniwami... .41Ciągłość odwzorowania homeomorficznego h gwarantuje że punkty odpowiednio bliskie wybranemu dowolnie

punktowi a ∈ U znajdą się na tej mapie blisko punktu h(a) (choć proporcje odległości mogą być zachwiane). Stwo-rzenie homeomorficznego obrazu całej sfery M na płaszczyźnie jest niemożliwe - „narysowanie takiej mapy wymaga„rozerwania” sfery. To, co znamy jako mapę świata nie jest homeomorficznym obrazem sfery. Ale mapę można stwo-rzyć np. dla Polski czy Europy. Wspomnij lekcje geografii i ”atlas świata”.42Homeomorfizm h : U →W charakteryzuje się tym, że odwzorowanie h−1 : W → U jest też ciągłe.43Zapewnienie zgodności rodziny funkcji fi : Ui → R , po zastąpieniu ich funkcjami fih−1 nie jest wielkim

problemem.Takie „lokalnie euklidesowe” przestrzenie topologiczne to rozmaitości.44Mowa tu o tzw. topologiach Grothendiecka - w pierwszym przypadku - i topologiach Lawvere’a-Tirney’a - w

drugim [69]. Do toposów Grothendiecka jeszcze w tym tekście wrócimy.

Page 218: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 217

tora. Druga wartość to morfizm false : 1→ Ω - taki, że diagram

1false // Ω

0

OO

// 1

true

OO

jest pullbackiem 45. Te dwa morfizmy - dwie wartości logiczne - znajdziemy w każdym toposie.

Operacje logiczne na zbiorze wartości logicznych - koniunkcję, alternatywę, implikację i negację- definiujemy wewnętrznie, jako ... morfizmy. Najprostszy z nich - negacja - to (jedyny) morfizm¬ : Ω→ Ω taki, że diagram-prostokąt

Ω ¬ // Ω

1

false

OO

// 1

true

OO

jest pullbackiem.

Zdefiniowanie koniunkcji, alternatywy i implikacji jako odpowiednich morfizmów z Ω × Ω do Ωwymaga nieco więcej pomysłowości. Ale jest możliwe [43].

Działanie morfizmów-operatorów logicznych na podobiektach obiektu A - morfizmach z A doΩ - definiujemy odwołując się do składania morfizmów:

A<f,g> //

f op g

33Ω× Ωop // Ω A

f //

¬f

44Ω ¬ // Ω

gdzie op ∈ ∧,∨,→.W szczególności - dla A = 1 - zdefiniujemy w ten sposób algebrę wartości logicznych toposu.

Powiedzmy wreszcie to, co najistotniejsze:

W różnych toposach mamy różne matryce wartości logicznych. Ale wewnętrzna logika zdaniowa każdegotoposu jest zawsze logiką intuicjonistyczną - zdefiniowane wyżej algebry na podobiektach dowolnegoobiektu A - morfizmach z A do Ω - to są zawsze algebry Heytinga46.I nie jest to dodatkowy warunek - to jest konsekwencja struktury toposu!

Kwantyfikatory

Zdefiniowanie kwantyfikacji w toposie wymaga wykorzystania dotąd nie wspominanej własnościdefiniującej toposy - ich kartezjańskiej domkniętości. Precyzyjna (pełna) definicja tego pojęcia jestzbyt skomplikowana bym odważył się ją tu przedstawiać 47. Teraz wykorzystamy to, że kartezjańskadomkniętość pozwala związać z każdym morfizmem-rzutowaniem Π: A × B → B dwie funkcje

45„0” oznacza tu obiekt początkowy. Obiekt początkowy to pojęcie dualne do obiektu końcowego: dla dowolnegoobiektu A istnieje dokładnie jeden morfizm z 0 do A. Obiekt początkowy w Set to zbiór pusty.46Co więcej: ta algebra jest zawsze zupełna tzn. każdy jej podzbiór ma kres dolny i kres górny.47Krótko: w kartezjańsko domkniętej kategorii C każdy zbiór C(X,Y ) morfizmów z obiektu X do obiektu Y jest

„reprezentowany” - cokolwiek to oznacza - przez obiekt wykładniczy Y X - exponential object. W Set to oczywistość- wszak funkcje ze zbioru X do Y tworzą zbiór. Ale w kategorii zbiorów przeliczalnych nie na takiej reprezentacji:zbiór morfizmów - funkcji między nieskończonymi zbiorami przeliczalnymi - nie zawsze jest przeliczalny.Przedstawienie pełnej definicji kartezjańskiej domkniętości wymaga wyjaśnienia, czym jest sprzężenie funktorów.Tego nie zrobiliśmy. Szkoda, bo sprzężenie to jeden z fundamentów teorii kategorii. Wielość i różnorodność sytuacji,które można opisywać korzystając ze sprzężeń jest imponująca. Niestety, złożony charakter tego pojęcia sprawia, żemusimy ograniczyć się do gombrowiczowskiej deklaracji: odkrycie sprzężeń to jedno z najważniejszych osiągnięć teoriikategorii („dlaczego Słowacki wzbudza w nas zachwyt i miłość? (...) Dlatego, panowie, że Słowacki wielkim poetąbył! - Ferdydurke).

Page 219: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 218

między zupełnymi algebrami Heytinga podobiektów produktu A×B i obiektu B - ∃B,∀B : C(A×B,Ω)→ C(B,Ω) - takie, że dla dowolnego podobiektu c : A×B → Ω:

- ∃B(c) to najmniejszy podobiekt B taki, że c ¬ ∃B(c) ·Π,- ∀B(c) to największy podobiekt B taki, że ¬ ∀B(c) ·Π ¬ c 48.

c ¬ d ·ΠB ⇔ ∃B(c) ¬ d , d ·ΠB ¬ c⇔ d ¬ ∀B(c)

Tak naprawdę to jest tak: kartezjańską domkniętość sprawia, że z każdym obiektem A w toposie C możnazwiązać obiekt potęgowy ΩA wraz z bijekcją

C(1,ΩA) ∼= C(A,Ω)

Potem dowodzimy istnienia morfizmów ∀B , ∃B : ΩA×B → ΩB które, w dalszej kolejności, wykorzystujemydo zdefiniowania opisanych tu funkcji [69].Pominiemy milczeniem zniechęcające zawiłości techniczne. Istotne jest to, że - podobnie jak w przypadkulogiki zdaniowej - logika pierwszego rzędu w dowolnym toposie jest w pełni zsynchronizowana z jegomatematyczną strukturą.Po co nam uwewnętrznianie? To konieczne, jeżeli teoria toposów ma być teorią podstawową, nową ur-teorią. Metajęzyk ur-teorii powinien być ograniczony do niekontrowersyjengo minimum49.

Gdy B to obiekt końcowy i gdy utożsamimy produkt A× 1 z A (co nam wolno) to dla dowolnegopodobiektu c : A→ Ω , ∃1(c) i ∀1(c) to wartości logiczne takie, że:

- ∃1(c) to najmniejsza wartość logiczna, taka, że c ¬ kA · ∃1(c),

- ∀1(c) to największa wartość logiczna, taka, że ∀1(c) · kA ¬ c.( kA : A→ 1 to (jedyny) morfizm z A do obiektu końcowego).

Dodajmy coś, co zbliża do zrozumienia istoty kwantyfikacji: każda wartością logiczna q : 1→ Ω

wyznacza podobiekt logiczny dowolnego obiektu A - morfizm qA : AkA→ 1

q→ Ω. Badając podobiektyA można więc pytać, czy podobiekt c „mieści się w paśmie” wyznaczonym przez wartości logiczneq ¬ p , czy qA ¬ c ¬ pA . Sens kwantyfikacji w tym, że:

wartości logiczne ∀1(c) i ∃1(c) wyznaczają „najwęższe pasmo” w którym mieści się podobiekt c- wskazują największy podobiekt logiczny w nim zawarty i najmniejszy go zawierający:

∀1(c)A ¬ c ¬ ∃1(c)A

W toposie Set logika jest dwuwartościowa, więc każdy obiekt (zbiór) A ma tylko dwa podobiekty logiczne- A i ∅ i tylko trzy „pasma” (∅, ∅), (∅, A) i (A,A).W mainstreamowej teorii modeli nie mówi się o „pasmach”. Ale jest pewien ślad: mówimy, że formuła φjest niespełniona w modelu posadowionym na zbiorze A jeśli [[φ]] jest w paśmie (∅, ∅), jest spełniona (alenie prawdziwa) gdy jest w paśmie (∅, A) i prawdziwa, gdy jest w paśmie (A,A)50..

Przykład - logika toposu Set→

Klasyfikator podobiektów w kategorii Set→ to obiekt Ω = (Ω0ω→ Ω1) taki, że:

48Warto na chwilę wrócić do opisu kwantyfikacji w Set (str. 84) by uwierzyć (uznać za prawdopodobne) że to, oczym teraz mówimy można nazwać kwantyfikacją... .49(...) One can consider (a topos) as a mathematical object that satisfies the axioms of topos and draw the

connections from the axioms. (...) these axioms (...) make assertion just about „all” objects and „all” arrows” (i.e.statements in FOL) they do not involve any set-theoretic assumptions; they can just be viewed as (part of) anindependent description of C as a universe of discussion. (...) Properties of a topos (...) formulated in this way (...)are said to be ”internal”. On the other hand one can think of a topos as an object formed within set theory, as a setof objects and a set of arrows for which composition (etc.) is defined so as to satisfy the category and topos axioms.(...) Development in this style are called ”external” [69].50Podobiekty logiczne w Set nazwano niewłaściwymi dając w ten sposób dowód ich lekceważenia... .

Zauważ, że w logice intuicjonistycznej pierwszego rzędu nie jesteśmy w stanie dowieść równości ∀1(φ) = q czy też∃1(φ) = p (gdzie q, p ∈ H) z oczywistego powodu: te równości nie należą do języka tej logiki. Można jedynie poszukiwać„semantycznych” dowodów tych równości korzystając ze struktury rozważanego toposu i jego logiki.

Page 220: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 219

Ω1 = •1 0

Ω0

ω

OO

= •1

OO

•12

``

0

``

Produkt (A0 → A1) × (B0 → B1) konstruujemy niezależnie dla każdej z dwóch chwil51. Obiektkońcowy w to tutaj obiekt 1 = (1→ 1), gdzie 1 to zbiór jednoelementowy.Morfizmy true = (true0, true1), false = (false0, false1) : (1 → 1)→ (Ω0

ω→ Ω1) narysujemy:

1true1 //

false1

**•1 0

1

OO

true0 //

false0

33•1

OO

•12

``

0

``

Logika tego toposu jest trójwartościowa. Trzecią wartością logiczną - „półprawdą” - jest morfizm12 = ((1

2)0, (12)1) :

1( 12 )1 // •1 0

1

OO

( 12 )0

55•1

OO

•12

``

0

``

Algebra Heytinga wartości logicznych w tym toposie to opisana wcześniej algebra posadowiona natrójelementowym zbiorze uporządkowanym 0 < 1

2 < 1.52

Podobiekty obiektu A = (A0tA→ A1) są tu kanonicznie reprezentowane przez obiekty C = (C0

tC→C1) takie, że C0 ⊆ A0, C1 ⊆ A1 i tC = tA|C

53.To pozwala opisać sumę i przekrój w algebrze Heytinga podobiektów A „zgodnie z (teoriomno-

gościową) intuicją”. Implikacja jest nieco trudniejsza (spróbuj)54.Trzy wartości logiczne tego toposa wyznaczają trzy podobiekty logiczne A :

A0 = (∅, ∅), A 12

= (∅, tA(A0)), A1 = A.Wykorzystując te podobiekty i wyznaczone przez nie „pasma” łatwo pokazać, że dla dowolnego

podobiektu C = (C0tC→ C1) :

∀1C =

1 C0 = A0, C1 = A112 C0 6= A0, C1 = A1,

0 otherwise

∃1C =

1 C0 6= ∅, C1 6= ∅12 C0 = ∅, C1 6= ∅0 otherwise

51(A0 → A1)× (B0 → B1) = (A0 ×B0 → A1 ×B1).52Str. 201. Wartość logiczną false reprezentuje liczba 0, półprawdę - 12 a true - 1.53C reprezentuje podobiekt - morfizm λC z A do Ω - który jest parą funkcji

(λ0C : A0 → 0, 12 , 1, λ1C : A1 → 0, 1),

gdzie λ1C to funkcja charakterystyczna podzbioru C1 ⊆ A1 , natomiast λ0C działa tak: dla dowolnego a ∈ A0

λ0C(a) =

1 gdy a ∈ C0,12 gdy a /∈ C0 ∧ tA(a) ∈ C10 gdy a /∈ C0 ∧ tA(A) /∈ C1

54Podpowiem, że ¬C = (C0tC→ C1) = (a ∈ A0 : tA(a) ∈ A1 \ C1, A1 \ C1) .

Page 221: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 220

Wzorując się na tym przykładzie można opisać topos „zbiorów zmiennych w czasie” w którym„zmienność” jest ciągła i opisana np. przez liczby rzeczywiste odcinka [0, 1]. Spróbuj.

12.4.1 Semantyka języka pierwszego rzędu

Zdefiniowanie modelu języka pierwszego rzędu (dowolnej sygnatury Σ) „posadowionego na obiekcieA” w toposie to przyporządkowanie każdemu n-argumentowemu symbolowi relacyjnemu r ∈ Σ -podobiektu rA : An → Ω, i każdemu m-argumentowemu symbolowi operacyjnemu f ∈ Σ - morfizmufA : Am → A.To przyporządkowanie można łatwo rozszerzyć interpretując wszelkie termy jako morfizmy postaci[[t(x1, . . . , xn)]] : An → A a formuły jako morfizmy postaci [[φ(x1, . . . , xn)]] : An → Ω. To proste:wystarczy powtórzyć rekurencyjną procedurę zastosowaną wcześniej do opisu modeli teoriomno-gościowych (str.160) wykorzystując opisaną przed chwilą logiczną strukturę toposu (algebry podo-biektów i kwantyfikację) i taką oto interpretację formuł-równości:dla dowolnych termów t1, t2 które interpretowane są jako morfizmy [[t1]], [[t2]] : An → A:

[[t1 = t2]] = ≈A · < [[t1]], [[t2]] >.gdzie ≈A: A×A→ Ω to morfizm taki, że prostokąt:

A×A ≈A // Ω

A

<id,id>

OO

// 1

true

OO

jest pullbackiem.

Tak skonstruowany model jest modelem teorii T (sygnatury Σ) jeśli [[φ]] = > dla każdego zdania-aksjomatu φ teorii T .

Logiki wyższych rzędów

O logice drugiego i wyższych rzędów mówimy tu niewiele. Ale już to, co powiedzieliśmy o arytme-tyce drugiego rzędu pozwala uwierzyć, że kluczowe dla odpowiedzi na pytanie czy te logiki możnainterpretować w toposie C jest wskazanie morfizmu, który będzie semantyką relacji „∈”. Okazujesię, że kartezjańska domkniętość toposu to umożliwia:

- wspomniana wcześniej bijekcja C(A,Ω) ∼= C(1,ΩA) pozwala reprezentować podobiekty Ajako elementy obiektu potęgowego ΩA,

- bijekcja C(ΩA,ΩA) ∼= C(ΩA ×A,Ω) pozwala na wyróżnienie morfizmu ∈A : A× ΩA → Ω55.

Dla dowolnego elementu e : 1 → B i podobiektu B reprezentowanego przez element d : 1 → ΩB ,wartość logiczna - morfizm ∈B · < e, d > - to „miara przynależności” elementu e do podobiektu d.

Takie sobie „sztuczki”... .

Wszystko jest „tak samo” jak w toposie zbiorów. Ale to nie „to samo” - toposy to różne od Set „mate-matyczne uniwersa”.

Toposy boolowskie i podwójna negacja

Może się zdarzyć, że w rozważanym toposie - tak jak w Set - podobiekty dowolnego obiektutworzą algebrę Boole’a (czyli algebrę Heytinga, w której dodatkowo obowiązuje prawo wyłączonegośrodka). Taki topos to topos boolowski56.

Światy opisane przez toposy boolowskie są nieco bardziej podobne do Set. To banał. Ciekawszejest takie oto twierdzenie:

„Każdy topos C zawiera w sobie mniejszy topos boolowski C¬¬ ”.

55Morfizm ∈A poprzez opisaną tu bijekcję odpowiada morfizmowi id : ΩA → ΩA.56To nie znaczy, że logika toposu boolowskiego musi być dwuwartościowa! Topos Set2 (którego obiektami są pary

zbiorów a morfizmami - pary funkcji) jest boolowski, a jego matryca wartości logicznych jest czteroelementowa.

Page 222: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 221

Oznaczenie C¬¬ wzięło się stąd, że ten „podtopos” wyróżnimy korzystając z podwójnej negacji- morfizmu ¬ · ¬ : Ω→ Ω.Robimy to tak: podobiekt f : A→ Ω nazwiemy gęstym, gdy ¬¬f = trueA. Obiekt E należy do tegopodtoposu boolowskiego gdy każdy morfizm φ : B → E, którego dziedzina jest gęstym podobiektemobiektu A, można jednoznacznie rozszerzyć do morfizmu φ : A→ E .Matrycę wartości logicznych toposu C¬¬ tworzą domknięte wartości logiczne - morfizmy w : 1→ Ωtakie, że ¬¬w = w. I to wszystko57.

Podobieństwo do omawianych wcześniej twierdzeń Glivenki i Godla jest oczywiste. Ale szczerzemówiąc, nie potrafię powiedzieć wiele ponad stwierdzenie tej „oczywistej oczywistości”58

12.5 Teoria zbiorów a teoria toposów

Jedno matematyczne uniwersum i - istniejąca niezależnie - jedna jedynie słuszna logika - to paradygmatzrealizowany w postaci matematyki teoriomnogościowej.Teoria toposów to podważa. Matematyczne uniwersum to galaktyka lokalnych światów - toposów, którychwewnętrzna struktura jest wprawdzie podobna do struktury kategorii zbiorów ale każdy z tych światówma swą własną logikę.

Aksjomaty teorii toposów są twierdzeniami w ZFC59. Ale nie odwrotnie. Definicja toposu nieobejmuje wszystkiego co obecne w miłej sercu teorii mnogości. Można więc pytać: jak daleko - jakblisko - pierwowzoru - kategorii Set - jest dowolny topos?

Podstawową różnicę już znamy: logika dowolnego toposu jest intuicjonistyczna a logika Set todwuwartościowa logika klasyczna. Powiedzmy coś o innych.

Generator

Zdanie „funkcje f, g : A→ B są równe gdy dla dowolnego elementu a ∈ A, f(a) = g(a)” kategorystaodczyta jako stwierdzenie, że zbiór jednoelementowy - obiekt końcowy - jest generatorem w Set60.Ale tak nie musi być w każdym toposie. Gdy tak jest, to mówimy - po angielsku - że ten topos jestwell-pointed61.

Powód pominięcia warunku „obiekt końcowy jest generatorem” w deinicji toposu jest prosty: logika toposuspełniajacego ten warunek musi być logiką klasyczną! [69]. A tego nie chcemy.Matematyczna struktura toposu determinuje jego logikę ... .

To, że obiekt końcowy nie musi być generatorem zmusza do zmiany wyobrażenia, co właściwieopisuje język pierwszego rzędu. W teoriomnogościowej narracji formuła φ(x1, . . . , xn) jest opisempewnej własności n-elementowych ciągów elementów zbioru A (na którym jest posadowiony aktu-alnie rozważany model). Semantyka formuły φ jest tu wtórna: to podzbiór An złożony z ciągówktóre mają własność opisaną przez φ.

W teorii toposów semantyka formuły jest pierwotna. Wtórne jest to, że można patrzeć naformuły jako opisy własności. Ale już nie elementów, tylko ... morfizmów:

57W Set→ podobiekt (B0 → B1) obiektu (A0 → A1) jest gęsty gdy B1 = A1 . Topos Set→¬¬ tworzą „zbiory

niezmienne w czasie” - Aid→ A. Ten boolowski podtopos jest „taki sam” jak topos zbiorów.

58Morfizm-podwójna negacja wyznacza jedną z możliwych topologii Lawvere’a-Tirney’a (o której wspominaliśmywcześniej) a przytoczone twierdzenie to szczególny przypadek twierdzenia które mówi, że każda taka topologia Jwyznacza w toposie C mniejszy (ale niekoniecznie boolowski) topos CJ [69].59Co zazwyczaj zastępujemy stwierdzeniem „kategoria Set jest toposem” przemilczając, że istnienie tej kategorii

- modelu ZFC - wcale nie jest oczywiste. To zdanie trzeba czytać tak, jak chcą nominaliści: po zastąpieniu pojęć„obiekt” i „morfizm” przez teoriomnogościowe „zbiór” i „funkcja”, aksjomaty teorii toposów są dowodliwe w ZFC.60Obiekt G jest generatorem jeżeli dowolne dwa równoległe morfizmy f, g : A → B są równe, jeśli tylko dla

dowolnego morfizmu a : G→ A, fa = ga”.61Po polsku mało zręcznie: „dobrze upunktowiony”. Żądanie, by obiekt końcowy był generatorem jest, w pewnym

sensie, „bliskie” aksjomatowi ekstensjonalności.

Page 223: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 222

morfizm f : B → An ma własność opisaną przez formułę φ(x1, . . . , xn) której semantyką jestpodobiekt [[φ]] : An → Ω dokładnie wtedy, gdy [[φ]] · f = trueB : B → 1 true→ Ω

Pomińmy szczegóły62. Zauważmy tylko, że w „well-pointed” toposie morfizm f : B → An mawłasność opisaną przez formułę φ dokładnie wtedy, gdy ma ją każdy morfizm postaci f · b : 1→ Ωgdzie b : 1→ B to dowolny element B.

Tylko w „well-pointed” toposach „prawda” jest sumą „punktowych prawd”: dla dowolnego f : B → Ω

f = trueB wtw fb = true dla dowolnego elementu b : 1→ B.

Wyróżnia się też toposy, które mają zbiór generatorów - „rodzinę obiektów (Gi : i ∈ I) taką, żedowolne morfizmy równoległe f, g : A→ B są równe, gdy fa = ga dla dowolnego morfizmu postacia : Gi → A”.Taki zbiór generatorów istnieje w każdym toposie snopów - są to podsnopy obiektu końcowego63.

Gdy dodatkowo zażądamy, by taki topos miał wszelkie kogranice, to otrzymamy nową charak-teryzację wspomnianych wcześniej toposów Grothendiecka64.

Aksjomat wyboru

W języku kategorii ten aksjomat zdefiniujemy tak: kategoria C spełnia aksjomat wyboru jeśli dlakażdego epimorfizmu e : A→ B istnieje morfizm f : B → A taki, że e · f = idB.Powód niewłączenia aksjomatu wyboru do definicji toposa jest taki sam, jak przed chwilą: logikatoposa z pewnikiem wyboru musi być logiką klasyczną65. To kolejne potwierdzenie, że strukturamatematyczna toposu determinuje jego logikę... .

Aksjomat nieskończoności - obiekt liczb naturalnych

Nie musimy akceptować nieskończoności w każdym toposie. Ale możemy:

obiekt liczb naturalnych - NNO - w toposie C to obiekt N wraz z morfizmami 0: 1 → N

, s : N → N , takimi, że dla dowolnego diagramu postaci 1 a→ Ah→ A istnieje dokładnie jeden

morfizm φ(h,a) : N → A taki, że diagram

1a

&&

0 // Nsucc //

φ(h,a)

N

φ(h,a)

Ah // A

jest przemienny.

NNO w Set to oczywiście (definiowany teoriomnogościowo) zbiór liczb naturalnych. W toposiezbiorów skończonych takiego obiektu nie ma66.

NNO jest obiektem nieskończonym. By to stwierdzenie miało sens, trzeba wyjaśnić, jak rozu-miemy „skończoność” w toposie:

obiekt A jest skończony, jeżeli każdy monomorfizm m : A → A jest izomorfizmem. Obiekt jestnieskończony gdy nie jest skończony.62Zainteresowani szczegółową analizą tej definicji znajdą ją w [69].63Obiekt końcowy 1 w toposie snopów to rodzina zbiorów jednoelementowych indeksowana zbiorami otwartymi.

Zbiór otwarty V wyznacza podsnop 1V ¬ 1 taki, że zbiór 1V (U) jest jednoelementowy gdy U ⊆ V i pusty wpozostałych przypadkach.64„Grothendieck topos is a topos that is neither too small nor too large, in that it is cocomplete (not too small),

and has a small generating set (not too large)” - (internet)65To jest opisane wcześniej twierdzenie Diaconescu „w wersji kategoryjnej”. Dodajmy, że to samo twierdzenie

udowodniono ponownie kilka lat poźniej (Goodman-Myhill). A wcześniej jako ćwiczenie(!) zamieścił w monografiiFoundations of constructive analysis E. Bishop...66Definicja NNO nawiązuje w oczywisty sposób do postrzegania liczb naturalnych jako ockhamowskiego wzorca re-

kurencji.Aby zdefiniować dodawanie liczb naturalnych - funkcję +: N×N→ N wystarczy skorzystać z kartezjańskiejdomkniętości i wskazać funkcję + : N→ NN. Zrobimy to korzystając z funkcji i : 1→ NN oraz succN : N : NN → NNokreślonych wzorami: i(1) = idN oraz succN(f)(n) = f(succ(n)).

Page 224: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 223

NNO jest nieskończony - morfizm succ : N → N jest monomorfizmem ale nie izomorfizmem.

W toposach presnopów obiekt liczb naturalnych to (odpowiednio liczna) rodzina kopii zbioruliczb naturalnych. W toposie snopów na przestrzeni (A, T ) jest ciekawiej: NNO-snop to rodzina(NSh(U) : U ∈ T ), gdzie NSh(U) to zbiór lokalnie stałych funkcji z U do N co oznacza, że jeślif(x) = n, to f(y) = n dla wszystkich punktów y z pewnego otwartego otoczenia punktu x ∈ U .

W toposie z NNO mamy też obiekty liczb całkowitych, wymiernych i rzeczywistych.

Dlaczego mamy nazwać pewien obiekt w toposie obiektem liczb całkowitych (wymiernych)? Te obiekty torezultaty konstrukcji, które prowadzimy odwzorowując budowę tych zbiorów liczbowych w Set. Punktemwyjścia dla tych konstrukcji jest obiekt liczb naturalnych.Konstrukcje obiektów liczb całkowitych i naturalnych są proste: wykorzystujemy tu tylko pewne skończonegranice i kogranice istniejące w każdym toposie.Konstrukcja obiektu liczb rzeczywistych jest bardziej subtelna, bo odwołuje się do wewnętrznej logikitoposu. Formalną definicję tego zbioru zapisaną w języku teorii mnogości można - po pewnej modyfikacji- interpretować w każdym toposie z NNO67. A potem, dla aktualnie rozważanego toposu, wystarczyudowodnić istnienie obiektu spełniającego warunki tej definicji ... . Zero transcedencji...

W toposie snopów obiekt liczb całkowitych (wymiernych) jest opisany podobnie jak NNO - tosnop lokalnie stałych funkcji, których kodziedziną jest zbiór liczb całkowitych (wymiernych).

Ból głowy pojawia się wtedy, gdy musimy przyjąć do wiadomości, że w każdym toposie snopówsnop-obiekt liczb rzeczywistych to ... poznany wcześniej snop funkcji ciągłych! Czy potrafisz sobiewyobrazić, czym jest np. przestrzeń metryczna w takim toposie?

Co więcej, jeśli odpowiednio dobierzemy topos z NNO, to spełnimy postulat Brouwera - wska-żemy topos z obiektem liczb rzeczywistych R takim, że wszystkie morfizmy z R do R są ciągłe!68

Teorię toposów z NNO, które są „well-pointed” i w których obowiązuje aksjomat wyboru,Lawvere nazwał Elementarną Teorią Kategorii Zbiorów - ETCS69. Można uznać, że to odmienna odZFC propozycja opisu klasycznego uniwersum, operująca innymi pojęciami pierwotnymi. Jednakteorie ZFC i ECTS nie są równoważne - ZFC jest nieco silniejsza: np. mamy w niej aksjomatsumy zbiorów, których istnienia nie można dowieść w ETCS.

Po co nam ten nowy opis klasycznego uniwersum? Choćby po to, aby czerpiąc pełnymi garściamiz teorii toposów potwierdzić dowód Cohena o niezależności (od ZFC) hipotezy continuum [69].

Jeśli ten świat potrwa jeszcze kilkaset lat, to, być może, Cantora i Hilberta będzie się pamiętać przedewszystkim jako twórców pierwszego toposa... .

67Ta modyfikacja polega na zapisaniu definicji Dedekinda w języku Mitchella-Benabou. „This language (...), is apowerful way to describe various objects in a topos as if they were sets. It can be viewed as making the topos intoa generalized set theory (...), so that we can write and prove statements in a topos, and properties of a topos, usingfirst order intuitionistic predicate logic” (https://ncatlab.org/nlab/show/Mitchell/Benabou+language) . Niesposóbignorować to, że prawie wszyscy obecnie pracujący matematycy są wychowani w kręgu matematyki teoriomnogo-ściowej. Język tej teorii jest ich językiem „ojczystym” a każdy inny matematyczny język jest obcy - trzeba się gouczyć przezwyciężając teoriomnogościowe nawyki. Stąd pomysł, by fragmenty teorii toposów opisywać nie w językukategorii ale w języku „podobnym” do języka teorii mnogości. To czysty pragmatyzm - nie sądzę, by to wnosiłocoś istotnie nowego do dyskusji o podstawach matematyki. Ale mogę się mylić. Może rzeczywiście język Cantora iHilberta jest najlepiej dostosowany do naszego postrzegania świata, najbliższy intuicji? Zainteresowanych odsyłamdo [73] (wersja prosta) i [89] (wersja rozbudowana nazwana konstruktywną teorią zbiorów.)68Dowody tych twierdzeń są zbyt skomplikowane by próbować je choćby naszkicować w języku, którego tu używamy.

Zainteresowanych odsyłam do [69].69Nie mylić z innym wynalazkiem - punktami ECTS.

Page 225: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 13

Od logiki do toposów

Każdy topos ma swą wewnętrzną logikę - „matematyka poprzedza logikę”. Czy można to odwrócić?

13.1 Topos snopów revisited

To, co istotnie w definicji snopa topologicznego to nie cała przestrzeń topologiczna (A, T ) lecztylko jej „bezpunktowa część” - rodzina zbiorów otwartych T 1 . Te zbiory tworzą zupełną algebrąHeytinga co oznacza, że każdy podzbiór T ma kres górny i dolny2. Stąd pomysł, by zająć sięsnopami związanymi z dowolnie wybraną zupełną algebrą Heytinga H.

H-snop to rodzina zbiorów F = (F (q) : q ∈ H) wraz z funkcjami fqp : F (q)→ F (p) dla dowol-nych elementów p, q ∈ H takich, że p ¬ q.Konwencja notacyjna. Termin „element obiektu A” zarezerwowaliśmy dla morfizmów z obiektukońcowego do A. Aby uniknąć nieporozumień elementy sumy rozłącznej zbiorów F (q) nazywamytu punktami snopa F . Gdy a ∈ F (q) i p ¬ q to piszemy a|p zamiast fq,p(a). Punkt a|p nazyywamy„obcięciem punktu a do p”.

Operacja obcinania punktów musi spełniać trzy warunki: dla dowolnego q ∈ H i a ∈ F (q),

- a|q = a , a|s = (a|p)|s jeśli tylko s ¬ p ¬ q ,- dla dowolnej zgodnej rodziny punktów

(ai ∈ F (qi) : i ∈ I

)- czyli takiej, że ai|qi∧qj = aj|qi∧qj -

istnieje dokładnie jeden punkt a ∈ F (sup(qi : i ∈ I)) taki, że a|qi = ai 3.

„Punkty snopa można obcinać i - pod pewnymi warunkami - sklejać”.

Morfizm H-snopów φ : F → G to rodzina funkcji (φq : F (q) → G(q) : q ∈ H) „respektującaoperację obcinania” - φq(a)|p = φp(a|p).

H-snopy i ich morfizmy tworzą topos. Logika - algebra H - wyznacza matematykę - topos H-snopów.

Algebra wartości logicznych w tym toposie to H. Klasyfikator podobiektów to rodzina ΩH =(ΩH(q) : q ∈ H) taka, że ΩH(q) = p ∈ H : p ¬ q.

Istnienie i równość punktów w snopachOne of the most intriguing features of topos is that it makes senseto talk about entities that only ”partially exists”. One can onlyspeculate what would have been Heidegger’s reaction had he beentold that the answer to ”What is a thing?” is ”Something thatpartially exists”[37]

1str. 2142Ponadto U ∧ sup(Vi : i ∈ I) = sup(U ∧ Vi : i ∈ I) dla dowolnych U, (Vi) ∈ T . Odtąd zakładamy, że rozważane tu

zupełne algebry Heytinga spełniają tak definiowany warunek dystrybutywności.3Stąd, w szczególności, F (⊥) jest zawsze zbiorem jednoelementowym (jednopunktowym)!

224

Page 226: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 225

Nasze doświadczenie matematyczne czerpiemy z teoriomnogościowym uniwersum. W tym świecie na py-tania „czy a jest elementem zbioru A” , „czy elementy są równe” i wreszcie „czy a istnieje” odpowiadamy„TAK” lub „NIE”. Tertium non datur.Matematyka toposów nie respektuje tego klasycznego paradygmatu. Dopuszcza „częściowe” istnienie.

W każdym H-snopie F można określić dwie miary:

- miarę równości punktów: gdy a ∈ F (r) i b ∈ F (s) to ich miarą równości jest największyelement q ∈ H taki, że a|q = b|q. Tę miarę oznaczamy symbolem a ≈F b.

- miarę istnienia: EF (a) = q gdy a ∈ F (q) 4

Miara istnienia jest wtórna w stosunku do miary równości - EF (a) = a ≈F a. Dla dowolnychpunktów a, b:

(Eq1) a ≈F b = b ≈F a,(Eq2) a ≈F b ∧ b ≈F c ¬ a ≈F c

Można uznać, że odkrycie iż „istnienie” i „równość” można mierzyć na niedychotomicznej skalito tylko ciekawostka. Ale można też uznać, że to fundamentalna różnica między matematyką teo-riomnogościową a matematyką toposa snopów i pokusić się o opis tej drugiej w języku, w którymmiara równości i miara istnienia są pojęciami podstawowymi.

13.2 Topos H

Realizacją tego zamysłu jest topos H-obiektów, który można zbudować dla dowolnej zupełnej alge-bry Heytinga H. Ale jest też niemiła wiadomość: definicja takiego toposa to - z formalnego punktuwidzenia - niezły koszmar.H-obiekty można traktować jako o reprezentacjach H-snopów. Już wyjaśniam: punkty H-snopówumiemy obcinać i sklejać. Morfizmy snopów zachowują nie tylko obcięcia (warunek definicyjny) aleteż sklejenia - gdy punkt a jest sklejeniem rodziny punktów (ai : i ∈ I) to jego obraz poprzez mor-fizm jest sklejeniem obrazów tych punktów. Dlatego każdy podzbiór punktów H-snopa pozwalającyodtworzyć pozostałe punkty za pomocą obcinania i sklejania w pewnym sensie go reprezentuje.

Takie podzbiory punktów H-snopów to H-obiekty.

Tym, którzy wiedzą cokolwiek o przestrzeniach liniowych pomoże przypomnienie roli jaką w tej teoriiodgrywają bazy: baza przestrzeni może być uważana za jej reprezentację z dwóch powodów:

- każdy wektor przestrzeni V można skonstruować z wektorów bazowch korzystając z operacji doda-wania i mnożenia przez skalary,

- każde przekształcenie liniowe φ : V → W można opisać korzystając z baz wyróżnionych w obuprzestrzeniach poprzez wskazanie tzw. macierzy przekształcenia5..

Topos H-obiektów i ich morfizmów - topos H - definiujemy tak:6

H-obiekty to pary (A,≈A: A × A → H) , gdzie A to niepusty zbiór, a funkcja ≈A spełnia - dladowolnych a, b, c ∈ A - dwa warunki:

a ≈a b ¬ b ≈ a,a ≈A b ∧ b ≈A c ¬ a ≈A c.

Funkcja ≈A to miara równości (punktów H-obiektu).

4Każdy H-snop ma dokładnie jeden „punkt nieistniejący” - taki, że E(a) = ⊥. „Istnieje punkt nieistniejący”... .5Być może lepiej kojarzyć reprezentacje H-snopów nie z bazami, ale ze zbiorami generatorów przestrzeni liniowych.

Ale skoro chodzi tylko o pomocne skojarzenia, to precyzja porównań nie jest aż tak istotna...6W literaturze używa się terminu „H-zbiory” To trochę niefortunne, bo skłania do myślenia o tym toposie w języku

teorii mnogości. Nazwa „kategoria H” ma też tę zaletę, że utrwala pamięć o twórcach tego lokalnego matematycznegouniwersum - A.Heytingu (pośrednio) i D.Higgsie, który tę kategorię opisał [46] (ale to nie Peter Higgs od bozonuHiggsa). Inną propozycją jest nazwa localic topos [73] ale w tym podejściu „miary równości i istnienia” nie sąeksponowane.

Page 227: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 226

Będziemy pisać EA(a) (lub E(a)) zamiast a ≈A a i nazywać funkcję EA miarą istnienia.

Mówimy o miarach „istnienia”, i równości” bo jakoś trzeba mówić. W zamian można mówić o mierach„obecności” i „współistnienia” lub miarach „kompletności” i „podobieństwa” lub... .Wybór nazw dla tych pojęć może inspirować ale może tez ograniczać. Proszę o tym pamiętać.

Morfizm z (A,≈A) do (B,≈B) to funkcja f : A × B → H taka, że dla dowolnych a, a1 ∈ A orazb, b1 ∈ B:

f(a, b) ¬ EA(a) ∧EB(b),a ≈A a1 ∧ b ≈B b1 ∧ f(a, b) ¬ f(a1, b1)f(a, b) ∧ f(a, b1) ¬ b ≈B b1EA(a) ¬ supf(a, b) : b ∈ B

Złożenie morfizmów f : (A,≈A)→ (B,≈B) i g : (C,≈C)→ (B,≈B) to morfizm-funkcjah : A× C → H taka, że

h(a, c) = sup(f(a, b) ∧ g(b, c) : b ∈ B).

Morfizm identycznościowy obiektu (A,≈A) to miara równości - funkcja ≈A : A×A→ H .

Dowód, że H-obiekty i ich morfizmy tworzą topos jest niebanalny [46]. Algebra wartości logicznychw tym toposie to algebra H. Klasyfikator podobiektów to H-obiekt ΩH = (H,≈H) , gdzie q ≈H rto największa wartość logiczna s ∈ H taka, że q ∧ s = r ∧ s. 7

Elementy algebry H pełnią tu podwójną rolę: są punktami w ΩH i jednocześnie wartościami miary rów-ności punktów w ΩH . Punkt związany z q ∈ H oznaczamy przez q. To pozwala uniknąć nieporozumieńzwiązanych choćby z tym, że miarą istnienia punktu q jest ... > - wszystkie punkty klasyfiktora podo-biektów są „globalne”! Na dodatek > ≈H q = q .konwencja notacyjna. Elementy algebry Heytinga H będziemy nazywać wartościami (logicznymi).

Uprzedzałem: ani to przejrzyste ani eleganckie... .Ale bez paniki - wszystko się pięknie wyjaśni8.

13.2.1 Punkty i elementy - od H-obiektów do H-snopów

Nie zaprzątajmy sobie głowy formalizmami i skupmy się na istocie tej konstrukcji. Krytyczna dlazrozumienia tej istoty jest relacja między punktami i elementami H-obiektów.

Punkty H-obiektu A = (A,≈) to elementy zbioru A. Punkt a ∈ A jest globalny gdy jego miarąistnienia jest największa wartość logiczna - E(a) = >.

Elementy A to morfizmy postaci e : 1q → A , gdzie q ∈ H, 1q = (?,≈q) oraz ? ≈q ? = q.Element e : 1q → A jest globalny gdy q = >.

Każdy punkt a ∈ A wyznacza element A - morfizm ea : 1E(a) → A , czyli funkcję ea : A → Htaką, że:

ea(b) = a ≈ b dla dowolnego b ∈ AAle nie każdy element jest wyznaczony przez punkt - „nie jest punktem”. Jeśli jednak tak jest

to H-obiekt jest opisywanym wcześniej H-snopem.

I to jest to. H-obiekty są w pewnym sensie niekompletne - mają „za mało” punktów - nie wszystkieelementy są wyznaczone przez punkty. H-snopy są kompletne, bo że każdy element jest wyznaczonyprzez dokładnie jeden punkt.H-snopy są eleganckie - to cenia matematycy. Ale H-obiekty można łatwiej opisać - wystarczy wskazaćdowolny zbiór punktów i określić dla nich miarę równości nie troszcząc się o to jak wygląda kompletny

7Obiekt końcowy to jednopunktowy obiekt 1> = (?,≈>) , gdzie E(?) = > .Morfizm true : 1> → ΩH to funkcja true : ? ×H → H taka, że true(?, q) = q8Podpowiedź budująca intuicję związaną z morfizmami: macierz M = [mij ] opisująca przekształcenie liniowe

f : V → W przy zadanych bazach (a1, . . . , an), (b1, . . . , bn) to w istocie funkcja: mij = f(ai, bj). Morfizm w H- funkcja f : A × B → H - to (nieskończona) macierz (o współczynnikach w H). Składanie morfizmów w H to„mnożenie” tych macierzy z tym, że dodawanie i mnożenie liczb (wykorzystywane w mnożeniu zwykłych macierzy)zastępują tu operacje w zupełnej algebrze Heytinga - koniunkcję i kres górny... .

Page 228: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 227

obiekt (snop) w ten sposób wygenerowany.Elementów jest więcej niż punktów. Czy interpretując kwantyfikator istnienia ∃ należy myśleć o punktachczy o elementach?

To, co powiedzieliśmy dotąd o punktach i elementach wystarczy, by zawiła definicja morfizmustała się olśniewająco prosta:

Morfizm f : A→ B przyporządkowuje punktom A elementy B:

a ∈ A ea : 1E(a) → A f · ea : 1E(a)ea→ A

f→ B

Jego opis - funkcję f : A × B → H - należy interpretować tak: wartość f(a, b) ∈ H to „miara wykorzy-stania” punktu b w budowie elementu - obrazu punktu a.

To oznacza, że:„podobiekty obiektu końcowego - H-obiekty postaci 1q - tworzą zbiór generatorów w toposie

H”.

Elementy H-obiektów umiemy obcinać i - pod pewnymi warunkami - sklejać:

- obcięcie elementu e : 1q → A do r ¬ q to element e|r : 1r → A taki, że e|r(a) = r ∧ e(a).

- jeśli (ei : 1qi → A : i ∈ I) jest zgodną rodziną elementów - taką, że ei|qi∧qj = ej|qi∧qj to jejsklejeniem jest element A - funkcja e : A→ H opisana wzorem e(a) = sup(ei(a) : i ∈ I).

Jednak obcięcia punktów i ich sklejenia nie muszą być punktami:

Przykład Szostakowicza. Załóżmy, że H = 22 = 0, 12 i popatrzmy na dwupunktowy 22-obiekt(a, b,≈), gdzie a ≈ b = (0, 0),E(a) = (0, 1),E(b) = (1, 0). Te punkty wyznaczają dwa różneelementy. Jedyny element globalny tego obiektu to morfizm e taki, że e(?, a) = (0, 1), e(?, b) = (1, 0).e to sklejenie punktów a i b9.

Podsumowaniem dyskusji o punktach i elementach jest takie oto twierdzenie:

Elementy H-obiektu A tworzą H-snop El(A) = (El(A),≈el) . Każdy element jest sklejeniem obcięćpunktów:

e(a) = sup(ec|e(c)(a) : c ∈ A) dla dowolnego punktu a 10.

H- obiekty A i El(A) mają różne zbiory punktów. Są różne, gdy patrzymy na nie przez teo-riomnogościowe okulary. A jednak „czujemy”, że te H-obiekty - „roboczy” A i elegancki, kompletnysnop El(A) mają ze sobą wiele wspólnego.

Jak to wyrazić formalnie, matematycznie? Odpowiedź już za chwilę.

Monomorfizmy, epimorfizmy, izomorfizmy

H-obiekty które mają identyczne zbiory punktów można łatwo porównywać: obiekt (A,≈1) jestmniejszy od (A,≈2) gdy a ≈1 b ¬ a ≈2 b dla każdej pary punktów. Wtedy funkcja id : A2 → Htaka, że id(a, b) = E(A,≈1)(a) ∧ (a ≈2 b) jest morfizmem z (A,≈1) do (A,≈2) .

Można też skonstruować „obiekt pośredni” (A,≈) , gdzie a ≈ b = E(A,≈1)(a) ∧(a ≈2 b)∧ E(A,≈1)(b)i pokazać, że id jest złożeniem dwóch morfizmów:

(∗) (A,≈1)eid→ (A,≈)

mid→ (A,≈2)z których pierwszy jest epi- a drugi monomorfizmem.

Morfizm id opisuje wzrost miary równości punktów zbioru A. Opisany rozkład odpowiada podziałowitego procesu na dwie fazy: Zapominając na chwilę o matematycznej precyzji, odczytamy zapis (∗) tak:

- „epimorfizm eid odpowiada fazie pierwszej, w której zwiększa się miara równości różnych punktów amiara istnienia pozostaje niezmieniona”,

9Skąd tu Szostakowicz? Tajemnica... .10Miarą równości elementów e : 1q → A, f : 1r → A jest największa wartość s ∈ H taka, że s ¬ q ∧ r i e|s = f|s .

W szczególności dla dowolnego elementu e i punktów a, e ≈el ea = e(a) .

Page 229: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 228

- „monomorfizm mid odpowiada fazie, w której zwiększa się miara istnienia a miara równości nie zwiększasię ponad to, co jest skutkiem zwiększenia miary istnienia punktów”

Tak opisane epi- i monomorfizmy są kanoniczne co oznacza, że:„każdy morfizm f : (A,≈A) → (B,≈B) jest złożeniem trzech morfizmów - epimorfizmu kano-

nicznego, izomorfizmu i monomorfizmu kanonicznego”:

(A,≈)eid //

f

11(A,≈1)if // (B,≈2)

mid // (B,≈B)

Skoro kanoniczne epi- i monomorfizmy nie zmieniają zbiorów punktów to musi to czynić izomorfizmif : (A,≈1)→ (B,≈2) - izomorfizm H-obiektów nie wymusza równoliczności zbiorów punktów! To trochęzaskakuje. Dlaczego?Model dowolnej teorii pierwszego rzędu posadowiony na obiekcie A można skopiować na izomorficz-nym obiekcie B. Ta kopia ma dokładnie te same (pierwszorzędowe) cechy co oryginał. I tak jeśli zdanie∀x,y(x = y) jest prawdziwe w oryginale to jest też prawdziwe w jego kopii. Ale to zdanie - „czytaneteoriomnogościowo” - mówi, że model ma jeden punkt. A przecież obiekt izomorficzny z jednopunktowymH- obiektem może mieć wiele punktów... .Wniosek może być tylko jeden - kwantyfikację uniwersalną w toposie H trzeba rozumieć inaczej.

Przykład. Dwupunktowy obiekt (a, b,≈) z „przykładu Szostakowicza” jest izomorficzny za-równo z jednopunktowym obiektem końcowym (1, E(1) = (1, 1)) jak i czteropunktowym snopemjego elementów.

Izomorficzne H-obiekty mogą mieć różne zbiory punktów ale mają „te same” elementy - generują takiesame snopy elementów częściowych11

.Dla nieprzekonanych: (różne) punkty a, b ∈ A nazwiemy rówoważnymi gdy E(a) = E(b) = a ≈ b

co oznacza, że wyznaczają ten sam element, ea = eb. Można zwiększyć zbiór punktów dorzucającdowolnie wiele „kopii” punktu a ∈ A zapewniając jednocześnie, że kopie a są z nim równoważne.Tak zbudowany „większy” obiekt jest izomorficzny z pierwotnym. Można dorzucić dowolnie wielepunktów nieistniejących - takich, których miarą istnienia jest najmniejsza wartość logiczna ⊥ ∈H12.

Na postawione wcześniej pytanie odpowiemy tak: różniące się „teoriomnogościowo” H-obiektA i H-snop El(A) są izomorficzne - „takie same”, gdy widzimy je wewnątrz toposa H. IzomorfizmηA : A → (El(A),≈el) jest wyznaczony przez przyporządkowanie a ∈ A ea ∈ El(A) (które naogół nie jest ani różnowartościowe ani funkcją „na”!)13

Skoro każdy H-obiekt jest izomorficzny z pewnym H-snopem to może należy wybrać jeden z tych topo-sów i zapomnieć o drugim? Jednak z „epistemologicznego punktu widzenia” te toposy to różne obiektymatematyczne. Są opisane w różnych językach. Każdy z tych opisów eksponuje inne cechy tego lokalnegouniwersum. Miary równości i istniania użyte w opisie H-obiektów to pojęcia zgodne z intuicja i przezto proste. Opis w języku snopów ułatwia wykorzystanie całego arsenał pojęć teorii kategorii (funktory,transformacje naturalne, sprzężenia)14.Pozwala też skorzystać z rezultatów badania klasycznych snopówtopologicznych.Różnorodność wielu opisów tego samego obiektu matematycznego jest zaletą a nie wadą.

Trochę patosu: czym jest matematyka, jeśli nie ciągłym poszukiwaniem najlepszego języka opisu?15

11Morfizm f : A → B opisany przez funkcję f : A × B → H - jest izomorfizmem gdy funkcja g : B × A → Hokreślona wzorem g(b, a) = f(a, b) jest morfizmem z B do A.12Można też odrzucać zbędne kopie punktów i punkty nieistniejące otrzymując zawsze H-obiekt izomorficzny.13Formalnie: ηA : A× El(A)→ H , η(a, e) = e(a).14Niestety w tym tekście jest to mało widoczne. Z prostego powodu - nie przedstawiłem języka kategorii w zakresie

to umożliwiającym.15Topos zbiorów skończonych i zawarty w nim mniejszy topos, ktorego obiektami są wyłącznie zbiory postaci

Page 230: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 229

13.2.2 Podobiekty

Podobiekty H-obiektu A = (A,≈) to morfizmy z A do klasyfikatora podobiektów. Mając w gło-wie koszmarną definicję morfizmów trudno oczekiwać, że dyskusja o podobiektach będzie łatwa iprzyjemna. Ale mam dobrą wiadomość: podobiekty w toposie H mają bardzo prosty, przyjaznyopis:

„każdy podobiekt obiektu A można jednoznacznie opisać wskazując jego funkcję charaktery-styczną α : A→ H - taką, że dla dowolnych punktów a, b ∈ A:

- α(a) ¬ E(a)- (a ≈ b) ∧ α(a) = (a ≈ b) ∧ α(b)

Wartość logiczna α(a) mówi jaka „część” punktu a ∈ A należy do tak opisanego podobiektu -stąd warunek α(a) ¬ E(a). Drugi warunek zapewnia, że H-obiekt Aα = (A,≈α) gdzie a ≈α a =α(a) ∧ a ≈ b reprezentuje podobiekt A16.

Aby zaznaczyć, że funkcja α opisuje podobiekt A będziemy pisać - trochę nieformalnie - α :A→ H . Będę też utożsamiał „podobiekt” z opisującą go funkcją charakterystyczną.

Możemy teraz łatwo opisać algebrę Heytinga podobiektów A:(α ∨ β)(a) = α(a) ∨ β(a), (α ∧ β)(a) = α(a) ∧ β(a).

Implikację opisujemy bardziej subtelnie:

(α→ β)(a) = E(a) ∧ (α(a)→ β(a))17

Każda wartość logiczna q ∈ H wyznacza podobiekt-funkcję chrakterystyczną γq : A → H :γq(a) = E(a) ∧ q dla dowolnego a ∈ A 18

Dla dowolnego podobiektu α : A→ H, γ∀α ¬ α ¬ γ∃α i jest to najwęższe „pasmo” utworzoneprzez podobiekty logiczne w którym znajduje się podobiekt α.Stąd:

∃(α) = sup(α(a) : a ∈ A)

∀(α) = inf(E(a)→ α(a) : a ∈ A) 19

O ile pierwszy wzór specjalnie nie dziwi to drugi już tak. Skąd ta implikacja? Dla dowolnegor ∈ H , γr ¬ α gdy E(a) ∧ r ¬ α(a) - dla każdego punktu a. A to - na mocy definicji implikacji -jest równoważne nierówności r ¬ E(a)→ α(a). Ot, cała tajemnica...

Funkcje charakterystyczne pozwalają też na prosty opis obiektu potęgowego ΩAH (str. 218). Te

funkcje są jego punktami globalnymi a Miarę równości podobiektów definiujemy tak:

α ≈sub β = ∀(α↔ β) = inf(α(a)↔ β(a) : a ∈ A).

Wartość logiczna stwierdzenia „podobiekt α jest mniejszy od podobiektu β - α ¬ β” to ∀(α→ β). To największa spośród tych wartości logicznych s ∈ H takich, że „obcięcie podobiektu α do s”jest podobiektem β - α ∧ γs ¬ β.Skoro każdy element e jest podobiektem to „tak samo” należy interpretować równość (e ∈ α) = s.

Wszystko jest tak jak w Set - tylko bardziej subtelnie... 20.

0, . . . , n są też równoważne. Ale czy ograniczenie (języka) badań do tego mniejszego toposu przyniesie jakiekolwiekkorzyści?16Dokładniej: α reprezentuje podobiekt - morfizm λα : A → ΩH taki, że λα(a, q) = E(a) ∧ (α(a) ≈H q). Jeśli

ktoś zechce wniknąć w szczegóły, ostrzegam: to nie są najprostsze rachunki!17Wartości logiczne mniejsze-równe p ∈ H tworzą algebrę Heytinga w której alternatywę i koniunkcję obliczamy

tak jak w H. Ale implikacja jest tu nieco inna: dla dowolnych r, s ¬ p: r →p c = p ∧ (r → s).18Gdy p ∧E(a) = q ∧E(a) dla dowolnego punktu a ∈ A to wartości logiczne p, q wyznaczają ten sam podobiekt.19Zakładaliśmy, że algebra H jest zupełna. Już wiemy, dlaczego.20Jedna z tych subtelności polega na tym, że nie można tak po prostu wyrzucić z podobiektu dowolny element

tworząc tak mniejszy podobiekt. Mam nadzieję, że to zauważyłeś... .

Page 231: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 230

Odwiecznym tematem (zazwyczaj jałowych) dyskusji ze studentami są pytania o wartość logicz-ną zdań postaci ∀x∈∅φ(x) i ∃x∈∅φ(x). Nagabywany wykładowca zazwyczaj odpowiada, że pierwszez tych zdań jest prawdziwe a drugie fałszywe. Robi się nieprzyjemnie gdy ktoś przypomni, że impli-kacja postaci ∀φ→ ∃φ jest - zgodnie ze zdrowym rozsądkiem - zawsza prawdziwa. Zazwyczaj takadyskusja kończy się zgniłym kompromisem - stwierdzeniem, że „kwantyfikacja po zbiorze pustym”jest niewartym uwagi problemem. Dużo w tym racji - taki „patologiczny” obiekt w toposie zbiorówjest tylko jeden21.W toposie H-obiektów nie jest tak łatwo gdyż jest tu całe mrowie obiektów pozbawionych elemen-tów globalnych (ale posiadajacych elementy częściowe). Czy te obiekty są „puste” czy też niepuste?Krótka dyskusja o subtelnościach kwantyfikacji w takich „patologicznych” H-obiektach wiele namwyjaśni.Trójelementowy poset (a, b, c, a < c, b < c) generuje 5-elementową algebrę H5 podzbiorów skie-rowanych w górę, którą narysujemy tak (diagram pierwszy z lewej):

l

> H5

r

d

@@I @@I

6

∅∗

@@I @@I

6

x

y

z

∅∗

@@I @@I

6

Środkowy diagram reprezentujeH5-obiekt 1⊥ z pojedynczym elementem nieistniejącym (E(∗) =⊥). Ten obiekt ma jeden podobiekt (jemu równy) i ∀1⊥ = >, ∃1⊥ = ⊥ .

Wynik taki sam, jak w przypadku zbioru pustego w Set. Ale teraz jest to rezultat toposowej definicjikwantyfikacji a nie „zdroworozsądkowej” analizy fraz „dla każdego” i „istnieje”22.

Trzeci obrazek to H5-obiekt z czterema punktami, których miary istnienia odczytamy z dia-gramu. Miara równości różnych punktów jest tu zawsze równa ⊥. Usuwając punkt y (nadając mumiarę istnienia ⊥) otrzymamy podobiekt A taki, że ∃A = > = ∀A = >.

∃A = > mimo, że w A nie ma punktów i elementów globalnych.To każe inaczej patrzeć na „skolemowską metodę eliminacji kwantyfikatora istnienia” która pozwala wy-eliminować z dowolnej teorii T zdanie-aksjomat postaci ∃φ(x) w zamian wprowadzając do języka stałą cφ- bez ryzyka utraty niesprzeczności teorii T (najlepiej znany przykład to dwie wersje teorii grup.)- „skoroelement istnieje, to go nazwijmy”. Ten przykład pokazuje, że to nieuprawnione gdy semantykę językadefiniujemy w innym toposie - jeśli semantyką stałej ma być element globalny23..

Jeśli usuniemy kolejny punkt z to otrzymamy podobiekt B taki, że ∀B = ⊥, ∃B = l

Semantyka języka pierwszego rzędu

Istnienie funkcji charakterystycznych podobiektów znacząco uprościć opis interpretacji języka pierw-szego rzędu w toposie H - możemy przyjąć, że semantyką formuły φ(x1, . . . , xn) w modelu posado-wionym na H-obiekcie A nie jest podobiekt [[φ(x1, . . . , xn)]] lecz reprezentująca go funkcja charak-terystyczna [φ] : An → H. Możemy teraz wykorzystać to wszystko, co powiedzieliśmy o algebrze

21Można złośliwie wypomnieć, że istnienie zbioru pustego to aksjomat ZFC a nie „oczywista oczywistość”.22Kategorię Set można utożsamiać z kategoria ⊥ < >-obiektów nadając wszystkim elementom zbioru miarę

istnienia > i dorzucając jeden element nieistniejący. Jeśli powtórzysz przedstawioną tu argumentację to będzieszwiedział dlaczego tak a nie inaczej mówi się o „kwantyfikacji na zbiorze pustym”.23Warto wspomnieć, że jest też „konstruktywna wersja” metody Skolema: jeśli zdanie arytmetyczne ∀x∃yψ(x, y)

jest dowodliwe w HA to istnieje obliczalna funkcja f taka, że zdanie ψ(n, f(n)) jest dowodliwe w HA.

Page 232: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 231

Heytinga podobiektów (ich funkcji charakterystycznych) i o ich kwantyfikacji24

Dla dowolnego punktu a = (a1, . . . , an) ∈ An wartość [φ](a) ∈ H to „miara posiadania przez punkt awłasności opisanej przez formułę φ(x1, . . . , xn)”. Punkt ma tę własność gdy ta miara jest równa mierzejego istnienia E(a) = E(a1) ∧ . . . ∧E(an) .Własność można przypisać nie tylko punktom lecz też elementom: element e : 1q → An ma własnośćopisaną przez formułę φ dokładnie wtedy gdy jest sklejeniem (sumą) obcięć punktów, dla których „sumamiar posiadnia własności opisanej przez φ” jest równa q.

Skoro każdy H-obiekt jest izomorficzny z H-snopem to wystarczy rozważać modele posadowionena snopach. To nęcące, bo to nie tylko uwalnia od dylematu „punkty czy elementy”. Taki modeljęzyka można opisać elegancko jako snop modeli - rodzinę teoriomnogościowych modeli (F (q) : q ∈H) taką, że funkcje-obcięcia a ∈ F (q) a|p ∈ F (p) „respektują operacje i relacje”25.

Możemy podobnie potraktować modele pewnych teorii w toposie H. Dlatego w literaturze spo-tkamy snopy grup i snopy pierścieni a raczej rzadko (nigdy) używa się sformułowania „model teoriigrup (pierścieni) w toposie snopów”. Ale czy tylko pewnych czy też wszystkich teorii pierw-szego rzędu? Znam tylko taki wynik: jeśli T jest teorią opisaną w języku pozbawionym symbolirelacyjnych a jej aksjomaty są quasi-równościami tzn. zdaniami postaci

∀x1,...,xn (p1 = t1 ∧ . . . ∧ pk = tk)→ (p = k)

to kategoria modeli teorii T toposie H jest równoważna z kategorią „H-snopów (teoriomnogościo-wych) modeli teorii T” 26.

13.2.3 Matematyka toposa - więcej niż przykład

Teoria mnogości jawi się jako oczywista oczywistość, bo z jej aksjomatycznym sformułowaniem (isubtelnościami stąd wynikającymi) spotykamy na ogół po latach matematycznej praktykowania„wewnątrz” tej teorii. Nikt, jak dotąd, nie zaczyna edukacji matematycznej od teorii toposów.To „język obcy”, trudny świat. Zapewne dlatego W. Phoa, komentując skomplikowane dowodytwierdzeń opisujących strukturę toposów, napisał: „There is no doubt that the pioneering topostheorists (...) all drank Carling Black Label.”[89]27

Każdy topos to matematyczne uniwersum, w którym można uprawiać matematykę odmiennąod teoriomnogościowej. Ujawnienie tych odmienności, czasem trudnych do zaakceptowania, niewymaga wcale sięgania po toposy których logika wewnętrzna jest wyjątkowo wyrafinowana.

Popatrzmy na topos 22-snopów, gdzie 22 = 0, 1×0, 1 to czteroelementowa algebra Boole’a.Wewnętrzna logika jest tu czterowartościowa: 11 (= true), 00 (= false), 01 oraz 10:

01

true

10

false

@@I @@I

22- snopy to czwórki zbiorów AB = (A,B,A × B, 1) . Miarą istnienia punktów zbioru A× B jesttrue, a punktów zbiorów A i B - odpowiednio - 01 i 10 .„Obcięcia” to projekcje. Punkt (a, b) ∈ A×B jest sklejeniem swoich obcięć - punktów a ∈ A orazb ∈ B.24Oczywiście pominęliśmy tu wiele istotnych szczegółów. Ale przeciez to są tylko (niepoważne) notatki a nie poważna

monografia.25Naukowo: każda funkcja-obcięcie F (q) F (p) jest homomorfizmem modeli. Mniejsza o szczegóły.26Ten, nie tak znowu trudny wynik, można znaleźć w pracy „Algebra in Grothendieck topos: injectivity in quasi-

equational classes”, M.M.Ebrahimi, JPPA 26(1982),269-283).27Carlig Black Label to - wg wikipedii - „ Canadian brand of lager distributed by Carling and well-known throughout

the former British Empire”.

Page 233: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 232

Obiekt liczb naturalnych to Nat = (N ×N,N,N, 1). Są tu globalne Liczby Naturalne - czylipary „zwykłych” liczb naturalnych - i częściowe Liczby Naturalne: każda „zwykła” liczba naturalnan wyznacza dwie takie Liczby: jedną o mierze 01 i drugą o mierze 10 .To pierwsza „dziwność” z którą musimy się zmierzyć.

Skoro w toposach można interpretować pierwszorzędowe teorie, to można (trzeba) zapytać: czyNat to model arytmetyki Peano? Odpowiedź brzmi „tak”. Ale i tu nie brak zaskoczeń.Zbadajmy jeden z aksjomatów PA - zdanie ∀x(x = 0 ∨ ∃y(x = succ(y)) . „Zero” - wymagany wdefinicji obiektu liczb naturalnych morfizm z obiektu końcowego do Nat - możemy utożsamiać zglobalną Liczbą Naturalną (0, 0) . Morfizm succ : Nat→ Nat przyporządkowuje globalnej LiczbieNaturalnej (n,m) Liczbę (n+1,m+1). Jeżeli odczytamy analizowany aksjomat tak, jak nas uczono- „każda Liczba Naturalna jest albo zerem albo następnikiem pewnej liczby” - to mamy kłopot:czy Liczba (0, 5) jest zerem czy następnikiem? Ani jednym, ani drugim... .

Katastrofa? W żadnym razie - wartość logiczna tego zdania-aksjomatu w wewnętrznejlogice rozważanego toposa jest równa true.Aby to pokazać wystarczy opisać semantykę składników alternatywy (x = 0) ∨ (∃y(x = succ(y)):- semantyką formuły ∃y(x = succ(y) jest podobiekt snopa Nat - czwórka:

[[∃y(x = succ(y)]] = (N>0,N>0,N>0 ×N>0, 1)

gdzie N>0 to zbiór liczb naturalnych pozbawiony zera. Podobnie

[[x = 0]] = (0, 0, (0, 0), 1)Stąd semantyką naszej alternatywy jest cały snop Nat. A to oznacza, że rozważany aksjomat jestprawdziwy w Nat!

Podobnie wartość logiczna zdania „(0, 5) jest zerem” nie jest ani prawdą ani fałszem - tą war-tością jest 01. A zdanie „(0, 5) jest następnikiem pewnej liczby” ma wartość logiczną 10. Dlategoalternatywa tych zdań jest prawdziwa chociaż żaden jej składnik nie jest zdaniem prawdziwym... .

To nie matematyczne czary. Logika tego toposa jest wprawdzie boolowska ale nie dwuwartościowa -prawdziwość alternatywy p ∨ q nie oznacza prawdziwości jednego z jej składników. Takie wnioskowanieto „wnioskowanie dychotomiczne” (lub: teoriomnogościowe) a nie boolowskie.

Logika (chyba każdego) języka naturalnego jest dwuwartościowa. Wnioskowanie dychotomiczne to częśćnaszego „kodu cywilizacyjnego”. Wyjście poza logikę dwuwartościową jest kulturowym szokiem.Globalna Liczba Naturalna (0, 5) jest trochę zerem i trochę następnikiem, trochę parzysta i trochęnieparzysta. To „trochę” potrafimy precyzyjnie mierzyć w logice wewnętrznej tego toposa. Zdanie∀x,y(x < y) ∨ (y < x) ∨ (x = y) jest tu prawdziwe choć wydaje się, że Liczby (2, 4) i (4, 2) temuprzeczą...

Legendarna opowieść o kocie Schrodingera przestanie być aż tak szokująca gdyby przyjąć, że logika(matematyki) świata kwantowego nie jest dychotomiczna....

Są tu też inne fakty sprzeczne z naszą intuicją:- nie jest prawdą, że każdą (globalną) Liczbę można skonstruować z zera za pomocą operacji

następnika w skończonej liczbie kroków,- na pozór oczywiste wyróżnienie globalnych Liczb Naturalnych postaci (n, n) nie ma w tej

matematyce sensu - to nie jest podobiekt Nat... .

Każdy skończony obiekt w tym toposie izomorficzny z obiektem postaci (n,m, n×m, 1), gdzien = 0, 1, . . . , n−1 (0 to zbiór pusty). Liczba (n,m) daje pełniejszą informacją o tym obiekcie niżnp. wskazanie liczby jego elementów (punktów). Liczby Naturalne nadal służą do „zliczania”.Z kolejkowaniem nie jest już tak łatwo28. Porządek „¬” w Nat jest dobrym porządkiem - jest (w„dziwny sposób”, ale jest) liniowy i każdy podobiekt Natma element najmniejszy. „Kolejkowanie”to procedura numerowania elementów skończonego obiektu, krok po kroku, począwszy od obiektupustego. Ale podczas gdy w Set w każdym kroku dodaje się do pojedynczy element (nadając mu

27Podobnie jest ze zdaniem ∀x,y(x ¬ y)∧(y ¬ x)→ (x = y). Np. wartość logiczna koniunkcji (1, 2) ¬ (2, 2)∧(2, 2) ¬(1, 2) to 10 . Wartość logiczna równości (1, 2) = (2, 2) jest taka sama... .28O tym, że liczby naturalne służą do zliczania i kolejkowania pisałem rozpoczynając skrypt.

Page 234: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 233

najniższy „wolny” numer), w toposie 22-snopów dodając element któremu nadamy pierwszy wolnynumer (n,m), musimy jednocześnie dodać inne elementy, które wyczerpią pulę numerów - Liczbpostaci (n, k) i (k1, n) gdzie k ¬ m i k1 ¬ n 29.

Dobry porządek ma opis obowiązujący w obu toposach lecz odmienny sens w każdym z nich.Jakby to było mało to dopowiedzmy, że w nieco większym, ale równoważnym toposie 22-obiektów obiektNat jest izomorficzny („taki sam”) z 22-obiektem (N,≈) gdzie miara równości jest „dyskretna”: n ≈m = > gdy n = m i n ≈ m = ⊥ w przeciwnym wypadku... .

Analogicznie jak Nat skonstruujemy w tym toposie obiekty liczb całkowitych, wymiernych irzeczywistych. Możemy w tym toposie interpretować analizę matematyczną. Ale tu też musimy byćczujni. Np. ciąg (1, 1), (1

2 , 2), . . . , ( 1n , n), . . . jest trochę zbieżny ( do 001 !) i trochę rozbieżny... .30

Nie trzeba przekonywać, że niewiele się zmieni, gdy zamiast czteroelementowej algebry 22 punk-tem wyjścia do konstrukcji toposa będzie algebra podzbiorów n-elementowego zbioru ... .

Ktoś powie, że te toposowe rebusy mało kogo interesują. Czyżby? Pomyślmy o szkole, w którejuczniowie uczą się pięciu przedmiotów. Ich wyniki opisuje pięcioelementowy ciąg liczb-ocen. Tonaturalne. Naturalne jest też stwiedzenie, że Jasiu jest lepszy od Ewy z matematyki ale ona jestlepsza z biologii. Ale na koniec roku zaczyna się wyliczanie absurdalnej średniej ocen. Absurdalnej,bo zbiór Liczb Naturalnych - ciągów (n1, . . . , n5) których średnia arytmetyczna jest, powiedzmy,większa od 4, nie jest obiektem w toposie 25-snopów. To jest obiekt teoriomnogościowy, obiekt zinnego świata... I jak tu lubić szkołę?

Robimy wiele różnych rzeczy, lepiej lub gorzej. Ale dajemy sobie narzucać liniową skalę ocen życiowegosukcesu. Jaki sens ma porównanie osiągnięć Einsteina i Bolta?31

Obiekty bogate, presnopy i zbiory rozmyte (krótko)

Elementy H-obiektu konstruujemy obcinając i sklejając jego punkty. Nic więc dziwnego w wyróż-nieniu dwóch klas tych obiektów: takich, w których każdy element jest sklejeniem zgodniej rodzinypunktów i tych, w których każdy element jest obcięciem punktu. Pierwsza klasa to znane nam jużH-presnopy32. Druga klasa to bogate H-obiekty33. Co istotne,

każdy morfizm do bogatego H-obiektu - f : (C,≈C)→ (A,≈A) - jest prosty, tzn. jednoznacznieopisany przez funkcję β : C → A taką, że c ≈C c1 ¬ β(c) ≈A β(c1) 34.

H-obiekty potęgowe - w szczególności klasyfikator podobiektów - są bogate. To tłumaczy, dla-czego podobiekty w tym toposie są reprezentowane przez funkcje charakterystyczne.

H- snopy to... bogate H-presnopy.Wyróżnijmy kolejną klasę: H-zbiór rozmyty to H-obiekt (A,≈) w którym miara równości jest

zredukowana do miary istnienia: a ≈ b = ⊥ jeśli tylko a 6= b . Te obiekty opisujemy prościej, jakopary (A,EA : A→ H) nie nakładając na funkcję EA żadnych ograniczeń.

Ta definicja jest „prawie” tożsama z tą, którą sformułował L.A.Zadeh. „Prawie”, gdyż wewczesnych pracach o zbiorach rozmytych nie mówi się wiele (wcale) o ich morfizmach. Tutaj to

29Trzeba też dodać wszystkie obcięcia dorzuconych punktów globalnych. Pominęliśmy tu równie ciekawą dyskusję ojednokrokowym powiększaniu obiektu „o pół kroku” czyli gdy do kolejki - dobrze uporządkowanego obiektu - chcemydołączyć punkt częściowy. „Pół-kroki i kroki”? Kroki częściowe i globalne?30Dla ścisłości: ciąg to teraz morfizm z Nat do obiektu liczb rzeczywistych... .31Gdyby Stanisław Lem znał teorię toposów to zapewne napisałby kolejną powieść o funkcjonowaniu człowieka w

wielu równoległych światach. Chociaż... Dr Jekyll and Mr Hyde?32Uwaga: morfizmy H-presnopów definiowane tak, jak morfizmy snopów a morfizmy między presnopami w kategorii

H to nie to samo: w drugim przypadku jest ich więcej.33ample objects w [46]. Lepsze tłumaczenie nie przychodzi mi do głowy.34f(c, a) = EC(c) ∧ (β(c) ≈A a) . Element-obraz punktu c poprzez morfizm f to obcięcie punktu β(c). Morfizm

prosty może mieć wiele takich reprezentacji ale nie jest to istotna komplikacja.

Page 235: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 234

zrobiliśmy lokując H-zbiory rozmyte wewnątrz toposa H35.Bliższe różnym definicjom morfizmów H-zbiorów spotykanym w literaturze są morfizmy proste.

Ale nie każdy morfizm między H-zbiorami rozmytymi w toposie H jest prosty. Np. rozpatrywany wprzykładzie Szostakowicza (str. 227) dwupunktowy obiekt (a, b,≈) to 22-zbiór rozmyty (który niejest bogaty). Morfizm prosty z tego obiektu do jednoelementowego zbioru rozmytego (?, E(?) =>) jest izomorfizmem w toposie 22-obiektów, ale nie jest izomorfizmem w kategorii 22-zbiorówrozmytych.

Topos H to oszczędne rozszerzenie kategorii rozmytych H-zbiorów w tym sensie, że „każdyH-obiekt jest epimorficznym obrazem pewnego rozmytego H-zbioru”36.

Ostatnia w kolejce wyróżnianych podkategorii to ... kategoria zbiorów, która jest w oczywistysposób zanurzalna w kategorię H-zbiorów rozmytych.

Snopy, presnopy, obiekty bogate, zbiory rozmyte czy wreszcie „zwykłe” zbiory... . Wszystko to pokazuje,że intuicyjnie prosta konstrukcja różnych toposów w oparciu o miarę równości powiązaną ścisle z logikąnie jest peryferyjną ciekawostką ale wydajną metodą opisu różnych matematycznych światów.

13.3 Morfizmy geometryczne, teorie geometryczne

Z kategoryjnego punktu widzenia opowieść o toposach będzie niepełna jeśli nie powiemy nic omorfizmach między toposami.Toposy to kategorie. Związki między kategoriami opisujemy za pomocą funktorów. Ale interesująnas tylko te funktory, które w pewien sposób odnoszą się do tego, co w toposach jest istotne37.Realizacją tego zamysłu są morfizmy geometryczne:

„If E and F are toposes, a geometric morphism f : F → E consists of an pair of adjoint functorsf∗ : E → F, f∗ : F → E such that the left adjoint f∗ preserves finite limits”.

Koszmar: wydaje się, że jedyne co można, to nauczyć się tej definicji na pamięć... . Spróbu-jemy jednak odnaleźć jej sens opisując morfizmy geometryczne między toposami H-obiektów iH1-obiektów dla różnych algebr Heytinga.

Zacznijmy od prostej obserwacji: „z każdą funkcją monotoniczną między zupełnymi algebramiHeytinga - m : H → H1 - która zachowuje skończone przekroje i dowolne sumy38 można związaćfunktor m∗ : H → H1:

m∗(A,≈) = (A,m· ≈: A2 → Hm→ H1) dla każdego H1-obiektu (A,≈),

m∗(f : A×B → H) = m · f : A2 → Hm→ H1 dla dowolnego morfizmu H-obiektów f : A→ B .

Tak zdefiniowany funktor nazwiemy mutacją (wyznaczoną przez m : H → H1).

Funktory-mutacje to morfizmy geometryczne między toposami H1-obiektów i H-obiektów39.

35Praca Zadeha „Fuzzy sets” ukazała się w 1965 roku (Information and Control 8(3)). Dopiero w 2004 r.w pracy”Categories of fuzzy sets”, C.L. Walker, Soft Computinng Feb. 2004, Vol.8, Issue 4 próbowano zdefiniować morfizmyH-zbiorów rozmytych. W pracy „On a new category of fuzzy sets”, A.R.Porselvi Agnes, D.Sivaraj, T.Tamizh Chelvam,Journal of Advanced Research in Pure Mathematics Vol.2,Issue 4, 2010 morfizmy zbiorów rozmytych zdefiniowanonieco inaczej. Także w monografii „Fuzzy Sets, Fuzzy Logic, Fuzzy Methods with Applications”, H. Bandemer, S.Gottwald (dostępna w internecie) trudno znaleźć definicję morfizmu zbiorów rozmytych.36Funkcja ≈ : A×A→ H jest epimorfizmem z rozmytego H-zbioru (A,EA) do A = (A,≈). Dla zaawansowanych:

to kokwalizator pary prostych morfizmów między (A×A,E) i (A,EA) , gdzie E(a, b) = (a ≈ b).37Wyróżnianie tego, „co nas interesuje” wydaje się być skrajnie subiektywne. Ale nie w matematyce. Na przykład:

morfizmy między grupami (G, ·, e) i (G1, , e1) to te funkcje h : G→ G1 które zachowują algebraiczną strukturą grup,tzn. - h(a · b) = h(a) h(b) , h(e) = e1. Z toposami jest podobnie.38m(q ∧ p) = m(q) ∧m(p), m(sup(pi : i ∈ I)) = sup(m(pi) : i ∈ I).39Mutacja m∗ to tylko jeden z pary funktorów sprzężonych tworzących morfizm geometryczny między toposami

H1-obiektów i H-obiektów (zwróć uwagę na „zmianę kierunku morfizmu!). Ale pominiemy milczeniem tę resztę iskoncentrujmy uwagę na mutacjach. Proszę też nie szukać terminu „funktor-mutacja” na stronach internetowych -wprowadziłem go wyłącznie na użytek tego tekstu.

Page 236: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 235

Najprostszy funktor-mutacja to zanurzenie Set w topos H-obiektów które jest generowane przezf -morfizm m : ⊥ < > → H 40

13.3.1 Frames, locales i algebry Heytinga

Przyjrzyjmy się dokładniej funkcjom między algebrami Heytinga generującym funktory-mutacje.Będę je tu nazywał frame-morfizmami (krótko: f -morfizmami).„Frame” to krata zupełna w której spełniony jest warunek dystrybutywności:

x ∧ sup(yi : i ∈ I) = sup(x ∧ yi : i ∈ I).

Taki obiekt nie różni się niczym od zupełnej algebry Heytinga gdyż można w nim (jednoznacznie)zdefiniować implikację:

x→ y = sup(x : x ∧ a ¬ b)- implikacja jest wtórna w stosunku do operacji przekroju i supremum.

Po co nam nowa nazwa dla tych samych obiektów? Bo jesteśmy kategorystami.f -morfizm m : H → H1 zachowuje przekroje i kresy górne ale nie zachowuje implikacji - taka funkcja jest„homomorfizmem frame’ów” ale nie jest homomorfizmem algebr Heytinga41.Kategorie algebr Heytinga i kategorie „frames” są różne choć mają te same obiekty. Mówiąc „frames”zamiast „algebry Heytinga” zapominamy o (wtórnej) implikacji i jednocześnie zwiększamy liczbę mor-fizmów między tymi obiektami. Zależność, którą wcześniej opisaliśmy mówi o wzajemnie jednoznacznejodpowiedniości między morfizmami z H do H1 w kategorii „frames” (f -morfizmami) a morfizmami geo-metrycznymi - funktorami między toposami H-obiektów i H1-obiektów.

Kategorię „frames” i f -morfizmow oznaczam tu przez Frames. Nie będę jednak nadużywaćnazwy „frame” ani tym bardziej szukać jej polskiego odpowiednika42. Ale będę używał nazwy f -morfizm.

Jest też bardziej subtelny powód pominięcia implikacji: jej definicja w dowolnym „frame” jestimpredykatywna (str. 76): x → y to największy spośród elementów zbioru wyróżnionych przezpewną własność (którą x→ y też posiada). A tego konstruktywiści nie kochają... .

Teza, że zastąpienie algebr Heytinga przez „frames” to krok w stronę konstruktywizmu jestkontrowersyjna. Ale to dobry punkt wyjścia do zrozumienia nominalistycznego spojrzenia na roz-ważaną tu sytuację. To podejście związane jest - symbolicznie - z trzecią nazwą dla tych obiektów:algebra Heytinga to locale43.

13.3.2 Teorie geometryczne

„Model teorimnogościowy języka pierwszego rzędu to jego interpretacja w języku teorii mnogości”. -pisałem w podrozdziale ,Modele teoriomnogościowe a nominalizm”.Tę dyskusję toczyliśmy akceptując dominującą rolę teorii mnogości jako ur-teorii mainstramowej ma-tematyki: model teorii to zawsze był model teoriomnogościowy44. Teraz zamiast dominatora - toposazbiorów - mamy wiele równouprawnionych matematycznych uniwersów, wiele toposów. Można definio-wać semantykę teorii w dowolnie wybranym toposie i pytać o zależności między jej modelami w różnychtoposach.

Jeśli mamy przyjąć nominalistyczny paradygmat - „model to translacja teorii” to musimy naj-pierw odpowiedzieć na pytanie czy każdy topos - tak jak topos zbiorów - ma swoją teorię?

40Drugi z funktorów tworzących ten morfizm geometryczny (z H do Set!) przyporządkowuje każdemu H-obiektowizbiór jego elementów globalnych.41Homomorfizmem między strukturami algebraicznymi przyjęto nazywać funkcję zachowującą wszystkie działania

wyróżnione w tych algebrach.42„Frame” to rama, kościec a nawet skład rządu. Żadne z tych tłumaczeń (nawet to ostatnie) nie wydaje mi się

adekwatne.43Ponownie: nie znam żadnej propozycji spolszczenia tego terminu.44Jedyny wyjątek zrobiliśmy dyskutując zależność ZFC− i Arytmetyki Peano.

Page 237: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 236

Rozpoczniemy ponownie od zupełnych algebr Heytinga - pokażemy, jak z każdą z nich związaćpewną teorię geometryczną.

Skąd tu „geometria”? Wszystkie algebr Heytinga mają pewne wspólne własności - te, które są konse-kwecją definicji tej klasy obiektów. Np. „x ∧ y ¬ y” czy też „x ¬ supS jeśli tylko x ∈ S”. Ale w każdejpojedynczej algebrze Heytinga relacja „¬” ma też pewne specyficzne własności odróżniające ją od pozo-stałych. Np. nierówność > ¬ ⊥ - „element największy jest mniejszy-równy elementowi najmniejszemu”- wyróżnia jednoelementową algebrę Heytinga. Te specyficzne własności „¬” to właśnie geometria danejalgebry Heytinga. A gdy jest to algebra zbiorów otwartych przestrzeni topologicznej - to „geometria” tejprzestrzeni.Formalnym opisem tak rozumianej geometrii jest właśnie teoria geometryczna45.

Język zdaniowych teorii geometrycznych przypomina język klasycznej logiki zdaniowej: budujączłożone geometryczne formuły zdaniowe korzystamy tylko z koniunkcji - „∧” i alternatywy - „

∨”

która jest nieograniczona . Wyróżniamy też dwie stałe - „>” i „⊥”46.

Zdaniowa teoria geometryczna to dowolny zbiór formuł postaci φ → ψ gdzie φ i ψ to formułygeometryczne zbudowane ze zmiennych należących do ustalonego dla danej teorii zbioru zmiennychzdaniowych ZMT

47.

Każde wartościowanie zmiennych w zupełnej algebrze Heytinga H - funkcję i : ZmT → H możnajednoznacznie rozszerzyć do interpretacji wszystkich formuł geometrycznych:

i(φ ∧ ψ) = i(φ) ∧ i(ψ), i(∨φi : i ∈ I) = sup(i(φi) : i ∈ I).

Wartościowanie i : ZmT → H jest modelem teorii T gdy dla każdego aksjomatu (φ → ψ) ∈ T ,i(φ) ¬ i(ψ) (równoważnie: i(φ)→ i(ψ) = >).

Implikacja (i negacja) występuje jedynie w aksjomatach specyficznych teorii geometrycznej a nie w jejaksjomatach logicznych, które opisują wszystkie wspólne „przestrzenne” (topologiczne) cechy zupełnychalgebr Heytinga48.Aksjomaty logiczne są kategoryczne a aksjmaty specyficzne są formułowane w duchu logiki założeniowej.

Związek teorii geometrycznych i algebr Heytinga opisują dwa twierdzenia:- „każda teoria geometryczna T wyznacza algebrę Heytinga H(T ) wraz z wartościowaniem

iT : ZmT → H(T ) która jest rdzennym modelem teorii T” co oznacza, że„dowolny model teorii T w H jest postaci m · iT gdzie m : H(T )→ H to f -morfizm” 49,

- „każda algebra Heytinga H jest opisywalna przez teorię geometryczną (tzn. H = H(T ) dlapewnej teorii geometrycznej T )” 50

45Zgodnie z klasyfikacją F.Kleina (str. 45), topologia jest jednym z rodzajów geometrii - bada te własności „obiektówprzestrzennych” które są zachowywane przez homeomorfizmy (izomorfizmy wTop). A każdy homeomorfizm wyznaczaf -izomorfizm między zupełnymi algebrami Heytinga zbiórów otwartych rozważanych przestrzeni. Teorie opisująceobiekty i morfizmy kategorii Frames można więc uznać za opis geometrii przestrzeni topologicznych (tak mi sięprzynajmniej wydaje).46Jeśli S to dowolny zbiór formuł geometrycznych to napis

∨S” jest też formułą. Teorie geometryczne to „teorie

rzędu 0” - nie ma tu zmiennych przedmiotowych ale wyłącznie zmienne zdaniowe. Takie teorie spotykamy w mate-matyce mainstreamowej nader rzadko i dlatego teorie geometryczne i ich modele mogą się wydać na pierwszy rzutoka czymś dziwacznym.47Zwróćmy uwagę, że nie mówimy to o jednym, ustalonym a priori zbiorze zmiennych wspólnym dla wszelkich teorii

geometrycznych. Odwrotnie, budowę teorii zaczynamy od wskazania jej zbioru zmiennych ZmT . Niby drobiazg, alepozwala np. bez oporów przyjąć do wiadomości istnienie teorii geometrycznych o pustym zbiorze zmiennych a nawetpustej teorii geometrycznej z pustym zbiorem zmiennych.48Tak naprawdę to te logiczne aksjomaty są ukryte w (założeniowym) systemie dowodzenia zdaniowej logiki geo-

metrycznej. Jest on bardzo prosty ale nie będziemy go tu omawiać polecając zainteresowanm lekturę [135].49Elementy algebry H(T ) to klasy T -równoważnych formuł geometrycznych. Formuły φ i ψ są T -równoważne gdy

- korzystając z aksjomatów teorii T - można dowieść implikacji φ→ ψ i ψ → φ.Rdzenny model iT to przyporządkowanie zmiennej z jej klasy równoważności, iT (z) = [z]. Określenie „rdzenny model”to moja propozycja tłumaczenia angielskiego terminu generic model.50Różne teorie mogą opisywać tę samą algebrę. Standardowy opis H to teoria T (H) taka, że: ZmH = vp : p ∈ H,

vp → vq gdy p ¬ q, vp ∧ vq → vp∧q, > → v>, v∨S→∨vq : q ∈ S dla dowolnego S ⊆ H [135].

Page 238: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 237

„Tak samo” jest na poziomie toposów:

„for every geometric theory T , there exists a topos B(T ) (called the classifying topos of T )containing a model GT of T which is generic in the sense that, for any Grothendieck topos F ,the functor(...) which sends a geometric morphism f : F → B(T ) to the T-model f∗(GT ) , is anequivalence of categories. Conversely, for every Grothendieck topos F , there exists a geometrictheory T such that B(T ) ∼= F”51

Różnica w tym, że w świecie toposów teorie geometryczne to teorie pierwszego rzędu:- formuła pierwszego rzędu jest geometryczna jeśli jest zbudowana z formuł atomowych jedynie

za pomocą alternatywy, koniunkcji i kwantyfikatora „∃”.- teoria pierwszego rzędu jest geometryczna jeżeli wszystkie jej aksjomaty są zdaniami postaci

∀φ lub ∀(φ→ ψ) gdzie formuły φ i ψ są geometryczne.

Zainteresowanych dowodem przywołanego twierdzenia odsyłam do [69]52. Zauważmy jedynie, że ztego twierdzenia wynika, że - podobnie jak w przypadku f -morfizmów - funktory geometrycznezachowują modele teorii geometrycznych:

jeśli H-obiekt A (wraz z odpowiednimi morfizmami qi : An → A, rj : An → Ω) jest modelemteorii geometrycznej T to dla dowolnej mutacji m∗ : H → H1 obiekt m∗(A) wraz z mutacjamimorfizmów (qi), rj jest modelem teorii T w toposie H1 [69].

Algebry Heytinga generują toposy a morfizmy między nimi - funktory geometryczne. Ta szczególna„sprawczość” wpisuje się w schemat nazwany kategoryfikacją: „categorification is the process of repla-cing set-theoretic concepts and theorems with category-theoretic analogues. Categorification, when donesuccessfully, replaces sets with categories, functions with functors, and equations with natural isomorphi-sms53of functors satisfying additional properties (wikipedia)..

Wiele (większość) teorii pierwszego rzędu „ważnych” w mainstreamowej matematyce to teoriegeometryczne. Ale nie wszystkie.Interpretacja teorii w różnych toposach ujawnia czasem zaskakujące subtelności. Tak jest np. wprzypadku jednej z najważniejszych teorii - teorii ciał. Jeden z aksjomatów tej teorii można zapisaćtak: ∀x((x = 0) ∨ ∃yxy = 1) lub tak: ∀x(¬(x = 0) → ∃yxy = 1). To, że te zapisy są równoważneudowodni ok. 43,52% studentów. Ale tylko dlatego, że żyją w świecie klasycznej logiki.

Łatwo zauważyć, że przyjmując pierwsze sformułowanie tego aksjomatu będziemy mieli do czy-nienia z geometryczną teorią ciał54. Jeśli wybierzemy drugie sformułowanie, to już nie. Która z tychdwóch wersji teorii ciał jest „właściwa” ?Podstawowy obiekt mainstreamowej matematyki - dedekindowskie liczby rzeczywiste z dodawa-niem i mnożeniem - to ciało. W wielu toposach ten obiekt ma swój odpowiednik - „obiekt liczbrzeczywistych”. Oczywiste jest oczekiwanie, że taki obiekt powinien być modelem teorii ciał. W to-posie snopów nad R ten obiekt to snop rzeczywistych funkcji ciągłych. A ten obiekt jest modelem

Gdy T jest pustą teorią nad pustym zbiorem zmiennych T to H(T ) jest dwuelementową algebrą Boole’a.Dla zaawansowanych: relacja między teoriami geometrycznymi a zupełnymi algebrami Heytinga to rozszerzenie kla-sycznej relacji między algebrami Lindenbauma i algebrami Boole’a.

Te twierdzenia pozwalają na utożsamienie f -morfizmów zH0 = H(T ) doH1 z modelami teorii T wH1. Jednocześniekażdy taki f -morfizm jest translacją formuł geometrycznych języka teorii T na formuły geometryczne języka teoriiT1 takiej, że H1 = H(T1). („modele to translacje” - tak jak chcą nominaliści).51Classifying toposes for first-order theories, C.Bud, P.Johnstone. Upuśćmy jednak trochę powietrza z tego balonika:

druga częśc tego twierdzenia jest banalna - przynajmniej gdy ograniczamy się do toposów H-obiektów: topos H- jesttoposem klasyfikującym dla teorii T (H) opisującej algebrę H. Ten rdzenny model” to ...algebra podobiektów obiektukońcowego w H.52Aby to twierdzenie było dowodliwe musimy użyć tzw. wielopodstawowych teorii geometrycznych. Ale zapomnijmy

o tym.53Tę zależność próbuje się opisywać też nieco inaczej: „the notion of (0, 1)-topos is essentially equivalent to that

of Heyting algebra; similarly, a Grothendieck (0, 1)-topos is a locale.”. Terminy „n-kategoria”, „(n,m)-kategoria(topos)” czy też „(∞, 1)-topos” należą do języka teorii kategorii wyższego rzędu (higher order category). Nie czujęsię upoważniony by napisać choćby słowo więcej.54Pozostałe aksjomaty teorii ciał są geometryczne.

Page 239: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 238

geometrycznej teorii ciał a nie jest modelem jej niegeometrycznej wersji! [69].Chyba nie mamy wyboru - „właściwa” jest geometryczna wersja teorii ciał.

13.3.3 Funktory logiczne

Funktor-mutacja generowany przez f -morfizm m : H → H1 zachowuje „snopową strukturę” to-posów: elementy H-obiektu A przekształca w elementy m∗(A) respektując operacje obcinania ele-mentów i sklejania zgodnych rodzin55. Podobiekty H-obiektu A przekształca w podobiekty m∗(A)zachowując przy tym skończone przekroje i dowolne sumy. To oznacza, że mutacja zachowuje „częśćgeometryczną” wewnętrznej logiki toposa co z kolei wystarcza by mutacje zachowywały modele teo-rii geometrycznych.

Ale mutacje nie zachowują modeli wszelkich teorii pierwszego rzędu. Tę własność mają funktoryHeytinga między toposami H-obiektów i H1-obiektów są generowane przez homomorfizmy algebrHeytinga h : H → H1 (czyli f -morfizmy zachowujące implikację (i negację). Funktory Heytingazachowują pełną pierwszorzędową wewnętrzną logikę tych toposów.

Funktory logiczne zachowują całą logiczną strukturę toposów, nie tylko pierwszorzędową. Wświetle tego, co napisałem o relacji ∈A w toposach na str. 220 nie zdziwi taka definicja:Funktor między toposami F : C → D jest logiczny gdy zachowuje wszelkie skończone granice iobiekty potęgowe oraz relację „∈” : dla dowolnego obiektu A ∈ C , F (∈A) =∈F (A)

56

13.4 Czy nieskończona logika jest logiką?

„Prawda” i „fałsz” to podstawowe pojęcia języka opisu rzeczywistości. Logika toposa zbiorów jestdwuwartościowa. Tymczasem w toposie H-zbiorów skala wartości logicznych nie musi być skończo-na. Może być nawet nieprzeliczalna. Czy to ma sens, czy to wciąż jest logika?

Celowość zadawania tego pytania ujawnia się dopiero wtedy, gdy wyjdziemy poza świat toposówboolowskich. A to dlatego że wśród toposów boolowskich dwuelementowa logika toposa Set nie tylkowyróżnia się prostotą, ale jest w pewnym sensie uniwersalna. To jest konsekwencja twierdzenieStone’a: dowolną algebrę Boole’a można zanurzyć w algebrę podzbiorów pewnego zbioru. To samo,nieco inaczej: dla dowolnej algebry Boole’a B istnieje różnowartościowy homomorfizm boolowskimB : B → 0, 1I .„Kategoryfikując” wynik Stone’a udowodnimy, że:

model języka sygnatury Σ w toposie B-obiektów jest modelem danej teorii pierwszego rzędu T(napisanej w tym języku) dokładnie wtedy, gdy wszystkie mutacje tego modelu wyznaczone przezhomomorfizmy h : B → 2 są modelami tej teorii w Set 57.

Tego nie da się powtórzyć dla wszelkich toposów H-obiektów. Dyskutując o modelach Kripkegozdaniowej logiki intuicjonistycznej zauważyliśmy, że - odróżnieniu od klasycznej logiki - nie możnawskazać pojedynczego skończonego modelu zamierzonego. Teraz powiemy to samo inaczej a nawetnieco więcej: nie istnieje skończony zbiór skończonych algebr Heytinga (H〉 : i ∈ I) taki, że każdąinną algebrę Heytinga można zanurzyć w produkt rodziny tych algebr58

Może tak być, że rozważając topos H-obiektów dla nieskończonej algebry Heytinga zmusze-ni będziemy pogodzić się z tym, że jego nieskończonej logiki nie można sprowadzić - tak jak wprzypadku boolowskim - do logik skończonych.55m∗(e|p) = m∗(e)|m(p) dla każdego elementu e : 1q → A i p ∈ H. Podobnie rozumiemy „zachowywanie sklejeń”.56To nie oznacza, że każdy funktor logiczny jest geometryczny:„logical functors between toposes is in contrast to

geometric morphisms between toposes: the former preserve the structure of an elementary topos, the latter those ofa sheaf topos” (nLab).57Oczywiście każdy homomorfizm boolowski jest f -morfizmem. Wróć na chwilę na str. 231 - teraz tamte zaskakujące

obserwacje staną się bardziej zrozumiałe.58Algebraik powie: dwuelementowa algebra Boole’a jest jedyną podprosto nierozkładalną algebrą Boole’a. Na-

tomiast wśród skończonych algebr Heytinga istnieje nieskończenie wiele algebr podprosto nierozkładalnych (każdaalgebra Heytinga „z ogonkiem” - taka, że zbiór elementów różnych od > ma element największy - jest podprostonierozkładalna).

Page 240: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 239

Czy to oznacza, że powinniśmy „zapomnieć” o takich toposach, o takich logikach?Niekoniecznie. G.Birkhoff i J. von Neumann definiując logikę kwantową nie wahali się przyjąć, iż zbiórjej wartości logicznych jest w wyznaczony przez (nieskończony) model Kripkego - poset podprzestrzeniliniowych (zespolonej) przestrzeni stanów kwantowych59.

13.4.1 Czy przestrzeń topologiczna powinna być trzeźwa?Sobriety of X is precisely a condition that forces the lattice ofopen subsets of X to determine X up to homeomorphism, whichis relevant to pointless topology (wikipedia)60

.

Termin „locale” pojawił się wcześniej w dyskusji o kontinuum i topologii bezpunktowej (str. 42).Różnicę między klasyczną a bezpunktową topologią opisałem wtedy jako „odwrócenie kierunkumyślenia” o relacji między elementami przestrzeni a rodzinami ich otwartych otoczeń. Wrócimyteraz do tej dyskusji nadając jej bardziej matematyczny charakter.

W dowolnej przestrzeni topologicznej (X, T ) rodzina Tx otwartych otoczeń dowolnego elementux ∈ X to zupełny filtr pierwszy w algebrze Heytinga zbiorów otwartych T :

∅ /∈ Tx, A ∈ Tx ∧ A ⊂ B → B ∈ Tx, A,B ∈ Tx → A ∩ B ∈ Tx oraz⋃Ai ∈ Tx tylko wtedy, gdy

pewien zbiór Ai0 ∈ Tx.Analogicznie zdefiniujemy zupełny filtr pierwszy w zupełnej algebry Heytinga H: jest to podzbiórF ⊂ H taki, że:⊥ /∈ H, a ∈ F, (a ¬ b) → b ∈ F, a, b ∈ F → a ∧ b ∈ F oraz sup(ai) ∈ F tylko wtedy, gdy

pewien element ai0 ∈ F .„Odwrócenie kierunku myślenia” polega na nazwaniu zupełnych filtrów pierwszych elementami

algebry H. Na zbiorze El(H) takich elementów można zdefiniować topologię w pełni wyznaczonąprzez algebrę H: zbiory otwarte tej topologii to rodzina Top(H) = (Up : p ∈ H) gdzie Up = F ∈El(H) : p ∈ F61. Możemy teraz przeprowadzić dwie konstrukcje:

- kierunek „klasyczny”: od przestrzeni topologicznej (X, T ) do przestrzeni (El(T ), T op(T )),- kierunek „odwrotny”: od zupełnej algebry Heytinga H do algebry Top(H).

i zapytać, czy (X, T ) = (El(T ), T op(T ) oraz czy H = Top(H) ?62

Odpowiedź jest negtywna:równość (X, T ) = (El(T ), T op(T )) charakteryzuje tzw. sober spaces63

równość H = Top(H) wyróżnia tzw. przestrzenne (spatial) zupełne algebry Heytinga.

Ta obserwacja to rezultat kategoryjnego twierdzenia:„kategoria Sober „trzeźwych” przestrzeni i funkcji ciągłych oraz kategoria SFrames przestrzen-

nych zupełnych algebr Heytinga i f-morfizmów są dualnie izomorficzne. - Sober ∼= SFramesop -„po odwróceniu morfizmów w kategorii SFrames otrzymamy kategorię „taką samą” jak kategoriaSober”.

Topologia bezpunktowa jest tożsama z topologią klasyczną jeśli po obu stronach zgodzimy się na pewne

59The Logic of Quantum Mechanics, G.Birkhoff; J.von Neumann The Annals of Mathematics, 2nd Ser., Vol. 37,No. 4. (1936). Może kiedyś uda się napisac tu „coś” o toposach odwołujących się do logiki kwantowej... .60Nie odmówię sobie przyjemności przytoczenia googlowskiego tłumaczenia: „Trzeźwość X jest dokładnie warun-

kiem, który zmusza sieć otwartych podzbiorów X do określenia X aż do homeomorfizmu, który jest istotny dlabezsensownej topologii”. To pozwala zrozumieć, skąd się biorą mądrości wygłaszane publicznie przez ważne osoby... .61Implikacja (p 6= q)→ (Up = Uq) wyróżnia tzw. przestrznne algeby Heytinga.62W istocie nie chodzi o równości ale o homeomorfizm przestrzeni w pierwszym przypadku i izomorfizm w drugim.63Trzeźwe przestrzenie??? Nie znam polskiego odpowiednika tego terminu. Znawcom geometrii algebaicznej pod-

powiem, że dla dowolnego pierścienia przemiennego z jedynką jego spektrum (zbiór ideałów pierwszych wyposażonyw topologię Zariskiego) jest „sober” przestrzenią.

Page 241: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 240

ustępstwa: po stronie klasycznej ograniczymy się do sober przestrzeni, a po stronie bezpunktowej - doprzestrzennych algebr Heytinga64. Niemniej jednak każdą przestrzeń można „otrzeźwić” za pomocą opi-sanej klasycznej konstrukcji a każdą zupełną algebrę Heytinga „uprzestrzennić” za pomocą konstrukcjiodwrotnej.

Wszystko pięknie, ale dlaczego zupełne filtry pierwsze algebry Heytinga nazwano elementami?Wyjaśnienie już za chwilę.

Próba podsumowania (zrozumienia)

„Teoria toposów to słoń” - P.Johnstone (str. 213). Grothendieckowi ten słoń przypomina przestrzeńtopologiczną - („a topos is a generalized space”)65. lub, nieco dokładniej, „a topos is (the extensionalessence of) a first-order (infinitary) geometric theory”.

Opisując toposy H-obiektów generowane przez zupełne algebry Heytinga jesteśmy bliżej takiego sło-nia, jakim go widzi Lawvere. Ten punkt widzenia trafnie opisuje przywołane już wcześniej stwierdzenieGoldblatta: „A topos is a category that looks and behaves like Set”.„Grothendieck/sheaf toposes is the notion relevant for applications in geometry and geometric logic,whereas the notion of elementary toposes is relevant for more general applications in logic66

Przyprawiająca o zawrót głowy mnogość przywoływanych tu kategorii, dualności, równoważno-ści itp. to rezultat starań by „połączyć w jedno” te dwa odległe - przynajmniej w punkcie wyjścia- spojrzenia na słonia - teorię toposów.Jeśli przyjmiemy punkt widzenia Grothendiecka to zaczynem działań jest kategoria przestrzenitopologicznych i odwzorowań ciągłych Top. Kategoryfikacja tych przestrzeni i funkcji ciągłych iprowadzi do zdefiniowania toposów snopów nad daną przestrzenią topologiczną (X, T ) oraz morfi-zmów geometrycznych między nimi.Przyjmując punkt widzenia Lawvere’a rozpoczniemy od algebr Heytinga by w efekcie kategoryfikacjitych obiektów otrzymać toposy H-obiektów wraz z funktorami-mutacjami i funktorami logicznymi.Kategoria Frames łączy te dwa spojrzenia na słonia - pozwala ujawnić zarówno podobieństwajak i odmienności. W rezultacie osiągamy pewien kompromis: ograniczenie do sober przestrzenipo stronie topologicznej i przestrzennych algebr Heytinga po stronie logicznej sprawia, że te dwaświaty stają się „dualnie równoważne”.To jeszcze nie koniec. Włączenie do dyskusji zdaniowych teorii geometrycznych usprawiedliwiawyróżnienie kolejnej kategorii: Locales to kategoria dualna do kategorii Frames. To już trzeciakategoria z tymi samymi obiektami. Skąd pomysł by odwrócić kierunek morfizmów między nimi?Otóż dowolny f -morfizm h : H(T0) → H(T1) może być interpretowany (postrzegany, traktowany)jako odwzorowanie przekształcające modele teorii T1 w algebrze H w modele teorii T0 w tej samejalgebrze67 To uzasadnia rozpatrywanie kategorii Framesop .Dotyczy to w szczególnosci modeli w dwuelementowej algebrze Heytinga (⊥ < >) która jest obiek-tem początkowym w kategorii Frames czyli obiektem końcowym w kategorii dualnej Locales.Myśląc kategoryjnie, potraktujemy każdy f -morfizm e : H → (⊥ < >) jako ... element H - o iletylko postrzegamy H jako obiekt kategorii Locales.Każdy taki morfizm jest jednoznacznie wyznaczony przez zbiór e−1(>) ⊂ H który jest ... zupełnymfiltrem pierwszym68. Co więcej, wówczas każdy f - morfizm h : H1 → H traktowany jako morfizmw kategorii Locales przekształca „punkty” w H w punkty w H1.

64Dla obytych z topologią: każda przestrzeń Hausdorffa jest „sober” a każda „trzeźwa” przestrzeń jest T0 przestrze-nią. Czy każda przestrzeń polska jest trzeźwa?65Nieco dokładniej: „topos is (the exteensional essence of) a first-order (infinitary) geometric theory”.66(https://ncatlab.org/nlab/show/topos).67Ponieważ modele T1 w H utożsamiamy modele T1 w H z f -morfizmami α : H(T1)→ H to tym przekształceniem

jest „składanie z h” - α α · f : H(T0)→ H.68Dlatego wcześniej takie filtry nazwaliśmy elementami H. Dla dociekliwych: jak wygląda mutacja wyznaczona

przez „punkt” e : H → (⊥ < >)?

Page 242: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 13. OD LOGIKI DO TOPOSÓW 241

To chyba najlepsze (na jakie mnie stać) rozszyfrowanie stwierdzenia użytego w pracy S.Vickersa„Locales and toposes as spaces” : „(...) a locale is a “propositional geometric theory pretending tobe a space”. Tylko „udaje” bo przecież twór zbudowany w ten sposob jest przestrzenią topologicznątylko wtedy gdy wyjściowa zupelna algebra Heytinga jest przestrzenna.

Zasada dualności - stworzenie nowej kategorii przez proste odwórcenie kierunku morfizmów - postrzeganajest często jako czysto formalny zabieg. Analizowany tu przypadek pokazuje, że tak nie jest: tę sytuacjęmożna potraktować jako przyczynek do dyskusji o „dualności między przestrzenią i wielkością” („dualityof space and quantity”). Niestety, nie czuję się upoważniony do dyskusji na ten temat... 69.

Przestrzeń R ze zwykłą topologią jest trzeźwa.Locale dla tej przestrzeni próbowaliśmy - w uproszczony sposób - opisać wcześniej. Teraz opi-

szemy elementy tej algebry Heytinga bez odwołań do zbiorów otwartych w R. Taki element to zbiórpar liczb wymiernych U spełniający trzy warunki: dla dowolnych liczb wymiernych a, b, c, d:

- jeśli a ¬ b to (b, a) ∈ U ,- jeśli (b, c) ∈ U, b ¬ a, d ¬ c to (a, d) ∈ U ,- jeśli (b, c) ∈ U dla wszelkich b > a i c < d, to (a, b) ∈ U .- jeśli (a, b), (c, d) ∈ U oraz c < b to (a, d) ∈ U

U ¬ V gdy U ⊆ V oraz U ∧V = U ∩V . Ale kres górny takich zbiorów-elementów locale to nie jestsuma mnogościowa:

(a, b) ∈ sup(Uk) gdy istnieje skończony ciąg a = a1, b1, a2, bs, . . . an, bn = b taki, że (ai, bi) ∈⋃Uk oraz bi > ai−1 dla wszelkich i ¬ n.

To locale ma też swoją teorię geometryczną. Zmienne tej teorii odpowiadają parom liczb wy-miernych - Zm = psr : s, r ∈ Q . Jej aksjomaty to:

psr ∧ ps1r1 a`∨pmn : max(s, s1) < m < n < min(r, r1)

> `∨ps−e,s+e : s ∈ Q dla dowolnego e > 0, e ∈ Q.

Zapewniam: zauważalne podobieństwo opisu locale i jego geometrycznej teorii nie jest przypadkowe.Pominę szczegóły odsyłając zainteresowanych do [135]. Jednak i bez tych szczegółów można się zgo-dzić, że modele tej teorii w dwuelementowej algebrze (⊥ < >) odpowiadają jednoznacznie nie tylkozupełnym ideałom pierwszym w opisanym locale ale też dedekindowskim liczbom rzeczywistym .

Geometria przestrzeni decyduje o tym, czym są jej punkty70.

Na koniec: mam nadzieję, że teraz potrafimy mądrzej niż google przetłumaczyć cytat z wikipediiotwierający ten mały podrozdział... . Spróbuj.

69Zainteresowanych odsyłam na stronę nLab:space and quantity.70Herezja: punkty to tylko „osobliwości” przestrzeni.

Page 243: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Rozdział 14

Od realizowalności do toposu Hylanda

14.1 Realizowalność Kleene’ego

Kleene’s realizability was, at least conceptually, a major ad-vance [86].

Nie zawsze droga od logiki o toposów jest tak prosta... .Realizowalność Kleene’ego to odmienne spojrzenie na semantykę języka arytmetyki zrywające z„tradycją Tarskiego”1. Nie ma tu mowy o spełnianiu formuły i prawdziwości zdań. Co jest wzamian? Uzasadnienie.Odmienność propozycji Kleene’ego uświadamiamy sobie boleśnie, gdy ufni w swą matematycznąwiedzę zajrzymy nieopatrznie do dedykowanej specjalistom pracy traktującej o tej idei. Szybko sięzniechęcimy: podstawową frazą, którą operuje się w tych pracach to stwierdzenie: „liczba naturalnan realizuje formułę arytmetyczną ψ(x1, . . . , xk)”.... Ki czort?

Realizowalność to implementacja BHK-postulatów odwołująca się do teorii obliczalności.„Uzasadnienie (arytmetycznego) zdania musi być zrealizowane proceduralnie”.

Te też niewiele wyjaśnia. Bardziej pomoże nam odwołanie się do sytuacji, która - jak się zdaje -była zaczynem myślenia o realizowalności. Prawdziwość zdania arytmetycznego postaci ∀x∃yψ(x, y)w modelu standardowym pozwala każdemu teoriomnogościowcowi powiedzieć, że „istnieje funkcjaf : N→ N taka, że dla dowolnej liczby naturalnej m zdanie ψ(x, y)[x := m, y := f(m)] jest praw-dziwe”2. Ale myślący konstruktywnie matematycy postulowali od zawsze, by konstrukcję takiejfunkcji uznać za jedyny akceptowalny dowód zdania ∀x∃yψ(x, y). Wystarczy enigmatyczną „kon-strukcję” zastąpić maszyną Turinga i wykorzystać istnienie numeracji tych maszyn by zrozumiećstwierdzenie „liczba n realizuje zdanie ∀x∃yψ(x, y)”: ono mówi, że:

„maszyna Turinga T o numerze n zatrzymuje się zawsze gdy rozpoczyna pracę z zapisanymna taśmie kodem dowolnej liczby naturalnej m i zwraca liczbę fT (m) (jej kod) taką, że zdanieψ(m, fT (m))) jest prawdziwe”.

Z oczywistych powodów w swojej definicji realizowalności Kleene zamiast do maszyn Turingaodwołuje się do zdefiniowanych przez siebie funkcji obliczalnych.

Definicja realizowalności jest rekurencyjna. Wykorzystujemy w niej ustaloną dowolnie efektywnąnumerację funkcji obliczalnych. Jak zwykle przez φn : N→ N oznaczamy n-tą funkcję obliczalną (wprzyjętej numeracji). W opisie reguł rekurencyjnych korzystamy też z kodowania par - obliczalnejbijekcji ( , ) : N×N→ N 3.

Liczba n realizuje zdanie ψ - n `real ψ - jeżeli4:1Pojęcie realizowalności zostało zdefiniowane przez Kleene’ego w pracy „On the interpretation of intuitionistic

number theory” Journal of Symb. Log, vol. 10, no. 4, 19452Wystarczy skorzystać z pewnika wyboru.3Możemy np. przyjąć numerację Cantora: (n.m) = 1

2 (m+ n)(m+ n− 1) + n.4Realize to „realizować” lecz także „urzeczywistniać”. W niektórych pracach zamiast zwrotu „n realizes ψ” pisze

242

Page 244: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 243

- ψ ≡ (t = t1) jest prawdziwym zdaniem atomowym - prawdziwą równością termów domkniętych- i n = 0. Żadna liczba nie realizuje tej równości, gdy jest ona fałszywa.

- ψ ≡ α ∧ β i n = (n1, n2), gdzie n1 realizuje α a n2 realizuje β,- ψ ≡ α ∨ β i n = (0, n1), gdzie n1 realizuje α albo n = (1, n2), gdzie n2 realizuje β,- ψ ≡ α→ β i dla dowolnego m realizującego α, φn(m) realizuje β,5

- ψ ≡ ¬α i n realizuje α→ (0 = 1)- ψ ≡ ∃x α(x) i n = (n1, n2), gdzie n1 realizuje zdanie α(x)[x := n2],- ψ ≡ ∀x α(x) i φn(m) realizuje zdanie α(x)[x := m] dla dowolnej liczby m.[134]

Reguły dotyczące obu kwantyfikatorów (i implikacji) są zgodne z intuicją ukształtowaną przezanalizę realizowalności zdania ∀x∃yψ(x, y). Warto jednak zwrócić uwagę na pewną subtelność re-alizacji implikacji α → β . Jeśli znamy jakąkolwiek liczbę n0 realizującą β to wskazanie liczbyrealizującej tę implikację jest banalne - to numer funkcji stałej f(m) = n0. To oczywiste. Ale istotąrealizacji implikacji jest wskazanie funkcji obliczalnej (procedury) , która gwarantuje przekształce-nie dowolnej hipotetycznej realizacji α w realizację β w sytuacji, gdy nie znamy żadnej realizacjiβ. A to już nie jest banalne.Reguły dotyczące alternatywy i koniunkcji są zgodne z BHK-postulatami. Np. realizacja alterna-tywy jest zawsze „dwuczłonowa”: musimy wskazać jeden z dwóch jej składników a potem liczbęrealizującą ten składnik.Definicja realizacji zdań atomowych - prawdziwych równości termów domkniętych - jest dość enig-matyczna. Stwierdzenie, że liczba 0 realizuje taką równość jest zgodna z definicją w [134]. W [49]prawdziwa równość t = t1 jest realizowana przez liczbę - wspólną wartość termów t i t1. A w[112] napisano wręcz tak: „For basic assertions it is intentionally left unspecified what are theirwitnesses”. To wygląda dziwnie, ale ... jest zgodne z paradygmatem logiki założeniowej6.

Równość (0 = 1) to arytmetyczna reprezentacja zdania fałszywego. To zdanie nie jest realizo-walne przez żadną liczbę. Skoro tak, to zdanie postaci ¬φ albo nie ma żadnego uzasadnienia (gdy φma uzasadnienie), albo jego uzasadnieniem jest każda liczba naturalna. Zbiór realizacji zdań-negacjinie ma „treści obliczeniowej”7 .

Powiemy, że:zdanie jest uzasadnione (realizowalne) jeżeli istnieje realizująca je liczba naturalna.8

orazformuła α(x1, . . . , xn) jest realizowalna gdy uzasadnione jest zdanie ∀x1,...,xn α(x1, . . . , xn).

Formuła α(x1, . . . , xn) jest uzasadniona gdy istnieje pojedyncza procedura φ która dla każdego naboruliczb naturalnych (m1, . . . ,mn) oblicza liczbę φ(m1, . . . ,mn) realizującą zdanie α(x)[x1 := m1, . . . , xn :=mn]. Nie można wykluczyć istnienia formuły β(x) która nie ma uzasadnienia a każde ze zdań β(x)[x := m]jest uzasadnione.Stwierdzenie, że formuła to wspólny schemat rodziny zdań - instancji tej formuły ma tu głębszy sens niżw logice klasycznej.

Jaki jest związek między realizowalnością a prawdziwością zdania arytmetycznego? Zapytajmybardziej konkretnie:I. „Wersja logiczno-klasyczna”: Czy każde zdanie arytmetyczne, które jest instancją prawa klasycz-nej logiki pierwszego rzędu, jest realizowalne?

Odpowiedź jest negatywna: przyjmijmy, że A to zbiór par liczb (m,n) takich, że „m-ta maszyna

się „n is an evidence of ψ” czy nawet „n is a witness of ψ” . Nie mam pojęcia jaką terminologię uznano za obowiązującąw języku polskim.5Dokładniej: „φn(m) jest określone i realizuje β”.6Podobnie rzecz się ma w przypadku BHK-postulatów - w ich opisie często pojawia się stwierdzenie „We assume

that we know what constitutes a construction of an atomic statement”.7„Realizability interpretation is not interesting for doubly negated formulas (because such formulas have no

„computational content”) [89]. Czy błądzę, mówiąc o braku „treści obliczeniowej” semantyk wszelkich zdań-negacji?8To nie oznacza, że potrafimy ją wskazać tzn. skonstruować realizację zdania A na podstawie struktury syntatycznej

i zgodnie z regułami opisanymi powyżej! Tak jest w przypadku alternatywy A ∨ ¬A gdy A jest zdaniem.

Page 245: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 244

Turinga pracując na własnym kodzie zatrzyma się po n krokach”. Ten zbiór jest rozstrzygalny ajego funkcja charakterystyczna - λA - jest prymitywnie rekurencyjna. To oznacza, że zbiór A jestopisany przez arytmetyczną formułę atomową - równość λA(x, y) = 1. Wówczas formułahalt(x) ≡ ∃y (λA(x, y) = 1) opisuje problem stopu9.

Alternatywa ∀x(halt(x)∨¬halt(x)) jest zdaniem prawdziwym - instancją prawa klasycznej logikipierwszego rzędu. Ale nie ma realizacji, bo to oznaczało by rozstrzygalność problemu stopu!10

II. Pytanie: „czy formuły dowodliwe w PA są zawsze uzasadnione” jest - w świetle powyższegowyniku - bezzasadne. Ale możemy zapytać: „czy każda formuła arytmetyczna dowodliwa w HAma uzasadnienie?”. Odpowiedź jest pozytywna. Więcej: dowód w HA pozwala nie tylko udowodnićistnienie uzasadnienia lecz „(..) the proof of φ gives us a recipe for construction of a realizer”[89].

W szczególności realizowalne są aksjomaty Peano. Np. realizowalnosć aksjomatu indukcji - α(0) ∧(∀n (α(n)→ α(n+ 1)))→ ∀n α(n) - dowodzimy tak: jeśli liczba k realizuje zdanie α(0) a liczba mrealizuje zdanie ∀n (α(n) → α(n + 1)) , to aksjomat indukcji jest realizowany przez liczbę s(k,m)która jest numerem funkcji rekurencyjnej definiowanej tak:

φs(0) = k,φs(k,m)(n+ 1) = φm(φs(k,m)(n))

Wówczas liczbą, realizującą ten aksjomat jest numer funkcji rekurencyjnej, która każdej parze< k,m > przyporządkowuje liczbę s(k,m).11

Skoro zdanie ∀x(halt(x) ∨ ¬halt(x) nie jest realizowalne to nie jest dowodliwe w HA. A to oznacza, żedodanie do HA zaprzeczenia ¬(∀x(halt(x) ∨ ¬halt(x)) nie prowadzi do sprzeczności... 12.

Jednak nie każde uzasadnione zdanie jest dowodliwe w arytmetyce intuicjonistycznej13. Takimzdaniem jest prawo Markova14.

Prawo Markova

Paradygmaty konstruktywizmu Markova:- The objects of mathematics are algorithms. Algorithms are meant in a mathematically precise sense inthe sense that they should be presented as „words” in some finite alphabet of symbols.- Limitations due to finite memory capacity are disregarded, the length of symbol strings is unbounded(though always finite). - Logically compound statements not involving ∃,∨ are understood in a directway, but existential statements and disjunctions always have to be made explicit.If it is impossible that an algorithmic computation does not terminate, we may assumethat it does terminate 15.

Ostatni paradygmat to prawo Markova: „jeśli jest niemożliwe, by praca algorytmu była nieskoń-czona, to jest skończona”. Dla wychowanych w kręgu klasycznej logiki ten postulat jest „oczywistąoczywistością” - wystarczy skorzystać z prawa podwójnej negacji: „nieprawda, że nieprawda, żepraca algorytmu jest skończona praca algorytmu jest skończona”. Tego nie uznają konstrukty-wiści. Ale Markov tak: „Suppose that someone tells us that it is impossible that the machine never9Maszyna Turinga o numerze n się zatrzyma gdy zdanie halt(n) jest prawdziwe.10Uzasadnieniem tego zdania - gdyby istniało - była by funkcja obliczalna φ taka, że dla dowolnej liczby n, φ(n) =

(0, k0), gdzie k0 jest uzsadnieniem zdania ∃y (λA(n, y) = 1) (czyli pokazuje, że maszyna o numerze n się zatrzymuje)lub φ(n) = (1, k1) gdzie k1 uzasadnia zdanie ¬(∃y (λA(n, y) = 1)) - „maszyna o numerze n się nie zatrzymuje”.11To samo nieco inaczej: uzasadnieniem aksjomatu indukcji jest procedura-schemat rekursji.12Nieco ogólniejsza uwaga: jeśli formuła ∀xα(x) ∨ ¬α(x) jest realizowalna, to własność opisana przez formułę α(x)

jest rozstrzygalna.13Implikacja odwrotna - „istnienie uzasadnienia” „dowodliwość w HA” - jest prawdziwa tylko dla prawie nega-

tywnych (almost negative) formuł - takich, które są zbudowane z formuł atomowych i formuł postaci ∃x t = s jedynieza pomocą → , ∧ oraz kwantyfikatora ∀ [114].14A.A. Markov (1903-1979) - twórca tzw. rosyjskiego konstruktywizmu matematycznego. Ojciec A. Markova (o tym

samym imieniu) (1856-1922) to równie znakomity matamatyk rosyjski, znany z dokonań w zakresie teorii prawdopo-dobieństwa (procesy Markova).15A.E.Troelstra, D. van Dalhen, Constructivism in Mathematics, vol 1, Elsevier, 1988)

Page 246: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 245

halts, do we know that it indeed halts? Markov argued ‘yes’. The decision procedure for the haltingin this case consists of turning on the machine and waiting for it to halt. An intuitionist would notbuy the argument. When somebody claims that a Turing machine will stop, the natural questionis ‘when?’ We want an actual bound on the computation time. [35]

Prawo Markova formalnie zapiszemy tak:

(∗) (∀x (r(x) ∨ ¬r(x)) ∧ ¬¬∃x r(x))→ ∃x r(x)

gdzie r(x) to formuła arytmetyczna opisująca własność „rozważany algorytm (maszyna Turinga)pracując na własnym kodzie zatrzyma się po x krokach”

Schemat logiczny tego zdania to formuła

(∗∗) (∀x (a(x) ∨ ¬a(x)) ∧ ¬¬∃x a(x))→ ∃x a(x)

która oczywiście jest prawem klasycznej logiki.Ta formuła nie ma dowodu w arytmetyce intuicjonistycznej. Ale każda formuła arytmetyczna-instancja schematu (∗∗) jest realizowalna! [35]16

Dowód (nieformalny, dla przypadku, gdy ta implikacja jest zdaniem): opiszemy procedurę prze-kształcającą dowolną realizację poprzednika tej implikacji w realizację jej następnika17. (Hipote-tyczną) realizacją poprzednika jest para procedur:

- procedura φ, która dla dowolnej liczby n wskazuje to spośród pary zdań (a(n),¬a(n)) którejest realizowalne,

- stwierdzenie, że istnieje realizacja zdania ¬¬∃x a(x) (co oznacza, że istnieje realizacja zdania∃x a(x) ale nie oznacza, że znam liczbę, która je realizuje!)

Możemy teraz łatwo opisać procedurę uzasadniającą ∃x a(x) - wystarczy kolejno uruchamiać proce-durę φ dla 0, 1, . . . tak długo, aż znajdziemy liczbę, dla której zdanie a(n) jest uzasadnione. Drugiez powyższych założeń gwarantuje, że poszukiwanie tej liczby musi zakończyć się sukcesem... .

Skoro tak, to może należy zrewidować poglądy i dodać prawo Markova do aksjomatów arytmetyki intu-icjonistycznej? Jednak trudno ten schemat uznać za aksjomat specyficzny, gdyż w jego sformułowaniu nieodwołujemy się do żadnych pojęć arytmetycznych. To by oznaczało, że jest to nowy aksjomat logiczny„poprawionej” logiki intuicjonistycznej pierwszego rzędu.Ale czy ten jeden - ważny, ale tylko jeden - model upoważnia do takiej zmiany?

Przeciwko tej zmianie przemawia też to, że wprawdzie prawo Markova - Markov principle - niejest dowodliwe w HA, ale niewiele (na pozór) różniąca się od niego reguła Markova:

„dla dowolnej formuły a(x): jeżeli HA ` ∀x(a(x) ∨ ¬a(x)) ∧ ¬¬∃x a(x) to HA ` ∃x a(x)”

- jest zgodna z tą teorią [35],[111].

Warto choć przez chwilę zadumać się nad różnicą między prawem a regułą Markova... .

Spróbujmy podsumować. Stwierdzenie, że każde zdanie dowodliwe w HA jest realizowalne moż-na sformułować (rozumieć) nieco inaczej: realizowalność Kleene’ego jest interpretacją, jest mode-lem arytmetyki intuicjonistycznej. Modelem „nieteoriomnogościowym”. W tym modelu semantykązdań są podzbiory liczb naturalnych:

ψ Aψ = n ∈ N : n realizuje ψSemantykę koniunkcji, alternatywy i implikacji opisać możemy jako pewne operacje na zbiorze

P(N) wszystkich podzbiorów liczb naturalnych wykorzystując pewną, dowolnie ustaloną numeracjęfunkcji obliczalnych: dla dowolnych podzbiorów C,D ⊆ N:

C ∧D = (n,m) : n ∈ C,m ∈ DC ∨D = (0,m) : n ∈ C ∪ (1,m) : m ∈ D

16Należy to rozumieć tak: formuły-instancje schematu (∗∗) otrzymamy zastępując a(x) konkretną formułą arytme-tyczną (tak samo, jak np. w przypadku indukcji matematycznej). „Niedowodliwość” tego schematu oznacza, że niekażda taka formuła-instancja jest dowodliwa w HA.17Uniknijmy pułapki: chodzi o wskazanie procedury przekształcajacej realizacje poprzednika w realizację następnika

a nie o dowód, że jeśli poprzednik implikacji jest realizowalny to i następnik jest realizowalny (co jest banalne).

Page 247: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 246

C → D = n : φn(C) ⊆ DSemantykę kwantyfikatora uniwersalnego opisujemy korzystając z nieskończonych przekrojów. Asemantyka kwantyfikatora egzystencjalnego jest, upraszczając, „nieskończoną sumą rozłączną”.

Realizowalność zdania to „dychotomiczna redukcja” tak zdefiniowanej semantyki: zdanie ψ jestrealizowalne („prawdziwe w modelu Kleene’ego” ) gdy jego semantyka - zbiór Aψ jest niepusty.Jest fałszywe w tym modelu, gdy ten zbiór jest pusty.

14.2 Kategoria zbiorów efektywnych

The pleasing feature of the effective topos is that in it, ideas abouteffectivity in mathematics seem to have their natural home.

J.M.E.Hyland [49]

Topos Hylanda18 to rozwinięcie idei realizowalności Kleene’ego. Tak zazwyczaj się pisze nietłumacząc, „co autor miał na myśli”. Spróbujemy to wyjaśnić, wykraczając poza prostą prezentacjędefinicji (czyli przepisanie ich z oryginalnych prac).

Naszą opowieść rozpoczniemy tak:

„Rzeczy” (wielkości, fakty, jedności) to obiekty uniwersum. Stają się dostępne, gdy są opisane, nazwane,czyli „zakodowane jako słowo”. Te opisy to realizacje rzeczy19.

Nie trzeba jednak zakładać, że pojedynczy opis rzeczy jednoznacznie ją identyfikuje - rzeczmoże być opisana, zrealizowana na wiele sposobów20.O uniwersum rzeczy myślimy jako o kategorii: interesują nas nie tylko rzeczy, ale i związki międzynimi - morfizmy. Chcemy je realizować wykorzystując słowne opisy-rzeczy: morfizm ma być reali-zowany jako przekształcenie opisów jednej rzeczy w opisy drugiej.Jeśli dodatkowo zażądamy, by nasz model był „konstruktywny”, to w tym celu powinniśmy wyko-rzystać... maszyny Turinga (które przecież przekształcają słowa w słowa). A skoro maszyny Turingateż umiemy opisywać21 to i one mogą być postrzegane jako opisy „rzeczy” - funkcji obliczalnych.

Rzeczy grupujemy - arbitralnie(?) - w kolekcje - typy. Wyróżnikiem (spoiwem) typu jest funkcja,która każdej rzeczy z rozważanej kolekcji przypisuje jej opisy.22.

Formalizacją idei „badania rzeczy i związków między nimi za pośrednictwem ich opisów” jestkategoria efektywnie reprezentowanych zbiorów - ESet. W opisie tej kategorii zamiast słów-opisówmamy liczby naturalne, zamiast maszyn Turinga - funkcje obliczalne. Turinga zastępuje Kleene.

Notacja: symbolem P(N) oznaczamy tu zbiór wszystkich podzbiorów liczb naturalnych a P(N)A -zbiór funkcji ze zbioru A do P(N).

Obiekty kategorii ESet („typy”) to pary (A,EA) , gdzie EA : A→ P(N) to funkcja taka, że

EA(a) ∩ EA(b) = ∅jeśli tylko a 6= b23. W zbiorze A wyróżniamy podzbiór AE złożony z punktów opisanych - takich,

18J. Hyland, angielski matematyk, zdefiniował ten w 1982 roku. Oczywiście nie nazywał go „toposem Hylanda”.Używał nazwy „effective topos”. Słowo „effective” można tłumaczyć bądź jako „rzeczywisty” lub „skuteczny”. Nastronie Dictionary.com znajdujemy takie objaśnienie znaczenia tego przymiotnika: adequate to accomplish a purpose;producing the intended or expected result lub actually in operation or in force; functioning Przyznam, że nie znampowszechnie akceptowanego polskiego odpowiednika tej nazwy. Dlatego pozwoliłem sobie na unik i użycie określeniatopos Hylanda. Nasz opis tego toposu opiera się głównie na [49], [89] i [134].19Z tą ideą zetknęliśmy się już mówiąc o λ-rachunku. Pokazaliśmy, jak korzystając z λ-termów opisać (kodować)

„typ boolowski” - czyli wielkości boolowskie true, false wraz z operacjami logicznymi. Pokazaliśmy jak kodowaćliczby naturalne i funkcje obliczalne.20Jeśli np. „rzeczą” jest funkcja obliczalna, to może ona być realizowana przez różne maszyny Turinga.21Opisem maszyny Turinga jest lista jej instrukcji.22Unikamy terminu „zbiór” by nie wpaść w pułapkę „myślenia teoriomnogościowego”. Jeśli kogoś - znawcę teorii

typów - razi użycie w tym kontekście terminu „typ” to bardzo przepraszam.23A to zbiór „rzeczy” a EA(a) to zbiór opisów rzeczy a. Różne rzeczy nie mają wspólnych opisów.

Page 248: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 247

że EA(a) 6= ∅.Morfizm z (A,EA) do (B,EB) to funkcja f : AE → BE dla której można wskazać (częściową)

funkcję obliczalną φ : N→ N taka, że φ(EA(a)) ⊆ EB(f(a)) dla dowolnego a ∈ AEMówimy wtedy, że morfizm f jest instancją φ i że φ realizuje f .

Darujmy sobie rutynową analizę struktury tej kategorii i skupmy się tym, co ją wyróżnia24.

Polimorfizmy

Morfizm f : (A,EA)→ (B,EB) może być realizowany przez wiele funkcji obliczalnych. To jasne25.

Jest też odwrotnie: wprawdzie funkcja obliczalna φ może realizować co najwyżej jeden mor-fizm między ustaloną parą obiektów, ale może realizować wiele morfizmów działających międzyróżnymi parami obiektów - może mieć wiele instancji. Np. funkcja identycznościowa id : N → Nrealizuje wszystkie morfizmy identycznościowe. Dlatego mówimy, że:

„każda (częściowa) funkcja obliczalna φ : N→ N jest polimorfizmem w kategorii ESet”.

Polimorfizmy pojawiły się w informatyce teoretycznej pod koniec lat sześćdziesiątych XX w. za sprawąCh. Strachey’a w odpowiedzi na to, co było obecne w praktyce programistycznej26.

W czym rzecz? „wstawienia elementu a na początek listy [a1, . . . , an] - (a, [a1, . . . , an]) [a, a1, . . . , an] -można opisać tak: „napisz znak „[”, potem przepisz „a” a następnie przepisz listę [a1, . . . , an] zastępującnawias otwierający „[” przecinkiem”.Tak opisana procedura jest zrozumiała bez względu na to, czy dopisujemy liczbę do listy liczb, słowo dolisty słów itp. itd. Skoro tak, to chciałoby się dysponować językiem programowania w którym można bynapisać program realizujący tę operację „dla wszystkich rodzajów list”, bez konieczności jego dostosowy-wania do różnych rodzajów danych27.

Kategorię ESet została wyróżniona przez teoretyków informatyki właśnie po to, by precyzyjnieopisać tak rozumiane polimorfizmy28. Więcej: w tej katogorii można to pojęcie „uwewnętrznić”definiując obiekty, których elementami są polimorfizmy. Pokażemy - na przykładzie i w sposóbuproszczony - jak taki obiekt zbudować.Niech K będzie klasą wszystkich endomorfizmów w ESet 29. Obiekt reprezentujący K-polimorfizmyto para (A,E) taka, że:

- A to produkt kartezjański wszystkich zbiorów morfizmów postaci ESet((B,EB), (B,EB)

),

- dla dowolnej rodziny morfizmów (fi : i ∈ I) ∈ AE((fi)) =

⋂EB(fi).

- n ∈ E((fi)) gdy n-ta funkcja obliczalna φn realizuje wszystkie morfizmy fi. 30

24Zainteresowanym szczegółami takiej (niebanalnej) analizy polecam [89].25Nieformalnie: morfizm f to „zadanie programistyczne” a funkcja obliczalna φ która ją realizuje to „program”.

To samo zadanie można rozwiązać na wiele sposobów... .26Christofer Strachey (1916-1975, brytyjski teoretyk informatyki) wyróżnił dwie klasy polimorfizmów: polimorfizmy

parametryczne i „polimorfizmy ad hoc. Teraz interesują nas te pierwsze. Polimmorfizmy ad hoc też są ciekawe, aleto raczej element pragmatyki języka a nie jego struktury.27Współczesne języki programowania - np. Haskell - dają taką możliwość. Możemy w nich tworzyć programy

polimorficzne które można wykorzystywać w sposób zgodny z tymi oczekiwaniami.28By to docenić, zastanów się jak wyróżnić polimorfizmy np. w kategorii zbiorów.29Endomorfizm to każdy morfizm postaci (A,EA)→ (A,EA) gdzie (A,EA) to dowolny obiekt.30Ta konstrukcja może, a nawet powinna budzić wątpliwości: tworząc zbiór A mówimy o produkcie wszystkich zbio-

rów morfizmów postaci ESet((B,E), (B,E)) Ale w ESet jest zbyt wiele obiektów by taki produkt istniał To prawda.Jednak w tej kategorii można (konstruktywnie!) wyróżnić szkieletową podkategorię PER (str. 211) z przeliczalnymzbiorem obiektów. Konstruując produkt -zbiór A - można ograniczyć się do zbioru PER ∩ K. Opis kategorii PER -„partial equivalence relations” - można znaleźć np. w [89].

Page 249: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 248

Zazwyczaj o stracheyowskich idei polimorfizmów mówi się nieco inaczej,: polimorfizmy pojawiają sięw systemach formalnych, które są rozszerzeniami λ-rachunku z typami31. Jedną z takich formalnychkonstrukcji jest tzw. System F w którym funkcjonuje konstruktor „typów polimorficznych”. Podobnie jakw przypadku pełnego λ-rachunku, w Systemie F mamy zadaną semantykę operacyjną - reguły redukcji(które możemy traktować jako reguły obliczeniowe).Kategoria ESet dostarcza tzw. semantyki denotacyjnej dla Systemu F - pozwala „nadać znaczenia”wyrażeniom tego systemu.To ważne dopełnienie: semantyka operacyjna pozwala badać i kontrolować procesy obliczeniowe. Seman-tyka denotacyjna pozwala zrozumieć, co właściwie obliczamy....

14.3 Topos Hylanda

Kategoria ESet ma wiele cech oczekiwanych przez teoretyków informatyki. Ale dla tych, którzychcą budować matematykę konstruktywną „od podstaw” ma zasadniczą wadę - nie jest toposem32.Ale tę kategorię można poszerzyć - „zanurzyć” w topos Hylanda.

Pierwszoplanową rolę w konstrukcji toposu Hylanda odgrywają relacje A zdefiniowane na zbiorachP(N)A - zbiorach funkcji działających ze zbioru A do P(N)”:

f A g gdy istnieje funkcja obliczalna ψ taka, że dla każdego a ∈ A , ψ(f(a)

)⊆ g(a) 33

f A g gdy istnieje wspólna dla wszystkich punktów a ∈ A procedura translacyjna liczb-opisów zezbiorów f(a) na liczby ze zbiorów g(a).Istotę żądania, by ta procedura była wspólna, pokazuje taki przykład:zdefiniujmy funkcje f, g : 0, 1 → P(N) tak:

f(0) = N \ C, f(1) = C ,g(0) = 0, g(1) = 1 ,

gdzie C ⊆ N to dowolnie ustalony niepusty zbiór. Łatwo wskazać parę funkcji obliczanych φ0, φ1 takich,że φ0(f(0)) ⊆ g(0), φ1(f(1)) ⊆ g(1). A wskazanie pojedynczej funkcji obliczalnej ψ takiej, że ψ(f(0)) ⊆g(0), ψ(f(1)) ⊆ g(1) jest możliwe tylko wtedy, gdy C jest zbiorem rozstrzygalnym!34.

Możemy teraz zdefiniować pewną „kategorię” bH (która jednak nie jest jeszcze toposem Hy-landa):

Obiekty bH to pary (A,≈A: A×A→ P(N)) takie, że dla dowolnych a, b, c ∈ A:

(a ≈ b) A (b ≈ a)((a ≈ b) ∧ (b ≈ c)) A (a ≈ c) 35

symbol „∧” oznacza operację binarną na zbiorze P(NA) zdefiniowaną tak: dla dowolnych funkcjif, g : A→ P(N) , (f ∧A g)(a) = f(a) ∧ g(a) dla dowolnego a ∈ A36

31Ten fragment λ-rachunku opisaliśmy omawiając izomorfizm Curry-Howarda (str.198). Więcej informacji o Sys-temie F i jego semantyce denotacyjnej można znaleźć w [6].32W toposie każdy morfizm, który jest jednocześnie mono- i epimorfizmem musi być izomorfizmem. Tymczasem wESet tak nie jest [89].33Tu i dalej zapis ψ(X) ⊆ Y oznacza, że dla dowolnej liczby n ∈ X wartość ψ(n) istnieje i ψ(n) ∈ Y .34Konwencja notacyjna: odtąd będziemy pisać f(a) A g(a) zamiast f A g. Pozwoli to uprościć formalne zapisy

i ułatwić ich odczytywanie.35The elements of (A,≈) are to be thought of as expressions denoting elements of some ”real underlying” set. Given

a pair (a, b) of elements of A, the set [a ≈A b] is the set of codes of proofs that the element denoted by a is equal tothe element denoted by b” - Colimit completions and the effective topos, E.Robinson, G. Rossolini, J. of Symb. Log.vol.55 no2. 1990.)36Korzystamy tu ze zdefiniowanej wcześniej operacji „koniunkcji” w zbiorze P(N) - C ∧D = (n,m) : n ∈ C,m ∈

D ( co oznacza, że również i w tym przypadku odwolujemy sie do pewnej, ustalonej wcześniej numeracji funkcjiobliczalnych)(str. 242).Tak samo - poprzez odwołanie do zdefiniowanych wcześniej operacji „∨” i „→” w zbiorze P(N) - definiujemy pozostałe„operacje logiczne” w zbiorach P(N)A.

Page 250: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 249

Definicja obiektów „kategorii” bH jest uderzająco podobna do defincji obiektów w toposie H.Ale ostrożnie - interpretacja tych zapisów jest odmienna!Będziemy mówić, że liczba n realizuje (opisuje, uzasadnia) „równość” a ≈ b gdy n ∈ a ≈ b. Możemyteraz „odczytać” oba warunki definiujące obiekty:

- pierwszy warunek jest spełniony, gdy istnieje funkcja obliczalna, która - dla dowolnych a, b ∈ A- przekształca dowolną realizację a ≈ b w realizację b ≈ a.

- drugi warunek jest spełniony, gdy istnieje funkcja obliczalna φ która - dla dowolnych a, b ∈ A-przekształca każdą parę realizacji a ≈ b i b ≈ c w realizację a ≈ c.Piszemy E(A,≈)(a) lub E(a) zamiast (a ≈ a). E(a) to miara istnienia punktu a.

Formalna definicja morfizmów w bH jest też podobna do definicji morfizmów w toposie H:

Morfizmy z (A,≈A) do (B,≈B) w „kategorii” bH to funkcje f : A×B → P(N) takie, że:(f(a, b) ∧ ([a ≈A a1) ∧ (b ≈B b1)

)A f(a1, b1),

f(a, b) A (E(a) ∧E(b),f(a, b) ∧ f(a, b1) A (b ≈B b1),

E(a) A⋃b∈B (E(b) ∧ f(a, b)).

Także i tę definicję należy odczytywać inaczej niż definicję morfizmu H-zbiorów. Np. drugi warunekoznacza, że istnieje funkcja obliczalna, która - dla dowolnych puntów a ∈ A, b ∈ B - przyporządko-wuje każdemu opisowi n ∈ f(a, b) parę opisów n1 ∈ E(a), n2 ∈ E(b)37 ... .

Morfizm identycznościowy (A,≈A)→ (A,≈A) to funkcja ≈A : A×A→ H.Złożenie (f : A× B → H) : (A,≈A) → (B,≈B) i (g : B × C → H) : (C,≈C) → (B,≈B) to funkcjah : A× C → H taka, że

h(a, c) =⋃

(f(a, b) ∧ g(b, c) : b ∈ B).

Definiując strukturę bH słowo „kategoria” napisałem w cudzysłowie ponieważ... nie jest tokategoria. Gdy policzymy złożenie dowolnego morfizmu f : (A,≈A)→ (B,≈B) z morfizmem iden-tycznościowym ≈A : (A,≈A)→ (A,≈A) to pokażemy jedynie, że

f · ≈AA f oraz f A f · ≈AA powinny być równości... .Podobne wyniki otrzymamy gdy obliczymy złożenie ≈B ·f i gdy ze-chcemy sprawdzić łączność tak zdefiniowanego składania morfizmów38.

Remedium na tę przypadłość jest proste: powiemy, że funkcje f, g : A→ P(N) są równoważnegdy f A g oraz g A f .

Topos Hylanda to kategoria, której obiektami sa opisane powyżej obiekty w bH, a morfizmy z (A,≈A) i(B,≈B) są jedynie reprezentowane przez funkcje f, g : A×B → P(N) - morfizmy w bH z (A,≈A) do(B,≈B) . Dwie takie funkcje reprezentują ten sam morfizm, gdy są równoważne.

Sprawdzenie, że tak zdefiniowane obiekty i morfizmy tworzą topos wymaga naprawdę sporejbiegłości. I benedyktyńskiej cierpliwości39 .

„Snopy” w toposie Hylanda

Zrozumienie, czym są morfizmy w toposie H ułatwiła konstrukcja „H-snopa elementów” El(A).Tę konstrukcję można powtórzyć w toposie Hylanda uwzględniając jednak specyficzne cechy tegotoposu:- najpierw - dla danego obiektu A = (A,≈A) konstruujemy - w bikategorii BH ! - obiekt El(A) =

37„Opis” (realizacja) to liczba naturalna.38Bardziej naukowo: opisana struktura bH nie jest kategorią lecz bikategorią (równoważnie: jest to weak 2-category

(mam nadzieję, że się nie mylę). Ale nie zaprzątajmy sobie głowy nowymi definicjami.39Zainteresowanych odsyłam np. do [134]. A w [89] napisano, że ten dowód jest „pretty hard”... .

Page 251: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 250

(El(A),≈el). Ta konstrukcja jest taka sama jak w toposie H40.

- następnie pokazujemy, że funkcja η : A×El(A)→ P(N) taka, że η(e, a) = e(a) generuje - w bH!- dwa morfizmy: η : A → El(A) i η1 : El(A) → A takie, że złożenie η · η1 jest funkcją równoważnąz miarą istnienia ≈el a złożenie η1 · η - z miarą istnienia ≈. To oznacza, że morfizmy η i η1 nie sąwprawdzie wzajemnie odwrotne w bikategorii bH ale są izomorfizmami mędzy tymi obiektami wtoposie Hylanda!

I to jest to: funkcja f : A×B → P(N) reprezentująca morfizm między obiektami A i B opisujew istocie przyporządkowanie punktom A elementów B .

Problem w tym, że nie tak łatwo powiedzieć, jak wyglądają „snopy” w toposie Hylanda... .41.

Zbiory efektywne i obiekt liczb naturalnych

Brak prostych intuicji, czym są morfizmy w toposie Hylanda nie jest wielkim zmartwieniem.Ten topos stworzono głównie po to, by zbudować matematyczne uniwersum zawierające kategorięzbiorów efektywnych. To się udało: każdy zbiór efektywne są obiektami a morfizmy w ESet sąmorfizmami w toposie Hylanda42. Co więcej, między zbiorami efektywnymi w toposie Hylanda niema innych morfizmów niż te, które są w kategorii ESet [89].

Jednym z efektywnych zbiorów jest obiekt N = (N,EN ) , gdzie E(n) = n . Morfizmy z N do Nto wyłącznie (totalne) funkcje obliczalne. To jest obiekt liczb naturalnych w toposie Hylanda.

Podkategoria ESet to „centrum” toposu Hylanda. Jego jądrem jest obiekt liczb naturalnych, gdyż każdyefektywny zbiór można z niego zbudować korzystając z najprostszych konstrukcji kategoryjnych: „everyeffective object is a quotient by a closed equivalence relation of a closed subobject of NNO”43.

14.3.1 Logika toposu Hylanda.

Obiekty i morfizmy leżące poza „centrum” - poza ESet - interesują nas średnio. Wyjątek robimydla tych, które związane z logiką toposu Hylanda.A ta logika jest ... intrugujaca.

Logika toposa Hylanda jest dwuwartościowa. To stwierdzenie - po tak pięknie (piekielnie) skom-plikowanej definicji tego toposa - nieco zaskakuje. Wyjaśnijmy to.

Klasyfikator podobiektów ΩH to para (P(N),≈), gdzie:

A ≈ B = (A→ B) ∧ (B → A)

dla dowolnych zbiorów A,B ⊆ N 44.Podobiekty dowolnego obiektu A = (A,≈) - morfizmy z A do klasyfikatora podobiektów - są(podobnie jak w toposie H) wyznaczone przez funkcje g : A → P(N) spełniające dwa warunki[134]:

- g(a) A E(a) ,- g(a) ∧ (a ≈ b) A g(b) 45

40Przypomnijmy: punkty El(A) to elementy A , czyli morfizmy z dowolnego jednopunktowego obiektu 1B =(?,EB) do A. Miara równości elementów e : 1B → A i e1 : 1C → A to największy zbiór D ⊆ B ∧ C, taki, żee|D = e1|D.41Ale może to tylko moja niewiedza... .42Morfizm f ∈ ESet((A,E), (B,E))) generuje jednoznacznie morfizm między tymi obiektami w toposie Hylanda

opisany przez funkcję f : A × B → P(N) taką, że f(a, f(a)) = (n, φ(n)) : n ∈ E(a) gdzie φ to funkcja obliczalnarealizująca f . W pozostałych przypadkach f(a, b) = ∅.43Relacja między kategorią ESet a toposem Hylanda przypomina tę między H-zbiorami rozmytymi a toposem H.44Odczytajmy to tak: n ∈ A ≈ B gdy n =< k, p > gdzie k jest realizacją implikacji A→ B a p - realizacją B → A.

A k realizuje B → A gdy jest numerem funkcji obliczalnej przekształcajacej kazdy opis B w opis A (242).45Oczywiście teraz te zapisy odczytujemy inaczej. Np. pierwszy warunek jest spełniony gdy istnieje funkcja obli-

czalna φ taka, że φ(g(a)) ⊆ E(a) dla każdego punktu a.

Page 252: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 251

Kanoniczną reprezentacją tak opisanego podobiektu jest obiekt (A,≈g) , gdzie a ≈g b = a ≈ b∧g(a).

Obiekt końcowy to jednopunktowy obiekt 1N = (?,E(?) = N). Jego podobiekty w bH to obiektypostaci 1A gdzie A ⊆ N. Ale w toposie Hylanda te podobiekty - z wyjątkiem obiektu 1∅ - sąizomorficzne z obiektem końcowym.

Dlatego w toposie Hylanda są tylko dwie wartości logiczne.

O semantyce języka pierwszego rzędu w toposie Hylanda trzeba myśleć tak:Pierwotną semantyką zdania α jest pewna funkcja [α] : ? → P(N) - morfizm w bH. Zbiór [α](?) ⊆ Nto zbiór realizacji (uzasadnień) zdania α.The meaning of a proposition is determined by (...) what counts as a verification of it - Martin Lof.46

Wartość logiczna zdania α to morfizm [[α]] : 1 → ΩH w toposie Hylanda wyznaczony przez funkcję [α].Ta wartość jest wtórna: zdanie α jest prawdziwe - [[α]] = true - gdy zbiór [α](?) jest niepusty czyli gdyzdanie α ma jakiekolwiek uzasadnienie. W przeciwnym przypadku wartością logiczną zdania α jest false.To jest zgodne z koncepcją Brouwera: prawdziwość to istnienie uzasadnienia.

Podobnie pierwotną semantyką formuły φ(x) z jedną wolną zmienną w modelu którego nośnikiem jestobiekt (A,≈) jest pewna funkcja [φ(x)] : A→ P(N) a wtórną - związany z nią morfizm w toposie Hylanda- [[φ(x)]] : (A,≈)→ ΩH.

I jest tak, jak oczekujemy: jeżeli w toposie Hylanda zinterpretujemy arytmetykę korzystając zobiektu liczb naturalnych, to:

„formuła arytmetyczna jest realizowalna w sensie Kleene’ego dokładnie wtedy, gdy jest uzasad-niona w toposie Hylanda” [49].

Jednak to, że w tym toposie są tylko dwie wartości logiczne nie znaczy, że jest on boolowski! Tozaskakujące stwierdzenie stanie się zrozumiałe gdy powiemy, jak w toposie Hylanda interpretowanajest kwantyfikacja.

Dla dowolnych obiektów A i B i podobiektu produktu A × B reprezentowanego przez funkcjęg : A×B → H zdefiniujemy funkcje ∀B(g),∃B(g) : B → P(N) (reprezentujące podobiekty B) :

(∀B g)(b) =⋂a∈A

(E(a)→ g(a, b)) , (∃B g)(b) =⋃a∈A

(E(a) ∧ g(a, b))

dla dowolnego b ∈ B .Jeśli pierwotną semantyką formuły φ(x, y) w modelu posadowionym na A jest funkcja [φ(x, y)] : A×A → H to semantyką formuł ∃yφ(x, y) i ∀yφ(x, y) są klasy równoważności funkcji ∀A([φ(x, y)]) i∃A([φ(x, y)]).

Uwzględniając równość (izomorfizm) A ∼= A× 1 możemy z każdą formułą φ(x) dwa podzbioryliczb naturalnych:

∀1[φ(x)] =⋂a∈A (E(a)→ [φ(x)](a)) , ∃1[φ(x)] =

⋃a∈A (E(a) ∧ [φ(x)](a))

które są pierwotnymi semantykami formuł-zdań ∀xφ(x) i ∃xφ(x).Te zdania są prawdziwe (w rozważanym modelu) gdy ich pierwotne semantyki są niepustymi

zbiorami.

Powiemy, że formuła φ(x) jest punktowo uzasadniona w punkcie a ∈ A gdy zbiór [φ(x)](a) jest niepusty.Przekrój niepustych zbiorów nie musi być niepusty. Dlatego uzasadnienia zdania ∀φ to - w toposie Hylanda- coś więcej niż istnienie wszystkich punktowych uzasadnień formuły φ! Potrzebne jest wspólne, jednoliteuzasadnienie.Wymóg jednolitego uzasadnienia zdań uniwersalnych jest zgodny z naszą intuicją. Czy uzasadnieniemsokratesowskiego zdania „każdy człowiek jest śmiertelny” jest osobny dowód śmiertlności każdego czło-wieka czy też oczekujemy jednolitej argumentacji obejmującej wszystkie przypadki?

Przykład. Przyjmijmy, że [α(x)], [β(x)] : 0, 1 → P(N) są funkcjami takimi, że:

46Per Martin-Lof. On the meanings of the logical constants and the justifications of the logical laws.Nordic Journalof Philosophical Logic, 1(1):11–60, 1996

Page 253: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 252

[α(x)](0) = N \ C, [α(x)](1) = C ,[β(x)](0) = 0, [β(x)](1) = 1 ,

gdzie C ⊆ N to dowolnie ustalony niepusty zbiór.

Bez względu na wybór zbioru C, zdania-implikacje (α(x) → β(x))[x := a] są realizowalne w obupunktach - dla a = 0 i a = 1. Natomiast zdanie ∀ (α(x) → β(x)) jest prawdziwe tylko wtedy, gdyzbiór C jest rozstrzygalny! 47

Co więcej, ponieważ ∃ g =⋃a∈A g(a), to - dla rozstrzygalnego zbioru C - żadne ze zdań

¬∀x (α(x)→ β(x)) i ∃x ¬(α(x)→ β(x)) nie jest prawdziwe. Wbrew prawom klasycznej logiki.

Wewnętrzna logika zdaniowa toposu Hylanda to dwuwartościowa logika klasyczna a wewnętrzna logikapierwszego rzędu jest „tylko” intuicjonistyczna. „This situation seems at first sight anomalous (atleast it did to the author)” pisał R.Goldblatt [43]. „Anomalous” można tłumaczyć jako „nienormalna”,będąca anomalią.Tego zaskoczenia nie da się wytłumaczyć matematycznie. Ale można spróbować „psychologicznie”. Na-wet matematycy (nie zajmujący się na co dzień logika matematyczną) skłonni są uznać, że prawdziwośćformuły postaci φ(x) ∨ ¬φ(x) to konsekwencja prawa wyłączonego środka sformułowanego w logice zda-niowej, że „jakoś” można tego dowieść. Ale to nieprawda: ta formuła jest prawdziwa wyłącznie na mocy„hiperaksjomatu” FOL który mówi, że każda instancja dowolnego prawa rachunku zdań jest zawszeformuła prawdziwą... 48.

Kwantyfikacja - przejście od uzasadnień formuły do prawdziwości zdania (od algebry Heytingado dwuelementowej algebry Boole’a) jest w tym toposie zrealizowana zgodnie z BHK-postulatami:prawdziwość zdania ∃φ(x) to istnienie (lokalnego) uzasadnienia φ(x) a zdania ∀φ(x) - istnieniejednolitego uzasadnienia tej formuły.

Punkty i elementy

Skoro logika toposu Hylanda jest dwuwartościowa, to nie ma tu elementów częściowych (pozanieszczęsnym elementem nieistniejącym): wszystkie elementy są globalne i generowane przez punkty.

Każdy punkt a ∈ A obiektu (A,≈A) taki, że E(a) 6= ∅ wyznacza element globalny. Punktya, b ∈ A wyznaczają ten sam element jeśli tylko zbiór a ≈A b jest niepusty.

Ale uwaga: obiekt końcowy nie jest tu generatorem: równoległe morfizmy id, ¬¬ : ΩH → ΩHsą równe na elementach klasyfikatora ΩH - ¬¬true = true, ¬¬false = false - ale nie są równe49.

To jeszcze jeden argument by definicji modelu języka pierwszego rzędu w toposie nie opierać nadefinicji „spełniania formuły w danym punkcie”.

Topos ∇(Set)Każdemu zbiorowi A można przyporządkować w toposie Hylanda obiekt ∇(A) = (A,≈A), taki, że:

[a ≈A b] =

N a = b

∅ a 6= b

. Każda funkcja f : A → B wyznacza morfizm z ∇(A) do ∇(B) Nieco trudniej pokazać, ża każdymorfizm z ∇(A) do ∇(B) jest wyznaczony przez pewną funkcję z A do B. W ten sposób wyróżnimyw toposie Hylanda podkategorię ∇(Set).

„∇(Set) should be regarded as the world of classical mathematics within Eff” [49].Co to znaczy, że w obiektach postaci ∇(A) miarą równości różnych punktów jest zbiór pusty a miarą

47Powielamy tu przykład który ilustrował sutelności relacji „A”. Nic dziwnego: f A g dokładnie wtedy, gdy∀(f → g) 6= ∅.48Instancje prawa wyłączonego środka - p ∨ ¬p - otrzymamy wstawiając w miejsce p dowolną formułę pierwszego

rzędu.49Równość ¬¬ = id implikuje boolowskość toposu [69].

Page 254: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 253

istnienia każdego punktu - „wszystko”? Nie można tego interpretować inaczej, niż jako stwierdzenie, żew świecie klasycznej matematyki „wiemy” (zakładamy, że wiemy, przyjmujemy aprioryczne założenie),że równe elementy (punkty obiektu) są równe a różne - różne.

Kategorię ∇(Set) można też wyróżnić „wewnętrznie”, jako topos boolowski, wyznaczony przezmorfizm (topologię) podwójnej negacji: obiekty postaci ∇(A) to ¬¬-snopy50.

Obiekt liczb naturalnych N jest podobiektem ∇(N) istotnie od niego różnym51

Morfizmy z ∇(N) do ∇(N) to wszystkie funkcje z N do N. Jest ich nieprzeliczalnie wiele.Morfizmy z N do N to totalne funkcje rekurencyjne. I jest ich przeliczalnie wiele.

Skoro w toposie Hylanda jest obiekt liczb naturalnych to są też obiekty liczb całkowitych, wy-miernych i rzeczywistych, konstruowane według schematu, który opisaliśmy w toposie H-zbiorów.Obiekt „liczb rzeczywistych” to tutaj para (Rrec,≈) gdzie Rrec to liczby rzeczywiste wyznaczoneprzez rekurencyjne ciągi Cauchy’ego a n ∈ (r ≈ r1) gdy r = r1 i φn opisuje ciąg rekurencyjny zbież-ny do r [49]. „Miarą istnienia” tak definiowanej liczby rzeczywistej jest zbiór (kodów) wszystkichrekurencyjnych ciągów, które ją aproksymują. A każdy morfizm z (R,≈) do (R,≈) jest ciągły...

Możliwość zanurzenia klasycznej matematyki w topos Hylanda - poprzez funktor ∇ - poddaje w wątpli-wość stwierdzenie, że topos Hylanda to świat matematyki obliczalnej. Wygląda na to, że chcąc zbudowaćmatematyczny świat konstruktywistów nie możemy zbudować czegoś „obok” a jedynie „coś więcej”.

Wątpliwość uzasadniona. Ale z uwagi na trywialny charakter miary równości w obiektach podkategorii∇(Set) można zaryzykować twierdzenie, że jest ona gdzieś na peryferiach toposu Hylanda.

Dodatek: od hiperdoktryny do toposu

Analizujac definicję toposu odkrywaliśmy jego wewnętrzną logikę. To droga „od matematykido logiki”. Ale możliwa jest też wędrówka w odwrotnym kierunku - „od logiki do matematycznegouniwersum (toposu)”. I właśnie w ten sposób konstruowany jest każdy topos H i topos Hylanda.Różnica polega na tym, że w pierwszym przypadku opis logiki jest prosty: ta logika wyznaczonaprzez pojedynczą zupełną algebrę Heytinga H. W przypadku toposu Heytinga jest to coś bardziejskomplikowanego - to hiperdoktryna. Cóż to takiego?

Hiperdoktryna pierwszego rzędu jest zadana przez wskazanie:- funktora Hd : Setop → Heyt , gdzie Heyt to kategoria zupełnych algebr Heytinga,- rodziny funkcji (indeksowanej parami zbiorów (A,B)) ∀A, ∃A : Hd(A × B) → Hd(B) powią-

zanych z rzutowaniami ΠA : A×B → A przez takie oto nierówności:

c ¬ Hd(Π)(d) ⇔ ∃A(c) ¬ d , Hd(Π)(d) ¬ c⇔ d ¬ ∀A(c)dla wszelkich elementów c ∈ Hd(A×B) i d ∈ Hd(B)

Darujemy sobie analizę tej definicji52. Niech nam wystarczy, że są tu algebry Heytinga (niejedna, ale wiele!) i działające między nimi funkcje, których opisy sugerują związki z kwantyfkacją.

Każda zupełna algebra Heytinga H wyznacza swoją hiperdoktrynę: funktor H : Setop → Heytprzyporządkowujący każdemu zbiorowi A algebrę Heytinga posadowioną na zbiorze HA wszystkichfunkcji z A do H. Działania są tu określone „po współrzędnych” (np. (f ∨ g)(a) = f(a) ∨ g(a)).Funkcje ∀A, ∃A : HB×A → HB opisaliśmy wcześniej, gdy mówiliśmy o kwantyfikacji w toposie H.

Hiperdoktryna - punkt wyjścia do budowy toposu Hylanda - jest bardziej skomplikowana. Aby jązbudować musimy - dla dowolnego zbioru A - wskazać odpowiednią zupełną algebrę HeytingaH(A).Zdefiniowanie struktur (P(N)A,∧,∨,→) zdaje się sugerować, że to właśnie one są poszukiwanymialgebrami. Niestety - to nie są algebry Heytinga.

50Konstrukcję takiego podtoposu boolowskiego opisaliśmy wcześniej.51Spróbuj pokazać, że wszystkie morfizmy z ∆(N) do N są „stałe” - postaci ∇(N) → 1 → N (gdzie 1 to obiekt

końcowy.52Podana tu definicja hiperdoktryny jest niepełna. Pełną wersję można znaleźć np. w pracy A.M.Pittsa [90].

Page 255: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

ROZDZIAŁ 14. OD REALIZOWALNOŚCI DO TOPOSU HYLANDA 254

Musimy powtórzyć manewr, który już raż wykonaliśmy definiując morfizmy w toposie Hylanda- musimy przyjąć, że elementy zbiorów P(N)A jedynie reprezentują elementy poszukiwanychalgebr Heytinga:

funkcje f, g : A→ P(N) reprezentują ten sam element algebry H(A) gdy są równoważne53

O tym, że możliwa jest droga „od logiki do (lokalnego) uniwersum” - od hiperdoktryny do toposu- mówi takie oto twierdzenie [90]:

Każda hiperdoktryna (spełniająca pewne dodatkowe warunki) wyznacza topos54.

Jego obiekty to pary(A,≈A) ∈ H(A×A)

)takie, że:

- ∀a,ba ≈A b→ b ≈A a,- ∀a,b,c (a ≈A b ∧ b ≈A c)→ a ≈A c

Natomiast morfizm z (A,≈A) do (B,≈B) to każdy element f ∈ H(A×B) taki, że:∀a,b a ≈ b→

(EA(a) ∧EB(b)

),

∀a,b,a1,b1 (a ≈A a1 ∧ b ≈B b1 ∧ f(a, b))→ f(a1, b1)∀a,b (f(a, b) ∧ f(a, b1))→ b ≈B b1∀a EA(a) ¬ ∃b f(a, b)

Ot, cała tajemnica... . 55.

To nie koniec

Proces dochodzenia do rozumienia matematyki jest (potencjalnie) nieskończony.

Czy zdanie okrągłe wypowiesz,czy księgę mądrą napiszesz,będziesz zawsze mieć w głowietę samą pustkę i ciszę.(...)

Zwieść cię może ciągnący ulicami tłum,wódka w parku wypita albo zachód słońca,lecz pamiętaj: naprawdę nie dzieje się nici nie stanie się nic - aż do końca. (...)

M. Zabłocki

to be continued ... (???))

53Matematycznie: poszukiwane algebry Heytinga to struktury ilorazowe (P(N)A,∧,∨,→)/ ∼=A gdzie ∼=A to relacjarównoważnego uzasadnienia: f ∼=A g gdy istnieje para funkcji obliczalnych taka, że φ(f(a)) ⊆ g(a) i ψ(g(a)) ⊆ f(a)dla dowolnego a ∈ A.54Hiperdoktryny spełniające te dodatkowe warunki to triposy. Rezygnuję tu ze szczegółowego omawiania tych

pojęć, gdyż wymagało by to użycia języka daleko wykraczającego poza przyjęte tu samoograniczenie.Co oznacza słowo ”tripos”? P.Johnstone (...) suggested naming these structures with the acronym tripos - standingfor Topos Representing Indexed Partially Ordered Set” ale zaraz dodaje: it is partly a joke: the Tripos is the nameCambridge University gives to examinations” [90]55Zainteresowanych szczegółami odsyłam do [90]

Page 256: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

Bibliografia

[1] S.Abramsky,The Lazy Lambda Calculus, (http://www.cs.ox.ac.uk/files/293/ lazy.pdf)

[2] M.Atiyah,Matematyka w XX wieku, Roczniki PTM Seria II: Wiad. Mat. XXXIX (2003)

[3] M.van Atten, D.van Dalen, R.Tieszen, Brouwer and Weyl: The phenomenology and mathe-matics of intuitive continuum, http://www.researchgate.net/publication/

[4] M.van Atten, D.van Dalen,Arguments for the continuity principle, The Bull. of. Symb.Logic,vol.8 num.3 (2002)

[5] J.Avigad, S.Feferman, Godel’s Functional Interpretation, Handbook of Proof Theory, 1968

[6] H.P.Barendregt, The Lambda Calculus, its syntax and semantics, Studies in Logic and theFoundation of Mathematics vol.103, North-Holland Publ. Comp. 1981

[7] M.Barr, Ch.Wells, Toposes, Triples and Theories (http://www.cwru.edu/artsci/math/wells/pub/ttt.html) (30.11.2011)

[8] A.Bauer, Realizability as connection between Computable and Constructive mathematics,(http://math.andrej.com/data/c2c.pdf) (23.09.2012)

[9] J.L.Bell, Continuity and Infinitesimals, Stanford Encyklopedia of Philosophy (http://plato.stanford.edu/entries/continuity/),(13.12.2012)(pedłny tekst książki The Continuous and theInfinitesimal in Mathematics and Philosophy jest dostępny w internecie).

[10] J.L.Bell, A.B.Slomson, Models and ultraproducts, an introduction, North-Holland Publ.Comp., 1971

[11] N.Bezhanishvili, D.de Jongh, Intuitionistic Logic, (http://www.cs.le.ac.uk/people/ nb118 /Pu-blications/ESSLLI2705.pdf) (20.01.2013)

[12] C.Bohm, G.Jacopini, Flow Diagrams, Turing Machines And Languages With Only Two For-mation Rules, http://www.cs.unibo.it/ martini/PP/bohm-jac.pdf

[13] B.Brożk, M.Hohol, Umysł matematyczny, Copernicus Center Press, Kraków 2014

[14] E.Bryniarski, Metoda fluksji Newtona, (http://www.math.uni.opole.pl/ebryniarski / Meto-da20fluksji20Newtona.pdf) (10.05.2011).

[15] A.Bundy, The Automation og Proof by Mathematica Induction, in Handbook of AutomatedReasoning vol.1 , North-Holland, 1992

[16] S.Buss,First-Order Proof Theory of Arithmetic - Rozdział II książki o nieznanym mi tytule,(http://www.math.ucsd.edu/ sbuss/ResearchWeb/handbookII/ChapterII.pdf )(24.07.2012)

[17] C.S.Calude,Information and Randomness - an algorithmic perspective, Springer 2002 (2ed.)

255

Page 257: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

BIBLIOGRAFIA 256

[18] F.Cardone, J.R.Hindley, History of Lambda-calculus and Combinatory Logic, Swansea Uni-versity Mathematics Department Research Report No. MRRS-05-06 (2006)(http://maths.swan.ac.uk/staff/jrh/papers/jrhhislamweb.pdf) (15.04.2012)

[19] G.Chaitin, The search for the perfect language , http://pirsa.org/09090007/ (20.12.2012)

[20] G.Chaitin, On the search of the lenght of programs for computing finite binary sequences,Journal of the ACM 13 (1966),pp. 547-569

[21] K. Ciesielski, Z. Pogoda,Diamenty matematyki, Prószyński i S-ka.

[22] P.Cohen,The discovery of forcing, Rocky Moutain J. of. Math. vol.32, no. 4 2002

[23] H.Curry,The Paradox of Kleene and Rosser, Transactions of the American MathematicalSociety Vol. 50, No. 3 (Nov., 1941), pp. 454-516

[24] D.van Dalen,Intuitionistic logic, Handbook of Philosophical Logic, vol. III, Reidel Publ.Co.,1986.

[25] B.Dembiński,Teoria idei. Ewolucja myśli platońskiej, sbc.org.pl)

[26] J.Dieudonee,Logika i matematyka, Zagadnienia Filozoficzne w Nauce VIII, 7-19 (1986)

[27] A.Doring, Ch.Isham,„What is a Thing?”: Topos Theory in the Foundationsof Physics (inter-net)

[28] J.M.Dunn, N.D.Belnap,The substitution Interpretation of the quantifiers, Nous, vol.2 (1968),177-185

[29] U.Eco,W poszukiwaniu języka uniwersalnego, Wyd. Marabut, 2002

[30] Companion Encyclopedia of the history and philosophy of the mathematical sciences, ed. I.Grattan-Guiness

[31] T.Chow,Forcing for dummies, (though I should warn that Tim has a rather stringent definitionof „dummy”), http://www-math.mit.edu/ tchow/mathstuff/forcingdum

[32] ks.J.Dadaczyński,Pojęcie nieskończoności w matematyce, Studia Historyczno-Teologiczne2002, t.35, z.2, s.265-270

[33] ks.J.Dadaczyński,Koncepcja matematyki G. Cantora a idea logicyzmu,Zagadnienia Filozoficz-ne w Nauce XXII, 1998, s.15-34

[34] ks.J.Dadaczyński, Filozofia matematyki Immanuela Kanta i jej dziedzictwo, Zagadnienia Fi-lozoficzne w Nauce XXIV / 1999, s.26-42

[35] D. van Dalen,Intuitionistic logic, The Blackwell Guide to Philosophica Logic. Ed. L.Gobble.Blackwell, Oxford.2001, 224-257.

[36] P.J.Davis, R.Hersh,Świat matematyki, Wydawnictwo Naukowe PWN,1994

[37] A.Doring, C.Isham,Topos theory in the foundations of Physics (w New Structure for Phisics”(ed. B.Coecke), internet

[38] S.Feferman, Predicativism (internet???)

[39] S.Feferman,G¨odel’s Dialectica interpretation and its two-way stretch, Computational Lo-gic and Proof Theory (Proc. 3d Kurt Godel Colloquium, Brno Aug. 1993, G. Gottlob et at.eds.,LNCS 713 (1993)

Page 258: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

BIBLIOGRAFIA 257

[40] T.Forster,The axioms of set theory, internet

[41] J.Y.Girard,The Blind Spot Lectures on Logic, Rome, Autumn 2004. (http://iml.univ-mrs.fr/ girard/coursang/coursang2.pdf.gz)

[42] J.Y.Girard,Proof and Types.

[43] R.Goldblatt,Topoi - the categorical analysis of Logic, Studies in Logic and Foundation ofMathepatisc, vol.98, North-Holland 1979

[44] M.Has,Czy świat zmierza ku czemuś?, Zielone Brygady. Pismo Ekologów, nr 4 (218), 2006

[45] M.Heller,Elementy mechaniki kwantowej dla filozofów, Copernicus Center Press, 2018

[46] D.Higgs,Injectivity in the topos of complete Heyting algebra valued sets, Can. J. Math., Vol.XXXVI, No. 3, 1984, pp. 550-568.

[47] Companion Encyclopedia of the History of Philosophy of Mathematical Science, Ed. I Grattan-Guinness, 1994

[48] Holmes, Randall,Elementary Set Theory with a Universal Set, Academia-Bruylant 1998.

[49] J.M.E.Hyland, The Effective Topos, internet

[50] B. Jacobs,Categorical logic and Type theory, Studies in Logic and Foundation of Mathematics,vol.141

[51] P.Johnstone,Stone spaces, Cambr.Univ.Press, 1986

[52] P.Johnstone, The point of pointless topology, Bull. AMS vol.8, No.1, 1983

[53] J.P.Jones, Universal Diophantine Equation, Journal of Symb.Logic,vol 47 N.3,1982

[54] A.Kanamori, The mathematical development of set theory. From Cantor to Cohen, Bull.ofSymb.Logic vol 2.,Num.1, March 1996

[55] H.J. Keisler, Foundations of infinitesmall calculus, ([email protected])

[56] R.Kaye, Tennenbaum’s Theorem for Models of Arithmetic, internet

[57] R.Kaye, T.L.Wong, On interpretation of arithmetic and set theory (internet - rozszerzonawersja art. z Notre Dame Journal of Formal Logic

[58] K. Kapulkin, O prawdzie u Alfreda Tarskiego, http://www.racjonalista.pl/kk.php/s,3573,

[59] A.O.Kazakci, A.Hatchuel, Is ”creative subject” of Brouver a designer? - an analysis of intu-itionist mathematics from the viewpoint of C-K design theory, ICED’09 24-27 August 2009,Stanford,CA 24-27,USA, .

[60] J.Klop, Term rewriting systems

[61] S.Krajewski, Twierdzenie Godla i jego filozoficzne interpretacje, rozdział z książki „Twier-dzenie Godla” zamieszczony w internecie

[62] A.Kolany, Kultura matematyczna - świadomość środków, świadomość ograniczeń,http://www.msn.ap.siedlce.pl/smp/msn/22/7-9.pdf

[63] M.Kordos, Czy w matematykę trzeba wierzyć? (XX Szkoła Matematyki Poglądowej, internet

Page 259: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

BIBLIOGRAFIA 258

[64] J.J.C.Kuiper, Ideas and Explorations - Brouwer’s Road to Intuitionism - praca doktorska,2004, http://igitur-archive.library.uu.nl/dissertations/2004-0303-084333/inhoud.htm

[65] F.W. Lawvere, Functorial semantics of algebraic theories. Proc. Nat. Acad. Sci U.S.A 50,869-73, 1963.

[66] F.W.Lawvere, An elementary theory of the category of sets, Proc. Nat. Acad. Sci U.S.A vol.52,1506-11, 1964.

[67] F.W.Lawvere, R.Rosebrugh, Sets for Mathematics, Cambridge Univ.Press, 2003 (internet)

[68] G.Lakoff, R.E.Nunez, Where Mathematics Come from. How the Embodied Mind Brings Ma-thematics into Being. New York.Basic Books,2000

[69] S.McLane, I.Moerdijk, Sheaves in Geometry and Logic - a first introduction to topos theory,Springer-Verlag,1992

[70] A.Miguel, An introduction to forcing, https://www.fing.edu.uy/ amiquel/forcing/forcing

[71] P.Martin-Lof, An Intuitionistic Theory of Types, Technical report, University of Stockholm.

[72] P.Martin-Lof, Intuitionistic Type Theory Per Martin-Lof, Notes by G. Sambin of a series oflectures given in Padua, June 1980, internet

[73] S. McLane, Category theory for the working mathematicians.

[74] M. McLuhan, Wybór tekstów, Zysk i S-ka Wydawnictwo,2001

[75] P.Muller, Introduction to model oriented programmming using C++ ( [email protected]) (10.10. 2012)

[76] A.Mostowski,Logika Matematyczna, Monografie Matematyczne t.18, Warszawa-Wrocław,1948.

[77] R.Murawski, Filozofia matematyki. Zarys dziejów. PWN, Warszawa, 1995.

[78] R.Murawski,Funkcje rekurencyjne i elementy metamatematyki, Wyd. Naukowe UAM, Poznań,2000.

[79] R.Murawski, Program Hilberta - drogi i manowce,http://www.msn.ap.siedlce.pl/smp/msn/14/21-25.pdf

[80] R.Murawski, Główne koncepcje i kierunki filozofii matematyki XX wieku, Zagadnienia Filo-zoficzne w Nauce XXXIII,74-92,2003

[81] R.Murawski (red.),Współczesna filozofia matematyki, wybór tekstów, PWN Wwa 2002.

[82] M. Di Nasso,On the Foundations of Nonstandard Mathematics (internet)

[83] E.Nelson, Hilbert’s mistake, https://web.math.princeton.edu/ nelson/papers/hm.pdf

[84] E.Nelson, Understanding intuitionism, http://www.math.princeton.edu/ nelson/papers.html

[85] J.Niekus, Brouwer’s incomplete objects (http://www.illc.uva.nl/Research/Reports/PP-2005-27.text.pdf)

[86] J.van Oosten,Realizability: a historical essay (internet)

[87] R.Penrose, Nowy umysł cesarza. PWN, Warszawa, 1995

Page 260: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

BIBLIOGRAFIA 259

[88] S.Petrakis, Brouwer intitionism as a self interpreted mathematical theory (internet)

[89] W.Phoa, An introduction to fibrations,topos theory the effective topos and modest sets,http://www.lfcs.inf.ed.ac.uk/reports/92/ECS-LFCS-92-208/

[90] A.M.Pitts, Tripos theory in retrospect, Math.Struc.in Comp.Sci., 2002, vol.12, 265-279.

[91] Platon, Obrona Sokratesa, Uczta.

[92] H.Poincare, Nauka i Hipoteza.

[93] J.Pogonowski, Niewyrażalna tęsknota za modelem zamierzonym, odczyt 10.06. 2010 roku,Uniwersytet Opolski, http://www.glli.uni.opole.pl/index.php?id=publications (2.11.2012)

[94] J.Pogonowski, Projekt Logiki Infinitarnej Ernsta Zermela, Investigationes Linguisticae, vol.XIV, praca dostępna w internecie

[95] J.Pogonowski, Geneza matematyki według kognitywistów, Investigationes Linguisticae, vol.XXIII, pp.106-146, 2001

[96] H.Putnam,Models and reality, Journal of Symbolic Logic, Vol. 45, No. 3 (Sep., 1980), pp.464-482.

[97] P.Raatikainen, Hilbert’s program revisited, (Synthese 137: 157dż˝177, 2003.) http://www.mv.helsinki.fi/home/praatika/Hilbert’s Program Revisited.pdf

[98] H.Rasiowa, Wstęp do matematyki współczesnej, PWN,1989.

[99] B.Russell, Wstęp do filozofii matematyki, PWN 1958.

[100] K.A.Ross, Ch.R.B.Wright, Matematyka dyskretna, PWN, 2000.

[101] B.Rosenblum, F.Kuttner, Zagadka teorii kwantów, Prószyński i S-ka, 2013.

[102] M.Rossberg, First order logic, second order logic and completeness, http://homepages.uconn.edu/ mar08022/papers/RossbergCompleteness.pdf

[103] G.Sambin, Intuitionistic formal spaces,http://www.math.unipd.it/ sambin/txt/ifs87-97.pdf,

[104] J.P.Seldin, Lambda-Calculus and Functional Programming, internet

[105] J.P.Seldin, The Logic of Curry and Church, http://www.logic.amu.edu.pl/images/c/c5/Currychurch.pdf

[106] S.Shaprio, Foundations without Foundationalism A Case for Second-order Logic, OxfordUniversity Press, 2006 (dostępne również˝ w internecie)

[107] W.Sieg, Theory of computability, http://www.phil.cmu.edu/summerschool/2006/Sieg/computability-theory.pdf (15.10.2012)

[108] S.G.Simpson, Subsystems of Second Order Arithmetic,(rozdział 1), https:www. math.psu.edu/simpson/sosoa/chapter1.pdf

[109] C.Smorydzyński, Godel incompleteness theorem, in: Proof Theory and Constructive Mathe-matics, Part D.

[110] R.Smullyan, Na zawsze nierozstrzygnięte - zagadkowy przewodnik po twierdzeniach Godla(tłum. J.Pogonowski) Książka i Wiedza, 2007.

[111] M.H.Soersten, P.Urzyczyn, Lectures on the Curry-Howard Isomorphism, draft-paper.

Page 261: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

BIBLIOGRAFIA 260

[112] Ch.Strachey, Fundamental Concepts in Programming Languages, Higher-Order and SymbolicComputation, 13, 11dż˝49, 2000

[113] T.Streicher, Introduction to Constructive Logic and Mathematics, http:www.mathematik.tu-darmstadt.de/ streicher/CLM/clm.pdf.

[114] T.Streicher,Realizability, http:www.mathematik.tu -darmstadt.de/ streicher/REAL/ RE-AL.pdf

[115] L.Susanka, What are we (mathematicians) doing? internet (???).

[116] K.Świrydowicz, Podstawy logiki modalnej, Wyd. Naukowe UAM, Poznań 2004.

[117] J.Szymanik, Paradoks implikacji: próba wyjaśnienia - http://kf.mish.uw.edu.pl/mishellanea/m2/m2 15.pdf (3.11.2012)

[118] T.Tait, Finitism, The Journal of Philosophy 78, 1981, pp.524-546.

[119] P.Taylor, Practical Foundations of Mathematics, Cambridge Studies in Advanced Mathema-tics 59 (1999)

[120] A.Tarski, Wprowadzenie do logiki, Philomat (internet)

[121] A.Tarski, The Semantical Conception of True, Philosophy and Phenomenological Research4 (1944) ( http://www.ditext.com/tarski/tarski.html) (5.10.2012)

[122] S.Thompson, Type Theory and Functional Programming, 1999 (internet)

[123] A.S.Troelstra, Constructivism and proof theory, internet

[124] A.S.Troelstra, History of constructivism in the 20th century, http://staff.science.uva.nl/ an-ne/hhhist.pdf (15.10.2011)

[125] A.S.Troelstra, Kleene’s realizability, http:oai. cwi.nl/oai/asset/13500/13500A.pdf

[126] K.Trzęsicki, Metodologiczne i teoriopoznwacze przesłanki klasycznego problemu rozstrzygal-ności, http: www.calculemus.org/neumann/odczyty/trzesicki2.pdf (10.12.2011)

[127] C.F von Weizsacker, Filozofia grecka a fizyka współczesna, Zagadnienia Filozoficzne w NauceII , 1979/80, s.1dż˝17.

[128] K.Wojtowicz, Paradoksy skończoności, Zagadnienia filozoficzne w nauce XVIII 1996, s.87-100.

[129] J.Vaananen, Lindstrom’s Theorem, http://www.math.helsinki.fi/logic/opetus/lt/lindstrom theorem1.pdf

[130] J.Vaananen, Second order logic and foundation of mathematics, Bull.Symbolic Logic, 7(4)504-520, 2001.

[131] J.Vaananen, Second order logic, set theory and foundation of mathematics,(http:www.math.helsinki.fi/logic/people/ jouko.vaananen/ (15.09.2011))

[132] J.Vaananen,Second order logic or set theory?, internet

[133] S.Valentini, Meta-mathematical aspects of Martin-Lof ’s type theory, http://www.math.unipd.it/ silvio/papers/PhDThesis/TypeTheory.pdf (10.06.2012)

[134] S.Vermeeren,Realizability Toposes, https://stijnvermeeren.be/download/ mathematics/ es-say.pdf

Page 262: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfProces nie jest rzeczą. Raczej rzecz jest stanem procesu. Jeśli uważasz, że trud poznania jest uzasadniony tylko

BIBLIOGRAFIA 261

[135] S.Vickers,Continuity and Geometric logic, Journal of Applied Logic 12 (2014)

[136] N.Weawer,Forcing for mathematicians, World Scientific,2014

[137] S.Wolfram,A New Kind of Science, Wolfram Media, 2002