28

Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana
Page 2: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Warszawa, Wiedza Powszechna 2007

Page 3: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Publikacja przygotowana w latach 2003–2006w ramach projektuSłownik gramatyczny języka polskiego,sponsorowanego przez Komitet Badań Naukowych(nr rejestracyjny 2 H01D 007 24) i zlokalizowanegow Uniwersytecie Warmińsko-Mazurskim w Olsztynie.

Page 4: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Zawartość słownika

Słownik gramatyczny języka polskiego• podaje wyczerpującą informację o odmianie polskich

leksemów (uwzględnia wszystkie wzorce odmiany obecnew języku?);

• uwzględnia podstawowe cechy składniowe:• dla rzeczowników — rodzaj,• dla czasowników — aspekt,• dla przyimków — wymagany przypadek,• dla liczebników — typ związku z rzeczownikiem,• oraz wskazówki co do łączliwości leksemów nieodmiennych;

• nie zawiera definicji.

Page 5: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Zawartość słownikaHasła Wzory

razem 244,341 1095rzeczowniki 135,388 762

pospolite 68,099własne 8,754odsłowniki 29,587odprzymiotnikowe 28,948

przymiotniki 65,564 71„prawdziwe” 31,273imiesłowy 34,291

liczebniki 98 45czasowniki 29,531 215nieodmienne 13,760 2

przysłówki 11,469przyimki 112inne 2,179

Page 6: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Page 7: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Praca nad SGJP

• Dane dla poszczególnych części mowy są przechowywanew osobnych bazach programu MS Access. Za każdą bazęjest odpowiedzialny jeden z Autorów.

• Wszystkie bazy mają (nieomal) tę samą strukturę.• Przetwarzanie do postaci danych wykorzystywanej

w interfejsie Słownika odbywa się pod Linuksem(mdb-tools, Perl i SQLite).

Page 8: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Jak opisujemy odmianę

sg plnom dziecko dziecigen dziecka dziecidat dziecku dzieciomacc dziecko dzieciinst dzieckiem dziećmiloc dziecku dzieciachvoc dziecko dzieci

Page 9: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Jak opisujemy odmianę

sg plnom dziecko dziecigen dziecka dziecidat dziecku dzieciomacc dziecko dzieciinst dzieckiem dziećmiloc dziecku dzieciachvoc dziecko dzieci

Page 10: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Jak opisujemy odmianę

Wzór fleksyjny

dzie +

sg plnom cko cigen cka cidat cku ciomacc cko ciinst ckiem ćmiloc cku ciachvoc cko ci

rdzeń + zakończenia

Page 11: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Schemat bazy danych (1. przybliżenie)

Page 12: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Schemat bazy danych (2. przybliżenie)

Page 13: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Odmiana typowego przymiotnika

sg plm1 m2 m3 n1,n2 f m1,p1 pozostałe

nom zły zły zły złe zła źli złegen złego złego złego złego złej złych złychdat złemu złemu złemu złemu złej złym złymacc złego złego zły złe złą złych złeinst złym złym złym złym złą złymi złymiloc złym złym złym złym złej złych złych

Page 14: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Odmiana typowego przymiotnika

sg plm1 m2 m3 n1,n2 f m1,p1 pozostałe

nom zły zły zły złe zła źli złegen złego złego złego złego złej złych złychdat złemu złemu złemu złemu złej złym złymacc złego złego zły złe złą złych złeinst złym złym złym złym złą złymi złymiloc złym złym złym złym złej złych złych

Page 15: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

11 form bazowych przymiotnika

sg plm1 m2 m3 n1,n2 f m1,p1 pozostałe

nom 1 1 1 5 6 9 5gen 2 2 2 2 7 10 10dat 3 3 3 3 7 4 4acc 2 2 1 5 8 10 5inst 4 4 4 4 8 11 11loc 4 4 4 4 7 10 10

Page 16: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Schemat bazy danych (3. przybliżenie)

Page 17: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Trzy rzeczowniki, które odmieniają się „tak samo”

mag m1 żuk m2 sąg m3

sg pl sg pl sg plnom mag magowie

magiżuk żuki sąg sągi

gen maga magów żuka żuków sąga sągówdat magowi magom żukowi żukom sągowi sągomacc maga magów żuka żuki sąg sągiinst magiem magami żukiem żukami sągiem sągamiloc magu magach żuku żukach sągu sągachvoc magu magowie

magiżuku żuki sągu sągi

Page 18: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Trzy rzeczowniki, które odmieniają się „tak samo”

mag m1 żuk m2 sąg m3

sg pl sg pl sg plnom mag magowie

magiżuk żuki sąg sągi

gen maga magów żuka żuków sąga sągówdat magowi magom żukowi żukom sągowi sągomacc maga magów żuka żuki sąg sągiinst magiem magami żukiem żukami sągiem sągamiloc magu magach żuku żukach sągu sągachvoc magu magowie

magiżuku żuki sągu sągi

Page 19: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Połączony wzór dla męskiego typu odmiany

sg:nom øsg:gen asg:dat owisg:inst iemsg:loc usg:voc upl:nom:m1 owiepl:nom:m2 ipl:gen ówpl:dat ompl:inst amipl:loc achpl:voc owie

Page 20: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Typy rodzajowe odmiany rzeczowników

• Wskazane zależności między formami nie są uniwersalnedla wszystkich rzeczowników.

• Wprowadzamy typy rodzajowe wzorów rzeczownikowych:męski, żeński, nijaki, nieodmienny.

Encja Pattern ma atrybut pat_type.• Generowane formy zależą także od rodzaju rzeczownika.

Encja Inflection ma atrybut infl_char.

Page 21: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Schemat bazy danych (4. przybliżenie)

Page 22: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Dlaczego infl_char jest atrybutem Inflection?

Ze względu na leksemy o rozchwianym rodzaju:• CZŁOWIECZYSKO m1 lub n2• CABERNET m2 lub m3 lub n2

Leksem taki opisujemy jedną instancją encji Lexeme skojarzonąz kilkoma instancjami Inflection o różnej wartości rodzaju.

Oczywiście dla typowych leksemów homonimicznych stosujemyosobne instancje encji Lexeme (np. trzy leksemy BOKSER).

Page 23: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Formy typowego czasownika

czytam, czytamy, czytasz, czytacie, czyta, czytają, czytałem, czytałam,czytałom, czytaliśmy, czytałyśmy, czytałeś, czytałaś, czytałoś,czytaliście, czytałyście, czytał, czytała, czytało, czytali, czytały,czytano, czytajmy, czytaj, czytajcie, czytałbym, czytałabym,czytałobym, czytalibyśmy, czytałybyśmy, czytałbyś, czytałabyś,czytałobyś, czytalibyście, czytałybyście, czytałby, czytałaby,czytałoby, czytaliby, czytałyby, czytać, czytając, czytanie, czytania,czytaniu, czytaniem, czytań, czytaniom, czytaniami, czytaniach,czytany, czytanego, czytanemu, czytanym, czytane, czytana, czytanej,czytaną, czytani, czytanych, czytanymi, czytający, czytającego,czytającemu, czytającym, czytające, czytająca, czytającej, czytającą,czytających, czytającymi

12 form bazowych: czyta, czytam, czytają, czytaj, czytać, czytał,czytałem, czytało, czytali, czytano, czytanie, czytani

Page 24: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Formy typowego czasownika

czytam, czytamy, czytasz, czytacie, czyta, czytają, czytałem, czytałam,czytałom, czytaliśmy, czytałyśmy, czytałeś, czytałaś, czytałoś,czytaliście, czytałyście, czytał, czytała, czytało, czytali, czytały,czytano, czytajmy, czytaj, czytajcie, czytałbym, czytałabym,czytałobym, czytalibyśmy, czytałybyśmy, czytałbyś, czytałabyś,czytałobyś, czytalibyście, czytałybyście, czytałby, czytałaby,czytałoby, czytaliby, czytałyby, czytać, czytając, czytanie, czytania,czytaniu, czytaniem, czytań, czytaniom, czytaniami, czytaniach,czytany, czytanego, czytanemu, czytanym, czytane, czytana, czytanej,czytaną, czytani, czytanych, czytanymi, czytający, czytającego,czytającemu, czytającym, czytające, czytająca, czytającej, czytającą,czytających, czytającymi

12 form bazowych: czyta, czytam, czytają, czytaj, czytać, czytał,czytałem, czytało, czytali, czytano, czytanie, czytani

Page 25: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Części składowe czasownikowej formy fleksyjnej

pref

iks

rdze

ńpr

zyro

stek

tema

towy

zako

ńcze

nie

nry

form

bazo

wych

d ął 6 praet:sg:m:terd ął em 7 praet:sg:m:prid ął eś 7 praet:sg:m:secd ęł a 8 praet:sg:f:terd ęł o 8 praet:sg:n:terd ęł y 8 praet:pl:f:terd mą cy 3 pact:sg:nom:m1:aff

nie d mą cy 3 pact:sg:nom:m1:neg

Page 26: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Schemat bazy danych

Page 27: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Części składowe formy fleksyjnej

Form

Infl

ecti

on

Endi

ng

Form

Infl

ecti

on

Form

pref

ix

stem

endi

ng

suff

ix

bafo

tag

tag

bia łego 2 adj:sg:gen:m1naj biels zego 2 adjsup:sg:gen:m1

mag a sg:gen sg:gen:m1mag a sg:gen sg:acc:m1sąg a sg:gen sg:gen:m3czyta ł o 8 praet:sg:n1:terczyta ł y 8 praet:pl:f:ter

nie czyta n y 10 ppas:sg:nom:m1:neg

Page 28: Publikacja przygotowana w latach 2003–2006 w …nlp.ipipan.waw.pl/NLP-SEMINAR/071105.pdfSGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Publikacja przygotowana

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

Podsumowanie

• Przedstawiony model obejmuje wszystkie zjawiskafleksyjne uwzględnione w SGJP.

• Formy odmiany leksmu dowolnej klasy generuje się w tensam sposób.

• Sposób prezentacji paradygmatów w programie możnacałkowicie zmienić manipulując tylko instancjamiencji Form.