Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
INF1820: Ordklasser
Arne Skjærholt
13. februar
INF1820: Ordklasser
Arne Skjærholt
13. februar
2014
-02-
13INF1820: Ordklasser
Ordklasser
Ordklasser20
14-0
2-13
INF1820: OrdklasserOrdklasser
Ordklassene er bindeleddet mellom ordet (det morfologiske nivaet)og syntaksen (setningsstrukturen). Det kan bestemme hva slagskontekst et ord forekommer i, og av og til ogsa uttale: en. record,content, discount.
Ordklassene er ikke universelle! Noen sprak har for eksempel ikkeadjektiver (de bruker verb i stedet, mer om det etter hvert), og andrespra har ordklasser vi ikke har. Kinesisk og japansk bruker foreksempel telleord sammen med substantiver som telles.
Ordklassetagging er en helt sentral oppgave i de flestedatalingvistiske applikasjoner: TTS, shunking, parsing. . .
Substantiv
Verb
Adjektiv
Adverb
Substantiv
Verb
Adjektiv
Adverb
2014
-02-
13INF1820: Ordklasser
Ordklasser
Ordklassene er en taksonomi. Det vil si at det er en fullstendig,gjensidig utelukkende klassifikasjon av ord.
Alle ord havner i en og bare en klasse.
Vi trenger en form for kriterier for a bestemme ordklassene. Vi brukertre kriterier for a bestemme ordklasser: formelle, funksjonelle, ogbetydningsmessige kriterier.
Formelle
Formelle20
14-0
2-13
INF1820: OrdklasserOrdklasser
Annet navn: morfologiske kriterier. Hvilke bøyningsformer harordene i klassen?
Funksjonelle
Funksjonelle20
14-0
2-13
INF1820: OrdklasserOrdklasser
Annet navn: syntaktiske kriterier. Hvordan kan ordene i klassenkombineres med andre ordklasser?
Betydningsmessige
Betydningsmessige20
14-0
2-13
INF1820: OrdklasserOrdklasser
Annet navn: semantiske kriterier. Hva er typiske betydninger hos ordi klassen?
I rød, røde, rødt, rødere, rødestI en rød bil, huset er rødtI Egenskap
de røde tapte borgerkrigen
I rød, røde, rødt, rødere, rødestI en rød bil, huset er rødtI Egenskap
de røde tapte borgerkrigen
2014
-02-
13INF1820: Ordklasser
Ordklasser
Vi forholder ogsa til den prototypiske (dvs. normale) bruken avordet. Jamfør hare.
I rød, røde, rødt, rødere, rødestI en rød bil, huset er rødtI Egenskap
de røde tapte borgerkrigen
I rød, røde, rødt, rødere, rødestI en rød bil, huset er rødtI Egenskap
de røde tapte borgerkrigen
2014
-02-
13INF1820: Ordklasser
Ordklasser
Vi forholder ogsa til den prototypiske (dvs. normale) bruken avordet. Jamfør hare.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
2014
-02-
13INF1820: Ordklasser
Ordklasser
Spørrerunde.
1. Substantiv
2. Verb
3. Adjektiv
4. Adverb
5. Preposisjon
6. Pronomen
7. Determinativ
8. Konjunksjon
9. Subjunksjon
10. Interjeksjon
1. Substantiv
2. Verb
3. Adjektiv
4. Adverb
5. Preposisjon
6. Pronomen
7. Determinativ
8. Konjunksjon
9. Subjunksjon
10. Interjeksjon
2014
-02-
13INF1820: Ordklasser
Ordklasser
Spørrerunde.
Substantiv
Substantiv20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Bøyes i bestemthet og tall. Bestemthet merkes enten bøyning ellerbestemmer (eller begge deler [det store huset], i motsetning til svensk[stora huset] og dansk [det store hus]), entall er umerket og flertallmarkeres med endelse (for det meste). Norske substantiver har ogsakjønn, men bøyes ikke i det. Det er en fast egenskap ved substantivet.
Substantivet er kjerne i substantivfrasen, med modifikatorer: enaldeles fantastisk vakker stol
De betegner ting (i en litt utvidet forstand): mennesker, dyr, objekter,fenomener, og ideer.
Fellesnavn
Fellesnavn20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Fellesnavn er de “vanlige” substantivene. De er enten konkrete ellerabstrakte. Konkrete er ting som finnes ute i verden, mens abstrakterer begreper eller ideer.
Men det er selvfølgelig uklare tilfeller: en mørkharet skjønnhet/dø iskjønnhet; spenstig som en ungdom/i min ungdom. . .
Egennavn
Egennavn20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Egennavnene (Per, Kari. . . ) er litt annerledes. De har vanligvis ikkebøyning (pa norsk!), men har ellers semantisk og syntaktisk mye tilfelles med fellesnavnene. Her ser vi at selv om de ikke er nøyaktiglike, særlig m.t.p. det morfologiske, men ogsa syntaktisk, sier vi at deer i samme ordklasse.
Tellbarhet
Tellbarhet20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
De fleste substantiver er tellbare, men noen er ikke-tellbare ellermassebetegnende. Ord som kjøtt, smør, støv
Igjen, noen ord kan brukes pa begge mater: Jeg liker øl/det star to øl ikjøleskapet; et vakkert tre/bordet er av tre.
Her finner vi ogsa en bruk som kan minne om de østasiatisketelleordene: tre flasker øl. Vi setter inn et nytt ord for a gjøre noeutellbart tellbart.
Andre sprak kan ha andre kategorier i substantivet. Ganske vanlig erkasus og animathet (levende/ikke-levende, brukes til en viss grad islaviske sprak som russisk og tsjekkisk).
Verb
Verb20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Bøyes (pa norsk) i tid, delt inn i finitte vs. infinitte former.
Kan sta alene som predikat. Kan klassifiseres etter transitivitet: Hvormange argumenter tar verbet?
Betegner handlinger, aktiviteter, tilstander.
Merk: Dette gjelder kun hovedverb. Hjelpeverb oppfører segannerledes.
I andre sprak er det vanlig med mer bøyning: person, aspekt, modusfor eksempel.
Aktivitetsverb
Aktivitetsverb20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Uttrykker en aktiv handling, og forutsetter en agens, men vi regnerogsa verb uten eksplisitt agens, som blase, regne, ulme, til denneklassen.
Overgangsverb
Overgangsverb20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Uttrykker at det skjer noe med subjektet (som er patiens). Typiskeeksempler er dø, forsvinne, sovne, vokse.
Tilstandsverb
Tilstandsverb20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
En begrenset klasse pa norsk, men vanlig pa andre sprak. Norskeeksempler: eie, bli, leve, ligge.
Denne typen verb kan ofte brukes i stedet for adjektiver, i sprak somikke har det. Vi har da egne ord for “a være rød” og lignende.
Adjektiv
Adjektiv20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Samsvarsbøyes i bestemthet, kjønn og tall, kan gradbøyes.
Modifikator til substantiv.
Betegner egenskaper.
Det typiske adjektivet angir en permanent egenskap (liten, stor, bred,lang, smal), men noen er ogsa mer kortvarige (sint, trøtt, gammel,ung, ren, skitten).
Gradbøyingen angir punkt pa en skala, men noen ord er vanskelige agradbøye: død, gift, gratis, lovlig, nybakt.
Antonymer
Antonymer20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Noen av de sentrale adjektivene kommer i par med motsattbetydning: liten og stor, høy og liten, lang og kort.
Adverb
Adverb20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Noen kan gradbøyes (mest de som er avledet fra adjektiver), men defleste er ubøyelige.
Modifiserer verb, adjektiv, adverb og hele setninger.
Angir omstendigheter: rom, tid, mate. . .
Preposisjoner
Preposisjoner20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Bøyes ikke.
Kjerne i preposisjonsfrasen, tar substantiv.
Betegner relasjoner.
Sammen med verb finner vi av og til preposisjoner uten utfylling:bryte sammen, sovne inn, drikke opp. Dette kalles forverbalpartikkel. Partikkelen danner en semantisk og syntaktisk enhetmed verbet, men kan være vanskelig a skille fra en PP som selekteresav verbet.
Noen sprak har postposisjoner i stedet for preposisjoner (gjerne desom har SOV i stedet for SVO), og noen (f.eks. sanskrit) har faktiskbegge deler.
Pronomen
Pronomen20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Stor variasjon i form og bøyning, sa vanskelig a klassifiseremorfologisk utifra endelser, men følger antesedenten i kjønn og tall.
Som substantiv.
Ikke eget innhold, men star for noe annet i konteksten.
Mange typer: personlig (jeg, du. . . ), refleksivt (seg), resiprokti(hverandre), spørrende (interrogativer; hvem, hva).
Antesedenten
Antesedenten20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Det som pronomenet faktisk betyr. Bestemmes utifra konteksten, kanvære veldig tvetydig, og er vanskelig a avgjøre automatisk.
Determinativ
Determinativ20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Eller bestemmer pa norsk. Bøyes i kjønn og tall.
Bestemmer til substantiv.
Spesifiserer substantivets referanse.
3 hovedtyper: possessiver (min bok, boka di), demonstrativer (denbilen, dette treet), kvantorer (noen, ingen, en, alle tallordene, visseenkelte), forsterkere (egen).
Konjunksjon
Konjunksjon20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Bøyes ikke.
Binder sammen to like ting til a lage en ting av samme type.
Grammatisk funksjon.
Subjunksjon
Subjunksjon20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
Bøyes ikke.
Innleder leddsetninger (som inkluderer infinitivssetninger, a er ensubjunksjon!): underordner en setning under en annen.
Grammatisk funksjon.
Interjeksjon
Interjeksjon20
14-0
2-13
INF1820: OrdklasserOrdklassene pa norsk
InnholdsordFunksjonsord
InnholdsordFunksjonsord
2014
-02-
13INF1820: Ordklasser
Ordklassene pa norsk
Innholdsord er de som refererer utenfor spraket, mensfunksjonsordene refererer ikke utenfor spraket. Dette skillet svarerstort sett til skillet mellom apne og lukkede ordklasser, men er ikkehelt en til en. For eksempel er hjelpeverb funksjonsord.
Lam og piggvar pa bryllupsmenyen
Lam og piggvar pa bryllupsmenyen
2014
-02-
13INF1820: Ordklasser
Ordklassetagging
To mater a gjøre tagging pa. Regelbaserte metoder, der ordenetilordnes alle mulige tagger (f.eks. med en FST-basert metode) og safjernes alternativer som er umulige. OBT virker sann.
Det andre alternativet er statistiske modeller som direkte finner denmest sannsynlige taggsekvensen for en ordsekvens. Det skal vi se pade neste to ukene.
Lam/subst og/konj piggvar/subst pa/prepbryllupsmenyen/subst
Lam/subst og/konj piggvar/subst pa/prepbryllupsmenyen/subst
2014
-02-
13INF1820: Ordklasser
Ordklassetagging
To mater a gjøre tagging pa. Regelbaserte metoder, der ordenetilordnes alle mulige tagger (f.eks. med en FST-basert metode) og safjernes alternativer som er umulige. OBT virker sann.
Det andre alternativet er statistiske modeller som direkte finner denmest sannsynlige taggsekvensen for en ordsekvens. Det skal vi se pade neste to ukene.
Ordklassetagging
Ordklassetagging20
14-0
2-13
INF1820: OrdklasserOrdklassetagging
Oppgaven er a automatisk tilordne riktig ordklasse tagg til alleordene i en setning. Stort sett er ord entydige, men hvis du velger entilfeldig engelsk ordform er 11.5% tvetydige, men i løpende tekst er40% av ordene du ser tvetydige.