View
11
Download
0
Category
Preview:
Citation preview
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Teori møter praksis –konstruksjonsgrammatikk, LFG og korpusarbeid
Hanne Eckhoff Dag Haug
Seminar i kognitiv grammatikk
3. desember
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 1 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PROIEL-prosjektet
Undersøker informasjonsstrukturering i gresk, gotisk, latin, armenskog kirkeslavisk
OrdstillingAnaforerDefinitthetPartisipper(Diskurspartikler)
Bruker Nytestamentet (gresk) og oversettelsene av det somdatagrunnlag
Ideen er a bruke paralltekstene til komparativ analyse
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 2 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Korpusbygging i praksis
For et lite korpus er det essensielt a ha en rik annotasjon
Annotasjonen ma være forstaelig for en datamaskin
Dette innebærer i praksis aristoteliske kategorier
Datamaskinen tvinger oss til a være presise, men vi vil ogsa værenyanserte
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 3 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Utvikling av formalismer
Vi annoterer pa mange nivaer
MorfologiSyntaksInformasjonsstrukturSemantikk (animathet, verbalklasser, preposisjonsbetydninger)
Mange formalismer ma utvikles, fra enkle kategoriseringer(animathet) til de mer komplekse (setningers syntaktiske struktur)
I det følgende skal vi se litt pa flere av disse formalismene, men medvekt pa syntaksen, som er forenklet versjon av leksikalsk-funksjonellgrammatikk
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 4 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Hvordan vil du representeresyntaks slik at en datamaskinkan forsta det og la deg søke iden?
Korpusarbeid konfrontererlingvistene med stadigekategoriseringsproblemer
Men det gir ogsa et meravslappet forhold tilformalismer
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 5 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Mentalisme?
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 6 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Formalismen og dens interpretasjon
Formalismer er uansett ikke i seg selv psykologiske hypoteser - de errepresentasjoner
Nar vi ikke tenker pa det, kan vi bli for glade i formalismene vare,enten de er binære trær, semantiske nettverk eller et formallogisksprak
For en korpuslingvist blir spørsmalet først og fremst hvor godtformalismen makter a representere nyanser i dataene pa en presis mate
Vi kan bruke (empirisk motiverte) ‘tomme’ elementer irepresentasjonene uten at det er en psykolingvistisk pastand
En god formalisme er en som lar oss formulere robustegeneraliseringer over dataene vare
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 7 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Infostrukturformalismen
Forskjellige kunnskapskontekster, en tagg for hver, avhengig av hvormottaker kan ‘finne’ diskursreferenten
Diskurs (anafor) → OLDSituasjon (deixis) → ACC-sitScenarier (inferenser) → ACC-infEncyklopedisk kunnskap → ACC-gen(Ingen contekst → NEW)
Anaforiske lenker
Nullanaforer Juleevangeliet
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 8 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Interpretasjon
Selv om informasjonsstruktur apenbart handler om kognitivetilstander hos sprakbrukere, ville ingen si at vi ‘har’ et sa enkeltkategoriseringsskjema i hodet
Utgangspunktet er a forsøke a klassifisere data pa en mate som laross finne generaliseringer og mønstre i dataene
Nullanaforer settes inn hver gang det er rimelig a anta at referentenreaktiveres
Maks. lengde pa anaforiske lenker er (tentativt) satt til 13 setninger
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 9 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PROIEL-syntaks 1
I utgangspunktet er formalismen var en dependensgrammatikk;frasestruktur er ikke representert, og ordstilling kodes i et separat niva
Setningens struktur modelleres som avhengigheter mellom ordHvert ord untatt setningsrota er avhengig av nøyaktig ett ordAvhengighetene merkes med tradisjonelle grammatiske funksjoner som‘subjekt’, ‘objekt’
En enkel setning ser slik ut: Jesus sa
Utelatte argumenter er ikke med: ... sa
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 10 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PROIEL-syntaks 2
Dependenssyntaks kan ikke handtere mer komplekse fenomener som
Løfting og kontroll hvor ett element har flere roller setningenVerb-ellipse og ‘gapping’
For a hanskes med dette innfører vi strukturdeling som i LFG, samtbruk av tomme noder
Løfting/kontroll Gapping
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 11 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PROIEL og LFG
Dependensgrafer og LFGs f-strukturer ser ganske ulike ut
LFGs f-strukturer er (nøstede) attributt–verdi-matriser (AVMer)[pred ‘Hanne’num sg
] pred ‘gjespe ⟨subj⟩’tense pressubj ?
pred ‘gjespe ⟨subj⟩’tense pres
subj
[pred ‘Hanne’num sg
]
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 12 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Sammenhengen
root
amat
puellam
pulchram
adj
obj
pred
Hver node ‘oversettes’ til enAVM med morfologiske trekkog en semantisk formpred ‘vakker’
case accgend fem
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 13 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Sammenhengen
root
amat
puellam
pulchram
adj
obj
pred
Relasjonene oversettes tilattributter med dependentensAVM som verdiadj
pred ‘vakker’case accgend fem
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 14 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Sammenhengen
root
amat
puellam
pulchram
adj
obj
pred
Dette gjøres for alle nodene istrukturenpred ‘jente’
case accgend fem
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 15 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Sammenhengen
root
amat
puellam
pulchram
adj
obj
pred
AVMene til hode og dependentunifiseres
pred ‘jente’case accgend fem
adj
pred ‘vakker’case accgend fem
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 16 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Sammenhengen
root
amat
puellam
pulchram
adj
obj
pred
Prosessen terminerer medhovedverbet[
pred ’elske 〈 subj, obj 〉’]
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 17 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Sammenhengen
root
amat
puellam
pulchram
adj
obj
pred
pred ‘elske 〈subj, obj〉’
obj
pred ‘jente’case accgend fem
adj
pred ‘vakker’case accgend fem
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 18 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Kasus og verbkongruens i LFGdaupja pred daupjan ‘døpe ⟨subj, obj⟩’
subj pers 1subj num sg
ik pred ‘pro’pers 1num sgsubj
izwis pred ‘pro’pers 2num plobj
Tabell: Ik daupja izwis ’Jeg døper dere’ i forenkla (pil-løs) LFG
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 19 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Subkategorisering i LFG
Semantisk form
pred daupjan ‘døpe ⟨subj, obj⟩’
Det blir mange slike: ‘fortære⟨subj, obj⟩’, ‘forkaste ⟨subj, obj⟩’, . . .
Vi kan generalisere over det felles elementet med en templat
Templater
@transitive(p): (↑pred) = ‘p⟨subj, obj⟩’@intransitive(p): (↑pred) = ‘p⟨subj⟩’@opt-transitive(p): @transitive(p) |@intransitive(p)
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 20 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Templater og betydning
Templaten @transitive-ag-pat(p)
@transitive(p)λR.λx .λy .∃e.R(e) ∧ agent(e) = x ∧ theme(e) = y :(↑σev)( ((↑subj)σ ( (↑obj)σ (↑σ)
Vi kan utstyre templatene med betydning ogsa
Her har vi en transitiv-templat som introduserer de semantiske rolleneagens og tema
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 21 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
LFGs kobeskrivelse
LFG beskriver flere nivaersamtidig
Nivaene er relatert men ikkederivert fra hverandre
Vi kan ha constraints pa flerenivaer
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 22 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Templater og LFGs arkitektur
‘prodrop’ kan representeres som en valgfri constraint som kommermed alle greske verb (unntatt de upersonlige)
En templat som bare sier dette vil være en rein forkortelse (pa noen fabokstaver): @propdop = (↑subj pred = ‘pro’)
Men vi kunne ogsa legge informasjonsstrukturelle constraints inn itemplaten, la oss si at antecedenten skal være topic i sin setning(galt, forresten) e.l.
Templater er i utgangspunktet ikke noe annet ennforkortelser/generaliseringer over constraints, men nar de kombinererbeskrivelser pa flere forskjellige nivaer minner de om konstruksjoner iCxG
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 23 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Svensk ‘Directed motion construction’ (Asudeh,Dalrymple, Toivonen 2008)
En konstruksjon signalisert av frasestruktur
Jonas knuffade sig in i mangden
V’ → (V) NP PP↑= ↓ (↑obj) = ↓ (↑obl) = ↓
(↓prontype) = simplex-reflexive@swedish-dmc((↑pred fn))
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 24 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Konstruksjonshierarki (Asudeh, Dalrymple, Toivonen 2008)
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 25 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
CxG og LFG
‘Alle’ er enige om at det er mye felles
Formalismene er kompatible og basert pa unifikasjon og constraints
Men noen grunnleggende holdninger er forskjellige
Bresnan 2009
The architecture of LFG was also heavily influenced by psycholinguisticprocessing findings, but in a way diametrically opposed to the Hawkins-Kempson version of the program. It was Kaplan’s insight that LFG shouldabstract away from procedural computational operations; . . .
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 26 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Fillmore-CxG
CxG er ikke-modulær og tegnbasert, den antar konstruksjonen somgrunnleggende analyse- og representasjonsenhet
Enheter pa alle kompleksitetsnivaer er form–betydning-par
CxG begrunner dette valget med sprakprosesseringsforskning, somviser at vi prosesserer i blokker større enn ord
CxG søker maksimale generaliseringer og representerer ikkeinformasjon redundant
Alle forbindelser mellom lingvistiske enheter ma formaliseres
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 27 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Bruksbasert CxG (RCxG, CCxG)
Setter psykologisk realisme og motivering høyere enn maksimalgeneralisering og prediksjon
Bruksbasert: ‘even fully regular patterns may be stored if suchpatterns occur with sufficient frequency’ (2006:215) (men betyr detteredundant representasjon?)
Nedenfra og opp: generaliseringene gar ikke høyere enn det somregnes som psykologisk plausibelt
Forkaster (universelle, primitive) syntaktiske relasjoner og ordklasser
Motivering vs. prediksjon, Goldberg: ‘While motivation is distinctfrom prediction insofar as a motivated construction could have beenotherwise, it typically could not have had the opposite values of theproperties claimed to provide motivation.’ (2006:219)
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 28 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Bruksbasert CxG for en praktisk orientert korpuslingvist
Croft 2001 forkaster ordklasser som spraklige enheter fordi han menerde er darlige og eklektiske generaliseringer
Ordklasser er veldig praktiske verktøy. Kun ordklasser basert pamorfologiske konstruksjoner?
Verb, substantiver, adjektiver . . . og en stor og uoversiktlig klasseubøyelige?
Syntaktiske relasjoner/dependenser? Croft vil bruke kun roller ikonstruksjoner (donor, gift, recipient; TrSub, TrObj . . . ), ikkedependenser mellom enkelte syntaktiske elementer
Annotering med mer eller mindre skjematiske syntaktiske roller? (Ihvilken grad vil vi postulere konstruksjoner pa forhand?)
Konstruksjonsgrenser?
Ville dette være nok til a finne de interessante konstruksjonene?
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 29 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Eliderte verb
Som sagt representerer vi ‘gapping’ med en tom node: Gap
Den tomme noden lar oss bevare den semantiske strukturenKonjunksjonen far de rette konjunkteneHva slags alternative representasjoner kan vi tenke oss?
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 30 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Gapping i LFG
pred ‘own ⟨subj, obj⟩’
subj
[pred ‘fox’num pl
]
obj
[pred ‘hole’num pl
]
,
pred ‘own ⟨subj, obj⟩’
subj
[pred ‘bird’num pl
]
obj
[pred ‘nest’num pl
]
conjunction form = and
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 31 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PDT
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 32 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PDT 2
Dette er en notasjonell ekvivalent av var annotasjon
Argumentene for var notasjon er først og fremst praktiske:
Mer eksplisittIngen analyse av merkelappeneEnklere søk
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 33 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Croft-representasjon
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 34 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Eller kanskje sann?
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 35 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Croft-representasjon 2
Croft bruker bade tomme elementer og predikatidentitet
Men han framstiller mindre av strukturen
Skisseprega og lite implementerbart
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 36 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Programmatisk skisseprega? – Crofts argumenter motformalisering (2001:4)
Thus, the reader will not find a formal vocabulary for representingsyntactic structure in this book, because such a vocabulary would belanguage-specific. [Hvorfor det? Skal vi ikke beskrive sprak pa en mestmulig sammenliknbar mate?]
In this sense, Radical Construction Grammar is the syntactic theory toend all syntactic theories. [Men han sa jo det var greit a formalisere!]
There is no longer any need to learn an entire complex technicallanguage in order to describe a complex human language. [Hm? Maman lage det selv?]
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 37 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Goldbergs argumenter mot formalisering av CxG
Skepsis mot trekkbasert semantikk: kan ikke fange detaljerteleksikalsk-semantiske egenskaper
Men Fillmore-CxG bruker ikke trekk i særlig grad, derimot semantiskerammer med roller
Overfokus pa syntaktiske elementer, siden det primært er de som garigjen og siden det først og fremst er de som er relevante forunifikasjonen
Et fast sett trekk/verktøy selv for formsida av konstruksjonen er istrid med Crofts posisjon om at grammatiske kategorier og roller ikkeer generelle pa tvers av konstruksjoner men bare definert pr.konstruksjon
‘To linguists unfamiliar with the formalism, unfication can appeardauntingly opaque and cumbersome’
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 38 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Formalisme og mentalisme igjen
Goldberg (2006:214–215)
Patterns or expressions that are predictable from other generalizations areassumed [by Fillmore-style CxGrammarians] not to be part of a speaker’sknowledge of language.
Men er dette sant?
Goldberg tar for gitt at den formelle representasjonen er en hypoteseom sprakbrukerens indre grammatikk
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 39 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Formalisme og mentalisme igjen
Fried/Ostman (2004:24)
CxG is generative in the traditional, Chomskyan (1957) sense of the word:it, too, aims to account for all of the grammatical sentences of the languageand only those, and to be precise and explicit, which requires some measureof formalization. Capturing generalizations in the most econonomical waypossible, as oposed to mere listings of phenomena and facts, is thus valuedin Construction Grammar.
Fokus er pa a beskrive mulige setninger i et sprak, noe som er logisknoe annet enn a representere sprakbrukernes kunnskap oom spraket
Det er en nødvendig, om ikke tilstrekkelig betingelse for enpsykologisk plausibel grammatikk
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 40 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Konstruksjoner
Korpuset inneholder mange lag med informasjon:
Morfologi Tomme noder-kalas
SyntaksInformasjonsstruktur Infostruktur
Frie tagger (animathet, verbalklasser, preposisjonssemantikk osv.)
Den rike, strukturerte annotasjonen var gjør det lett a studerekonstruksjoner i korpuset
Ting som ‘mangler’ i ett niva kan suppleres fra et annet
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 41 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
For fa tomme noder?
Vi har (ukontroversielt?) tomme nominale noder iinformasjonsstrukturen Info
Men vi skulle ønske vi hadde tomme nominale noder i syntaksen ogsaSyntaks
Vi har strittet i mot, og na er det for seint. . . Deep shit
Dermed far vi mer kompliserte søk, og det er ting vi ikke kan finne
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 42 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Konstruksjoner med ‘ekstra’ argumenter
I noen konstruksjoner forekommer det argumenter(?) som tydelig ikkefar noen rolle fra verbet
‘Han tok henne i handa’
Nar vi regner ‘henne’ som et OBJ her, er det fordi vi regner med etkonstruksjonsskjema som lisensierer det
Konstruksjonen forteller oss ogsa at ‘henne’ er possessor for ‘handa’
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 43 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Nar formalismen ikke strekker helt til
Sakalt ‘external possession’: inneholder et element som bade ser ut tila være et argument for verbet/en rolle i konstruksjonen, men somsamtidig ma fortolkes som possessor for en kroppsdel e.l.
Vi har endt opp med forskjellige analyser i forskjellige sprak
I kirkeslavisk tar vi alle slike dativer som adnominale fordi det ogsafinnes en adnominal dativkonstruksjon (lettest a finne)
I de andre sprakene tar vi slike dativer som oblike argumenter tilverbet
Dette kunne vært løst med en sekundær dependens
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 44 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Gries’ og Stefanowitsch’ kollostruksjoner
The co-occurrence of words is investigated from a purely linearperspective on language that deliberately disregards syntacticstructure (2004:100)
The deliberate disregard of syntactic structure limits the usefulness ofthe method for fine-grained syntactic description (2004:100)
Obviously, defining what counts as an instance of construction C mayinvolve decisions on the part of the researcher that have to bejustified on theoretical grounds (2003:218).
Med andre ord ma en teoretisk definisjon komme forut for analysen avkorpusdata, ogsa i bruksbasert CxG
Det er umulig a telle noe du ikke har definert!
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 45 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Rammer
Vi kombinerte morfologi og syntaks for a ta utargumentstrukturkonstruksjoner
Igjen ville vi trengt tomme subjekter, i stedet ignorerer vi upersonligeverb
Vi har slitt mye med dativer: er de argumenter eller ikke?
La oss se pa rammer med dativelementer (OBL eller ADV), med oguten OBJ
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 46 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
SVObl vs. SVAdv
SVObl frequency SVAdv frequencylego ‘si’ 494 (1672) psallo ‘lovsynge’ 2(2)akoloutheo ‘følge’ 32 (74) ekmasso ‘tørke’ 2(3)didomi (p.) ‘gi’ 28 (57) erkhomai ‘komme’ 6 (163)hupakouo ‘adlyde’ 9 (15) eremoo (p.) ‘legge øde’ 2 (4)apokrinomai ‘svare’ 23 (110) laleo ‘snakke’ 5 (155)femi ‘si’ 16 (60) proseukhomai ‘be’ 3 (40)diakoneo ‘tjene’ 8 (15)aphiemi (p.) ‘tilgi’ 9 (29)homoioo (p.) ‘sammenlikne’ 5 (8)sugkhairo ‘glede seg med’ 4 (5)
Resten av verbene i SVAdv-ramma har frekvens pa 1 (1).
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 47 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
SVOObl vs SVOAdv
SVOObl frequency SVOAdv frequencydidomi ‘gi’ 66 (238) katakaio ‘brenne ned’ 3 (4)deiknumi ‘vise’ 11 (21) timao ‘ære’ 3 (16)gnorizo ‘gjøre kjent’ 7 (15) enduo ‘kle’ 2 (12)paradidomi ‘overgi’ 11 (61) baptizo ‘døpe’ 2 (17)ekdidomi ‘leie ut’ 4 (4) esthio ‘spise’ 3 (87)homoioo ‘sammenlikne med’ 4 (5)epitithemi ‘sette’ 6 (21)apodidomi ‘gi fra seg, betale’ 6 (31)epiballo ‘ta pa, legge pa’ 4 (13)poieo ‘gjøre’ 17 (353)
Resten av verbene i SVOAdv-ramma har frekvens pa 1 (1).
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 48 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Hva ser vi?
Klare verbklasser med sterk assosiasjon med verbramma iOBL-konstruksjonene
Klart aktiv–passiv-mønster mellom SVOObl og SVObl
Spredte verb som er svakt assosiert med verbramma iADV-konstruksjonene
Mange instrumenter i ADV-konstruksjonene
Burde noen av ADV-ene vært OBL-er? Ingen opplagte kandidater her,men statistikken lar oss kontrollere annotasjonen
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 49 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Rammer med preposisjoner
SVL(pros ‘til’) frekvens A(en ‘i’)SVO frekvenslego ‘si’ 77 (1672) ekho ‘ha’ 20 (361)erkhomai (m) ‘ga’ 19 (163) poieo ‘gjøre’ 19 (353)erkhomai ‘ga’ 11 (237) ekballo ‘kaste ut’ 7 (53)poreuomai (m) ‘reise’ 4 (56) aspazomai (m) ‘hilse’ 4 (22)femi ‘si’ 4 (60) baptizo ‘døpe’ 3 (17)upago ‘dra’ 4 (69) eurisko ‘finne’ 5 (110)
Klarere semantisk gruppe av verb som tar preposisjonen somargument
Verbene som assosieres sterkt med et adverbial har typisk ‘lite’semantikk og beskriver typiske hendelser som ‘ha’, ‘gjøre’, ‘kaste ut(demoner)’ . . .
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 50 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Artikkelkonstruksjoner
I NT-gresk forekommer det bestemte artikler bade pa egennavn ogfellesnavn (ho Iesous vs. ho anthropos)
Betingelsene for bruk av artikler er forskjellige for egennavn ogfellesnavn
Ved fellesnavn har vi ‘vanlig bestemthet’, artikkel nar ordet antas avære identifiserbart for mottaker
Egennavn har alltid unik og spesifikk referanse, og litteraturen er ivillrede om nar artikkelen egentlig brukes
Vi har to konstruksjoner: [art personnavn] og [art fellesnavn(hum)]
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 51 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Hvordan filtrere ut et datasett?
Ordklasse (lemmaniva): egennavn eller fellesnavn?
Animathet (semantisk annotering): kun mennesker
Syntaks: Har hodet artikkeldependent eller ei? Luke ut visseposisjoner der tidligere forskning viser at artikkelen har utypiskdistribusjon (predikativer, koordinasjoner)
Morfologi: Artikkelen ma kongruere med hodet
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 52 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Tre posisjoner fra litteraturen om artikkelbruk vedpersonnavn
Valgfri og tilfeldig
En form for topicmarkering, artikkelbruken markerer kanskjetopicskifter
Anaforisk: artikkelbruken har a gjøre med om og hvor mye referentener nevnt fra før i diskursen
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 53 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Men hva er et topic?
‘Aboutness topics’: hva handler setningen om?
Ikke uproblematisk a identifisere, og i hvert fall ikke i en 2000 argammel tekst pa et dødt sprak
Vi lagde en topicgjetter som kombinerte informasjon fra mange lag:informasjonsstatus, animathet, saliens (beregnet pa basis av deanaforiske lenkene), syntaktisk relasjon, ordstilling, egenskaper vedantecedenten
Virker omtrent like bra/darlig som et menneske, men er i alle fallkonsistent. . .
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 54 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Markerer artikkelkonstruksjonen topikalitet?
Artikkelkonstruksjonen har ikke noen klar topicmarkeringsfunksjon:Lukas unngar artikler pa topics, mens Markus har litt økt sjanse for aha artikkel om personnavnet er topic
Artikkelkonstruksjonen markerer heller ikke topicskifter
Vi finner artikkelkonstruksjonen hyppigere om det er et annet topicmellom egennavnet og antecedentenMen egennavnet trenger ikke selv a være topic (13 av 24 er ikke dethos Markus, 9 av 11 er ikke det hos Lukas)!
Konstruksjonen klargjør hvordan anaforen skal oppløses snarere enn areintrodusere et topic
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 55 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Artikkelkonstruksjonen ser bade framover og bakover
artikkel def. navn indef. navn fellesnavn pron. prodrop ingennei 5 5 1 12 3 68ja 15 3 2 15 13 21
Tabell: Neste referent etter type
Navn med artikler har mye større sjanse til a bli plukket opp enn navnuten artikkel
Navn med artikler blir ganske ofte plukket opp med navn med artikler
Om du bruker artikkelkonstruksjonen, er det god sjanse for at du hartenkt a fortsette a snakke om personen
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 56 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Kan vi male dette?
Vi kan kombinere anaforiske lenker med informasjon om tekststruktur
Om vi ser hvor ofte en person er nevnt i en perikope, relativt til antallord i perikopen, far vi et mal pa hvor viktig personen er i episoden
Vi far et mal som ser bade bakover og forover
Vi far vist at artikkelkonstruksjonen brukes nar man snakker om noenman planlegger a si mer om
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 57 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Saliens
●
●●
●
●
●●
●●
●●
Without article With article
0.00
0.02
0.04
0.06
0.08
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 58 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Felles for LFG og CxG
Empirisk holdning: Vi skal representere det som finnes i data
Overflatenære representasjoner (tildels svært like i LFG ogFillmore-CxG)
Konstruksjonsskjemaer kan inkorporeres i LFG
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 59 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Syntaktisk teori som korpuslingvistisk verktøy
Ma ha en notasjon som en datamaskin kan forsta
Vegg-til-vegg-annotasjon tvinger deg til a gjøre alt eksplisitt
Alle syntaktiske teorier ma ha en notasjon!
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 60 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
PROIEL-korpuset som utgangspunkt forkonstruksjonsstudier
Informasjon fra mange lag: ikke bare syntaks, men lemma, morfologi,ordstilling, semantikk, informasjonsstruktur
Mulighet til a lage presist utvalgte datasett med veldig lite støy
Frie tagger: Enkeltforskere kan a legge inn egne kategoriseringer palemma- eller tokenniva
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 61 / 62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon
Presentasjonen blir lagt ut pahttp://www.hf.uio.no/ifikk/proiel/
Korpuset er tilgjengelig for allehttp://foni.uio.no:3000
Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 62 / 62
Recommended