62
Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon Teori møter praksis – konstruksjonsgrammatikk, LFG og korpusarbeid Hanne Eckhoff Dag Haug Seminar i kognitiv grammatikk 3. desember Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 1 / 62

Teori m[PleaseinsertPrerenderUnicode{ø}intopreamble]ter ... · Kasus og verbkongruens i LFG daupja pred daupjan ‘d˝pe 〈subj, obj〉’ subj pers 1 subj num sg ik pred ‘pro’

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Teori møter praksis –konstruksjonsgrammatikk, LFG og korpusarbeid

Hanne Eckhoff Dag Haug

Seminar i kognitiv grammatikk

3. desember

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 1 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PROIEL-prosjektet

Undersøker informasjonsstrukturering i gresk, gotisk, latin, armenskog kirkeslavisk

OrdstillingAnaforerDefinitthetPartisipper(Diskurspartikler)

Bruker Nytestamentet (gresk) og oversettelsene av det somdatagrunnlag

Ideen er a bruke paralltekstene til komparativ analyse

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 2 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Korpusbygging i praksis

For et lite korpus er det essensielt a ha en rik annotasjon

Annotasjonen ma være forstaelig for en datamaskin

Dette innebærer i praksis aristoteliske kategorier

Datamaskinen tvinger oss til a være presise, men vi vil ogsa værenyanserte

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 3 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Utvikling av formalismer

Vi annoterer pa mange nivaer

MorfologiSyntaksInformasjonsstrukturSemantikk (animathet, verbalklasser, preposisjonsbetydninger)

Mange formalismer ma utvikles, fra enkle kategoriseringer(animathet) til de mer komplekse (setningers syntaktiske struktur)

I det følgende skal vi se litt pa flere av disse formalismene, men medvekt pa syntaksen, som er forenklet versjon av leksikalsk-funksjonellgrammatikk

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 4 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Hvordan vil du representeresyntaks slik at en datamaskinkan forsta det og la deg søke iden?

Korpusarbeid konfrontererlingvistene med stadigekategoriseringsproblemer

Men det gir ogsa et meravslappet forhold tilformalismer

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 5 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Mentalisme?

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 6 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Formalismen og dens interpretasjon

Formalismer er uansett ikke i seg selv psykologiske hypoteser - de errepresentasjoner

Nar vi ikke tenker pa det, kan vi bli for glade i formalismene vare,enten de er binære trær, semantiske nettverk eller et formallogisksprak

For en korpuslingvist blir spørsmalet først og fremst hvor godtformalismen makter a representere nyanser i dataene pa en presis mate

Vi kan bruke (empirisk motiverte) ‘tomme’ elementer irepresentasjonene uten at det er en psykolingvistisk pastand

En god formalisme er en som lar oss formulere robustegeneraliseringer over dataene vare

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 7 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Infostrukturformalismen

Forskjellige kunnskapskontekster, en tagg for hver, avhengig av hvormottaker kan ‘finne’ diskursreferenten

Diskurs (anafor) → OLDSituasjon (deixis) → ACC-sitScenarier (inferenser) → ACC-infEncyklopedisk kunnskap → ACC-gen(Ingen contekst → NEW)

Anaforiske lenker

Nullanaforer Juleevangeliet

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 8 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Interpretasjon

Selv om informasjonsstruktur apenbart handler om kognitivetilstander hos sprakbrukere, ville ingen si at vi ‘har’ et sa enkeltkategoriseringsskjema i hodet

Utgangspunktet er a forsøke a klassifisere data pa en mate som laross finne generaliseringer og mønstre i dataene

Nullanaforer settes inn hver gang det er rimelig a anta at referentenreaktiveres

Maks. lengde pa anaforiske lenker er (tentativt) satt til 13 setninger

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 9 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PROIEL-syntaks 1

I utgangspunktet er formalismen var en dependensgrammatikk;frasestruktur er ikke representert, og ordstilling kodes i et separat niva

Setningens struktur modelleres som avhengigheter mellom ordHvert ord untatt setningsrota er avhengig av nøyaktig ett ordAvhengighetene merkes med tradisjonelle grammatiske funksjoner som‘subjekt’, ‘objekt’

En enkel setning ser slik ut: Jesus sa

Utelatte argumenter er ikke med: ... sa

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 10 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PROIEL-syntaks 2

Dependenssyntaks kan ikke handtere mer komplekse fenomener som

Løfting og kontroll hvor ett element har flere roller setningenVerb-ellipse og ‘gapping’

For a hanskes med dette innfører vi strukturdeling som i LFG, samtbruk av tomme noder

Løfting/kontroll Gapping

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 11 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PROIEL og LFG

Dependensgrafer og LFGs f-strukturer ser ganske ulike ut

LFGs f-strukturer er (nøstede) attributt–verdi-matriser (AVMer)[pred ‘Hanne’num sg

] pred ‘gjespe ⟨subj⟩’tense pressubj ?

pred ‘gjespe ⟨subj⟩’tense pres

subj

[pred ‘Hanne’num sg

]

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 12 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Sammenhengen

root

amat

puellam

pulchram

adj

obj

pred

Hver node ‘oversettes’ til enAVM med morfologiske trekkog en semantisk formpred ‘vakker’

case accgend fem

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 13 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Sammenhengen

root

amat

puellam

pulchram

adj

obj

pred

Relasjonene oversettes tilattributter med dependentensAVM som verdiadj

pred ‘vakker’case accgend fem

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 14 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Sammenhengen

root

amat

puellam

pulchram

adj

obj

pred

Dette gjøres for alle nodene istrukturenpred ‘jente’

case accgend fem

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 15 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Sammenhengen

root

amat

puellam

pulchram

adj

obj

pred

AVMene til hode og dependentunifiseres

pred ‘jente’case accgend fem

adj

pred ‘vakker’case accgend fem

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 16 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Sammenhengen

root

amat

puellam

pulchram

adj

obj

pred

Prosessen terminerer medhovedverbet[

pred ’elske 〈 subj, obj 〉’]

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 17 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Sammenhengen

root

amat

puellam

pulchram

adj

obj

pred

pred ‘elske 〈subj, obj〉’

obj

pred ‘jente’case accgend fem

adj

pred ‘vakker’case accgend fem

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 18 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Kasus og verbkongruens i LFGdaupja pred daupjan ‘døpe ⟨subj, obj⟩’

subj pers 1subj num sg

ik pred ‘pro’pers 1num sgsubj

izwis pred ‘pro’pers 2num plobj

Tabell: Ik daupja izwis ’Jeg døper dere’ i forenkla (pil-løs) LFG

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 19 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Subkategorisering i LFG

Semantisk form

pred daupjan ‘døpe ⟨subj, obj⟩’

Det blir mange slike: ‘fortære⟨subj, obj⟩’, ‘forkaste ⟨subj, obj⟩’, . . .

Vi kan generalisere over det felles elementet med en templat

Templater

@transitive(p): (↑pred) = ‘p⟨subj, obj⟩’@intransitive(p): (↑pred) = ‘p⟨subj⟩’@opt-transitive(p): @transitive(p) |@intransitive(p)

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 20 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Templater og betydning

Templaten @transitive-ag-pat(p)

@transitive(p)λR.λx .λy .∃e.R(e) ∧ agent(e) = x ∧ theme(e) = y :(↑σev)( ((↑subj)σ ( (↑obj)σ (↑σ)

Vi kan utstyre templatene med betydning ogsa

Her har vi en transitiv-templat som introduserer de semantiske rolleneagens og tema

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 21 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

LFGs kobeskrivelse

LFG beskriver flere nivaersamtidig

Nivaene er relatert men ikkederivert fra hverandre

Vi kan ha constraints pa flerenivaer

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 22 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Templater og LFGs arkitektur

‘prodrop’ kan representeres som en valgfri constraint som kommermed alle greske verb (unntatt de upersonlige)

En templat som bare sier dette vil være en rein forkortelse (pa noen fabokstaver): @propdop = (↑subj pred = ‘pro’)

Men vi kunne ogsa legge informasjonsstrukturelle constraints inn itemplaten, la oss si at antecedenten skal være topic i sin setning(galt, forresten) e.l.

Templater er i utgangspunktet ikke noe annet ennforkortelser/generaliseringer over constraints, men nar de kombinererbeskrivelser pa flere forskjellige nivaer minner de om konstruksjoner iCxG

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 23 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Svensk ‘Directed motion construction’ (Asudeh,Dalrymple, Toivonen 2008)

En konstruksjon signalisert av frasestruktur

Jonas knuffade sig in i mangden

V’ → (V) NP PP↑= ↓ (↑obj) = ↓ (↑obl) = ↓

(↓prontype) = simplex-reflexive@swedish-dmc((↑pred fn))

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 24 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Konstruksjonshierarki (Asudeh, Dalrymple, Toivonen 2008)

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 25 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

CxG og LFG

‘Alle’ er enige om at det er mye felles

Formalismene er kompatible og basert pa unifikasjon og constraints

Men noen grunnleggende holdninger er forskjellige

Bresnan 2009

The architecture of LFG was also heavily influenced by psycholinguisticprocessing findings, but in a way diametrically opposed to the Hawkins-Kempson version of the program. It was Kaplan’s insight that LFG shouldabstract away from procedural computational operations; . . .

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 26 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Fillmore-CxG

CxG er ikke-modulær og tegnbasert, den antar konstruksjonen somgrunnleggende analyse- og representasjonsenhet

Enheter pa alle kompleksitetsnivaer er form–betydning-par

CxG begrunner dette valget med sprakprosesseringsforskning, somviser at vi prosesserer i blokker større enn ord

CxG søker maksimale generaliseringer og representerer ikkeinformasjon redundant

Alle forbindelser mellom lingvistiske enheter ma formaliseres

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 27 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Bruksbasert CxG (RCxG, CCxG)

Setter psykologisk realisme og motivering høyere enn maksimalgeneralisering og prediksjon

Bruksbasert: ‘even fully regular patterns may be stored if suchpatterns occur with sufficient frequency’ (2006:215) (men betyr detteredundant representasjon?)

Nedenfra og opp: generaliseringene gar ikke høyere enn det somregnes som psykologisk plausibelt

Forkaster (universelle, primitive) syntaktiske relasjoner og ordklasser

Motivering vs. prediksjon, Goldberg: ‘While motivation is distinctfrom prediction insofar as a motivated construction could have beenotherwise, it typically could not have had the opposite values of theproperties claimed to provide motivation.’ (2006:219)

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 28 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Bruksbasert CxG for en praktisk orientert korpuslingvist

Croft 2001 forkaster ordklasser som spraklige enheter fordi han menerde er darlige og eklektiske generaliseringer

Ordklasser er veldig praktiske verktøy. Kun ordklasser basert pamorfologiske konstruksjoner?

Verb, substantiver, adjektiver . . . og en stor og uoversiktlig klasseubøyelige?

Syntaktiske relasjoner/dependenser? Croft vil bruke kun roller ikonstruksjoner (donor, gift, recipient; TrSub, TrObj . . . ), ikkedependenser mellom enkelte syntaktiske elementer

Annotering med mer eller mindre skjematiske syntaktiske roller? (Ihvilken grad vil vi postulere konstruksjoner pa forhand?)

Konstruksjonsgrenser?

Ville dette være nok til a finne de interessante konstruksjonene?

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 29 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Eliderte verb

Som sagt representerer vi ‘gapping’ med en tom node: Gap

Den tomme noden lar oss bevare den semantiske strukturenKonjunksjonen far de rette konjunkteneHva slags alternative representasjoner kan vi tenke oss?

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 30 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Gapping i LFG

pred ‘own ⟨subj, obj⟩’

subj

[pred ‘fox’num pl

]

obj

[pred ‘hole’num pl

]

,

pred ‘own ⟨subj, obj⟩’

subj

[pred ‘bird’num pl

]

obj

[pred ‘nest’num pl

]

conjunction form = and

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 31 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PDT

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 32 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PDT 2

Dette er en notasjonell ekvivalent av var annotasjon

Argumentene for var notasjon er først og fremst praktiske:

Mer eksplisittIngen analyse av merkelappeneEnklere søk

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 33 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Croft-representasjon

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 34 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Eller kanskje sann?

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 35 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Croft-representasjon 2

Croft bruker bade tomme elementer og predikatidentitet

Men han framstiller mindre av strukturen

Skisseprega og lite implementerbart

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 36 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Programmatisk skisseprega? – Crofts argumenter motformalisering (2001:4)

Thus, the reader will not find a formal vocabulary for representingsyntactic structure in this book, because such a vocabulary would belanguage-specific. [Hvorfor det? Skal vi ikke beskrive sprak pa en mestmulig sammenliknbar mate?]

In this sense, Radical Construction Grammar is the syntactic theory toend all syntactic theories. [Men han sa jo det var greit a formalisere!]

There is no longer any need to learn an entire complex technicallanguage in order to describe a complex human language. [Hm? Maman lage det selv?]

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 37 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Goldbergs argumenter mot formalisering av CxG

Skepsis mot trekkbasert semantikk: kan ikke fange detaljerteleksikalsk-semantiske egenskaper

Men Fillmore-CxG bruker ikke trekk i særlig grad, derimot semantiskerammer med roller

Overfokus pa syntaktiske elementer, siden det primært er de som garigjen og siden det først og fremst er de som er relevante forunifikasjonen

Et fast sett trekk/verktøy selv for formsida av konstruksjonen er istrid med Crofts posisjon om at grammatiske kategorier og roller ikkeer generelle pa tvers av konstruksjoner men bare definert pr.konstruksjon

‘To linguists unfamiliar with the formalism, unfication can appeardauntingly opaque and cumbersome’

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 38 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Formalisme og mentalisme igjen

Goldberg (2006:214–215)

Patterns or expressions that are predictable from other generalizations areassumed [by Fillmore-style CxGrammarians] not to be part of a speaker’sknowledge of language.

Men er dette sant?

Goldberg tar for gitt at den formelle representasjonen er en hypoteseom sprakbrukerens indre grammatikk

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 39 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Formalisme og mentalisme igjen

Fried/Ostman (2004:24)

CxG is generative in the traditional, Chomskyan (1957) sense of the word:it, too, aims to account for all of the grammatical sentences of the languageand only those, and to be precise and explicit, which requires some measureof formalization. Capturing generalizations in the most econonomical waypossible, as oposed to mere listings of phenomena and facts, is thus valuedin Construction Grammar.

Fokus er pa a beskrive mulige setninger i et sprak, noe som er logisknoe annet enn a representere sprakbrukernes kunnskap oom spraket

Det er en nødvendig, om ikke tilstrekkelig betingelse for enpsykologisk plausibel grammatikk

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 40 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Konstruksjoner

Korpuset inneholder mange lag med informasjon:

Morfologi Tomme noder-kalas

SyntaksInformasjonsstruktur Infostruktur

Frie tagger (animathet, verbalklasser, preposisjonssemantikk osv.)

Den rike, strukturerte annotasjonen var gjør det lett a studerekonstruksjoner i korpuset

Ting som ‘mangler’ i ett niva kan suppleres fra et annet

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 41 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

For fa tomme noder?

Vi har (ukontroversielt?) tomme nominale noder iinformasjonsstrukturen Info

Men vi skulle ønske vi hadde tomme nominale noder i syntaksen ogsaSyntaks

Vi har strittet i mot, og na er det for seint. . . Deep shit

Dermed far vi mer kompliserte søk, og det er ting vi ikke kan finne

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 42 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Konstruksjoner med ‘ekstra’ argumenter

I noen konstruksjoner forekommer det argumenter(?) som tydelig ikkefar noen rolle fra verbet

‘Han tok henne i handa’

Nar vi regner ‘henne’ som et OBJ her, er det fordi vi regner med etkonstruksjonsskjema som lisensierer det

Konstruksjonen forteller oss ogsa at ‘henne’ er possessor for ‘handa’

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 43 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Nar formalismen ikke strekker helt til

Sakalt ‘external possession’: inneholder et element som bade ser ut tila være et argument for verbet/en rolle i konstruksjonen, men somsamtidig ma fortolkes som possessor for en kroppsdel e.l.

Vi har endt opp med forskjellige analyser i forskjellige sprak

I kirkeslavisk tar vi alle slike dativer som adnominale fordi det ogsafinnes en adnominal dativkonstruksjon (lettest a finne)

I de andre sprakene tar vi slike dativer som oblike argumenter tilverbet

Dette kunne vært løst med en sekundær dependens

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 44 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Gries’ og Stefanowitsch’ kollostruksjoner

The co-occurrence of words is investigated from a purely linearperspective on language that deliberately disregards syntacticstructure (2004:100)

The deliberate disregard of syntactic structure limits the usefulness ofthe method for fine-grained syntactic description (2004:100)

Obviously, defining what counts as an instance of construction C mayinvolve decisions on the part of the researcher that have to bejustified on theoretical grounds (2003:218).

Med andre ord ma en teoretisk definisjon komme forut for analysen avkorpusdata, ogsa i bruksbasert CxG

Det er umulig a telle noe du ikke har definert!

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 45 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Rammer

Vi kombinerte morfologi og syntaks for a ta utargumentstrukturkonstruksjoner

Igjen ville vi trengt tomme subjekter, i stedet ignorerer vi upersonligeverb

Vi har slitt mye med dativer: er de argumenter eller ikke?

La oss se pa rammer med dativelementer (OBL eller ADV), med oguten OBJ

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 46 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

SVObl vs. SVAdv

SVObl frequency SVAdv frequencylego ‘si’ 494 (1672) psallo ‘lovsynge’ 2(2)akoloutheo ‘følge’ 32 (74) ekmasso ‘tørke’ 2(3)didomi (p.) ‘gi’ 28 (57) erkhomai ‘komme’ 6 (163)hupakouo ‘adlyde’ 9 (15) eremoo (p.) ‘legge øde’ 2 (4)apokrinomai ‘svare’ 23 (110) laleo ‘snakke’ 5 (155)femi ‘si’ 16 (60) proseukhomai ‘be’ 3 (40)diakoneo ‘tjene’ 8 (15)aphiemi (p.) ‘tilgi’ 9 (29)homoioo (p.) ‘sammenlikne’ 5 (8)sugkhairo ‘glede seg med’ 4 (5)

Resten av verbene i SVAdv-ramma har frekvens pa 1 (1).

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 47 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

SVOObl vs SVOAdv

SVOObl frequency SVOAdv frequencydidomi ‘gi’ 66 (238) katakaio ‘brenne ned’ 3 (4)deiknumi ‘vise’ 11 (21) timao ‘ære’ 3 (16)gnorizo ‘gjøre kjent’ 7 (15) enduo ‘kle’ 2 (12)paradidomi ‘overgi’ 11 (61) baptizo ‘døpe’ 2 (17)ekdidomi ‘leie ut’ 4 (4) esthio ‘spise’ 3 (87)homoioo ‘sammenlikne med’ 4 (5)epitithemi ‘sette’ 6 (21)apodidomi ‘gi fra seg, betale’ 6 (31)epiballo ‘ta pa, legge pa’ 4 (13)poieo ‘gjøre’ 17 (353)

Resten av verbene i SVOAdv-ramma har frekvens pa 1 (1).

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 48 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Hva ser vi?

Klare verbklasser med sterk assosiasjon med verbramma iOBL-konstruksjonene

Klart aktiv–passiv-mønster mellom SVOObl og SVObl

Spredte verb som er svakt assosiert med verbramma iADV-konstruksjonene

Mange instrumenter i ADV-konstruksjonene

Burde noen av ADV-ene vært OBL-er? Ingen opplagte kandidater her,men statistikken lar oss kontrollere annotasjonen

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 49 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Rammer med preposisjoner

SVL(pros ‘til’) frekvens A(en ‘i’)SVO frekvenslego ‘si’ 77 (1672) ekho ‘ha’ 20 (361)erkhomai (m) ‘ga’ 19 (163) poieo ‘gjøre’ 19 (353)erkhomai ‘ga’ 11 (237) ekballo ‘kaste ut’ 7 (53)poreuomai (m) ‘reise’ 4 (56) aspazomai (m) ‘hilse’ 4 (22)femi ‘si’ 4 (60) baptizo ‘døpe’ 3 (17)upago ‘dra’ 4 (69) eurisko ‘finne’ 5 (110)

Klarere semantisk gruppe av verb som tar preposisjonen somargument

Verbene som assosieres sterkt med et adverbial har typisk ‘lite’semantikk og beskriver typiske hendelser som ‘ha’, ‘gjøre’, ‘kaste ut(demoner)’ . . .

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 50 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Artikkelkonstruksjoner

I NT-gresk forekommer det bestemte artikler bade pa egennavn ogfellesnavn (ho Iesous vs. ho anthropos)

Betingelsene for bruk av artikler er forskjellige for egennavn ogfellesnavn

Ved fellesnavn har vi ‘vanlig bestemthet’, artikkel nar ordet antas avære identifiserbart for mottaker

Egennavn har alltid unik og spesifikk referanse, og litteraturen er ivillrede om nar artikkelen egentlig brukes

Vi har to konstruksjoner: [art personnavn] og [art fellesnavn(hum)]

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 51 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Hvordan filtrere ut et datasett?

Ordklasse (lemmaniva): egennavn eller fellesnavn?

Animathet (semantisk annotering): kun mennesker

Syntaks: Har hodet artikkeldependent eller ei? Luke ut visseposisjoner der tidligere forskning viser at artikkelen har utypiskdistribusjon (predikativer, koordinasjoner)

Morfologi: Artikkelen ma kongruere med hodet

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 52 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Tre posisjoner fra litteraturen om artikkelbruk vedpersonnavn

Valgfri og tilfeldig

En form for topicmarkering, artikkelbruken markerer kanskjetopicskifter

Anaforisk: artikkelbruken har a gjøre med om og hvor mye referentener nevnt fra før i diskursen

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 53 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Men hva er et topic?

‘Aboutness topics’: hva handler setningen om?

Ikke uproblematisk a identifisere, og i hvert fall ikke i en 2000 argammel tekst pa et dødt sprak

Vi lagde en topicgjetter som kombinerte informasjon fra mange lag:informasjonsstatus, animathet, saliens (beregnet pa basis av deanaforiske lenkene), syntaktisk relasjon, ordstilling, egenskaper vedantecedenten

Virker omtrent like bra/darlig som et menneske, men er i alle fallkonsistent. . .

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 54 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Markerer artikkelkonstruksjonen topikalitet?

Artikkelkonstruksjonen har ikke noen klar topicmarkeringsfunksjon:Lukas unngar artikler pa topics, mens Markus har litt økt sjanse for aha artikkel om personnavnet er topic

Artikkelkonstruksjonen markerer heller ikke topicskifter

Vi finner artikkelkonstruksjonen hyppigere om det er et annet topicmellom egennavnet og antecedentenMen egennavnet trenger ikke selv a være topic (13 av 24 er ikke dethos Markus, 9 av 11 er ikke det hos Lukas)!

Konstruksjonen klargjør hvordan anaforen skal oppløses snarere enn areintrodusere et topic

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 55 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Artikkelkonstruksjonen ser bade framover og bakover

artikkel def. navn indef. navn fellesnavn pron. prodrop ingennei 5 5 1 12 3 68ja 15 3 2 15 13 21

Tabell: Neste referent etter type

Navn med artikler har mye større sjanse til a bli plukket opp enn navnuten artikkel

Navn med artikler blir ganske ofte plukket opp med navn med artikler

Om du bruker artikkelkonstruksjonen, er det god sjanse for at du hartenkt a fortsette a snakke om personen

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 56 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Kan vi male dette?

Vi kan kombinere anaforiske lenker med informasjon om tekststruktur

Om vi ser hvor ofte en person er nevnt i en perikope, relativt til antallord i perikopen, far vi et mal pa hvor viktig personen er i episoden

Vi far et mal som ser bade bakover og forover

Vi far vist at artikkelkonstruksjonen brukes nar man snakker om noenman planlegger a si mer om

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 57 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Saliens

●●

●●

●●

●●

Without article With article

0.00

0.02

0.04

0.06

0.08

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 58 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Felles for LFG og CxG

Empirisk holdning: Vi skal representere det som finnes i data

Overflatenære representasjoner (tildels svært like i LFG ogFillmore-CxG)

Konstruksjonsskjemaer kan inkorporeres i LFG

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 59 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Syntaktisk teori som korpuslingvistisk verktøy

Ma ha en notasjon som en datamaskin kan forsta

Vegg-til-vegg-annotasjon tvinger deg til a gjøre alt eksplisitt

Alle syntaktiske teorier ma ha en notasjon!

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 60 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

PROIEL-korpuset som utgangspunkt forkonstruksjonsstudier

Informasjon fra mange lag: ikke bare syntaks, men lemma, morfologi,ordstilling, semantikk, informasjonsstruktur

Mulighet til a lage presist utvalgte datasett med veldig lite støy

Frie tagger: Enkeltforskere kan a legge inn egne kategoriseringer palemma- eller tokenniva

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 61 / 62

Korpusbygging PROIEL-syntaks og LFG CxG Representasjoner Korpuset Konklusjon

Presentasjonen blir lagt ut pahttp://www.hf.uio.no/ifikk/proiel/

Korpuset er tilgjengelig for allehttp://foni.uio.no:3000

Hanne Eckhoff, Dag Haug CxG, LFG og korpora 3. desember 62 / 62