26
PRAXE V ČESKÉM PROSTŘEDÍ Úvod do korpusové lingvistiky 5

Úvod do korpusové lingvistiky 5

  • Upload
    chessa

  • View
    47

  • Download
    3

Embed Size (px)

DESCRIPTION

Úvod do korpusové lingvistiky 5. Praxe v českém prostředí. Elektronicky přístupný skrze k orpusové manažery. Klient – server Webové rozhraní. BONITO. Bonito. NoSketch Engine. https://korpus.cz/corpora/run.cgi/first_form. Doporučujeme. - PowerPoint PPT Presentation

Citation preview

Page 1: Úvod do korpusové lingvistiky 5

PRAXE V ČESKÉM PROSTŘEDÍ

Úvod do korpusové lingvistiky 5

Page 2: Úvod do korpusové lingvistiky 5

Elektronicky přístupný skrze korpusové manažery

Klient – serverWebové rozhraní

Page 3: Úvod do korpusové lingvistiky 5

BONITO

Bonito

Page 4: Úvod do korpusové lingvistiky 5

NoSketch Engine

https://korpus.cz/corpora/run.cgi/first_form

Page 5: Úvod do korpusové lingvistiky 5

Doporučujeme

Varianta klient-server (bonito) není v současné době již dále udržovaná

Varianta NoSketch Engine prošla v poslední době úpravami a bude i nadále udržovaná

Varianta klient-server má velmi dobrý uživatelský manuál

Varianta No Sketch Engine má dosud k dispozici pouze manuál ke starší (neaktuální) verzi

Křen, Michal: Co je nového v ČNK II. KORPUS – GRAMATIKA – AXIOLOGIE 7/ 2013, 98-100.

Page 6: Úvod do korpusové lingvistiky 5

Základní termíny a funkce manažeru

Příkazová okna KWIC (Key Word In Context)Konkordance / konkordanční seznamFrekvenční seznamFiltrZobrazeníUložení

Page 7: Úvod do korpusové lingvistiky 5

Volba korpusu

Page 8: Úvod do korpusové lingvistiky 5

Volba vyhledávání

Základní / Lemma / Fráze / Slovní tvar / Podřetězec /CQL

Page 9: Úvod do korpusové lingvistiky 5

Slovní tvar (word)

Textová slova (češu)

Page 10: Úvod do korpusové lingvistiky 5

Konkordanční seznam ve forměKWIC (Key Word In Context)

Vyhledá všechny kontexty výskytu hledaného slovního tvaru

Page 11: Úvod do korpusové lingvistiky 5

Lemma – základní tvar – systémové slovo

Lemma (česat)

Page 12: Úvod do korpusové lingvistiky 5

Konkordanční seznam ve forměKWIC (Key Word In Context)

Výskytů tvarů (word) hledaného lemmatu je 291

Page 13: Úvod do korpusové lingvistiky 5

Definování zobrazení hodnot lemmatu, tagu a díla pro KWIC

Zobrazení

Page 14: Úvod do korpusové lingvistiky 5

Možnosti zjištění frekvenční distribuce

Frekvenční distribuce

Page 15: Úvod do korpusové lingvistiky 5

Frekvenční distribuce slovních tvarů

Page 16: Úvod do korpusové lingvistiky 5

češou

Page 17: Úvod do korpusové lingvistiky 5

Filtry

Na pozici KWIC <0,0> pouze tvary prézentu

Page 18: Úvod do korpusové lingvistiky 5

Pouze tvary [tag=“VB.*”]

Page 19: Úvod do korpusové lingvistiky 5

Uložení

Možnost uložení a práce of-line

Page 20: Úvod do korpusové lingvistiky 5

Uložení do textového formátu

Hlavička obsahuje informace o korpusu, s nímž pracujeme a o dotazu, přes nějž jsme získali uložená data

Page 21: Úvod do korpusové lingvistiky 5

Manuály k variantám korpusového manažeru

Klient-server: http://ucnk.ff.cuni.cz/bonito/index.php

Webové rozhraní: http://ucnk.ff.cuni.cz/doc/Bonito2_manual.pdf

Page 22: Úvod do korpusové lingvistiky 5
Page 23: Úvod do korpusové lingvistiky 5
Page 24: Úvod do korpusové lingvistiky 5

Od ledna 2014 KonText

Page 25: Úvod do korpusové lingvistiky 5

https://kontext.korpus.cz/run.cgi/first_form

Page 26: Úvod do korpusové lingvistiky 5

http://wiki.korpus.cz/doku.php

Manuál práce s korpusovým rozhranímFunkce rozhraní KonTextPřehled základních pojmů korpusové

lingvistikyJaké korpusy zpřístupňuje Český národní

korpus?Seznamy zdrojů a zkratek