Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
1
Empirinių duomenų ir informacijos HSM tyrimams kaupimas ir valdymas: Lietuvos HSM duomenų
archyvas (LiDA)
KOKYBINIŲ DUOMENŲ ANALIZĖHUMANITARINIŲ IR SOCIALINIŲ
MOKSLŲ TYRIMUOSE
Mokymo kursas
Dr. Vaidas Morkevičius(PVAI, KTU)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
2
Kurso tikslai:
supažindinti Lietuvos HSM tyrinėtojus su kompiuterio pagalba atliekamos kokybiniųduomenų analizės pagrindais ir...kompiuterine įranga leidžiančia praktiškaiįgyvendinti tokią analizę:– NVivo (kokybinė analizė)– TextQuest (kiekybinė analizė)– QDA Miner (kokybinė analizė)– WordStat (kiekybinė analizė)
TextAnalysis
Suite}
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
3
Kurso struktūra:
1. Teorinis įvadas į (kompiuterio pagalba atliekamą) kokybinių duomenų analizę
2. Praktinis įvadas į kokybinių duomenųanalizę su “TextQuest”
3. Praktinis įvadas į kokybinių duomenųanalizę su “WordStat”
4. Praktinis įvadas į kokybinių duomenųanalizę su “NVivo”
5. Praktinis įvadas į kokybinių duomenųanalizę su “QDA Miner”
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
4
Teorinis įvadas
Kokybinių duomenų samprataKokybinių duomenų analizės perspektyvos:– Kiekybinė perspektyva (kiekybinė turinio
analizė):duomenų rinkimas ir tvarkymasduomenų kodavimas ir analizė:
– automatiškai vs. a priori modeliai
– Kokybinė perspektyva:duomenų rinkimas ir tvarkymasatmintinės (memos) ir kategorizavimas (coding)sąsajos (hyperlinks) ir ryšiai (matrices & maps) tarp kategorijų
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
5
Kokybiniai duomenys
Kiekybiniai duomenys -> skaitinė išraiškaKokybiniai duomenys -> “tekstinė” išraiška
skaičiai vs. prasmės
10 vs. dešimt
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
6
Kokybiniai duomenys
Iš kur ir kaip atsiranda skaičiai..?Socialinis pasaulis yra nestruktūruotas (“kokybinis”), o duomenys yra tyrinėtojo sukonstruojami, esti jo “kūrybos vaisius”, t.y. ir kiekybiniai, ir kokybiniai duomenys “sukuriami” ar “atrenkami” pagal tyrimo tikslus:– kokie reiškiniai egzistuoja? kokie tai reiškiniai? kokie jų
bruožai? kaip, kokiais būdais ir formomis jie pasireiškia?-> kokybiniai duomenys
– kiek reiškiniai paplitę? kurie reiškiniai labiau paplitę?-> kiekybiniai duomenys
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
7
Kokybiniai duomenys
Kokybinių duomenų analizė –nestruktūruotos socialinės informacijos (“socialinio pasaulio”) struktūravimas pagal kiekybinę arba kokybinę perspektyvą.
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
8
Kiekybinė analizės perspektyva
Kiekybinė turinio analizė (contentanalysis):– Berelson (1952): tyrimų technika objektyviam,
sistemiškam ir kiekybiniam akivaizdauskomunikacijos turinio aprašymui
– Shapiro ir Markoff (1997): turinio analizės terminas reiškia bet kokią sisteminę teksto (ar kitų simbolinių formų) tėkmės redukciją įstandartinę statistiškai apdorojamų simboliųvisumą, atspindinčią tam tikrų socialiniams (ir humanitariniams – V.M.) mokslams reikšmingųcharakteristikų buvimą, intensyvumą ar kiekį.
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
9
Kiekybinė analizės perspektyva
Pagrindinės formos:– Teminė analizė – kokios sąvokos ir kaip dažnai
pasitaiko tekste (labiausiai paplitusi forma).Prielaida: prasminiai vienetai (žodžiai, jųjunginiai ir pan.; jų buvimas ar intensyvumas tam tikruose teksto vienetuose) atspindi tam tikrus tyrime analizuojamus aspektus
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
10
Kiekybinė analizės perspektyva
Pagrindinės formos:– Semantinė analizė – kokie branduoliniai sakiniai
ir kaip dažnai pasitaiko tekste.Prielaida: branduoliniai sakiniai (jų buvimas ar intensyvumas tam tikruose teksto vienetuose) atspindi tam tikrus tyrime analizuojamus aspektus.Iš esmės: Teminės analizės praplėtimas lingvistiniais (sintaksiniais ir semantiniais) elementais.Veikėjas-Pozicija-Ryšys-Objektas.
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
11
Kiekybinė analizės perspektyva
Pagrindinės formos:– Tinklo analizė – kokios sąvokos ar branduoliniai
sakiniai ir kaip siejasi su kitomis sąvokomis ar branduoliniais sakiniais.Prielaida: ryšiai tarp veikėjų, jų veiksmų ir objektų (jų buvimas, kryptingumas, intensyvumas ir prasmė tam tikruose teksto vienetuose) atspindi tam tikrus tyrime analizuojamus aspektus.
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
12
Kiekybinė analizės perspektyva
Pagrindinės perspektyvos:– automatinė analizė, kai pradžioje
nesivadovaujama teorijomis ir leidžiama “kalbėti tekstams”
– jau sukurtų teorinių modelių taikymas, ieškant tekste tam tikrų kategorijų
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
13
Kiekybinė analizės perspektyva: žingsniai
1. Tyrimo tikslų, objektų ir perspektyvos pasirinkimasa. Ar reikalinga (kompiuterinė) kiekybinė turinio analizė?Daug teksto, analizės ir stebėjimo vienetai aiškiai ir nedviprasmiškai apibrėžti (operacionalizuoti)b. Kuri perspektyva geriausiai leis pasiekti tyrimo tikslus?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
14
Kiekybinė analizės perspektyva: žingsniai
2. Tekstinių duomenų atrankaKokių tekstinių duomenų reikia?a. Komunikacijos šaltinio atranka (Lietuvos rytas ir Kalvotoji Žemaitija)b. Dokumentų atranka (vedamieji straipsniai)c. Teksto dokumentuose atranka (antraštė, partijos programos ekonominė dalis)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
15
Kiekybinė analizės perspektyva: žingsniai
3. Tekstinių duomenų paruošimas analizeiKo reikia, kad tekstinius duomenis galima būtųapdoroti kompiuterio pagalba (automatinė vs. a priori perspektyva)?a. Sakinio, pastraipos, teksto galo, kalbėtojo ir pan. įvardijimas ir pažymėjimas.b. Santrumpų, įvardžių, tikrinių daiktavardžių ir pan. pažymėjimas.c. Žodžių daugiareikšmiškumo pašalinimas.d. Pirminė lingvistinė (morfologinė, sintaksinė ir semantinė) analizė ir pažymėjimas.
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
16
Kiekybinė analizės perspektyva: žingsniai
4. Kodavimo sistemos sukūrimasKokie bus kodavimo (prasminiai) vienetai?a. Žodis, žodžio reikšmė, žodžių junginys(pastarieji trys taikomi kompiuterizuotoje turinio analizėje), sakinys, tema, pastraipa, visas tekstas?Ar ir kokios kategorijos bus tiriamos?a. Kaip jos apibrėžiamos?b. Siauros ar plačios?c. Nepersikertančios?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
17
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasAr taikomas žodyninis metodas? Jei taip, tai:a. Ar tiriami tik keletas žodžių? (pvz., ekonomikos terminai)b. Ar tiriama tik viena konkreti tema? (pvz., pasiekimų poreikis)c. Ar sudaromas didelis, daugelio kategorijųžodynas?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
18
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasKaip sudaromas žodynas?Pirmas etapas – kategorijų medžio sudarymas pagal teorijas ir hipotezes (kategorijų išskyrimas ir detalus aprašymas)Antras etapas – pirminio žodyno sudarymasGalimybės:1. Tipinių tekstų analizė:1.1. Tipinių žodžių-sąvokų atrinkimas tekstuose, kurie sukurti tipinių tiriamųjų veikėjų (agency)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
19
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymas1. Tipinių tekstų analizė:1.2. Tipinių žodžių-sąvokų atrinkimas tekstuose, kurie sukurti tiriamo reiškinio ekspertų1.3. Tipinių žodžių-sąvokų atrinkimas įvairiuosetekstiniuose šaltiniuose – žiniasklaidoje, mokslinėje ir grožinėje literatūroje, tiriamųasmenų (agency), įvairių kitų asmenų nei tiriamieji ir ekspertų sukurtuose tekstuose (kuo daugiau šaltinių)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
20
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasAntras etapas – pirminio žodyno sudarymasGalimybės:2. Įžvalga ir išmonė:2.1. Tipinių žodžių-sąvokų atrinkimas žodynuosepagal kategorijas2.2. Tipinių žodžių-sąvokų parinkimas pagal intuiciją
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
21
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasTrečias etapas – pirminio žodyno tikrinimas ir gryninimas1. Žodyno įvertinimas, kurį atlieka ekspertai2. Žodyno įvertinimas (žodžių-sąvokų kodavimo tikslumo lygio nustatymas: kiek kartų tekstus koduoja tiksliai ir kiek – netiksliai) analizuojant visus (arba daugumą) turimus tekstinius duomenis – KWIC-concordance (žodis-sąvoka kontekste), collocates (kiek, kaip ir kurie žodžiai yra kartu), patterns (kurie ir kaip žodžiai yra kartu), clusters-sequences (žodžių junginiai)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
22
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasTrečias etapas – pirminio žodyno tikrinimas ir gryninimas3. Ieškomų žodžių-sąvokų kiekio kategorijose parinkimas:3.1. Ar po lygiai visose kategorijose?3.2. Kiek – kuo daugiau ar tik “svarbiausi-dažniausi”?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
23
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasTrečias etapas – pirminio žodyno tikrinimas ir gryninimas4. Teigiamo (ne visai teigiamo-sąlyginio) ir neigiamo konteksto įvertinimas: ar turi įtakos? kaip pašalinti, jei turi (konteksto panaudojimas, jei nepadeda – atmesti žodį-sąvoką arba įvesti jo kiekybės santykinį įvertį, pvz.: pagal imtįnustatomas teigiamų ir neigiamų atvejų skaičius, kuriuo įvertinami vėlesni kodavimo rezultatai)?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
24
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasItin geras praktinis pavyzdys, kurio pagrindu sudaryta ir ši schema, yra:Bengston, D, & Xu, Z. (1995). Changing nationalforest values: A content analysis St. Paul, Minn.: North Central Forest Experiment Station, ForestService, U.S. Dept. of Agriculture.http://www.ncrs.fs.fed.us/pubs/rp/rp_nc323.pdf.
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
25
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasProblemos:a. Tikslus bendrųjų žodynų kategorijųapibrėžimasb. Žodžių daugiareikšmiškumas ir nevienodas žodžių santykinis svoris kategorijosec. Kodavimo vienetas (žodis, žodžio reikšmė, žodžių junginys, žodžių darinys ar branduolinis sakinys?)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
26
Kiekybinė analizės perspektyva: žingsniai
5. Teksto klasifikavimas ir žodynų taikymasProblemos:d. Įvardžiai ir santrumpos.e. Žodžių reikšmių priskyrimas kategorijoms (tik vienai (statistinėms procedūroms būtina) ar kelioms kategorijoms?).f. Kategorijos iš anksto sudarytos (žodynas a priori) ar gautos iš duomenų/teksto (post hoc)?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
27
Kiekybinė analizės perspektyva: žingsniai
6. Konteksto vienetaiKoks bus kodavimo vienetų konteksto vienetas?Sakinys? “Pasisakymas”? Pastraipa? Dokumentas? Šaltinis?
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
28
Kiekybinė analizės perspektyva: žingsniai
7. Kodavimo vienetų ir kategorijųskaičiavimas“Kiekybinis” vs. “kokybinis”
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
29
Kiekybinė analizės perspektyva: žingsniai
8. Suskaičiuotų kodavimo vienetų ir kategorijų statistinė analizė bei duomenųinterpretacija a. “Tekstinių” duomenų apibūdinimas(dažniai, vidurkiai, procentai, proporcijos, proporcijų skirtumas, duomenų sklaidos charakteristikos)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
30
Kiekybinė analizės perspektyva: žingsniai
8. Suskaičiuotų kodavimo vienetų ir kategorijų statistinė analizė bei duomenųinterpretacija b. Ryšių (kovariacijos) tarp “tekstinių” duomenųpaieška(faktorinė, klasifikavimo, korespondencijos ar daugiamačio skaliavimo (MDS) analizė)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
31
Kiekybinė analizės perspektyva: žingsniai
8. Suskaičiuotų kodavimo vienetų ir kategorijų statistinė analizė bei duomenųinterpretacija c. Ryšio tarp “tekstinių” ir “už teksto esančių”duomenų nustatymas ir to ryšio stiprumo matavimas (požymių priklausomumas, vidurkių skirtumas, dispersinė analizė – ANOVA, koreliacija, regresija)
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
32
Kiekybinė analizės perspektyva: privalumai ir trūkumai
Privalumai:– Aiškios ir tiksliai nustatytos teksto kodavimo
taisyklės.– Kodavimo patikimumas.– Galima santykinai lengvai ir greitai apdoroti
didžiulius teksto kiekius (-> kompiuterinė).– Paprasta atlikti analizę, kurioje daug kategorijų
ar jų schema sudėtinga (-> kompiuterinė). – Tinkama pradedantiesiems (nekompiuterinė) ☺
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
33
Kiekybinė analizės perspektyva: privalumai ir trūkumai
Trūkumai:– Validumo problema, jei kompiuterinė
(kodavimo vienetų parinkimo, žodžiųdaugiareikšmiškumo, už teksto esančios informacijos perkėlimo į žodyną ir kodavimo vienetų priskyrimo kategorijoms problemos)
– Esant mažam tekstų kiekiui neracionalu taikyti
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
34
Rekomenduojama literatūra:
Kiekybinei perspektyvai:– Neuendorf, Kimberley A. 2002. The Content
Analysis Guidebook. Thousand Oaks: Sage Publications. (Bendro pobūdžio įvadinis vadovėlis pradedantiesiems).
– Riffe, Daniel, Stephen Lacy, and Frederick G Fico. 2005. Analysing Media Messages: Using Quantitative Content Analysis in Research. 2nd ed. Mahwah, New Jersey, London: Lawrence Erlbaum Associates, Publishers. (Bendro pobūdžio įvadinis vadovėlis pradedantiesiems).
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
35
Rekomenduojama literatūra:
Kiekybinei perspektyvai:– Krippendorff, Klaus. 2004. Content Analysis: An
Introduction to Its Methodology. 2nd ed. Thousand Oaks, London, New Delhi: SAGE Publications. (Bendro pobūdžio vadovėlis pažengusiems).
– Roberts, Carl W., ed. 1997. Text Analysis for the Social Sciences: Methods for Drawing Statistical Inferences from Texts and Transcripts. Mahwah, New Jersey: Lawrence Erlbaum Associates. (Bendro pobūdžio leidinys pažengusiems).
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
36
Rekomenduojama literatūra:
Kiekybinei perspektyvai:– Weber, Robert Philip. 1990. Basic Content
Analysis. Newbury Park, CA: Sage Publications.(Kompiuterizuotai kiekybinei turinio analizei skirtas įvadinis vadovėlis pradedantiesiems).
– Popping, Roel. 2000. Computer-Assisted Text Analysis. edited by Raymond M Lee. London, Thousand Oaks: SAGE Publications.(Kompiuterizuotai kiekybinei turinio analizei skirtas vadovėlis pažengusiems).
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
37
Rekomenduojama literatūra:
Kiekybinei perspektyvai:– West, Mark D., ed. 2001a. Applications of
Computer Content Analysis. Westport, Connecticut: Ablex Publishing.(Kompiuterizuotai kiekybinei turinio analizei skirtas leidinys pažengusiems).
– West, Mark D., ed. 2001b. Theory, Method, and Practice in Computer Content Analysis. Westport, Connecticut: Ablex Publishing.(Kompiuterizuotai kiekybinei turinio analizei skirtas leidinys pažengusiems).
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
38
Rekomenduojama literatūra:
Kokybinei perspektyvai:– Tichter, Stefan, Michael Meyer, Ruth Wodak,
and Eva Vetter. 2000. Methods of Text and Discourse Analysis. London, Thousand Oaks, CA: SAGE Publications. (Bendro pobūdžio teorinis įvadinis vadovėlis skirtas tekstiniųduomenų analizei).
– Grbich, Carol. 2007. Qualitative Data Analysis: An Introduction. London, Thousand Oaks, New Delhi: SAGE Publications. (Teorinis įvadinis vadovėlis skirtas kokybinių duomenų analizei).
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
39
Rekomenduojama literatūra:
Kokybinei perspektyvai:– Dey, Ian. 1993. Qualitative Data Analysis: A
User-Friendly Guide for Social Scientists. London and New York: Routledge/Francis & Taylor Group. (Bendro pobūdžio įvadinis vadovėlis skirtas kokybinių duomenų analizei).
– Richards, Lyn. 2005. Handling Qualitative Data: A Practical Guide. London, Thousand Oaks, NewDelhi: SAGE Publications. (Bendro pobūdžio įvadinis vadovėlis skirtas kokybinių duomenųanalizei).
BPD2004-ESF-2.5.0-03-05/0042 © Vaidas Morkevičius
Lietuvos duomenų archyvas (LIDA)
40
Rekomenduojama literatūra:
Kokybinei perspektyvai:– Lewins, Ann, and Christina Silver. 2007. Using
Software in Qualitative Research: A Step-by-Step Guide. Los Angeles, London, New Delhi, Singapore: SAGE Publications. (Bendro pobūdžio įvadinis vadovėlis į kompiuterizuotąkokybinių duomenų analizę).
– Bazeley, Patricia. 2007. Qualitative Data Analysis with NVivo. Los Angeles, London, NewDelhi, Singapore: SAGE Publications. (Darbui su NVivo skirtas įvadinis vadovėlis).