Click here to load reader

ZPRACOVÁVÁME KVANTITATIVNÍ DATA I

  • View
    35

  • Download
    0

Embed Size (px)

DESCRIPTION

ZPRACOVÁVÁME KVANTITATIVNÍ DATA I. Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu 18. 4. 2007. „SOUVISLOST“. Kvantitativní výzkum – testování hypotéz Jeho silnou stránkou je schopnost nám říct, jak moc se mýlíme. - PowerPoint PPT Presentation

Text of ZPRACOVÁVÁME KVANTITATIVNÍ DATA I

  • ZPRACOVVMEKVANTITATIVN DATA I.Mgr. Karla HrbkovMetodologie pedagogickho vzkumu18. 4. 2007

  • SOUVISLOSTKvantitativn vzkum testovn hypotzJeho silnou strnkou je schopnost nm ct, jak moc se mlme.Testovn hypotz produkce vrok o tom, jak siln promnn souvis (jak je mezi nimi mra korelace hodn, malinko).

  • OMYLPedstavte si, e mte v rukou oblku s vyplnnm dotaznkem z vzkumu na celosttnm vzorku dosplho obyvatelstva. V kol je odhadnout, jak je pohlav respondenta, jeho dotaznk je v oblce (jak je pravdpodobnost sprvnho odhadu?).Pedstavte si, e z oblky vytete odpov na nsledujc otzku. Uvte nkdy rtnku? ANO x NE Pravdpodobnost sprvnho odhadu je mnohem vy. Meme tedy ci, e mezi promnnmi pohlav a pouvn rtnky existuje souvislost.Souvislost me bt definovna jako prstek v pravdpodobnosti sprvnho odhadu jedn promnn, za kter vdme na znalosti o jin promnn.

  • Pklad souvislostiGeometrie Matematikak nm tato tabulka nco o souvislosti mezi znmkou z G a M?Co by to znamenalo, kdyby vedla diagonla obrcen?

    ABCDA50%35%10%0%B45%55%25%10%C5%8%55%10%D0%2%10%80%N100%150100%360100%400100%50

  • PkladJe njak souvislost mezi promnnm v tabulce?X reprezentuje volebn obvody, Y politick strany. Kdy znme hodnotu X, odhadneme hodnotu Y!Statistika srovnn nalezen distribuce pozorovn do pol tabulky s takovou distribuc, jakou bychom obdreli, kdyby byla pozorovn zaazena do pol tabulky nhodn.Promnn XPromnn Y

  • Redukce informacPrmrn poet pllitr vypit bhem jednoho tdne: mui: 8 eny: 2Vce vme prmru, kter byl vypotn na vzorku 500 pozorovn, ne prmru vypotanm pro vzorek 5 jedinc.asto je pro ns vhodn vyjdit informaci o vzorku v co nejjednodu form (ale sta nm prmr?)Jak maj data rozloen? Mry centrln tendence, mry variability, mry koncentrace.Prmr a jin reprezentace stednch hodnot redukuj informaci do jednoho daje podle druhu dat!

  • Statistick operace z rznch druh menNOMINLN MEN etnosti, %, modus, koeficient kontingence, ch-kvadrt, atd.ORDINLN MEN medin, nkter mry variability, poadov koeficienty korelace, atd.INTERVALOV MEN aritmetick prmr, testy vznamnosti t-test, F-test, smrodatn odchylka, analza rozptylu, koeficienty korelace,atd.

  • TABULKA ETNOSTUtdn dat pomoc tzv. rkovac metody.Pi men koln spnosti zskali ci tyto znmky z matematickho testu: 1, 1, 2, 4, 3, 3, 3, 2, 4, 1, 3, 2, 1, 5, 1, 1, 2, 4, 3, 2, 3, 3.Sestavte tabulku etnost podle vzorce fi = ni : n

  • Aritmetick prmr, modus, medinIntervalov popis stedn hodnotyprmr r 2,455Poet dt, pjem vk, barva o

    Modus ta hodnota, kter se v danm souboru dat vyskytuje nejastji (m nejvt etnost).Medin prostedn hodnota z ady hodnot seazench podle velikosti (rozdluje soubor na dv stejn sti).1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,5 (stoj pesn uprosted, odlehl hodnota nen reflektovna).

  • Mra variability (rozptyl)Jak dalece jsou data rozptlena? Tda A 1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,5Tda B 1,1,1,1,1,1,1,1,1,1,2,4,4,4,4,4,4,4,4,5,5.Rozptyl zda mezi prmry jsou i nejsou vznamn rozdly! Pklad ter.Smrodatn odchylka jak jsou hodnoty vzdleny od prmru!Ptme se, co in kolsn rozptylu. Kvantitativn vzkum kontroluji rozptyl hodnot (dat), izoluji promnn.Chceme, aby to byla nezvisle promnn, nemla by to bt nhoda. Jestlie je nae psoben vt ne nhoda, pijmme alternativn hypotzu. Pklad experimentu vliv metody.

  • Vpoet rozptyluA = {1,1,1,5,5,5} B = {3,3,3,3,3,3}Vypotejte prmr (r) a rozptyl (s2)

    1. Od pozorovan hodnoty pro kadho jedince odeteme prmr.2. Odchylku vypotanou pro kadho jedince umocnme.3. Umocnn odchylky seteme.4. Souet vydlme potem jedinc ve vzorku = rozptyl.5. Vsledek dlen odmocnme = smrodatn odchylka.

  • Smrodatn odchylka, normln rozloenr = prmr68% vech respondent-1+1 rozptylHodnoty, kterch me studovan promnn nabvatMnostv ppad, kte maj danou hodnotu promnn

  • Nominln data ch-kvadrtNejastjm statistickm postupem na rovni nominlnho men bv test ch-kvadrt. Ovuje se zde, zda etnosti, kter byly zskny pozorovnm se vznamn odliuj od teoretickch etnost, kter odpovdaj dan nulov hypotze.Pklad pro pochopen principu testu dobr shody.

    Skupina 90 k zkladn koly ve vzkumu odpovdala na otzku: Kter z vyuovacch pedmt m nejradji?A matematika B fyzika C chemieNa zklad testu dobr shody ch-kvadrt mme rozhodnout, zda mezi oblibou pedmt jsou statisticky vznamn rozdly.

  • Princip testu dobr shody ch-kvadrt

    Jestlie je vsledek statisticky vznamn, je velmi nepravdpodobn, e by byl zpsoben nhodou.Zanme formulac nulov (mezi sledovanmi jevy nen vztah) a alternativn (existuje vztah) hypotzy.H0 : etnost k, kte vybraj jednotliv pedmty, jsou zhruba stejn.H1 : etnost k, kte vybraj jednotliv pedmty, jsou rozdln. Vypotanou hodnotu srovnvme s tzv. kritickou hodnotou (statistick tabulka). x2 = (P O)2 O

  • Princip testu dobr shody ch-kvadrtPslunou kritickou hodnotu hledme vdy pro uritou (zvolenou) hladinu vznamnosti a urit poet stup volnosti.Ve statistickch tabulkch nalzme, e kritick hodnota ch-kvadrt pro hladinu vznamnosti 0,05 a 2 stupn volnosti je x20,05(2) = 5,991Zjiujeme, e vypotan hodnota je men, ne hodnota kritick, a proto pijmme nulovou hypotzu. K odmtnut nulov hypotzy je teba, aby vypotan hodnota testovho kritria byla vt (nebo alespo stejn velk) jako hodnota kritick.Pokud jsme nuceni pijmout nulovou hypotzu, znamen to, e vsledky je mono docela dobe pipsat na vrub nhody, e tedy mezi studovanmi jevy nen vznamn vztah.Nebylo prokzno, e mezi oblibou vyuovacch pedmt je rozdl.

  • Zvislost mezi jevy - nominlnExistuje zvislost mezi danmi dvma pedagogickmi jevy, kter byly zmeny na rovni nominlnho (a vyho) men.Pklad: Vzorku 400 nhodn vybranch student PdF byl pedloen dotaznk. Jedna z otzek (uzaven otzky) zjiovala, zda studenti byly v uplynulm studijnm roce ubytovni na kolejch. Dal z otzek zjiovala, jakho prmrnho prospchu studenti v uplynulm studijnm roce doshli. Mme rozhodnout, zda je vztah mezi tm, zda studenti bydl na kolejch a tm, jakch studijnch vsledk dosahuj. Pouijeme tzv. kontingenn tabulku (etnosti student, kte odpovdli uritm zpsobem na prvn otzku a souasn uritm zpsobem na druhou otzku).

  • Pklad

    bydlen na kolejchNap. slo 93 v tabulce znamen, e 93 student odpovdlo, e bydleli na kolejch a souasn, e mli prmrn prospch hor ne 2,1.sla uvdn vpravo od tabulky a pod tabulkou jsou tzv. okrajov (marginln) etnosti, tj. souty etnost v dcch a sloupcch tabulky. Formulujeme nulovou a alternativn hypotzu.Vypotme oekvan etnosti pro kad pole kontingenn tabulky tak, e nsobme odpovdajc marginln etnosti v tabulce a potom dlme celkovou etnost. Nap. oekvanou etnost (48) vypotme O = 80 . 240 = 48Pro kad pole kontingenn tabulky vypotme hodnotu (P - O)2 : O. Testov kritrium x2 vypotme jako souet vech tchto hodnot, tj. 1,333 + 0,009 + 0,964 + 2,000 + 0,014 + 1,446 = 5,767.Urme hladinu vznamnosti a poet stup volnosti podle vzorce f = (r 1) . (s 1) = 2Srovnme-li vypotanou hodnotu testovho kritria (5,767) s kritickou hodnotou testovho kritria x20,05(2) = 5,991, zjistme, e je men, proto pijmme nulovou hypotzu.400

  • Zvislost mezi jevy - ordinlnKoeficienty korelace nap. Spearmanv (ordinln dat), Pearsonv (metrick data).P. zvislost mezi vkou a vkem k. Lze ci, e vka k se s pibvajcm vkem zvtuje, ale nelze tvrdit, e uritmu vku odpovd jen urit vka ka. Zjiujeme, zda existuje souvislost, nikoli kter promnn ji zpsobuje.Hodnoty koeficientu (-1 do +1).

  • Pklad n xi yi - xi yi { n xi2 ( xi )2 } { n yi2 ( yi )2 } 8 . 372 50 . 52 (8 . 376 502) (8 . 380 522) r = 0,91

  • Regresn linie

  • Regresn liniePerfektn pozitivn korelace, s rostouc hodnotou X hodnota Y vzrst. Hodnotu Y odhadneme na zklad znalosti hodnoty X bez jakhokoli omylu, r = 1.Perfektn negativn korelace, s pirstajc hodnotou X, hodnota Y kles, r = -1.

    Siln korelace.

    Perfektn nezvislost, znalost hodnoty X nezlep nai schopnost odhadnout sprvn hodnotu Y, r = 0.

    Kdy odeteme standardn odchylku od prmru, mezi tmito hodnotami bude vdy 68% pozorovn. Kdy od prmru odeteme a piteme msto jedn smrodatn odchylky dv, v rozmez definovanm tmito novmi hodnotami bude 95% pozorovn. Smrodatn odchylka m homogennost souboru. Umon nm definovat, jak dobe vypotan prmr charakterizuje populaci. Msn pjem osob naeho vzorku byl 1.480 K prmrn. Meme pedpokldat, e prmrn pjem populace spad s 95% pravdpodobnost do oblasti mezi 1.410 a 1.550 K. Dky smrodatn odchylce jsme schopni ci, e existuje jen 5% pravdpodobnost, e rozdly v prmrnch znmkch z uritho pedmtu ve dvou zkoumanch tdch jsou nhodn a e pro zbvajcch 95% meme doufat, e rozdly jsou zpsobeny funkc njak vlastnosti.

Search related