28
KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA) Cilj KTT: maksimizacija zanesljivosti skupnega dosežka, t.j. (obtežene) vsote odgovorov na postavke. Test sestavljamo na podlagi koeficientov diskriminativnosti postavk idr. kriterijev (npr. primerne porazdelitve težavnosti).

KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

  • Upload
    sari

  • View
    160

  • Download
    0

Embed Size (px)

DESCRIPTION

KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA). Cilj KTT: maksimizacija zanesljivosti skupnega dosežka, t.j. (obtežene) vsote odgovorov na postavke. Test sestavljamo na podlagi koeficientov diskriminativnosti postavk idr. kriterijev (npr. primerne porazdelitve težavnosti). - PowerPoint PPT Presentation

Citation preview

Page 1: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

KLASIČNA TESTNA TEORIJA(TEORIJA PRAVEGA DOSEŽKA)

Cilj KTT: maksimizacija zanesljivosti skupnega dosežka, t.j. (obtežene) vsote odgovorov na postavke.

Test sestavljamo na podlagi koeficientov diskriminativnosti postavk idr. kriterijev (npr. primerne porazdelitve težavnosti).

Page 2: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

2

2

2

2

222

1

0)(

X

E

X

TXX

ETX

TEiji

jiij

r

rXET

ETX

Ključni problem KTT je določanje zanesljivosti testnih dosežkov.

razdelitev testnegadosežka

def. pravega dosežka

razdelitev testne variance

def. koeficientazanesljivosti

Page 3: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

“Zanesljivost” se vedno nanaša na meritev in ne na merski instrument!

Pri “večfaktorskih” testih računamo zanesljivost za vsako lestvico posebej!

Za oceno deleža prave variance potrebujemo več eksperimentalno neodvisnih meritev (postavk, podtestov, testov).Eksperimentalna neodvisnost: odgovor na eno meritev ne pogojuje odgovora na drugo.

Page 4: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Delitev mer zanesljivosti v KTT

mere notranje skladnosti(interne konsistentnosti)

• mere, ki temeljijo na modelih;• spodnje meje zanesljivosti.

mere stabilnosti

• ponovno testiranje (retest);

• alternativni obliki.

Temeljne predpostavke:

nekorelirane napake merjenja vzporednost obeh merjenj

Page 5: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Spodnja meja zanesljivosti: statistika, ki je vedno manjša ali enaka resnični zanesljivosti.

Lastnost spodnje meje vedno velja le za vzorec!

Spodnje meje se razlikujejo glede na natančnost in glede na statistične lastnosti (npr. pristranskost).

Page 6: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Najbolj priljubljena SM: koeficient

temelji na povprečni kovarianci med postavkami (višje kovariance in višji N višji );

• natančnost znižujejo: multidimenzionalnost in razlike med pravimi variancami postavk ( je večinoma zadovoljivo natančen);

ni mera enodimenzionalnosti!

• dobre statistične lastnosti (skoraj nepristranska cenilka, lahko določimo IZ).

2

2

2

2

11 S

i

S

ij

nnn

Page 7: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Razpolovitveni koeficient zanesljivosti:

Guttmanov koeficient 2:• vedno nekoliko boljši od , zlasti če prisotne negativne kovariance;• ne poznamo vzorčne porazdelitve.

1. test razdelimo na dva čim bolj enakovredna dela (t.j.: s čim višjo kovarianco in čim bolj podobnima variancama);2. izračunamo za dve postavki (dela testa kot postavki).

SPSS: uporabi “Guttman split-half”.

Uporabimo namesto , kadar se variance postavk zelo

razlikujejo. Razpolovitvenega koeficienta ne smemo

uporabljati “na slepo”!

Page 8: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Najvišja spodnja meja zanesljivosti(The Greatest Lower Bound to the reliability, GLB)

• optimalna ocena zanesljivosti (izkoristi vso informacijo v

kovariančni matriki);• računsko zahtevna - potrebujemo specializiran program, npr.

TiaPlus (http://www.cito.nl/e_pok/software/eind_fr.htm), ali MRFA

(http://www.ppsw.rug.nl/~kiers);• pristranske (previsoke) ocene v majhnih vzorcih (TiaPlus

omogoča popravek po “Kljukčevi metodi”).

Page 9: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Na faktorskem modelu temelječe mere zanesljivosti

Koeficient :

1. Opravimo faktorsko analizo kovariančne matrike z enim faktorjem.2. Komunaliteta = ocena zanesljivosti posamezne postavke.

Če enofaktorski model drži in spremenljivke nimajo specifične variance, je = zanesljivost.

Page 10: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Pomanjkljivosti “faktorskih” mer zanesljivosti:

• enofaktorski model v praksi nikoli ne drži;• ni spodnja meja zanesljivosti (lahko je večji ali manjši);• izračun ni objektiven - rezultati so odvisni od izbire metode FA.

Uporaba enofaktorskih mer zanesljivosti v praksi ni priporočljiva!

Page 11: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Kriteriji zanesljivosti:

• individualna diagnostika: vsaj 0,90

• pri raziskovanju dopustni nižji rXX.

Tipični koeficenti zanesljivosti:• testi splošne inteligentnosti: 0,90-0,95• vprašalniki osebnosti, testi znanja: 0,75-0,80• projekcijske tehnike, ocenjevalne lestvice: 0,60-

0,65

Page 12: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Kako izboljšati zanesljivost?

• dovolj veliko število postavk;

• ustrezno velike korelacije med postavkami;

• kakovostne postavke (jasno opredeljene naloge, nedvoumne, kratke in razumljive trditve…)

Page 13: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Kritika klasične testne teorijePredpostavke KTT ne veljajo vedno:• primernost linearnega modela, • nekoreliranost napak,

• enaka natančnost merjenja za vsak Xi.

Parametri oseb so odvisni so odvisni od vzorca postavk in obratno.

KTT ne obravnava odnosa med odgovorom na postavko in skupnim dosežkom.

Page 14: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

TEORIJA ODGOVORA NA POSTAVKO(Item response theory - IRT)

aliTEORIJA LATENTNIH POTEZ

(Latent trait theory)

“Paradigma v psihometriji, ki s pomočjonelinearnih modelov obravnava vprašanja

analize postavk, sestavljanja testov invrednotenja dosežkov.”

Page 15: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

IZHODIŠČI TOP:

1. Odgovor na postavko lahko pojasnimo z (navadno eno) latentno potezo.

2. Odnos med latentno potezo in verjetnostjo pravilnega odgovora lahko opišemo z monotono naraščajočo funkcijo (=karakteristična funkcija postavke)

Page 16: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Raschev model:

( )

exp( )

exp( ) exp ( )p Y

b

b b

11

1

1

Verjetnost pravilnega odgovora je odvisna od vrednosti:

• parametra postavke b in

• parametra osebe .

Page 17: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Dvoparametrski (Birnbaumov) model:

( )exp ( )

exp ( )p Y

a b

a b

11

Postavke se razlikujejo v težavnosti (b)

in diskriminativnosti (a).

Page 18: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Triparametrski model:

( ) ( )exp ( )

exp ( )p Y c c

a b

a b

1 11

Model vsebuje tudi verjetnost odgovora

pri “odsotnosti sposobnosti” (c).

Page 19: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

0,0

0,2

0,4

0,6

0,8

1,0

1,2

-3

-2,6

-2,2

-1,8

-1,4 -1

-0,6

-0,2 0,2

0,6 1

1,4

1,8

2,2

2,6 3

theta

p(Y

=1)

b=0, a=2

b=0, a=1

b=1, a=1

Page 20: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

0,0

0,2

0,4

0,6

0,8

1,0

1,2-3

-2,6

-2,2

-1,8

-1,4 -1

-0,6

-0,2 0,2

0,6 1

1,4

1,8

2,2

2,6 3

theta

p(Y

=1)

b=0, a=1, c=0,2

b=0, a=0,2

b=1, a=3

Page 21: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Ocenjevanje parametrov:

metoda največjega verjetja

(Maximum Likelihood - ML)

“Vrednosti parametrov določimo tako, da ima vzorec rezultatov največjo verjetnost.”

Testni dosežek v IRT ni vsota odgovorov, ampak je izračunan na osnovi vzorca odgovorov. Preizkušanec je “lestvičen” na intervalni merski lestvici.

Page 22: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Primer:

Raschev (1PL) model,

imamo odgovore 3 oseb:

b = (-1, 0, 1) x = (0, 0, 1)

L x x x Q Q P

e e

e

eb b

b

b

( , , , , )

. ( ) . ( )

. ( )

. ( )

1 2 3 1 2 3 1 2 3

1 7 1 1 7 0

1 7 1

1 7 1

1

1

1

1 1

Page 23: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

b 0.0 0.1 0.2 0.3 0.4L .357 .386 .411 .432 .447b 0.5 0.6 0.7 0.8 0.9 1.0L .455 .458 .454 .444 .429 .409

.b 0 6

Pri standardizaciji je potrebno simultano ocenjevanje parametrov postavk in oseb.

Page 24: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Informacijska funkcija:

natančnost merjenja latentne poteze.

ISE

( )( )

1

2

I.f. je večja, če je: blizu b,a visok,c nizek.

Page 25: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

• model za graduirane odgovore (npr. Likertova lestvica),

• model za postavke izbirnega tipa (upošteva tudi napačne odgovore),

• linearni logistični modeli (modeliranje razlik v parametrih karakteristične funkcije),

• neparametrični modeli.

Nekateri drugi pomembni modeli:

Page 26: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Nekateri pomembni vidiki uporabe TOP:

• adaptivno testiranje,

• izenačevanje testov,

• odkrivanje pristranskih postavk.

Slabosti TOP:• TOP analiza zahteva zelo veliko število

preizkušancev,• različni tipi postavk zahtevajo različne

modele,• analiza zahteva specializirano programje.

Page 27: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Literatura za KTT in TOP:

Lord, F.M. in Novick, M.R. (1974). Statistical theories of

mental test scores (2nd printing). Reading, MA: Addison-

Wesley.

McDonald, R.P. (1999). Test theory: A unified treatment.

Mahwah, NJ: Laurence Erlbaum.

Nunnally, J.C. in Bernstein, I.H. (1994). Psychometric

theory (3rd ed.). New York: McGraw-Hill.

Page 28: KLASIČNA TESTNA TEORIJA (TEORIJA PRAVEGA DOSEŽKA)

Dodatna literatura za KTT:Ten Berge, J.M.F. (2000). Linking reliability and factor analysis: recent developments in some classical psychometric problems. V S.E. Hampson (Ur.), Advances in personality psychology: Volume one (str. 138-156). Hove: Psychology Press.

Gl. tudi Bucik, Osnove psihološkega testiranja in Sočan, Postopki

klasične testne teorije (v tisku).

Dodatna literatura za TOP:Hambleton, R.K., Swaminathan, H. in Rogers, H.J. (1991). Fundamentals of item response theory. Newbury Park: Sage.van der Linden, W.J. in Hambleton, R.K. (1997). Handbook of modern item response theory. New York: Springer.