Psihometrija - Skripta - Seminarski, Diplomski, Maturski Radovi, Ppt i Skripte Na Www.ponude.biz

Embed Size (px)

DESCRIPTION

DFGFD DFBD FVS FVFBDFB DGB

Citation preview

1. Pregled metrijskih karakteristika

psihometrija

1. uvod1.) uvodni pregled metrijskih karakteristika testovaPet metrijskih karakteristika

1. valjanost

2. pouzdanost

3. objektivnost

4. osjetljivost

5. badarenost

1.) valjanost

Pod valjanosti podrazumjevaju se dvije stvari (prema Krkovi, 1978)

1. Simptomatska ili dijagnostika valjanost:

Podaci o tome da mjerni instrument stvarno mjeri ba i iskljuivo onaj predmet mjerenja za koji je taj instrument namjenjen. Daje odgovor na pitnje to mjeri mjerni instrument.2. prognostika valjanost: Podaci o tome koliko se na osnovi rezultata dobivenih pomou nekog mjernog postupka moe prognozirati ili dijagnosticirati ispitanikov uinak u nekoj drugoj aktivnosti (kriterijskoj varijabli).2.) pouzdanost

pouzdanost predstavlja nezavisnost rezultata od djelovanja NSVF (nesistematskih varijabilnih faktora).

3.) objektivnost

OBJEKTIVNOST definira se kao nezavisnost rezultata mjerenja od ispitivaa-mjerioca.

4.) osjetljivost

Osjetljivost ili diskriminativnost mjerenja definira-na je kao mogunost razlikovanja ispitanika na osnovi njihovih brojanih rezultata

5.) badarenostBADARENOST ili GRADUIRANOST mjernog instru-menta jest mogunost utvrivanja kvantitativne vrijednosti individualnog rezultata mjerenja na nekoj od psihometrijskih ljestvica za vrednovanje.

( Obiljeja metrijskih karakteristika:

1. Povezanost metrijskih karakteristika:

Metrijske karakteristike donekle su meusobno povezane. Tako je valjanost rezultata niska ako su rezultati nepouzdani, a stupanj pouzdanosti je dalje nizak ako rezultati nisu potpuno objektivni.

2. NE-konstantnost metrijskih karakteristika:

Jednom utvren stupanj neke metrijske karakteristike u nekom testu nije trajno svojstvo tog mjernog postupka ili testa, ve pokazuje metrijske osobine - neke konkretne primjene odreenog mjernog postupka na ba toj konkretnoj skupini ispitanika.

SVAKA promjena ili u postupku mjerenja ili primjena na druge ispitanike ima za posljedicu promjenu brojanih vrijednosti pokazatelja metrijskih karakteristika.

2.) osnovni problemi psihometrije

1.) kako formulirati rezultat

Pitanje je kako izraziti rezultat nekog ispitanika u nekom testu. Osnovna racionala (logika) je da vei broj tonih rjeenja, pretstavlja veu izraenost neke pshike osobine.

2.) Kvantitativna interpretacija dobivenih rezultata

Pitanje je kako interpretirati dobiven rezultat, npr. je li nizak, prosjean ili visok. Kao referenina toka se esto uzima neka od sredinjih vrijednosti skupina kojoj neki ispitanik pripada.

3.) problem pouzdanosti ili tonosti rezultata

Problem pouzdanosti vrlo je bitan jer psiholozi esto odluuju o drugim osobama, te je vaan cilj poveati pouzdanost i tonost mjerenja. Pouzdanost se oituje kada ponovimo neki test na istom ispitanku i dobimo identian rezultat. No, u praksi je to poneto drukije.

4.) Problem valjanosti

Pitanje je je li dobiven rezultat posljedica djelovanja sposobnosti uenja, osobine linosti ili moda neeg sasvim treeg, tj. pitanje je kako psiholoki interpretirati rezultat. To je zapravo pitanje faktorske strukture testa (koje sve faktore i u kojem stupnju neki test mjeri odreene faktore).

5.) pitanje praktine upotrebljivosti testa

Mogu li testovni rezultati pomoi u poveanju tonosti donoenja odluka?

6.) Kako konstruirati psihologijski test

Pitanje je kako izgleda postupak konstruiranja testa, kakve karakteristike bi test trebao imati, a da bi bio od praktine vrijednosti i o emu te karakteristike zapravo ovise.

3.) osnovni "pojmovi"

1.) psihometrijaDEF.: Psihometrija je grana psihologije koja se bavi mjerenjem psihikih stanja i procesa.

Psihometrija je zapoela s problemima psihofizike, ali je danas sve vie zaokupljena teorijom testova i metodolokim problemima psihodijagnoze i prognoze.

2.) mjerenjeMjerenje je apstraktni pojam koji se moe proizvoljno definirati, pa tako postoji mnogo definicija koje se razlikuju po opsenosti.

DEF.: Mjerenje je pridruivanje brojeva pojedinim atributima prouavanih objekata u skladu s odreenim pravilima (i to tako da odnosi izmeu brojanih vrijednosti odgovaraju slinim odnosima meu objektima koje mjerimo).

UA DEF.: Mjerenje je usporedba veliine nekog objekta s mjernom jedinicom.

Osnovni pojmovi u ovoj definiciji su:

1.) PRAVILA: Pravila su odredbe kojima se opisuje mjerni proces i koja omoguuju njegovu provedbu.

( Pravilo pridjeljivanja brojeva moe biti bilo koje konzistentno pravilo (osim pridjeljivanja po sluaju). Ta pravila mogu biti jednostavna, ali i vrlo sloena i o njima ovisi na kojoj skali mjerenja e biti rezultati.

1. ( nominalna skala: svaki brojani simbol ima svoj identitet, tj. sigurno je razliit od drugog i reprezentira uvijek isto.

2. ( ordinalna skala: Za svaki broj vrijedi njegov kvantitativni identitet, pa tako brojevi koji nisu identini, manji su ili vei te se mogu redati po veliini.

3. ( intervalna skala: skala ima ekvidistantne jedinice, pa je mogue utvrditi stupanj razliitosti.

4. ( omjerna skala: sustav brojeva sadri jedinstveni broj - nula - koji reprezentira odsutnost mjerene pojave ili koliine.

( Pravila omoguuju standardiziranost mjernog pos-tupka. Standardizacija ukljuuje preciziranje svih postupaka primjene nekog testa, te bodovanja i naina vrednovanja bruto rezultata. Preciziranje postupaka mjerenja omoguuje dalje:

a) izjednaavanje uvjeta mjerenja kod svakog pojedinog ispitanika ili pojedinog objekta, i

b) objektivnost mjernog postupka koja se oituje u tome da razliiti ispitivai dobiju iste razultate.

B) ATRIBUTI: Konkretan predmet mjerenja, tj. karakteristika ili osobina predmeta prouavanja.

( 1. PROBLEM: Mjerenje se mora odnositi samo na jedan atribut, jer ako mjerenje sadri dva ili vie atributa onda su rezultati dijagnostiki neinterpreta-bilni. Tada nije naime mogue razluiti koliki udio svaki od atributa ima u tom zajednikom razultatu (faktorska istoa), tj. mogua je linearna kompenzacija.

NPR.: Imamo npr. sljedee rezultate: 180 cm visina, 80 kg teina. Mi ih moemo jednostavno interpretirati, jer svaka vriejdnost vai za "svoj" atribut. No, kad bi mjerni instrument simultano biljeio efete visine i teine: x = 260, tada bi taj rezultat bio dijagnostiki neinterpretabilan, jer nije jasno koliki je udio pojedinih atributa. Npr. pozanto je da na razultat u testu inteligencije utjee i motivacija, ali mi ne znamo njen udio, to uzrokuje smanjenu interpretabilnost rezultata.

( 2. PROBLEM: Ponekad se pokuava izmjeriti atribut koji uope ne postoji (npr. istraivanja rigidnosti - koja ne postoji kao samostalna osobina).

C) OBJEKTI: - su predmeti prouavanja ije karakteristike (atributi) se prouavaju.

U psihometriji su to dvije skupine:

1) ljudi i ivotinje

2) materijalni (fizikalni) objekti: intenzitet osjeta u odnosu na intenzitet podraaja.

Postoje dva pristupa u psihologiji:

1) EKSPERIMENTALNO PSIHOLOKI PRISTUP: Cilj je utvrdti ope zakonitosti te se zanemaruju individualne razlike; one se smatraju pogrekom mjerenja (npr. neka grupa je podvrgnuta odreenom tretmanu (NZV) i opaa se njegov utjecaj na ZV, a individulane razlike se saimaju u jednu vrijednost.

2) DIFERENCIJALANO PSIHOLOKI PRISTUP:

Centralni interes su upravo individualne razlike. Prouava se porijeklo i priroda individualnih razlika u razliitim osobinama. Cilj je to tonija dijagnoza pojedinca radi predvianja njegova ponaanja.

3.) karakteristike podataka dobivenih mjerenjem1. OBJEKTIVNOST ( zbog standardizacije mjerenja razliiti istraivai dobivaju iste rezultate.

2. Kvantifikacija ( rezultati mjerenja izraavaju se brojevima koji su oznaka za koliinu.

3. KOMUNIKACIJA ( upotreba rezultata u komunika-ciji s drugim ljudima; zbog brojane prirode i stan-dardizacije, komunikacija je minimalna.

4. EKONOMINOST ( Mjerenje je najekonominiji opis stvarnosti.

5. Mogunost generalizacije ( Podatke dobivene prema definiciji mjerenja oekujemo da emo ponovno dobiti u istoj situaciji.

4.) uloga mjerenja u psihologiji

A) Pred svaku znanost postavljaju se odreeni uvjeti:1. Provjerljivost podataka ( postie se jedino i samo standardizacijom mjernog postupka

2. PRECIZNOST ( najprecizniji podaci su kvantita-tivni.

3. MOGUNOST GENERALIZACIJE dobivnenih REZULTATA

Dakle, da bi psihologija mogla biti empirijska znanost, ona mora do relevantnih podataka doi mjerenjem, jer jedino mjerenjem dobiveni podaci zadovoljavaju uvjete i ciljeve znanosti.

B) 3 vrste prigovora na psihologijska mjerenja:

1.) Psihologija ima analitki pristup

Pristup znanstvene psiholgije jest, da se sva ponaanja mogu raslaniti na manje sastavne dijlelove (npr.: linost: prouavanje manjih dijelova moe dovesti do neeg konanog).

( NO, strunjaci ostalih struka koji imaju isti predmet interesa (psihijatri, defektolozi, i sl.) polaze od holis-tikog pristupa: smatraju da nije mogue analizirati pojedine aspekte ponaanja ili nekih struktura (npr. linost), jer je cjelina vie od sume djelova.

Zakljuak: Meutim pokazalo se, da kad je potrebno objanjavanje ili predvianje ponaanja, tada holistiki pristup nije uspjean i propada.

2.) ETIKI PRIGOVORI:

( Prigovor je da procedura mjerenja esto zadire u ljudsku intimu i time kri osnovna ljudska prava.

Meutim, psiholozi imaju etike kodekse koji definiraju pravila ponaanja psihologa i prava ispitanika.

3.) Psihologijska mjerenja nisu prava, direktna mjerenja( Ovaj prigovor je neosnovan, jer indirektna mjerenja nisu i pogrena mjerenja, ali treba jako paziti da se ne "promai" cilj, tj. da izmjerena manifestacija stvarno i iskljuivo odraava eljeni predmet mjerenja.

5.) DIREKTNA I INDIREKTNA MJERENJA

A) DIREKTNA MJERENJA: - predstavljaju usporedbe predmeta mjerenja sa mjernom jedinicom iste vrste (npr. duinu mjerimo duinom, teinu teinom i sl.). Pitanje valjanosti ovdje ne postoji jer je ona oigledna i ne treba ju dokazivati.

B) INDIREKTNA MJERENJA: U indirektnim mjerenji-ma mjerna jedinica i predmet mjerenja nisu iste vrste, ve zakljuujemo o veliini predmeta mjerenja na temelju njegovih manifestacija (npr.: mjerenje tem-perature visinom stupca ive; inteligencija: zna se koje podraajne situacije ju izazivaju i moemo uhvatiti njene manifestacije.)

U psihologiji direktnih mjerenja praktiki nema (osim Fechnerovog pokuaja da se intenzitet osjeta mjeri brojem diferencijalnih limena), ve su gotovo sva mjerenja indirektna mjerenja, i to iz dva razloga:

1. neke stvari koje mjerimo nisu direktno opaljive

2. nemamo dovoljno znanja da konstruiramo odgovarajui instrument.

( Osnovni problem: je PROBLEM VALJANOSTI: postoji naime teoretska mogunost da su manifestacije koje mjerimo zapravo proizvod nekog drugog faktora ili da nekoliko faktora utjeu na oblik manifestacije. U psihologiji na neki predmet mjerenja redovito djeluje velik broj faktora i te relevantne faktore treba ili eliminirati ili kontrolirati. No, poto radimo s ljudima mogunost otklanjanja i kontrola tih faktora je iz etikih razloga smanjena. U biti, indirektno mjerenje nije manje vrijedno od direktnog, ali zahtijeva poznavanje naina povezanosti izmeu onoga to mjerimo i razliitih vrijednosti na instrumentu.

Kod tehnikih (direktnih) mjerenja malo je drugih faktora koji utjeu na predmet mjerenja i lako ih je kontrolirati.

6.) osnovni psihometrijski problemi

1.) Prouavanje situacije - Ispitivanje uvjeta (situacija) u kojima se manifestira predmet mjerenja i otkrivanje uvjeta u kojima se predmet mjere-nja najbolje oituje, tj. optimalnih uvjeta.

2.) Klasifikacija razliitih manifestacija nekog predmeta mjerenja (reakcija ispitanika) - pitanje je koje reakcije su simptomatske za predmet mjere-nja.

3.) Transformacija razliitih manifestacija nekog predmeta mjerenja. Stvaranje kvantitativne skale i formiranje rezultata. Cilj je dobiti ko-ntinuum na kojem emo ispitanike razlikovati (npr. agresivnost).

7.) opa matrica podataka

( MODEL MJERENJA - je internokonzistentni plan na kojem poivaju postavke mjerenja

( Mjerna tehnika (metoda) = psihologijski tes-tovi predstavljaju mjernu tehniku. Cilj je proizvodnja jednog ili vie kontinuuma pomou kojeg moemo razlikovati ispitanike, tj. atribute.

( REZULTATI: sadre tri dimenzije = I.P.R.

I = ispitaniciP = podraaji ili situacije - sve ono to inimo u procesu mjerenja

R = reakcije - sve ono to ispitanik emitira na podraajnu situaciju

Jedan od problema u teoriji testova jest, kako formirati sumativni, konani rezultat nekog ispitanika kroz sve situacije.

8.) struktura psihometrije

Psihometrija ima tri djela:

1. teorija testova - ispituje mjerenje atributa ispitanika2. faktorska analiza (multivatijantna metoda) - omoguava svoenje veeg broja manifestnih varijabli na manji broj latentnih varijabli (faktora).

1. manifestne varijable - sve one koje su dobivene emprijskim postupkom.2. latentne varijable - skrivene varijable, ono to procjenjujemo na osnovi manifestnih varijabli (npr. inteligencija).3. teorija psiholkog skaliranja - Psihofizika i psihofiziki problem. Cilj je mjerenje karakteristi-ka podraaja.

9.) odnos teorije mjerenja i matematike

Obje discipline koriste modele, ali ti modeli se razliku-ju:

1.) (Matematiki modeli su apstrakcije koje mogu ali ne moraju imati veze sa realnim, stvarnim svije-tom.

( Metrijski modeli uvijek se odnose na neki aspekt realne pojave ili stvari

2.) ( Matematiki modeli su uvijek pravila koja opisu-ju neke operacije simbolima, a to mogu biti brojevi ili neto drugo.

( Metrijski modeli operiraju s brojevima shvae-nim kao kvantitativnim vrijednostima (ua definicija mjerenja).

3.) ( Matematiki modeli su interno-konzistentni

( Metrijski modeli - regularnost - tj. kvaliteta se ocjenjuje uvijek na temelju slaganja s empirijskim podacima, tj. koliko dobro predviaju pojave u realnom svijetu.

9.) skale mjerenja u psihometriji

Razliite skale se dobivaju ovisno o pravilu pridjeljivanja brojeva koje smo primjenili prilikom mjerenja. Postoje 4 glavne skale:

DiferencijacijaRang poredakUdaljenost objekataApsolutna veliina atributaRaunske operacije

Nominalna (--------

Ordinalna((------

Intervalna(((--+ , -

Omjerna(

(((+ , -

( , :

( Za formiranje intervalnih skala najee se uzima prosjek kao referenina toka i oznaava se s 0.

( Na razini skalnih toaka kod intervalne skale dozvoljeni su samo rauni "+" i "-", ali na razini intervala doputene su sve 4 raunske operacije.

Gore navedene skale jo moemo klasificirati na kvalitativne i kvantitativne:

1. kvalitativne - podaci predstavljaju samo identifikaciju, jer mjerena pojava varira u vrsti. Npr. razliita zvanja i znanja se izraavaju na kvalitativnoj skali (samo nominalna skala).

2. kvantitativna - mjerena pojava varira u frekvenciji, stupnju ili koliini, a podaci oznaavaju kvantitet. Npr. broj djece, visina, teina, dob i sl. (od ordinalne prema viim skalama).

Kvantitativne skale se dalje mogu podjeliti na rangovne i skalne, a skalne opet dalje a) na diskontinuirane (gdje nema prijelaza meu brojevima - troje ili etvero djece) i b) kontinuriane (gdje varijabla moe poprimiti bilo koju meuvrijednost - npr. visina, teina).

( Ordinalne skale ostaju invarijatne na sve - monotone transformacije

( Intervalne skale ostaju invarijatne na sve - linearne transformacije

4.) teorija testova

1.) uvodU primjenjenoj psihologiji testovi predstavljaju neza-mijenjivo sredstvo za dijagnosticiranje mnotva razliitih psiholokih atributa ovjeka. Oni su takoer i glavno sredstvo za evaluaciju efikasnosti razliitih tretmana.

TEORIJA TESTOVA = je skup modela, pretpostavki i teorija kojima se pokuava rijeiti osnovni problem psihometrije: cilj je kvantitativno opisati karakteristike ili atribute ljudi.

2.) POvijest razvoja testova - Prvi psiho-loki test je konstruirao francuski psiholog Alfred Binet 1905. godine u suradnji sa T. Simonom sa ciljem ispitivanja intelektualne razvijenosti djece.

I prije Bineta upotrebljavala se sintagma MENTALNI TEST (danas TEST INTELIGENCIJE), i te prve testove konstruirali su F. GALTON (u Evropi) i J. McKEEN CATELL ( u S.A.D.). Ovi autori su inteligenciju pokuali izmjeriti ispitivanjem senzornih sposobnosti. Pretpostavka je bila da oni ispitanici koji imaju bolje razvijene senzorne sposobnosti, takoer imaju i vei QI, pa su se ti prvi testovi "mentalnih sposobnosti" sastojali od testiranja AL i DL (apsolutnog i diferenci-jalnog limena). Ovo Galtonovo shvaanje temelji se i logiki proizlazi iz John Lockeove empiristike filozofije. John Locke je smatrao:"..da ne postoji nita u razumu to nije prolo kroz osjetila", pa tako oni koji imaju bolja osjetila, imaju i bolji razum.

No, empirijska istraivanja raznih autora nisu potvrdila tu pretpostavku, npr.:

1.) WISSLER (1901) ( Galtonovo shvaanje pro-vjeravao je tako da je raunao korelacije izmeu urada-ka na tim senzornim testovima i aktivnostima koje ovise o QI (npr. kolski uspjeh). Racionala takvog provjeravanja bila je da ako su dobro razvijene sen-zorne sposobnosti stvarno kljune za intelektualni razvoj, onda oni koji imaju visoki rezultat na senzornim testovima takoer moraju biti uspjeni i u intelektualnim aktivnostima, tj. mora se pokazati pozitivna korelacija izmeu senzornih i mentalnih sposobnosti. Kao dodatne kriterije je Wissler odabrao a) procjenu uitelja o inteligenciji uenika, i b) samoprocjene inteligencije svakog uenika.

2.) THORNDIKE (1909) - je koristio faktorsku analizu.

( Oba autora su dola do istog zakljuka: Senzorni testovi nisu dobri indikatori mentalne razvijenosti kod ljudi jer nije pronaena pozitivna korelacija, tj. Galtonova pretpostavka je pogrena. Zbog toga je Galtonov test ubrzo bio odbaen.

( BINETOV TEST INTELIGENCIJE IZ 1905.:

Sa sve veom proirenou masovnog kolovanja u Francuskoj se poelo raspravljati to uiniti s djecom smanjenih intelektualnih sposobnosti koja ne mogu pratiti redovni program rada. Osnovni problem bio je prepoznati koja su to djeca koja imaju smanjene mentalne mogunosti, tj. kako razlikovati potencijalno uspjenu od potencijalno neuspjene djece. Usljed toga raspisan je natjeaj za konstrukciju dijagnosti-kog sredstva za mjerenje intelektualnog statusa djece i Binetov-Simonova skala je pobijedila.

( Polazei od svoje globalistike, heterogene koncep-cije inteligencije koju je ovako formulirao:" Dobro rasuivati, dobro razumijeti i dobro i pravilno misliti - to su bitne karakteristike inteligencije", Binetov test inteligencije sadri 30 zadataka:

Od tih 30 zadataka:

- 18 zadataka se odnosi na razumijevanje (induktivno i deduktivno rezoniranje)

- 5 zadataka ispituju sposobnosti pamenja,- 3 zadatka ispituju psihomotoriku,- 3 zadatka ispituju kreativne sposobnosti.( BINETOVA OSNOVNA NAELA O MJERENJU INTELIGENCIJE1. Inteligencija je jedna kompleksna globalna sposobnost, te ju ne moemo mjeriti ili zahvatiti promatrajui ispitanika u elementarnim, jednostavnim zadacima, ve treba koristiti kompleksne i sloene zadatke.

2. Inteligencija se treba opaati u situacijama i problemima koji su slini realnim ivotnim situacijama.

( REVIZIJA 1908: Binet je 1908. godine preuredio skalu i nainio 2 bitne izmjene:

1. Zadaci su rasporeeni po kronolokoj dobi, tj. svaka KD rjeava drugaije zadatke koji su teinski primjereni za tu dobnu skupinu

2. Rezultat je poeo izraavati kao mentalna dob (MD), tj. rezultat je transformiran na skalu mje-seci i godina, pri emu MD ne mora odgovarati kronolokoj dobi. Osnovna logika je ta, da kod normalne djece mentalna dob odgovara kronolokoj dobi.

( W. WUNDT i W. STERN ( su 1912 (kad je poto-nuo Titanic), predloili da se intelektualna razvijenost izraava tzv. KVOCIJENTOM INTELIGENCIJE (QI), koji odgovara omjeru mentalne dobi i kronoloke dobi puta 100 (radi eliminacjie decimala), tj.:

Q I = MD / KD ( 100

Kvocijent inteligencije se definira kao "pokazatelj stupnja intelektualnog razvoja pojedinca u odnosu na prosjean stupanj razvoja drugih pojedinaca iste dobi" (P. Rjenik, 1981) i predstavlja indikator brzine mentalnog razvoja inteligencije. Dakle, to je ustvari broj koji nam pokazuje tempo razvoja intelektualnih sposobnosti. Prosjeni QI iznosi 100.

( Binetov test inteligencije preveden je na mnoge jezike i adaptiran je za specifine prilike mnogih zemalja, a jo se i danas koristi u itavom svijetu.

( GRUPNI TESTOVI: Za vrijeme I. svijetskog rata, SAD su trebale u vrlo kratkom vremenu mobilizirati ogroman broj ljudi (2 milijuna), te se pojavila potreba za testovima koji se mogu primjeniti na velikom broju ispitanika, tj. skupno i koji daju grubu procjenu inteligencije.

A) ( ARMY ALFA TEST - u tu svrhu je konstruirana skala army alfa test ( tj. prvi test za grupno testiranje inteligencije odraslih ljudi. To je bio verbalni test inteli-gencije. Po uzor na njega stvoren je itav niz serija i baterija testova inteligencije.

B ( ARMY BETA TEST - No, taj alfa test nije mogao zadovoljiti sve potrebe vojske (nepismenost, nepoz-navanje jezika i sl.) te je izraen tzv. army beta test. To je bio prvi neverbalni test inteligencije odraslih ljudi. U poetku su upute za taj test bile zadavane pantomimom.

Zakljuno treba rei da su svi ti testovi nastali kao odgovor na drutvene potrebe i poticaje i svi mjere kognitivne sposobnosti.( povijest kvantitativne teorije testova:

Kvantitativna teorija testova razvila se paralelno s razvojem testova.

Nekoliko bitnih elemenata njenog razvoja:

1. rxy - Pearson je razvio raun za raunanje korelacije

2. Klasina teorija pouzdanosti i osnove faktorske analize - Ch. Spearman,

3. Formulacija multifaktorske teorije strukture bruto rezultata:

opisuje od ega se sve sastoji bruto rezultat, tj. to sve utjee na njegovu veliinu.

pojava multifaktorske analize

2.) DEFINICIJA TESTA:

DEF.: Test je standardiziran postupak kojim se izaziva odreena aktivnost, a zatim se uinak te aktivnosti mjeri i vrednuje usporeujui ga sa rezultatima drugih ispitanika u istoj situaciji.( Glavni elementi te definicije su;

1. Standardiziranost( uvjeti mjerenja su unificirani, tj. izjednaeni za sve ispitanike. Standardiziranost je preduvjet objektivnosti testa.2. izaziva ( testovi su indirektna mjerenja 3. usporedba sa drugim ispitanicima ( ambicija testovnih mjerenja je intervalna skala; referenina toka moe biti ili prosjek skupine ili rezultati drugih ispitanika.

( znaaj testova u psihologijiPrimjena testova u psihologiji ima dvije glavne svrhe:

1. DIJAGNOZA - utvrditi trenutani stupanj razvijenosti neke psihike veliine kod jednog ili kod skupine pojedinaca.

2. PROGNOZA - predvianje uspjeha u nekim praktinim aktivnostima pomou rezultata dobivenih u nekom testu.

3.) klasifikacija testova

a) prema prirodi zadataka

1. TESTOVI MAKSIMALNOG UINKA

Sastavljeni su od zadataka u kojima sadrajno ili formalno postoje tona rjeenja.

U ovu skupinu spadaju testovi znanja i veina testova sposobnosti.

Zadatk ispitanika je to bre tono rijeiti to vie zadataka.

2. TESTOVI TIPINIH PONAANJA Sadre zadatke pitanja ili se trae procjene ispitanika ali ne postoje tona rjeenja (npr. testovi ekstraverzije, testovi neuroticizma i sl.).

Zadatak ispitanika je da procjeni svoje ili tue ponaanje.

b) prema nainu primjene

1. individualni testovi

Jedan ispitiva simultano ispituje samo jednog ispitanika.

2. grupni testovi

Jedan ispitiva simultano primjenjuje test na vie ispitanika.

c) prema predmetu mjerenja

1. testovi znanja

Testovi kojima se ispituje efekt nekog procesa treninga ili openito procesa poduavanja.

2. testovi sposobnosti

Ispituju se ope dispozicije ili potencijali ispitanika za obavljanje odreene aktivnosti. Razlikujemo:

1. senzorne

2. mentalne (kognitivne)

3. psihomotorike

3. testovi linosti u uem smislu

Testovi kojima se procjenjuju osobine temperamenta i karaktera. Razlikujemo:

1. ANALITIKE - njima se kvantificiraju pojedine osobine ili crte linosti (upitnici, inventari, skale procjene).

2. SINTETIKE - projektivne tehnike. Osobitosti: linost se eli opisati u cjelini, a ne izdvajajui pojedine osobine linosti.

d) prema vremenskom ogranienju

1. testovi brzine

Kod testova brzine postoji strogo vremen-sko ogranienje za rjeavanje testa.

Zadaci su u pravilu vrlo lagani, a vremensko ogranienje je glavni limitirajui faktor uspjenosti, pa uz jednake sposbnosti bri ispitanici postiu bolje rezultate.

Dakle, ispituje se i tonost, ali prije svega brzina rada.

2. testovi snage Kod testova snage nema vremenskog ogranienja, a teina zadataka postepeno se poveava. Glavni oganiavajui faktor uspjenosti je sposobnost ispitanika da rjeava sve tee zadatke.

Vremenska neogranienost je u praksi naravno samo teoretska jer se ispitanicima uvijek postavlja odreen vremenski period za rjeavanje testa. Pretpostavka je da je to vrijeme dovoljno da svaki ispitanik moe barem pokuati rjeavati sve zadatke i da je doao do granica svojih mogunosti.

Testovima snage se utvruje samo stupanj razvijenosti ispitivane osobine

( kompozitni testovi = su oni testovi koji se sastoje od vie dijelova (to mogu biti zadaci ili sub-testovi) i ukupni rezultat (xu) formira se kao aditivna linearna kombinacija uinaka u tim dijelovima, tj.:

xu = ((ixi ( xi = uradak u pojedinim dijelovima

( (i = ponder, tj. koeficijent koji mijenja znaenje pojedinih dijelova testa.

Najee je ( = 1, za sve i tada je xu = (xi. Meutim takvo formiranje esto nije najbolje rjeenje ve je bolje (npr. zbog poveanja osjetljivosti testa) pojedine dijelove diferencijalno ponderirati.

Opi cilj ili problem: saimanje informacija kompozitnih testova u mjernu skalu po kojoj emo rezlikovati ispitanike (xu).

3. LINEarni ili sumativni model mjerenjaDEF.: Model mjerenja je jedan interno-konzistentni plan koji omoguava ili opisuje proces nekog mjerenja.

Linearni ili sumativni model predstavlja ishodite za sve ostale modele mjerenja.

y

Zi = uradak

u testu -

-

-

l l l 0 - m + x

ATRIBUT (npr. inteligencija) Slika 1. KARAKTERISTINA KRIVULJA ZADATKAOvdje vidimo tzv. karakteristinu krivulju zadatka koja nam pokazuje: odnos izmeu veliine atributa i uinka u zadatku. Pretpostavka je da je to monotono rastua krivulja (tj. vea veliina atributa, vei razultat u zadatku). Osnovne pretpostavke linearnog modela mjerenja:1. Uradak u svakom testu sainjenog od niza zadataka je monotono rastua funkcija veliine atributa. No, ova pretpostavka nije stroga, jer dozvoljava vrlo razliite karakteristine krivulje zadataka (npr. mogu biti negativno ili pozitivno akcelerirane), ali ono to je bitno jest da je krivulja u svakom sluaju rastua.

Zi = uradak

u testu -

-

-

l l l 0 - m +

2. Ova prva pretpostavka vrijedi samo za SUMU karakteristinih krivulja zadataka u nekom testu, a ne i za ba svaki pojedini zadatak. Drugim rijeima, pojedine krivulje zadataka nisu toliko bitne, ve je odluujua suma svih krivulja.

3. Svi zadaci u testu imaju u izvjesnom stupnju isti predmet mjerenja (to se oituje u relativno visokim interkorelacijama).

2.) teorija pouzdanosti1.) uvod( DEF.: POUZDANOST = NEzavisnost rezultata od utjecaja NSVF, tj. dosljednost, vjernost, (tonost) rezultata.

Pouzdanost testa se manifestira u tome, da kad isti predmet mjerenja mjerimo nekoliko puta na istim ispitanicima, dobivamo iste ili vrlo sline rezultate. Dakle radi se o konzistentnosti testa. Kad bi test bio savreno pouzdan, rezultati bi kod svakog mjerenja bili potpuno identini (r = 1, (e = ()( pitanje pouzdanosti i tonosti mjerenja:

Neki test koji je pouzdan ne mora biti i toan mjerni instrument. Pouzdanost znai dosljednost, osloboe-nost od nekontroliranog variranja. No, neki test moe vrlo dosljedno pogreno mjeriti neku pojavu, to znai da on je pouzdan ali ne i toan.

(NPR.: Ako na nekom termometru pomaknemo cijev sa ivom nanie, termometar e pokazivati pogrenu temperaturu, ali e je pokazivati konzistentno krivo. Takva sistematska pogre-ka - ako za nju znamo - ne predstavlja nikakav problem, jer se ona raunski vrlo lako moe ispraviti.)

( zato je pouzdanost bitna u psihologiji?:

1.) KOmparacija razliitih ispitanika (po istoj osobini):

Stupanj povjerenja u to da razlika izmeu dva konkretno dobivena rezultata reflektira realnu razliku razvijenosti te sposobnosti - je funkcija pouzdanosti mjerenja (reciprona funkcija nepouzdanosti ili veliine nesistematskog varijabiliteta u rezultatima).

2.) Komparacija razliitih osobina kod istog ispitanika:

(Isto kao i kod 1.) - to rezultati manje NS variraju, to oni tonije pokazuju izraenost neke osobine, pa je laka i usporedba osobina meusobno.3.) Problem valjanosti:

Openito - to je manja pouzdanost, to je manja i valjanost. Valjanost moemo interpretirati kao sposobnost testa da mjeri samo one faktore koje treba mjeriti. Prema tome ako su rezultati pod velikim utjecajem NSVF - tada test ne mjeri samo te eljene faktore, pa time nije valjan. Korelacije sa kreiterijima su smanjene, te su i dijagnoze neprecizne i neinterpretabline, a smanjena je i mogunost prognoze (kriterijska i simptomatska valjanost je smanjena).4.) Otkrivaje i evaluacija efekata razliitih unutarnjih i vanjskih faktora na veliinu rezultata u testu:

Vei nesistematski varijabilitet moe znaajno maskirati efekte raznih intervenirajuih faktora (jer je tee razluiti to je posljedica NSVF, a to intervenirajueg faktora.

( SASTAV BRUTO REZULTATA:

Smatra se da su BRUTO rezultati pod utjecajem triju faktora:

1.) Prava veliina mjerenja,

2.) Nesistematski V.F.,

3.) Sistematski V.F.

Osnovni cilj mjerenja jest da rezulrati reflektiraju samo pravu veliinu mjerenja

NSVF = faktori koji ne utjeu prema nekom pravilu (ve sluajno) - pa zato ponekad djeluju poveavajue, a ponekad smanjujue na bruto rezultat, to vodi od normalnosti distribucije bruto rezultata. Njihova ukupna rezultanta je (kad bi imali beskonaan broj mjerenja) jednaka nuli.

Sistematski VF = faktori iji utjecaj je matematiki zahvatljiv

( kvantitativni indikatori pouzdanosti

1.) standardna pogreka mjerenja: (errorDEF.: (e = standardna devijacija distribucije rezultata svakog RETKA ((i(), tj. rezultata dobivenih kod ISTOG ISPITANIKA u nizu paralelnih testova.

( (e = 0 : ako je mjerenje tog ispitanika bilo saveno pouzdano

( (e > 0 : ako su rezultati pod utjecajem NSVF (to je vei utjecaj NSVF, to je vea (e).

2.) Koeficijent pouzdanosti: rxxDEF.: Korelacija izmeu dva paralelna testa, a moglo bi se i rei korelacija testa sa samim sobom. Odreuje se na razliite naine:

a) sukcesivnom primjenom istog testa (= retest - metoda; koeficijent stabilnosti)

b) kao korigirana prosjena interkorelacija razliitih dijelova istog testa (= metoda diobe testa; koeficijent nutarnje konzistencije)c) korelacija izmeu dvije ekvivalentne forme istog testa (= metoda alternativnih formi; koef. ekvivalentnosti)( INTERPRETACIJA KOEF. POUZDaNOsti:

1. Koeficijent pouzdanosti odgovara proporciji prave varijance u totalnoj varijanci, pa se zato moe interpretirati kao koef. simptomatske valjanosti (jer nam pokazuje koliki udio ima pravi rezultat u dobivenom bruto rezultatu, tj. koliko dobro nam bruto rezultat reflektira pravu veliinu mjerenja).2. Koeficijent pouzdanosti je, znai, korelacija izmeu dva paralelna testa, pa se zato moe interpretirati kao koeficijent prognostike valjanosti rezultata u jednom paralelnom testu za prognozu razultata u bilo kojem drugom paralelnom testu (jer imaju isti predmet mjerenja).

Koeficijenti pouzdanosti suvremenih psihologijiskih testova u pravilu su vei od 0.80, a kod testova koji se koriste pri individualnoj dijagnozi i prognozi, poeljno je da budu vei od 0.90.2.) teorija pravih rezultata i pogreaka mjerenja (klasina teorija pouzdanosti ili mjerenja - Spearman, Thurstone, Guilford, Jule)

1.) uvod

( Definicija bruto rezultata:

xt = x( + xe

xt = BRUTO REZULTAT

- je tzv. netoan rezultat (failible score)

- to je onaj neposredan rezultat koji dobijemo bilo kojim mjernim postupkom.

x( = pravi rezultat

- je rezultat koji bi dobili savreno pouzdanim mjerenjem (true score)

xe = komponenta pogreke

- onaj dio bruto rezultata koji je uvjetovan djelovanjem NSVF i uzrok je razlike izmeu BRUTO i PRAVOG rezultata: xe = Xt - X(x( - Jedinstveni simbol za pravu veliinu mjerenja ne znai da je ona determinirana samo jednim faktoro-m, tj. da je neka jedinstvena (primarna) sposobnost. Pravi rezultat moe biti i suma vie komponenata:

x( = x(1 + x(2 + x(3 + . . . + x(nxe - Takoer i komponetu pogreke moemo shvatiti kao sumu razliitih sluajnih faktora:

Xe = XAe + XBe + XCe + . . . + XNe

NPR.:

XAe = pogreka u instrumentu (testu)

XBe = pogreka u vezi s vanjskim faktorima

XCe = pogreka u vezi s fiziolokim stanjem ispitanika

XDe = pogreka u ocjenjivanju odgovora ili oitavanju mjerne skale

XEe = pogreka zbog kolebanja u raspoloenju ispitanika

( U klasinoj teoriji pouzdanosti baratamo sa dvije vrsti varijabli:a) LATENTNE VARIJABLE = varijable koje ne moe-mo izravno opaati, ve na njih zakljuivati preko manifestnih varijabli. To su ovdje: x( i xeb) Manifestne varijable = dobivamo ih empirijs-kim ispitivanjem ( xt - dakle to su bruto rezultati

2.) tri osnovne pretpostavke kl. t. p.

1.) predmet mjerenja je stabilan (nepromjenjiv) u vremenu

( ako neku stvar nekoliko puta sukcesivno mjerimo onda bi trebali dobiti isti rezultat jer se sama stvar u toku vremena nije promijenila.

( Te stabilne karakteristike neke osobine pojedinca su osnovica PRAVOG REZULTATA (x().

2.) pogreke mjerenja (xe) su potpuno sluajne varijable

( Posljedica su NSVF, pa zato:

1.) rezultati se distribuiraju normalno

2.) Me = ( - jer se djelovanje NSVF meusobno ponitava.

3.) re,( = rei,ej = rey = ( - korelacija izmeu komponenata pogreke i izmeu bilo kojih drugih komponentata rezultata = (3.) bruto rezultati su j.l.k. prave veliine mjerenja i pogreke mjerenja

xt = x( + xe3.) odnosi parametara koji slijede iz k.t. Pouzdanosti:a) za SVAKOG ISPITANIKA:

1.) Mt = M( : jer se NSVF meusobno ponitavaju

2.) M(i = X(i : M-pravih rezultata = PRAVOM rez.

3.) Me = ( : jer se NSVF meusobno ponitavaju

4.) V( = ( : jer je predmet mjerenja stabilan u vremenu

?5.) Vt = M( : jer je jedini izvor varijabiliteta NSVF

b) za PARALELNE TESTOVE:

1.) (Mi = (Mj : M-pravih rez. su kod SVIH paralel. test. identine

2.) (Vi = (Vj : V-pravih rez. su kod SVIH paralel. testova identine

3.) eMi = ( = eMj : M-pogreke je kod svih paralel. testova = 0

4.) eVi = eVj : V-pogreke su kod SVIH paralel. testova identine

5.) r(i(j = 1 : Pravi rez. paralel. testova su u potpunoj korelaciji

4.) POUZDANOST I PARALELNI TESTOVI:

Dakle, pouzdanost se pokazuje - ako isti predmet mjerenja mjerimo nekoliko puta i svaki put dobimo prilino sline rezultate. Zbog toga je uveden pojam "paralelnih testova", a oni se definiraju kao: testovi koji imaju isti predmet mjerenja.

PARALELNI TESTOVI:

= testovi koji fakat imaju isti predmet mjerenja

Npr.:paralelni testovi 1-3

Test 1

Test 2Test 3

Zad. 1

1,2,3,_,_,_

2,3,4,_,_,_7,8,9,_,_,_

Zad. 2

1,4,2,4,_,_2,6,3,6,_,_4,1,5,1,_,_

Kad bi paralelni testovi bili savreno pouzdani, onda bi svaki ispitanik u svakom od paralelnih testova imao potpuno isti rezultat, korelacija meu rezultatima istog ispitanika bi bila 1, a varijanca bi iznosila 0 (Vi = 0).

( etri glavna obiljeja paralelnih testovaPostavlja se pitanje kada dva testa moemo smatrati paralelnima. Takav zakljuak je dozvoljen kad ti testovi zadovoljavaju 4 statistika kriterija:

1.) Mt : Aritm. sredina BRUTO REZULTATA( Pretpostavka: ______________________

( ______________________ ( _______________

( DAKLE: M - BRUTO REZ. = M . PRAVIH rez.: jer je M - POGREKE = 0

( PRAVILO: Zato moraju M - BRUTO rez. u svim paralelnim testovima biti iste (jer je prava veliina predmeta mjerenja ista).

2.) Vt : Varijanca BRUTO REZULTATA( Pretpostavka: ______________________________

( ______________________________

( ______________________________

( ______________________________

( DAKLE: V. BRUTO rez. = V. pravih rezultata + V. POGREKE.

Vrijedi: Vei = Vej kao i V(i = V (j , tj. sve komponente Vt su kod svih paralelnih testova iste, iz ega slijedi da su i varijance bruto rezultata kod svih paralelnih testova iste.

( PRAVILO: Varijance BRUTO reultata su - kod svih paralelnih testova iste.

3.) rxx: KORELACIJA izmeu DVA PARALELNA TESTA

Korelacija izmeu dva paralelna testa odgovara termi-nu "koeficijent pouzdanosti". to je korelacija izmeu dva paralelna testa vea, to je i pouzdanost svakog od tih paralelnih testova vea.

( Pretpostavke:

_________________ gdje je: __________________

_________________ gdje je: __________________

( Izvod (Pearsonov r):

rxy =

( =

( = ( =

( DAKLE: rxx = korelacija izmeu dva paralelna testa je OMJER VARIJANCE PRAVIH rezultata i VARIJAN-CE BRUTO REZULTATA

PRAVILO: paralelni testovi moraju biti u podjednakim koreacijama:

r12 = r13 = r23 = rij

4.) rxc: KORELACIJA izmeu paralelnih testova i kriterijske varijableKorelacija izmeu paralelnog testa i kriterija (rxc) je zato bitna, jer nam pokazuje dijagnostiku ili prog-nostiku valjanost tog testa.( Pretpostavke:

( X ( rezultat u paralelnom testu : Xt = X( + Xe( C ( rezultat u kriterijskoj varijabli: C - sadri samo prave rezultate

( IZVOD: rxc =

( DAKLE: rxc = r(c ( ( rxxPrognostika ili dijagnostika valjanost nekog testa, tj. veliina rxc ovisi o dva faktora:

a) r(c : o korelaciji izmeu PRAVOG rez. i KRITERIJSKE VARIJABLE

b) rxx : o koeficijentu pouzdanosti

( Pravilo: Korelacije izmeu pojedinih paralelnih testova i kriterija su identine.5.) Djelomina korekcija zbog atenuacije (nepouzdanosti):( Budui da mjerenje praktiki nikada nije potpuno pouzdano, i da nepouzdanost mjerenja smanjuje veliinu koeficijenta korelacije, dobiveni koeficijenti korelacije ne pokazuju pravu povezanost meu vari-jablama, ve je ona podcijenjena. Zato treba provesti korekciju zbog atenuacije ( = nepouzdanosti) i tako dobivena vrijednost (rtt) pokazuje kakva bi bila korelacija kad bi mjerenje u obje (ili samo jednoj = djelomina korekcija) varijable bilo savreno pouzdano.

( Raun se temelji na koeficijentima pouzdanosti jedne i druge varijable: (rxx i ryy).

( Da bi dakle dobili korelaciju izmeu pravih rezultata testa i kriterija (a ne BRUTO rez.) trebamo samo okrenuti formulu, tj.:

rx(c =

ili - ako provodimo potpunu korekciju zbog atenuacije onda formula glasi:

rx(y( =5.) standardna pogrka mjerenja ((e)

( Standardna pogreka mjerenja je ustvari standardna devijacija distribucije rezultata dobivenih kod istog ispitanika u nizu paralelnih testova, i njena veliina ovisi o pouzdanosti mjerenja, jer to je test nepouzda-niji, to e se rezultati istog ispitanika vie meusobno razlikovati, a time e se poveat rasprenje distribucije rezultata istog ispitanika (tj. (e).

( Prema tome, pomou standardne pogreke mjerenja mogu se opisati granice intervala unutar kojeg se sa izvesnom vjerojatnou nalazi prava veliina pred-meta mjerenja nekog ispitanika. (npr.: ( 1.96 (e). SPM je to manja, to je vea pouzdanost mjerenja.

( SPM predstavlja procjenu pogreke rezultata mjere-nja, a odreuje sa na temelju koeficijenta pouzdanosti.

IZVOD:

( rxx = gdje je : V( = Vt - Ve ( Vt = V( + Ve( Dakle: rxx =

i dalje:

( Ve = Vt (1- rxx), to znai ((( (e = (t ( 1 - rxx,a za standardizirane z - vrijednosti: (e = ( 1 - rxx( Formula za raunanje INTERVALA u kojem se nala-zi PRAVi rezultat:

5 %: Xt ( 1,96 ( (e1 %: Xt ( 2,58 ( (e6.) indeks pouzdanosti mjerenja

( Indeks pouzdanosti predstavlja procjenu korelacije izmeu bruto rezultata mjerenja i teoretskih "pravih" rezultata (tj.: rxt,x().

( IZVOD:

( rxt,x( =

( =

( =( tri INTERpretacije indeksa pouzdanosti

1.) procjena korelacije izmeu bruto i pravih rezultata = koef. prognostike valjanosti - koristi se za proraunavanje (prognoziranje) najvjerojatnijih pravih rezultata na temelju (ind.) bruto rezultata. No, u praksi se ovakva prognoza u pravilu ne ini, jer je ona optereena istom pogrekom mjerenja kao to su i sami bruto rezultati.2.) maksimalno mogua korelacija - koju moemo oekivati izmeu dobivenih bruto rezul-tata u tom testu s bilo kojom drugom varijablom.

(NPR.: rxx = 0.64 ( max. korelacija izmeu testa i kriterija: ( rxx =3.) indikator simptomatske valjanosti testa

kvadrat i. p. ( ( rxx )2 = rxx - nam pokazuje koliki dio varijance bruto rezultata je uvjetovan od strane pravih rezultata. Zbog toga ga je mogue interpretirati kao indikatorom simptomatske ili dijagnostike valjanosti.( PROGNOZIRANJE PRAVOG REZULTATA:

Vrijednost PRAVE VELIINE predmeta mjerenja nije mogue izravo odrediti. No, pomou JEDNADBE CRTE REGRESIJE mogue bi bilo proraunati najvjerojatniju veliinu PRAVOG rezulata, na osnovi dobivenog bruto rezultata, tj.:

1.) Mt = M(.

2.) rxt,x( =

3.) (( ( rxx =

=

DAKLE: X(( =

( =

X(( =

3.) determinante pouzdanosti mjernja1.) Ovisnost koef. pouzdanosti od broja mjerenja

Openito vrijedi: to je vei broj mjerenja - to je vea i pouzdanost rezultata koji je (kao suma ili prosjek izveden) iz tih mjerenja.

ZATO: Svaki bruto rezultat je pod utjecajem NSVF, a to je vei broj rezultata dobivenih u nizu paralelnih testova, to se ti NSVF vie meusobno ponitavaju. Zbog toga, moe se oekivati da e prosjeni rezultat koji je dobiven iz nekoliko mjerenja bolje reflektirati pravu veliinu predmeta mjerenja od bilo kojeg pojedinanog rezultata

( SPEARMAN - BROWNOVA FORMULA:( Osnovna logika: Kad bi imali nekoliko paralelnih testova mogli bi formirati grupe od po nekoliko paralelnih testova u par kompozitnih testova.

NPR.:

( Za oekivati su dvije stvari:

1.) Oekiva se da e varijabilitet prosjenih rezultata iz takvih grupa paralelnih testova (tj. kompozita) biti manji od varijabiliteta bruto rezultata iz niza pojedinanih paralelnih testova, jer e se (u prosjenim vrijednostima kompozita) NSVF djelomino ponititi.

2.) Oekiva se da e korelacija izmeu takvih dvaju kompozita biti VEA od korelacije izmeu bilo koja dva paralelna testa.

Na osnovi takvog rezoniranja izvedena je tzv. SPEAR-MAN - BROWNOVA formula: Ona nam omoguuje da se procjeni pouzdanost testa koji je produen, a poznata mu je veliina samo poetnog (prvog) dijela.

SPEARMAN - BROWNOVA FORMULA:

rtt =rtt =

( rtt nam pokazuje:

a) Odnos izmeu broja paralelnih testova u kompozit-nom testu i pouzdanosti mjerenja s tim kompozitnim testom.

b) Pouzdanost tih paralelnih testova.

ZAKLJUAK: to je test dui - pouzdanost je vea, a time i koeficijent pouzdanosti.

NPR.: rxx = 0.3

rtt

br. dijelova kompozita

Odnos izmeu broja dijelova kompozita i pouzdanosti jest negativno akceleriran. Na poetku poveanje broja dijelova rezultira brzim porastom pouzdanosti, no, kasnije pouzdanost sve se sporije poveava.

No, taj odnos takoer ovisi i o poetnoj pouzdanosti. Ako je ona visoka, poetni porast e biti sporiji i ranije e dostii gornji plato.

( FAKTORI KOJI UTJEU NA rtt1.) Broj paralelnih testova u kompozitu: vei broj = vea pouzdanost kompozita

2.) Pouzdanost tih pojedinih paralelnih testova (rxx): vea pouzdanost pojedinih testova = vea pouzdanost itavog kompozita.

( TRI PRAKTINE PRIMJENE SB - formule:

1.) PROCJENA POUZDANOSTI KOMPOZITNIH TESTOVA

2.) PROCJENA PROMJENA U POUZDANOSTI PRILIKOM PREURE-IVANJA TESTA

- smanjenje br. zadataka ( manja pouzdanost

- poveanje br. zadataka ( vea pouzdanost

3.) PROCJENA POTREBNOG BROJA ZADATAKA DA BI SE POSTIGLA ZADANA POUZDANOST MJERENJA

( Formula: k =

( to e se desiti s varijabilitetom ako se promjeni pouzdanost ?Vt = V( + VeVrijednost koeficijenta pouzdanosti (rxx) i varijance bruto rezultata (Vt) su obrnuto proporcionalni.

Ako smanjimo koef. pouzdanosti, varijabilitet nekog testa e se pove-ati jer se Ve poveava, a V( ostaje ista. Suproto vrijedi ako poveamo koef. pouzdanosti.

Dakle, do promjena u Vt dolazi sa-mo zbog Ve (to ne znai da je pouz-danost u kontradikciji sa osjetiljvosti ( zapravo ako je Ve velika unato velikog rasprenja rezultata ne mo-emo dobro razlikovati razultate ispitanika jer ne znamo je li razlika posljedica djelovanja NSVF ili odra-ava stvarnu razliku.

3.) kriterijska valjanost ovisi o...

Rekli smo da je korelacija izmeu dvije varijable ovisna o pouzdanosti, i da je uvijek smanjena jer niti prediktori niti kriteriji nikada nisu savreno pouzdani. Dalje je reeno da se prava korelacija moe proceniti izvodei korekciju zbog atenuacije. Ako tu formulu okrenemo dobivamo sljedei izraz:

Prema tome, korelacija izmeu dvije varijable ovisi o barem dviju stvari:

1. rx(,y(U korelaciji mogu biti samo pravi rezultati, a pogreke ne mogu nikako korelirati ili utjecati na korelaciju; dakle korelacija izmeu prediktora i kriterija moe maksimalno onolika kolika je kolika je korelacija izmeu pravih rezultata prediktora i kriterija (rx(,y().

2. rxx, ryyrxy e biti maksimalna jedino ako su rxx i ryy = 1, tj. ako je i prediktor i kriterij maksimalno pouzdan. Naime to je pouzdanost manja, to je i manja njihova korelacija.

Osim toga procjena korelacije ovisi jo i o:

3. to je vei N ( jer je tada je pouzdanost vea

4. Kada je uzorak reprezentativan.

4.) empirijske metode za odreivanje pouzdanosti1.) uvod

Pouzdanost se u psihometrijskoj teoriji odreuje kao proporcija "prave" varijance u ukupnoj varijanci rezultata mjerenja, pri emu je prava varijanca jednaka razlici izmeu ukupne varijance i varijance pogreke.

Problem je meutim u tome to se pogrena, odnosno prava varijanca ne moe jednoznano odrediti, pa se koriste razliite metode za procjenu pouzdanosti. Kako te razliite metode ne zahvaaju iste izvore pogrene varijance, one dovode do razliitih vrsta procjena. Premda razliite, ni jedna od ovih vrsta nije openito bolja od druge. Koju emo od njih odarati ovisi o specifinostima i ciljevima konkretnog mjerenja.1.) metoda retestaDEF.: Retest metoda se sastoji od viestruke primjene istog testa na istoj skupini ispitanika. Rauna se korelacija izmeu rezultata svih primjena i kao koeficijent pouzdanosti uzima se prosjena interkorelacija svih tih primjena. Taj dobiven koerficijent pouzdanosti se naziva:

.......koef. stabilnosti

( PREDNOSTI:

1.) dovoljna je samo jedna forma testa i

2.) poto je uzorak podraajnih situacija (zadataka) konstantan, velika je vjerojatnost da e svaka primjena inducirati iste sposobnosti i osobine.

( NEDOSTACI:

1.) Osnovni problem je da kod opetovane primjene istog testa postoji djelovanje sistematskih psiholokih faktora (serijalnih) koji poveavaju (ili ponekad smanjuju) rezultate. (npr. transfer, vjebanje, specifino pamenje rjeenja nekih zadataka i sl.). Problem je kako eliminirati utjecaj tih faktora.

Osnovni postupak za smanjenje transfera je umetnuti dugaak vremenski interval izmeu pojedinih mjerenja, ali ovdje se dalje postavlja pitanje optimalne duine intervala izmeu testa i retesta: a) ako je naime interval pre dug, postoji opasnost da se promjeni predmet mjerenja, tj. prava veliina mjerenja, odnosno b) ako je interval prekratak onda postoji poveana opasnost da e rezultati biti pod utjecajem serijalnih efekata. U jednom i u drugom sluaju e korelacije izmeu dvije primjene testa reflektirati i neto drugo osim pouzdanosti mjerenja.

2.) Drugi problem je taj da ve samo rjeavanje zadataka u testu moe izmjeniti ispitanika na manje ili vie trajan nain (NPR.: Ako se nekim upitnikom trai da procjenjuje vrijednost svog ponaanja s etikog ili moralnog stanovita, sam taj proces autoevaluacije moe uzrokovati trajne promjene u njegovom ponaanju).

( UTJECAJ SELEKCIJE ISPITANIKA NA KORELACIJU:Drugu primjenu testa (tj. retest) ponekad moemo obaviti samo na nekim i ispitanicima, tj. onima koji su proli selekciju. Problem sa selekcioniranjem jest taj da taj postupak dovodi do smanjenja varijabiliteta u varijabli. Korelacijska povrina manja i nepravilnija je kod selekcioniranih ispitanika, to vodi do toga da je korelacija izmeu prve primjene i druge je MANJA neko to bi to bila da nismo izbacili neke ispitanike (korelacija selekcionirane skupine je potcjenjenja). Zapravo kad imamo selekcionirane ispitanike, imamo neregularnu situaciju jer to nije prava bivarijatna skupina. Dalje, to je selekcija stroa ( korelacijska povrina je manja i nepravilnija i njeno potcjenjivanje biti e vee.

Pearson je predloio sljedeu formulu kako bi se rjeio ovaj problem:

NPR.: Prijemni ispit za studij psihologije:

2.) metoda alternativnih formi istog testa

DEF.: Ekvivalentne forme nekog testa su niz testova koji su po obliku, sadraju i broju zadataka vrlo slini.

Meutim ekvivalentne forme nekog testa nisu nuno i paraleleni testovi. Da bi dva testa proglasili ekvivalent-nima dovoljna je fenomenoloka analiza, no to nije i dovoljan dokaz za paralelnost tih testova. Da bi dvije ekvivalentne forme testa bile ujedno i paralelne, mora-ju udovoljavati statistikim kriterijima za paralelne testove (etri su obiljeja paralelnih testova).

( KOEFICIJENT POUZDANOSTI: - se rauna kao ko-relacija izmeu dvije ekvivalentne forme nekog testa, a naziva se:

........koeficijent ekvivalentnostiAko postoji vie od dviju formi koeficijent pouzdanosti odgovara prosjenoj interkorelaciji.

( PREDNOSTI: Glavna prednost proizlazi iz injenice da su u ekvivalentnim formama zadaci donekle razliiti po sadraju, pa zato je smanjena mogunost prijenosa iskustva (npr. pamenje rjeenja) i drugih sistematskih faktora. No, ipak ostaje mogunost transfera opeg stava prema sadraju testa, ili opeg naina rjeavanja zadataka.

( NEDOSTACI:

1. Upravo zbog toga to se zadaci donekle razlikuju vjerojatno je da se pomou njih pobuuju i donekle razliiti psihiki procesi.

2. Zato se dalje smatra da kod ovakve procjene pouzdanosti dobivamo ustvari procjenu donje gra-nice pouzudanosti, a da je prava vrijednost najvjerojatnije via.

3. S praktine strane gledano, najvei problem predstavlja konstrukcija velikog broja "razliitih ali ipak istih" zadataka, kao npr. ako elimo napraviti 3 ekvivalentne forme nekog testa od 100 zadataka.

3.) metoda dijobe testa

DEF.: Metoda dijobe testa sastoji se u tome da se jedan test podjeli na nekoliko dijelova, te se rauna korelacija meu tim dijelovima. Dakle, zamiljamo si kao da je neki test ustvari kompozit od vie paralelnih testova

Ta metoda se koristi: a) kad je nemogue iste ispita-nike ispitivati vie od jedanput ili b) kad imamo na raspolaganju samo jednu formu nekog testa.

( KOEFICIJENT POUZDANOSTI: - odgovara korigira-noj prosjenoj interkorelaciji izmeu pojedinih dijelova istog testa (pomou SB formule), a naziva se:

.........koeficijent nutarnje konzistencije.

( emu korekcija: Korekcija pomou SB-formule nuna je zbog toga jer inae dobivamo pouzdanost sa-mo tih pojedinih dijelova testa, a ne pouzdanost itavog testa koja nas zapravo zanima. Pouzdanost pojedinih dijelova je manja, a razlog tome je taj, da su pojedini dijelovi testa krai od itavog testa, te se djelovanje nesistematskih varijabilnih faktora ne moe tako dobro uravnoteiti, to dalje vodi do smanjenja korelacije. Dakle, nekorigirana pouzdanost je potcijenjena.

PRETPOSTAVKA: Osnovna pretpostavka ove metode jest, da su pojedini dijelovi testa dovoljno paralelni.

Meutim, u praksi najee pojedini dijelovi testa nisu stvarno paralelni. Zbog toga koeficijent pouzdanosti dobiven i ovom metodom prestavlja samo aproksi-maciju prave pouzdanosti.

( Postoji nekoliko naina podjele nekog testa u sub-testove:1. TRANSVERZALNO = Npr.: Kad neki test od npr. 100 zadataka raspodijelimo tako da prvih 50 zadataka po redu ine prvi subtest (1-50), dok drugih 50 zadataka po redu (51-100) ine drugi subtest. Dakle, subtestovi se formiraju tako da svaki subtest ine sukcesivne skupi-ne zadataka.

2. longitudinalno = Npr.: Kad jedan subtest ine zadaci sa neparnim rednim brojem (1,3,5,... ,99), dok drugi subtest ine zadaci sa parnim rednim brojem (2,4,6,...,100) - (podjela par - nepar).

( USPOREDBA: Ako ova dva naina podjele uspore-dimo, onda longitudinalna podjela ima dvije prednosti pred transverzalnom podjelom:

1) Kod longitudinalne podjele se sistematski faktori ravnomjernije rasporeuju na svaki subtest (umor, efekt mjesta u seriji, poveanje teine zadataka i sl.).

Npr. zbog umora mogue je da ispitanici bolje rijeavaju poetne zadatke, a slabije one kasnije. Isto vrijedi, ako su poetni zadaci lake za rijeiti od oni kasnijih. U oba sluaja aritmetike sredine tih subtestova nee biti jednake, tj.: M1 > M2.

( Zbog toga su pojedini subtestovi kod longitudinalne podjele meusobno sliniji i vea je vjerojatnost da ti subtestovi zadovoljavaju kriterije paralelnih testova.

2) Osim toga, transverzalni rascijep je neupotrebljiv kod testova brzine, je ovdje svi ispitanici uspjeno rijeavaju samo prvi dio zadataka, a gotovo nitko ne rijeava zadnje zadatke. Zbog smanjenog varijabiliteta to rezultira nultim korelacijama meu subtestovima. Ovaj problem se rijeava tako da se svaki subtest zadaje zasebno, tj. da svaki subtest ima svoje ogranieno vrijeme rijeavanja.

( No, postavlja se pitanje to uiniti ako i kod lungitudinalne podjele aritmetike sredine subtestova nisu podjednake? Tada zadatke moemo podijeliti i prema indeksima lakoe i to tako da je suma tih indeksa lakoe jednaka kod svakog subtesta.

( Ogranienje metode: Metoda dijobe testa ne moe se upotrijebiti kod testova koji nisu kompozitni, kao npr. kod projektivnih tehnika, nekih psihomotorikih testova, testova brzine itd. i u tom sluaju se koriste druge metode za procjenu pouzdanosti.

3.1.) kuder - richardsonov problem

Metoda dijobe testa nalazi svoj logiki i praktiki ekstrem kad svaki pojedini zadatak shvatimo kao jedan subtest.

( Npr.: kad neki test od 100 zadataka podijelimo na 100 subtestova gdje je svaki zadatak jedan subtest.

Osnovna pretpostavka ove metode je - da su zadaci paralelni testovi, tj. da zadovoljavaju kriterije za paralelne testove.

( Koeficijent pouzdanost pojedinih zadataka odgovara korelaciji meu zadacima, a pouzdanost itavog testa se oreuje pomou SB-formule. Korelacija meu zadacima se moe izvesti iz formule za raunanje ukupne varijance linearnih kombinacija:

( Vu = (Vi + 2 ( rij (i (j( rij = rxx = ---------------

3.2.) odreivanje pouzdanosti testa( osnovna Formula:

( rtt = ------ ( (1 - -------)gdje je:

( k = broj zadataka

( vi = varijanca bilo kojeg zadatka

( Vu = varijanca bruto rezultata u tom testu

Meutim, ova formula je prilino neupotrebljiva u praksi jer su varijance zadataka eso dosta razliite, pa koritenje varijance samo jednog zadatka predstavlja grubo nametanje. Zbog toga je uvedena formula:

( Formula K - R - 20:

Kod ove formule se u brojniku koristi suma varijanci pojedinih zadatka. Dakle, za ovu formulu je bitno poz-navanje varijanci svih pojedinih zadataka. Kod binarnih zadataka to je: Vi = p(q( rtt = ------ ( (1 - -------)( Formula K - R - 21:

Meutim, kod binarnih zadataka, kada ne poznamo varijance pojedinih zadataka, moemo upotrijebiti prosjenu varijancu. Ova formula omoguuje dakle procjenu pouzdanosti testa sastavljenog od binarnih zadataka, kada su nam poznati samo M i V bruto rezutlata, a temeljna pretpostavka jest, da su svi zadaci u testu priblino podjednake teine.

( rtt = ------ ( (1 - -------)( USPOREDBA:

1. K-R-20: predstavlja dobru aproksimaciju pouzda-nosti (prema Brodgenu).

Ona nije toliko pogodna:

a) kada je broj zadataka samo malen,

b) kad su korelacije meu zadacima visoke.

2. K-R-21: predstavlja slabiju aprokcimaciju pouzda-nosti jer se koristi samo procjenjena prosjena varijanca u brojniku. Prednost ove formule je da se moe vrlo lako primjenjivati i nisu potrebne varijance svih zadataka.

Rulonova procedura Ova procedura je izvedena iz osnovnih pretpostavki klasine teorije pouzdanosti. Rulonov obrazac mogue je koristiti kada je test podijeljen u dva dijela, te ukoliko nam je poznata varijanca razlika izmeu rezultara koje ispitanici postiu u jednom i drugom dijelu testa:

( Vt = V( + Ve( rtt = V( / Vt = (Vt - Ve) / Vt =

rtt = 1 - Ve / VtKao to vidimo u ovoj formuli se koristi Ve = varijanca pogreke, no, to je problem ne postoji mogunost odrediti Ve. Zbog toga se umjesto Ve korisi Vd = koja predstavlja varijancu razlika izmeu dvije paralelne polovice testa. To znai: a) test se podijeli na dvije polovice; b) zatim se rauna razlika meu rezultatima istog ispitanika dobivenih u tim polovicama testa (d); c) i konano se rauna varijanca tih dobivenih razlika (Vd).

Ta varijanca predstavlja procjenu Ve itavog testa, a ne samo jedne polovice testa.

Flanaganova proceduraFlanaganova procedura poinje od Rulonovog obrazca: rtt = 1 - (Ve / Vt).

( Ve = VX1 - x2 = V1 + V2 - 2 r1,2 (1 (2( Vt = VX1 + x2 = V1 + V2 + 2 r1,2 (1 (2

rtt = 2 ( (1- (V1 + V2)/Vt)Ova formula se moe koristiti kada su poznate varijance dviju polovica testa.

L. Cronbachov (-koeficijentCronbach je predloio da se pouzdanost kompozitnih testova rauna uvijek na isti nain, bez obzira na to koliko dijelova je test podijeljen.

( rtt = ( = ------ ( (1 - -------)Ova formula predstavlja najpopularniju generaliza-ciju koeficijenta pouzdanosti (rtt). 4.) koeficijenti pouzdanosti

1. koeficijent nutarnje konzistencijeTo su oni koeficijenti koji se dobivaju metodom diobe testa.

( INTERPRETACIJA: oni pokazuju veliinu djelovanja NSVF u trenutku kada je test primjenjen.

to je rtt vei, to je slabije bilo djelovanje NSVF u trenutku primjene testa.

Ovaj koeficijent pouzdanosti nam ne govori o stabilnosti rezultata u vremenu, ne pokazuje da e rezultati istih ispitanika kod sljedee primjene biti isti ili moda razliiti.

Poto se djelovanje NSVF mijenja od trenutka do trenutka, ne smijemo pretpostaviti da e u sljedeoj primjeni koeficijent pozudanosti biti iste veliine.

2. koeficijent stabilnostiDobiva se metodom retesta.

( INTERPRETACIJA: oni pokazuju stabilnost predmeta mjerenja u vremenu.

to je rtt vei, to je stabilnihi predmet mjerenja u retest - intervalu (npr. visina odraslog ovjeka).

Temeljna pretpostavka je da NSVF podjednako dje-luju na rezultate kod prve i druge (i tree) primjene istog testa.

( Koeficijent stabilnosti i nutarnje konzistencije nisu meusobno povezani, pa zato na temelju podataka o stabilnosti teko zakljuujemo o nutarnjoj konzistenciji:

npr.:

1. TEST: rNut.Kon = 0; rstabil = 1

jer je predmet mjerenja u vremenu izrazito stabilan, ali pojedini zadaci su meusobno potpuno nezavisni

2. TEST (neki drugi): rNut.Kon = 1; rstabil = 0

jer je predmet mjerenja u vremenu izrazito nestabilan, ali svi zadaci mjere istu stvar.

3.) testovni rezultati1.) oblici testovnih rezultata

1. fizike ili tehnike skaleMeu fizikim skalama je najea vremenska skala (npr. vrijeme savladavanja Bonadelove sinu-soide, vrijeme reakcije, vrijeme itanja, vrijeme prolaska kroz labirint i sl.)

( Rezultat izraene na fizikim ili tehnikim skala-ma nikada ne koristimo u neposrednom obliku, ve se na temelju njih zakljuuje o psiholokim procesima, tj. pridruuje im se psiholoko znaenje. No, tada njihov metrijski identitet postaje upitan.

2. skala mentalne dobiPojam mentalne dobi kao prvi je uveo A. Binet, i to u sklopu 1. revizije svoga testa inteligencije (1908). Mentalna dob oznaava stupanj mentalnog razvoja nekog pojedinca izraenog u jedinicama godina i mjeseci. Na temelju mentalne dobi mogue je izraunati kvocijent inteligencije (QI) nekog ispita-nika.

( to se tie skale QI polazilo se od sljedeih pretpostavki:

- a) podrazumijevalo se da su jedinice na skali QI podjednako udaljene na svim dobnim skupinama, tj. da je to intervalna skala,

- b) da QI mjeren razliitim testovima znai uvijek isto,

- c) da je QI primjenjiv na svim dobnim i kulturalnim skupinama.

( KRITIKA: Kvocijentu inteligencije kao mjeri brzine mentalnog razvoja upuene su i neke kritike:

1.) Pokazalo se da skala QI nema identine jedinice na razliitim dobnim skupinama, odnosno standardne devijacije nisu podjednake veliine. NPR.:

mlaiMm = 100

SDm = 20

QIm = 120

zim = 1stariji

Ms = 100

SDs = 10

QIs = 120

zis = 2

To znai da su jedinice kod starijih ispitanika manje, to dalje ima znaajne reperkusije na psiho-loku interpretaciju dobivenih rezultata. Naime, kao to vidimo brojano isti rezultati dobivenih na razliitim dobnim skupinama nemaju isto znaenje, ve odstupanje QI starijih ispitanika od 100 znai vie jer je SD manja (to se vidi po z-vrijednostima: zim < zis).

2.) Sadrajno ili psiholoki QI je vrlo razliit ovisno o tome kojim testovima se odreuje mentalna dob. Naime, razliiti testovi inteligencije ispituju razliite mentalne funkcije pa zato su i QI dobiveni na razli-itim testovima zapravo neusporedivi i psiholoki predstavljaju sasvim rezliite stvari.

3. sumativni rezultatSumativni rezultat se najee definira kao aditivna linearna kombinacija uradaka u pojedinim zadaci-ma ili dijelovima testa, tj.:

xu = ((ixi (Galton - Thurstoneov princip)

Pri tome ( najee iznosi ( = 1, i tada govorimo o jednostavnoj linearnoj kombinaciji, no ako je velii-na ( za svaki dio testa odreena posebno, onda govorimo o diferencijalno ponderiranoj liearnoj kombinaciji.

( Veliina individualnog rezultata nekog ispitanika ocjenjuje se usporedbom u odnosu na prosjean rezultat njegove referenine skupine i s obzirom na rasprenje rezultata ispitanika koji pripadaju toj skupini (temeljna pretpostavka takvog postupka je, da je referenina skupina je po svojim osnovnim obiljejima slina ispitaniku).

( Na taj nain se rijeava problem nejednakih jedinica skale. Najee se rezultat transformira na standardiziranu skalu z-vrijednosti. Z-vrijednost nam pokazuje odstupanje individulanog rezultata od prosjeka, i to u jedinicama standardne devijacije.

2.) korekcija rezultata zbog sluajnog pogaanjaKorekcija zbog sluajnog pogaanja tonih i netonih odgovora je mogua samo kad test sadri zadatke maksimalnog uinka, tj. zadatke u kojima postoje toni odnosno netoni odgovori. U takvim testovima ispitanik moe dati etri kategorije odgovora:

1. R ( right - zadataci u kojima je ispitanik dao toan odgovor.

2. W ( wrong - zadaci koje ispitanik je pokuao rijeiti, ali nije uspio pronai tono rijeenje. Ispitanikovo traenje rijeenja je na neki nain vidljivo.

3. S - zadaci koji su preskoeni, a prepoznaju se po tome da nakon njih slijedi barem jedan pokuan zadatak (ispitanik je pokuao rijeiti, ali nije ostavio nikakav opaljiv trag)

4. U ( untouched - nepokuani zadaci, tj. nema nikakvog traga o pokuavanju rijeavanja (najee se nalaze na kraju testa i ispitanik ih nije stigao pokuati.

( Kao to smo spomenuli ukupni individualni razulati se formiraju kao linearna kombinacija uinaka u poje-dinim zadacima, odnoso ako svaki zadatak vrijedi je-dan bod, to je jednostavno ukupan broj tono rijeenih zadataka.

a) kod testova snage: oekujemo da e regularni odgovori biti R i W, jer se pretpostavlja da je ispitanik zbog neogranienosti vremena pokuao sve zadatke i da je to vidljivo kod svih zadatka. Neregularni odgovori su S i U.

b) kod testova brzine: oekuje se da e regularni odgovori biti samo R (jer su zadaci laki) i U (jer je vrijeme rada ogranieno). Neregularni odgovori su W i S.

Meutim u praksi ne postoje idealnih testova, te se redovito pojavljuju i neregularni odgovori.

2.1.) korekcija rezultata zbog sluanjnog pogaanja

Da bi korekcija rezultata imala smisla trebaju biti zadovoljena dva uvjeta:

1.) Zadaci su tipa viestrukog izbora: Mora postojati odreen, ogranien broj tonih rijeenja, a takoer mora postajati mogunost sasvim sluajnog pogaanja tih ili tog tonog odgovora. To je sluaj kod zadataka viestrukog izbora i samo kod njih korekcija zbog sluajnog pogaanja ima smisla.

( Vjerojatnost sluajnog pogaanja: ovisi o broju ponu-enih odgovora, npr.:

A = 2

A = 4

A = 10

A = 100

A = (p = 0.5

p = 0.25

p = 0.1

p = 0.01

p = 0

( Dakle - formula za raunanje vjerojatnosti sluajnog pogaanja glasi:

P = 1 / A

- gdje je A = broj ponuenih alternativa

( To dalje znai, da korekcija nema smisla, kada ispitanik mora sam dati odgovor, tj. nema nikakvih ponuenih odgovora. Razlog tome je taj, da tada ima praktiki beskonaan broj "(" ponuenih odgovora, pa je vjerojatnost sluajnog pogaanja jednaka nuli. Prema formuli: p = 1 / ( = 0. To vrijedi npr. kod zadataka tipa dopunjavanja, sreivanja i sl.

( Broj tonih rijeenja kod potpuno sluajnog pogaa-nje: Pretpostavimo da ispitanici ba ni ne znaju, i da su se odluili na potpuno sluajno pogaanje. Da bi odredili ili predvidjeli broj zadataka koji e oni ipak tono rijeiti moemo koristiti sljedeu formulu:

M = k / A

gdje je:

( k = broj zadataka u testu (npr. k = 10)

( A = broj ponuenih alternativa u svakom zadatku

2.) SAMO neki ispitanici su koristili strategiju sluajnog pogaanja:

Drugi uvjet da bi korekcija rezultata imala smisla je taj, da nisu svi ispitanici zaokruili ili dali odgovore u svim zadacima, ve su samo neki ba u svakom zadatku dali odgovor (jer su koristili strategiju sluajnog poga-anja), dok drugi ispitanici nisu dali odgovor u svim zadacima testa (jer nisu rijeavali po sluaju).

ZATO taj uvjet ( ovaj uvjet je bitan, jer ako su ba svi ispitanici rijeili sve zadatke tada nam korekcija ne pomae u boljoj diskriminaciji ispitanika (to je cilj). Naime, oni koji imaju netona rijeenja (jer nisu sluajno sve tono pogodili) tako i tako imaju manji broj bodova od onih koji su sve zadatke tono rijeili. Ako pak samo neki rijee sve zadatke (jer su pogaali), i mi provedemo korekciju, tada e biti penalizirani samo oni ispitanici koji su sluajno pogaali (jet imaju netone odgovore), dok e oni drugi biti poteeni negativnih bodova jer su oni davali samo tone odgovore (jer su ih znali), a nemaju netone odgovore u nekim zadacima (jer te zadatke nisu znali pa nisu niti davali odgovor).

2.2.) efekti sluajnog pogaanja:

1. POUZDANOST: sluajno pogaanje smanjuje po-uzdanost testa, jer takvi odgovori spadaju u kompo-nentu pogreke.

2. PROBLEM USPOREDBE: Ako neki ispitanici rijea-vaju po strategiji sluajnog odabira, dok drugi to ne ine tada se postavlja problem komparacije rezulta-ta tih ispitanika.

NPR.: k = 40 ; A = 2

( ISP A: pravi rezultat: x( = 20; bruto rez.: xt = 20

( ISP B: pravi rezultat: x( = 20; bruto rez.: xt = 30

Kao to vidimo, oba ispitanika su znala i tono rije-ila 20 zadataka, no, unato podjednakog znanja - bruto rezultat ispitanika B je zbog koritenja strate-gije sluajnog odabira odgovora u 20 zadatakac koje nije znao rijeiti - za 10 bodova vei od bruto rezul-tata ispitanika A koji, eto nije po toj strategiji rijea-vao zadatke koje nije znao (20 < 30). To je oigled-no nepravda i kompracija ispitanikovih znanja ne bi bila tona niti pravedna kad bi se temeljila na bruto rezultatima. Zbog toga se uvodi korekcija. Recimo da je ispitanik B sluajno tono rijeio 10 zadataka, kao to je isto tako sluajno netono rijeio 10 zadataka, kad se provede korekcija (x = 30-10 = 20) dobije se pravi rezultat ispitanika B koji je identian rezultatu ispitanika A.

( Poveana tendencija sluajnog pogaanja javlja se u odreenim uvjetima:1. U kompetitivnoj situaciji

2. Ako je test preteak

3. Ako je uputa ispitanicima neadekvatna

( to uiniti s rezultatima koji pokazuju da su ispitanici koristili strategiju sluajnog pogaanja:

1. Primjeniti neki drugi adekvatan test

2. Ponovno primjeniti test koji je olakan ili ispitanici imaju vie vremena za rijeavanje.

3. Provesti korekciju rezultata. Ukoliko svi ispitanici zaokrue sve zadatke ( tada korekcija nema smisla, jer su za sve ispitanike izjednaeni uvjeti po sluajnom pogaanju.

2.2.) osnovni modeli korekcije

Kod svakog modela postavlja se jedno temeljno pitanje na koje se pokuava dati odgovor.

1. dodavanje (rijetko u praksi)( Pitanje: "Koliko bi iznosio rezultat ispitanika, a da on je koristio strategiju sluajnog pogaanja".

( Formula: Rc = Rd + (B / A)

Rc = korigirani rezultat Rd = bruto rezultat B = S + U: broj zadataka u kojima nema rijeenja A = broj alternativa u zadacima

NPR.: Ako uzmemo kao primjer rezultate ve spome-nutih ispitanika A i B:

xA = 20 + (20/2) = 30

xB = 30 + (0/2) = 30

Ova korekcija koristi se kako bi ispitanike izjednaili po mogunosti sluajnog pogaanja i ona se utjee na rezultate samo onih ispitanika koji neke zadatke nisu rijeili (jer je inae B = 0).

Korekcija dodavanja ima samo smisla ako su indeksi lakoe vei od vjerojatnosti; ukoliko ja indeks lakoe manji od vjerojatnosti tada ispitanici koji su manje rijeili, tj. manje znaju dobivaju vei rezultat.2. oduzimanje (esto u praksi)( Pitanje: "Koliko bi iznosio rezultat ispitanika, a da on nije koristio strategiju sluajnog pogaanja, ili koliki je broj zadataka koje ispitanik stvarno zna rijeiti ."

( Dvije pretpostavke:

1. Pretpostavljamo da su S i U zadaci definitivno pre-teki za ispitanika i da ih ispitanik stvarno ne moe rijeiti.

2. Pretpostavljamo da dobiven bruto rezultat nije dobra mjera uinka jer je nerealno prevelik. Dakle, eksplicitno tvrdimo da ispitanik neke od zadataka koji jesu tono rijeni, nije zapravo znao rijeiti, ve je toan rezultat zadatka postignut sluajnim pogaanjem.

( Formula: Rc = Rd - (Wd / (A-1))

Rc = korigirani rezultat Rd = broj tono rijeenih zadataka Wd = broj netono rijeenih zadataka A = broj alternativa u zadacima

U toj formuli izraz Wd / (a-1) su ustvari tzv. "negativni bodovi.

NPR.:

xA = 20 - (0/(2-1)) = 20 - 0 = 20

xB = 30 - (10/(2-1)) = 30 - 10 = 20

Pri tome vrijedi da to je vei broj alternativa, to je korekcija stroa.

3. korekcija kod testova brzine

( Pitanje: "Koliki je broj zadataka koje ispitanici mogu rijeiti u odreenom vremenu."

( Formula: Rc = Rd - (Wd/C) - (S/D)

Rc = korigirani rezultat Rd = broj tono rijeenih zadataka C, D = konstntaC i D u gornjoj formuli predstavljaju arbitrarne konstan-te pri emu je C < D. Preporuuje se da C bude neto manje od A-1, a D neto vei od A

Indikator rijeavanja po sluaju kod testova brzine je postajanje neregularnih odgovora W i S, jer zadatke testova brzine svi moraju tono rjeavati jer su laki.

4.) objektivnost1.) uvod

( Def.: Pod objektivnosti podrazumijevamo neza-visnost rezultata od ispitivaa - mjerioca.

Drugim rijeima, objektivnost moemo definirati kao slaganje rezultata dobivenih od razliitih ispitivaa. Ako vie ispitivaa primjenjuje isti test na istim ispitani-cima, i ako oni dobiju i iste rezultate - tada test moe-mo smatrati objektivnim. S druge strane, ukoliko pos-toje razlike meu rezultatima dobivenih od razliitih ispitivaa - tada test nije objektivan, ve su rezultati pod utjecajem ispitivaa.

( OSOBna jednadba ispitivaa: Temeljni uzrok neslaganja meu rezultatima je da razliiti ispitivai imaju razliiti kriterij ocjenjivanja, tj. neki ispitivai imaju blagi kriterij, dok drugi imaju stroi kriterij ocje-njivanja = osobna jednadba ispitivaa.

( kvantitativni zapis objektivnosti treba sadravati sljedee:

1. Korelaciju (r) - izmeu rezultata dobivenih od razliitih ispitivaa, a na istim ispitanicima. Ako korelacija iznosi r = 1, tada je prvi uvjet zadovo-ljen da bi test mogli smatrati objektivnim.

2. H0 = M1 = M2 - treba testirati znaajnost razlika meu aritmetikim sredinama rezultata dobivenih od razliitih ispitivaa.

Zato nije dovoljna samo korelacija: Korelacija nam pokazuje samo stupanj sukladnosti u varira-nju, to meutim nikako ne ovisio o apsolutnim vrijednostima rezultata, tj. ne govori da li su rezul-tati s obzirom na njihovu apsolutnu vrijednost svarno isti. Moe se desiti da rezultati savreno sukladno variraju (kad rezultati istog ispitanika u svakoj varijabli imaju upravo isti z-poloaj), ali da se radi o potpuno razliitim rezultatima. Je li ovaj drugi uvjet zadovoljen nam pokazuje npr. t - test.

2.) faktori koji utjeu na objektivnost

1. Uvjebanost ili istreniranost ispitivaa( neizvjebani ispitiva radi s manje rutine pa zato radi vie greaka i vie djeluju sistematski faktori.

2. NEKE KARAKTERISTEKE testa

( najobjektivniji je test viestrukog izbora; Takvi testovi su po definicij potpuno objektivni - i to zato jer imaju jednoznano odreen klju za ocjenjiva-nje (kada svaki zadatak ima samo jedno tono rije-enje). Kod takvih testova uzroci razliitosti rezulta-ta, tj. neobjektivnosti su banalne greke: npr. slu-ajno priznavanje netonih odgovora i obrnuto, preskakanje pitanja itd. Da bi se te greke svele na najmanju moguu mjeru, bitno je svaki individualni uinak, radi provjere 2x korigirati i vrednovati.

( test tipa otvorenog odgovora podloniji su subjektivizmu, jer nema samo jednog tonog odgovora.

3. nain registriranja ispitanikovih reakcija

(nain odgovaranja) - npr. projektivne tehnike ( ovdje su odgovori upravo otvorenog tipa, tj. nema ponuenih odgovora meu kojima treba izvriti izbor i klju za ocjenjivanje nije jednoznaan - to ne pogoduje objektvnosti.

3.) standardiziranost testa - preduvjet objektivnostiStandardizacija ukljuuje preciziranje svih postupaka primjene nekog testa, te bodovanja i naina vrednova-nja bruto rezultata. Ti svi podaci sadrani su u poseb-nom priruniku koji pretstavlja neophodan pribor uz svako psihologijsko mjerenje pomou testova.

( Standardizacija je bitna jer ona omoguuje izjed-naavanje uvjeta mjerenja kod svakog pojedinog ispitanika i jasno je da je preduvijet objektivnosti strogo pridravanje svih specifikacija.

( Standardizacija ukljuuje:

1. NAIN PRIMJENE TESTA: Specifikacija da li se ispitivanje vri individualno (na samo po jednom ispitaniku) ili grupno (po nekoliko ispitanika istovremeno)

2. FIZIKALNI UVJETI MJERENJA: Specifikacija mi-krofizikalnih i mikroklimatskih uvjeta ispitivanja. (NPR.: osvjetljenje, temperatura, zranost, veliina radnog prostora, pribor i sl.)

3. UPUTA: Specifikacija uputa ispitanicima - obrazloenje primjene testa, globalni nain rada sa zadacima i nain davanja odgovora

4. ISTI PODRAAJI - specifikacija podraaja = zada-taka u testu. Svi ispitanici moraju rijeavati iste zadatke.

5. KLJU ZA OCJENJIVANJE ODGOVORA - radi se o popisu reakcija (koji su simptomatski valjani s obzirom na predmet mjerenja), i tonih rijeenja. Kod testova linosti to je popis indikativnih simpto-ma. To su dakle upute ispitivau kako interpretirati ispitanikove odgovore.

6. FORMIRANJE UKUPNOG REZULTATA - Specifikacija pravila o tome kako se formira i izraunava ukupni individualni uradak u testu.

7. VREDNOVANJE IND. REZ.: Specifikacija podata-ka koji su nuni za vrednovanje individualnog rezultata (NPR.: normativni podaci ili konverzione tablice).

( LISTE ZA optiko ITANJE: U dananje vrijeme postoje testovi koje aparati automatski i direktno mogu korigirati. Radi se o optiki itljivim listama sa odgovorima, tj. kompjutor oita listu i odmah korigira i vrednuje uinak ispitanika. Rezultati dakle bez zaobilaznice preko ovjeka direktno ulaze u kompjutor i poseban program usporeuje rezultate s tonim odgovorima te se formira rezultat. Ovdje je objektivnost osigurana i putpuna (a pogotovo nema banalnih "ljudskih" greaka). Takav postupak mogu je naroito kod zadataka viestrukog izbora.

( Kompjutorske adaptacije testova: Osim toga postoje tzv. kompjutorske adaptacije tesova, tj. radi se o psiholokim testovima koji se primjenjuju preko kompjutora, tj. kompjutor ispitaniku zadaje zadatak, a ispitanik svoj odgovor daje opet direktno u kompjutor. Ovdje je objektivnost takoer potpuna jer je sve totalno automatirano, tj. nema nikakvog ispitivaa koji bi bio izvor pogreaka. Nedostatak takvih adaptacija je da se ne mogu primjenivati masovno i da neki "jednostavniji" ispitanici mogu imati problema sa radom na osobnom raunalu.5.) osjetljivost1.) uvodDEF.: Osjetljivost je mogunost razlikovanja ispita-nika na temelju njihovih individulanih ukupnih bruto rezultata.

Sa gledita mjerenja, neki mjerni instrument moemo smatrati osjetljivim ako pomou njega moemo mjeriti i utvrditi i vrlo male razlike u mjerenoj pojavi.

Osjetljivost je znaajna u primjenjenoj psihologiji. Ponekad npr. elimo selekcionirati ispitanike po nekim kljunim osobinama ili elimo prilagoditi tretman sposobnostima ispitanika i to nam je jedino mogue ako imamo mjerni instrument pomou kojeg moemo dobro razlikovati ispitanike. 2.) kriteriji za osjetljivost testa

1. Veliina razlikovanja meu ukupnim individual-nim bruto rezultatima: Osnovni indikator je varijanca. Ona ne pokazuje broj razlikovanja ve samo stupanj ili veliinu razlikovanja.

2. BOR - Broj ostvarenih razlikovanja:

- Usporeuju se svaki individualni rezultat sa svakim drugim i biljei se svaka utvrena razlika. BOR dakle predstavlja sumu svih moguih razlika izmeu individualnih rezultata (npr. 10 isp. i sada se gleda koliko razlikovanja postie svaki ispitanik sa drugim ispitanicima). Ovdje se ne uzima u obzir stupanj ili veliina razlika, ve samo broj tih razlika.3.) determinante osjetljivosti

1.) teinska primjerenost zadataka i testa

A) LAKOA (TEINA) POJEDINIH ZADATAKA:

Jedna od osnovnih determinanti osjetljivosti je tein-ska primjerenost pojedinih zadataka. Teina nekog zadatka u testu izraava se proporcijom ispitanika koji su zadatak uspjeli rijeiti, a ta proporcija se naziva indeks lakoe. Zadatak e biti maksimalno diskrimina-tivan ako je on upravo prosjene teine, tj. ako je up-ravo polovica ispitanika uspjelo rijeiti zadatak (indeks lakoe p = 0.5).

ZATO:

Ako je indeks teine p = 0.5, ta to znai? Kao to smo rekli, to znai da je upravo pola ispitanika taj zadatak uspjelo rijeiti, a pola nije, a to dalje znai da smo dobili maksimalno mogui broj razliitih rezultata i da je postignut maksimalni mogui broj ostvarenih razlikovanja (BOR = f+ ( f-). Takoer je ovdje i varijanca zadatka najvea mogua (V= p ( q).

To se moe vidjeti iz sljedee tabele:

N =100p

vf+f- BOR =

f+ ( f-

Z1

Z2

Z3

Z4

Z50,9

0,7

0,5

0,3

0,1

0,09

0,21

0,250,21

0,0990

70

50

30

1010

30

5070

90

900

2100

2500

2100

900

Kao to vidimo, to je indeks lakoe vie razliit od 0.5, to su varijanca i BOR tog zadatka manji, to znai da su kod pojedinih zadataka varijanca i BOR u proporcionalnom odnosu.

Da je zadatak najosjetljiviji ako je upravo "prosjeno" teak, vidi se i po tome da ako je indeks lakoe npr. p = 0, onda niti jedan ispitanik nije rijeio taj zadatak, pa ispitanike niti ne moemo razlikiovati pomou tog zadatka. Isto vrijedi i ako je p = 1, jer onda su pak svi ispitanici rijeili zadatak.

( Praktina implikacija: To za praksu znai da pri konstrukciji testova treba odabirati one zadatke koji imaju upravo prosjean indeks lakoe (za odreenu skupinu).

( Pokazatelji teinske primjerenosti zadatka su sljedei:

a) INDEKS LAKOE (TEINE):

p = frto/N, odnosno q = frneto/N

( p i q nam daju ustvari istu informaciju, samo to jedan indeks govori o lakoi (p), a drugi o teini (q) zadatka.

b) Podatke o teini zadatka moemo takoer dobiti i od ispitanika, traei da donese subjektivan sud o teini.

c) Jo jedan indikator teine je potrebno vrijeme rjeavanja zadatka. Osnovna racionala je ovdje da e tei zadatak zahtijevati i due vrijeme rjeavanja.

B) teinska primjerenost itavog testa

Teinska primjerenost nekog testa determinirana je teiskom primjerenou pojedinih zadataka. Naime, prosjeni indeks lakoe za neki test se odreuje kao aritmetika sredina indeksa lakoe svih zadataka, dakle: p = (pi/k, ili ako nam nisu poznati indeksi lakoe pojedinih zadataka, ve samo ukupna artmetiku sredina bruto rezultata, onda nju dijelimo sa brojem zadataka, tj.: p = Mu/k.

p < 0.5 ( neprimjereno teak test - distribucija rezultata je pozitivno asimetrina, veina ispitanika se nalazi u zoni niih rezultata; tada test dobro razlikuje samo ispitanike sa iznadprosjenim rezultatima, a slabije one sa niim rezultatima.

p > 0.5 ( neprimjereno lagan test - distribucija je negativno asimetrina; rezultati se grupiraju oko viih vrijednosti; test loe razlikuje ispitanike u zoni veih rezultata, a dobro u zoni niih rezultata.

p = 0.5 ( test je primjeren - distribucija je normalna; ovdje se rezultati grupiraju oko prosjenih vrijednosti; test dobro razlikuje slabije od boljih ispitanika, a loije prosjene.

2.) Broj zadataka u testu

Openito govorei, to je vei boj zadataka (k), to je u pravilu i bolja osjetljivost testa. Naime, svaki zadatak vie pretstavlja jednu potencijalnu mogunost za razlikovanje ispitanika, tj. neki ispitanici e zadatak uspjeti rjeiti, a drugi nee (to opet ovisi o teinskoj primjerenosti zadatka), pa tako to je vie zadataka, to se teoretski moe postii vei broj razliitih rezultata (BRR), a time i vei BOR.

( BRR = k+1 ; (NPR.: k = 5; BRR = 5 + 1 = 6)

U psihologiji se kao minimalna duina esto spominje 20 zadataka, no, u veini sluajeva osjetljivi testovi imaju oko 100 zadataka ili ak vie stotina.

3.) korelacije meu zadacima (rij)Kad se radi o testovima (ne zadacima) osjetljivost testa ne ovisio samo o teini pojedinih zadataka. Stvar se komplicira korelacijom izmeu zadataka.

Prema formuli za raunanje ukupne varijance proilazi da e ukupna varijanca biti maksimalna kada su pojedini zadaci u potpunoj korelaciji:

Vu = (Vi + 2(rij(i(jDakle prema ovoj formuli Vu e biti maksimalna, ako:

- su zadaci prosjene teine (p = 0.5)

- su zadaci u potpunoj korelaciji (rij = 1)

NPR.:

k = 20

pi = 0.5

Vi = 0.25

(i = 0.5rij = 0 (rij = 0.2 (rij = 0.4 (rij = 0.6 (rij = 0.8 (rij = 1.0 (

Vu = 5Vu = 24

Vu = 43

Vu = 62

Vu = 81

Vu = 100

( DVA EKSTREMNA PRIMJERA:

1.) Ako je korelacija r=1, javlja se problem da postoje samo dva ukupna rezultata, tj. x=0 i x=k. Naime, svi ispitanici koji jesu rijeili jedan zadatak, rijeili i sve ostale zadatke i tako dobili maksimalno mogui ukupni rezultat od "k" bodova, a svi oni koji nisu rijeili neki zadatak, nisu rijeili niti jedan drugi zadatak, pa im je ukupni rezultat x=0. Tada je itav test upravo toliko diskriminativan kao i samo jedan bilo koji njegov zadatak. Dakle unato maksimalnoj varijanci osjetljivost testa (po BOR-u) je slaba. Zbog toga, kad su korelacij meu zadacima vrlo visoke Vu je vrlo slab pokazatelj osjetljivosti testa.

2.) Ako je korelacija pak r = 0, tada je varijanca minimalna, ali broj razliitih individualnih ukupnih rezultata mogao bi biti ak i k + 1, No, tada se javlja problem da imamo zadatke koji su potpuno heterogeni, tj. svaki zadatak ispitiva neto posve drugo. Ovdje se osjetljivost kosi s dvije stvari: a) to se tie pouzdanosti korelacije meu zadacima bi trebale biti to vie, kako bi svi zadaci imali isti predmet mjerenja (jednaki x(), to meutim smanjuje osjetljivost i b) to se tie simptomatske valjanosti vrlo heterogeni zadaci ine ukupni rezultat psiholoki neinterpretabilnim, jer se ne zna koji atribut ima koliki udio u ukupnom rezultatu.

( U PRAKSI: U praksi su korelacije meu zadacima redovito u zoni niih vrijednosti, i to zato to pojedini zadaci a) imaju veliku varijancu pogreke, b) imaju razliite distribucije, tj. indekse lakoe.

( RJEENJE PROBLEMA: - nalazimo u tome da test sadri zadatke nejednake teine, ali sa to veim meusobnim korelacijama. Tako se ispitanici diferen-ciraju po njihovoj sposobnosti rjeavanja razliito tekih zadataka. Neki e rijeiti samo one lake zadatke, neki lake i prosjeno teke, a samo oni najbolji e rjeiti i najtee zadatke.

4.) nain formiranja rezultata u testu

Ukupni rezultat se u pravilu formira prema modelu jednostavne linearne kombinacije, tj.: xu = (xiNo, to se tie poveanja osjetljivosti povoljnije je ukupni rezultat formirati po modelu D.P.L.K, to znai pridati razliitu teinu pojedinim zadacima (diferenci-jalno ih ponderirati), tj.: xu = ((ixi.

ZATO:

Kad se ukupni rezultat formira kao J.L.K. svi ispitanici koji rijee isti broj zadataka imati e isti rezultat, te ih neemo moi razlikovati po tome koje zadatke su rijeili. Meutim ako ukupni rezultat formiramo kao D.P.L.K. ispitanici e imati samo onda ba isti rezultat ako rijee tono iste zadatke, i nije vie dovoljno da rijee samo isti broj zadataka da bi i imali isti broj bodova.

Dakle, kroz diferencijalno ponderiranje poveava razliitost rezultata (BRR), a time i broj moguih razlikovanja (BOR). Znai omogueno nam je bolje diferenciranje ispitanika.

( Opravdanost takovog postupka nalazimo u tome da je valjanost klasinih i diferencijalno ponderiranih testovnih rezultata gotovo identna. Korelacija izmeu rezultata J.L.K. i D.P.L.K iznosi r > 0.95. Strategija D.P.L.K. poveava osjetljivost, a ne naruava valja-nost i pouzdanost testa.

NPR.: Imamo dva ispitanika A i B koji imaju isti rezultat x = 3.

q0.20.40.60.80.9JLKDPLK

z1z2z3z4z5xuxuDP

A1110031.2

B0101132.1

3. INDIKATORI OSJETLJIVOSTI

(Ovo je dosta dobro objanjenjo u zbirci zadataka - rijeite tih par zadataka i sve je jasno.)

1. Totalni raspon Opaenih rezultata

2. BRR = Broj razliitih rezultata

(brr = k + 1)

3. BOR =Broj ostvarenih razlikovanja

4. Varijanca (vt) - govori o veliini razlika, ali ne i o broju ostvarenih razlikovana5. indeks relativnog varijabiliteta - koristi se samo kada je skala mjerenja omjerna i distribucija rezultata normalna.6. Fergusonov delta koeficijent (() - predstavlja omjer broja ostvarenih razlikovanja (BOR) i maksimalnog broja moguih ralikovanja (BORmax)7. OBLIK DISTRIBUCIJE REZULTATA6.) konsturukcija (kompozitnih) testova1.) uvod

Pod kompozitnim testovima podrazumijevamo testove koji se sastoje od vie dijelova. Dijelovi testa mogu biti subtestovi, no i svaki zadatak se moe shvatiti kao dio testa.

Prilikom konstrukcije testa treba se drati odreenih pravila, a ta ista pravila vrijede i kod skraivanja (zbog ekonominosti) i kod produivanja testa (radi povea-nja pouzdanosti).

2.) konstrukcija novog testa1. definicija predmeta mjerenja

Definicija se najee izvodi iz neke psiholoke teorije ili odreenog broja pretpostavki i pravila.

2. razmatranje moguih operacionalizacija

Radi se o razmatranju razliitih moguih tehnika za odmjeravanje predmeta mjerenja:

- upitnika forma,

- skale procjene,

- unipolarne skale (npr. nervozan: 1-2-3)

- bipolarne skale (npr. nervozan -1, 0, +1 smiren).

3. izrada odreenog broja estica ili pitanja za preliminarnu verziju testa

U poetku je bitno obratiti panju na sadrajnu valjanost, treba nastojati da sadraji zadataka budu reprezentativan uzorak za ono to ispitujemo.

NPR.: test znanja ( reprezentativnost je od kruci-jalnog znaaja kod testova znanja. Bitno je da su obuhvaena sva podruja koja su obraena u okviru tog predmeta.

BROJ ZADATAKA: Pretpostavka je da su neki za