24
GIRU Lecţia 9 GIRU Lecţia 9

Lectia 9 SPSS

Embed Size (px)

Citation preview

Page 1: Lectia 9 SPSS

GIRU Lecţia 9GIRU Lecţia 9

Page 2: Lectia 9 SPSS

Elemente de analiză statistică

Eşantioane şi populaţii. Selectarea cazurilor.

Eroarea standard.

Testul t pentru două eşantioane de scoruri corelate/relaţionate.

Testul t pentru două eşantioane de scoruri necorelate/nerelaţionate.

Page 3: Lectia 9 SPSS

Elemente de analiză statistică Eşantioane şi populaţii.

Selectarea cazurilorAnumite analize statistice presupun selectarea:

unui anumit subgrup dintr-un eşantion (ex. tineri sau numai femei);

unor subgrupuri pe baza unor criterii multiple.

Utilizarea subgrupurilor poate conduce la o înţelegere mai clară a tendinţelor existente în date, decât ar fi posibilă dacă, de exemplu, s-ar folosi tabele de asociere.

Pe subgupuri se pot realiza şi calcule. De ex. corelarea abilităţilor muzicale şi cele matematice la:

a. Fete şi băieţi separat.

b. Copii mari şi mici separat.

c. Fete şi băieţi mari şi mici separat.

Page 4: Lectia 9 SPSS

Elemente de analiză statistică Eşantioane şi populaţii. Selectarea

cazurilorScoruri_muzicale Scoruri_matematice Gen Varsta

2 8 1 10

6 3 1 9

4 9 2 12

5 7 1 8

7 2 2 11

7 3 2 13

2 9 2 7

3 8 1 10

5 6 2 9

4 7 1 11

Page 5: Lectia 9 SPSS

Elemente de analiză statistică Eşantioane şi populaţii.

Selectarea cazurilor

RezolvareRezolvare

Se introduce un cod pentru gen cum ar fi “11” pentru fete şi “2” pentru băieţi si un cod pentru vârstă.

Se va folosi vârsta 1010 ani ca limită fixă.

copii de 9 ani sau mai puţin încadrându-se în grupul de vârstă mică;

copii de 10 ani sau mai mulţi vor fi încadraţi în grupul de vârsă mare.

Se vor selecta pe rând cele două grupuri şi se vor Se vor selecta pe rând cele două grupuri şi se vor efectua calculeefectua calcule.

Page 6: Lectia 9 SPSS

Elemente de analiză statistică Eşantioane şi populaţii. Selectarea

cazurilorRezolvare:

1. Introducerea datelor Definirea variabilelor in modul de lucru Variable ViewVariable View din Data View.Data View. Trecerea în modul de lucru Data ViewData View din Data EditorData Editor.

2. Selectarea cazurilor Data – Select Case ... Data – Select Case ... Din fereastra afişată se selectează If condition is satisfied If condition is satisfied şi clic pe butonul If...If... pentru a selecta fetele , se execută clic pe variabila gen şi apoi clic pe butonul Se selectează semnul “==“ şi “11” şi se execută clic pe butonul Continue Continue şi apoi clic pe OKOK.

Se repetă procedura pentru gruparea dupa baieţiSe repetă procedura pentru gruparea dupa baieţi.

Page 7: Lectia 9 SPSS

Elemente de analiză statistică Eşantioane şi populaţii.

Selectarea cazurilorRezolvare:

Pentru a selecta fetele de 9 sau mai puţini ani:Data – Select Case ... Data – Select Case ... Din fereastra afişată se selectează If condition is satisfied If condition is satisfied şi clic pe butonul If...If... Pentru a selecta fetele , se execută clic pe variabila gen şi apoi clic pe butonul Se selectează semnul “==“ şi “11” Se selectează semnul “&&“ şi varstaSe selectează semnul “<=<=“ şi “99” Se execută clic pe butonul Continue Continue şi apoi clic pe OKOK.Se repetă procedura pentru gruparea după băieţi.

Page 8: Lectia 9 SPSS

Elemente de analiză statistică Eroarea standard

Este un indice pentru variabilitatea mediilor în cazul mai multor eşantioane.

Este abaterea standard, dar aplicată eşantioanelor în loc de scoruri.

Este media măsurii cu care media eşantioanelor diferă faţă de media populaţiei din care au fost extrase.

Este folosită în cea mai mare parte ca un pas intermediar

în alte tehnici statistice, cum ar fi testul tt.Există două versiuni ale erorii standard. Eroarea standard Eroarea standard aplicatăaplicată unui set de scoruri şi cea estimatăcea estimată, care este folosită atunci când se încearcă estimarea erorii standard a populaţiei pe un eşantion.SPSS calculează eroarea standard estimatăSPSS calculează eroarea standard estimată..

Page 9: Lectia 9 SPSS

Elemente de analiză statistică

Testul t Prin acest test se va vedea dacă valoarea medie pentru un set de scoruri diferă de valoarea medie pentru alt set de scoruri.

Este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre mediile pentru două seturi de scoruri.

Există două variante ale testului testului tt: una este folosită când cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion, sau când coeficientul de corelaţie între cele două seturi

este mare. Această variantă este cunoscută ca testul testul tt pentru pentru eşantioane perechi.eşantioane perechi.

Cealaltă versiune a testului tt este utilizată în momentul în care două seturi diferite de scoruri provin din grupuri diferite de participanţi.

Testul Testul tt pentru eşantioane perechi lucrează optim dacă distribuţia pentru eşantioane perechi lucrează optim dacă distribuţia diferenţelor dintre cele două seturi de valori se prezintă, diferenţelor dintre cele două seturi de valori se prezintă, aproximativ, aproximativ, sub forma unui clopotsub forma unui clopot. .

Page 10: Lectia 9 SPSS

Elemente de analiză statistică

Testul tDistribuţia t mai este denumită şi distribuţia Studentdistribuţia Student. Ea are toate caracteristicile unei distribuţii normale, are aceeaşi formă de clopot dar care de această dată depinde de numărul gradelor de libertate df (degrees of freedom). Cu cât df este mai mic cu atât forma curbei devine mai aplatizată. Pentru un test statistic tt aplicat unui sigur eşantion expresia de calcul a df este:

df = N – 1df = N – 1 unde:

dfdf reprezintă numărul gradelor de libertate;NN este volumul eşantionului.

Dacă testul t se aplică pentru două eşantioane primul de volum N1 iar al doilea de volum N2 atunci:

df = N1 + N2 – 2df = N1 + N2 – 2

Page 11: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane de scoruri corelate/relaţionate

Pentru fiecare test ttest t se calculează o probabilitate pp

corespunzătoare (ce poate fi găsită în tabelele tt).

Deoarece nu există o garanţie 100% pentru acceptarea sau

respingerea unei ipoteze, atunci trebuie să fie asumat un risc de risc de

eroareeroare. Nivelul convenţional minim acceptat pentru acesta Nivelul convenţional minim acceptat pentru acesta

este de 5% (0.005).este de 5% (0.005).

Nivelul de risc poate fi exprimat şi prin opusul lui (95% aşa

cum lucrează SPSS). În acest caz 95% nu reprezintă eroarea

maximă acceptată, ci nivelul minim de încrederenivelul minim de încredere în rezultatul

experimentului.

O explicitare grafică a erorii maxim acceptate este O explicitare grafică a erorii maxim acceptate este

prezentată în următoarele două slide-uri.prezentată în următoarele două slide-uri.

Page 12: Lectia 9 SPSS

Acesta este un test t unilateral (one tailed)

Dacă scorul eşantionului se află în zona haşurată de 5% atunci ipoteza de nul se respinge şi se acceptă ipoteza cercetării. Cu alte cuvinte dacă dacă p < 0,05 atunci se acceptă p < 0,05 atunci se acceptă ipoteza cercetării.ipoteza cercetării.

Page 13: Lectia 9 SPSS

Pentru a verifica ipoteza cercetării simultan pe ambele laturi (stânga – dreapta) ale distribuţiei se aplică t bilateral (two tailed)

Dacă scorul eşantionului se află în oricare dintre zonele haşurate de 5% atunci ipoteza de nul se respinge şi se acceptă ipoteza cercetării. Cu alte cuvinte dacă p < 0,05 atunci se dacă p < 0,05 atunci se acceptă ipoteza cercetării.acceptă ipoteza cercetării.

Page 14: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane de scoruri corelate/relaţionate

Exemplu:

Să se analizeze dacă numărul contactelor vizuale avute de bebeluşi (vârste între 6 şi 9 luni) cu mamale lor se modifică între aceste vârste.

Numărul segmentelor de un minut cu contact vizual

Nume_bebeluşi 6 luni 9 luni

Cristina 3 7

Andrei 5 6

Elena 5 3

Aura 4 8

Cosmin 3 5

Ştefan 7 9

Mara 8 7

Ion 7 9

Page 15: Lectia 9 SPSS

Elemente de analiză statistică

Testul t Rezolvare:

1. Introducerea datelor Definirea variabilelor sasesase_luni_luni şi noua_luninoua_luni in modul de lucru Variable ViewVariable View..

Trecerea în modul de lucru Data ViewData View şi introducerea datelor.

2. Testul t pentru eşantioane perechi. Se selectează Analyze – Compare Means – Paired-Samples Analyze – Compare Means – Paired-Samples

tt Test... Test... Se selecteazăSe selectează variabila variabila sasesase_luni_luni şi apoi variabila noua_luninoua_luni care vor fi afişate sub Current SelectionCurrent Selection. .

Se apasă butonul pentru a plasa cele două variabile în lista variabilelor relaţionate.

Page 16: Lectia 9 SPSS

Elemente de analiză statistică

Testul t pentru două eşantioane de scoruri corelate/relaţionate

Page 17: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane de scoruri corelate/relaţionate

Interpretarea output-uluiInterpretarea output-ului

Primul tabel arată mediamedia, numărul de cazurinumărul de cazuri şi abaterea standardabaterea standard pentru cele două eşantioane. Media numărului de contacte vizuale la 6 luni şi la 9 luni este afişată sub “Mean”.

Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate. Corelaţa (Person) dintre ele este 0,419Corelaţa (Person) dintre ele este 0,419. Aceasta este o corelaţie medie, şi totuşi nesemnificativă, pentru că nivelul de semnificaţie este mai mare de 0,050,05 (este p= 0,301).

În al treilea tabel, diferenţele dintre cele două valori medii sunt prezentate în În al treilea tabel, diferenţele dintre cele două valori medii sunt prezentate în conoana conoana “Mein”“Mein”de la de la “Paired Differences”“Paired Differences”, precum şi eroarea standard a acestei medii. Diferenţa dintre cele două medii este -1,500 şi eroarea standard estimată mediilor pentru acest eşantion este de 0,76.Valoarea tt a diferenţei dintre mediile celor două eşantioane, gradele sale de libertate şi nivelul de semnificaţie two-tailed sunt, de asemenea, în acest tabel.Valoarea Valoarea tt este este 1,9841,984, care are un nivel de semnificaţie de , care are un nivel de semnificaţie de 0,0880,088 cu cu 77 grade grade de libertate.de libertate.

Page 18: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane de scoruri corelate/relaţionate

Raportarea output-uluiRaportarea output-ului

S-ar putea prezenta rezultatele astfel:Media numărului de contacte vizuale la 6 luni (M=5,25, SD=1,91) şi la 9 luni (M=6,75, SD=2,05) nu diferă semnificativ (t=-1,98, DF=7, two-tailed p=0,088).

Dacă se doreşte utilizarea intervalelor de încredere, va trebui să se prezinte următoarele rezultate: Media numărului de contacte vizuale la 6 luni este 5,25 (SD=1,91) şi la 9 luni este 6,75, (SD=2,05). Diferenţa este 1,50. Intervalul de încredere 95% pentru această diferenţă este de -3,29 la 0,29. Deoarece intervalul de încredere trece pin 0,00, diferenţa nu este statistic semnificativă la nivelul de semnificaţie two-tailed 5%.

Page 19: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane

de scoruri necorelate/nerelaţionate

Testul testul t pentru eşantioane independente este utilizat

pentru a vedea dacă mediile pentru două seturi de

variabile sunt diferite semnificativ una faţă de cealaltă.

Testul Testul t pentru eşantioane independente este utilizat

atunci când cele două seturi de variabile provin din

două eşantioane diferite de oameni.

Este versiunea de test t cea mai des folosită.

Page 20: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane

de scoruri necorelate/nerelaţionateExemplu:

Sunt date scorurile emotivităţii pentru copiii proveniţi din familii cu doi părinţi şi cu un singur părinte. Să se analizeze dacă valorile emotivităţii sunt diferite pentru familii cu doi părinţi faţă de cele cu un singur părinte.

DoiDoi__părinţipărinţi (x1) (x1) UnUn__părintepărinte (x2) (x2)

12 6

18 9

14 4

10 13

19 14

8 9

15 8

11 12

10 11

13 9

15

16

Page 21: Lectia 9 SPSS

Elemente de analiză statistică

Testul t pentru două eşantioane de scoruri necorelate/nerelaţionate

Rezolvare:1. Introducerea datelor Definirea variabilelor familiafamilia şi stare_emotionalastare_emotionala În modul de lucru Variable ViewVariable View.. Trecerea în modul de lucru Data ViewData View şi introducerea datelor.

2. Testul tt pentru eşantioane independenteSe selectează Analyze – Compare Means – Independent-Samples T Test… Analyze – Compare Means – Independent-Samples T Test…

Se selecteazăSe selectează variabila variabila stare_emotionalastare_emotionala şi se apasă butonul

pentru a plasa variabila în lista variabilelor.Se selecteazăSe selectează variabila variabila familiafamilia şi se apasă butonul pentru a

plasa variabila în căsuţa Grouping Variable.Se selectează Define Groups... Pentru a defini cele două grupuri.Se introduce valoarea 1 în căsuţa Group1 şi valoarea 2 în căsuţa

Group2.Se execută clic pe butonul Continue. Se execută clic pe butonul OK.

Page 22: Lectia 9 SPSS

Elemente de analiză statistică

Testul t pentru două eşantioane de scoruri necorelate/nerelaţionate

Page 23: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane

de scoruri necorelate/nerelaţionateInterpretarea output-uluiInterpretarea output-ului

Primul tabel arată, pentru fiecare grup în parte,numărul de cazuri, medianumărul de cazuri, media, şi

abaterea standardabaterea standard. Media pentru un singur părinteeste 9,50. Există în mod

evident o diferenţă între cele două tipuri de familii.

Pentru copiii proveniţi din familii cu doi părinţi, valoarea medie a emotivităţii

este 13,42 şi abaterea standard a valorilor emotivităţii este 3,37. Pentru

copiii proveniţi din familii cu un singur părinte, valoarea medie a emotivităţii

este 9,50 şi abaterea standard a valorilor emotivităţii este 3,10.

Valoarea t (-2,813)t (-2,813) este pur şi simplu media diferenţei (-3,917)media diferenţei (-3,917) divizată cu

eroarea standard a diferenţei (1,382).eroarea standard a diferenţei (1,382).

Pentru variaţii egale, Pentru variaţii egale, tt este este -2,813-2,813 care cu care cu 2020 grade de libertate este grade de libertate este

semnificativ la semnificativ la 0,0110,011 pentru pentru two-tailed two-tailed (test bilateral). (test bilateral).

Pentru a obţine nivelul Pentru a obţine nivelul one-tailedone-tailed (test unilateral), se divizează la (test unilateral), se divizează la 22 nivelul nivelul

anterior şi rezultă anterior şi rezultă 0,0060,006..

Page 24: Lectia 9 SPSS

Elemente de analiză statistică Testul t pentru două eşantioane de scoruri corelate/relaţionate

Raportarea output-uluiRaportarea output-ului

S-ar putea prezenta rezultatele astfel:Media pentru valorile testelor de emotivitate ale copiilor ce provin din familii cu doi părinţi (M=13,42, SD=3,37) este semnificativ mai mare (t=-2,81, DF=20, two-tailed p=0,011) decât aceea a copiilor proveniţi din familii cu un singur părinte (M=9,50, SD=3,10).

Dacă se doreşte utilizarea intervalelor de încredere, va trebui să se prezinte următoarele rezultate: Diferenţa dintre valorile testelor de emotivitate ale copiilor ce provin din familii cu doi părinţi (M=13,42, SD=3,37) şi cei proveniţi din familii cu un singur părinte (M=9,50, SD=3,10) este -3,92. Intervalul de încredere 95% pentru această diferenţă este de la -6,82 la -1,01. Deoarece intervalul nu conţine puncul 0,00 diferenţa este statistic semnificativă la nivelul de semnificaţie two-tailed de 5%.