5/9/2012
1
Metodi Quanti – Qualitativi per
le scienze sociali
Incontro 4Scuola di dottorato – Variabili e livelli di misurazione
Alessandro Pepe
Mail: [email protected]
� Riassunti livelli di misurazione
� Descrittori, indicatori semplici e formato Likert
� Indicatori compositi e modelli di misurazione
� Studio della distribuzione delle variabili
� Distribuzioni normali e non normali
Nominale
Ordinale
Intervalli equivalenti
Rapporti equivalenti
Livelli di misurazione
5/9/2012
2
Misurazione Nominale
Variabili senza un particolare “valore” numerico, hanno solo un nome, valenza descrittiva � genere, scuola di appartenenza, nazionalitàDistinguono esclusivamente fra stati fisici diversi di una determinata condizione
Variabili senza un particolare “valore” numerico, hanno solo un nome, valenza descrittiva � genere, scuola di appartenenza, nazionalitàDistinguono esclusivamente fra stati fisici diversi di una determinata condizione
Esempio:
Indichi il suo stato civile.
__Coniugato/a __ Divorziato/a __ Single __ Vedovo/a
Indichi il suo genere.
__Maschile __ Femminile
Misurazione Ordinale
Ordinale � variabili a cui è iniziato ad associare un particolare “ valore numerico”, si possono ordinare � livello di istruzione, classe scolastica, scale Likert
Ordinale � variabili a cui è iniziato ad associare un particolare “ valore numerico”, si possono ordinare � livello di istruzione, classe scolastica, scale Likert
Esempio.
Indichi il suo livello di istruzione:
__Elementare __ Media inferiore __ Media superiore __ Univerisità __ Altro
Indichi la sua età:
__fino a 18 __ da 18 a 30__ da 30 a 60__ sopra 60
Misurazione intervalli equivalenti
Intervalli equivalenti� variabili a cui è iniziato ad associare un particolare “ valore numerico” con distanze relative equivalenti, si possono ordinare ma ci consentono anche di stabilire la distanza esistente fra due stati diversi della medesima proprietà �punteggi ai test, punteggi di personalità, QI
Intervalli equivalenti� variabili a cui è iniziato ad associare un particolare “ valore numerico” con distanze relative equivalenti, si possono ordinare ma ci consentono anche di stabilire la distanza esistente fra due stati diversi della medesima proprietà �punteggi ai test, punteggi di personalità, QI
Esempio.
Consiglieresti l’hotel XYZ ad un familiare?
Decisamente no Decisamente sì
1 2 3 4 5 6 7
Indichi la sua età:
__fino a 20 __ da 21 a 40__ da 41 a 60 __ da 61 a 80 __altro
5/9/2012
3
Misurazione rapporti equivalenti
variabili con il massimo livello di misurazione, sono le variabili tipiche delle scienze dure, presentano tutte le
caratteristiche degli altri livelli di misurazione, in più presentano anche una origine non relativa (=zero reale) �
altezza,età, reddito.
variabili con il massimo livello di misurazione, sono le variabili tipiche delle scienze dure, presentano tutte le
caratteristiche degli altri livelli di misurazione, in più presentano anche una origine non relativa (=zero reale) �
altezza,età, reddito.
Esempio:
Indichi il numero di alunni che mostrano un comportamento “difficile” nell’attualeanno scolastico_
0 1 2 3 4 5 6 7 (se più di sette specificare il numero___)
Indichi la sua età:
__
Muoversi tra le scale
� Posso salire tra i livelli di misurazione? Tendenzialmente no. E’ possibile però utilizzare il livello ordinale cumulato per ottenere variabili con proprietà simili ad intervalli equivalenti.
� Posso scendere tra i livelli di misurazione? Sì, tutte le volte che voglio � basta scegliere criteri di classificazione e/o raggruppamento
Caratteristiche delle scale – Rule of thumb
� Rapporti: Esiste uno zero assoluto?� Intervalli : Esiste una misura standard?
� Ordinali : Posso ordinare le categorie?� Nominale: Sono tutte categorie ?
5/9/2012
4
Errori frequenti
� Concettualizzazione troppo ampia� Operazionalizzazione non precisa� Non coerenza tra metodi di indagine e natura del dato
� Campioni insufficienti� Alterazione del dato (involontaria)
� Non coerenza tra metodologie e livelli di misurazione� Non ripulire gli effetti.
� Riassunti livelli di misurazione
� Descrittori, indicatori semplici e formato Likert
� Indicatori compositi e modelli di misurazione
� Studio della distribuzione delle variabili
� Distribuzioni normali e non normali
Descrittori
� Sono spesso variabili “indipendenti” (indicatori) che possono essere ricondotte a caratteristiche generali e/o specifiche dei partecipanti al disegno di ricerca.
� Variabili socio-demografiche� Correlati di interesse
� Altre informazioni
5/9/2012
5
Indicatori semplici
� Descrittori di comportamenti e fatti reali� Quanto spesso ti capita di…
� Descrittori di conoscenze� Conosci le seguenti marche…
� Descrittori di stati psicologici � Nelle ultime due settimane mi sono sentito…
� Descrittori di atteggiamenti� Esprimi il tuo grado di accordo
� Descrittori di comportamenti ipotetici.� Se ti dovessi trovare nella situazione di….
Modalità di risposta Likert
Una “scala” Likert è un formatodi risposta ordinale che permetteai rispondenti di indicare ilgrado di “accordo/disaccordo” ad una serie di domande (item)
Granularità (grana) � numero modalità di risposta (5-punti, 7-punti, 9-punti).
Esempi
5/9/2012
6
Modalità di gestione� Nelle scienze sociali i singoli item raramente sono gestiti
singolarmente (livello ordinale)� “non c’è modo di capire se la distanza tra “molto
d’accordo” e “d’accordo” è la stessa che esiste tra “d’accordo” e “neutrale”.
� Punteggi sommativi � analisi fattoriale� I punteggi degli item misurati tramite likert possono
essere sommati:� Se le Likert sono equivalenti� Se le Likert misurano tutte lo stesso concetto� Se esiste una ragionevole (e difendibile)
approssimazione ad una scala ad intervalli
� Riassunti livelli di misurazione
� Descrittori, indicatori semplici e formato Likert
� Indicatori compositi e modelli di misurazione
� Studio della distribuzione delle variabili
� Distribuzioni normali e non normali
Indicatori compositi
� Rappresentano processi di raggruppamento di indicatori semplici attraverso operazioni matematiche� Scale di misurazione di costrutti� Indicatori di performance� Indicatori sintetici
5/9/2012
7
Perché indicatori compositi
� Fenomeni complessi come la qualità della vita o il benessere sono “misurabili” attraverso gruppi di variabili, ciascuna empiricamente osservabile, ma che solo prese insieme rappresentano il fenomeno in analisi.
� L’indicatore composito non può essere osservato empiricamente ma è il risultato di operazioni matematiche
Modelli di misurazione – Salute fisica
Modelli di misurazione -Qualità della vita
5/9/2012
8
� Riassunti livelli di misurazione
� Descrittori, indicatori semplici e formato Likert
� Indicatori compositi e modelli di misurazione
� Studio della distribuzione delle variabili
� Distribuzioni normali e non normali
Idea di distribuzione
Distribuzione dei dati
� Due gruppi di persone (g1, g2) compilano un questionario, ottenendo entrambi nella variabile “test” un punteggio medio (M) di 81.5.
� Possiamo dire che i gruppi sono uguali?
� No. La media non ci dice nulla circa la confrontabilità dei gruppi.� Ho bisogno di una misura della distribuzione
dei punteggi.
5/9/2012
9
Punteggi
grezzi del
gruppo 1
nella
variabile test
72
76
80
80
81
83
84
85
85
89
Media:81.5
Media
Deviazione standard (DS)
� La deviazione standard è il numero che misura quanto i valori del mio campione sono “dispersi” attorno al valore medio� Più la deviazione è grande, maggiore sarà
la dispersione dei valori
� Più la deviazione standard è piccola, minore sarà la dispersione dei punteggi
5/9/2012
10
Punteggi
grezzi
gruppo_1
gruppo_2
72
76
80
80
81
83
84
85
85
89
Media:81.5
57
65
83
94
95
96
98
93
71
63
- 9.5
Considerando il punteggio più basso (72), qual’è la sua distanza dallamedia ? E considerando il punteggio più alto (89), quanto è distante dallamedia?
72 - 81.5 = - 9.5 89 - 81.5 = 7.5
7.5
Calcolo
tutte le
distanze, le
elevo al
quadrato e
le sommo.
72
76
80
80
81
83
84
85
85
89
- 9.5
- 5.5
- 1.5
- 1.5
- 0.5
1.5
2.5
3.5
3.5
7.5
Distanzadalla
media
90.25
30.25
2.25
2.25
0.25
2.25
6.25
12.25
12.25
56.25
Distanza al
quadrato
5/9/2012
11
In verde il
valore della
varianza.
In giallo il
valore della
deviazione
standard.
72
76
80
80
81
83
84
85
85
89
- 9.5
- 5.5
- 1.5
- 1.5
- 0.5
1.5
2.5
3.5
3.5
7.5
Distanzadalla
media
90.25
30.25
2.25
2.25
0.25
2.25
6.25
12.25
12.25
56.25
Distanza al
quadrato
Somma:214.5
= 21.4
= 4.88
Stesse
operazioni
per il
secondo
gruppo.
57
65
83
94
95
96
98
93
71
63
- 24.5
- 16.5
1.5
12.5
13.5
14.5
16.5
11.5
- 10.5
-18.5
Distanzadalla
media
600.25
272.25
2.25
156.25
182.25
210.25
272.25
132.25
110.25
342.25
Distanza al
quadrato
228,05
= 15.10
Somma:2280.5
Media
DS = 4.81
DS = 15.10
5/9/2012
12
� Riassunti livelli di misurazione
� Descrittori, indicatori semplici e formato Likert
� Indicatori compositi e modelli di misurazione
� Studio della distribuzione delle variabili
� Distribuzioni normali e non normali
Punteggi nelle tabelle di frequenza
Punteggi osservati Frequenza (N=16)65 1
70 275 3
80 485 3
90 295 1
Grafico di distribuzione delle frequenze
Test Punteggi
Frequenza
4
3
2
1
65 70 75 80 85 90 95
5/9/2012
13
Galton’s Board
http://www.youtube.com/watch?v=AUSKTk9ENzg
http://www.youtube.com/watch?v=xDIyAOBa_yU
Some care is needed to obtain these idealized results, however, as the actual distribution of balls depends on physical properties of the setup, including the elasticity of the balls (as characterized by their coefficient of restitution), the radius of the nails, and the offsets of the balls over the funnel's opening when they are dropped (Kozlov and Mitrofanova 2002).
Valutare la normalità della distribuzione
La distribuzione è normale quando:
-è simmetrica
-assume la forma della curva Gaussiana
-esiste concordanza tra gli indicatori di tendenza
centrale
-le code non toccano mai l’asse X
-ci sono almeno 30 punteggi osservati (N>30)
Per valutare la concordanza tra gli indicatori di tendenza centrale si usano:
media, moda e mediana devono essere molto simili (quasi sovrapposte)
Asimmetria e Curtosi (SPSS, analizza � descrittive � frequenze � statistiche)
Indici di normalità� Asimmetria (skweness) indica il grado di simmetria della
distribuzione [accettabile per valori compresi tra -1 e +1]� Curtosi (Kurtosis) indica il grado di schiacciamento della
distribuzione [accettabile per valori compresi tra -1 e +1]
5/9/2012
14
Indicatori di tendenza centrale
� Moda (è il valore con frequenza più alta)
� Mediana (è il valore che divide la distribuzione a metà)
� Media e deviazione standard� Medie ridotte (trimmered 5%)
� Nel nostro caso Media (1280/16=80, ds= 8.16), media ridotta (80), moda (80) e mediana (80) si sovrappongono la distribuzione può essere considerata normale
� SPSS (analizza � descrittive � esplora)
Distribuzione di una variabile
� Se il livello di misurazione è nominale, la distribuzione dei dati grezzi può essere studiatausando moda e distribuzione di frequenza(istogrammi, torte, ecc…).
� Se il livello è ordinale la distribuzione dei datigrezzi può essere studiata attraverso la medianae i range (min-max, percentili) ( oltre alla moda e alle distribuzioni di frequenza)� Per livelli di misurazione ad intervalli e a rapporti
equivalenti è invece possibile utilizzare media e deviazione standard (oltre a tutte le precedenti)
Perché normalità è essenziale?
� Perché in base alla condizione di normalità della distribuzione di una variabile effettuiamo la prima scelta metodologica:� Analisi parametriche (assunti normalità OK)� Analisi non-parametriche (assunti normalità
violati)
5/9/2012
15
Uso della DS per identificare gli outlier.
Esempio pratico: l’età del campioneRiepilogo dei casi
Casi
Validi Mancanti Totale
N Percentuale N Percentuale N PercentualeAge 143 1,0 2 ,0 145 1,0
Descrittive
Statistica Errore std.Age Media 32,92 ,707
Media 5% trim 32,29
Mediana 32,00
Varianza 71,542
Deviazione std. 8,458
Minimo 21
Massimo 59
Intervallo 38
Distanza interquartilica 11
Asimmetria 1,463 ,203
Curtosi ,793 ,403
Distribuzioni non-normali
5/9/2012
16
Evitare conclusioni numeriche distorte
Validità
� La ricerca misura davvero ciò per cui è stata costruita? Gli strumentidi misurazione scelti ci permettono di “far centro” (Joppe, 2000, p.1)
� E’ la sovrapposizione tra la definizione concettuale e la definizioneoperativa
� Diversi tipi di validità:
� Di facciata� Di contenuto� Di costrutto
� Predittiva (di criterio)� Concorrente
� Discriminante
Operazionalizzazione funziona
Predizione funziona
� Validità di facciata� È la serietà apparente ed esteriore che una
misura o un piano di ricerca presenta
� Validità di contenuto� Gli indicatori selezionati riflettono il contenuto
della ricerca
� Validità di costrutto� Gli indicatori selezionati misurano effettivamente il
costrutto che si vuole misurare
5/9/2012
17
� Validità predittiva� capacità di uno strumento di fare previsioni
accurate
� Validità concorrente� la misura correla con altri strumenti che si
ritengono validi nel misurare la stessa caratteristica
� Validità discriminante� la misura NON correla con altri strumenti che
misurano altre caratteristiche (precisione)