Upload
others
View
28
Download
0
Embed Size (px)
Citation preview
1
Statistica Descrittiva
Indagine Statistica: Terminologia
Def. Popolazione (o Collettivo Statistico) : Insieme di elementi oggetto dell’indagine statistica aventi caratteristiche comuni.
Tali elementi vengono chiamati unità statistiche.
Def. Carattere (o Variabile Statistica) : grandezza che viene rilevata su una unità statistica.
Def. Insieme delle modalità di un Carattere: insieme di tutte le possibili espressioni con cui un carattere può manifestarsi.
Esempi (natura dati):
Caratteri qualitativi : espressi in forma verbale (attributi)
colori occhi:
Modalità: azzurri, grigi , neri,..
nazionalità:
Modalità: italiana, francese , svizzera,..
religione:
Modalità: cattolica, protestante , musulmana
Es. Gli alunni di una classe rappresentano un collettivo statistico. Ogni alunno è un’unità statistica.
Rilevazione (Raccolta) Dati: Raccolta Campionaria e Raccolta Globale
2
Indagine Statistica: Terminologia
Caratteri quantitativi : espressi da numeri (le modalità per essi si chiamano
valori)
statura:
Valori: 173 cm, 165 cm,..
numero di stanze della casa di abitazione:
Valori: 2, 3, 5, ….
Def. Dato Statistico : numero che si determina in presenza di una data modalità di un
carattere.
a) Può rappresentare il numero di volte in cui si presenta una determinata modalità. In
questo caso si chiama Frequenza (di quella modalità).
b) Può esprimere una misura. In questo caso si chiama Intensità (di quella modalità).
I dati statistici sono solitamente riassunti in tabelle che si chiamano Distribuzioni di
frequenza o di intensità che indicano come si dividono i dati statistici nelle diverse
modalità (o nei diversi caratteri).
Le frequenze (assolute) si indicano con fi (in cui l’indice i indica la modalità a cui è
riferita) ed esprimono quante volte si è manifestata quella determinata modalità.
Le Intensità (assolute) si determinano, in modo analogo, attraverso una misura di
quella determinata modalità.
3
Indagine Statistica: Terminologia
Def. Frequenza Relativa : è il rapporto tra la frequenza assoluta di una determinata
modalità ed il numero totale dei casi (può essere espressa anche in forma percentuale).
i
ii
i fN,..,niN
fp 1 (relativamente alla i-esima modalità)
Es. In un gruppo di N=30 persone abbiamo 15 italiani, 10 francesi, 5 inglesi
151 f 102 f 53 f
Es. Relativamente all’esempio precedente
2
1
30
151 p
3
1
30
102 p
6
1
30
53 p
Proprietà 11
n
i
ip10 ip
Es. Ponendo tre oggetti su una bilancia si ottengono i tre pesi 5,48kg, 8.78kg 7.75 kg:
48,51 I 78,82 I 75,73 I
( condizione di normalizzazione)
4
Es. Numero di incidenti sul lavoro per giorno della settimana
Indagine Statistica: Terminologia
Def. Frequenza Cumulativa (o Cumulata) : è data dalla somma delle frequenze
(usualmente percentuali) sino alla modalità considerata.
Giorni Lavorativi Freq. Ass. Freq. Rel. Freq. % Freq. Cum.
Lunedì 52 0,208 20,80% 20,80%
Martedì 48 0,192 19,20% 40,00%
Mercoledì 45 0,180 18,00% 58,00%
Giovedì 52 0,208 20,80% 78,80%
Venerdì 53 0,212 21,20% 100,00%
Totale 250 1,000 100,00%
5
Indagine Statistica: Terminologia
Riassumendo:
Secondo il Carattere X gli N individui della popolazione C si distribuiscono
nelle modalità 1,…,k , secondo le frequenze f1,…,fk
Nfff
xxX
k
i
i
k
k
11
1con
......
......
oppure
1con ......
11
1
k
i
i
k
kp
......pp
xxX
Def. La X precedentemente costruita si chiama:
Variabile statistica a una dimensione se il carattere è quantitativo
Mutabile statistica a una dimensione se il carattere è qualitativo
6
2) Rilevazione (Raccolta) Dati:
Raccolta Campionaria (Parziale) e Raccolta Globale
Raccolta pubblica o privata
Ricerca Statistica: Fasi
1) Studio del problema e impostazione della ricerca statistica
Esatta definizione del fenomeno
Ipotesi da provare
Individuazione delle unità statistiche
3) Spoglio, Classificazione e Tabulazione Dati:
Tabella Statistiche Semplici:
Mutabili (con un numero finito di modalità)
Variabili discrete (con un numero finito di modalità)
Variabili continue ( con raggruppamento in classi)
Tabella Statistiche a Doppia Entrata:
7
Variabili Discrete e Continue
Voto in Matematica Alunni
3 1
4 2
5 5
6 13
7 4
8 2
Totale 27
Statura (in cm) Freq. [120-130) 3
[130-140) 14
[140-150) 138
[150-160) 2334
[160-170) 5659
[170-180) 1739
[180-190) 111
[190-200] 2
Totale 10000
Variabili discrete (con un numero finito di modalità) Variabili continue ( con raggruppamento in classi)
4) Elaborazione Dati
Indagini di natura matematica (indici di posizione, di dispersione , etc)
5) Interpretazione dei risultati. Conclusioni dell’indagine
9
1) ORTOGRAMMI : Basi eguali ; altezze proporzionali alle frequenze
Rappresentazione Grafica dei Dati Statistici
A strisce
A colonne
10
Rappresentazione Grafica dei Dati Statistici
2) DIAGRAMMI CIRCOLARI (A TORTA) (angolo al centro proporzionale alla frequenza)
11
Rappresentazione Grafica dei Dati Statistici
3) COORDINATE POLARI
4) IDEOGRAMMI (PICTOGRAMMI) (fanno riferimento a figure stilizzate)
15
Rappresentazione Grafica dei Dati Statistici
8) ISTOGRAMMI
Si utilizzano quando si ha una distribuzione statistica con modalità del carattere
quantitativo le quali sono ripartite in classi di varia ampiezza. L’istogramma consiste in
un insieme di rettangoli aventi:
a) Base sull’asse orizzontale con gli estremi nei limiti di ogni classe
b) Area proporzionale alla frequenza delle classi
N.B. se le classi hanno tutte la stessa ampiezza allora l’altezza è proporzionale alla
frequenza
Classi con diversa ampiezza
16
Rappresentazione Grafica dei Dati Statistici
Classi con uguale ampiezza
(poligoni delle frequenze)