Upload
vothien
View
220
Download
0
Embed Size (px)
Citation preview
Statistica
Lezione 1
a.a 2011-2012
Dott.ssa Daniela [email protected]
Università degli Studi del Piemonte OrientaleCorso di Laurea in Infermieristica
Corso integrato in Scienze della Prevenzione e dei Serviz i sanitari
- Comprensione dei termini di base (popolazione, campione, variabile ecc)
- calcolo e presentazione di distribuzioni di frequenza- descrizione di dati con metodi grafici- calcolo degli indici di tendenza centrale e variabilità- analisi della relazione tra due variabili
Introduzione all’inferenza statistica- Comprensione dei fondamenti della valutazione di probabilità
di un evento- Distribuzione di probabilità binomiale- Distribuzione di probabilità gaussiana- Proprietà della distribuzione della media campionaria- Intervallo di confidenza - Test di ipotesi
Programma del corso
• Fowler ed al. Statistica per le professioni sanitarie. E dises
• Altri testi per approfondimenti:
• M.Pagano & K.Gauvreau. Biostatistica (II edizione italiana). ed.
Idelson Gnocchi, Napoli 2003
• Wayne W. Daniel. Biostatistica, Edises, Napoli
• Jekel JF, Katz DL, Elmore JG, Wild DMG. Epidemiologia,
Biostatistica e Medicina Preventiva (III Edizione), Elsevier
Testi
• Insieme delle metodologie per lo studio dei fenomeni singolarmente o congiuntamente considerati con attitudine a variare
• La popolazione P è l’insieme delle unità (individui, enti etc) alle quali fare riferimento per avere informazioni sul fenomeno in questione
• L’unità statistica è un singolo elemento della popolazione
Statistica
• Individuata la popolazione e le unità statistiche:
- Identificazione delle caratteristiche rilevanti per l’indagine
- Rilevazione dei casi statistici (intervista, indagine postale, censimento etc)
- Spoglio o classificazione dei casi rilevati- Formazione di tabelle statistiche- Elaborazione dei dati statistici
Fasi di un ’indagine statistica
Rilevazione
Fasi di un ’indagine statistica
TOTALE
Descrivo la popolazione
statistica descrittiva
PARZIALE
Considero un campione della popolazione ossia una sottocollezione di membri selezionati dalla popolazione
statistica inferenziale
Variabile
Carattere osservato su ogni unità statistica
NUMERICA CATEGORICA
DISCRETA
Deriva da operazioni di conteggio
Es. n.giorni di ricovero
CONTINUA
Prodotta da operazioni di misura
Es. altezza, peso
NOMINALE
Solo classificazione
Senza ordinamento
Es. sesso, razza
ORDINALE
Classificazione con ordinamento
Es. giudizi (suff, buono, ottimo)
- Indichiamo come frequenza assoluta (f i) il numero di osservazioni con la caratteristica in esame.
- La frequenza cumulativa (F i) è la somma della frequenza delle osservazioni con valore della variabile inferiore od uguale al valore considerato.
- La proporzione (p i) o frequenza relativa si esprime come relazione quantitativa tra una parte ed il tutto. La si calcola con una frazione in cui il numeratore è compreso nel denominatore: p = parte / totale
0 <= p <= 1
- Percentuale o frequenza relativa percentuale (%) : indica una proporzione od una variazione riferiti ad una base di 100.
Percentuale = % = Proporzione * 100
Distribuzioni di frequenza
Esempio
Temperature massime in aprile di Milano (°C)
Numero di giorni nel mese di aprileFreq assoluta (f i )
Freq assoluta cumulata (F i )
Proporzione (p i)
Percentuale (%)
17 5 5+0=5 5/31=0,16 16%
20 10 5+10=15 10/31=0,32 32%
21 10 15+10=25 10/31=0,32 32%
23 5 25+5=30 5/31=0,16 16%
25 1 30+1=31 1/31=0,03 3%
totale 31 1 100%
Esercizio 1
Numero di componenti di una famiglia
Numero di famiglie (f i)
Fi p i Pi p i% Pi%
1 10
2 20
3 10
4 10
5 5
totale 55
Esercizio 1 - soluzione
Numero di componenti
di una famiglia
Numero di famiglie
Fi p i Pi p i% Pi%
1 10 10 0,18 0,18 18 18
2 20 30 0,36 0,54 36 54
3 10 40 0,18 0,72 18 72
4 10 50 0,18 0,9 18 90
5 5 55 0,09 1 9 100
totale 55 1 100
• Distribuzione di frequenza della pressione sistolica in un gruppo di 40 uomini in classi di ampiezza 10 a partire da 100 mmHg.
Suddivisione in intervalli di una variabile numerica
Pressione sistolica
Frequenza
100<=x<110 5
110<=x<120 17
120<=x<130 12
130<=x<140 5
140<=x<150 1
totale 40
Esercizio 2 - DATI
ID SESSO ETA’ ALTEZZA (cm)
FUMO
1 M 18 160 SI
2 F 20 150 NO
3 M 24 155 NO
4 F 30 162 SI
5 F 18 154 SI
6 M 25 170 SI
7 M 19 155 NO
8 F 27 165 NO
9 M 24 172 SI
10 M 20 150 NO
Esercizio 2
• Costruire la distribuzione di frequenza assoluta, la proporzione e la percentuale delle variabili sesso e fumo.
• Costruire la distribuzione di frequenza assoluta, frequenza assoluta cumulata, percentuale e percentuale cumulata della variabile altezza in classi di ampiezza 5 a partire da 150cm.
• Costruire la distribuzione di frequenza assoluta della variabile età in classi di ampiezza 5 a partire da 15 anni.
Esercizio 2 - soluzione
SESSO f i p i p i%
M 6 0,6 60
F 4 0,4 40
totale 10 1 100
FUMO f i p i p i%
SI 5 0,5 50
NO 5 0,5 50
totale 10 1 100
100
20
10
20
20
30
p i%Altezza Frequenza F i p i Pi%
150<=x<155 3 3 0.3 30
155<=x<160 2 5 0.2 50
160<=x<165 2 7 0.2 70
165<=x<170 1 8 0.1 80
170<=x<175 2 10 0.2 100
totale 10 1
Esercizio 2 - soluzione
Età Frequenza F i p i p i%
15<=x<20 3 3 0.3 30
20<=x<25 4 7 0.4 40
25<=x<30 2 9 0.2 20
30<=x<35 1 10 0.1 10
totale 10 1 100
Esercizio 2 - soluzione
Distribuzione di frequenza di 2 variabili
Procedimento:
1. definire i possibili valori di ciascuna delle due variabili2. costruire una tabella con le due variabili a definire le
righe e le colonne3. contare le osservazioni per ciascuna combinazione di
valori4. calcolare i totali di riga, colonna e della tabella
Esercizio 3
• E’ stato condotto uno studio su 531 soggetti che hanno subito un trauma da incidente di bicicletta (traumi facciali, altri traumi) e hanno indossato o meno il casco
30 soggetti con casco hanno subito traumi facciali
113 soggetti indossano il casco
212 soggetti hanno subito traumi facciali
1. Costruire una tabella a doppia entrata calcolando i totali di riga e i totali di colonna
2. Calcolare la proporzione di soggetti con casco sul totale dei soggetti
3. Calcolare la percentuale di soggetti con traumi facciali e casco sul totale di soggetti con casco
Esercizio 3
Con casco Senza casco Totale
Traumi facciali
30 182 212
Altri traumi 83 236 319
TOTALE 113 418 531
Esercizio 3
2. Proporzione di soggetti con casco sul totale dei soggetti
p = 113/531 = 0,21
3. Percentuale di soggetti con traumi facciali con casco sul totale di soggetti con casco
p% = (30/113)*100 = 26%
• Per rappresentare graficamente la distribuzione di frequenza di una variabile categorica si utilizza il diagramma a barre.
• In questo tipo di grafico i rettangoli sono proporzionali alla frequenza (assoluta o relativa) osservata e si distanziano gli uni dagli altri.
Rappresentazione grafica dei dati
0
1
2
3
4
5
6
7
M F
Fre
quen
cy
ESERCIZIO 2 – Diagramma a barre della variabile sess o
5,6
15,6
34,3
44,4
0
10
20
30
40
50
T A
Traumi
%
C
S
Esempio
ESERCIZIO 2 – Distribuzione percentuale delle variab ili trauma e uso di casco
• Nei diagrammi a torta la frequenza relativa percentuale è proporzionale all'angolo al centro.
Diagramma a torta, distribuzione di frequenza relativa percentuale
SI50%
NO50%
ESERCIZIO 2 – Diagramma a torta della variabile fumo
Angolo al centro = 360° x proporzione
Istogramma
Rappresentazione grafica di distribuzioni di frequenza di variabili numeriche.
Vengono disegnati su un grafico dei rettangoli contigui, uno per ciascun valore o intervallo (classe) di valori della variabile.
L’area dei rettangoli è proporzionale alla frequenza di osservazioni, è opportuno che gli intervalli siano della stessa ampiezza e quindi che i rettangoli corrispondenti abbiano tutti base uguale: semplifica sia la preparazione sia la lettura.
Esempio
ESERCIZIO 2 – Istogramma della variabile altezza
0
1
2
3
4
[150,155) [155,160) [160,165) [165,170) [170,175]
X
Fre
quen
cy
• Costruire l’istogramma della variabile etàdell’esercizio 2 (utilizzando le frequenze assolute)
• Costruire il diagramma a torta della variabile sesso dell’esercizio 2
Esercizio 4
Esercizio 4 - soluzione
0
1
2
3
4
5
[15,20) [20,25) [25,30) [30,35]
X
Fre
quen
cy
ESERCIZIO 2 – Istogramma della variabile età