30
STATISTICA MEDICA Prof.ssa Donatella Siepi [email protected] tel: 075 5853525 UNIVERSITA’ DEGLI STUDI DI PERUGIA

STATISTICA MEDICA - med.unipg.it Didattico... · dopo aver raccolto i dati e prodotto l’informazione statistica ed è il punto di partenza per la rappresentazione, la lettura,

  • Upload
    lytu

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

STATISTICA MEDICA

Prof.ssa Donatella Siepi

[email protected]

tel: 075 5853525

UNIVERSITA’ DEGLI

STUDI DI PERUGIA

4° LEZIONE

Statistica descrittiva

C

Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati

STATISTICA DESCRITTIVA

piano tabelle grafici Medie e indici di

variabilitàA

D

E

B

C

A

D

E

B

In seguito

Tavola riassuntiva delle caratteristiche

delle scale di misura StevensNominale Ordinale Intervalli Rapporti

Tipo di

variabile

Qualitativa Qualitativa

rettilinea o

ciclica

Quantitativa Quantitativa

Proprietà Classificazione

Non c’è

ordinamento

tra le modalità

Ordinamento

Le modalità

presentano un

ordinamento

Conservazione

delle relazioni

tra le distanze

Esiste un unità

di misura

Costanza del

rapporto tra i valori

utilizzati

Zero non Arbitrario

Operazioni

matematiche

di base

Uguaglianza

/Disuguaglianz

a

=;

Maggiore di /

Minore di

>; <; =;

Somma e

Sottrazione

+; -

Moltiplicazione e

Divisione

Indicatori

statistici

Numero dei

casi

Frequenze

Moda

Mediana

Percentili

Quartili

Media

Varianza

Correlazione

Coeff. di

Variazione

Concentrazione

Statistica descrittiva

C

Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati

STATISTICA DESCRITTIVA

piano tabelle grafici Medie e indici di

variabilitàA

D

E

B

C

A

D

E

B

In seguito

E’ una particolare ed efficace rappresentazione grafica della strutturaper età e sesso di un dato collettivo o popolazione.

E’ rappresentata da due istogrammi rovesciati, corrispondenti ai duesessi, sul cui asse verticale comune sono indicate le modalità delcarattere età (in classi) e sul cui asse orizzontale sono riportate lefrequenze (assolute o relative) sia dei maschi che delle femmine,corrispondenti a ciascuna classe di età considerata.

Piramide delle età

Dalla forma assunta dalla piramide è possibile trarre indicazioni siasui fattori che caratterizzano la struttura per età e sesso attualeche sull’evoluzione passata nonché previsioni per un arco di temponon superiore a un secolo.

Tali indicazioni possono essere tratte analizzando, in particolare:

- La base, che fornisce indicazioni circa il flusso delle nascite. Se èmolto larga, si ha un flusso di nascite in forte aumento; se èsufficientemente larga, le nascite sono costanti o in lieveaumento; se è stretta significa che il flusso delle nascite è indiminuzione.

- L’inclinazione dei lati, che fornisce indicazioni circa il livellogenerale di eliminazione per morte. Se l’obliquità dei lati è forte,si ha un’alta mortalità; se è debole, si ha una bassa mortalità.

- La presenza di rigonfiamenti o strozzature per particolari classid’età, che fornisce indicazione dell’intervento di particolari fattoridi perturbazione (es. Prima Guerra Mondiale).

Piramide delle età

????????????• Matrice dei dati o

serie di dati

• Tabelle semplici

• Tabelle a doppia

entrata

• Curve di frequenza

• Grafici a dispersione

• Areogrammi

• Cartogrammi

• Istogrammi

• Grafici a barre

• Poligoni

Frequenze

assolute

Frequenze

relative

Frequenze

assolute

Frequenze

relative

14-19 650 3,1 494 15,5

20-24 1.953 9,2 969 30,3

25-29 3.062 14,5 699 21,9

30 e

oltre15.461 73,2 1.032 32,3

Totale 21.126 100 3.194 100

CLASSI

DI

ETA’

OCCUPATI

PERSONE IN

CERCA DI

OCCUPAZIONE

Forze di lavoro per condizione e classe di età. Ottobre 1992

Fonte:ISTAT. Dati in migliaia e in percentuale

Tabella a doppia entrata (mista)

Come presentare i dati: le tabelle

La tabella è uno schema che consente di presentare i dati in modo

ordinato e sintetico; quindi rende l’informazione statistica

rapidamente leggibile.

La tabella è un'immagine semplificata del fenomeno osservato.

Essa può contenere una distribuzione semplice, doppia, tripla,

oppure più distribuzioni semplici giustapposte. Può contenere

anche risultati di elaborazioni sui dati raccolti: rapporti, differenze,

valori medi eccetera.

La tabella dovrebbe essere chiara e di facile comprensione.

Qualche volta, invece, le tabelle sono complicate e difficili da

leggere poiché raccolgono in poco spazio molte informazioni.

Inoltre, i termini utilizzati sono spesso basati su definizioni

minuziose, oppure sono poco chiari.

Le tabelle, come i grafici, si utilizzano per dare visibilità ai

dati dopo che sono stati raccolti individualmente ed

elaborati.

Tabelle e grafici si completano a vicenda e concorrono a

descrivere il fenomeno che costituisce l’oggetto

dell'indagine.

La tabella è la prima sintesi sistematica a cui si perviene

dopo aver raccolto i dati e prodotto l’informazione statistica

ed è il punto di partenza per la rappresentazione, la lettura,

l’interpretazione e l’elaborazione successiva.

Il ricorso alle tabelle è appropriato per presentare tra una

ventina e un centinaio di dati. Al di sopra di questo numero,

è di solito più indicato un grafico o una figura.

Quando utilizzare le tabelle

Ogni tabella deve essere autoesplicativa. A questo scopo è necessario

che la tabella abbia un titolo che renda evidente il suo contenuto. Il titolo

deve indicare l’insieme (popolazione) degli elementi (unità statistiche) su

cui è stata effettuata la rilevazione; che cosa è stato rilevato

(caratteristica o carattere); il riferimento temporale e territoriale della

rilevazione; le eventuali elaborazioni effettuate sui dati.

La tabella è organizzata per colonne. Ogni colonna deve portare la

propria intestazione. L’insieme delle intestazioni forma la testata. La

prima colonna (dettacolonna madre) riporta le modalità del carattere

rispetto alle quali è stata fatta la classificazione, oppure le occasioni

nelle quali i dati sono stati rilevati.

Gli elementi delle tabelle

Frequenze

assolute

Frequenze

relative

Frequenze

assolute

Frequenze

relative

14-19 650 3,1 494 15,5

20-24 1.953 9,2 969 30,3

25-29 3.062 14,5 699 21,9

30 e

oltre15.461 73,2 1.032 32,3

Totale 21.126 100 3.194 100

CLASSI

DI

ETA’

OCCUPATI

PERSONE IN

CERCA DI

OCCUPAZIONE

Forze di lavoro per condizione e classe di età. Ottobre 1992

Fonte:ISTAT. Dati in migliaia e in percentuale

Tabella a doppia entrata (mista)

Statistica descrittiva

C

Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati

STATISTICA DESCRITTIVA

piano tabelle grafici Medie e indici di

variabilitàA

D

E

B

C

A

D

E

B

• Rispetto alle cifre, le figure

forniscono impressioni che

sono percepite con maggiore

facilità; ma nel contempo hanno il

limite di essere meno precise e

meno ricche di particolari.

• Per i caratteri qualitativi, la tabella e le

rappresentazioni grafiche esauriscono

quasi completamente gli aspetti descrittivi,

quando sia possibile leggere con esattezza le

frequenze delle varie classi.

• Per i caratteri quantitativi, si pone il

problema di sintesi oggettive che possano

essere elaborate matematicamente e quindi

che siano numeriche, al fine di un'analisi

obiettiva che deve condurre tutti i

ricercatori, con gli stessi dati, alle

medesime conclusioni.

Indici Statistici

Per sintetizzare i dati ed evidenziare una

certa caratteristica:

• Indici di tendenza centrale

• Indici di dispersione

• La forma

• Le misure di tendenza centrale o

posizione servono per individuare il

valore intorno al quale i dati sono

raggruppati; la tendenza centrale è la

misura più appropriata per sintetizzare

l'insieme delle osservazioni, se una

distribuzione di dati dovesse essere

descritta con un solo valore; è la prima

indicazione della dimensione del

fenomeno.

• Le misure proposte sono essenzialmente 3: la

media, la moda e la mediana.

• La scelta della misura di tendenza centrale di

una serie di dati dipende dalle caratteristiche

della distribuzione e dal tipo di scala.

La media

Gli obiettivi che ci si prefigge nel calcolo di una

media sono sostanzialmente due:

1) sostituire a più dati rilevati un solo numero

che dia però una efficace rappresentazione

del fenomeno dato;

2) esprimere l’ordine di grandezza o tendenza

centrale dell’insieme dei dati relativi a un

fenomeno. Tale ordine di grandezza può a

volte sfuggire perché i dati sono spesso

differenti fra loro.

La Media

A questo punto bisogna dare dei criteri pratici

per calcolare tale valor medio; i più

importanti, quindi quelli più usati, sono i

seguenti:

a) si può calcolare il valor medio come

funzione matematica dei dati rilevati e in tal

caso si parla di media analitica;

b) si possono ordinare i dati rilevati e ottenere la

media in relazione alla posizione che occupa

fra essi e in tal caso si parla di media di

posizione.

La media aritmetica

64

24

4

6585

6,5,8,5:

...,...,, 21

21

M

valoriseguentiiDati

n

xxxxxxM n

n

La media aritmetica semplice M di n valori è il

rapporto fra la loro somma e il loro numero n:

La media aritmetica di distribuzioni di

frequenza raggruppate in classi, è detta

media aritmetica ponderata

Calcolo della media ponderata

624

3857865534

M

Voto

(modalità)

Allievi

(frequenza)

4 3

5 5

6 8

7 5

8 3

Esempio

Se all’esame finale di un corso si attribuisce un peso

tre volte superiore a quello attribuito ad un

questionario, ed uno studente ottiene come voto

finale 85 e come voto per i questionari 70 e 90 la

medieadei voti è

X = (1)(70)+(1)(90)+ (3)(85) = 415 = 83

1 + 1 + 3 5

Media geometrica sempliceLa media geometrica semplice è utilizzata quando

le variabili non sono rappresentate da valori

lineari, ma ottenuti da prodotti o da rapporti di valori

lineari.

Serve per il confronto di superfici o volumi, di tassi di

accrescimento o di sopravvivenza, per quei valori

appunto che sono espressi da rapporti.

La media geometrica di n dati è uguale alla radice

di ordine n (solo positiva) del prodotto degli n dati

MEDIA ARMONICA

La media armonica H di un insieme

di N numeri X 1, X2 ecc è il

reciproco della media aritmetica dei

reciproci dei numeri stessi

H = _____________3___________= 3 = 3,43

½ + 1/4 + 1/8 7/8

Quale è la media armonica dei numeri 2,4 ,8

Media quadratica

√X2_

ha senso come misura di tendenza centrale

solamente se i valori sono positivi o nulli.

E' un indice che trova applicazioni quando si

analizzano superfici.

Si usa in fisica

è la radice quadrata della media aritmetica

dei quadrati