21
La distribuzione normale

La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Embed Size (px)

Citation preview

Page 1: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

La distribuzione normale

Page 2: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

La distribuzione normale

• Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di casi infinitamente grande

• Misurazioni di una stessa grandezza variano tra loro ma le differenze tra misure e indice di riferimento (x) più sono elevate e meno sono frequenti

• Se distribuiamo per classi le misurazioni di una stessa grandezza l’istogramma che ne deriva è rappresentato da curve continue esprimibili attraverso equazioni matematiche

• La distribuzione normale è una di queste curve

Page 3: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di
Page 4: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di
Page 5: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

La forma della curva normale

• L’area di ogni rettangolo rappresenta la proporzione di casi che cade nella classe

• L’area compresa sotto la curva continua all’interno di ogni classe data può essere uguagliata all’area del rettangolo corrispondente

• Con l’aumentare del numero dei rettangoli la somma delle aree dei rettangoli stessi si avvicina sempre di più all’area sottesa alla curva continua completa

• Considerato che la somma delle aree dei rettangoli corrisponde a una unità questo sarà vero anche per l’area sottesa alla curva continua costruita

Page 6: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Caratteristiche della curva normale

• L’ascissa del punto di massimo è pari alla media (μ) e coincide con mediana e moda

• L’ordinata del punto di massimo varia al variare di DS (σ)

• È asintotica all’asse x( quanto più ci si allontana dalla media tanto più la curva si avvicina all’asse x

• È simmetrica rispetto alla retta parallela all’asse y e passante per l’ascissa del punto massimo

• L’area racchiusa dalla curva è =1

• L’area racchiusa dalla curva, dall’asse x e dalle due ordinate in corrispondenza di due punti x1 e x2 dà la percentuale di casi compresi nell’intervallo (x1, x2), posta l’area sottesa alla curva pari a 100

Page 7: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di
Page 8: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Le aree sottese alla curva normale

• Spesso è necessario determinare la proporzione di casi che ricadono entro un dato intervallo

Proprietà della curva normale

l’area sottesa alla porzione di curva che vi è tra le media e una ordinata posta a una distanza data, determinata in termini di unità di deviazione standard, è costante

Page 9: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di
Page 10: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Importanza della deviazione standard

• Se le osservazioni seguono una distribuzione normale l’intervallo compreso tra

(x 1 DS) include circa il 68% delle osservazioni

(x 2 DS) include circa il 95% delle osservazioni

(x 3 DS) include circa il 99% delle osservazioni

σ è uno dei due parametri ( con x /μ) che caratterizza la distribuzione normale (Gaussiana)

Page 11: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Si consideri ad esempio che la statura media di una popolazione di

sesso maschile e di età adulta sia di 170 cm. con deviazione

standard di 10 cm.

• La legge di Gauss mi dice che il 95% circa di questa popolazione avrà una statura compresa entro i limiti

170 20, cioè 150 e 190 cm.

• Ne deriva che nel 5% della stessa popolazione la statura sarà inferiore o superiore a tali limiti

• Essendo la curva simmetrica si avrà il 2,5% della popolazione avrà una statura inferiore a 150 cm. e il 2,5% avrà una statura superiore a 190 cm.

Page 12: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Curve normali

• La posizione nel piano della curva normale e la sua forma dipendono dalla media (μ) e dalla DS( σ)

• Ognuno di questi parametri può assumere infiniti valori, esistono nel piano infinite curve normali

• Al variare della media (parametro di posizione)la curva trasla (si sposta nel piano parallelamente a se stessa lungo l’asse x, conservando la stessa forma)

• Al variare di σ (parametro di dispersione) la curva cambia forma: si appiattisce se σ cresce e si restringe quando σ decresce

Page 13: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di
Page 14: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di
Page 15: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Standardizzazione della curva normale

• Non è necessario che le distanze dalla media siano sempre multipli esatti della deviazione standard

• E’ sempre possibile determinare l’area sottesa alla porzione di curva delimitata da due ordinate

• È possibile trasformare ogni curva normale in modo da permettere di calcolare il numero di casi sottostante ogni porzione della curva mediante l’uso di una tabella

Page 16: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Distribuzione gaussiana standardizzata

• Per agevolare il ricercatore la variabile x viene trasformata in una nuova variabile Z

• Mentre la distribuzione di X è normale con media X e s.q.m. s, quella della nuova variabile è normale con media 0 e s.q.m. 1

• La distribuzione standardizzata presenta il vantaggio di consentire la predisposizione di tabelle che permettono di calcolare porzioni di area della distribuzione e di stabilire la probabilità statistica di riscontrate valori in relazione a determinati valori Z

x

z

Page 17: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Curva standardizzataquale proporzione di casi ricade nell’intervallo 50 e 65?quale proporzione di casi ricade nell’intervallo 50 e 65?

• Una distribuzione normale, media 0 e s. q. m. 1 viene indicata come curva standardizzata e Z è il valore standardizzato

• Una Z di valore 1,5 indica che la distanza tra l’ordinata è a 1,5 s.q.m. dalla media

• Esistono tabelle che riportano per tutti le ordinate della curva standardizzata qual è la proporzione di area sottesa

s

xxz

5,110

5065

z

Page 18: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Utilizzo della tavola normale

• I valori di z sono riportati nella prima colonna a sinistra e nella riga posta in alto

• Le prime due cifre di z si leggono sulla colonna, l’ultima sulla prima riga.

• I vari numeri riportati nella tabella individuano la proporzione dell’area che è sottesa alla curva delimitate da un lato dalla media e dall’altro dall’ordinata z

Esempio precedente

uno z di valore 1,5 indica che l’ordinata è a 1,5 s.q.m.

dalla media

l’area delimitata dai punti (z=1,5) è 0,4332

Page 19: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Aree sottese alla curva normale

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0000 0040 0080 0120 0159 0199 0239 0279 0319 03590,1 0398 0438 0478 0517 0557 0596 0636 0675 0714 07530,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141......................................1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 36211,1 3643 3665 3686 3718 3729 3749 3770 3790 3810 3830.............................................1,5 4332 4345 4357 4370 4382 4394 4406 4418 4430 4441.....................1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767.........2,0 4773 4778 4783 4788 4793 4798 4803 4808 4812 4817 ..........................2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952.......................

Page 20: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Utilizzo della tavola normale

• Data una distribuzione con X=168 e S=12 • Trovare la proporzione di casi inferiori o uguali (≤ )a 143

08,212

25

12

168143

z

143 168

Page 21: La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di

Utilizzo della tavola normale

• Nella tabella normale si legge che l’area compresa tra la media e uno z = 2,08 è di 0,4812

• Considerata la simmetria della curva l’area a destra della media deve essere = 0,5

• L’area tratteggiata si ottiene sottraendo il valore trovato sulla tabella dal totale dell’area alla sinistra della media

• (percentuale di casi ≤ 143)= 0,5000 – 0,4812 = 0,0188

• Meno del 2% dei casi hanno un valore minore o uguale a 143

• Per calcolare l’area complessiva esterna rispetto ai punti 168 25 si raddoppia il risultato (si considera anche l’ area tratteggiata simmetrica)