22
23‐03‐2014 1 Sono un mezzo per rappresentare dati e indagini statistiche. Sono percepiti con maggiore rapidità rispetto alla forma tabellare. Consentono di cogliere gli elementi essenziali delle distribuzioni dei dati. Grafici a barre Grafici a settori circolari (torte) Istogramma Diagramma cartesiano Diagramma di dispersione Altre rappresentazioni… Servono principalmente per rappresentare caratteri (variabili) qualitative (cioè non numeriche; ad es., regione di appartenenza, titolo di studio) quantitative (cioè numeriche; ad es., età, reddito) discrete (possono assumere valori in un insieme discreto di numeri reali; ad es. il numero di componenti di una famiglia).

Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

1

  Sono un mezzo per rappresentare dati e indagini statistiche.

  Sono percepiti con maggiore rapidità rispetto alla forma tabellare.

  Consentono di cogliere gli elementi essenziali delle distribuzioni dei dati.

Grafici a barre

Grafici a settori circolari (torte)

Istogramma Diagramma cartesiano

Diagramma di dispersione

Altre rappresentazioni…

Servono principalmente per rappresentare caratteri (variabili)   qualitative (cioè non numeriche; ad es., regione di

appartenenza, titolo di studio)   quantitative (cioè numeriche; ad es., età, reddito)   discrete (possono assumere valori in un insieme discreto di

numeri reali; ad es. il numero di componenti di una famiglia).

Page 2: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

2

Per ogni modalità del fenomeno si disegna un rettangolo (orizzontale o verticale) di

  lunghezza proporzionale alla frequenza o intensità della modalità

  larghezza arbitraria

Possono riportare valori positivi o negativi

Si possono rappresentare anche dati di tabelle a doppia entrata

Negozio Reddito

Negozio 1 € 21.500,00

Negozio 2 € 16.800,00

Negozio 3 € 20.500,00

Negozio 4 € 21.100,00

Negozio 5 € 19.700,00

• Realizzare il grafico come qui sotto

$ - $ 5.000,00 $ 10.000,00 $ 15.000,00 $ 20.000,00 $ 25.000,00

Negozio 1

Negozio 2

Negozio 3

Negozio 4

Negozio 5

Reddito

Reddito

Page 3: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

3

Esempio 2.3: la tabella seguente mostra l’ammontare di esportazioni e importazioni per attività economica. Produrre un grafico a barre rappresentativo (è a doppia entrata…)

Classi di attività economica Esportazioni Importazioni

Autoveicoli 11.681.377 24.736.864

Parti e accessori per autoveicoli 8.494.249 4.862.863

Calzature 8.394.356 3.062.063

Medicinali e preparati farmaceutici 6.988.249 6.483.934

Altre macchine per impieghi speciali 6.895.006 2.495.881

Elettrodomestici 6.011.183 1.119.915

Macchine utensili compresi parti e accessori 5.680.330 2.631.355

Altri indumenti esterni 5.669.565 2.612.787

Gioielli e articoli di oreficeria 5.382.526 941.905

Altre macchine di impiego generale 5.134.691 1.431.210

- 10.000.000 20.000.000 30.000.000 40.000.000

Autoveicoli

Parti e accessori per autoveicoli

Calzature

Medicinali e preparati farmaceutici

Altre macchine per impieghi speciali

Elettrodomestici

Macchine utensili compresi parti e accessori

Altri indumenti esterni

Gioielli e articoli di oreficeria

Altre macchine di impiego generale

Esportazioni e importazioni per attività economica anno 2001 (fonte: ISTAT) Esportazio

ni

Page 4: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

4

  Si usano quando si vuole evidenziare come il fenomeno viene suddiviso tra le varie modalità che lo compongono.

  La frequenza totale viene rappresentata dall’area del cerchio, mentre quella di ogni modalità viene rappresentata dall’area di un singolo settore.

  Ci saranno tanti settori quante sono le modalità da rappresentare. L’angolo al centro di ogni settore è proporzionale alla frequenza rappresentata

  L’ampiezza dell’angolo si ottiene moltiplicando per 360 la frequenza relativa (frequenza della modalità/frequenza totale)

  Se occorre rappresentare più di una serie di dati (più colonne) si possono usare i grafici ad anello

Page 5: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

5

La tabella seguente rappresenta il numero complessivo di depositi bancari suddivisi per aree geografiche. Produrre un grafico a torte.

Italia Nord-Occidentale 214.476 Italia Nord-Orientale 129.678 Italia Centrale 141.728 Italia Meridionale 85.614 Italia Insulare 40.817

• Realizzare il grafico come nella slide seguente

35%

21%

23%

14%

7%

Titolo del grafico

Italia Nord-Occidentale

Italia Nord-Orientale

Italia Centrale

Italia Meridionale

Italia Insulare

Page 6: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

6

Vengono utilizzati per rappresentare distribuzioni di variabili quantitative continue, rappresentate in classi

Classi di uguale ampiezza

Rettangoli con - stessa base - altezza proporzionale alla frequenza

area dei rettangoli = frequenza totale moltiplicato l’ampiezza della classe

Classi di ampiezza diversa

Rettangoli con - Base proporzionali all’ampiezza della classe - Altezza proporzionale alla densità di frequenza (freq. diviso ampiezza della classe)

Area dei rettangoli = frequenza della classe

 Calcola l’ampiezza delle classi  Calcola la densità di frequenza (frequenza/

ampiezza)

  Sulle ascisse rappresenta le classi   Si “innalzano” i rettangoli di base due

valori successivi delle ascisse, e per altezze le densità

Page 7: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

7

 Usando “Analisi dei dati”

  Si usa quando si vuole rappresentare l’andamento di un fenomeno (serie statistica), che varia in funzione di un parametro.

  Si usano le frequenze relative congiunte con una spezzata.   (Se si vuole mostrare il contributo che ogni serie fornisce al

totale al variare del tempo, si possono usare i diagrammi ad aree)

  Ascisse: modalità   Ordinate: frequenze

Page 8: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

8

Un’azienda alimentare produttrice di gelato vuole controllare il processo di riempimento di vaschette di gelato da essa prodotte. Si osservano i dati di 30 lotti di 5 vaschette, ottenendo la tabella seguente.

n. lotto Osservazioni

1a vaschetta 2a vaschetta 3a vaschetta 4a vaschetta 5a vaschetta 1 101,5 98,5 97,0 102,3 99,4 2 101,1 100,2 100,4 97,0 101,8 3 98,8 99,9 98,2 101,4 99,1 4 100,4 99,8 99,4 99,1 97,3 5 99,2 101,7 101,6 100,0 100,5 6 96,8 101,9 98,0 102,3 100,0 7 102,9 98,1 102,3 100,1 99,9 8 97,5 100,1 101,9 95,5 101,1 9 98,3 98,4 96,3 98,8 100,2

10 98,5 97,0 100,6 103,2 102,7 11 100,8 98,2 101,3 102,1 101,3 12 103,2 101,0 97,6 100,1 100,8 13 99,5 100,1 101,2 100,2 99,6 14 100,2 94,9 99,4 103,7 103,0 15 97,3 101,8 99,2 101,0 100,7 16 100,9 99,6 102,9 100,8 99,4 17 99,8 97,9 100,7 100,3 99,3 18 99,9 99,3 100,6 101,1 103,3 19 96,1 101,1 104,1 97,4 102,1 20 98,3 99,2 100,7 98,2 100,9 21 98,4 104,7 100,0 98,2 99,2 22 101,9 97,8 98,1 103,4 99,0 23 101,7 96,8 100,9 100,8 101,8 24 101,8 102,9 102,9 98,8 101,5 25 102,3 100,9 100,1 99,4 101,1 26 100,8 102,3 98,5 100,8 102,4 27 100,3 101,9 102,3 100,4 99,5 28 100,2 103,4 102,1 100,8 104,0 29 103,7 105,4 101,5 103,2 103,4 30 102,8 101,9 104,5 103,4 104,7

Page 9: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

9

Un’azienda alimentare produttrice di gelato vuole controllare il processo di riempimento di vaschette di gelato da essa prodotte. Si osservano i dati di 30 lotti di 5 vaschette, ottenendo la tabella seguente.

Si vuole visualizzare l’andamento del processo al variare dei lotti

•  selezionare grafico a linee • In Progettazione, selezionare i dati: ascisse inserire prima colonna (da 1 a 30); creare 5 serie, e per ognuna indicare i valori (la colonna corrispondente)

88,0

90,0

92,0

94,0

96,0

98,0

100,0

102,0

104,0

106,0

108,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Tit

olo

dell'

asse

Titolo del grafico

1a vaschetta

2a vaschetta

3a vaschetta

4a vaschetta

5a vaschetta

Page 10: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

10

  Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili

  Serve per osservare la “dispersione” ossia la vicinanza o distanza tra le unità statistiche

La tabella seguente riporta la concentrazione di alcuni reagenti in funzione del tempo (secondi), verificatesi durante una reazione chimica.

tempo misure di concentrazione

0 995,14

10 970,43

20 931,54

30 900,51

40 884,08

50 847,10

60 815,00

70 791,08

80 755,32

90 733,93

100 712,53

110 688,51

120 668,22

130 636,10

Page 11: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

11

La tabella seguente riporta la concentrazione di alcuni reagenti in funzione del tempo (secondi), verificatesi durante una reazione chimica.

Visualizzare le misure di concentrazione in funzione del tempo, evidenziando la vicinanza o la distanza tra le unità

•  selezionare diagramma a dispersione • In Progettazione, selezionare i dati e poi “aggiungi” •  Nome della serie “concentrazione”; •  Valori X: inserire prima colonna (tempo) •  Valori Y: le misure di concentrazione

0

100

200

300

400

500

600

700

800

900

1000

0 50 100 150 200 250 300 350 400 450 500

mM

/L

tempo (sec)

misure di concentrazione

Page 12: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

12

Esempio 2.2[B]: la tabella seguente mostra gli arrivi (variazioni in percentuale rispetto allo stesso periodo dell’anno precedente) negli alberghi italiani, nel periodo di ferragosto 2001

Zona geografica Italiani Stranieri

Nord - ovest 1,1 -7,6

Nord - est -1,0 -1,6

Centro -2,9 5,9

Sud e isole 6,5 16,1

Produrre un grafico a barre che la rappresenti

Dovrebbe uscire un grafico così

-10

-5

0

5

10

15

20

Nord - ovest Nord - est Centro Sud e isole

Arrivi negli esercizi alberghieri per ripartizione geografica ferragosto 2001 (fonte: ISTAT)

Italiani Stranieri

Page 13: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

13

  Spesso si vuole effettuare una sintesi dei dati per ottenere indici che misurino gli aspetti più rilevanti. ◦  Indici di posizione ◦  Indici di variabilità ◦  Indici di forma

  E’ un valore sintetico che esprime l’entità del carattere (ossia della variabile) che meglio rappresenta una serie di osservazioni diverse.

  Questa sintesi si può fare in modi diversi ◦  Analitiche (utilizzano tutti i valori della serie indipendentemente

dal loro ordine; ad es., media aritmetica, geometrica, armonica) ◦  Lasche o di posizione (solo osservazioni ordinate; ad es. valore

centrale, mediana, quantili, moda)

Page 14: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

14

  Supponiamo di avere n unità statistiche sulle quali si sono rilevate le modalità x1 , x2 , …, xn. Si definisce media aritmetica la somma degli n valori diviso n

  In Excel c’è la funzione MEDIA(num1;num2:…) dove num1, num2 sono argomenti (numeri, nomi o riferimenti)

  Testo, valori logici vengono esclusi. Celle contenenti 0 vengono conteggiate, celle vuote non sono conteggiate.

  Se si vuole inglobare nel calcolo anche testo oppure logici, si usa la funzione MEDIA.VALORI(val1;val2;…): le celle contenenti testo sono considerate come celle contenenti 0, VERO vale 1, FALSO vale 0.

  Viene normalmente usata per determinare il tasso di incremento/decremento medio di un bene oppure il tasso di accrescimento di una popolazione

  Si usa su valori strettamente maggiori di zero che variano in progressione geometrica. Si ottiene calcolando la radice n-esima del prodotto delle n modalità.

  In Excel è la funzione MEDIA.GEOMETRICA(num1;num2;…) dove num1, num2 sono valori strettamente maggiori di zero. Se uno è negativo, la funzione restituisce il valore di errore #NUM!

Page 15: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

15

Un olio minerale viene sottoposto ad un processo di raffinazione con 5 filtri che riducono l’olio delle seguenti percentuali (tabella). Si vuole determinare la quantità media ricavata dopo ogni filtraggio [si tratta quindi di calcolare un tasso di decremento di un bene…]

filtro n° % perdita

1 18%

2 10%

3 10%

4 5%

5 5%

Inseriamo i dati; calcoliamo la colonna C dove la prima cella è 1-B1 e così via (usiamo il trascinamento). Calcoliamo poi la media geometrica da C2 a C6 (settiamo la cella come “percentuale”)

Un olio minerale viene sottoposto ad un processo di raffinazione con 5 filtri che riducono l’olio delle seguenti percentuali (tabella). Si vuole determinare la quantità media ricavata dopo ogni filtraggio [si tratta quindi di calcolare un tasso di decremento di un bene…]

filtro n° % perdita %passaggio

1 18% 82%

2 10% 90%

3 10% 90%

4 5% 95%

5 5% 95%

Inseriamo i dati; calcoliamo la colonna C dove la prima cella è 1-A1 e così via (usiamo il trascinamento). Calcoliamo poi la media geometrica da C2 a C6 (settiamo la cella come “percentuale”)

quantità media ricavata 90,27%

Page 16: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

16

  Dato un insieme di elementi ordinati (crescenti o decrescenti), la mediana è quel valore che lascia tanti elementi a sinistra quanti a destra. Dunque è quel valore che al di sotto del quale ci sono metà delle osservazioni.

  Se le osservazioni sono dispari, occupa la posizione centrale   Se le osservazioni sono pari, la mediana è la semisomma dei due

valori che occupano la posizione centrale (la loro media).

  In Excel è la funzione MEDIANA(num1;num2;…) . Se le celle contengono testo o sono vuote, vengono ignorate. Non è necessario fornire i dati ordinatamente nelle celle.

  I quartili dividono la distribuzione in quarti.   Si tratta di ◦  I quartile (valore che lascia alla sua sinistra il 25% dei valori della

distribuzione) ◦  II quartile (è la mediana) ◦  III quartile (lascia 75% dei valori alla sua sinistra)

In Excel è la funzione QUARTILE(matrice;quarto)

Quarto=0, minimo Quarto=4 massimo (Quarto=1,2,3). Altrimenti errore

Page 17: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

17

  I percentili dividono la distribuzione in 100.

In Excel è la funzione PERCENTILE(matrice;k)

•  K è il valore percentile nell’intervallo 0,1 compresi •  matrice contiene i dati, max 8.191

Messaggi di errore:

•  #NUM! Se la matrice contiene più di 8.191 dati oppure se k è un valore numerico fuori dal range [0,1]

•  #VALORE! Se k non è un valore numerico

Si vogliono determinare i quartili a partire dai dati nella tabella seguente

Inseriamo i dati (da A1 a F3) e poi in 5 celle inseriamo la funzione QUARTILE(A1:F3;0) …

3,761 3,861 3,769 3,772 3,675 3,861

3,888 3,819 3,788 3,800 3,720 3,748

3,753 3,821 3,811 3,740 3,740 3,839

Page 18: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

18

  E’ il valore che si presenta con frequenza maggiore

  Non esiste se tutti i valori hanno la stessa frequenza. Può essere unica (distribuzione unimodale) oppure non unica (distribuzione plurimodale).

  In Excel è la funzione MODA(num1;num2…)   …con i soliti messaggi di errore; in più, se l’insieme

dei dati non ha valori duplici, restituirà il valore #N/D

La tabella seguente mostra il numero di difetti di fabbricazione riscontrati in 20 rotoli di tessuto, oggetto del controllo di qualità

6 3

9 5

14 6

17 9

3 10

8 12

9 11

2 4

14 9

1 4

moda 9

Page 19: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

19

  Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna scala sarebbe adeguata), oppure se si vogliono evidenziare le variazioni in percentuale, piuttosto che quelle assolute

  Diagramma di Pareto: serve per rappresentare la perdita economica (difettosità e loro costi).

  Diagramma a scatola e baffi (box-plot): consente di visualizzare alcune caratteristiche della distribuzione statistica (campo di variazione, percentili, media aritmetica, mediana, massimo, minimo)

  Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna scala sarebbe adeguata), oppure se si vogliono evidenziare le variazioni in percentuale, piuttosto che quelle assolute.

  Si usa la scala logaritmica per rappresentare le ordinate

Anni Passeggeri (migliaia)

1948 212 1953 324 1958 922 1963 2855 1968 5612 1973 10171 1978 12842 1983 14864

Esempio 2.11. La tabella mostra il traffico dei passeggeri negli aeroporti italiani nel periodo 1948-1983.

Graficare la dinamica del traffico.

Page 20: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

20

Usiamo la scala logaritmica (valori molto distanti tra loro…)

  Creiamo il foglio con i dati   Scegliamo il grafico Logaritmico   Nella casella Serie e Etichette X indicare le celle relative agli anni   Nella etichetta Serie e Valori indicare le celle con i valori del traffico

Se non c’è questa opzione, fare clic sul grafico. Formato Selezione corrente : fare clic sulla freccia accanto alla casella Area del grafico e quindi su Asse verticale (valori).

Formato Selezione formato: Opzioni assi ; Per modificare l'asse dei valori in logaritmico, selezionare la casella di controllo Scala logaritmica.

1

10

100

1000

10000

100000

1948

1953

1958

1963

1968

1973

1978

1983

Dinamica del traffico passeggeri negli areoporti italiani (fonte: ISTAT)

Page 21: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

21

  Diagrammi di Pareto: servono per rappresentare la perdita economica (difettosità e loro costi).

  Ordinate: frequenza di ciascun tipo di difetto riscontrato   Ascisse: tipologie di difetto in ordine di frequenza decrescente

  Curva cumulativa: rappresenta i valori cumulativi per ciascun tipo di difetto è possibile valutare quanto siano “pesanti” i primi difetti rispetto alla globalità dei difetti

La tabella seguente riporta la distribuzione, per tipologia di difetto, di 200 pezzi meccanici. Graficare l’andamento della difettosità.

Tipo di difetto Numero di difetti

deformazione 104 foro 42

graffio 20 giuoco 14 rottura 10 macchia 7

altri 3

Riportare i dati nel foglio excel. Ordinare i dati in senso decrescente (dati, ordina), in un nuovo foglio. Aggiungere C1 “totale cumulato”;in C3 inserire =B3 e poi in C4 inserire =B4+C3 e poi trascinare. Per le percentuali cumulate, realizzare il calcolo usando il trascinamento

Page 22: Diagramma di dispersione · Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza

23‐03‐2014

22

Tipo di difetto Numero di Totale Percentuale difetti cumulato cumulata

deformazione 104 104 52,00% foro 42 146 73,00%

graffio 20 166 83,00% giuoco 14 180 90,00% rottura 10 190 95,00% macchia 7 197 98,50%

altri 3 200 100,00%

Ora dobbiamo inserire il grafico.

Selezioniamo le celle B1:B9 e D1:D9; selezioniamo Grafico Istogramma

Serie, Etichette asse X: selezionare A3:A10 Valori: B3:B9

Selezionare la parte di istogramma che riguarda la percentuale cumulativa e cambiare il grafico (a linee). Poi, selezionare la serie “percentuale cumulativa” (formato, elementi grafico – menu sinistra) e “formato selezione.” Opzioni serie “traccia la serie lungo asse secondario”.

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0

20

40

60

80

100

120

deformazione foro graffio giuoco rottura macchia altri

Diagramma di Pareto per i 200 pezzi meccanici