Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
23‐03‐2014
1
Sono un mezzo per rappresentare dati e indagini statistiche.
Sono percepiti con maggiore rapidità rispetto alla forma tabellare.
Consentono di cogliere gli elementi essenziali delle distribuzioni dei dati.
Grafici a barre
Grafici a settori circolari (torte)
Istogramma Diagramma cartesiano
Diagramma di dispersione
Altre rappresentazioni…
Servono principalmente per rappresentare caratteri (variabili) qualitative (cioè non numeriche; ad es., regione di
appartenenza, titolo di studio) quantitative (cioè numeriche; ad es., età, reddito) discrete (possono assumere valori in un insieme discreto di
numeri reali; ad es. il numero di componenti di una famiglia).
23‐03‐2014
2
Per ogni modalità del fenomeno si disegna un rettangolo (orizzontale o verticale) di
lunghezza proporzionale alla frequenza o intensità della modalità
larghezza arbitraria
Possono riportare valori positivi o negativi
Si possono rappresentare anche dati di tabelle a doppia entrata
Negozio Reddito
Negozio 1 € 21.500,00
Negozio 2 € 16.800,00
Negozio 3 € 20.500,00
Negozio 4 € 21.100,00
Negozio 5 € 19.700,00
• Realizzare il grafico come qui sotto
$ - $ 5.000,00 $ 10.000,00 $ 15.000,00 $ 20.000,00 $ 25.000,00
Negozio 1
Negozio 2
Negozio 3
Negozio 4
Negozio 5
Reddito
Reddito
23‐03‐2014
3
Esempio 2.3: la tabella seguente mostra l’ammontare di esportazioni e importazioni per attività economica. Produrre un grafico a barre rappresentativo (è a doppia entrata…)
Classi di attività economica Esportazioni Importazioni
Autoveicoli 11.681.377 24.736.864
Parti e accessori per autoveicoli 8.494.249 4.862.863
Calzature 8.394.356 3.062.063
Medicinali e preparati farmaceutici 6.988.249 6.483.934
Altre macchine per impieghi speciali 6.895.006 2.495.881
Elettrodomestici 6.011.183 1.119.915
Macchine utensili compresi parti e accessori 5.680.330 2.631.355
Altri indumenti esterni 5.669.565 2.612.787
Gioielli e articoli di oreficeria 5.382.526 941.905
Altre macchine di impiego generale 5.134.691 1.431.210
- 10.000.000 20.000.000 30.000.000 40.000.000
Autoveicoli
Parti e accessori per autoveicoli
Calzature
Medicinali e preparati farmaceutici
Altre macchine per impieghi speciali
Elettrodomestici
Macchine utensili compresi parti e accessori
Altri indumenti esterni
Gioielli e articoli di oreficeria
Altre macchine di impiego generale
Esportazioni e importazioni per attività economica anno 2001 (fonte: ISTAT) Esportazio
ni
23‐03‐2014
4
Si usano quando si vuole evidenziare come il fenomeno viene suddiviso tra le varie modalità che lo compongono.
La frequenza totale viene rappresentata dall’area del cerchio, mentre quella di ogni modalità viene rappresentata dall’area di un singolo settore.
Ci saranno tanti settori quante sono le modalità da rappresentare. L’angolo al centro di ogni settore è proporzionale alla frequenza rappresentata
L’ampiezza dell’angolo si ottiene moltiplicando per 360 la frequenza relativa (frequenza della modalità/frequenza totale)
Se occorre rappresentare più di una serie di dati (più colonne) si possono usare i grafici ad anello
23‐03‐2014
5
La tabella seguente rappresenta il numero complessivo di depositi bancari suddivisi per aree geografiche. Produrre un grafico a torte.
Italia Nord-Occidentale 214.476 Italia Nord-Orientale 129.678 Italia Centrale 141.728 Italia Meridionale 85.614 Italia Insulare 40.817
• Realizzare il grafico come nella slide seguente
35%
21%
23%
14%
7%
Titolo del grafico
Italia Nord-Occidentale
Italia Nord-Orientale
Italia Centrale
Italia Meridionale
Italia Insulare
23‐03‐2014
6
Vengono utilizzati per rappresentare distribuzioni di variabili quantitative continue, rappresentate in classi
Classi di uguale ampiezza
Rettangoli con - stessa base - altezza proporzionale alla frequenza
area dei rettangoli = frequenza totale moltiplicato l’ampiezza della classe
Classi di ampiezza diversa
Rettangoli con - Base proporzionali all’ampiezza della classe - Altezza proporzionale alla densità di frequenza (freq. diviso ampiezza della classe)
Area dei rettangoli = frequenza della classe
Calcola l’ampiezza delle classi Calcola la densità di frequenza (frequenza/
ampiezza)
Sulle ascisse rappresenta le classi Si “innalzano” i rettangoli di base due
valori successivi delle ascisse, e per altezze le densità
23‐03‐2014
7
Usando “Analisi dei dati”
Si usa quando si vuole rappresentare l’andamento di un fenomeno (serie statistica), che varia in funzione di un parametro.
Si usano le frequenze relative congiunte con una spezzata. (Se si vuole mostrare il contributo che ogni serie fornisce al
totale al variare del tempo, si possono usare i diagrammi ad aree)
Ascisse: modalità Ordinate: frequenze
23‐03‐2014
8
Un’azienda alimentare produttrice di gelato vuole controllare il processo di riempimento di vaschette di gelato da essa prodotte. Si osservano i dati di 30 lotti di 5 vaschette, ottenendo la tabella seguente.
n. lotto Osservazioni
1a vaschetta 2a vaschetta 3a vaschetta 4a vaschetta 5a vaschetta 1 101,5 98,5 97,0 102,3 99,4 2 101,1 100,2 100,4 97,0 101,8 3 98,8 99,9 98,2 101,4 99,1 4 100,4 99,8 99,4 99,1 97,3 5 99,2 101,7 101,6 100,0 100,5 6 96,8 101,9 98,0 102,3 100,0 7 102,9 98,1 102,3 100,1 99,9 8 97,5 100,1 101,9 95,5 101,1 9 98,3 98,4 96,3 98,8 100,2
10 98,5 97,0 100,6 103,2 102,7 11 100,8 98,2 101,3 102,1 101,3 12 103,2 101,0 97,6 100,1 100,8 13 99,5 100,1 101,2 100,2 99,6 14 100,2 94,9 99,4 103,7 103,0 15 97,3 101,8 99,2 101,0 100,7 16 100,9 99,6 102,9 100,8 99,4 17 99,8 97,9 100,7 100,3 99,3 18 99,9 99,3 100,6 101,1 103,3 19 96,1 101,1 104,1 97,4 102,1 20 98,3 99,2 100,7 98,2 100,9 21 98,4 104,7 100,0 98,2 99,2 22 101,9 97,8 98,1 103,4 99,0 23 101,7 96,8 100,9 100,8 101,8 24 101,8 102,9 102,9 98,8 101,5 25 102,3 100,9 100,1 99,4 101,1 26 100,8 102,3 98,5 100,8 102,4 27 100,3 101,9 102,3 100,4 99,5 28 100,2 103,4 102,1 100,8 104,0 29 103,7 105,4 101,5 103,2 103,4 30 102,8 101,9 104,5 103,4 104,7
23‐03‐2014
9
Un’azienda alimentare produttrice di gelato vuole controllare il processo di riempimento di vaschette di gelato da essa prodotte. Si osservano i dati di 30 lotti di 5 vaschette, ottenendo la tabella seguente.
Si vuole visualizzare l’andamento del processo al variare dei lotti
• selezionare grafico a linee • In Progettazione, selezionare i dati: ascisse inserire prima colonna (da 1 a 30); creare 5 serie, e per ognuna indicare i valori (la colonna corrispondente)
88,0
90,0
92,0
94,0
96,0
98,0
100,0
102,0
104,0
106,0
108,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Tit
olo
dell'
asse
Titolo del grafico
1a vaschetta
2a vaschetta
3a vaschetta
4a vaschetta
5a vaschetta
23‐03‐2014
10
Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili
Serve per osservare la “dispersione” ossia la vicinanza o distanza tra le unità statistiche
La tabella seguente riporta la concentrazione di alcuni reagenti in funzione del tempo (secondi), verificatesi durante una reazione chimica.
tempo misure di concentrazione
0 995,14
10 970,43
20 931,54
30 900,51
40 884,08
50 847,10
60 815,00
70 791,08
80 755,32
90 733,93
100 712,53
110 688,51
120 668,22
130 636,10
23‐03‐2014
11
La tabella seguente riporta la concentrazione di alcuni reagenti in funzione del tempo (secondi), verificatesi durante una reazione chimica.
Visualizzare le misure di concentrazione in funzione del tempo, evidenziando la vicinanza o la distanza tra le unità
• selezionare diagramma a dispersione • In Progettazione, selezionare i dati e poi “aggiungi” • Nome della serie “concentrazione”; • Valori X: inserire prima colonna (tempo) • Valori Y: le misure di concentrazione
0
100
200
300
400
500
600
700
800
900
1000
0 50 100 150 200 250 300 350 400 450 500
mM
/L
tempo (sec)
misure di concentrazione
23‐03‐2014
12
Esempio 2.2[B]: la tabella seguente mostra gli arrivi (variazioni in percentuale rispetto allo stesso periodo dell’anno precedente) negli alberghi italiani, nel periodo di ferragosto 2001
Zona geografica Italiani Stranieri
Nord - ovest 1,1 -7,6
Nord - est -1,0 -1,6
Centro -2,9 5,9
Sud e isole 6,5 16,1
Produrre un grafico a barre che la rappresenti
Dovrebbe uscire un grafico così
-10
-5
0
5
10
15
20
Nord - ovest Nord - est Centro Sud e isole
Arrivi negli esercizi alberghieri per ripartizione geografica ferragosto 2001 (fonte: ISTAT)
Italiani Stranieri
23‐03‐2014
13
Spesso si vuole effettuare una sintesi dei dati per ottenere indici che misurino gli aspetti più rilevanti. ◦ Indici di posizione ◦ Indici di variabilità ◦ Indici di forma
E’ un valore sintetico che esprime l’entità del carattere (ossia della variabile) che meglio rappresenta una serie di osservazioni diverse.
Questa sintesi si può fare in modi diversi ◦ Analitiche (utilizzano tutti i valori della serie indipendentemente
dal loro ordine; ad es., media aritmetica, geometrica, armonica) ◦ Lasche o di posizione (solo osservazioni ordinate; ad es. valore
centrale, mediana, quantili, moda)
23‐03‐2014
14
Supponiamo di avere n unità statistiche sulle quali si sono rilevate le modalità x1 , x2 , …, xn. Si definisce media aritmetica la somma degli n valori diviso n
In Excel c’è la funzione MEDIA(num1;num2:…) dove num1, num2 sono argomenti (numeri, nomi o riferimenti)
Testo, valori logici vengono esclusi. Celle contenenti 0 vengono conteggiate, celle vuote non sono conteggiate.
Se si vuole inglobare nel calcolo anche testo oppure logici, si usa la funzione MEDIA.VALORI(val1;val2;…): le celle contenenti testo sono considerate come celle contenenti 0, VERO vale 1, FALSO vale 0.
Viene normalmente usata per determinare il tasso di incremento/decremento medio di un bene oppure il tasso di accrescimento di una popolazione
Si usa su valori strettamente maggiori di zero che variano in progressione geometrica. Si ottiene calcolando la radice n-esima del prodotto delle n modalità.
In Excel è la funzione MEDIA.GEOMETRICA(num1;num2;…) dove num1, num2 sono valori strettamente maggiori di zero. Se uno è negativo, la funzione restituisce il valore di errore #NUM!
23‐03‐2014
15
Un olio minerale viene sottoposto ad un processo di raffinazione con 5 filtri che riducono l’olio delle seguenti percentuali (tabella). Si vuole determinare la quantità media ricavata dopo ogni filtraggio [si tratta quindi di calcolare un tasso di decremento di un bene…]
filtro n° % perdita
1 18%
2 10%
3 10%
4 5%
5 5%
Inseriamo i dati; calcoliamo la colonna C dove la prima cella è 1-B1 e così via (usiamo il trascinamento). Calcoliamo poi la media geometrica da C2 a C6 (settiamo la cella come “percentuale”)
Un olio minerale viene sottoposto ad un processo di raffinazione con 5 filtri che riducono l’olio delle seguenti percentuali (tabella). Si vuole determinare la quantità media ricavata dopo ogni filtraggio [si tratta quindi di calcolare un tasso di decremento di un bene…]
filtro n° % perdita %passaggio
1 18% 82%
2 10% 90%
3 10% 90%
4 5% 95%
5 5% 95%
Inseriamo i dati; calcoliamo la colonna C dove la prima cella è 1-A1 e così via (usiamo il trascinamento). Calcoliamo poi la media geometrica da C2 a C6 (settiamo la cella come “percentuale”)
quantità media ricavata 90,27%
23‐03‐2014
16
Dato un insieme di elementi ordinati (crescenti o decrescenti), la mediana è quel valore che lascia tanti elementi a sinistra quanti a destra. Dunque è quel valore che al di sotto del quale ci sono metà delle osservazioni.
Se le osservazioni sono dispari, occupa la posizione centrale Se le osservazioni sono pari, la mediana è la semisomma dei due
valori che occupano la posizione centrale (la loro media).
In Excel è la funzione MEDIANA(num1;num2;…) . Se le celle contengono testo o sono vuote, vengono ignorate. Non è necessario fornire i dati ordinatamente nelle celle.
I quartili dividono la distribuzione in quarti. Si tratta di ◦ I quartile (valore che lascia alla sua sinistra il 25% dei valori della
distribuzione) ◦ II quartile (è la mediana) ◦ III quartile (lascia 75% dei valori alla sua sinistra)
In Excel è la funzione QUARTILE(matrice;quarto)
Quarto=0, minimo Quarto=4 massimo (Quarto=1,2,3). Altrimenti errore
23‐03‐2014
17
I percentili dividono la distribuzione in 100.
In Excel è la funzione PERCENTILE(matrice;k)
• K è il valore percentile nell’intervallo 0,1 compresi • matrice contiene i dati, max 8.191
Messaggi di errore:
• #NUM! Se la matrice contiene più di 8.191 dati oppure se k è un valore numerico fuori dal range [0,1]
• #VALORE! Se k non è un valore numerico
Si vogliono determinare i quartili a partire dai dati nella tabella seguente
Inseriamo i dati (da A1 a F3) e poi in 5 celle inseriamo la funzione QUARTILE(A1:F3;0) …
3,761 3,861 3,769 3,772 3,675 3,861
3,888 3,819 3,788 3,800 3,720 3,748
3,753 3,821 3,811 3,740 3,740 3,839
23‐03‐2014
18
E’ il valore che si presenta con frequenza maggiore
Non esiste se tutti i valori hanno la stessa frequenza. Può essere unica (distribuzione unimodale) oppure non unica (distribuzione plurimodale).
In Excel è la funzione MODA(num1;num2…) …con i soliti messaggi di errore; in più, se l’insieme
dei dati non ha valori duplici, restituirà il valore #N/D
La tabella seguente mostra il numero di difetti di fabbricazione riscontrati in 20 rotoli di tessuto, oggetto del controllo di qualità
6 3
9 5
14 6
17 9
3 10
8 12
9 11
2 4
14 9
1 4
moda 9
23‐03‐2014
19
Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna scala sarebbe adeguata), oppure se si vogliono evidenziare le variazioni in percentuale, piuttosto che quelle assolute
Diagramma di Pareto: serve per rappresentare la perdita economica (difettosità e loro costi).
Diagramma a scatola e baffi (box-plot): consente di visualizzare alcune caratteristiche della distribuzione statistica (campo di variazione, percentili, media aritmetica, mediana, massimo, minimo)
Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna scala sarebbe adeguata), oppure se si vogliono evidenziare le variazioni in percentuale, piuttosto che quelle assolute.
Si usa la scala logaritmica per rappresentare le ordinate
Anni Passeggeri (migliaia)
1948 212 1953 324 1958 922 1963 2855 1968 5612 1973 10171 1978 12842 1983 14864
Esempio 2.11. La tabella mostra il traffico dei passeggeri negli aeroporti italiani nel periodo 1948-1983.
Graficare la dinamica del traffico.
23‐03‐2014
20
Usiamo la scala logaritmica (valori molto distanti tra loro…)
Creiamo il foglio con i dati Scegliamo il grafico Logaritmico Nella casella Serie e Etichette X indicare le celle relative agli anni Nella etichetta Serie e Valori indicare le celle con i valori del traffico
Se non c’è questa opzione, fare clic sul grafico. Formato Selezione corrente : fare clic sulla freccia accanto alla casella Area del grafico e quindi su Asse verticale (valori).
Formato Selezione formato: Opzioni assi ; Per modificare l'asse dei valori in logaritmico, selezionare la casella di controllo Scala logaritmica.
1
10
100
1000
10000
100000
1948
1953
1958
1963
1968
1973
1978
1983
Dinamica del traffico passeggeri negli areoporti italiani (fonte: ISTAT)
23‐03‐2014
21
Diagrammi di Pareto: servono per rappresentare la perdita economica (difettosità e loro costi).
Ordinate: frequenza di ciascun tipo di difetto riscontrato Ascisse: tipologie di difetto in ordine di frequenza decrescente
Curva cumulativa: rappresenta i valori cumulativi per ciascun tipo di difetto è possibile valutare quanto siano “pesanti” i primi difetti rispetto alla globalità dei difetti
La tabella seguente riporta la distribuzione, per tipologia di difetto, di 200 pezzi meccanici. Graficare l’andamento della difettosità.
Tipo di difetto Numero di difetti
deformazione 104 foro 42
graffio 20 giuoco 14 rottura 10 macchia 7
altri 3
Riportare i dati nel foglio excel. Ordinare i dati in senso decrescente (dati, ordina), in un nuovo foglio. Aggiungere C1 “totale cumulato”;in C3 inserire =B3 e poi in C4 inserire =B4+C3 e poi trascinare. Per le percentuali cumulate, realizzare il calcolo usando il trascinamento
23‐03‐2014
22
Tipo di difetto Numero di Totale Percentuale difetti cumulato cumulata
deformazione 104 104 52,00% foro 42 146 73,00%
graffio 20 166 83,00% giuoco 14 180 90,00% rottura 10 190 95,00% macchia 7 197 98,50%
altri 3 200 100,00%
Ora dobbiamo inserire il grafico.
Selezioniamo le celle B1:B9 e D1:D9; selezioniamo Grafico Istogramma
Serie, Etichette asse X: selezionare A3:A10 Valori: B3:B9
Selezionare la parte di istogramma che riguarda la percentuale cumulativa e cambiare il grafico (a linee). Poi, selezionare la serie “percentuale cumulativa” (formato, elementi grafico – menu sinistra) e “formato selezione.” Opzioni serie “traccia la serie lungo asse secondario”.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0
20
40
60
80
100
120
deformazione foro graffio giuoco rottura macchia altri
Diagramma di Pareto per i 200 pezzi meccanici