Upload
hoanghuong
View
218
Download
0
Embed Size (px)
Citation preview
1
Fonti e strumenti statistici per la comunicazione
Prof.ssa Isabella MingoA.A. 2018-2019
a.a. 2011-2012
Obiettivi del corso• Fornire le conoscenze e le competenze necessarie
per : un uso consapevole delle informazioni quantitative,
che non può prescindere dalla conoscenza dellacomplessità dei processi di produzione dei dati ad operadelle fonti statistiche nazionali e internazionali.
interpretare e analizzare in senso critico taliinformazioni, organizzate sempre più spesso in banchedati di grandi dimensioni disponibili on-line.
• Alla fine del corso lo studente avrà acquisito:– le conoscenze necessarie per l'individuazione delle fonti
statistiche adeguate ai propri bisogni conoscitivi .– le competenze per l'uso e la rielaborazione dei
prodotti statistici nell'ambito di un proprio progetto diindagine, in cui le statistiche diventano indicatori difenomeni semplici e complessi.
2
Concetti chiave
Fonti statistiche
Prodotti statistici
Analisi dei dati statistici
a.a. 2018-2019
E’ una scienza che ha per oggetto lo studio,mediante metodi matematici, di fenomenicollettivi suscettibili di misurazione e didescrizione quantitativa.
Si basa sulla raccolta di dati riguardanti lemanifestazioni individuali con cui tali fenomeni simanifestano.
Fornisce regole, strumenti e tecniche checonsentono la raccolta e l’analisi quantitativa dellecaratteristiche dei fenomeni collettivi.
Che cos’è la statistica?
3
Che cosa sono i fenomeni collettivi? Fenomeni relativi a una collettività di casi singoli
o a una collettività di osservazioni su un singolocaso. Richiedono un insieme di osservazioni detti
individuali o singoli.
Esempi di fenomeni collettivi: reddito nazionale natalità occupazione e disoccupazione soddisfazione degli utenti consumi culturali • …..
Le caratteristiche che ci permettono di analizzare e descrivere un fenomeno vengono denominate caratteri o variabili statistiche.
Fenomeni collettivi semplici o complessi
Sono fenomeni collettivi semplici quelli delineabili attraversoun solo carattereEs.: L’età degli individui è un fenomeno completamentedescritto dal carattere che misura il numero di anni cheintercorrono dalla nascita al momento in cui si rileval’informazione.
Sono fenomeni collettivi complessi o multivariati quellidescritti da un insieme di caratteri.
Es.: Il consumo culturale degli individui è un fenomenocollettivo multivariato poiché può essere descrittoconsiderando molti caratteri: numero di libri letti, spettacoliteatrali, cinematografici a cui si è assistito, musei visitati…
4
Statistica descrittiva/inferenziale
Statistica descrittiva• ha l’obiettivo di organizzare,
riassumere e presentare i dati sottoforma tabellare e grafica in modoordinato.
• I suoi strumenti permettono di:– sistematizzare l’informazione mediante
distribuzioni semplici e complesse– sintetizzare l’informazione attraverso
famiglie di indici: valori percentuali,medi, indici di variabilità, rapportistatistici, relazioni statistiche, ecc.
Statistica inferenziale: • Procedure, messe a punto con
l'ausilio della Teoria dellaProbabilità, che consentono digeneralizzare le osservazioniottenute su una parte di unapopolazione statistica- dettacampione – all’intera popolazione.
• Si ottengono così le stime deglielementi distintivi dei caratteri chedefiniscono il fenomeno nellapopolazione, e che vengonogeneralmente chiamate stime deiparametri nella popolazione.
Carattere statistico: caratteristica da studiare, rilevata sulle unità statistiche.
Unità statistica (u.s.): unità elementare che presenta le caratteristiche (caratteri) oggetto di studio.
Popolazione statistica: insieme di u.s. omogenee rispetto ad uno o più caratteri.
Alcuni concetti preliminari
5
Esempio:Qual è la regione italiana più estesa?
Unità statistiche
Caratteristica o carattere o variabile
Fonte:Istat 2011
a.a. 2018-2019
Esempio:Gli utenti di un servizio erogato dai Municipi di RomaCaratteri e unitàNella tabella seguente:- quali e quanti sono i caratteri?- quali e quante sono le unità statistiche?- qual è la popolazione di riferimento?
I.Mingo 2014
Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300
6
Unità statisticaE’ un’entità reale (persona, animale, oggetto, territorio) o virtuale (es. evento) che presenta le caratteristiche oggetto di studio.
•Non è necessariamente una persona fisica• Es: nello studio del fenomeno «vendita di quotidiani» le
unità statistiche di riferimento potrebbero essere sono lediverse Testate;
• Es: nello studio delle Imprese che producono automobili leunità statistiche di riferimento sono le imprese
•Non è necessariamente rappresentata da un singolo elemento.• Es: nello studio del fenomeno relativo al consumo delle
famiglie, l’unità statistica di riferimento è la famiglia e quindi un insieme di individui.
Termini equivalenti per indicare una unità statistica sono elemento, soggetto, oggetto, caso o individuo.
Popolazione statisticaL’ insieme di unità statistiche, omogenee rispetto ad una o più caratteri osservabili su di esse.Può essere:
Finita, se costituito da un numero finito di unità statistiche.Es. aziende esistenti in una certa area in un determinatoperiodo .
Infinita, se costituita da un numero illimitato di unitàstatistiche, tanto che non è possibile definirne una listacompiuta. Es. pezzi producibili da una fabbrica a ciclo continuo.
Reale (o empirica) quando tutte le unità della popolazionesono osservabili;
Teorica (o virtuale) quando alcune unità, che potrebbero odovrebbero far parte della popolazione statistica diriferimento, non sono rilevabili. Es. visitatori potenziali di un museo.
a.a. 2018-2019
7
Caratteri statistici
Modalità: modi in cui un carattere si può presentare Esaustive : devono rappresentare tutti i possibili
modi di essere del carattere Non sovrapposte : ogni u.s. presenta una ed una
sola modalità
Osservare o rilevare un carattere sulle u.s. significa attribuire a tali u.s. una modalità del carattere secondo determinate regole e con certi contenuti
u x
x rappresenta la modalità del carattere Xassociata all’u.s. u
Esempio:Caratteri e modalità
Nella tabella seguente:- quali sono i caratteri?- quali sono le modalità?
I.Mingo 2014
Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300
modalità
8
Tipi di caratteri (1/2)
• Caratteri qualitativi (mutabili statistiche)
• Le modalità sono espresse da attributi.
• E’ possibile associare a ciascuna modalità unnumero intero che tuttavia non ha alcun valorenumerico: rappresenta solo un codiceconvenzionale
Codifica dei caratteri qualitativi: esempio
a.a. 2018-2019
IdentificativoMunicipio Sesso Nazionalità Età Titolo di studio RedditoAP 001 9 2 1 30 3 1500AP 004 9 1 2 41 5 2800BO 005 8 1 1 52 5 1900BO 007 8 1 1 73 2 850BO 008 8 1 1 44 3 1200BR 018 17 2 2 35 6 900BR 020 17 2 1 61 5 3000FL 043 4 2 1 72 5 2800FL 079 4 1 1 69 2 1100FL 085 4 1 1 69 2 750FM 001 2 2 1 45 3 2300
Sesso1= Maschio2= Femmina
Nazionalità1= Italiana2= Estera
9
Caratteri qualitativi : esempi
Carattere Modalità
Sesso M (0), F (1)
Stato civile nubile/celibe (2), coniugato (4), divorziato (6), vedovo (8)
Settore attività economica
agricoltura (1), industria (2), servizi (o terziario) (3)
Titolo di studio Nessun Titolo (1), Lic. El.(2), Lic. Media inf. (3), Diploma (4), DL1 (5), DL2 (6) Dottorato (7)
Statura Bassa, Media, Alta
Tipi di caratteri (2/2)• Caratteri Quantitativi (Variabile Statistica):
modalità espresse da valori numerici.Possono essere:Discreti: le modalità sono numeri che
costituiscono un insieme discreto di valori;possono, quindi, essere i numeri interi. Esempi: numero di figli, di nati, di maschi, di
anziani, di imprese.
Continui: le modalità possono essere tutti inumeri, anche non interi, cioè reali,compresi entro un intervallo di valori in cui ilcarattere è misurabile. Esempi: peso, altezza, reddito
a.a.2011-2012
10
Caratteri, Unità, Popolazione: esempiScopo dell’indagine
•Indagine sulle carriere degli iscritti ai Corso di Laurea triennali in Comunicazione della Sapienza di Roma
POPOLAZIONE
•Studenti iscritti ai Corsi di Comunicazione Pubblica e d’Impresa e di Scienze e tecnologie della Comunicazione
UNITÀ STATISTICA
•Studente
CARATTERI
•Anno di corso, Esami sostenuti, Età, Tipo di diploma
a.a. 2018-2019
Scopo dell’indagine
•Indagine sulla qualità della vita dei residenti nella provincia di Rieti
POPOLAZIONE
•Popolazione residente nella provincia di Rieti
UNITÀ STATISTICHE
•Persone residenti
CARATTERI
•Genere, età, Professione, Reddito, Soddisfazione
Caratteri, Unità, Popolazione: esempi
Scopo dell’indagine
•Indagine sulle condizioni economiche dei Paesi UE
POPOLAZIONE
•Paesi dell’UE
UNITÀ STATISTICHE
•Singoli Stati UE
CARATTERI
•Esportazioni, Importazioni, PIL, Tasso di disoccupazione
a.a. 2018-2019
Scopo dell’indagine
•Indagine sulle condizioni economiche delle imprese italiane
POPOLAZIONE
•Imprese italiane
UNITÀ STATISTICHE
•Singole Imprese italiane
CARATTERI
•Fatturato, Numero dei dipendenti
11
“Misurazione” : caratteri qualitativi Scala nominale o Mutabile Sconnessa
Nessun ordine tra le modalità Date due modalità è possibile affermare solo se
sono uguali o diverse
Es: Sesso, Stato civile, Sett. attività economica
Scala Ordinale o Mutabile Ordinata Esiste un ordine tra le modalità Date due modalità è possibile non solo affermare
se queste sono uguali o diverse, ma anche stabilireun ordinamento oggettivo, specificando qualeprecede l’altra.
Mutabili rettilinee: Tit. studio, Grado militare Mutabili cicliche: Mese di nascita, Giorno della
settimana di nascita …a.a. 2011-2012
Esiste un’unità di misura delle modalità numeriche
Variabile a scala di intervalli non esiste uno zero assoluto: il valore (modalità) 0
non significa assenza di proprietà del carattere, ma indica una situazione convenzionale.
Operazioni: uguale/diverso; maggiore/minore; somma/sottrazione.
Esempi: Temperatura Celsius, Q.I.
Variabile a scala di rapporti esiste uno zero assoluto, naturale e non arbitrario Operazioni: uguale/diverso; maggiore/minore;
somma/sottrazione; moltiplicazione/divisione Esempi: Nati, Morti, Reddito, Peso
a.a. 2011-2012
Misurazione: caratteri quantitativi
12
Esempio: variabile a scala di intervalliTemperatura in gradi Celsius e Farenheit
F=32 +1,8 x C
Città C F
Mosca -17,8 0,0
Milano 0,0 32,0
Roma 5,0 41,0
Napoli 10,0 50,0
Palermo 20,0 68,0
Differenze di 10 gradi C corrispondono a differenze di 18 gradi FUna temperatura doppia in gradi C non corrisponde al doppio in gradi F
In sintesi:
a.a. 2011-2012
13
Livelli di misura e operazioni logico-matematiche
= o > o < + o - x o /
Sconnessa si no no no
Ordinale si si no no
Scala intervalli si si si no
Scala rapporti si si si si
Classificazione gerarchica
14
Trasformazioni della scala di misura
ADA
Nominale Ordinale Scala di intervalli
Scala di rapporti
Nominale Introdurre parametri
Introdurre parametri
Introdurre parametri
Ordinale Non tenere conto dell’ordine
Introdurre parametri
Introdurre parametri
Introdurre parametri
Scala di intervalli
Suddividere in classi e non tenere conto dell’ordine
Suddividere in classi
Scala di rapporti
Suddividere in classi e non tenere conto dell’ordine
Suddividere in classi
Trasformazione di un carattere: da quantitativo a qualitativo ordinale, esempio
• Supponiamo di aver rilevato il reddito annuo lordo su un collettivo di occupati : il reddito minimo e’ 4000 euro, il massimo 50.000 euro
• Si tratta di un carattere quantitativo a scala di rapporti.• Può essere trasformato in una mutabile ordinale raggruppando in
classi le modalità numeriche ed associando a ciascuna di esse un attributo.
• Le classi devono essere esaustive e non sovrapposte.
Classi di reddito Attributo[da 4.000 a 10.000) Basso
[da 10.000 a 20.000) Medio-basso
[da 20.000 a 25.000) Medio[da 25.000, a35-000) Medio-alto[da 35.000 a 50.000] Alto
[ Estremo incluso
( Estremo escluso
15
Trasformazione di un carattere: da qualitativo a quantitativo esempio
•Supponiamo di aver rilevato la mutabile ordinale “titolo di studio” in uncollettivo di occupati, distinguendo nessun titolo, licenza elementare,media inferiore, diploma, laurea triennale, laurea magistrale.
• La mutabile ordinale può essere trasformata in carattere quantitativofacendo corrispondere a ciascuna modalità il numero di anni scolasticinecessari per conseguire il titolo corrispondente.
Modalità attributo Modalità numericaNessun titolo 0
Licenza elementare 5Licenza media
inferiore8
Diploma 13Laurea triennale 16
Laurea magistrale 18
La struttura dei dati
Carattere Qualitativo (mutabile statistica)
Carattere Quantitativo (variabile statistica)
Collettivo statistico
Unità statistica
Osservazione di uno o più caratteri
16
Tabelle di datiTabella di dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili”o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in
colonna) su una u.s. (in riga)
Matrice dei dati: esempioA B C D E F G H I J K M N P Q
UNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2
17
La manipolazione dei dati può riguardare non soltanto i caratteri osservati, ma anche le unità statistiche che possono essere aggregate secondo criteri utili alle finalità dell’indagineSi è rilevato su alcuni individui laureati alcuni caratteri, si può passare dalle unità statistiche laureati
alle unità statistiche corsi di laurea
Trasformazione delle unità statistiche
FSSC Mingo 2018-2019
La tabella dei microdati
Unità statistica di rilevazione Corso di laurea
Conclusione del percorso di
studioVoto di laurea
Intervistato 1 Economia In corso 100
Intervistato 2 Economia Fuori corso 106
Intervistato 3 Comunicazione In corso 110
Intervistato 4 Comunicazione Fuori corso 104
Intervistato 5 Comunicazione Fuori corso 101
Intervistato 6 Ingegneria In corso 90
Intervistato 7 Ingegneria In corso 110
18
Si vuole focalizzare l’analisi non tanto sui singolilaureati quanto sui corsi di laurea, per faremergere eventuali analogie e differenze inmerito ai voti e alla possibilità di licenziarelaureati in corsoI dati statistici che si andranno ad analizzarenon saranno quelli riguardanti i singoliintervistati, ma quelli ottenuti attraversoopportune elaborazioni dei microdatiQueste elaborazioni danno luogo ai macrodati
Trasformazione delle unità statistiche
Dai microdati ai macrodati
19
I laureati sono aggregati in gruppi in base alla medesima modalità del carattere “corso di laurea” tanti gruppi quante sono le modalità del carattere
“corso di laurea” unità di analisiPer gli altri caratteri si sceglie una appropriata funzione di aggregazione delle modalità che tenga conto della tipologia del carattere per la mutabile dicotomica “conclusione del
percorso di studio” si contano, per ogni unità di analisi, i laureati in corso e quelli fuori corso
per la variabile a scala di rapporti “voto di laurea” si calcola il voto medio alla laurea per ciascuna unità di analisi
Dai microdati ai macrodati: procedura
Unità statistiche di rilevazione: unità elementari su cui vengono rilevati i caratteri danno luogo ai microdati: insieme di dati
riguardanti le unità elementariUnità statistiche di analisi: unità primarie di interesse per l’analisi, a cui vengono riferiti i caratteri oggetto di studio può coincidere con quella di rilevazione può riferirsi ad aggregazioni di tali unità (la
famiglia, la scuola, l’azienda, il corso), in tal caso danno luogo ai macrodati.
Microdati e macrodati
20
Matrice unità/caratteri o tabelle di datiTabella ai dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili” o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in
colonna) su una u.s. (in riga)
Matrice dei dati microdati o macrodati
A B C D E F G H I J K M N P QUNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2
La matrice unità/caratteri: esempioDa un’indagine condotta ad un anno dalla laurea sui laureati nell’a.a. 2016/2017 ad un corso di laurea triennale della nostra facoltà, si sono ottenuti i seguenti microdati:
21
Distribuzione unitaria
Tabella “unità x variabili” è una distribuzione unitaria multiplaunitaria perché è rappresentata ciascuna
u.s.multipla perché sono osservati più
caratteri su una medesima u.s.
Una sola colonna della tabella distribuzione unitaria semplice
Esempio: Distribuzione …
A B C D E FUNITA' sesso LaureaNO Tesi VotoL Duratau1 F STC 4 101 3u2 M STC 4 111 3u3 F SCPO 7 110 3u4 F STC 3 108 3u5 M SCPO 12 99 3u6 F COOP 6 110 3u7 M COOP 13 96 3u8 M STC 4 107 3u9 F SCPO 7 104 3u10 F STC 3 110 3u11 M SCPO 16 105 3u12 F SCPO 4 108 3u13 F SCPO 11 108 3u14 F SCPO 4 102 4u15 F STC 4 103 3u16 F SCPO 9 108 4u17 F SCPO 7 103 3u18 F SCPO 11 111 3u19 M SCPO 11 105 3u20 F STC 2 103 3u21 F SCPO 9 109 4u22 M STC 1 111 5u23 M STC 3 104 3u24 F SCPO 2 111 4u25 M SCPO 5 109 3u26 F STC 3 107 5
Unitaria Multipla Unitaria SempliceA B
UNITA' sessou1 Fu2 Mu3 Fu4 Fu5 Mu6 Fu7 Mu8 Mu9 Fu10 Fu11 Mu12 Fu13 Fu14 Fu15 Fu16 Fu17 Fu18 Fu19 Mu20 Fu21 Fu22 Mu23 Mu24 Fu25 Mu26 F
22
La distribuzione Statistica di …Frequenze AssoluteNecessità di sintesiLista delle modalità che il carattere può assumereConteggio del numero di u.s. del collettivo considerato che presentano la singola modalità (freq. Assoluta)
CARATTERE FREQUENZE ASSOLUTE
Modalità uno
Numero di unità statistiche del collettivo considerato che
presentano la modalità uno del carattere
Modalità due
Numero di unità statistiche del collettivo considerato che
presentano la modalità due del carattere
… …
Modalità kappa
Numero di unità statistiche del collettivo considerato che
presentano la modalità kappa del carattere
Dalla distribuzione unitaria a quella di frequenza esempio
Cognome sesso età Livello soddisfazione
Tipo albergo(categoria)
Giorni permanenza
Bianchi F 28 basso 2 4
Alimov F 52 medio 3 6
More M 19 alto 4 2
Wieser F 23 alto 3 10
Lincoln M 60 medio 5 8
a.a. 2018-2019
23
Distribuzione di frequenza assoluta• Elencazione del numero delle volte che una modalità di un
carattere viene osservata nel collettivo.• Corrisponde alla suddivisione delle unità statistiche in
sottogruppi.
Sesso frequenza
F 3
M 2
totale 5
Livello soddisfazione
frequenza
basso 1
medio 2
alto 2
Totale 5
Osservazioni:•Evidenzia le caratteristiche del fenomeno•Implica perdita di informazione
a.a. 2018-2019
Frequenze assolute: la notazione
X : Carattere osservatox1 , x2 ,…, xi ,…, xK : K modalità
assunte del carattere Xxi modalità genericaxK ultima modalità Se X quantitativo
x1< x2<…< xi<…< xKn : numero di u.s. che
compongono il collettivon1 , n2 ,…, ni ,…, nK : freq. Assol.
associate alle K modalitàn1+ n2+… + ni+…+ nK=n
Car. X FREQUENZE ASSOLUTE
x1 n1
x2 n2
… …
xi ni
… …
xK nK
Totale n
24
Esercizio 1
Come si procede:1. Individuare e contare le modalità
della variabile titolo di studio2. Costruire un tabella che ha:
– un numero di righe uguale alnumero di modalità dellavariabile più una riga per itotali di colonna
– e due colonne, una per lemodalità xi e una per lefrequenze assolute ni
3. Se possibile, ordinare le modalità in ordine ascendente
4. Contare per ogni modalità il numero di unità statistiche e riportare il conteggio nella colonna ni
5. Sommare le frequenze assolute ottenute e controllare che il totale corrisponda al numero dei casi n della distribuzione unitaria
Data la seguente distribuzione unitaria multipla, calcolare le distribuzioni di frequenze assolute della variabile titolo di studio.
Esercizio 1: soluzione
Distribuzione di frequenza titolo di studioxi ni
Medio Inferiore 3Medio superiore 7laurea triennale 2laurea magistrale 8totale (n) 20
a.a. 2018-2019
25
Distribuzione di frequenza relativa e percentuale• Frequenze Relative fi= ni/n
si ottengono dividendo, per ogni modalità, la corrispondente Frequenza Assoluta ni per la Numerosità Totale del collettivo n
sono sempre numeri compresi tra 0 e 1 la loro somma è sempre uguale a 1:
f1 + f2 +…+ fi +…+ fK = 1
• Frequenze Percentuali pi= fi*100 frequenza relativa fi moltiplicata per 100 p1 + p2 +…+ pj +…+ pK = 100
Sesso Freq. Relativa fi
F (3/5)=0.6
M (2/5)= 0.4
totale 1
Sesso Freq. Percentuale pi
F (3/5*100)=60
M (2/5*100)= 40
totale 100
a.a. 2018-2019
Sesso Freq. Assoluta ni
F 3
M 2
totale 5
Distribuzione di frequenza percentuale: esempio
Sesso Freq. %
F (3/5*100)= 60
M (2/5*100)= 40
totale 100
Sesso Freq. assol.
F 3
M 2
totale 5
Sesso Freq.%
F (180/300*100)= 60
M (120/300*100)= 40
totale 100
Sesso Freq. assol.
F 180
M 120
totale 300
•Attenzione: le distribuzioni percentuali implicano la perdita dell’informazione sulla numerosità dei collettivi
a.a. 2018-2019
•Possibile il confronto tra due o più collettivi di dimensioni diverse rispetto ad un carattere
26
Esercizio 2
A partire dalla distribuzione di frequenze assolute ottenute nell’esercizio 1 calcolare le frequenze relative e percentuali
Come si procede:1. A partire dalla tabella di frequenze assolute
aggiungere due colonne :• Una per le frequenze relative• Una per quelle percentuali
2. Calcolare le freq. relative e verificare che il totalesia pari a 1
3. Calcolare le freq. percentuali e verificare che iltotale sia 100
Esercizio 2: soluzione
Distribuzione di frequenza titolo di studioxi ni fi pi
Medio Inferiore 3 0,1500 15Medio superiore 7 0,3500 35laurea triennale 2 0,1000 10laurea magistrale 8 0,4000 40totale (n) 20 1,0000 100
a.a. 2018-2019
27
Suggerimento …a proposito di decimali
Quando si calcolano le frequenze relative è opportuno mantenere almeno 4 cifre decimali per avere almeno 2 decimali nel passaggio alle frequenze percentuali.L’arrotondamento si effettua per eccesso se la cifra decimale è almeno pari a 5; per difetto se è inferiore di 5.
Distribuzione per condizione occupazionale dei laureati di Scienze della Comunicazione nell’a.a. 2003/2004
Pagina 53
Condizione Occupazionale
Frequenze Assolute
Frequenze Relative
Frequenze Percentuali
Si, lavora 9 0.3462 34.62Non lavora e cerca 4 0.1538 15.38Non lavora e non cerca 13 0.5000 50.00TOTALE 26 1.0000 100.00
Pagina 2
Frequenze CumulateHanno senso solo se il carattere in esame è almeno un carattere qualitativo ordinaleLa frequenza cumulata associata alla modalità xidel carattere rappresenta il numero di u.s che presentano una modalità non superiore a xiFrequenze Cumulatesi ottengono sommando le frequenze assolute
(relative o percentuali) associate alle modalità inferiori o uguali alla modalità per la quale si sta calcolando la frequenza cumulata
28
Frequenze cumulate: esempio
Livello di soddisfazione
ni N i pi P i
Molto basso 60 60 25 25
Basso 70 (60+70)=130
29.17 (25+29.17)= 54.17
Medio 20 (130+20)=150 8.33 (54.17+8.33)= 62.5
Alto 60 (150+60)=210 25 (62.5+25)= 87.5
Molto alto
Totale
30
240
(210+30)=240 12.5
100
(87.5+12.5)= 100
Osservazioni:Le freq. cumulate consentono di individuare immediatamente il numero di unità che hanno un livello di soddisfazione inferiore ad alto
Es. il 62,5% ha un livello di soddisfazione inferiore o uguale a medioa.a. 2018-2019
Pagina 56
Calcolo delle frequenze cumulate
Frequenza Assoluta Cumulata della modalità xi
Frequenza Relativa Cumulata della modalità xi
Frequenza Percentuale Cumulata della modalità xi
29
Pagina 57
Glossario
Sommatoria x : indica in modo sintetico la somma di un insieme di numeri x Sia x1=3, x2=5, x3=1, x4=9, x5=15
Pagina 58
Calcolo delle frequenze cumulate
Ovviamente in corrispondenza della modalità più grande xK si avràFrequenza assoluta cumulata NK=nFrequenza relativa cumulata FK=1Frequenza percentuale cumulata PK=100
30
Esercizio
Nella tabella seguente sono riportate le frequenze con cui gli studenti di due campioni, rilevati in due Istituiti, caricano contenuti sui social media.In quale dei due campioni si registra una percentuale più elevata di studenti che usano a tal fine i social media meno di 1-3 volte a settimana?In quale dei due campioni si registra una percentuale più elevata di studenti che usano i social media meno 4 volte a settimana?
a.a. 2018-2019
Studenti in base alla frequenza di upload di contenuti sui Social MediaLiceo A Istituto tecnico B
Mai 16 13qualche volta al mese 24 201-3 volte a settimana 53 444-6 volte a settimana 32 28tutti i giorni 40 48
165 153