30
1 Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2018-2019 a.a. 2011-2012 Obiettivi del corso Fornire le conoscenze e le competenze necessarie per : un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di produzione dei dati ad opera delle fonti statistiche nazionali e internazionali. interpretare e analizzare in senso critico tali informazioni, organizzate sempre più spesso in banche dati di grandi dimensioni disponibili on-line. Alla fine del corso lo studente avrà acquisito: – le conoscenze necessarie per l'individuazione delle fonti statistiche adeguate ai propri bisogni conoscitivi . – le competenze per l'uso e la rielaborazione dei prodotti statistici nell'ambito di un proprio progetto di indagine, in cui le statistiche diventano indicatori di fenomeni semplici e complessi.

Fonti e strumenti statistici per la comunicazione 26_27 sett.pdf · Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2018-2019 a.a. 2011-2012 Obiettivi

Embed Size (px)

Citation preview

1

Fonti e strumenti statistici per la comunicazione

Prof.ssa Isabella MingoA.A. 2018-2019

a.a. 2011-2012

Obiettivi del corso• Fornire le conoscenze e le competenze necessarie

per : un uso consapevole delle informazioni quantitative,

che non può prescindere dalla conoscenza dellacomplessità dei processi di produzione dei dati ad operadelle fonti statistiche nazionali e internazionali.

interpretare e analizzare in senso critico taliinformazioni, organizzate sempre più spesso in banchedati di grandi dimensioni disponibili on-line.

• Alla fine del corso lo studente avrà acquisito:– le conoscenze necessarie per l'individuazione delle fonti

statistiche adeguate ai propri bisogni conoscitivi .– le competenze per l'uso e la rielaborazione dei

prodotti statistici nell'ambito di un proprio progetto diindagine, in cui le statistiche diventano indicatori difenomeni semplici e complessi.

2

Concetti chiave

Fonti statistiche

Prodotti statistici

Analisi dei dati statistici

a.a. 2018-2019

E’ una scienza che ha per oggetto lo studio,mediante metodi matematici, di fenomenicollettivi suscettibili di misurazione e didescrizione quantitativa.

Si basa sulla raccolta di dati riguardanti lemanifestazioni individuali con cui tali fenomeni simanifestano.

Fornisce regole, strumenti e tecniche checonsentono la raccolta e l’analisi quantitativa dellecaratteristiche dei fenomeni collettivi.

Che cos’è la statistica?

3

Che cosa sono i fenomeni collettivi? Fenomeni relativi a una collettività di casi singoli

o a una collettività di osservazioni su un singolocaso. Richiedono un insieme di osservazioni detti

individuali o singoli.

Esempi di fenomeni collettivi: reddito nazionale natalità occupazione e disoccupazione soddisfazione degli utenti consumi culturali • …..

Le caratteristiche che ci permettono di analizzare e descrivere un fenomeno vengono denominate caratteri o variabili statistiche.

Fenomeni collettivi semplici o complessi

Sono fenomeni collettivi semplici quelli delineabili attraversoun solo carattereEs.: L’età degli individui è un fenomeno completamentedescritto dal carattere che misura il numero di anni cheintercorrono dalla nascita al momento in cui si rileval’informazione.

Sono fenomeni collettivi complessi o multivariati quellidescritti da un insieme di caratteri.

Es.: Il consumo culturale degli individui è un fenomenocollettivo multivariato poiché può essere descrittoconsiderando molti caratteri: numero di libri letti, spettacoliteatrali, cinematografici a cui si è assistito, musei visitati…

4

Statistica descrittiva/inferenziale

Statistica descrittiva• ha l’obiettivo di organizzare,

riassumere e presentare i dati sottoforma tabellare e grafica in modoordinato.

• I suoi strumenti permettono di:– sistematizzare l’informazione mediante

distribuzioni semplici e complesse– sintetizzare l’informazione attraverso

famiglie di indici: valori percentuali,medi, indici di variabilità, rapportistatistici, relazioni statistiche, ecc.

Statistica inferenziale: • Procedure, messe a punto con

l'ausilio della Teoria dellaProbabilità, che consentono digeneralizzare le osservazioniottenute su una parte di unapopolazione statistica- dettacampione – all’intera popolazione.

• Si ottengono così le stime deglielementi distintivi dei caratteri chedefiniscono il fenomeno nellapopolazione, e che vengonogeneralmente chiamate stime deiparametri nella popolazione.

Carattere statistico: caratteristica da studiare, rilevata sulle unità statistiche.

Unità statistica (u.s.): unità elementare che presenta le caratteristiche (caratteri) oggetto di studio.

Popolazione statistica: insieme di u.s. omogenee rispetto ad uno o più caratteri.

Alcuni concetti preliminari

5

Esempio:Qual è la regione italiana più estesa?

Unità statistiche

Caratteristica o carattere o variabile

Fonte:Istat 2011

a.a. 2018-2019

Esempio:Gli utenti di un servizio erogato dai Municipi di RomaCaratteri e unitàNella tabella seguente:- quali e quanti sono i caratteri?- quali e quante sono le unità statistiche?- qual è la popolazione di riferimento?

I.Mingo 2014

Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300

6

Unità statisticaE’ un’entità reale (persona, animale, oggetto, territorio) o virtuale (es. evento) che presenta le caratteristiche oggetto di studio.

•Non è necessariamente una persona fisica• Es: nello studio del fenomeno «vendita di quotidiani» le

unità statistiche di riferimento potrebbero essere sono lediverse Testate;

• Es: nello studio delle Imprese che producono automobili leunità statistiche di riferimento sono le imprese

•Non è necessariamente rappresentata da un singolo elemento.• Es: nello studio del fenomeno relativo al consumo delle

famiglie, l’unità statistica di riferimento è la famiglia e quindi un insieme di individui.

Termini equivalenti per indicare una unità statistica sono elemento, soggetto, oggetto, caso o individuo.

Popolazione statisticaL’ insieme di unità statistiche, omogenee rispetto ad una o più caratteri osservabili su di esse.Può essere:

Finita, se costituito da un numero finito di unità statistiche.Es. aziende esistenti in una certa area in un determinatoperiodo .

Infinita, se costituita da un numero illimitato di unitàstatistiche, tanto che non è possibile definirne una listacompiuta. Es. pezzi producibili da una fabbrica a ciclo continuo.

Reale (o empirica) quando tutte le unità della popolazionesono osservabili;

Teorica (o virtuale) quando alcune unità, che potrebbero odovrebbero far parte della popolazione statistica diriferimento, non sono rilevabili. Es. visitatori potenziali di un museo.

a.a. 2018-2019

7

Caratteri statistici

Modalità: modi in cui un carattere si può presentare Esaustive : devono rappresentare tutti i possibili

modi di essere del carattere Non sovrapposte : ogni u.s. presenta una ed una

sola modalità

Osservare o rilevare un carattere sulle u.s. significa attribuire a tali u.s. una modalità del carattere secondo determinate regole e con certi contenuti

u x

x rappresenta la modalità del carattere Xassociata all’u.s. u

Esempio:Caratteri e modalità

Nella tabella seguente:- quali sono i caratteri?- quali sono le modalità?

I.Mingo 2014

Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300

modalità

8

Tipi di caratteri (1/2)

• Caratteri qualitativi (mutabili statistiche)

• Le modalità sono espresse da attributi.

• E’ possibile associare a ciascuna modalità unnumero intero che tuttavia non ha alcun valorenumerico: rappresenta solo un codiceconvenzionale

Codifica dei caratteri qualitativi: esempio

a.a. 2018-2019

IdentificativoMunicipio Sesso Nazionalità Età Titolo di studio RedditoAP 001 9 2 1 30 3 1500AP 004 9 1 2 41 5 2800BO 005 8 1 1 52 5 1900BO 007 8 1 1 73 2 850BO 008 8 1 1 44 3 1200BR 018 17 2 2 35 6 900BR 020 17 2 1 61 5 3000FL 043 4 2 1 72 5 2800FL 079 4 1 1 69 2 1100FL 085 4 1 1 69 2 750FM 001 2 2 1 45 3 2300

Sesso1= Maschio2= Femmina

Nazionalità1= Italiana2= Estera

9

Caratteri qualitativi : esempi

Carattere Modalità

Sesso M (0), F (1)

Stato civile nubile/celibe (2), coniugato (4), divorziato (6), vedovo (8)

Settore attività economica

agricoltura (1), industria (2), servizi (o terziario) (3)

Titolo di studio Nessun Titolo (1), Lic. El.(2), Lic. Media inf. (3), Diploma (4), DL1 (5), DL2 (6) Dottorato (7)

Statura Bassa, Media, Alta

Tipi di caratteri (2/2)• Caratteri Quantitativi (Variabile Statistica):

modalità espresse da valori numerici.Possono essere:Discreti: le modalità sono numeri che

costituiscono un insieme discreto di valori;possono, quindi, essere i numeri interi. Esempi: numero di figli, di nati, di maschi, di

anziani, di imprese.

Continui: le modalità possono essere tutti inumeri, anche non interi, cioè reali,compresi entro un intervallo di valori in cui ilcarattere è misurabile. Esempi: peso, altezza, reddito

a.a.2011-2012

10

Caratteri, Unità, Popolazione: esempiScopo dell’indagine

•Indagine sulle carriere degli iscritti ai Corso di Laurea triennali in Comunicazione della Sapienza di Roma

POPOLAZIONE

•Studenti iscritti ai Corsi di Comunicazione Pubblica e d’Impresa e di Scienze e tecnologie della Comunicazione

UNITÀ STATISTICA

•Studente

CARATTERI

•Anno di corso, Esami sostenuti, Età, Tipo di diploma

a.a. 2018-2019

Scopo dell’indagine

•Indagine sulla qualità della vita dei residenti nella provincia di Rieti

POPOLAZIONE

•Popolazione residente nella provincia di Rieti

UNITÀ STATISTICHE

•Persone residenti

CARATTERI

•Genere, età, Professione, Reddito, Soddisfazione

Caratteri, Unità, Popolazione: esempi

Scopo dell’indagine

•Indagine sulle condizioni economiche dei Paesi UE

POPOLAZIONE

•Paesi dell’UE

UNITÀ STATISTICHE

•Singoli Stati UE

CARATTERI

•Esportazioni, Importazioni, PIL, Tasso di disoccupazione

a.a. 2018-2019

Scopo dell’indagine

•Indagine sulle condizioni economiche delle imprese italiane

POPOLAZIONE

•Imprese italiane

UNITÀ STATISTICHE

•Singole Imprese italiane

CARATTERI

•Fatturato, Numero dei dipendenti

11

“Misurazione” : caratteri qualitativi Scala nominale o Mutabile Sconnessa

Nessun ordine tra le modalità Date due modalità è possibile affermare solo se

sono uguali o diverse

Es: Sesso, Stato civile, Sett. attività economica

Scala Ordinale o Mutabile Ordinata Esiste un ordine tra le modalità Date due modalità è possibile non solo affermare

se queste sono uguali o diverse, ma anche stabilireun ordinamento oggettivo, specificando qualeprecede l’altra.

Mutabili rettilinee: Tit. studio, Grado militare Mutabili cicliche: Mese di nascita, Giorno della

settimana di nascita …a.a. 2011-2012

Esiste un’unità di misura delle modalità numeriche

Variabile a scala di intervalli non esiste uno zero assoluto: il valore (modalità) 0

non significa assenza di proprietà del carattere, ma indica una situazione convenzionale.

Operazioni: uguale/diverso; maggiore/minore; somma/sottrazione.

Esempi: Temperatura Celsius, Q.I.

Variabile a scala di rapporti esiste uno zero assoluto, naturale e non arbitrario Operazioni: uguale/diverso; maggiore/minore;

somma/sottrazione; moltiplicazione/divisione Esempi: Nati, Morti, Reddito, Peso

a.a. 2011-2012

Misurazione: caratteri quantitativi

12

Esempio: variabile a scala di intervalliTemperatura in gradi Celsius e Farenheit

F=32 +1,8 x C

Città C F

Mosca -17,8 0,0

Milano 0,0 32,0

Roma 5,0 41,0

Napoli 10,0 50,0

Palermo 20,0 68,0

Differenze di 10 gradi C corrispondono a differenze di 18 gradi FUna temperatura doppia in gradi C non corrisponde al doppio in gradi F

In sintesi:

a.a. 2011-2012

13

Livelli di misura e operazioni logico-matematiche

= o > o < + o - x o /

Sconnessa si no no no

Ordinale si si no no

Scala intervalli si si si no

Scala rapporti si si si si

Classificazione gerarchica

14

Trasformazioni della scala di misura

ADA

Nominale Ordinale Scala di intervalli

Scala di rapporti

Nominale Introdurre parametri

Introdurre parametri

Introdurre parametri

Ordinale Non tenere conto dell’ordine

Introdurre parametri

Introdurre parametri

Introdurre parametri

Scala di intervalli

Suddividere in classi e non tenere conto dell’ordine

Suddividere in classi

Scala di rapporti

Suddividere in classi e non tenere conto dell’ordine

Suddividere in classi

Trasformazione di un carattere: da quantitativo a qualitativo ordinale, esempio

• Supponiamo di aver rilevato il reddito annuo lordo su un collettivo di occupati : il reddito minimo e’ 4000 euro, il massimo 50.000 euro

• Si tratta di un carattere quantitativo a scala di rapporti.• Può essere trasformato in una mutabile ordinale raggruppando in

classi le modalità numeriche ed associando a ciascuna di esse un attributo.

• Le classi devono essere esaustive e non sovrapposte.

Classi di reddito Attributo[da 4.000 a 10.000) Basso

[da 10.000 a 20.000) Medio-basso

[da 20.000 a 25.000) Medio[da 25.000, a35-000) Medio-alto[da 35.000 a 50.000] Alto

[ Estremo incluso

( Estremo escluso

15

Trasformazione di un carattere: da qualitativo a quantitativo esempio

•Supponiamo di aver rilevato la mutabile ordinale “titolo di studio” in uncollettivo di occupati, distinguendo nessun titolo, licenza elementare,media inferiore, diploma, laurea triennale, laurea magistrale.

• La mutabile ordinale può essere trasformata in carattere quantitativofacendo corrispondere a ciascuna modalità il numero di anni scolasticinecessari per conseguire il titolo corrispondente.

Modalità attributo Modalità numericaNessun titolo 0

Licenza elementare 5Licenza media

inferiore8

Diploma 13Laurea triennale 16

Laurea magistrale 18

La struttura dei dati

Carattere Qualitativo (mutabile statistica)

Carattere Quantitativo (variabile statistica)

Collettivo statistico

Unità statistica

Osservazione di uno o più caratteri

16

Tabelle di datiTabella di dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili”o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in

colonna) su una u.s. (in riga)

Matrice dei dati: esempioA B C D E F G H I J K M N P Q

UNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2

17

La manipolazione dei dati può riguardare non soltanto i caratteri osservati, ma anche le unità statistiche che possono essere aggregate secondo criteri utili alle finalità dell’indagineSi è rilevato su alcuni individui laureati alcuni caratteri, si può passare dalle unità statistiche laureati

alle unità statistiche corsi di laurea

Trasformazione delle unità statistiche

FSSC Mingo 2018-2019

La tabella dei microdati

Unità statistica di rilevazione Corso di laurea

Conclusione del percorso di

studioVoto di laurea

Intervistato 1 Economia In corso 100

Intervistato 2 Economia Fuori corso 106

Intervistato 3 Comunicazione In corso 110

Intervistato 4 Comunicazione Fuori corso 104

Intervistato 5 Comunicazione Fuori corso 101

Intervistato 6 Ingegneria In corso 90

Intervistato 7 Ingegneria In corso 110

18

Si vuole focalizzare l’analisi non tanto sui singolilaureati quanto sui corsi di laurea, per faremergere eventuali analogie e differenze inmerito ai voti e alla possibilità di licenziarelaureati in corsoI dati statistici che si andranno ad analizzarenon saranno quelli riguardanti i singoliintervistati, ma quelli ottenuti attraversoopportune elaborazioni dei microdatiQueste elaborazioni danno luogo ai macrodati

Trasformazione delle unità statistiche

Dai microdati ai macrodati

19

I laureati sono aggregati in gruppi in base alla medesima modalità del carattere “corso di laurea” tanti gruppi quante sono le modalità del carattere

“corso di laurea” unità di analisiPer gli altri caratteri si sceglie una appropriata funzione di aggregazione delle modalità che tenga conto della tipologia del carattere per la mutabile dicotomica “conclusione del

percorso di studio” si contano, per ogni unità di analisi, i laureati in corso e quelli fuori corso

per la variabile a scala di rapporti “voto di laurea” si calcola il voto medio alla laurea per ciascuna unità di analisi

Dai microdati ai macrodati: procedura

Unità statistiche di rilevazione: unità elementari su cui vengono rilevati i caratteri danno luogo ai microdati: insieme di dati

riguardanti le unità elementariUnità statistiche di analisi: unità primarie di interesse per l’analisi, a cui vengono riferiti i caratteri oggetto di studio può coincidere con quella di rilevazione può riferirsi ad aggregazioni di tali unità (la

famiglia, la scuola, l’azienda, il corso), in tal caso danno luogo ai macrodati.

Microdati e macrodati

20

Matrice unità/caratteri o tabelle di datiTabella ai dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili” o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in

colonna) su una u.s. (in riga)

Matrice dei dati microdati o macrodati

A B C D E F G H I J K M N P QUNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2

La matrice unità/caratteri: esempioDa un’indagine condotta ad un anno dalla laurea sui laureati nell’a.a. 2016/2017 ad un corso di laurea triennale della nostra facoltà, si sono ottenuti i seguenti microdati:

21

Distribuzione unitaria

Tabella “unità x variabili” è una distribuzione unitaria multiplaunitaria perché è rappresentata ciascuna

u.s.multipla perché sono osservati più

caratteri su una medesima u.s.

Una sola colonna della tabella distribuzione unitaria semplice

Esempio: Distribuzione …

A B C D E FUNITA' sesso LaureaNO Tesi VotoL Duratau1 F STC 4 101 3u2 M STC 4 111 3u3 F SCPO 7 110 3u4 F STC 3 108 3u5 M SCPO 12 99 3u6 F COOP 6 110 3u7 M COOP 13 96 3u8 M STC 4 107 3u9 F SCPO 7 104 3u10 F STC 3 110 3u11 M SCPO 16 105 3u12 F SCPO 4 108 3u13 F SCPO 11 108 3u14 F SCPO 4 102 4u15 F STC 4 103 3u16 F SCPO 9 108 4u17 F SCPO 7 103 3u18 F SCPO 11 111 3u19 M SCPO 11 105 3u20 F STC 2 103 3u21 F SCPO 9 109 4u22 M STC 1 111 5u23 M STC 3 104 3u24 F SCPO 2 111 4u25 M SCPO 5 109 3u26 F STC 3 107 5

Unitaria Multipla Unitaria SempliceA B

UNITA' sessou1 Fu2 Mu3 Fu4 Fu5 Mu6 Fu7 Mu8 Mu9 Fu10 Fu11 Mu12 Fu13 Fu14 Fu15 Fu16 Fu17 Fu18 Fu19 Mu20 Fu21 Fu22 Mu23 Mu24 Fu25 Mu26 F

22

La distribuzione Statistica di …Frequenze AssoluteNecessità di sintesiLista delle modalità che il carattere può assumereConteggio del numero di u.s. del collettivo considerato che presentano la singola modalità (freq. Assoluta)

CARATTERE FREQUENZE ASSOLUTE

Modalità uno

Numero di unità statistiche del collettivo considerato che

presentano la modalità uno del carattere

Modalità due

Numero di unità statistiche del collettivo considerato che

presentano la modalità due del carattere

… …

Modalità kappa

Numero di unità statistiche del collettivo considerato che

presentano la modalità kappa del carattere

Dalla distribuzione unitaria a quella di frequenza esempio

Cognome sesso età Livello soddisfazione

Tipo albergo(categoria)

Giorni permanenza

Bianchi F 28 basso 2 4

Alimov F 52 medio 3 6

More M 19 alto 4 2

Wieser F 23 alto 3 10

Lincoln M 60 medio 5 8

a.a. 2018-2019

23

Distribuzione di frequenza assoluta• Elencazione del numero delle volte che una modalità di un

carattere viene osservata nel collettivo.• Corrisponde alla suddivisione delle unità statistiche in

sottogruppi.

Sesso frequenza

F 3

M 2

totale 5

Livello soddisfazione

frequenza

basso 1

medio 2

alto 2

Totale 5

Osservazioni:•Evidenzia le caratteristiche del fenomeno•Implica perdita di informazione

a.a. 2018-2019

Frequenze assolute: la notazione

X : Carattere osservatox1 , x2 ,…, xi ,…, xK : K modalità

assunte del carattere Xxi modalità genericaxK ultima modalità Se X quantitativo

x1< x2<…< xi<…< xKn : numero di u.s. che

compongono il collettivon1 , n2 ,…, ni ,…, nK : freq. Assol.

associate alle K modalitàn1+ n2+… + ni+…+ nK=n

Car. X FREQUENZE ASSOLUTE

x1 n1

x2 n2

… …

xi ni

… …

xK nK

Totale n

24

Esercizio 1

Come si procede:1. Individuare e contare le modalità

della variabile titolo di studio2. Costruire un tabella che ha:

– un numero di righe uguale alnumero di modalità dellavariabile più una riga per itotali di colonna

– e due colonne, una per lemodalità xi e una per lefrequenze assolute ni

3. Se possibile, ordinare le modalità in ordine ascendente

4. Contare per ogni modalità il numero di unità statistiche e riportare il conteggio nella colonna ni

5. Sommare le frequenze assolute ottenute e controllare che il totale corrisponda al numero dei casi n della distribuzione unitaria

Data la seguente distribuzione unitaria multipla, calcolare le distribuzioni di frequenze assolute della variabile titolo di studio.

Esercizio 1: soluzione

Distribuzione di frequenza titolo di studioxi ni

Medio Inferiore 3Medio superiore 7laurea triennale 2laurea magistrale 8totale (n) 20

a.a. 2018-2019

25

Distribuzione di frequenza relativa e percentuale• Frequenze Relative fi= ni/n

si ottengono dividendo, per ogni modalità, la corrispondente Frequenza Assoluta ni per la Numerosità Totale del collettivo n

sono sempre numeri compresi tra 0 e 1 la loro somma è sempre uguale a 1:

f1 + f2 +…+ fi +…+ fK = 1

• Frequenze Percentuali pi= fi*100 frequenza relativa fi moltiplicata per 100 p1 + p2 +…+ pj +…+ pK = 100

Sesso Freq. Relativa fi

F (3/5)=0.6

M (2/5)= 0.4

totale 1

Sesso Freq. Percentuale pi

F (3/5*100)=60

M (2/5*100)= 40

totale 100

a.a. 2018-2019

Sesso Freq. Assoluta ni

F 3

M 2

totale 5

Distribuzione di frequenza percentuale: esempio

Sesso Freq. %

F (3/5*100)= 60

M (2/5*100)= 40

totale 100

Sesso Freq. assol.

F 3

M 2

totale 5

Sesso Freq.%

F (180/300*100)= 60

M (120/300*100)= 40

totale 100

Sesso Freq. assol.

F 180

M 120

totale 300

•Attenzione: le distribuzioni percentuali implicano la perdita dell’informazione sulla numerosità dei collettivi

a.a. 2018-2019

•Possibile il confronto tra due o più collettivi di dimensioni diverse rispetto ad un carattere

26

Esercizio 2

A partire dalla distribuzione di frequenze assolute ottenute nell’esercizio 1 calcolare le frequenze relative e percentuali

Come si procede:1. A partire dalla tabella di frequenze assolute

aggiungere due colonne :• Una per le frequenze relative• Una per quelle percentuali

2. Calcolare le freq. relative e verificare che il totalesia pari a 1

3. Calcolare le freq. percentuali e verificare che iltotale sia 100

Esercizio 2: soluzione

Distribuzione di frequenza titolo di studioxi ni fi pi

Medio Inferiore 3 0,1500 15Medio superiore 7 0,3500 35laurea triennale 2 0,1000 10laurea magistrale 8 0,4000 40totale (n) 20 1,0000 100

a.a. 2018-2019

27

Suggerimento …a proposito di decimali

Quando si calcolano le frequenze relative è opportuno mantenere almeno 4 cifre decimali per avere almeno 2 decimali nel passaggio alle frequenze percentuali.L’arrotondamento si effettua per eccesso se la cifra decimale è almeno pari a 5; per difetto se è inferiore di 5.

Distribuzione per condizione occupazionale dei laureati di Scienze della Comunicazione nell’a.a. 2003/2004

Pagina 53

Condizione Occupazionale

Frequenze Assolute

Frequenze Relative

Frequenze Percentuali

Si, lavora 9 0.3462 34.62Non lavora e cerca 4 0.1538 15.38Non lavora e non cerca 13 0.5000 50.00TOTALE 26 1.0000 100.00

Pagina 2

Frequenze CumulateHanno senso solo se il carattere in esame è almeno un carattere qualitativo ordinaleLa frequenza cumulata associata alla modalità xidel carattere rappresenta il numero di u.s che presentano una modalità non superiore a xiFrequenze Cumulatesi ottengono sommando le frequenze assolute

(relative o percentuali) associate alle modalità inferiori o uguali alla modalità per la quale si sta calcolando la frequenza cumulata

28

Frequenze cumulate: esempio

Livello di soddisfazione

ni N i pi P i

Molto basso 60 60 25 25

Basso 70 (60+70)=130

29.17 (25+29.17)= 54.17

Medio 20 (130+20)=150 8.33 (54.17+8.33)= 62.5

Alto 60 (150+60)=210 25 (62.5+25)= 87.5

Molto alto

Totale

30

240

(210+30)=240 12.5

100

(87.5+12.5)= 100

Osservazioni:Le freq. cumulate consentono di individuare immediatamente il numero di unità che hanno un livello di soddisfazione inferiore ad alto

Es. il 62,5% ha un livello di soddisfazione inferiore o uguale a medioa.a. 2018-2019

Pagina 56

Calcolo delle frequenze cumulate

Frequenza Assoluta Cumulata della modalità xi

Frequenza Relativa Cumulata della modalità xi

Frequenza Percentuale Cumulata della modalità xi

29

Pagina 57

Glossario

Sommatoria x : indica in modo sintetico la somma di un insieme di numeri x Sia x1=3, x2=5, x3=1, x4=9, x5=15

Pagina 58

Calcolo delle frequenze cumulate

Ovviamente in corrispondenza della modalità più grande xK si avràFrequenza assoluta cumulata NK=nFrequenza relativa cumulata FK=1Frequenza percentuale cumulata PK=100

30

Esercizio

Nella tabella seguente sono riportate le frequenze con cui gli studenti di due campioni, rilevati in due Istituiti, caricano contenuti sui social media.In quale dei due campioni si registra una percentuale più elevata di studenti che usano a tal fine i social media meno di 1-3 volte a settimana?In quale dei due campioni si registra una percentuale più elevata di studenti che usano i social media meno 4 volte a settimana?

a.a. 2018-2019

Studenti in base alla frequenza di upload di contenuti sui Social MediaLiceo A Istituto tecnico B

Mai 16 13qualche volta al mese 24 201-3 volte a settimana 53 444-6 volte a settimana 32 28tutti i giorni 40 48

165 153