View
1.169
Download
1
Embed Size (px)
DESCRIPTION
Sessione I Campionamento e Stima
Citation preview
SESSIONE I CAMPIONAMENTO E STIMA
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali
Relatore: Fabrizio Solari
Michele D’Alo’, Lorenzo Di Biagio, Stefano Falorsi, Andrea Fasulo e Fabrizio Solari
GIORNATE DELLA RICERCA IN ISTAT | 10-11 NOVEMBRE 2014
Indice
1. Introduzione
2. La strategia di benchmark
3. Studio empirico – Dati simulati
4. Studio empirico – Indagine FL
5. Conclusioni e sviluppi futuri
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Spesso le indagini hanno come obiettivo la stima di parametri disaggregati per dominio in corrispondenza dei quali le stime dirette non garantiscono sufficienti livelli di precisione
In tali casi si può ricorrere ai metodi di stima per piccole aree (SAE).
La maggior parte delle indagini sulle famiglie/imprese sono indagini ripetute nel tempo.
E’ importante considerare metodi SAE che prendono forza non soltanto dalle aree, ma che utilizzano anche le informazioni provenienti dalle indagini precedenti.
Introduzione
1Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali
F. Solari, Roma, 10-11/11/2014
Un problema si riscontra nel momento in cui le stime per piccole aree vengono aggregate a livello di domini più ampi. In questo caso la corrispondente stima differisce dalla stima diretta (affidabile) disponibile per tale dominio.
Due possibili approcci per ottenere stime per piccole aree che soddisfano i vincoli di benchmark:
– ex-ante: introducendo i vincoli direttamente nel modelloUgarte, Goicoa & Militino (2009), Montanari, Ranalli & Vicarelli (2010), Nandram & Sayit (2011)
– ex-post: aggiustando le stime successivamenteWang, Fuller & Qu (2008), Bell, Datta & Ghosh (2012), Datta, Ghosh, Steorts & Maples (2011), Bell, Datta & Ghosh (2013)
2Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali
F. Solari, Roma, 10-11/11/2014
Il problema del benchmark: vincoli trasversali
Le indagini statistiche prevedono spesso la produzione di stime high-frequency (es. trimestriali) e stime low-frequency (es. annuali).
Per garantire la coerenza tra le serie storiche high-frequency e le corrispondenti serie storiche low-frequency si possano usare i metodi di riconciliazione dei dati.
Poiché le serie storiche low-frequency sono usualmente più affidabili,si possono considerare le serie storiche high-frequency come stime preliminari.
3Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali
F. Solari, Roma, 10-11/11/2014
Il problema del benchmark: vincoli longitudinali
Il Benchmark
4
Il metodo Di Fonzo-Marini
Di Fonzo & Marini (2011) hanno proposto una procedura di riconciliazione, chiamata simultaneous reconciliation. Tale procedura si propone di trattare, in un unico passo, sia i vincoli longitudinali che i vincoli trasversali producendo infine la serie storica riconciliata.
Di Fonzo & Marini (2011) propongono anche una procedura di riconciliazione chiamata two-step reconciliation procedure, da utilizzare quando si usano serie storiche molto lunghe (generalizzazione del two-step approach proposto da Quenneville & Rancourt, 2005).
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Il Benchmark
5
Il metodo Di Fonzo-Marini
Indicata con P la serie storica high-frequency, la procedura ha lo scopo di produrre la corrispondente serie storica riconciliata R, trovando il minimo della funzione:
I vincoli di benchmark sono introdotti attraverso i moltiplicatori di Langrange
Le soluzioni si ottengono risolvendo un sistema lineare sparso, simmetrico e singolare. Se le dimensioni del sistema non sono troppo elevate, allora può essere trovata una soluzione diretta del sistema lineare.
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
F DM=∑j=1
M
∑t=2
T
( R j , t−P j , t
P j , t
−R j , t−1−P j , t−1
P j , t−1)2
=∑j=1
M
∑t=2
T
( R j , tP j , t
−R j , t−1P j , t−1
)2
Il Benchmark
6
Come risolvere il sistema lineare in R?
package base [ solve(a, b, LAPACK = T) ] package pracma [ qrSolve(a,b) ] package limSolve [ nnls (a,b) ]
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Il Benchmark
7
Dove P è la serie storica high-frequency originale e R la corrispondente serie storica riconciliata
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
F S=∑j=1
M
∑t=2
T
( R j , t−P j , t
P j , t )2
=∑j=1
M
∑t=2
T
( R j , tP j , t
−1)2
E' stata anche testata un‘ulteriore funzione obiettivo, poiché (data la scarsa lunghezza della serie storica), la funzione FDM potrebbe non essere la scelta migliore:
Il Benchmark
8
Il metodo è stato valutato tramite:
Una popolazione artificiale
Dati reali provenienti dall’indagine sulle FL
In entrambi i casi si è preso in considerazione lo stimatore EBLUP derivante da un modello lineare ad effetti misti con effetti casuali di spazio e tempo (effetti casuali con correlazione spaziale e correlazione temporale)
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Dati simulati
9
Popolazione
Popolazione artificiale (N=60,000,000)
107 aree e 4 tempi
Struttura spazio-temporale per la variabile target
Campione
2,000 campioni di 1,200,000 unità estratti dalla popolazione artificiale
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Dati simulati
Indicatori di performance
10
Indicatori per misurare la performance dei vari stimatori:
Average Absolute Relative Bias (AARB)
Average Relative Root Mean Squared Error (ARRMSE)
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Dati simulati
Risultati
11
AARB (MARB)
Variabili EBLUP baseDM nnlsDM baseS nnlsS
Disoccupazione 45.5 (647)
5.3(35.4)
5.8(34.2)
9.7(156)
13.9(183)
Occupazione 16.7(117)
1.9(10.2)
2.4(11.9)
2.4(16.7)
4.5(29.6)
Non Forze Lavoro 13.2(77.4)
1.1(13.1)
1.4(18.0)
1.6(24.1)
3.4(60.0)
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari. Roma. 10-11/11/2014
Studio empirico – Dati simulati
Risultati
12
ARRMSE (MRRMSE)
Variabili EBLUP baseDM nnlsDM baseS nnlsS
Disoccupazione 54.5(670)
19.2(45.8)
22.8(60,2)
21.8(167)
28.0(191)
Occupazione 19,1(118)
6,6(14.7)
8.7(25.5)
7.0(18.9)
10.3(33.1)
Non Forze Lavoro 14.6(77.9)
3.6(15.1)
5,1(19.8)
4,1(26.4)
6.7(63.5)
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Indagine FL
13
Variabile target: la condizione occupazionale tra i 15 e 24 anni
Aree d’interesse: province
Periodo di riferimento: 4 trimestri del 2011
Stimatore: EBLUP a livello di unità con effetti casuali d’area spazio-temporali
Dati: campioni FL dal 2008 al 2011
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Indagine FL
14
Il problema di Benchmark
Vincoli trasversali
Per ogni trimestre e per ogni variabile d’interesse, la somma delle stime prodotte a livello provinciale deve essere uguale alla stima diretta regionale.
A livello provinciale, la somma di occupati, inoccupati ed inattivi deve coincidere con la popolazione totale provinciale.
Vincoli longitudinali
La stime trimestrali devono essere coerenti con le corrispondenti stime annuali.
La procedura di riconciliazione si basa sui dati relativi ai 4 trimestri per ogni anno e viene applicata regione per regione separatamente.
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Indagine FL
15
Indicatori di performance
Le procedure di benchmark è stata valutata tramite indicatori che misurano il livello di aggiustamento a cui è stata sottoposta la serie originale per garantire il rispetto dei vincoli.
Sono stati considerati due differenti indicatori, il Mean Squared Percentage Adjustment (MSPA) che misura il livello di aggiustamento e il Mean Squared Adjustment (MSA) che tiene conto dei tassi di crescita tra le serie:
,
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Studio empirico – Indagine FL
16
MSPA
Variabili baseDM nnlsDM baseS nnlsS
Mediana 9.0 8.9 9.0 8.9
Max 84.8 84.7 84.4 85.2
Min 0.3 0.2 0.4 0.2
MSA
Variabili baseDM nnlsDM baseS nnlsS
Mediana 3.5 2.0 4.5 3.9
Max 79.6 74.6 79.6 84.6
Min 0.1 0.03 0.1 0.03
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014
Utilizzando il packag nnls le soluzioni trovate non rispettano tutti i vincoli imposti
Studio empirico – Indagine FL
17Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali
F. Solari, Roma, 10-11/11/2014
MSA boxplot
Conclusioni e sviluppi futuri
18
La procedura di benchmark oltre a garantire la coerenza tra le stime che si producono, permette di contenere la distorsione delle stime SAE.
Oggetto di sviluppi futuri sarà:
– tenere in considerazione il problema delle misurazioni ripetute degli individui che compongono i vari campioni
– considerare funzioni di perdita che garantiscono:
• fattori di correzioni della serie positivi
• fattori di correzione della serie inclusi all'interno di un range stabilito
Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014